10多年前自己以新人的身份开启数据生涯,现在算是一个数据老人了,与当初的自己相比,现在看数据的视角发生了很大的变化,这里列出了50条关于新人老人在数据认知上的可能的差异,希望能带来些启示。
条
新人把一张张宽表看成一块块浮冰。
老人知道这些浮冰只是冰山一角,看不见的沉在水下的表才是重要的,因此不要总对着几张宽表猛干,知其所以然很重要。
第二条
新人写PPT,喜欢写一页是一页,在排版上会不自觉花很多功夫。
老人写PPT,会努力理解老板的意图,理清楚思路,给出目录架构,明确每页要表达的主题,然后才开始动笔。
第三条
新人做分析,都喜欢先想:这个问题可以用个什么模型。
老兵去做分析,都喜欢先看:数据是从哪些系统产生的,产生数据需要什么流程,有哪些字段,这些字段在业务上有什么含义,基础质量如何。
第四条
新人做营销,喜欢琢磨数据和模型,迷于各种算法、AUC,ROC等等。
老人做营销,喜欢先看看这个需求是不是公司的业务重点,业务部门的预期是什么,成本是不是限制因素,流程是否顺畅,渠道是否有资源投放,效果数据能否回来。
第五条
新人认为数据仓库的ODS,DWD,DW神圣不可动摇。
老人总想着颠覆下数据仓库的DW。
第六条
新人对着数据中台不觉明历。
老人认为数据中台的技术没啥新意,挑战大的是人,文化、组织和流程。
第七条
新人想象中的数据分析是自己发现了一个“惊天秘密”,对着老板挥斥方遒。
老人觉得大多数时候能够跟上老板的思路就不错了,老板才是大的发动机和操盘手
第八条
新人认为数据分析师是一种可以为之奋斗一生的职业。
老人认为数据分析师只是职场的一个阶段。
第九条
新人认为BI可以有效提升分析能力。
老人认为BI就是报表和取数的马甲。
第十条
新人每天想着用数据驱动别人。
老人想着如何让数据先驱动自己。
第十一条
新人认为自助取数可以降低人工取数量,想着脱离苦海的那一天。
老人认为人工取数量不会降低,激发了更多自助取数而已,跟老板要说增量,少提降本。
第十二条
新人认为搞可视化大幅提升报表体验。
老人认为还不如搞个导出EXCEL来得实在。
第十三条
新人认为指标标准化可以降低报表开发量。
老人认为公司的支持、标准的制定、前期的投入、规模的效益、业务的态度都决定了这件事情90%要被搞黄。
第十四条
新人认为全力配合好业务部门的取数是大的成绩。
老人知道老板更关注的是取数人员的独特价值创造,放缓取数的节奏,也许做个分析、谈谈业务的理解和建议更有出其不意的效果。
第十五条
新人认为业务部门太过强势。
老人知道多半是因为能力不够所致。
第十六条
新人认为元数据是个玄妙的东西。
老人说那是一个简单通用概念被抽象化的、失败的取名案例。
第十七条
新人觉得每天SQL取数没有技术含量。
老人说从踏上取数那天开始,就要先撇开技术,多关注数据和业务含量,那是以后吃饭的家伙。
第十八条
新人评价机器学习引擎的好坏是算法是否足够多,调用是否简单。
老人关注的是机器学习引擎能否跟自身的数据生态相融合。
第十九条
新人认为搞可视化浪费资源。
老人认为这是管理扁平化的一种有效手段。
第二十条
新人认为模型都是由算法实现的。
老人知道现实中的模型大多是由业务规则的简单叠加形成的。
第二十一条
新人认为算法。
老人认为业务。
第二十二条
新人只想干算法。
老人知道算法工程化也许更重要。
第二十三条
新人认为报表指标太多难以管理。
老人知道虽然这是业务前端的问题,但你不管,企业里就没有其他人能管好了。
第二十四条
新人认为搞模型的不需要懂产品。
老人知道产品是模型价值的出口,有时候是的一个。
第二十五条
新人认为大数据重要的特征是数据量足够大。
老人知道维度多才更有力量。
第二十六条
新人认为数据是一门有前途的职业。
老人知道CDO很少,诸君要努力。
第二十七条
新人总是把大数据跟价值创造联系在一起。
老人知道大数据很难独立创造价值,被人质疑多的恰恰是大数据的价值创造能力。
第二十八条
新人眼中的大数据是营销、风险控制、城市大脑等等。
老人眼中的大数据大多是报表、指标和取数。
第二十九条
新人觉得酒香不怕巷子深。
老人认为数据需要一个外交官。
第三十条
新人想去算法牛的公司。
老人想去数据多的公司。
第三十一条
新人为做了很多报表而自豪。
老人为少做了很多报表而自豪。
第三十二条
新人认为做产品是其他部门的事情。
老人认为一个有前途的数据团队必需自己做产品。
第三十三条
新人为取数加班而自豪。
老人为业务人员更正了一个口径而自豪。
第三十四条
新人:昨天老板夸我的数据分析报告做得很好,今天我提供的数据获得了业务部门小张的点赞,这是实力的证明。
老人:今天我提供的数据获得了外部客户的认可,这是实力的证明。
第三十五条
新人:我要去大厂掌握先进的数据技术。
老人:我要深入某个行业理解真正的数据诉求。
第三十六条
新人:数据产品的体验重要。
老人:数据产品的差异化数据重要。
第三十七条
新人:数据分析师、算法工程师、数据工程师是企业大的缺口。
老人:他们的头稀缺,也就是的数据管理者,我大的困惑是没有“出头之日”。
第三十八条
新人:乙方的数据工程师水平不行,只知道执行。
老人:那些既有想法,又能执行的乙方很难在你面前出现。
第三十九条
新人想得是少干点PPT,多练练技术。
老人想得是把PPT干好,然后让新人有干技术的机会。
第四十条
新人喜欢倒腾算法来提升模型效果。
老人喜欢倒腾业务和数据来提升模型效果。
第四十一条
新人:数据运维没意思,工作不够显性化。
老人:这是一种错觉,牛逼的人都被派去干前端了,因此牛逼的人更容易在运维做出成绩。
第四十二条
新人:老板总抓着数据的细节不放,是否有点吹毛求疵?
老人:这是老板的高明之处,一方面高度和细节不冲突,另一方面见微知著,老板难得检查一次你都不全力以赴,可见平时之散漫,或者不是做数据的料。
第四十三条
新人对大数据的认识过程:牛逼、忽悠、忽悠...
老人对大数据的认知过程:牛逼、忽悠、忽悠、牛逼、忽悠、牛逼、牛逼、牛逼...很多新人没有机会坚持到后。
第四十四条
新人:连接各个数据孤岛是大的问题。
老人:相对于数据连接,数据孤岛本身的开放是个更现实的问题。
第四十五条
新人:数据湖海纳百川,联邦学习合纵连横,flink流批一体,clickhouse颠覆olap。
老人:数据仓库活了20年,多方安全计算提出了40年,批处理支撑了20年,OLAP艰难的混了20年,请给我一个现在选择的理由。
第四十六条
新人:我要去互联网公司用数据改变世界(产业数字化)。
老人:互联网准备改造的数字世界就在你现在呆的地方,为什么要舍近求远?
第四十七条
新人:为什么业务部门不好好管管报表?
老人:报表是你工作的,但仅是业务管理者工作的10%,这就是你要管的原因。
第四十八条
新人:我毕业于某985大学,从事大数据、人工智能、机器学习研究。
老人:快去取数。
第四十九条
新人:我这个月做了100个取数。
老人:请用两句话总结你这个月的工作成果。
第五十条
新人:为什么我要遵守那么多数据管理的规范和流程?
老人:规范和流程确保做事的底线,这就是我们团队牛逼的原因。
以上是一家之言,有机会跟大家聊数据治理、数据技术的新老人的思维差别!
原文链接:https://mp.weixin.qq.com/s/Qq6ZejiaEO7iHb-i3rGYNg