演讲主题:大数据—数据质量与数据仓库
简介:大数据兴起后,数据平台的建设和数据的挖掘应用被广泛提及和关注,但是在数据体系本身的建设上相对比较落后,本分享将结合美丽说数据建设的经验,重点谈谈互联网领域的基础日志治理、数据仓库建设,以及数据质量建设。
演讲嘉宾:高玉石 美丽说数据智能部副总监
目前负责美丽说的基础数据技术和业务体系建设。曾任百度音乐事业部基础数据研发经理,负责百度音乐基础数据团队的组建和大规模基础数据体系的建设,先后建立了音乐数据仓库,数据挖掘与个性化推荐,数据平台和数据分析等方向,并整合了音乐歌曲库资源建设方向,他所建立的音乐基础数据团队是百度用户产品体系早成立的数据团队之一,也是百度产品部门成熟的数据团队,团队在百度横向数据团队具备较大影响力。
演讲主题:打怪升级 之 数仓困境二三事
简介:数据仓库作为BI体系的重要组成部分,一直支撑、引导着当当的业务走向。本议题通过剖析数据仓库搭建中遇到的问题、踩过的坑,分享当当BI大数据体系的心路历程。
演讲嘉宾:刘鸿超 当当技术部开发总监
2011年加入当当,多年数据开发经验,历任开发工程师、开发经理、数据开发总监,目前负责用户、销售、流量等BI大数据体系中,离线、实时方面的架构设计,及数据分析平台搭建。
演讲主题:汽车之家数据平台架构
简介:从网站页面说起,用户的行为日志是怎么一层一层穿过数据平台的架构,终展现在数据报表上的。详细介绍汽车之家如何基于大数据技术,应对业务发展的需求,构建自己的数据平台和数据仓库;分享在网站推荐和用户分析上做的一些尝试,在数据方面,遇到的一些典型问题的解决方案:1,IP地址库更新;2,evercookie & fingerprint;3,cookiemapping;4.移动deviceid的冲突和漂移及跨app共享;5,用户溯源等。
演讲嘉宾:高红锋 汽车之家用户智能组主管
2011年作为数据仓库架构师加入汽车之家,重构了汽车之家流量收集统计系统,从SQL Server迁移到Hadoop分布式架构,支持每日几亿流量的访问统计。负责汽车之家指数产品的研发,数据仓库平台的建设,网站推荐,用户行为分析。2014年负责开发了类似友盟的App统计SDK,支撑移动业务更精细化的运营和个性化推送。目前集群规模150台左右,支持pc和移动端流量统计,广告算法,数据仓库,指数系统,用户推荐。同时做了很多基础实践解决互联网遇到的普遍问题,如多网站cookie打通问题、IP地址库不准、cookie标识用户不准确、移动端设备id冲突和漂移等问题。
演讲主题:电商行业数据运营建设实践
简介:结合电商行业数据建设与数据运营经验,分享在电商行业数据运营、建设等的相关经验;一、电商需要哪些数据;二、如何对数据分析;三、如何对数据挖掘;四、电商数据运营的方法;五、数据仓库建设经验。
演讲嘉宾:王庆恒 数据挖掘工程师
北京邮电大学硕士研究生毕业后,就职于搜狗科技发展有限公司商业广告部门,负责并参与了搜索商业广告数据仓库和商业智能的建设,并搭建了大数据分析平台;后就职于百度公司,负责客户端软件部数据仓库和数据建设;现就职于兰亭集势,负责公司商业智能数据建设、数据挖掘工作。