ROW Key COLUMN+CELL
18977777777 column=msisdn:*#06#, timestamp=1351560318018, value=100
18977777777 column=msisdn:cellphone,timestamp=1351563680951, value=iphone-5
18977777777 column=sites:http, timestamp=1351560423739, value=www.dataguru.cn 登陆网站
18977777777 column=sites:name, timestamp=1351560476264, value=lianshuchengjin
18977777777 column=user:age, timestamp=1351560350911, value=28
18977777777 column=user:name, timestamp=1351560335833, value=leonarding
18866662222 column=msisdn:*#06#, timestamp=1351560560622, value=101
18866662222 column=msisdn:cellphone, timestamp=1351560540173, value=iphone-4
18866662222 column=sites:http, timestamp=1351560630783, value=www.dataguru.cn 登陆网站
18866662222 column=sites:name, timestamp=1351560664387, value=lianshuchengjin
18866662222 column=user:age, timestamp=1351560606783, value=26
18866662222 column=user:name, timestamp=1351560585193, value=sunev_yu
15911112222 column=msisdn:*#06#, timestamp=1351560873212, value=102
15911112222 column=msisdn:cellphone, timestamp=1351560851244, value=iphone-3
15911112222 column=sites:http, timestamp=1351562148765, value=www.itpub.net 登陆网站
15911112222 column=sites:name, timestamp=1351562171874, value=itpub
15911112222 column=user:age, timestamp=1351562118827, value=100
15911112222 column=user:name, timestamp=1351562102858, value=tigerfish
第二步:在map-reduce程序中进行统计和排名(由于手机号就是随机型的因此可以均衡的打散到各个节点执行)。
第三步:汇总结果后,把排名前20的热点网站输出,运营商就可以找到这些热点网站进行合作推出更符合用户倾向的套餐,大把大把的敛money。
后续还可以开发:用户倾向性分析、TOPn大流量排名分析、用户行为分析等等诸如此类的功能。
欢迎大家一起积极讨论,共创Hbase美好未来