近我在思考实时数仓问题的时候,想到了巨量的 Redis 的存储的问题,然后翻阅到这篇文章,与各位分享
一、需求背景
该应用场景为 DMP 缓存存储需求,DMP 需要管理非常多的第三方 id 数据,其中包括各媒体 cookie 与自身 cookie(以下统称 supperid)的 mapping 关系,还包括了 supperid 的人口标签、移动端id(主要是idfa和imei)的人口标签,以及一些黑名单id、ip等数据。
二、存储何种数据
1、PC端的ID:
媒体编号-媒体 cookie=>supperid
supperid => { age=>年龄段编码,gender=>性别编码,geo=>地理位置编码 }
2、Device 端的 ID:
imei or idfa => { age=>年龄段编码,gender=>性别编码,geo=>地理位置编码 }
显然 PC 数据需要存储两种 key=>value 还有 key=>hashmap,⽽ Device 数据需要存储⼀一种
key=>hashmap即可。
三、数据特点
短 key 短 value:
-
-
-
其中superid为21位数字:比如1605242015141689522;
imei为小写md5:比如2d131005dc0f37d362a5d97094103633;
idfa为大写带”-”md5:比如:51DFFC83-9541-4411-FA4F-356927E39D04;
媒体自身的 cookie 长短不一;
需要为全量数据提供服务,supperid 是百亿级、媒体映射是千亿级、移动 id 是几十亿级;
每天有十亿级别的 mapping 关系产生;
对于较大时间窗口内可以预判热数据(有一些存留的稳定 cookie);
对于当前 mapping 数据无法预判热数据,有很多是新生成的 cookie;
四、存在的技术挑战
长短不一容易造成内存碎片;
由于指针大量存在,内存膨胀率比较高,一般在7倍,纯内存存储通病;
虽然可以通过cookie的行为预判其热度,但每天新生成的id依然很多(百分比比较敏感,暂不透露);
由于服务要求在公网环境(国内公网延迟60ms以下)下100ms以内,所以原则上当天新更新的 mapping 和人口标签需要全部 in memory,而不会让请求落到后端的冷数据;
业务方面,所有数据原则上至少保留35天甚至更久;
内存至今也比较昂贵,百亿级Key乃至千亿级存储方案势在必行!
五、解决方案
5.1 淘汰策略
存储吃紧的一个重要原因在于每天会有很多新数据入库,所以及时清理数据尤为重要。主要方法就是发现和保留热数据淘汰冷数据。
网民的量级远远达不到几十亿的规模,id 有一定的生命周期,会不断的变化。所以很大程度上我们存储的id实际上是的。而查询其实前端的逻辑就是广告曝光,跟人的行为有关,所以一个 id 在某个时间窗口的(可能是一个campaign,半个月、几个月)访问行为上会有一定的重复性。
数据初始化之前,我们先利用 HBase 将日志的id聚合去重,划定TTL的范围,一般是35天,这样可以砍掉近35天未出现的id。另外在 Redis 中设置过期时间是35天,当有访问并命中时,对 key 进行续命,延长过期时间,未在 35 天出现的自然淘汰。这样可以针对稳定 cookie 或 id 有效,实际证明,续命的方法对 idfa 和 imei 比较实用,长期积累可达到非常理想的命中。
5.2 减少膨胀
下面是具体的实现方式
public static byte [] getBucketId(byte [] key, Integer bit) {
MessageDigest mdInst = MessageDigest.getInstance("MD5");
mdInst.update(key);
byte [] md = mdInst.digest();
byte [] r = new byte[(bit-1)/7 + 1];// 因为一个字节中只有7位能够表示成单字符,ascii码是7位
int a = (int) Math.pow(2, bit%7)-2;
md[r.length-1] = (byte) (md[r.length-1] & a);
System.arraycopy(md, 0, r, 0, r.length);
for(int i=;i<r.length;i++) {
if(r[i]<) r[i] &= 127;
}
return r;
}
参数 bit 决定了终 BucketId 空间的大小,空间大小集合是2的整数幂次的离散值。这里解释一下为何一个字节中只有7位可用,是因为 redis 存储 key 时需要是 ASCII(0~127),而不是 byte array。如果规划百亿级存储,计划每个桶分担10个kv,那么我们只需 2^30=1073741824 的桶个数即可,也就是终 key 的个数。
5.3 减少碎片
另外提一下,减少碎片还有个很 low 但是有效的方法,将 slave 重启,然后强制的 failover 切换主从,这样相当于给master整理的内存的碎片。
推荐 Google-tcmalloc, facebook-jemalloc 内存分配,可以在 value 不大时减少内存碎片和内存消耗。有人测过大 value 情况下反而libc更节约。
来源:juejin.cn/post/6956147115286822948