分享自己的观点...
飘絮絮絮丶
飘絮絮絮丶
2022-06-01 14:47:44
我们长期以来,Lucene在搜索领域的垄断地位无人能及,基于Lucene之上的ElasticSearch与Solr也是家喻户晓的产品;录信数据库初的版本也是基于Lucene来实现的,在设计之初经常会遇到跟solr、es同样的问题。如面对几十亿的数据就遇到内存爆掉的问题,此时CPU与...
飘絮絮絮丶
2022-06-01 14:46:21
我们在如下场景中,我们需要对A表数据进行筛选,然后将筛选后的结果跟另外一张表进行关联碰撞。如果筛选后的结果,内存可以放的下,就可以考虑使用RamIndexFilter来提升关联碰撞的性能。因为使用RamIndexFilter是直接使用索引进行关联的,并非采用暴力扫描的方式进行关联,关...
飘絮絮絮丶
2022-06-01 14:44:18
将表中已有的字段中的数据汇聚到一个新的字段中进行存储的机制,用以解决数据搜索过程中不知道位置的问题的方法叫做汇聚存储。汇聚存储可以解决搜索的内容不知道在表的哪个字段中,可以做到全表匹配。再结合分词数据类型即可做到全文检索的特性。用户可以自己定义任意的字段存储到不同的或者相同的目标...
飘絮絮絮丶
2022-06-01 14:42:02
地理位置检索服务在日常生活中随处可见,小到共享单车、高德地图,大到飞行航线轨迹。上述服务中很多相关功能都可以通过GeoHash来实现,Lucene/Solr中也有应用到GeoHash,通过GeoHash创建索引、查询索引以及距离的计算等等。GeoHash编码Lucene内部san...
gaokeke123
2022-06-01 14:41:12
1.主从简介LSQL在主从集群上需要启动两个LSQL,两个LSQL是在进程上的资源隔离。在主上面可以进行数据的导入、删除以及查询。从只能负责数据的查询。启动多个lsql集群,一主多从。在主上面做数据写入。从做查询。与mysql不同的是,主从共享同一份数据。2.配置方法主从集群,需要在两个不同的机器上...
飘絮絮絮丶
2022-06-01 14:37:58
Facet在标签分析与画像分析中是必备的功能。facet用于反映一个搜索词的小平面(或者说某一个分组),即起到标签聚合统计的功能,可以像电商类网站那样的对搜索结果聚合分类,品牌等属性。简言之,facet就是某一类型的标签统计,比如xxx年热词等等,只要有记录,都能统计出来。这类数...
飘絮絮絮丶
2022-06-01 14:35:58
点击上方蓝字关注我们业务有成百上千张表,每张表有上百个列。在如下场景中:每张表的数据量都不多(几亿几十亿),但是表数量特别多(几十张甚至几百张表)如果为每个表都创建一个物理表,则会造成资源的浪费。同时存在如下问题:每张物理表都需要维护自己的BUFFER,极易OOM,导入性能太差。每张物理表都需要单独...
gaokeke123
2022-06-01 14:33:38
1.在配有主从集群时建议在主节点上做权限相关操作2.只有管理员和超级管理员才有将数据导入至表中的权限3.管理员用户赋予的是以整表为单位的权限,所有能赋予的权限为create/select/truncate/delete/drop4.管理员建表需要超管授权后才能创建,即使这张表不存在,直接创建也是没有...
点击加载更多
分享好友
分享这个小栈给你的朋友们,一起进步吧。
LSQL
创建时间:2022-04-24 17:00:53
分享
LSQL是录信数软研发的一款高性能分布式数据库,基于Lucene和Hadoop技术栈,面向全文检索与OLAP分析场景,实现超海量数据的即席交互式检索和实时多维钻取分析。
展开
订阅须知
• 所有用户可根据关注领域订阅专区或所有专区
• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询
• 专区发布评论属默认订阅所评论专区(除付费小栈外)
技术专家
查看更多- 飘絮絮絮丶专家
- 热门小栈
- 新小栈
- 更多