分享好友

×
取消 复制
elasticsearch的查询基础知识
2020-05-27 10:29:36

es的全文索引、丰富的搜索api是她受欢迎的一个重要原因。DSL查询语句,可以让用户定制各类型的查询、聚类语句。

基本概念:

term:词项,即索引的最小单元,文本搜索时最小的匹配单元。

match查询语句,match和term查询的最大区别在于,term查询会将查询词当为词项,并在倒排索引中进行全匹配。match查询会先进行分词处理,再将解析后的词项去查询,"minimum_should_match",可以控制match的查询词中最小应该匹配的比例。

match_phrase,句子查询,和match的区别,phrase是句子,句子内部要保持信息一致,所以match_phrase查询将全匹配句子所有文字,并且保证文字之间的相对位置。es提供了slop等查询控制,给用户去调整文字间相对位置的距离。slop:1 以为着 查询词“帅哥”,可以匹配到“帅*哥”,中间可以有一个文本的距离。

boost,控制单个查询语句在整体查询语句中的权重。

bool逻辑查询,should,must,should_not, must_not,可以和match、term查询进行嵌套。"minimum_should_match",在这里也可以控制should的处理个数。( 可以组合match bool,match_phrase来保证文本的相对位置,以及允许少匹配文本个数。)

aggs,聚合查询。强大的聚合查询,根据用户设置的桶处理条件,可以进行桶內数据的sum,min,max,统计。terms桶,会根据terms处理字段,统计桶內同一文体聚类数量。聚合查询支持,嵌套桶,时间范围的桶等。

注意1:match_phrase_prefix查询,非常消耗资源,今天中午才进行测试时,成功一条查询,挂掉了本地es服务。

注意2:slop在处理list字段时,小心逗号造成的文本对象位置问题。可以在mapping时定义list分词时逗号文本的距离问题。

分享好友

分享这个小栈给你的朋友们,一起进步吧。

Elasticsearch
创建时间:2020-05-22 14:49:51
ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。我们建立一个网站或应用程序,并要添加搜索功能,但是想要完成搜索工作的创建是非常困难的。我们希望搜索解决方案要运行速度快,我们希望能有一个零配置和一个完全免费的搜索模式,我们希望能够简单地使用JSON通过HTTP来索引数据,我们希望我们的搜索服务器始终可用,我们希望能够从一台开始并扩展到数百台,我们要实时搜索,我们要简单的多租户,我们希望建立一个云的解决方案。因此我们利用Elasticsearch来解决所有这些问题及可能出现的更多其它问题。
展开
订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询

• 专区发布评论属默认订阅所评论专区(除付费小栈外)

技术专家

查看更多
  • 栈栈
    专家
戳我,来吐槽~