Elasticsearch屬性單詞常用解析說明
一、前言
說實(shí)話,剛測試ES的時(shí)候,我的內(nèi)心是崩潰的,好多單詞都不知道代表什么意思,只能一邊測試,一邊查詢??吹骄挖s緊記下來,一天下來,也算是學(xué)的七七八八吧。這里分享給大家。
二、ES常見單詞解釋
1、url請求中的參數(shù):
curl -XPOST 'localhost:9200/bank/type1/_search?pretty' -d ' { "query": { "match_all": {} } }' (1)9200后面的bank是索引名字 (2)type1代表es的type,類似于傳統(tǒng)數(shù)據(jù)庫的table (3)pretty:pretty是將返回的信息以可讀的JSON形式返回
2、_source字段:
這個(gè)字段代表是否存儲在原始文檔。如果設(shè)置為true,那么查詢之后,會在hits.hits里面有個(gè)_source數(shù)組,展示原始文檔。
_source可以限制存儲部分字段,或者不存儲部分字段,形如:
"yourtype":{ "_source":{ "includes":["field1","field2"] //這兩個(gè)字段會存儲在原始文檔 }, "properties": { ... } } "yourtype":{ "_source":{ "excludes":["field1","field2"] //這兩個(gè)字段不會存儲在原始文檔 }, "properties": { ... } }
3、_all的配置:
這個(gè)屬性的配置方法和_source類似,它是把一個(gè)文檔里面的所有信息都放到一起組合成一個(gè)大字段。我們可以設(shè)置這個(gè)字段包含所有的字段,也可以設(shè)置只包含幾個(gè)字段,或者是只存儲幾個(gè)字段
(1)包含所有字段
"yourtype": { "_all": { "enabled": true //這樣設(shè)置的話,就包含了所有的字段 },}
(2)包含或者不包含部分字段
"yourtype": { "properties": { "field1": { "type": "string", "include_in_all": false //這個(gè)字段不包含在_all }, "field2": { "type": "string", "include_in_all": true //這個(gè)字段包含在_all } } }
4、highlight 高亮顯示:
這個(gè)字段類似于咱們百度的時(shí)候,符合預(yù)期文字的部分都會高亮顯示出紅色來
(1)可以在查詢時(shí)指定高亮字段或者全部高亮
"query": { "match": { "_all": "中國人" } }, "highlight": { "fields": { //"_all": {} //這是對_all字段進(jìn)行高亮查詢 //"title": {} //這是對title字段進(jìn)行高亮顯示 } }
5、設(shè)置字段的index屬性。
這個(gè)屬性是控制該字段是否生成倒排索引,取值主要有三個(gè):
(1)analyzed:字段被索引,會做分詞,可搜索。反過來,如果需要根據(jù)某個(gè)字段進(jìn)搜索,index屬性就應(yīng)該設(shè)置為analyzed。 (2)not_analyzed:字段值不分詞,會被原樣寫入索引。反過來,如果某些字段需要完全匹配,比如人名、地名,index屬性設(shè)置為not_analyzed為佳。 (3)no:字段不寫入索引,當(dāng)然也就不能搜索。反過來,有些業(yè)務(wù)要求某些字段不能被搜索,那么index屬性設(shè)置為no即可。
類似于:
(1)analyzed:字段被索引,會做分詞,可搜索。反過來,如果需要根據(jù)某個(gè)字段進(jìn)搜索,index屬性就應(yīng)該設(shè)置為analyzed。 (2)not_analyzed:字段值不分詞,會被原樣寫入索引。反過來,如果某些字段需要完全匹配,比如人名、地名,index屬性設(shè)置為not_analyzed為佳。 (3)no:字段不寫入索引,當(dāng)然也就不能搜索。反過來,有些業(yè)務(wù)要求某些字段不能被搜索,那么index屬性設(shè)置為no即可。
6、store屬性:
用于指定是否將原始字段寫入索引,默認(rèn)取值為no。
因?yàn)樵贚ucene中,高亮功能和store屬性是否存儲息息相關(guān),因?yàn)樾枰鶕?jù)偏移位置到原始文檔中找到關(guān)鍵字才能加上高亮的片段。在Elasticsearch,因?yàn)開source中已經(jīng)存儲了一份原始文檔,可以根據(jù)_source中的原始文檔實(shí)現(xiàn)高亮,在索引中再存儲原始文檔就多余了,所以Elasticsearch默認(rèn)是把store屬性設(shè)置為no。
注意: 如果想要對某個(gè)字段實(shí)現(xiàn)高亮功能,_source和store至少保留一個(gè)。
參考:https://blog.csdn.net/mlljava1111/article/details/70598481
7、took :該請求花了多少毫秒 (took)
8、_shards:
描述了查詢分片的信息,查詢了多少個(gè)分片、成功的分片數(shù)量、失敗的分片數(shù)量等猜測這個(gè)字段代表該次查詢,獲取數(shù)據(jù)經(jīng)過的分片數(shù)量之和
9、hits:
搜索的結(jié)果,total是全部的滿足的文檔數(shù)目,hits是返回的實(shí)際數(shù)目(默認(rèn)是10)
10、max_score和_score :
代表的是查詢結(jié)果的評分值,分越高,代表權(quán)重越大,排名越靠前。具體的參考:
https://blog.csdn.net/paditang/article/details/79098830
有的時(shí)候我們可能對分?jǐn)?shù)不感興趣,就可以使用filter進(jìn)行過濾,它不會去計(jì)算分值,因此效率也就更高一些
11、Routing:Elasticsearch的路由機(jī)制
我們可以通過制定路由,而避免ES自己進(jìn)行大量的廣播操作。直接按照我們制定的路由找到對應(yīng)的分片查詢,關(guān)于路由機(jī)制,我們不做贅述,只是了解下就行。
具體請參考:https://blog.csdn.net/cnweike/article/details/38531997
12、term和trems:
這兩個(gè)是精準(zhǔn)查找,一個(gè)是單數(shù),一次查找單個(gè)值。一個(gè)是復(fù)數(shù),一次查找多個(gè)值。
例如:"terms" : { "price" : [20, 30] }
13、先看個(gè)語句:
GET _search { "query": { "filtered": { "query": { "match": { "text": "quick brown fox" } }, "filter": { "term": { "status": "published" } } } } }
(1) 這里的"filtered": 從ES5.0之后被移除了。
(2) filter代表過濾匹配,也是為了過濾status字段,讓它不去計(jì)算的分?jǐn)?shù),不用計(jì)算權(quán)重等。
新的語句為:
GET _search { "query": { "bool": { "must": { "match": { "text": "quick brown fox" } }, "filter": { "term": { "status": "published" } } } } }
(3) bool代表的是bool查詢,參數(shù)主要有:
must 所有的語句都 必須(must) 匹配,與 AND 等價(jià)。 must_not 所有的語句都 不能(must not) 匹配,與 NOT 等價(jià)。 should 至少有一個(gè)語句要匹配,與 OR 等價(jià)
到此這篇關(guān)于Elasticsearch屬性單詞常用解析說明的文章就介紹到這了,更多相關(guān)Elasticsearch屬性單詞解析內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
版權(quán)聲明:
本站所有文章和圖片均來自用戶分享和網(wǎng)絡(luò)收集,文章和圖片版權(quán)歸原作者及原出處所有,僅供學(xué)習(xí)與參考,請勿用于商業(yè)用途,如果損害了您的權(quán)利,請聯(lián)系網(wǎng)站客服處理。