當前位置：首頁 > 科技 > 軟件

深度探索 Elasticsearch 8.X：function_score 參數解讀與實戰案例分析

來源：責編：時間：2023-08-05 11:45:48 4764觀看

導讀在 Elasticsearch 中，function_score 可以讓我們在查詢的同時對搜索結果進行自定義評分。function_score 提供了一系列的參數和函數讓我們可以根據需求靈活地進行設置。近期有同學反饋，function_score 的相關參數不好理

在 Elasticsearch 中，function_score 可以讓我們在查詢的同時對搜索結果進行自定義評分。

function_score 提供了一系列的參數和函數讓我們可以根據需求靈活地進行設置。

近期有同學反饋，function_score 的相關參數不好理解，本文將深入探討 function_score 的核心參數和函數。

圖片

1、function_score 函數的用途及適用場景

Elasticsearch 的 function_score 查詢是一種強大的工具，它可以允許我們修改文檔的基本的相關評分，讓我們在特定的應用場景下獲得更好的搜索結果。

這個功能通過提供了一組內置函數（如 script_score, weight, random_score, field_value_factor, decay functions等），以及一系列參數（如boost_mode和score_mode等）來實現。

以下是一些 function_score 可以應用的場景：

1.1 用戶偏好場景

如果需要了解用戶的興趣或者行為，我們可以使用 function_score 來提升用戶可能感興趣的結果。

比如在推薦系統中，如果我們已知道用戶喜歡某個作者的文章，可以提升這個作者的文章的得分。

比如最近火熱的“羅剎海市”就被網易云音樂推薦到最前面。

圖片

1.2 隨機抽樣場景

如果我們需要從一個大的數據集中隨機抽樣，可以使用 random_score 函數。

這個函數會給每個文檔生成一個隨機得分，從而讓我們能夠得到隨機的搜索結果。

1.3 時間敏感的查詢場景

對于一些時間敏感的數據，比如新聞、博客文章或者論壇帖子，新的文檔通常比舊的文檔更相關。

在這種情況下，我們可以使用 decay functions（衰減函數）來降低舊的文檔的得分。

1.4 地理位置敏感的查詢場景

如果我們的應用關心地理位置，比如房地產或者旅游相關的應用。

可以使用 decay functions （衰減函數）來提升接近某個地理位置的文檔的得分。

1.5 特定字段影響場景

如果我們的文檔有一些字段值可以影響相關度評分，可以使用 field_value_factor （字段值因子）函數。

比如在電商場景，一個商品的銷量、評分或者評論數量可能會影響搜索結果的排序。

總的來說，function_score 提供了一種靈活的方式來滿足各種復雜的相關度評分需求。

2、function_score 參數介紹

2.1 boost_mode 參數

boost_mode 決定了如何將查詢得分和函數得分進行組合。

可接受的參數有：

boost_mode	描述
multiply	查詢得分和函數得分相乘（默認值）
sum	查詢得分和函數得分相加
avg	查詢得分和函數得分的平均值
first	僅僅使用函數得分
max	查詢得分和函數得分中的最大值
min	查詢得分和函數得分中的最小值
replace	完全替換查詢得分，只使用函數得分

2.2 score_mode

score_mode 決定了如何處理多個函數的分數。

可接受的參數有：

score_mode	描述
multiply	各個函數得分相乘
sum	各個函數得分相加（默認值）
avg	各個函數得分的平均值
first	僅僅使用第一個函數的得分
max	各個函數得分中的最大值
min	各個函數得分中的最小值

2.3 提供的函數

function_score 提供了多種函數類型來進行自定義評分：

Score Function	描述
script_score	用腳本計算得分
weight	簡單地修改查詢得分，不考慮字段值
random_score	生成隨機得分
field_value_factor	使用字段值進行計算得分
decay functions	衰減函數，根據字段值的距離計算得分，越近得分越高

3、function_score 使用實戰解讀

3.1 構造數據

為了幫助大家更好地理解，我們將創建一個簡單的索引，插入一些文檔，并對它們執行 function_score 查詢。

假設我們有一個名為 articles 的索引，里面存儲了一些博客文章的數據，包括作者(author)，標題(title)，內容(content)，以及這篇文章的喜歡數量(likes)。

首先，創建索引并添加一些文檔：

PUT /articles{  "mappings": {    "properties": {      "title": { "type": "text" },      "author": { "type": "text" },      "content": { "type": "text" },      "likes": { "type": "integer" }    }  }}POST /_bulk{ "index" : { "_index" : "articles", "_id" : "1" } }{ "title": "Elasticsearch Basics", "author": "John Doe", "content": "This article introduces the basics of Elasticsearch.", "likes": 100 }{ "index" : { "_index" : "articles", "_id" : "2" } }{ "title": "Advanced Elasticsearch", "author": "Jane Doe", "content": "This article covers advanced topics in Elasticsearch.", "likes": 500 }{ "index" : { "_index" : "articles", "_id" : "3" } }{ "title": "Elasticsearch Function Score Query", "author": "John Doe", "content": "This article discusses the function_score query in Elasticsearch.", "likes": 250 }

現在我們有了一些文檔，讓我們對它們執行 function_score 查詢。

3.2 使用 script_score 函數實現基于 'likes' 字段的對數加權排序

GET /articles/_search{  "query": {    "function_score": {      "query": {        "match_all": {}      },      "boost": "5",      "functions": [        {          "script_score": {            "script": {              "source": "Math.log(1 + doc['likes'].value)"            }          }        }      ],      "boost_mode": "multiply"    }  }}

上述查詢使用了 Elasticsearch 的 function_score 查詢。

它首先對 "articles" 索引中的所有文檔進行匹配（使用 match_all 查詢），然后使用一個腳本函數（script_score），該腳本會計算每個文檔的 "likes" 字段的自然對數值加一（Math.log(1 + doc['likes'].value)），然后把這個得分與原始查詢得分相乘（由于 boost_mode 被設為了 "multiply"），最終的得分再乘以5（由于 boost 被設為了 "5"）。這種查詢用于根據 "likes" 字段對結果進行加權排序。

執行結果如下：

圖片

3.3 使用 random_score 生成基于 'likes' 字段的全隨機結果查詢

GET /articles/_search{  "query": {    "function_score": {      "query": {         "match_all": {}       },      "functions": [        {          "random_score": {            "field": "likes"          }        }      ],      "boost_mode": "replace"    }  }}

上述查詢使用 Elasticsearch 的 function_score 查詢，并配合使用 random_score 函數。random_score 函數根據 "likes" 字段的值生成一個隨機分數。

重要的是，由于沒有提供一個固定的種子（seed），所以每次執行這個查詢都會返回一個全新的隨機排序結果。

match_all 是基礎查詢，用來匹配所有文檔。然后 random_score 函數基于 "likes" 字段值生成隨機分數。

boost_mode 設為 "replace" 表示忽略基礎查詢的分數，完全使用 random_score 函數的分數作為最終結果。所以，這個查詢會在每次執行時都返回全新的隨機排序結果。

執行結果如下圖所示：

圖片

3.4 field_value_factor 函數根據某個字段的值來修改_score

這對于一些字段很有用，比如"likes"：一篇有很多"likes"的文章可能比"likes"少的文章更相關。

示例如下：

GET /articles/_search{  "query": {    "function_score": {      "query": {        "match": {          "content": "Elasticsearch"        }      },      "functions": [        {          "field_value_factor": {            "field": "likes",            "factor": 1.2,            "modifier": "sqrt",            "missing": 1          }        }      ],      "boost_mode": "multiply"    }  }}

在這個查詢中：

"match": { "content": "Elasticsearch" }

表示基礎查詢是在 "content" 字段中匹配包含 "Elasticsearch" 的文章。

field_value_factor

函數用來基于 "likes" 字段的值調整查詢得分。它首先取 "likes" 字段的值，如果文檔沒有 "likes" 字段或者該字段的值為空，那么將使用 "missing" 參數指定的默認值1。然后，它將取得的值乘以 "factor" 參數指定的因子1.2。最后，它將結果進行 "modifier" 參數指定的平方根運算（"sqrt"）。

boost_mode

參數設置為 "multiply"，這表示將基礎查詢的得分和 field_value_factor 函數計算得出的得分相乘，以得到最終的文檔得分。

所以，這個查詢會返回包含 "Elasticsearch" 的文章，并且文章的得分會根據 "likes" 字段的值進行調整，"likes" 值越高的文章，得分也會越高。

執行結果如下：

圖片

3.5 decay functions 根據某個字段的值的距離來調整_score。

如果值接近某個中心點，得分就會更高。這對于日期或地理位置字段特別有用。

Elasticsearch 提供了三種衰減函數：線性（linear）、指數（exp）、和高斯（gauss）。

以下是使用 gauss 函數的一個示例：

GET /articles/_search{  "query": {    "function_score": {      "query": {        "match": {          "content": "Elasticsearch"        }      },      "functions": [        {          "gauss": {            "likes": {              "origin": "100",              "scale": "20",              "offset": "0",              "decay": 0.5            }          }        }      ],      "boost_mode": "multiply"    }  }}

上述執行可概括為：使用 function_score 和 gauss 函數對含有 'Elasticsearch' 的文章進行基于 'likes' 字段的高斯衰減得分調整"。

在這個查詢中：

"match": { "content": "Elasticsearch" }

表示基礎查詢是在 "content" 字段中匹配包含 "Elasticsearch" 的文章。

gauss

函數則是用來對 "likes" 字段的值進行高斯衰減處理。

其中，

參數	值	描述
origin	100	期望的中心點，即 "likes" 字段的最理想值
scale	20	表示衰減的速度，也就是距離 "origin" 值多遠時，得分會衰減到原始得分的一半
offset	0	表示在距離 "origin" 多少的范圍內不進行衰減
decay	0.5	表示當距離超過了 "scale" 之后，得分會以多快的速度衰減，例如 0.5 表示超過 "scale" 距離后，得分會衰減到原始得分的一半

boost_mode

參數設置為 "multiply"，這表示將基礎查詢的得分和 gauss 函數計算得出的得分相乘，以得到最終的文檔得分。

所以，這個查詢會返回包含 "Elasticsearch" 的文章，并且文章的得分會根據 "likes" 字段的值進行高斯衰減處理，"likes" 值越接近100的文章，得分也會越高。

圖片

4、小結

在深入了解 Elasticsearch 的 function_score 后，我們可以明顯感受到其在搜索應用中的強大作用。無論是基于特定字段值的排序，還是利用自定義腳本微調搜索結果，function_score 都能發揮其出色的性能。

盡管 function_score 的參數和選項多樣，初看可能會覺得復雜，但只需理解各參數的含義和作用，我們就能根據需求靈活運用。實際案例中，我們使用了 script_score、field_value_factor、random_score 和 decay functions 等函數，演示了如何通過 function_score 滿足復雜的搜索需求。

但是，我們也必須注意，在使用 function_score 時，要慎重考慮性能問題，因為復雜的函數和腳本可能占用大量計算資源。在實際應用中，我們應始終關注這一點，以維護良好的系統性能。

此外，隨著數據和用戶行為的不斷變化，我們需要持續觀察、學習和調整搜索策略，以不斷提升用戶體驗。在這個過程中，function_score 將是我們強有力的工具。

總的來說，Elasticsearch 的 function_score 是一個強大而靈活的工具，只要我們深入了解并恰當使用，就能夠挖掘其巨大的潛力，提升我們的搜索應用性能和用戶體驗。

本文鏈接：http://www.tebozhan.com/showinfo-26-132-0.html深度探索 Elasticsearch 8.X：function_score 參數解讀與實戰案例分析

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：在線圖片編輯器，支持PSD解析、AI摳圖等

下一篇：三萬字盤點 Spring 九大核心基礎功能

標簽：

熱門焦點

2023年Q2用戶偏好榜：12+256G版本成新主流

3月份的性能榜、性價比榜和好評榜之后，就要輪到2023年的第二季度偏好榜了，上半年的新機潮已經過去，最明顯的肯定就是大內存和存儲的機型了，另外部分中端機也取消了屏幕塑料支架
不容錯過的MSBuild技巧，必備用法詳解和實踐指南

一、MSBuild簡介MSBuild是一種基于XML的構建引擎，用于在.NET Framework和.NET Core應用程序中自動化構建過程。它是Visual Studio的構建引擎，可在命令行或其他構建工具中使用
得物效率前端微應用推進過程與思考

一、背景效率工程隨著業務的發展，組織規模的擴大，越來越多的企業開始意識到協作效率對于企業團隊的重要性，甚至是決定其在某個行業競爭中突圍的關鍵，是企業長久生存的根本。得物
馮提莫簽約抖音公會前“斗魚一姐”消失在直播間

來源：直播觀察提起“馮提莫”這個名字，很多網友或許聽過，但應該不記得她是哪位主播了。其實，作為曾經的“斗魚一姐”，馮提莫在游戲直播的年代影響力不輸于現
余承東:AI大模型技術的發展將會帶來下一代智能終端操作系統的智慧體驗

8月4日消息，2023年華為開發者大會（HDC.Together）今天正式開幕，華為發布HarmonyOS 4、全新升級的鴻蒙開發套件、HarmonyOS Next開發者預覽版本等一系列
華為Mate 60系列用上可變靈動島：正式版體驗將會更出色

這段時間以來，關于華為新旗艦的爆料日漸密集。據此前多方爆料，今年華為將開始恢復一年雙旗艦戰略，除上半年推出的P60系列外，往年下半年的Mate系列也將
iQOO Neo8 Pro真機諜照曝光：天璣9200+和V1+旗艦雙芯加持

去年10月，iQOO推出了iQOO Neo7系列機型，不僅搭載了天璣9000+，而且是同價位唯一一款天璣9000+直屏旗艦，一經上市便受到了用戶的廣泛關注。在時隔半年后，
iQOO Neo8系列或定檔5月23日：首發天璣9200+ 安卓跑分王者

去年10月，iQOO推出了iQOO Neo7系列機型，不僅搭載了天璣9000+，而且是同價位唯一一款天璣9000+直屏旗艦，一經上市便受到了用戶的廣泛關注。在時隔半年后，
最薄的14英寸游戲筆記本電腦 Alienware X14已可以購買

2022年1月份在國際消費電子展(CES2022)上首次亮相的Alienware新品——Alienware X14現在已經可以購買了，這款筆記本電腦被譽為世界上最薄的 14 英寸游戲筆

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

深度探索 Elasticsearch 8.X：function_score 參數解讀與實戰案例分析

1、function_score 函數的用途及適用場景

1.1 用戶偏好場景

1.2 隨機抽樣場景

1.3 時間敏感的查詢場景

1.4 地理位置敏感的查詢場景

1.5 特定字段影響場景

2、function_score 參數介紹

2.1 boost_mode 參數

2.2 score_mode

2.3 提供的函數

3、function_score 使用實戰解讀

3.1 構造數據

3.2 使用 script_score 函數實現基于 'likes' 字段的對數加權排序

3.3 使用 random_score 生成基于 'likes' 字段的全隨機結果查詢

3.4 field_value_factor 函數根據某個字段的值來修改_score

3.5 decay functions 根據某個字段的值的距離來調整_score。

4、小結

2023年Q2用戶偏好榜：12+256G版本成新主流

不容錯過的MSBuild技巧，必備用法詳解和實踐指南

得物效率前端微應用推進過程與思考

馮提莫簽約抖音公會前“斗魚一姐”消失在直播間

余承東:AI大模型技術的發展將會帶來下一代智能終端操作系統的智慧體驗

華為Mate 60系列用上可變靈動島：正式版體驗將會更出色

iQOO Neo8 Pro真機諜照曝光：天璣9200+和V1+旗艦雙芯加持

iQOO Neo8系列或定檔5月23日：首發天璣9200+ 安卓跑分王者

最薄的14英寸游戲筆記本電腦 Alienware X14已可以購買

最新推薦

猜你喜歡

熱門推薦

相關資訊