ElasticSearch自定义排序（转载）-阿里云开发者社区

ElasticSearch自定义排序（转载）

2017-10-22 2875

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

检索分析服务 Elasticsearch 版，2核4GB开发者规格 1个月

简介： 转自：http://www.dcharm.com/?p=469本文讨论ES的自定义排序的两种实现形式：基于groovy脚本的自定义排序和基于native script的自定义排序。

转自：http://www.dcharm.com/?p=469

本文讨论ES的自定义排序的两种实现形式：基于groovy脚本的自定义排序和基于native script的自定义排序。

1. 基于Groovy脚本的自定义排序

ES的排序脚本必须放在config/scripts下面,ES能够自动发现这些脚本并提供对外使用，例如编写脚本calculate-score.groovy

log(_score*2)+my_modifier

脚本中my_modifier是搜索请求中的参数,_score是ES计算得到的文档分数。发起搜索请求时指定用calculate-score排序

curl -XPOST localhost:9200/_search -d '{

"query": {

"function_score": {

"query": {

"match": {

"body": "foo"

}

"functions": [

{

"script_score": {

"lang": "groovy",

"script_file": "calculate-score",

"params": {

"my_modifier": 8

}

]

}

}}'

在上面的请求指定了my_modifier的值为8，排序时calculate-score脚本中对应变量my_modifier就会被赋值为8。除此以外，还可以在脚本中通过doc[‘field_name’].value或者doc[‘field_name’].value获取field data中的字段；通过_fields[‘field_name’]获取没有存放在doc values中但是放在了ES存储(store)中的字段。需要注意的是doc values会被载入到内存，而store不会，所以doc values取值速度更快。

ES会周期性的扫描config/scripts下面的文件，新增和被修改的脚本会被重新载入，并从script缓存中删除文件夹中被删除的脚本。重载的频率可以在watcher.interval中说明，默认是60s。如果要禁止重载脚本，可以设置script.auto_reload_enabled为false。

2. 基于native脚本的自定义排序

ES中的native脚本使用java语言编写，并需要实现相应的NativeScriptFactory接口。

public class CustomScriptFactory implements NativeScriptFactory {

@Override

publicExecutableScript newScript(@NullableMap params) {

returnnewCustomScript(params);

}

public class CustomScript extends AbstractDoubleSearchScript {

private double myVal;

private double base;

public CustomScript(@NullableMap params){

base = (Double)params.get("myVal");

}

@Override

public double runAsDouble() {

doublea = ((ScriptDocValues.Longs)doc().get("itemNum")).getValue();

returna +2;

}

将打包后的jar包放到ES的class path中，并在配置文件config/elasticsearch.yml中增加一行配置：

script.native.mynativescript.type: com.ymatou.search.searcher.script.CustomScriptFactory

Native脚本不能被ES自动发现，需要重启ES，另外搜索请求的格式也有些不同。

curl -XPOST localhost:19200/m2c/item/_search -d '{

"query": {

"function_score": {

"query": {

"match_all": {}

"functions": [

{

"script_score": {

"lang":"native",

"script":"m2c_jyh_base",

"params": {

"myVal": 10.0

}

]

}

3. Groovy脚本自定义排序和Native自定排序的比较

相对于Native自定义排序，Groovy脚本自定义排序实现和部署方便：不用编译打包，不用修改配置文件，也不用重启ES，但是Native自定义排序的速度是Groovy脚本自定义排序速度的1到3倍，因此建议大家使用Groovy脚本做实验，但是在生产环境中使用Native脚本。

相关实践学习

使用阿里云Elasticsearch体验信息检索加速

通过创建登录阿里云Elasticsearch集群，使用DataWorks将MySQL数据同步至Elasticsearch，体验多条件检索效果，简单展示数据同步和信息检索加速的过程和操作。

ElasticSearch 入门精讲

ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示，Elasticsearch是最受欢迎的企业搜索引擎，其次是Apache Solr（也是基于Lucene）。 ElasticSearch的实现原理主要分为以下几个步骤：用户将数据提交到Elastic Search 数据库中通过分词控制器去将对应的语句分词，将其权重和分词结果一并存入数据当用户搜索数据时候，再根据权重将结果排名、打分将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索，具有接近实时的搜索，并支持多租户。

ElasticSearch自定义排序（转载）

热门文章

最新文章

相关课程

相关电子书

相关实验场景