Join 数据类型—Elastic Stack 实战手册-阿里云开发者社区

Join 数据类型—Elastic Stack 实战手册

2021-05-16 303

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

检索分析服务 Elasticsearch 版，2核4GB开发者规格 1个月

简介： Join 类型是一种特殊的数据类型，类似父子结构，一个子文档只能有一个父文档，一个父文档可以有多个子文档。

· 更多精彩内容，请下载阅读全本《Elastic Stack实战手册》

· 加入创作人行列，一起交流碰撞，参与技术圈年度盛事吧

创作人：李增胜

Join 类型是一种特殊的数据类型，类似父子结构，一个子文档只能有一个父文档，一个父文档可以有多个子文档。

使用场景

Join 可以实现父子文档的关系存储，在什么情况下使用 Join 类型呢？假设我们存在这种场景，售卖的商品有评价信息，商品信息不会经常发生变更，但是评论信息就更新的比较频繁了，此时就可以使用 Join 数据类型来处理此种业务，一对多关系存在多个文档中，父子文档更新性能高，可独立更新，互不影响。

在实际使用场景中，推荐使用 Data denormalization 来解决过多关联查询问题，字面解读就是”非规范化存储”，通过冗余存储多字段来达到过多关联的查询问题，避免使用 Join 数据类型，虽然带来了关联的方便性，但是会带来额外的查询开销影响搜索性能。

此外，Kibana 对 Join 以及 Nested 的支持也比较少

#定义索引，my_goods_sale 为售卖的商品信息，my_goods_comment 为商品的评价信息
PUT my_goods_hot_sale
{
  "mappings": {
    "properties": {
      "my_id": {
        "type": "keyword"
      },
      "my_join_field": { 
        "type": "join",
        "relations": {
          "my_goods_sale": "my_goods_comment" 
        }
      }
    }
  }
}

#添加商品售卖 ID 为1的信息
PUT my_goods_hot_sale/_doc/1?refresh
{
  "my_id": "1",
  "text": "This is a my_goods_sale",
  "my_join_field": {
    "name": "my_goods_sale" 
  }
}

#添加商品售卖 ID 为2的信息
PUT my_goods_hot_sale/_doc/2?refresh
{
  "my_id": "2",
  "text": "This is another my_goods_sale",
  "my_join_field": {
    "name": "my_goods_sale"
  }
}

#添加商品售卖 ID 为3，父商品为1，注意父子文档一定要在一个 shard 上
PUT my_goods_hot_sale/_doc/3?routing=1&refresh
{
  "my_id": "3",
  "text": "This is an comment",
  "my_join_field": {
    "name": "my_goods_comment", 
    "parent": "1" 
  }
}

#添加商品售卖 ID 为4，父商品为1
PUT my_goods_hot_sale/_doc/4?routing=1&refresh
{
  "my_id": "4",
  "text": "This is another comment",
  "my_join_field": {
    "name": "my_goods_comment",
    "parent": "1"
  }
}

根据父文档查询子文档

GET my_goods_hot_sale/_search
{
  "query": {
    "has_parent": {
      "parent_type": "my_goods_sale",
      "query": {
        "match": {
          "text": "my_goods_sale"
        }
      }
    }
  }
}

根据子文档查询父文档

GET my_goods_hot_sale/_search
{
  "query": {
    "has_child": {
      "type": "my_goods_comment",
      "query": {
        "match_all": {}
      }
    }
  }
}

相关实践学习

使用阿里云Elasticsearch体验信息检索加速

通过创建登录阿里云Elasticsearch集群，使用DataWorks将MySQL数据同步至Elasticsearch，体验多条件检索效果，简单展示数据同步和信息检索加速的过程和操作。

ElasticSearch 入门精讲

ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示，Elasticsearch是最受欢迎的企业搜索引擎，其次是Apache Solr（也是基于Lucene）。 ElasticSearch的实现原理主要分为以下几个步骤：用户将数据提交到Elastic Search 数据库中通过分词控制器去将对应的语句分词，将其权重和分词结果一并存入数据当用户搜索数据时候，再根据权重将结果排名、打分将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索，具有接近实时的搜索，并支持多租户。

Join 数据类型—Elastic Stack 实战手册

使用场景

检索分析服务 Elasticsearch版

热门文章

最新文章

相关电子书

相关实验场景