开发搜索引擎-开发搜索引擎文档介绍内容-移动阿里云

内容社区行业

更便捷的开发使用 ——上线周期短，降低搜索引擎开发、效果调优难度;用户搜索意图指向性强 ——主搜聚集多个频道内容，搜索结果相关性要求更加精准;以某论坛社区为例，产品线覆盖多个平台，包含网页、APP、小程序等形式，同时业务上区分多...

常见问题

目前的开放域搜索引擎是面向关键字搜索优化的，query超长会降低检索精度。故请求时建议将原始复杂问题通过模型改写为1-4个关键字进行检索（也可以1改N）。建议长度 15，在RT、相关性两个方面都能更优。索引构建的时效性如何，是否能够爬取...

接入搜索 HTTP API

工具路径：https://cloud-iqs.aliyuncs.com/search/unified 输入参数：query：查询语句（必填参数）engineType：搜索引擎类型（选填参数，业务透传，可参考文档中的参数自行配置）测试完成后发布插件，即可在阿里云百炼应用中使用 '信息...

搜索引擎线路

概述 搜索引擎是指搜索引擎爬虫（又被称为网页蜘蛛，网络机器人），是一种按照一定的规则自动抓取万维网信息的程序或者脚本。应用场景网站被搜索引擎爬虫访问会耗费服务器的流量和带宽，可通过设置 搜索引擎线路专门指向一个服务器地址，...

SQL开发

召回引擎版提供了SQL开发功能，支持SQL语句的编译、开发、测试，含高亮、自动补充、设置参数等IDE基础功能。使用方法进入 OpenSearch控制台，在左上角切换到 OpenSearch-召回引擎版，在实例管理页面对应的列表中找到所属实例，点击操作栏...

SQL开发

简介召回引擎版提供了SQL开发功能，支持SQL语句的编译、开发、测试，含高亮、自动补充、设置参数等IDE基础功能。使用方法进入 OpenSearch控制台，在左上角切换到 OpenSearch-召回引擎版，在实例管理页面对应的列表中找到所属实例，点击...

放行搜索引擎爬虫

为了避免等候室的排队机制对主流搜索引擎的SEO和搜索结果产生影响，您可以启用放行搜索引擎爬虫功能，使经过Bot Management验证的SEO爬虫程序可以绕过等候室直接访问您的源站资源。使用限制目前放行搜索引擎爬虫功能仅高级版和企业版...

增量导入

本章节介绍搜索引擎如何进行增量导入。请参见 RDS增量导入，将增量数据导入到宽表引擎中。导入宽表引擎后，后台会通过BDS服务自动将宽表引擎的增量数据同步到搜索引擎中。注意同步到搜索引擎的数据仅限于已经配置好的schema映射。

开通指南

本文介绍如何开通云原生多模数据库 Lindorm 搜索引擎以及如何查看连接地址。购买实例时开通搜索引擎 登录 Lindorm管理控制台。单击页面左上角的创建。在云原生多模数据库 Lindorm 售卖页，配置搜索节点规格(Solr API/Elasticsearch API)...

开通向量检索

Lindorm搜索引擎提供了向量检索功能，支持纯向量数据检索、向量数据与标量数据的混合检索。本文介绍如何开通Lindorm搜索引擎的向量检索功能。注意事项目前仅Lindorm新版实例（服务类型为 Lindorm_V2、购买实例时形态选择为生产型）...

分析器

分析器介绍中文通用分析器（chn_standard...比如干预“搜索引擎”的分词时，在词条中添加搜索引擎，搜索引擎还会继续分词成“搜索”、“引擎”两个词。注意事项该分析器只适用于TEXT类型字段，在配置schema的时候指定分析器为chn_standard。

释放引擎

如果您不再使用 Lindorm实例中的LTS服务或搜索引擎，可以通过Lindorm管理控制台手动释放，避免造成资金浪费。本文介绍通过控制台释放引擎的方法及相关注意事项。前提条件实例的服务类型为Lindorm。如何查看服务类型，请参见产品系列。...

搜索引导

本文介绍搜索引导中的下拉提示、黑白名单、热搜和底纹的基本概念。下拉提示是搜索服务的基础功能，在...热搜和底纹是一个完整搜索引擎必备的基本功能，通常占据着搜索框入口的重要位置，提供不可或缺的业务价值。详情请参见热搜和底纹。

什么是营销引擎

用户在营销广告页具备更长停留时间的优势场景融合支持用户线下互动场景和线上标签组合的投放模式，更精准的识别和触达目标用户 UC流量阿里唯一综合资讯平台与电商打通全球使用量最大的第三方浏览器移动搜索引擎NO.2 全球客户6亿人均...

引擎与数据权限管控

开发环境的MaxCompute引擎权限：空间级预设角色默认有部分开发环境的MaxCompute引擎权限，即空间级预设角色的用户可直接访问开发环境下MaxCompute表。生产环境的MaxCompute引擎权限：空间级预设角色没有生产环境的MaxCompute引擎权限，如果...

产品简介

简要介绍智能开放搜索OpenSearch是基于阿里巴巴自主研发的大规模分布式搜索引擎搭建的一站式商用智能搜索平台，目前为包括淘宝、天猫、菜鸟在内的阿里集团核心搜索业务提供中台服务支持。经过多年的行业搜索经验沉淀、双11大促流量冲击，...

分析器

比如干预“搜索引擎”的分词时，在词条中添加搜索引擎，搜索引擎还会继续分词成“搜索”、“引擎”两个词。注意事项该分析器只适用于TEXT类型字段，在配置schema的时候指定分析器为chn_standard。行业分析器行业-电商通用分析分析器介绍...

开发指南

本文面向应用开发者概要介绍了如何基于Lindorm时序引擎开发应用程序。应用开发步骤一般来说，开发者需要按照如下步骤进行开发。1.选择SDK Lindorm提供了以SQL为主的多种形态接口，方便开发者编写访问时序引擎的应用程序。Java语言开发的...

数据开发流程引导

DataWorks将不同类型引擎任务封装为不同节点，通过创建节点来生成数据开发任务。同时，数据开发（DataStudio）支持使用资源、函数以及不同的逻辑处理节点开发复杂任务。本文将为您介绍数据开发任务的通用开发流程。前提条件已绑定所需数据...

模糊分析器

模糊分析介绍模糊分析器（fuzzy）适用于模糊搜索，模糊搜索是指在用户搜索意图不明确时，搜索引擎将用户的查询（query）与待检索的内容（doc）进行模糊匹配，找出与查询相关的内容。是否相关主要从两个方面衡量：一是query是doc中某些内容...

周期性调度作业概述

权限类别描述 MaxCompute开发项目权限 DataWorks通过空间级预设角色与开发环境MaxCompute引擎Role的映射关系，让被授予空间角色的RAM用户（子账号）拥有该角色映射的开发引擎权限，默认拥有开发环境对应的引擎项目权限，但无生产环境对应...

操作权限控制

使用MaxCompute引擎时的权限问题逻辑说明：DataWorks预设角色与MaxCompute引擎开发项目的Role存在权限映射关系（DataWorks预设角色默认拥有MaxCompute开发项目映射的role所有的引擎层面的权限）。DataWorks预设角色与MaxCompute引擎生产...

创建CDH Presto节点

数据开发（DataStudio）基于业务流程对不同开发引擎进行具体开发操作，所以您创建节点前需要先新建业务流程，操作详情请参见创建业务流程。已创建CDH集群，并注册至DataWorks。创建CDH相关节点并开发CDH任务前，您需要先将CDH集群注册至...

创建并管理MaxCompute节点

数据开发（DataStudio）基于业务流程对不同开发引擎进行具体开发操作，所以您创建节点前需要先新建业务流程。以ODPS SQL节点为例，为您介绍创建节点的操作。右键某个业务流程，选择新建节点 MaxCompute ODPS SQL。您也可以单击顶部新建 ...

创建CDH Hive节点

数据开发（DataStudio）基于业务流程对不同开发引擎进行具体开发操作，所以您创建节点前需要先新建业务流程，操作详情请参见创建业务流程。已创建CDH集群，并注册至DataWorks。创建CDH相关节点并开发CDH任务前，您需要先将CDH集群注册至...

创建CDH MR节点

数据开发（DataStudio）基于业务流程对不同开发引擎进行具体开发操作，所以您创建节点前需要先新建业务流程，操作详情请参见创建业务流程。已创建CDH集群，并注册至DataWorks。创建CDH相关节点并开发CDH任务前，您需要先将CDH集群注册至...

创建EMR Kyuubi节点

数据开发（DataStudio）基于业务流程对不同开发引擎进行具体开发操作，所以您创建节点前需要先新建业务流程，操作详情请参见创建业务流程。使用限制仅支持使用 Serverless资源组（推荐）或独享调度资源组运行该类型任务。步骤一：创建EMR...

召回引擎版支持RAG方案

put("_POST_BODY","{\"content\":\"OpenSearch是基于阿里巴巴自主研发的大规模分布式搜索引擎搭建的一站式商用智能搜索平台，目前为包括淘宝、天猫、菜鸟在内的阿里集团核心搜索业务提供中台服务支持。经过多年的行业搜索经验沉淀、双11...

创建EMR Presto节点

Presto（即PrestoDB）是一款灵活、可扩展的分布式SQL查询引擎，支持使用标准的SQL查询语言进行大数据的交互式分析查询，DataWorks为您提供EMR Presto节点，便于您在DataWorks上进行Presto任务的开发和周期性调度。本文为您介绍使用EMR ...

工作空间模式升级

添加开发环境项目成员：将DataWorks工作空间成员在引擎层面添加为开发引擎项目成员，命令 add user。移除原空间成员生产项目权限：简单模式空间下，RAM用户拥有较大的生产环境权限，升级后，将移除RAM用户拥有的生产项目权限，只允许RAM...

创建CDH Spark SQL节点

数据开发（DataStudio）基于业务流程对不同开发引擎进行具体开发操作，所以您创建节点前需要先新建业务流程，操作详情请参见创建业务流程。已创建CDH集群，并注册至DataWorks。创建CDH相关节点并开发CDH任务前，您需要先将CDH集群注册至...

创建CDH Spark节点

数据开发（DataStudio）基于业务流程对不同开发引擎进行具体开发操作，所以您创建节点前需要先新建业务流程，操作详情请参见创建业务流程。已创建CDH集群，并注册至DataWorks。创建CDH相关节点并开发CDH任务前，您需要先将CDH集群注册至...

创建EMR Impala节点

数据开发（DataStudio）基于业务流程对不同开发引擎进行具体开发操作，所以您创建节点前需要先新建业务流程，操作详情请参见创建业务流程。使用限制仅支持使用 Serverless资源组（推荐）或独享调度资源组运行该类型任务。EMR Impala仅...

创建EMR Hive节点

数据开发（DataStudio）基于业务流程对不同开发引擎进行具体开发操作，所以您创建节点前需要先新建业务流程，操作详情请参见创建业务流程。使用限制仅支持使用 Serverless资源组（推荐）或独享调度资源组运行该类型任务。DataLake数据湖...

创建EMR Trino节点

数据开发（DataStudio）基于业务流程对不同开发引擎进行具体开发操作，所以您创建节点前需要先新建业务流程，操作详情请参见创建业务流程。使用限制仅支持使用Serverless资源组运行该类型任务。DataLake或自定义集群若要在DataWorks管理...

创建EMR Spark SQL节点

数据开发（DataStudio）基于业务流程对不同开发引擎进行具体开发操作，所以您创建节点前需要先新建业务流程，操作详情请参见创建业务流程。如果您在开发任务时，需要特定的开发环境支持，可使用DataWorks提供的自定义镜像功能，定制化构建...

智能开放搜索 OpenSearch

智能开放搜索 OpenSearch是基于阿里巴巴自主研发的大规模分布式搜索引擎搭建的一站式智能搜索业务开发平台，目前为包括淘宝、天猫在内的阿里集团核心业务提供搜索服务支持。通过内置各行业的查询语义理解、机器学习排序算法等能力，提供...

游戏行业

开放搜索游戏行业增强版解决方案开放搜索（OpenSearch）是阿里云自主研发的大规模分布式搜索引擎搭建的一站式智能搜索业务开发平台，无需开发，一键接入即可获得高质量搜索服务，内置阿里系技术多年沉淀的核心搜索引擎，行业前沿的搜索...

产品概述

高性能检索版简介 OpenSearch-高性能检索版是基于阿里巴巴自主研发的大规模分布式搜索引擎搭建的一站式智能搜索业务开发平台，在大数据场景下实现千亿数据毫秒级响应，提供订单、物流、保单等场景检索方案。OpenSearch-高性能检索版架构 ...

产品概述

OpenSearch-行业算法版是基于阿里巴巴自主研发的大规模分布式搜索引擎构建的一站式智能搜索业务开发平台，现已为包括淘宝、天猫在内的阿里集团核心业务提供搜索服务支持。该平台通过内置各行业的查询语义理解及机器学习排序算法等功能，...