pandas用groupby后对层级索引levels的处理-pandas用groupby后对层级索引levels的处理文档介绍内容-移动阿里云

虚拟列

使用虚拟列功能时，您可以通过修改多元索引Schema或者新建多元索引来实现新字段新数据类型的查询功能，而无需修改表格存储的存储结构及数据。功能概述虚拟列功能支持用户在创建多元索引的时候将表中一列映射到多元索引中的虚拟列。新的...

VACUUM

对具有 GIN 索引的表，VACUUM（任何形式）也会通过将待处理索引项移动到主要 GIN 索引结构中的合适位置来完成任何待处理的索引插入。我们建议经常清理活动的生产数据库（至少每晚一次），以保证移除失效的行。在增加或删除了大量行之后，对...

只用索引的扫描和覆盖索引

本数据库中的所有索引是二级索引,这意味着每个索引都是与表的主数据区（在本数据库术语称为表的堆中）分开存储。这意味着在普通索引扫描中，每行检索都需要从索引和堆中取数据。此外，虽然匹配给定的可索引 WHERE 条件的索引条目通常在...

TrajGisT索引

TrajGisT索引是GisT索引的扩展。背景信息在GisT基础上，TrajGisT提供额外两点优化：TrajGisT对索引的开销估计进行了优化，当建立了多个索引时，TrajGisT可以比GisT更好地在不同索引之间进行选择。TrajGist支持索引的向上兼容，即当索引所...

TrajGisT索引

TrajGisT索引是GisT索引的扩展。背景信息在GisT基础上，TrajGisT提供额外两点优化：TrajGisT对索引的开销估计进行了优化，当建立了多个索引时，TrajGisT可以比GisT更好地在不同索引之间进行选择。TrajGist支持索引的向上兼容，即当索引所...

TrajGisT索引

TrajGisT索引是GisT索引的扩展。背景信息在GisT基础上，TrajGisT提供额外两点优化：TrajGisT对索引的开销估计进行了优化，当建立了多个索引时，TrajGisT可以比GisT更好地在不同索引之间进行选择。TrajGist支持索引的向上兼容，即当索引所...

IndexFileMeta-文件元信息建立索引

对输入的文件进行数据处理如标签识别、人脸检测、地点检测等，将提取的文件元信息建立索引，支持用户在一个数据集内多样化的数据检索。接口说明请确保在使用该接口前，已充分了解智能媒体管理产品的收费方式和价格。文件元信息建立索引...

二级索引计量计费

二级索引包括全局二级索引和本地二级索引。使用二级索引功能将产生额外的数据存储量。当向数据表写入数据时，在建立索引的过程中将产生一定的读写CU。本文介绍二级索引费用组成及计费方式。计费说明索引的数据存储、计算以及读取的规则...

索引和ORDER BY

除了简单地查找查询要返回的行外，一个索引可能还需要将它们以指定的顺序传递。这使得查询中的 ORDER BY 不需要独立的排序步骤。在本数据库当前支持的索引类型中，只有 B-tree 可以产生排序后的输出，其他索引类型会把行以一种没有指定的且...

一键实时同步至Elasticsearch

步骤四：设置目标索引单击刷新源表和Elasticsearch 索引映射将根据您在步骤三配置的设置表名到索引名的映射规则来生成目标索引，若步骤三未配置映射规则，将默认写入与源表同名的目标索引，若目标端不存在该同名索引，将默认新建。...

多元索引最佳实践

本文从数据表设计、多元索引设计、多元索引使用三个方面介绍了使用多元索引的最佳实践。数据表相关设计实践主键设计 Tablestore数据表根据分区键进行Range范围分区，主键的设计会影响多元索引的同步速度和部分场景下的查询水平拓展。主键...

使用说明

列存索引的目标是提供一个最简单的方案，对业务中复杂耗时的SQL语句进行提速。您可以参考基础使用说明中的内容为集群配置HTAP负载处理能力。除此之外，列存索引还提供了高阶定制优化功能以满足业务负载的特殊需求，您可以参考进阶使用说明...

创建数据表

使用CreateTable接口创建数据表时，需要指定数据表的结构信息和配置信息，高性能实例中的数据表还可以根据需要设置预留读/写吞吐量。创建数据表的同时支持创建一个或者多个索引表。说明创建数据表后需要几秒钟进行加载，在此期间对该数据...

矢量金字塔

概述矢量金字塔对空间几何数据创建稀疏索引，按规则对密集区域预处理，可以输出标准的mvt-pbf格式数据。通过Ganos提供的矢量金字塔，亿条空间几何记录可以实现分钟级预处理、秒级终端显示。快速入门创建扩展。CREATE EXTENSION ganos_...

CREATE INDEX

每一个分区首先会被检查是否有一个等效的索引存在，如果有则该索引将被挂接为被创建索引的一个分区索引，而被创建的索引将成为其父索引。如果不存在匹配的索引，则会创建一个新的索引并且自动进行挂接。如果命令中没有指定索引名称，每个...

矢量金字塔

概述矢量金字塔对空间几何数据创建稀疏索引，按规则对密集区域预处理，可以输出标准的mvt-pbf格式数据。通过Ganos提供的矢量金字塔，亿条空间几何记录可以实现分钟级预处理、秒级终端显示。快速入门创建扩展。CREATE EXTENSION ganos_...

矢量金字塔

概述矢量金字塔对空间几何数据创建稀疏索引，按规则对密集区域预处理，可以输出标准的mvt-pbf格式数据。通过Ganos提供的矢量金字塔，亿条空间几何记录可以实现分钟级预处理、秒级终端显示。快速入门创建扩展。CREATE EXTENSION ganos_...

使用Python访问Hologres

cur.close()conn.close()Pandas DataFrame快速写入Hologres最佳实践使用Python时，经常会使用Pandas将数据转换为DataFrame，并对DataFrame进行处理，最终将DataFrame导入Hologres，此时希望将DataFrame快速导入Hologres。导入时候常用 to_...

倒排索引介绍

什么是倒排索引倒排索引也常被称为反向索引、置入档案或反向档案，是一种索引方法，被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。通过倒排索引，可以快速定位单词所在...

索引诊断

本文档向您介绍 PolarDB-X 的索引诊断功能，您可以使用此功能诊断和发现数据库中低效的索引，进而采取措施提升数据库的性能。背景信息“建立索引”是数据库中加速查询的常用手段，可以显著提高查询效率。但索引会在数据表更新的时候同步...

数据处理配置

每个数据源默认免费提供2个资源，如您的数据量更新较大，并且对数据的时效性有要求的场景，可以通过数据处理配置，扩容process_partition_count来支持更大的数据更新。扩容数据处理资源在高级配置中，用户点击数据处理配置后，选择需要...

数据处理配置

每个数据源默认免费提供2个资源，如您的数据量更新较大，并且对数据的时效性有要求的场景，可以通过数据处理配置，扩容process_partition_count来支持更大的数据更新。扩容数据处理资源在高级配置中，用户点击数据处理配置后，选择需要...

PyODPS制作第三方包

PyODPS自V0.11.3版本开始提供了 pyodps-pack 命令行工具，用于制作符合PyODPS及DataWorks PyODPS节点标准的三方包，使用方法类似 pip 命令。您可以使用该工具将所有依赖项目制作成一个后缀为.tar.gz 的压缩包，其中包含所有依照MaxCompute...

倒排索引介绍

什么是倒排索引倒排索引也常被称为反向索引、置入档案或反向档案，是一种索引方法，被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。通过倒排索引，可以快速定位单词所在...

向量查询

引擎索引重建成功后就可以开始搜索体验，向量检索版在控制台中内置了“查询测试”功能方便用户查询测试。支持向量查询、主键查询、向量文本混合查询三种查询方式，本文介绍向量查询。界面入口点击【查询测试】-【向量查询】，选择要查询的...

多元索引限制

本文介绍了多元索引创建多元索引时的Mapping限制，使用Search接口和ParallelScan接口查询数据时的限制，多元索引速率、总大小、行数等限制以及多元索引的支持地域。Mapping 创建多元索引时对字段长度、字段数量、字段类型映射、嵌套类型、...

使用须知

Phoenix不支持复杂查询 Phoenix的二级索引本质还是前缀匹配，用户可以建多个二级索引来增加对数据的查询模式，二级索引的一致性是通过协处理器实现的，索引数据可以实时可见，但也会影响写性能，特别是建多个索引的情况下。对于复杂查询，...

使用流程

本文介绍了文档管理场景、图片社交场景和家庭设备场景下产品的使用流程。重要此文档已不再维护，建议您使用新版智能媒体管理。关于智能媒体管理新版与旧版的对比，请参见新旧版本使用指引。关于新版智能媒体管理各功能的使用方法，请参见...

向量索引的高级配置介绍

在索引结构时可以对向量索引进行高级配置，以下将详细说明这些高级版配置的参数含义。在配置索引结构时，索引设置中可以对向量索引进行高级配置：详细的配置参数如下：参数说明：参数名称可选值参数描述 dimension 大于1的整数向量维度 ...

分词

为Text类型的字段设置分词类型后，系统会将可分词类型的内容根据设定的分词类型分成多个词。非Text类型的字段不能设置分词类型。背景信息对于Text类型字段，常用于匹配查询（MatchQuery）和短语匹配查询（MatchPhraseQuery），少部分场景...

多元索引嵌套类型

多元索引除了提供Long、Double、Boolean、Keyword、Text等基本类型外，还提供了嵌套类型（Nested）。嵌套类型代表嵌套文档类型。嵌套文档是指对于一行数据（文档）可以包含多个子行（子文档），多个子行保存在一个嵌套类型字段中。本文介绍...

Indexing Service系列介绍

您可以根据业务的读写需求选择使用阿里云Elasticsearch内核增强版Indexing Service系列，通过其云上写入托管能力，体验按需购买、按量付费的低成本、高性能的时序日志场景下的Elasticsearch服务。本文主要介绍Indexing Service的适用场景、...

深度解析Lindorm搜索索引（SearchIndex）特性

索引是加速数据库查询的重要手段，Lindorm除了提供高性能的二级索引外，同时支持搜索索引(SearchIndex)，主要面向复杂的多维查询场景，并能够覆盖模糊查询、聚合分析、排序、分页等场景。本文主要介绍SearchIndex的技术原理和核心能力。...

向量检索版介绍

全量索引的产出需要经过数据处理，索引构建，索引合并等流程，在各个阶段可以通过设置索引处理的并发度提高全量索引的产出速度。实时增量流程全量索引产出后，每个全量版本都会有一个常驻的增量流程，而增量数据同步是通过数据更新节点 ...

数据输入输出

MaxFrame支持直连MaxCompute，允许对MaxCompute中的数据进行高效直接读写操作，运行时无需将数据拉取至本地计算，消除了不必要的本地数据传输，提高了执行效率。MaxCompute表您可以使用MaxCompute表创建MaxFrame DataFrame对象，并将计算...

Btree-GIST

Btree-GIST插件提供了一种使用GIST索引结构来模拟B树（B-tree）索引行为的方法。GIST允许用户为新的数据类型自定义索引策略，常用于处理复杂数据类型（多维数据、地理信息系统数据）的索引需求，并提供高效的搜索性能。功能简介 Btree-GIST...

通过SDK使用多元索引

如果实际业务中要用到非主键列查询、多条件组合查询等多种查询功能，您可以通过控制台为数据表创建多元索引，然后使用多元索引查询与分析数据。前提条件已创建数据表，且数据表的最大版本数（max Versions）必须为1，数据生命周期（Time ...

并行DDL

使用限制目前并行DDL加速支持创建主键索引和二级索引（不包括全文索引、空间索引和虚拟列上的二级索引）的DDL操作。背景信息传统的DDL操作基于单核和传统硬盘设计，导致针对大表的DDL操作耗时较久，延迟过高。以创建二级索引为例，过高...

PyODPS概述

需要注意的是，PyODPS提供了多种方便拉取数据到本地的操作，如tunnel下载操作、execute操作、to_pandas操作等，因此，很多初始使用PyODPS的用户会试图把数据拉取到本地，处理完成后再上传到 MaxCompute上，很多时候这种方式是十分低效的，...

索引结构

索引表结构介绍每个Document都是由多个field组成，每个field中包含一系列的词语，构建索引的目的是为了加快检索的速度，根据映射关系方向的不同，索引可以分为：字段（filed）：用于定义索引表的字段名及字段类型。倒排索引（index）：倒...