数据逻辑结构数据存储结构-数据逻辑结构数据存储结构文档介绍内容-移动阿里云

冷存储介绍

冷热分离功能可以自动将表中的热数据存储至读写速度更快的热存储中，将不常访问的历史数据存储至容量型云存储中，从而降低存储成本。如果您在业务上有冷热分离的需求，请参见冷热分离介绍。开通容量型云存储如何开通容量型云存储，请参见...

实例选型和集群规划

规格节点云原生数据仓库AnalyticDB PostgreSQL版采用MPP并行架构，在节点角色上区分为Master节点和Segment节点，其中Master节点是实例的入口，负责SQL请求、路由分发和结果集处理，Segment节点为计算节点，负责SQL处理和数据存储，每个...

使用前须知

重命名Object 上传Object 数据丢失为避免影响OSS-HDFS服务的正常使用或者引发数据丢失的风险，在开通了OSS-HDFS服务的Bucket中，禁止以非OSS-HDFS提供的方式在OSS-HDFS的数据存储目录.dlsdata/中上传Object。简单上传修改Object存储类型 ...

设置数据保留策略

InfluxDB的数据保留策略可以定义数据在InfluxDB中保存时间，本文介绍如何设置数据保留策略。前提条件已创建数据库。具体操作，请参见创建数据库。数据保留策略介绍 InfluxDB可以通过定义数据保留策略，用来控制存储数据量的方式。新创建...

功能特性

数据存储 功能集功能功能描述参考文档通用型NAS 容量型通用型NAS的一个细分存储类型，适用于数据库备份、日志存储、Windows用户目录、Linux home目录等成本敏感型且对时延响应要求不高的文件共享业务。通用型NAS 高级型通用型NAS的...

计费常见问题

本地数据迁移至文件存储 HDFS 版本地数据迁移至文件存储 HDFS 版时，需要配置ECS作为中转节点从公网访问阿里云文件存储 HDFS 版。弹性公网IP对入方向流量不收费，仅对出方向流量收费。即从公网上传数据到文件存储 HDFS 版不会收取...

Kafka实时入湖建仓分析

数据解析配置的参数说明如下：参数名称参数说明消息数据格式 Kafka的Value字段的数据存储格式，固定为JSON。Schema设置模式默认为手动设置，会从Kafka的Topic获取一条样例数据进行Schema的推断设置。消息样例数据通过调整样例数据对...

表数据格式

数据存储分桶为了进一步优化读写效率，Delta Table支持按照BucketIndex对数据进行切分存储，BucketIndex数据列默认复用PK列，bucket数量可通过配置表属性 write.bucket.num 指定，因此对同一张表或分区的数据，写入数据会按PK列值对数据...

入湖基础操作

数据湖存储位置：数据存储的OSS路径，入湖任务会自动创建此处填写的空文件夹来存储数据。分区信息：添加需要写入的分区信息。分区表达式：填写描述分区值的获取方式，比如 MySQL 中from_unixtime(gmt_create)。分区字段：填写分区字段名称...

存储说明

本文介绍E-MapReduce集群中数据存储相关的信息，包括磁盘角色、云盘与本地盘，以及OSS。背景信息关于存储的类型、性能和相关的限制信息，请参见什么是块存储。存储价格估算如下：本地盘实例存储为0.04 元/GB/月 OSS标准型存储为0.12 元/...

存储费用

MaxCompute数据存储三个副本，但只按一个副本压缩后的大小进行按量计费。存储费用分为存储计费和备份存储计费。存储计费公式与价格说明，请参见分层存储计费（Beta版本）。备份存储计费公式与价格说明，请参见备份存储计费。当实例欠费后...

存储类型概述

对象存储OSS提供标准、低频访问、归档、冷归档、深度冷归档多种存储类型，全面覆盖从热到冷的各种数据存储场景。说明各存储类型的定价，请参见 OSS产品定价。各存储类型的计费方式，请参见存储费用。标准存储（Standard）提供高可靠、高...

存储加密

当MaxCompute项目中存有敏感信息如个人身份信息、财务记录、健康记录等，开启数据存储加密可保护这些数据不被未授权者访问。MaxCompute支持通过密钥管理服务KMS（Key Management Service）对数据进行加密存储，提供数据静态保护能力，满足...

性能测试

以时空轨迹数据为7.6 GB为例，写入耗时的测试结果如下：数据库写入耗时云原生多模数据库 Lindorm Ganos引擎 7分钟开源GeoMesa（HBase）13分钟云数据库MongoDB分片集群 34分钟创建时空索引后的时空数据存储空间占用情况创建时空主键...

更新分析存储的数据生命周期

当需要清理分析存储中的历史数据或者希望延长数据保存时间时，您可以使用UpdateTimeseriesAnalyticalStore接口更新时序分析存储的数据生命周期TTL配置。更新分析存储的TTL后，表格存储会自动异步清理分析存储中超过TTL的数据。前提条件已...

DAS企业版介绍

只能对开启DAS企业版后且在 数据存储时长范围内的数据进行搜索（审计）、安全审计（旧版）和 SQL洞察。关闭数据库实例的DAS企业版，会关闭SQL洞察和审计功能，不会对业务产生影响，但是会清除所有的DAS企业版相关数据（包括SQL洞察、分析...

技术架构

PolarDB PostgreSQL版（兼容Oracle）采用Shared Everything架构，利用分布式共享存储实现存储和计算的分离。计算节点与存储节点分离的架构设计给 PolarDB PostgreSQL版（兼容Oracle）带来了实时的水平扩展能力。由于单个数据库实例的计算...

基于DLF、RDS或Flink、OSS支持Delta Lake或Hudi存储...

参数描述示例所属数据目录 数据存储的数据库目录。default 数据库名称目标数据库的名称。dlf_db 数据库描述目标数据库的描述信息。湖仓一体选择路径 OSS数据路径。格式为 oss:/名称>/目录名称>。oss:/doc-test-01/datalake/单击确定...

限制说明

数据可靠性云数据库 Memcache 版的数据存储在内存中，服务并不保证缓存数据不会丢失，有强一致性要求的数据不适合存储。数据大小云数据库 Memcache 版支持的单条缓存数据的 Key 最大不超过 1 KB，Value 最大不超过 1 MB，过大的数据不...

简介

系统兼容开源GeoMesa、GeoServer等生态，内置了高效的时空索引算法、空间拓扑几何算法、遥感影像处理算法等，结合云数据库HBase强大的分布式存储能力以及Spark分析平台能力，广泛应用于空间、时空、遥感大数据存储、查询、分析与数据挖掘...

数据服务集群

Apache HBase支持海量数据存储，具有很高的存储和计算扩展性，以及很好的读写性能，支持动态列、数据多版本存储，以及数据的生命周期管理等特点。适用场景基于Apache HBase的优势和特点，DataServing适用于以下场景：风控或画像等需要支持...

概述

大部分阿里云用户以CSV格式将数据存储在OSS上，若要提高数据扫描性能，需要借助第三方工具对文件进行格式转换，然后将转换后的数据上传至OSS，整个过程比较繁琐。为减轻用户工作量，您可以直接使用DLA来转换文件格式。假设将1.2GB的数据以...

新零售：特步

PolarDB-X 通过水平拆分将订单、库存、用户、渠道等数据放在不同的物理RDS上，使系统具备了高并发读写能力（1.5万TPS，22万QPS），当前架构的数据存储量可支撑15 TB~20 TB，能满足特步未来2~3年的数据存储和高并发读写诉求。PolarDB-X 弹性...

块存储

您可以像使用物理硬盘一样格式化并建立文件系统来使用块存储，可满足绝大部分通用业务场景下的数据存储需求。适用场景阿里云为您的云服务器ECS提供了丰富的块存储产品类型，包括基于分布式存储架构的云盘以及基于物理机本地硬盘的本地盘...

Delta Lake概述

背景信息通常的数据湖方案是选取大数据存储引擎构建数据湖（例如，阿里云对象存储OSS产品或云下HDFS），然后将产生的各种类型数据存储在该存储引擎中。在使用数据时，通过Spark或Presto对接数据分析引擎并进行数据解析。但该套方案存在...

数据重排

在MaxCompute的使用过程中，如果已经积累了大量数据占用了大量存储资源，且已经通过削减数据存储生命周期和删除非必要数据等方式进行了治理，在您的存储预算有限，计算资源还有冗余的情况下，可以考虑使用数据重排方式对存储空间进行优化。...

EMR+DLF数据湖解决方案

节省存储成本您可以通过生命周期管理对数据湖中的数据库、数据表配置数据管理规则，可以基于分区/表创建时间、分区/表最近修改时间、分区值三种规则类型，对数据定期进行OSS存储类型转换，从而节省数据存储成本。具体操作和说明参考生命...

冷热分层存储

为避免配置错误导致冷热分层无法正常工作，OSS会自动创建同时包含以下三种策略的生命周期规则：指定OSS-HDFS的数据存储目录.dlsdata/下携带Key为 transition-storage-class、Value为 IA 标签的数据在1天后转为低频访问存储。指定OSS-HDFS的...

开启和使用冷数据分层存储

本文介绍如何开启冷数据分层存储功能，以及开启功能后的使用方式。使用限制仅 PolarDB PostgreSQL版 14.10.21.0 及以上版本支持冷数据分层存储功能。开启冷数据分层存储功能后，无法关闭该功能，只能删除冷数据。如果没有存储数据，开启该...

数据归档

功能优势开启用RDS PostgreSQL数据归档功能后，利用OSS的海量、安全、低成本和高可靠特性，您可以在RDS PostgreSQL上实现极低成本、无限容量的归档数据存储，并支持低频数据访问。相较于ESSD PL1云盘，数据存储成本下降了80%。说明数据...

开启和使用冷数据分层存储

本文介绍如何开启冷数据分层存储功能，以及开启功能后的使用方式。使用限制仅 PolarDB PostgreSQL版（兼容Oracle）2.0.14.21.0 及以上版本支持冷数据分层存储功能。开启冷数据分层存储功能后，无法关闭该功能，只能删除冷数据。如果没有...

JindoFS实战演示

如何将HDFS海量文件归档到OSS 如何将HDFS海量文件归档到OSS 2021-05-18 如果您的数据存储在HDFS集群内，随着业务的发展，数据不断增长，可能导致存储空间不足、存储成本不断上升等问题，此时您可以将访问频率较低的HDFS数据归档到OSS中。...

Catalog概述

本文为您介绍什么是Catalog（数据目录），以及如何使用Catalog管理和查询内外部数据。基本概念内部数据：保存在StarRocks中的数据。外部数据：保存在外部数据源（例如Apache Hive、Apache Iceberg和Apache Hudi）中的数据。Catalog ...

新零售：杭州数云信息技术有限公司

PolarDB 采用共享存储架构，存储和计算分离，能够最大程度的提供单实例的存储能力，最大可达100 TB，对于历史数据存储，海量在线数据存储都有较好的适配能力，降低代码复杂度和维护成本。PolarDB 通过引擎的优化和超强的IOPS能力提供高并发...

JindoFS介绍和使用

Cache模式和Block模式对比两种模式都把数据存储在OSS上，同时根据本地缓存空间剩余情况确定是否在本地也放置一份以用于缓存加速。两种模式的本质区别在于，块存储模式可以管理目录和文件元数据，文件是分成多个块存储在OSS上，所以写到OSS...

成本

存储分层能力很多分析场景的数据具有一定的时效性，时间越近的数据访问频率越高、越远的数据访问频率越低。AnalyticDB PostgreSQL版能够根据需求，自动地将部分时效性较低的数据进行归档、使用OSS等成本更低、访问速度较慢的存储介质替换...

更新分析存储的数据生命周期

当需要清理分析存储中的历史数据或者希望延长数据保存时间时，您可以使用UpdateTimeseriesAnalyticalStore接口更新时序分析存储的数据生命周期TTL配置。更新分析存储的TTL后，表格存储会自动异步清理分析存储中超过TTL的数据。前提条件已...

聚合支付方案

阿里云从业务扩展性、数据流动性、服务高可用三方面入手，通过多款云数据库产品为利楚扫呗制定聚合支付方案，解决利楚扫呗在业务扩展期遇到的数据存储空间不足、读写性能下降以及大数据分析空缺等问题。业务痛点武汉利楚商务服务有限公司...

通过SDK使用分析存储

使用SDK在已开启分析存储的时序模型实例下为时序表创建分析存储并为分析存储创建绑定关系，然后使用SQL查询数据。说明您可以通过 Java SDK 或者 Go SDK 使用分析存储功能，本文以Java SDK为例介绍分析存储的使用。注意事项时序分析存储...

Kafka数据接入

通过创建Tablestore Sink Connector，将云消息队列 Kafka 版实例的数据源Topic导出到表格存储（Tablestore）。前提条件云消息队列 Kafka 版已为实例开启Connector。具体操作，请参见开启Connector。已为实例创建数据源Topic。更多...

数据逻辑结构 数据存储结构

数据逻辑结构数据存储结构