删除或更新数据 大部分数仓都难以实现较为高效的行级数据删除或更新,通常需要启动离线作业把整个表原始数据读取出来,然后变更数据后,写入到一个原始表。而Iceberg成功把变更的范围从表级别缩小到了文件级别,从而可以通过局部变更来完成...
如果您使用的是HDFS,在引入HDFS的业务数据至Dataphin中或将Dataphin数据导出至HDFS的场景中,您需要先完成HDFS数据源的创建。更多HDFS信息,请参见 HDFS官方介绍。权限说明 仅支持拥有 新建数据源 权限点的自定义全局角色和 超级管理员、...
对于数据导出,请登录 AnalyticDB PostgreSQL版 的管理控制台进行IP 白名单设置,详情请参见 添加白名单 数据导入 源端的数据源需要在DataWorks管理控制台进行添加,数据源添加的详细步骤请参考 配置AnalyticDB for PostgreSQL数据源 配置...
限制和最佳实践:分布式执行模式下,配置较大任务并发度可能会对您的数据存储产生较大的访问压力,请评估数据存储的访问负载。如果您的独享资源组机器台数为1,不建议使用分布式执行模式,因为执行进程仍然分布在一台Worker节点上,无法...
AnalyticDB PostgreSQL版 向量分析可以通过AI算法提取非结构化数据的特征,并利用特征向量作为非结构化数据的唯一标识,帮您快速且低成本地实现对非结构化数据检索和对结构化数据关联分析。向量数据库简介 在现实世界中,绝大多数的数据都...
需要重点关注的参数有:partitions:如果只有HASH分区,建议将分区数量 partitions 设置为较大的值,例如64、128等,可以使数据分布至更多的分区。数据查询时,如果查询语句通常会携带分区字段,那么系统只需要在某一个或某几个分区中查找...
本文为您介绍如何在项目中添加、使用和管理数据源。前提条件 已经创建项目。请参见 创建及管理项目。进入项目管理 登录 DataV-Atlas控制台。在 我的项目 全部项目 下,将鼠标悬停至目标项目,单击 编辑,进入该项目的编辑界面。添加数据源 ...
数据脱敏是保障数据安全的重要措施。DataWorks支持静态脱敏、动态脱敏和引擎脱敏等多种方式,帮助组织在不同场景下保护敏感数据。通过配置具体的脱敏规则和脱敏策略,可以对敏感数据实施精准的脱敏处理,确保敏感数据在数据开发、分析等...
解决方案 数据归档 数据归档功能支持定时将大表的数据归档至其他数据库,同时支持源表数据删除、表空间整理回收等。一键建仓 一键创建实时同步的数据仓库,数据在秒级的延迟下,同步至 AnalyticDB for MySQL 数据库中。数据库迁移 通过创建...
解决方案 数据归档 数据归档功能支持定时将大表的数据归档至其他数据库,同时支持源表数据删除、表空间整理回收等。一键建仓 一键创建实时同步的数据仓库,数据在秒级的延迟下,同步至 AnalyticDB for MySQL 数据库中。数据库迁移 通过创建...
数据质量是数据分析结论有效性和准确性的基础。本文为您介绍数据质量保障教程的业务场景以及如何衡量数据质量的高低。前提条件 在开始本教程前,请您首先完成 搭建互联网在线运行分析平台 教程,详情请参见 业务场景与开发流程。业务场景 ...
DataWorks的数据集功能可以实现对非结构化数据(如图像、文档)的有效管理控制,并在DataWorks中使用,本文将为您介绍数据集的创建与使用方式。背景信息 在使用DataWorks进行数据开发的过程中,当您需要读写存储于OSS、NAS中的数据时,可以...
数据归档 数据归档功能定时将大表的数据归档至其他数据库,支持源表数据删除、表空间整理回收等功能。数据库迁移 通过创建工单实现数据库迁移、校验和清理的闭环操作。运维管理 通知管理 可根据您的业务需求,订阅不同功能模块的消息事件,...
数据集成是一个稳定高效、弹性伸缩的数据同步平台,致力于提供在复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动及同步能力。流程引导 重要 数据集成在使用时,仅支持在PC端Chrome浏览器69以上版本使用。数据集成的通用开发流程...
数据集成是一个稳定高效、弹性伸缩的数据同步平台,致力于提供在复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动及同步能力。流程引导 重要 数据集成在使用时,仅支持在PC端Chrome浏览器69以上版本使用。数据集成的通用开发流程...
空间数据提供对矢量、栅格、矢量瓦片、栅格瓦片、三维模型、倾斜摄影、BIM、点云等数据的添加,支持通过上传文件和对象存储两种通用的方式添加数据。本文主要介绍如何添加各类空间数据。前提条件 已在云存储上存储了数据文件。背景信息 ...
数据元管理通过分析业务流程,抽象关键业务对象和业务对象属性,并把关键业务对象新建为数据元,并配置数据元的类型、长度、质量校验函数和引用数据字典,为模型标准化设计及数据治理过程中的质量监控提供规则依据。本文介绍如何新建数据元...
如果您使用的是FTP,在对接Dataphin进行数据开发或将Dataphin的数据写入至FTP的场景中,您需要先完成FTP数据源的创建。权限说明 仅支持拥有 新建数据源 权限点的自定义全局角色和 超级管理员、数据源管理员、板块架构师、项目管理员 系统...
如果您使用的是FTP,在对接Dataphin进行数据开发或将Dataphin的数据写入至FTP的场景中,您需要先完成FTP数据源的创建。更多FTP信息,请参见 FTP官网。权限说明 仅支持拥有 新建数据源 权限点的自定义全局角色和 超级管理员、数据源管理员、...
在DataV-Board(数据看板)中使用DataV Atlas地理数据服务之前,需要先将DataV Atlas地理数据服务添加为DataV-Board的数据源。本文为您介绍如何添加DataV Atlas地理数据服务。适用场景 通过DataV Atlas地理数据服务通过在各种业务场景下...
数据图元组件、栅格瓦片、地形瓦片、三维瓦片 和 其他:在这五个类型图层数据面板中,数据配置和普通图表组件一致,可配置静态数据源、API数据源和空间构建数据源内容,还可将图层数据接口作为区块数据接口,在可视化应用中配置更丰富的...
说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 部署方式 支持 集群 和 ...
数据图元组件、栅格瓦片、地形瓦片、三维瓦片 和 其他:在这五个类型图层数据面板中,数据配置和普通图表组件一致,可配置静态数据源、API数据源和空间构建数据源内容,还可将图层数据接口作为区块数据接口,在可视化应用中配置更丰富的...
数据图元组件、栅格瓦片、地形瓦片、三维瓦片 和 其他:在这五个类型图层数据面板中,数据配置和普通图表组件一致,可配置静态数据源、API数据源和空间构建数据源内容,还可将图层数据接口作为区块数据接口,在可视化应用中配置更丰富的...
周期任务补数据功能用于对周期任务在指定的历史业务日期内进行数据回刷。周期任务开发完成并提交发布后,任务会按照调度配置定时运行,如果您希望在指定时间段运行周期任务或回刷历史一段时间区间的数据,可以使用补数据功能。节点使用的...
周期任务补数据功能用于对周期任务在指定的历史业务日期内进行数据回刷。周期任务开发完成并提交发布后,任务会按照调度配置定时运行,如果您希望在指定时间段运行周期任务或回刷历史一段时间区间的数据,可以使用补数据功能。节点使用的...
说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 部署方式 支持 集群 和 ...
同步SAP Table数据源的数据至其他数据源的场景中,您需要先配置SAP Table输入组件读取的数据源,再配置数据同步的目标数据源。本文为您介绍如何配置SAP Table输入组件。前提条件 已创建SAP Table数据源,如何创建,请参见 创建SAP Table...
随着企业的数据资料持续积累,需要持久化地保留数据资产,但是数据的存储成本居高不下,因此DMS和 AnalyticDB PostgreSQL版 Serverless模式共同推出了数据归档功能,可以面对数据库实现灵活低价、归档管理和高分析性能的能力。功能介绍 DMS...
当项目用户具备查询E-MapReduce项目中的某些敏感数据权限,担忧不希望用户能看到完整的敏感数据信息时,可以对查询结果进行数据动态脱敏。本文为您介绍如何开启E-MapReduce的动态脱敏功能,并提供参考示例。使用限制 EMR集群仅支持数据保护...
数据脱敏可以对实时同步的单表数据进行脱敏,然后存储到指定的数据库位置。前提条件 配置数据脱敏节点前,您需要先配置好相应的输入节点,详情请参见 实时同步支持的数据源。操作步骤 进入数据开发页面。登录 DataWorks控制台,切换至目标...
本文为您介绍如何将数据归档至专属存储中(存储在 DMS),以及删除归档至专属存储的数据等操作。说明 数据归档功能目前处于公测中。前提条件 源数据库类型为:MySQL:RDS MySQL、PolarDB MySQL版、AnalyticDB MySQL 3.0。说明 MySQL数据库...
在DataV-Note(智能分析)中,分析单元是进行数据分析及报告制作的主要工作区域,而数据集和变量则是分析单元用于进行分析的输入数据。本文为您介绍DataV-Note支持的分析单元类型,以及数据分析及报告制作的流程概述。概念须知 分析单元:...
MaxCompute支持您将MaxCompute项目数据接入观远BI,帮助企业的业务人员和数据分析师开展以问题为导向的探索式分析工作以及制作数据卡片和数据看板。本文为您介绍如何通过MaxCompute JDBC驱动,连接观远BI和MaxCompute项目,并进行可视化...
数据交互方式 涉及到数据输出的,需要描述数据的交互方式、格式等。附件说明 如果有附件需要补充的,请在此说明,并同步附加附件。项目涉众 数据产品经理 设计人员 开发人员 测试人员 数据安全与合规人员 需求版本变更历史 版本号 版本确认...
读/写-LogHub(SLS)数据源 读/写 读-MaxCompute数据源 读/写 写 写-写 MariaDB数据源 读/写-Maxgraph数据源 写-Memcache(OCS)数据源 写-MetaQ数据源 读-Milvus数据源 读/写-MongoDB数据源 读/写-读-MySQL数据源 读/写 读 读 读 读 ...
如果使用单表,需要从一张大表中按照时间条件通过一个 DELETE 大事务来清理掉一个月的数据,然后通过 OPTIMIZER TABLE 来释放删除数据的空间。而按照月份创建RANGE分区表,可以秒级 DROP 掉一个分区,清理数据非常方便。同理,需要按天、周...
为满足多样化的数据导入需求,AnalyticDB for MySQL 提供了多种数据导入方式,包括:通过外表导入数据、通过DataWorks导入数据、通过DTS导入数据以及使用JDBC通过程序导入数据等。您可以通过本文了解各导入方式的特性及适用场景,帮助您...
购买 数据安全中心DSC(Data Security Center)实例后,在使用DSC检测ECS自建数据库中存在的敏感数据或监控数据库异常操作前,您需要先完成资产实例授权。使用限制 仅支持VPC网络中的ECS自建数据库。仅支持MySQL、SQL Server和Oracle类型的...
数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据。数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...