应用数据集成-应用数据集成文档介绍内容-移动阿里云

通过DataWorks导入数据

您需要在数据集成同步任务配置前，配置好您需要同步的源端和目标端数据库，以便在同步任务配置过程中，可通过选择数据源名称来控制同步任务的读取和写入数据库。离线同步支持的数据源及其配置详情请参见支持的数据源与读写插件。说明数据...

同步数据至DataHub

支持的同步类型单表离线支持数据来源：数据集成模块数据来源支持的所有数据源类型配置指导：离线同步任务配置单表实时支持数据来源：DataHub、Kafka、LogHub、MySQL、PolarDB 配置指导：配置单表实时同步任务整库实时支持数据来源：...

使用独享数据集成资源组

您可以使用DataWorks独享数据集成资源组功能，为数据集成同步任务分配独立的计算资源，从而提高任务的执行效率和稳定性。购买独享资源组后，在实际使用前您还需进行网络绑定、白名单等配置操作。本文为您介绍从购买至使用独享数据集成资源...

数据集成

云数据库 SelectDB 版的数据集成是用于将外部数据导入实例数据库的可视化工具。本文介绍如何使用云数据库 SelectDB 版的数据集成。前提条件已创建云数据库 SelectDB 版实例。具体操作，请参见创建实例。实例版本大于等于3.0.7。操作...

ETL工具支持概览

阿里云的数据集成服务（Data Integration）：阿里云提供的ETL工具。在数据集成服务中，将 AnalyticDB PostgreSQL版配置为一个PostgreSQL数据库，即可实现其他数据源（RDS、MaxCompute、TableStore等）到 AnalyticDB PostgreSQL版的数据...

等待资源

数据集成任务等待数据集成资源。计算任务等待引擎计算资源。产生原因资源组下可用资源是有限的，如果有任务长时间执行未释放资源必定会阻塞其他任务执行，关于任务下发机制，详情请参见：DataWorks资源组概述。解决措施您可进入运维中心...

通用参考：切换资源组

登录 DataWorks控制台，切换至目标地域后，单击左侧导航栏的 数据集成 数据集成，在下拉框中选择对应工作空间后单击进入数据集成。在左侧导航栏，单击同步任务，然后在任务列表中，找到目标同步任务，单击右侧操作栏的更多编辑，...

应用场景

本文介绍云消息队列 Kafka 版的典型应用场景，包括网站活动跟踪、日志聚合、数据处理、数据中转枢纽。网站活动跟踪成功的网站运营需要对站点的用户行为进行分析。通过云消息队列 Kafka 版的发布/订阅模型，您可以实时收集网站活动数据...

配置RDS MySQL间的数据集成任务

本文以配置RDS MySQL间的数据集成任务为例，介绍数据集成任务的配置流程和注意事项。说明新版DTS控制台暂不支持数据集成功能，您可以在数据管理DMS控制台配置离线集成任务，详情请参见离线集成概述。支持全量数据迁移的数据源均支持数据...

独享数据集成资源组计费

在数据集成任务高并发执行且无法错峰运行的情况下，需要专有的计算资源组来保障数据快速、稳定的传输时，建议您选择使用DataWorks的独享数据集成资源组。本文为您概要介绍独享数据集成资源组。DataWorks不推荐使用独享数据集成资源组 ...

查看历史信息

进入数据集成页面。在Dataphin首页，单击研发，进入数据开发页面。在数据开发页面，单击项目名称后的图标，选择数据开发的项目空间（Dev 或 Basic 项目）。如果您当前访问的是 Dev 或 Basic 项目，且项目空间为您的数据开发空间，...

数据集成调度策略说明

DTS的数据集成功能可根据调度策略的配置，定期地将源库中的结构和存量数据迁移至目标库中。通过该功能可以帮助您构建更加灵活的数据仓库（例如构建T+1的周期性数仓），本文介绍数据集成的策略、限制及适用场景。支持的数据库支持全量数据...

数据传输加密

应用执行动态数据加密需要集成阿里云密钥管理服务KMS的SDK或API，实现应用数据加密。数据动态加密的最佳实践如下：选择数据加密密钥阿里云密钥管理服务提供了不同类型的密钥用于云产品加密和应用加密场景，需要注意的是阿里云密钥管理服务...

Oracle数据导入

您需要在数据集成同步任务配置前，配置好您需要同步的源端和目标端数据库，以便在同步任务配置过程中，可通过选择数据源名称来控制同步任务的读取和写入数据库。同步任务支持的数据源及其配置详情请参见支持的数据源及同步方案。说明数据...

概述

本文为您介绍如何通过Tunnel、DataHub、LogHub以及DataWorks数据集成将日志数据迁移至MaxCompute。方案说明适用场景 Tunnel 通过MaxCompute的Tunnel功能，将日志数据上传至MaxCompute。详情请参见通过Tunnel迁移日志数据至MaxCompute。...

跨账号授权（RDS、Hive或Kafka）

登录 DataWorks控制台，切换至目标地域后，单击左侧导航栏的 数据集成 数据集成，在下拉框中选择对应工作空间后单击进入数据集成。新增RDS、Hive或Kafka数据源。关键参数：参数说明数据源类型阿里云实例模式。实例所属账号选择其他云...

数据库实时导入DataHub

为了更加方便让数据库数据实时导入到DataHub，联合数据集成一起开发了“数据库实时导入到DataHub”，尽量简化数据流入DataHub的流程。整体流程如下：使用图解主账号使用方式：打开公有云DataHub Console，选择对应的Project，点击右上角的...

实时同步字段格式

本文为您介绍数据集成实时同步字段的格式及附加列。数据集成实时同步MySQL数据的记录格式如下。sequence_id_operation_type_execute_time_before_image_after_image_字段1 字段2 字段3 增量事件的记录 ID，值唯一且递增。操作类型（I/D/U）...

字段编辑与赋值

DataWorks数据集成实时ETL支持字段编辑与赋值组件使用，可以在来源与去向组件间新增字段编辑与赋值组件按配置的过滤规则，进行新增字段的编辑和赋值。前提条件已完成数据集成的基本配置与网络资源配置。仅支持如下数据源类型的数据来源和...

DataWorks On Hologres使用说明

数据开发仅支持部分离线同步和实时同步场景，更多数据同步应用，请前往 数据集成 主站查看。数据开发：您无需接触复杂的命令行，便可在DataWorks中实现各类任务的开发及周期性调度。节点代码定义：Hologres开发指南 Hologres SQL节点一键...

基本操作

MaxCompute无缝集成了上下游生态产品，支持多种丰富的数据集成工具，并进行了深度的定制开发与优化。例如MaxCompute定制开发的Flink Connector和DataWorks的数据集成等，用于支持高并发、可扩展的高效近实时增量数据导入。SQL批式写入Delta...

API概览

ListDIJobs 获取数据集成同步任务配置列表查询数据集成新版任务列表，包括整库同步实时任务，整库同步离线任务，单表同步实时任务等数据集成任务。ListDIJobRunDetails 获取数据集成同步任务运行的执行进展获取数据集成运行信息。...

公网流量计费说明

数据集成任务运行在公共资源组和独享资源时，在数据传输过程中如果产生了公网流量，会按量收取公网流量费用。本文为您介绍数据集成公网流量计费详情。流量费用产生原则若DataWorks上的数据源配置了公网地址，则基于该数据源配置的任务执行...

SQL Server集成至OSS

本文以自建SQL Server数据库为例，为您介绍如何将SQL Server的数据集成到阿里云对象存储OSS（Object Storage Service）的指定存储空间（Bucket）中。前提条件 SQL Server数据库已开通公网访问权限或已通过专有网络VPC接入到阿里云。说明 ...

单表实时同步任务

支持的数据源重要数据开发和数据集成支持的数据源有部分重叠，如您需要使用的类型在数据集成侧已支持，更推荐在 数据集成 侧创建实时同步任务。数据集成侧支持的数据源的源端和目的端并非任意组合，具体支持类型见配置来源和去向数据源时...

数仓开发任务流

任务流说明相关文档 数据集成 显示任务流中的数据集成节点：DTS数据迁移节点和离线数据集成节点。数据集成节点在项目空间的标准模式下试运行时，节点会空跑，以免生产数据迁移到测试环境的风险。配置DTS数据迁移节点配置离线数据集成...

DataWorks On MaxCompute使用说明

数据开发仅支持部分离线同步和实时同步场景，更多数据同步应用，请前往 数据集成 主站查看。数据开发：您无需接触复杂的命令行，便可在DataWorks中实现各类任务的开发及周期性调度。节点代码定义：MaxCompute语法创建并使用MaxCompute表 ...

迁移ECS自建MySQL数据库至MaxCompute

本文为您介绍如何使用独享数据集成资源，将您在ECS上自建的MySQL数据库中的数据，迁移到MaxCompute。前提条件已拥有至少一个绑定专有网络VPC的ECS（请勿使用经典网络），并在ECS上安装好MySQL数据库，数据库中已创建好用户和测试数据。...

Oracle集成至OSS

本文为您介绍如何将Oracle的数据集成到阿里云对象存储OSS（Object Storage Service）的指定存储空间（Bucket）中。前提条件 Oracle数据库已开通公网访问权限或已通过专有网络VPC接入到阿里云。说明通过专有网络VPC将Oracle数据库接入到...

MySQL集成至OSS

本文以自建MySQL数据库为例，为您介绍如何将MySQL的数据集成到阿里云对象存储OSS（Object Storage Service）的指定存储空间（Bucket）中。前提条件 MySQL数据库已开通公网访问权限或已通过专有网络VPC接入到阿里云。说明通过专有网络VPC将...

DataWorks访问DLF

如何在阿里云DataWorks数据集成服务通过Paimon REST将数据导入至DLF Catalog。前提条件已创建DataWorks工作空间。如未创建，详情请参见创建工作空间。创建DLF Catalog 详情请参见 DLF 快速入门。创建数据源进入数据源页面。登录 ...

迁移ECS自建MySQL数据库至MaxCompute

本文为您介绍如何使用独享数据集成资源，将您在ECS上自建的MySQL数据库中的数据，迁移到MaxCompute。前提条件已拥有至少一个绑定专有网络VPC的ECS（请勿使用经典网络），并在ECS上安装好MySQL数据库，数据库中已创建好用户和测试数据。...

DataWorks On CDP/CDH使用说明

数据同步：数据开发仅支持部分离线同步和实时同步场景，更多数据同步应用，请前往 数据集成 主站查看。数据开发：您无需接触复杂的命令行，便可在DataWorks中实现各类任务的开发及周期性调度。创建CDH Hive节点创建CDH Spark节点创建CDH ...

MongoDB（副本集架构）集成至OSS

本文以自建MongoDB（副本集架构）为例，为您介绍如何将MongoDB（副本集架构）的数据集成到阿里云对象存储OSS（Object Storage Service）的指定存储空间（Bucket）中。前提条件 MongoDB（副本集架构）数据库已通过专有网络VPC接入到阿里云。...

ListDIProjectConfig-查看数据集成项目默认配置

查看当前工作空间中数据集成同步解决方案任务默认的全局配置。接口说明当前 DataWorks 仅支持为同步解决方案任务中的实时同步 DDL 消息处理策略设置默认的全局配置。如果您的同步解决方案任务包含实时同步任务，则配置 DDL 消息处理规则时...

配置PolarDB输入

鼠标悬停至图标，单击新建节点 数据集成 实时同步。您也可以展开业务流程，右键单击目标业务流程，选择新建节点 数据集成 实时同步。在新建节点对话框中，选择同步方式为单表（Topic）到单表（Topic）ETL，输入名称，并选择路径...

使用DataWorks

MaxCompute支持通过DataWorks的数据集成功能将MaxCompute中的数据以离线方式导出至其他数据源。当您需要将MaxCompute中的数据导出至其他数据源执行后续数据处理操作时，您可以使用数据集成功能导出数据。本文为您介绍如何将MaxCompute的...

DataWorks On EMR使用说明

数据同步：数据开发仅支持部分离线同步和实时同步场景，更多数据同步应用，请前往 数据集成 主站查看。数据开发：您无需接触复杂的命令行，便可在DataWorks中实现各类任务的开发及周期性调度。创建EMR Hive节点创建EMR MR节点创建EMR ...

DataStudio侧实时同步任务配置

您需要在数据集成同步任务配置前，配置需要同步的源端和目标端数据库，以便在同步任务配置过程中，可通过选择数据源名称来控制同步任务的读取和写入数据库。实时同步支持的数据源及其配置详情请参见支持的数据源及同步方案。已购买合适...