jipei数据线-jipei数据线文档介绍内容-移动阿里云

功能简介

在数据中台建设过程中，搭建核心处理平台，并根据相关标准要求，将源数据或治理后的数据，按照“全面、高效、统筹”的共享原则，“低延时”、“精准化”地传递给用户，方便更多应用消费数据，实现数据价值。协同管控各种组织机构，为智慧化...

典型场景

ETL离线数据处理面对复杂SQL优化和海量数据大规模聚合分析等挑战，云原生数据仓库AnalyticDB PostgreSQL版具有如下技术优势：支持标准SQL、OLAP窗口函数和存储过程。ORCA分布式SQL优化器，复杂查询免调优。MPP多节点全并行计算，PB级数据...

功能更新动态（2023年）

创建MySQL数据源创建PolarDB-X数据源创建AnalyticDB for MySQL 2.0数据源创建AnalyticDB for PostgreSQL数据源创建达梦（DM）数据源创建TiDB数据源创建Kafka数据源离线集成新增Apache Doris数据源的离线集成。整库迁移任务支持...

功能更新动态（2022年之前）

2021年08月19日华北2（北京）、华东1（杭州）购买指引、计费说明 2021年08月24日华南1（深圳）2021年08月26日华东2（上海）数据源：可支持的数据源类型和版本拓展，优化数据源配置交互新建数据源页面支持分类展示数据源类型，同时增加...

DataWorks模块使用指引

以下是几种典型的组合模式：组合模式一：离线数仓构建这是最经典、最基础的组合，适用于构建企业级数据仓库，进行周期性的批量数据处理和商业智能（BI）分析。核心目标：建立稳定、可靠、可追溯的离线数据仓库体系。模块组合：实现方式：...

名词解释

聚合（Aggregation）：当同一个度量（Metric）的查询有多条时间线产生（多个指标采集设备），那么为了将空间的多维数据展现为成同一条时间线，需要进行合并计算，例如，当选定了某个城市某个城区的污染指数时，通常将各个环境监测点的指标...

什么是数据管理DMS

提供全域数据资产管理、数据治理、数据库设计开发、数据集成、数据开发和数据消费等功能，同时DMS内置的数据灾备（DBS）还提供了低成本、高可靠的备份恢复能力，致力于帮助企业高效、安全地挖掘数据价值，助力企业数字化转型。前置概念 ...

LTS（原BDS）服务介绍

功能列表功能场景相关文档 HBase、Lindorm宽表之间数据迁移新旧集群无缝迁移、集群升配、在线离线业务分离、主备容灾、异地多活。全增量数据同步 RDS-Lindorm 重要该功能自2023年3月10日下线，2023年3月10日后购买的LTS 不再支持此...

标签资产市场概述

如离线指标映射标签包括来源数据集、数据集主体、数据集指标、指标值类型、指标描述信息。标签测试：开启了在线服务的离线标签和实时标签可以通过输入主键值方式，测试标签主键值的计算结果。说明标签测试将使用标签在线服务，数据传输到...

数据编辑器功能介绍

数据编辑器是一款支持多种地理数据编辑与管理功能的小工具，本文介绍数据编辑器的详细功能。进入数据编辑器单击 DataV.GeoAtlas地理小工具系列，打开数据编辑器工具页面。界面概述数据编辑器页面分为三大主要功能面板，分别为地图面板...

标签资产市场概述

如离线指标映射标签包括来源数据集、数据集主体、数据集指标、指标值类型、指标描述信息。标签血缘：可以查看标签的血缘链路信息。详情请参见标签血缘说明。标签血缘说明在标签详情页面单击标签血缘页签，将展示当前标签的血缘关系图...

客户案例

DataWorks在多个行业中均有典型的案例落地，帮助多个行业的企业解决数据痛点，挖掘数据价值。本文为您介绍典型行业中已落地的客户案例。新零售行业：大润发云上数据中台建设客户简介为了快速数字化转型，拥抱新零售，大润发计划两年内将...

产品更新动态-共享模式（全托管）

2025年11月04日-Dataphin新版本发布 Dataphin于2025年11月04日发布V5.3版本，本次升级相较于历史版本：新增支持DolphinDB数据源，可用于数据集成。数据库SQL新增支持OceanBase数据源。元数据中心新增支持DolphinDB、openGauss采集源。新增...

血缘查看

各数据源血缘展示情况说明数据源数据集成数据开发表级血缘字段级血缘表级血缘字段级血缘 AnalyticDB MySQL 详情页详情页-血缘信息离线同步实时同步离线同步实时同步 insert into/insert overwrite table create as select from...

洞察考生流向，助力地摊经济精准布局

数据清洗：整合高校信息由于获取到的三个原始文件数据（招生一段线、招生二段线、高校信息）均包含高校相关信息，且存在信息重合情况，为避免多次查询导致分析过程繁琐，在进行数据分析前，需先对这些数据进行整合。创建SQL分析单元。在...

数据导入方式介绍

离线数仓加速离线数据运行在 MaxCompute 等离线数仓上，单天数据增量达到几十GB甚至TB级，需要每天导入数据到 AnalyticDB for MySQL 进行数据加速分析。使用方法数据导入方式分为常规导入（默认）和弹性导入。常规导入在计算节点中读取源...

数据开发概述

Data Studio介绍 Data Studio是智能湖仓一体数据开发平台，内置阿里巴巴15年大数据建设方法论，深度适配阿里云MaxCompute、E-MapReduce、Hologres、Flink、PAI等数十种大数据和AI计算服务，为数据仓库、数据湖、OpenLake湖仓一体数据架构...

数据开发（Data Studio）（新版）

Data Studio介绍 Data Studio是智能湖仓一体数据开发平台，内置阿里巴巴15年大数据建设方法论，深度适配阿里云MaxCompute、E-MapReduce、Hologres、Flink、PAI等数十种大数据和AI计算服务，为数据仓库、数据湖、OpenLake湖仓一体数据架构...

审计日志

自定义数据源（支持新建离线数据源和实时数据源）AddCustomDataSource 创建实时自定义数据源。UpdateCustomDataSource 更新实时自定义数据源。DeleteCustomDataSource 删除实时自定义数据源。我的权限 ApplyPrivilege 申请权限。...

单表离线同步任务

数据集成的离线同步功能为您提供数据读取（Reader）和写入插件（Writer），方便您通过定义来源与去向数据源，并结合DataWorks调度参数使用，将源端数据库中全量或增量数据的同步至目标数据库中。本文为您介绍离线同步的相关能力。核心能力 ...

使用DataWorks（离线与实时）

MaxCompute支持通过DataWorks的数据集成功能以离线或实时方式导入其他数据源的数据，也支持导入部分类型的本地文件数据。本文介绍如何使用DataWorks将数据导入MaxCompute的。操作步骤已创建MaxCompute项目和创建表。用于存储后续同步...

线图层

线图层包含多个元素，具体使用请参见基础线、纹理填充线。基础线基础线是线图层中最基本的样式，用于以简单的线条连接地理位置，展示点与点之间的路径或关系。使用场景基础线以简洁的方式呈现空间关系，适用于交通网络（道路、航线）、...

副本数据管理CDM（Copy Data Management）

典型应用场景基于线上数据的开发测试（Dev或Ops）测试和预发布需要基于线上存量数据验证，但又必须保护线上数据不被污染。沙箱功能可以快速提供历史全量数据副本，同时满足快速测试迭代和数据可靠性保障需求。在线应急容灾基于沙箱的备份...

数据导入

云数据库 SelectDB 版支持多样化的数据导入方式，涵盖原生接口与生态工具，满足从实时流数据到离线批处理的多场景需求。本文为您介绍数据导入到 SelectDB 的核心接口与工具。导入选型建议阿里云生态源数据：DTS、DataWorks 非阿里云生态...

同步数据至Hive

支持的同步类型单表离线支持数据来源：数据集成模块数据来源支持的所有数据源类型配置指导：离线同步任务配置整库离线支持数据来源：MySQL 配置指导：数据集成侧同步任务配置配置案例 MySQL整库离线同步至Hive

数据传输作业：数据集成

离线同步离线（批量）的数据通道通过定义数据来源和去向的数据源和数据集，提供一套抽象化的数据抽取插件（Reader）、数据写入插件（Writer），并基于此框架设计一套简化版的中间数据传输格式，从而实现任意结构化、半结构化数据源之间...

调试实时任务

Session集群调试方式：即通过Session集群进行调试，调试的数据为线上的真实数据且为流式数据（即来源表中写入数据时，将直接输出该条数据的计算结果，与真实线上运行任务的结果一致）。该方式下，Session集群提供Flink任务状态、日志和...

增量数据同步

通过选择已注册的数据源端数据和目标端，实现增量任务自动建表的方式创建离线同步周期任务，本文介绍如何创建MySQL to MaxCompute离线增量数据同步周期调度的任务。前提条件已新建工作组“信息中心（xxzx）”，具体操作，请参见新建工作...

同步数据至StarRocks

支持的同步类型单表离线支持数据来源：数据集成模块数据来源支持的所有数据源类型配置指导：离线同步任务配置单表实时支持数据来源：Kafka 配置指导：数据集成侧同步任务配置整库离线支持数据来源：MySQL 配置指导：数据集成侧同步...

离线同步写入MongoDB数据

DataWorks的数据集成为您提供MongoDB Writer插件，可从其他数据源中读取数据，并将数据同步至MongoDB。本文以一个具体的示例，为您演示如何通过数据集成将MaxCompute的数据离线同步至MongoDB。前提条件本实践进行操作时，需满足以下条件。...

同步数据至Elasticsearch

支持的同步类型单表离线支持数据来源：数据集成模块数据来源支持的所有数据源类型配置指导：离线同步任务配置单表实时支持数据来源：DataHub、Kafka、LogHub、MySQL、PolarDB 配置指导：配置单表实时同步任务整库离线支持数据来源：...

轨迹线层（v3.x版本）

轨迹线层子组件拥有交互配置，可单击某个线或鼠标移入到线时，触发数据请求，抛出回调值，实现在单击或鼠标移入到线时，动态加载不同线的数据。默认抛出所单击区域的 id 值，具体配置请参见如何配置数字翻牌器组件的回调ID。蓝图编辑器...

使用DataWorks同步数据

背景信息您可以通过DataWorks，将支持的各种数据源数据离线同步至云数据库ClickHouse。离线同步支持的数据源类型，具体请参见支持的数据源与读写插件。前提条件已创建工作空间，引擎服务选择为MaxCompute。如何创建，请参见创建工作...

支持的数据库类型与功能

数据源类型 MySQL SQL Server PostgreSQL MariaDB MySQL Oracle PostgreSQL PolarDB分布式版全量数据备份 ✔️ ✔️ ✔️ ✔️ ✔️ ✔️ ✔️ 增量日志备份 ✔️ ❌ ❌ ✔️ ✔️ ❌ ❌ 实时备份 RPO（秒级）RPO（天级）RPO（天级）RPO...

同步数据至ClickHouse

支持的同步类型单表离线支持数据来源：数据集成模块数据来源支持的所有数据源类型配置指导：离线同步任务配置配置案例 MaxCompute单表离线同步至ClickHouse

向导模式配置

数据集成提供向导式的开发引导，您无需编写任何代码，通过在界面勾选数据来源与去向，并结合DataWorks调度参数，实现将源端单表或分库分表的全量或增量数据周期性同步至目标数据表。本文为您介绍向导模式配置离线同步任务的常规配置，各...

脚本模式配置

当需要实现更精细化的离线任务配置时，可以使用脚本模式，通过编写数据同步的JSON脚本并结合DataWorks调度参数，将源端单表或分库分表的全量或增量数据周期性同步至目标数据表。本文为您介绍脚本模式配置离线同步任务的常见配置，各数据源...

使用MaxCompute控制台（离线）

MaxCompute控制台提供数据上传功能，支持您将本地文件或阿里云对象存储服务OSS中的文件数据离线（非实时）上传至MaxCompute进行分析处理及相关管理操作。使用限制仅支持基于本地文件或阿里云对象存储OSS 上传数据，具体如下。本地文件...

同步数据至Hologres

支持的同步类型单表离线支持数据来源：数据集成模块数据来源支持的所有数据源类型配置指导：离线同步任务配置单表实时支持数据来源：DataHub、Hologres、Kafka、LogHub 配置指导：数据集成侧同步任务配置整库离线支持数据来源：...

数据集成

通过离线单条管道构建同步任务离线的数据管道通过定义数据来源和去向的数据源和数据集，提供一套抽象化的数据输入组件、数据输出组件及流程和转换组件，并基于此框架设计一套简化版的中间数据传输格式，从而实现数据源之间数据传输。数据...