大数据线上拓客-大数据线上拓客文档介绍内容-移动阿里云

离线同步任务运维

后续：离线同步数据质量问题与同步任务调优离线同步提速或限速离线同步数据质量排查离线同步日志分析离线同步任务运维常见问题如果离线同步传输数据时，脏数据超出限制，是否所有数据都不会同步？如何排查离线同步任务运行时间长的...

查看离线数据同步任务监控

在左侧导航栏，单击图标，将鼠标悬停在离线数据同步上，单击图标。在离线数据同步页面，单击目标同步任务操作列的监控。跳转到离线同步实例页面，可查看同步任务运行详情，更多信息，请参见查看离线计算实例详情。

上线离线数据同步任务

新增离线数据同步任务后，需对任务进行上线操作，同步任务上线后会按照创建同步任务中设置的调度周期执行。本文介绍如何上线离线数据同步任务。前提条件已新增离线数据同步任务，具体操作，请参见新增离线数据同步任务、批量新增离线数据...

添加任务目录

在左侧导航栏，单击图标，将鼠标悬停在离线数据同步上，单击图标，选择添加子级目录，为根目录添加子目录。在类目属性设置对话框，输入类目名称和类目描述，单击确定。（可选）在左侧导航栏，单击离线数据同步，将鼠标悬停在新建...

创建MySQL to MaxCompute离线同步周期任务

通过选择已注册的数据源端数据和目标端，实现全量任务自动建表的方式创建离线同步周期任务，本文介绍如何创建MySQL to MaxCompute离线同步周期任务。前提条件已新建工作组“信息中心(xxzx)”，具体操作，请参见新建工作组。已在工作组中...

运行MySQL to MaxCompute离线同步任务

在左侧导航栏，单击图标，将鼠标悬停在离线数据同步上，单击图标。在同步任务列表，单击“信用卡客户数据上云_d”操作列的上线，弹出确定上线提示页面，单击确定。预期结果在周期任务管理页面，“信用卡客户数据上云_d”任务的...

批量新增离线数据同步任务

在左侧导航栏，单击图标，将鼠标悬停在离线数据同步上，单击图标。在离线数据同步页面，单击批量新增任务。配置基本信息、数据元和目标端。在配置向导页面，选择所属目录，输入任务的描述。在数据源配置区域，选择数据源类型。在 ...

查看MySQL to MaxCompute离线同步任务监控

在左侧导航栏，单击图标，将鼠标悬停在离线数据同步上，单击图标。在同步任务列表，在“信用卡客户数据上云_d”任务操作列中，单击操作列的监控。在离线同步实例页面，默认展示最新运行的实例任务，在任务的操作列单击详情，...

入仓解决方案

根据所需的同步效率、同步数据量需求，创建入仓解决方案同步线上库数据。入仓解决方案包括：实时同步任务：基于离线数据集成的数据传输服务。新建实时同步任务，请参见新建实时同步任务。实时迁移任务：基于数据传输服务DTS的数据传输服务...

数据模型

元素描述聚合（Aggregation）对同一时间线、或不同时间线上的数据点进行分组、求和、计数等计算操作。降采样（Downsample）查询时间区间跨度较长，且原始数据采样频率较高时，可通过降采样降低数据的查询展现精度，例如按秒采集的数据，...

新增离线数据同步任务

数据同步支持离线数据同步任务的新建。离线数据同步任务支持的云计算资源类型为MySQL、Oracle、SQL Server、Hdfs、ftp、PostgreSQL、Hive、MaxCompute、AnalyticDB PostgreSQL、OSS。本文以同步MySQL数据源到MaxCompute目标端为例，介绍...

调试实时任务

Session集群调试方式：即通过Session集群进行调试，调试的数据为线上的真实数据且为流式数据（即来源表中写入数据时，将直接输出该条数据的计算结果，与真实线上运行任务的结果一致）。该方式下，Session集群提供Flink任务状态、日志和...

高压缩引擎（X-Engine）

业务对单独的高压缩引擎（X-Engine）一般有如下诉求：具备大容量存储空间，支持业务持续将线上数据保存到高压缩引擎（X-Engine）中，而无需担心容量问题。与在线数据库系统使用相同的访问接口，如都支持MySQL协议等，确保应用程序端无需...

数据编辑器功能介绍

最大数量：单条线上最多生成的数据量上限。缓冲半径：在线数据两侧一定范围内生成点的随机方向和距离，用于控制点分布的空间离散程度和覆盖范围。创建临时表：开启后执行时会创建新的临时表存储生成的数据。左侧工具栏功能说明地图放大...

产品优势

多场景支持：支持离线数仓搭建、数仓提速、离线数据分析、数据中台搭建、大规模数据集成、离线计算、异构数据集成等。低门槛：近乎零代码，简单配置连线后即可满足各项离线数据集成任务，同时任务支持复杂调度。基于资产的虚拟湖：配合数据...

组件操作

您可以根据产品架构图查看EMR提供的大数据组件及使用场景。数据开发数据开发层提供可视化工具和代码管理，涵盖数据的采集、清洗、建模、分析以及任务调度等一系列开发过程，旨在支持企业对数据资产的高效管理与利用。在EMR中数据开发的...

数据扫描和识别

大数据：TableStore、MaxCompute、AnalyticDB-MYSQL、AnalyticDB-PG。详细说明，请参见支持的数据资产类型。数据源授权完成后需要多长时间完成扫描？DSC 完成数据源授权后，会在2小时内启动扫描。扫描时长将由您所需扫描的数据量决定。当...

整库离线同步任务

数仓/数据湖构建周期性地将线上业务数据库（OLTP）的全量或增量数据，批量同步至数据仓库或数据湖的贴源层（ODS），作为后续数据分析的源头。数据备份与灾备定期将生产数据库的全量数据备份到低成本的存储介质（如HDFS、OSS）。跨地域/...

云消息队列 Kafka 版数据迁移至MaxCompute

本文介绍如何使用DataWorks数据同步功能，将云消息队列 Kafka 版集群上的数据迁移至阿里云大数据计算服务MaxCompute，便于分析加工离线数据。前提条件在开始本教程前，确保您在同一地域中已完成以下操作：云消息队列 Kafka 版购买并...

应用场景

智能构建云上数仓，提高战略决策效率场景：某集团在全国经营多家连锁超市，线上线下零售渠道及形态众多。痛点：因为业务系统多、数据来源多，经营所需的数据需求高频且多样化。但数据体系复杂、数据不统一，数据分析速度和数据准确一致性...

应用场景

智能构建云上数仓，提高战略决策效率场景：某集团在全国经营多家连锁超市，线上线下零售渠道及形态众多。痛点：因为业务系统多、数据来源多，经营所需的数据需求高频且多样化。但数据体系复杂、数据不统一，数据分析速度和数据准确一致性...

数据集成支持的数据源

整库迁移适用于将本地数据中心或在ECS上自建的数据库，同步数据至离线数仓（Hive）、大数据计算服务等场景。例如，将ECS上自建的MySQL数据库的数据迁移至MaxCompute中。离线集成支持的数据源数据源读取写入 大数据存储型数据源 ...

产品简介

大数据专家服务 大数据专家服务（Bigdata Expert Service）是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障，帮助用户...

飞线层

飞线层是3D平面中国地图的子组件，支持独立的样式和数据配置，包括飞线的速度、颜色、粗细以及起始点的经纬度等，能够以飞线动画的形式表现两个地理坐标点之间的过渡效果。本文介绍飞线层各配置项的含义。单击子组件管理下方的飞线层，...

数据集成支持的数据源

整库迁移适用于将本地数据中心或在ECS上自建的数据库，同步数据至离线数仓（Hive）、大数据计算服务等场景。例如，将ECS上自建的MySQL数据库的数据迁移至MaxCompute中。实时集成适用于将来源端数据源中整库或全部表的数据变化实时集成至...

互联网、电商行业离线大数据分析

方案介绍实现互联网、电商行业离线大数据分析的流程如下：同步用户订单等数据至MaxCompute。通过DataWorks对原始数据进行处理，并形成开放API。以API的形式通过DataV在大屏上展示结果数据。方案优势大规模存储：超大规模存储且自动扩容，...

路网轨迹层

透明度系数：轨迹线上点的颜色透明度值，取值范围0.01~1，数值越大，透明度越大。数据面板该组件数据为GeoJson格式，关于数据格式以及数据获取方法，请参见地图数据格式和基础平面地图的地理边界geojson数据接口。配置字段说明字段 ...

产品架构

并且一旦出现数据安全问题，线上业务将无法进行。随着数据恢复时间的增加，造成的损失也会越大。数据灾备提供的应急恢复功能，将自动获取备份集并合成快照点，可按需在短时间内恢复出（即创建）一个新的数据灾备沙箱实例。您可以在沙箱...

路网轨迹层

透明度系数：轨迹线上点的颜色透明度值，取值范围0.01~1，数值越大，透明度越大。数据源面板字段说明 geometry 定义type类型为"LineString。coordinates 定义两个或多个经纬度坐标位置。properties 定义value字段，配合配置中的最大宽度...

DeltaLake

Delta数据湖方案如下：在大数据存储层之上提供了数据管理层，该数据管理层等同于数据库中的元数据管理，其元数据随着数据一起存放并对用户可见（例如数据仓库与数据湖所示）。Delta基于元数据管理引入了ACID，解决了因数据导入失败而产生...

数据归档

当线上数据库中的历史数据（访问率很低的数据）越来越多，占用的存储越来越大，以至于会影响数据库的查询性能与业务运转，此时您可以使用数据管理DMS 的数据归档功能，周期性地将符合筛选条件的表数据归档至其他数据库或存储服务中。...

客户案例

线上业务爆发，需求积压严重，期望有整体解决方案，能够快速灵活支持业务发展所需的技术扩展。价值体现通过 MMA工具，15天完成400TB+历史数据迁移，同时保证了迁移的准确性，让客户拥有平滑高效的上云体验。基于飞天大数据平台产品...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力，本文以一个零售电商行业的数仓搭建实验为例，为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现，帮助您深入了解阿里云...

新功能发布记录

云数据库RDS、云原生数据库PolarDB、云数据库MongoDB、云数据库 Tair（兼容 Redis）、云原生数据仓库AnalyticDB PostgreSQL版产品的备份恢复功能均由数据灾备提供，各产品功能动态详情如下。功能发布更新 2025年 09月功能名称变更类型 ...

通过整库迁移配置集成任务

离线整库迁移可用于将本地数据中心或在ECS上自建的数据库同步数据至大数据计算服务，包括MaxCompute等数据源。本文为您介绍如何新建并配置整库迁移任务。前提条件已完成所需迁移的数据源创建。整库迁移支持MySQL、Microsoft SQL Server、...

什么是MaxCompute

云原生大数据计算服务MaxCompute（原名ODPS）是阿里云自主研发的集高性价比、多模计算、企业级安全和 AI驱动于一体的企业级SaaS化智能云数据仓库（AI-Native Datawarehouse）。视频简介产品简介 MaxCompute是面向分析的企业级 SaaS ...

通过整库迁移配置集成任务

离线整库迁移可用于将本地数据中心或在ECS上自建的数据库同步数据至大数据计算服务，包括MaxCompute、Hive、TDH Inceptor 等数据源。本文为您介绍如何新建并配置整库迁移任务。前提条件已完成所需迁移的数据源创建。整库迁移支持MySQL、...

线热力层（v2.x版本）

线热力层是基础平面地图的子组件，支持独立的样式、数据和交互配置，能够以热力线的形式表现地理位置上的线路信息，适用于地图上线路图的大屏展示，例如展示地铁线路图。本文介绍线热力层各配置项的含义。重要当前为v2.x版本的线热力层子...

技术架构选型

其中，MaxCompute作为整个大数据开发过程中的离线计算引擎。DataWorks的数据集成负责完成数据的采集和基本的ETL，并执行包括数据开发、数据质量、数据安全、数据管理等在内的一系列功能。整体选型说明架构概述本架构围绕“数据采集—数据...

TSDBClient

返回：List 抛出：HttpUnknowStatusException-Exception lastdp public List LastDPValue lastdp(Timeline…timelines)throws HttpUnknowStatusException 从接口复制的说明：TSDB 获取指定时间线上的最后一个数据点。参数：timelines-时间...