在线制作大数据-在线制作大数据文档介绍内容-移动阿里云

互联网、电商行业离线大数据分析

通过阿里云MaxCompute、云数据库RDS MySQL、DataWorks等产品，可以实现互联网、电商网站的离线数据分析，且支持通过DataV大屏展示分析后的业务指标数据。概述电商网站的销售数据通过大数据进行分析后，可以在大屏幕展示销售指标、客户指标...

计算设置

使用StarRocks作为元仓计算引擎进行元仓初始化 Lindorm（计算引擎）Lindorm是阿里云的一个云原生多模数据库产品，其计算引擎模式可以支持离线大数据应用。设置Dataphin的计算引擎为Lindorm（计算引擎）GaussDB（DWS）GaussDB（DWS）是华为...

计算设置概述

使用StarRocks作为元仓计算引擎进行元仓初始化 Lindorm（计算引擎）Lindorm是阿里云的一个云原生多模数据库产品，其计算引擎模式可以支持离线大数据应用。设置Dataphin的计算引擎为Lindorm（计算引擎）实时计算引擎阿里云实时计算Flink ...

离线同步任务运维

后续：离线同步数据质量问题与同步任务调优离线同步提速或限速离线同步数据质量排查离线同步日志分析离线同步任务运维常见问题如果离线同步传输数据时，脏数据超出限制，是否所有数据都不会同步？如何排查离线同步任务运行时间长的...

什么是数据湖构建

阿里云数据湖构建（Data Lake ...传统大数据场景适用于数据湖计算和数据湖分析场景，典型案例包括大数据离线分析、实时分析、机器学习以及日志文件分析等。通过DLF提供的统一元数据和存储服务，旨在简化和加速数据湖的构建以及数据治理过程。

产品系列

近年来，针对半结构化和非结构化数据分析（例如日志数据）的业务诉求越来越多，因此，AnalyticDB for MySQL 推出了基于弹性模式的湖仓版，提供Spark计算引擎满足大数据离线处理需求。新推出的企业版和基础版，融合了数仓版预留模式、...

访问数据分析功能

本文介绍访问数据分析功能的三种方式。通过顶部菜单栏直接进入数据可视化登录数据管理DMS 5.0...相关操作在进入数据分析页面后，您需要创建数据集，用于后续所有的分析工作、仪表盘制作和大屏制作。创建数据集的操作，请参见管理数据集。

大数据专家服务

大数据专家服务（Bigdata Expert Service）是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障，帮助用户构建和持续优化的大...

产品简介

实时物化视图差异数据湖 Spark离线处理查询性能的智能诊断与调优 RAG应用时空分析应用场景共同点实时数仓实时日志分析商业智能报表差异精准营销多源联合分析 大数据存储分析离线数据加速其它数据湖或数据仓库业务迁移...

应用场景

实时数据通道接入多种异构数据并投递到下游多种大数据系统通过数据总线，您可以实时接入APP、WEB、IoT和数据库等产生的异构数据，统一管理，并投递到下游的分析、归档等系统，构建清晰的数据流，让您更好的释放数据的价值。收益系统解耦...

管理离线数据集

离线数据集创建完成后，可在离线数据集列表中进行相关管理操作。本文为您介绍数据集相关的管理操作。在Dataphin顶部菜单栏中，选择标签标签工作台。在左侧导航栏中，选择数据准备离线数据集。离线数据集页面分别展示离线数据集列表，...

克里金等值面层

克里金等值面层是基础平面地图的子组件，支持独立的样式和数据配置，包括填充颜色、边线样式等，适用于将已知的矢量点数据制作成栅格区域图进行大屏展示。本文介绍克里金等值面层各配置项的含义。单击子组件管理下方的克里金等值面层，...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力，本文以一个零售电商行业的数仓搭建实验为例，为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现，帮助您深入了解阿里云...

离线数据集

离线数据集是通过指标映射创建离线标签的前提条件。可以选择表映射、SQL加工以及表单加工的方式对离线数据集进行定义。并通过预定义加工的方式，以便后续的离线标签创建。功能概述您可根据业务需求创建所需的离线数据集。离线数据集的加工...

离线数据集概述

离线数据集是通过指标映射创建离线标签的前提条件。可以选择表映射、SQL加工以及表单加工的方式对离线数据集进行定义。并通过预定义加工的方式，以便后续的离线标签创建。功能概述您可根据业务需求创建所需的离线数据集。离线数据集的加工...

什么是EMR on ECS

EMR on ECS是指在ECS上运行EMR，它将EMR的大数据处理能力与ECS的弹性灵活优势相结合，使得您能够更加便捷地配置和管理EMR集群，同时支持多种开源和自研大数据组件，适用于复杂的大数据处理和分析场景。产品架构 EMR主要由四部分组成，分别...

上线离线数据同步任务

新增离线数据同步任务后，需对任务进行上线操作，同步任务上线后会按照创建同步任务中设置的调度周期执行。本文介绍如何上线离线数据同步任务。前提条件已新增离线数据同步任务，具体操作，请参见新增离线数据同步任务、批量新增离线数据...

数据模型

数据库在存储数据时，会将同一条时间线的数据尽量聚类存储，提升时间线数据访问效率，同时更好的支持时序数据压缩。在时序表中，Tag列的值都相同的一系列数据行构成了一条时间线。时序数据库提供一系列特有的数据访问操作，包括聚合...

Echarts K线图

本文介绍Echarts K线图的图表样式和配置面板的功能。图表样式配置面板搜索配置：单击配置面板右上角的搜索配置，可在搜索配置面板中输入您需要搜索的配置项名称，快速定位到该配置项，系统支持模糊匹配。详情请参见搜索资产配置。...

Echarts K线图

本文介绍Echarts K线图的图表样式和配置面板的功能。图表样式样式面板搜索配置：单击样式面板右上角的搜索配置项图标，可在搜索配置面板中输入您需要搜索的配置项名称，快速定位到该配置项，系统支持模糊匹配。详情请参见搜索配置项。...

查看离线数据同步任务监控

前提条件已上线离线数据同步任务，具体操作，请参见上线离线数据同步任务。操作步骤登录数据资源平台控制台。在页面左上角，单击图标，选择协同。在顶部菜单栏，单击图标，选择目标工作组，单击资产加工。在左侧导航栏，单击图标...

组件操作

EMR提供的组件包括开源和自研两大类，涵盖数据开发、计算引擎、数据服务、资源管理、数据存储、数据集成等领域，您可以按需选择和配置。说明在创建集群时，如果没有您想使用的组件，或者想使用的开源组件仅对存量用户开放，您可以自行安装...

管理数据集

注意事项数据分析后续所有的分析工作、仪表盘制作和大屏制作都是基于数据集进行的，因此在进行其他功能前，必须先创建数据集。创建数据集方式一：通过控制台顶部菜单栏操作创建数据集登录数据管理DMS 5.0。单击控制台左上角的图标，...

飞线层

图表样式飞线层是3D球形地图的子组件，支持独立的样式和数据配置，包括飞线的速度、高度、色调以及起始点经纬度等，适用于OD数据的线型表达，通常表示两地之间的关联，如物流、交易等。配置面板搜索配置：单击配置面板右上角的搜索...

核心能力

数据资源平台提供了一站式数据资产定义、生产、管理与服务平台，提供企业级数据资产构建能力和一致性使用体验，助力客户快速构建数据智能平台，实现数据资源统一管理，挖掘潜在规律，优化业务决策，让大数据真正的驱动客户业务。...

云产品集成

您可以使用 DMS 录入云数据库 OceanBase 的数据，通过 DMS 的全域数据资产管理、数据治理、数据库设计开发、数据集成、数据开发和数据消费等功能，帮助企业高效、安全地挖掘数据价值，助力企业数字化转型。什么是数据管理DMS 支持的数据库...

综合：网站用户画像分析

开源全托管服务EMR Serverless StarRocks 开源大数据平台 E-MapReduce 开源全托管服务EMR Serverless Spark 数据中台一站式大数据开发治理DataWorks 在本案例中，DataWorks作为数据中台，用于对原始数据进行同步、加工、质量监控、数据...

大数据

购买数据安全中心DSC（Data Security Center）实例后，在使用 DSC 检测大数据产品（包括TableStore、MaxCompute、AnalyticDB-MYSQL、AnalyticDB-PG）中存在的敏感数据或审计数据库等功能前，您需要先开启对应功能。前提条件已开通数据...

添加任务目录

在左侧导航栏，单击图标，将鼠标悬停在离线数据同步上，单击图标，选择添加子级目录，为根目录添加子目录。在类目属性设置对话框，输入类目名称和类目描述，单击确定。（可选）在左侧导航栏，单击离线数据同步，将鼠标悬停在新建...

同步数据至OSS/OSS-HDFS

支持的同步类型单表离线数据去向为OSS或OSS-HDFS时，支持的数据来源：数据集成模块数据来源支持的所有数据源类型配置指导：数据集成侧同步任务配置单表实时数据去向为OSS或OSS-HDFS时，支持的数据来源：Kafka、LogHub 配置指导：数据...

数据库节点

支持创建数据库节点数据源数据源类型数据源简介 MySQL MySQL是用于存储和处理数据的关系型数据库管理系统（RDBMS），是最流行的关系型数据库管理系统之一，其体积小、速度快、总体拥有成本低。更多介绍请参见 MySQL。SQL Server SQL ...

热力线层

数据源单击配置数据源，可在设置数据源面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果，详情请参见配置资产数据。数据过滤器数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击添加过滤器...

创建MySQL to MaxCompute离线同步周期任务

通过选择已注册的数据源端数据和目标端，实现全量任务自动建表的方式创建离线同步周期任务，本文介绍如何创建MySQL to MaxCompute离线同步周期任务。前提条件已新建工作组“信息中心(xxzx)”，具体操作，请参见新建工作组。已在工作组中...

迁移Hive数据

导入Hive源数据增量数据迁移说明实际生产环境中，Hive数据主要分为离线数据和增量数据，由于Hive数据迁移到 SelectDB，通常的使用场景是拷贝一份数据到数据仓库进行查询加速，因此对于增量数据的迁移，可以考虑以下方式：在生产Hive数据...

技术架构选型

数据计算层数据计算能力以MaxCompute为核心，承担数据仓库的大规模离线计算任务。选型理由：强大的分布式批处理能力，适用于大规模存储与运算。成本可控，存算分离，按量付费。与 DataWorks、数据治理能力强耦合，可集成研发、质量、安全...

热力线层

图表样式热力线层是3D地球的子组件，支持独立的样式和数据配置，包括线的长宽、渐变速度和颜色以及经纬度等，适用于绘制地理位置上的线条元素。样式面板搜索配置：单击样式面板右上角的搜索配置项图标，可在搜索配置面板中输入您需要...

批量新增离线数据同步任务

数据同步支持离线同步任务的批量创建，并支持一键启动多个上云任务，实现全量任务自动建表。本文以同步MySQL数据源到MaxCompute目标端为例，介绍如何批量新增离线数据同步任务。前提条件已存在对应数据源，具体操作，请参见新建数据源。...

通过SQL加工创建离线数据集

Dataphin标签基于离线计算引擎，支持通过SQL加工方式开发数据集指标，对来源物理表字段进行预加工后供离线标签使用。本文将指导您如何通过SQL加工创建离线数据集。前提条件创建离线数据集前需先创建数据集所归属的标签项目。更多信息，请...

通过SQL加工创建离线数据集

Dataphin标签基于离线计算引擎，支持通过SQL加工方式开发数据集指标，对来源物理表字段进行预加工后供离线标签使用。本文将指导您如何通过SQL加工创建离线数据集。前提条件创建离线数据集前需先创建数据集所归属的标签项目。更多信息，请...

离线数据处理

想用AnalyticDB进行离线数据处理？本篇实践教程通过详细的分步指南与代码示例，清晰讲解核心操作流程，助您快速构建并优化数据处理任务。