大数据在线

_相关内容

使用新版数据开发体验

通过本教程,您可以了解如何使用DataWorks和StarRocks产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站行为...

使用旧版数据开发体验

通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站...

使用旧版数据开发体验

通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站...

使用新版数据开发体验

通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站...

使用新版数据开发体验

通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站...

创建MySQL to MaxCompute离线同步周期任务

在左侧导航栏,单击 图标,将鼠标悬停在 离线数据同步 上,单击 图标。在 离线数据同步 页面,单击 新增任务。在 离线数据同步 管理 页面,配置离线同步周期任务。填写基本信息,任务名称“信用卡客户数据上云_d”。在 源端配置 区域,选择...

数据传输与迁移概述

数据传输渠道 SDK-Tunnel渠道 外表(湖仓一体)JDBC渠道 场景数据写入MaxCompute 离线数据批量写入(数据通道)场景特征。周期调度任务(天、小时级别调用)。对数据延迟不敏感(只要在调度周期执行完成即可满足需求)。典型场景。类型 ...

全量数据同步

在 离线数据同步 页面,单击 新增任务,在 离线数据同步 管理页面,配置离线同步周期任务。填写基本信息,任务名称“信用卡客户数据上云_全量”。在 源端配置 区域,配置数据源端。参数 说明 示例 数据源 数据来源端的数据源类型以及该类型...

使用DataWorks连接

DataWorks基于MaxCompute等引擎,提供统一的全链路大数据开发治理平台。本文为您介绍如何通过DataWorks使用MaxCompute服务。背景信息 DataWorks支持将计算引擎绑定至DataWorks的工作空间,绑定后您可以创建计算任务并进行周期调度。使用...

离线标签

在您完成离线数据集的创建或行为关系的定义后,您可为所创建的离线数据集或行为关系创建对应的离线标签,以便后续的资产应用创建。如标签服务、画像服务的创建。功能概述 您可根据业务需求创建所需的离线标签,离线标签的加工方式不同创建...

离线标签

在您完成离线数据集的创建或行为关系的定义后,您可为所创建的离线数据集或行为关系创建对应的离线标签,以便后续的资产应用创建。如标签服务、画像服务的创建。功能概述 您可根据业务需求创建所需的离线标签,离线标签的加工方式不同创建...

Append Delta Table数据组织优化

Append Delta Table在复杂业务场景上表现优秀,显著的效能提升也反映出数据存储格式的技术优化在大数据分析场景下的核心价值。其技术价值及性能优化总结如下:数据自治:通过Merge、Compaction、Reclustering等后台任务,实现存储效率与...

通过SQL加工创建离线数据

本文将指导您如何通过SQL加工创建离线数据集。前提条件 创建离线数据集前需先创建数据集所归属的标签项目。更多信息,请参见 创建标签项目。操作步骤 在Dataphin首页,单击顶部菜单栏的 标签 标签工作台。在顶部菜单栏中,选择 项目。在...

通过SQL加工创建离线数据

本文将指导您如何通过SQL加工创建离线数据集。前提条件 创建离线数据集前需先创建数据集所归属的标签项目。更多信息,请参见 创建标签项目。操作步骤 在Dataphin首页,单击顶部菜单栏的 标签 标签工作台。在顶部菜单栏中,选择 项目。在...

添加任务目录

在左侧导航栏,单击 图标,将鼠标悬停在 离线数据同步 上,单击 图标,选择 添加子级目录,为根目录添加子目录。在 类目属性设置 对话框,输入类目名称和类目描述,单击 确定。(可选)在左侧导航栏,单击 离线数据同步,将鼠标悬停在新建...

批量新增离线数据同步任务

本文以同步MySQL数据源到MaxCompute目标端为例,介绍如何批量新增离线数据同步任务。前提条件 已存在对应数据源,具体操作,请参见 新建数据源。已完成源端数据和目标端的物理表同步,具体操作,请参见 获取物理表。已添加离线数据同步任务...

离线标签概述

在您完成离线数据集的创建或行为关系的定义后,您可为所创建的离线数据集或行为关系创建对应的离线标签,以便后续的资产应用创建。如标签服务、画像服务的创建。功能概述 您可根据业务需求创建所需的离线标签,离线标签的加工方式不同创建...

通过表单加工创建离线数据

本文将指导您如何通过表单加工创建离线数据集。前提条件 创建离线数据集前需先创建数据集所归属的标签项目。更多信息,请参见 创建标签项目。操作步骤 在Dataphin首页,单击顶部菜单栏的 标签 标签工作台。在顶部菜单栏中,选择 项目。在...

通过表单加工创建离线数据

本文将指导您如何通过表单加工创建离线数据集。前提条件 创建离线数据集前需先创建数据集所归属的标签项目。更多信息,请参见 创建标签项目。操作步骤 在Dataphin首页,单击顶部菜单栏的 标签 标签工作台。在顶部菜单栏中,选择 项目。在...

通过表映射创建离线数据

本文将指导您如何通过表映射创建离线数据集。前提条件 创建离线数据集前需先创建数据集所归属的标签项目。更多信息,请参见 创建标签项目。操作步骤 在Dataphin首页,单击顶部菜单栏的 标签 标签工作台。在顶部菜单栏中,选择 项目。在左侧...

通过表映射创建离线数据

本文将指导您如何通过表映射创建离线数据集。前提条件 创建离线数据集前需先创建数据集所归属的标签项目。更多信息,请参见 创建标签项目。操作步骤 在Dataphin首页,单击顶部菜单栏的 标签 标签工作台。在顶部菜单栏中,选择 项目。在左侧...

离线数据处理

想用AnalyticDB进行离线数据处理?本篇实践教程通过详细的分步指南与代码示例,清晰讲解核心操作流程,助您快速构建并优化数据处理任务。

技术架构选型

其中,MaxCompute作为整个大数据开发过程中的离线计算引擎。DataWorks的数据集成负责完成数据的采集和基本的ETL,并执行包括数据开发、数据质量、数据安全、数据管理等在内的一系列功能。整体选型说明 架构概述 本架构围绕“数据采集—数据...

迁移Hive数据

本文为您介绍Hive的离线数据迁移到 云数据库 SelectDB 版 的各个方式以及方式选择规则。方式选择 根据不同的业务场景,选择合适您的迁移方式。具体的方式选择可以参考如下规则:方式 适用场景 推荐原因 操作步骤 Catalog 数据存储在阿里云...

新增离线数据同步任务

数据同步支持离线数据同步任务的新建。离线数据同步任务支持的云计算资源类型为MySQL、Oracle、SQL Server、Hdfs、ftp、PostgreSQL、Hive、MaxCompute、AnalyticDB PostgreSQL、OSS。本文以同步MySQL数据源到MaxCompute目标端为例,介绍...

同步数据至OSS/OSS-HDFS

支持的同步类型 单表离线 数据去向为OSS或OSS-HDFS时,支持的数据来源:数据集成模块数据来源支持的所有数据源类型 配置指导:数据集成侧同步任务配置 单表实时 数据去向为OSS或OSS-HDFS时,支持的数据来源:Kafka、LogHub 配置指导:数据...

飞线层

当飞线请求失败时 飞线数据接口请求失败时(请求失败的情况可能是:网络问题或接口报错等)返回并经过过滤器处理后抛出的事件,同时抛出处理后的JSON格式的数据。具体数据示例请参见画布编辑器中组件右侧配置面板 数据 页签的 数据响应结果...

数据服务

数据推送:数据推送是阿里云大数据开发治理平台DataWorks提供的一项数据服务功能,允许用户通过编写SQL查询数据源(如MySQL、PostgreSQL、Hologres、MaxCompute、ClickHouse等),将查询结果结合富文本或表格内容,定期自动推送至钉钉群、...

数据服务概述

数据推送:数据推送是阿里云大数据开发治理平台DataWorks提供的一项数据服务功能,允许用户通过编写SQL查询数据源(如MySQL、PostgreSQL、Hologres、MaxCompute、ClickHouse等),将查询结果结合富文本或表格内容,定期自动推送至钉钉群、...

标签工厂权限列表

Y Y N Y Y 查看实例详情&日志 Y Y N Y Y 补数据 Y Y N Y Y 回滚到该版本 Y Y N Y Y 删除版本 Y N N N Y 重跑实例 Y Y N Y Y 移除已申请离线标签 Y N N N-离线数据集 新建(保存并发布)&复制离线数据集 Y Y N N-编辑(保存&发布)离线数据...

数据同步

支持在离线数据同步、实时数据同步任务中引用已添加的数据模板,根据数据模板定义的数据结构执行数据同步任务。离线数据同步 支持单表离线任务、批量离线任务的新建。支持自定义选择已经注册的数据源端数据和目标端,支持多种常见离线同步...

功能简介

支持在离线数据同步、实时数据同步任务中引用已添加的数据模板,根据数据模板定义的数据结构执行数据同步任务。离线数据同步 支持单表离线任务、批量离线任务的新建。支持自定义选择已经注册的数据源端数据和目标端,支持多种常见离线同步...

同步数据

场景:以下SQL为Spark SQL,通过EMR Spark SQL节点创建的外部表ods_user_info_d_spark,用LOCATION来获取离线数据集成任务写入私有OSS对象存储Bucket的用户信息,并写入对应的dt分区。补充:DataWorks提供调度参数,可实现调度场景下,将...

核心能力

一站式大数据开发平台,提供一致性开发体验 一站式数据同步 支持离线/实时数据传输。周期同步任务调度统一管理。主流空间数据库全面支持同步汇聚(超图SDX+,ArcGIS SDE,PostGIS,Ganos)。自动灵活的数据探查 物理表预览和表数据自动探查...

同步数据

场景:以下SQL为Spark SQL,通过EMR Spark SQL节点创建的外部表ods_user_info_d_spark,用LOCATION来获取离线数据集成任务写入私有OSS对象存储Bucket的用户信息,并写入对应的dt分区。补充:DataWorks提供调度参数,可实现调度场景下,将...

标签工厂权限列表

Y Y N Y Y 移除已申请离线标签 Y N N N-离线数据集 新建(保存并发布)&复制离线数据集 Y Y N N-编辑(保存&发布)离线数据集 Y Y N N Y 删除离线数据集 Y N N N Y 查看离线数据集详情 Y Y Y Y Y 查看实例详情&运行日志 Y Y N N Y 下线离线...

【通知】DBS备份数据查询功能下线

该功能允许用户通过选择目标备份集并创建数据湖,在离线数据湖中使用SQL语句查询不同备份集中的数据。但随着DLA服务的停止,数据灾备(DBS)的备份数据查询功能也将于2024年05月起逐步下线。更多详情,请参见【通知】停止售卖云原生数据湖...

数据质量管理流程

数据质量的管理流程包括业务数据资产定级、加工卡点、风险点监控和及时性监控,您可以构建属于自己的...详情请参见 离线数据加工卡点校验。对数据风险点进行监控,包括数据的质量风险和及时性。详情请参见:数据质量风险监控 数据及时性监控

数仓开发任务流

配置DTS数据迁移节点 配置离线数据集成节点 数据开发 显示任务流中的数据开发节点:除数据集成节点之外的其他节点。数据开发节点,试运行和发布后的调度功能相同。任务类型介绍 配置DTS位点检查节点 表 数仓表可被其任务流引用并操作,您...

离线集成

解决企业复杂大数据批处理难题,支持企业精细化运营、数据营销、智能推荐等大数据业务场景。离线集成功能底层基于Spark开发,支持提升Hadoop平台运行速度的应用场景。说明 如果您在使用该功能的过程中有任何疑问或问题,请使用钉钉搜索钉钉...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用