大数据运作流程

_相关内容

离线集成

创建数据流程 操作步骤 登录 数据管理DMS 5.0。在顶部菜单栏中,选择 Data+AI 数据集成 离线集成。说明 若您使用的是极简模式的控制台,请单击控制台左上角的 图标,选择 全部功能 Data+AI 数据集成 离线集成。单击 新增数据流,输入 ...

什么是DataWorks

DataWorks是一站式智能大数据开发治理平台,适配阿里云MaxCompute、E-MapReduce、Hologres、Flink、AnalyticDB、StarRocks、PAI 等数十种大数据和AI计算服务,为数据仓库、数据湖、湖仓一体、Data+AI解决方案提供全链路智能化的数据集成、...

Data+AI和数据科学

为满足用户基于MaxCompute进行规模数据处理、分析、挖掘及模型训练的需求,MaxCompute提供了一套Python开发生态,让用户通过统一的Python编程接口一站式、高效地完成数据处理、加工及挖掘工作。发展路径 MaxCompute提供的Python开发生态...

大数据

购买 数据安全中心DSC(Data Security Center)实例后,在使用 DSC 检测大数据产品(包括TableStore、MaxCompute、AnalyticDB-MYSQL、AnalyticDB-PG)中存在的敏感数据或审计数据库等功能前,您需要先开启对应功能。前提条件 已开通数据...

实现开发生产等多套环境隔离

背景信息 很多企业用户在大数据的研发流程中有创建并隔离多套环境的需求,如创建并完全隔离开发、测试、生产环境,即各环境的数据物理存储地址、任务运行集群、大数据作业脚本均隔离,并对操作人员有严格的权限管控,如仅运维团队可使用...

技术架构选型

本教程中使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。整体架构图 完整的技术架构图如下图所示。其中,MaxCompute作为整个大数据开发过程中的离线计算引擎。DataWorks的数据集成负责完成数据的采集和基本...

什么是EMR Notebook

EMR Notebook是一个Serverless化的交互式数据分析和探索平台,满足大数据和AI融合下的数据处理需求,为数据工程师、数据分析师和数据科学家提供了可视化的应用程序开发环境。通过EMR Notebook可以完成对SQL、Python、Markdown等多种语言...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

DataHub数据

创建数据源 在进行数据同步任务开发时,您需要在DataWorks上创建一个对应的数据源,操作流程请参见 数据源管理,详细的配置参数解释可在配置界面查看对应参数的文案提示。数据同步任务开发 数据同步任务的配置入口和通用配置流程可参见下文...

数据导入

从阿里云对象存储OSS导入数据至图数据库GDB实例 图数据库GDB服务端集成有数据导入模块,可以获取您提供的.csv格式的OSS数据文件,并将其解析为图中的点数据和边数据,然后将点数据和边数据导入至图数据库GDB实例。步骤 步骤说明 ① 将需要...

产品生态

DM(达梦)数据源 Milvus数据源 TiDB数据源 DRDS(PolarDB-X 1.0)数据源 MongoDB数据源 TSDB数据源 Elasticsearch数据源 MySQL数据源 Vertica数据源 FTP数据源 OpenSearch数据源 TOS数据源 GBase8a数据源 Oracle数据源 HBase数据源 Graph ...

应用场景

阿里云EMR凭借弹性扩展的计算集群、多源异构数据融合治理以及实时流批一体处理等卓越能力,已经广泛应用于金融风控、电商精准营销、物联网时序数据处理等多个领域。本文为您介绍EMR在数据湖、数据分析、实时数据流、数据服务四个场景的典型...

网易有数BI连接MaxCompute

操作流程 网易有数BI连接MaxCompute的操作流程如下:步骤一:网易有数BI连接MaxCompute 通过配置连接参数,连接网易有数BI及MaxCompute项目。步骤二:网易有数BI可视化建模 创建数据模型,为后续进行数据可视化分析做准备。步骤三:使用...

DML无锁变更概览

DML无锁数据变更可以将单个SQL拆分成多个批次执行,能更好地满足业务方对大量数据变更的需求,例如历史数据清理、全表更新字段等,保证执行效率,减小对数据库性能、数据库空间等的影响。背景信息 当业务累积了大量数据时,需要定期清除表...

数据集成概述

5分钟快速了解 背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效地配置大量数据表的同步任务、能够集成多种异构数据源、能够实现对数据源的数据进行轻度预处理、能够实现数据同步任务的调优(例如容错、...

DMS数据管理预案助力业务大促

背景信息 大型活动期间,公司业务量可能出现幅度上涨,数据库的使用与数据安全管理将面临巨大挑战。例如如下场景:临近双十一,数据库即将面临一次访问流量上的大考。筹备业务大促期间,您可评估您现有数据库的使用情况,预估活动期间的...

数据库节点

DataWorks支持创建多种数据库节点,以便于SQL任务的开发、周期性调度及与其他作业的集成操作。前提条件 RAM账号添加至对应空间(可选)。进行任务开发的RAM账号已被添加至对应工作空间中,并具有 开发 或 空间管理员(权限较,谨慎添加)...

什么是数据资源平台

数据资源平台覆盖数据同步、数据标准建模及数据质量检查、数据开发、数据标签体系构建,基于标签数据的群体分析、专家业务模型构建、全流程任务监控告警、数据服务化、数据资产管理等核心能力,提供标准化程度高、易用性强的一站式大数据...

一键MaxCompute任务出错恢复

解决方法:进入 数据集成 同步任务 找到目标任务,单击 更多 修改配置 编辑全增量同步任务,可以通过先减表,提交执行流程,再加表,提交执行流程,触发此表的重新同步,跳过该表不支持的DDL。实时任务启动时,修改DDL策略,修改该类型的...

权限管理与规范化数据开发

本实践将基于DataWorks标准模式空间完成从“数据建模”到“数据生产”的基本流程,帮助您快速掌握规范化的数据体系建设流程,提升在数据开发过程中的规范性、安全性、稳定性。背景信息 DataWorks采取RBAC权限模型供用户管理DataWorks所有...

内置全密态能力

PolarDB PostgreSQL版(兼容Oracle)提供全密态数据库功能,数据在用户侧加密后传入数据库管理系统,数据明文对于数据库服务端不可见,实现了端到端的全程加密的数据强安全性。全密态云数据库是达摩院数据库与存储实验室的自研产品,可以...

SelectDB数据

创建数据源 在进行数据同步任务开发时,您需要在DataWorks上创建一个对应的数据源,操作流程请参见 数据源管理,详细的配置参数解释可在配置界面查看对应参数的文案提示。下面对SelectDB数据源的几个配置项进行说明:MySQL连接地址:请填写...

使用新版数据开发体验

通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站...

全增量同步任务运维

您可以在DataWorks 运维中心 的 查看周期实例 页面查看该同步任务Merge实例的执行情况,如果Merge任务和全量补数据操作产生冲突,您可以:暂停全量补数据操作,等待Merge任务执行完成后,再执行全量补数据操作。冻结即将运行的Merge实例,...

数据保护伞

使用流程 数据保护伞为您提供敏感数据规则配置、识别敏感数据、查看识别结果、处理敏感数据等管控流程,帮助您在敏感数据产生的事件前、中、后各阶段管控梳理项目中的敏感数据,保障数据安全。具体流程及相关功能介绍如下。步骤一:事前...

使用老版DataWorks

通过本教程,您可以了解如何使用DataWorks和EMR Serverless Spark产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从...

使用旧版数据开发体验

通过本教程,您可以了解如何使用DataWorks和Spark产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站行为中...

使用新版DataWorks

通过本教程,您可以了解如何使用DataWorks和EMR Serverless Spark产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从...

DML操作

目录 插入单条数据 插入多条数据 单值分区表插入数据 修改数据-单条数据 修改数据-用查询结果批量修改 说明 若您需对Dataphin中逻辑表进行DML操作,请参见 逻辑表DML操作。插入单条数据 INSERT INTO table_name VALUES(value1,value2,value...

使用旧版数据开发体验

通过本教程,您可以了解如何使用DataWorks和EMR产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站行为中获取...

使用新版数据开发体验

通过本教程,您可以了解如何使用DataWorks和Spark产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站行为中...

数据保护机制

注意事项 设置Exception Policy可能存在TOCTOU(Time-of-Check to Time-of-Use)数据泄露问题(即Race Condition问题):问题描述 假设,用户的数据流出流程如下:(TOC阶段)用户A向项目所有者申请导出表t1的数据。项目所有者对t1的数据...

使用新版数据开发体验

通过本教程,您可以了解如何使用DataWorks和EMR产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站行为中获取...

使用旧版数据开发体验

通过本教程,您可以了解如何使用DataWorks和StarRocks产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站行为...

使用新版数据开发体验

通过本教程,您可以了解如何使用DataWorks和StarRocks产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站行为...

使用旧版数据开发体验

通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站...

使用旧版数据开发体验

通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站...

使用新版数据开发体验

通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站...

数据集成操作指导

支持的源和目标数据数据集成支持的源数据库和目标数据库与数据迁移支持的数据库相同。数据集成的基本步骤 您可以通过以下步骤来创建和管理数据集成任务。步骤 说明 设置网络环境 在使用DTS进行数据集成之前,您必须确保DTS服务器可以...

数据分析作业

MaxCompute是适用于数据分析场景的企业级SaaS模式云数据仓库,支持在多种工具上使用MaxCompute运行大数据计算分析作业。如果您需要进行简单的查询等数据分析作业,推荐您使用SQL查询或DataWorks的临时查询等工具,高效便捷地完成数据分析...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用