阿里大数据平台

_相关内容

通过大数据平台搭建设备监控大屏

本文介绍如何对接物联网平台和阿里大数据平台,以实现设备数据分析、统计、计算和可视化实时展示。前提条件 开通、购买相关阿里云产品实例和计算资源。使用阿里大数据平台处理物联网平台设备相关数据,涉及多个阿里云产品,包括 云数据...

快速体验

数据存储与计算:云原生数据计算服务 MaxCompute(必选)、实时数仓Hologres(可选)、开源大数据平台E-MapReduce(可选),您可根据需要开通MaxCompute、Hologres或E-MapReduce。数据开发与调度:数据开发治理平台 DataWorks数据...

Alibaba Cloud Linux 3软件兼容性列表

数据库 GoldenDB分布式数据库 V6 金篆信科有限责任公司 数据库 MariaDB 10.5.22 开源组件 数据库 MongoDB 3.6.8 开源组件 数据库 MySQL 8.0.36 开源组件 数据库 PostgreSQL 13.16 开源组件 数据库 Redis 6.2.7 开源组件 大数据平台 阿里云...

DataWorks交流钉钉群

DataWorks作为阿里大数据平台操作系统,对接各种数据计算引擎,以all in one box的方式提供专业高效、安全可靠的全域智能大数据平台,高效率完成数据全链路研发流程,建设企业数据治理体系,同时提供优质高效的交流服务,本文为您介绍...

产品简介

大数据专家服务(Bigdata Expert Service)是由阿里大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户构建和持续优化的...

通用数据开发

说明 上图中,虚线框内的开发流程均可基于阿里大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的数据,存储在业务系统所对应的数据库中,包括MySQL、Oracle和RDS等类型。数据收集与存储:您需要同步...

什么是DataWorks

获奖经历 IDC:大数据平台公共云市场份额中国第一 Forrester:全球云数据仓库卓越表现者象限,国内唯一 中国信通院:首个通过577项技术要求的数据平台整体解决方案评测 中国电子学会科技进步特等奖 中国国际软件博览会金奖 浙江省科技进步...

Paimon概述

目前阿里云开源大数据平台E-MapReduce常见的计算引擎(例如Flink、Spark、Hive或Trino)都与Paimon有着较为完善的集成度。您可以借助Apache Paimon快速地在HDFS或者云端OSS上构建自己的数据湖存储服务,并接入上述计算引擎实现数据湖的分析...

Cloudera CDP 企业数据平台

企业数据云平台Cloudera Data Platform(简称阿里云CDP),是阿里云和Cloudera联合打造阿里云上的大数据平台

应用场景

阿里云开源大数据平台E-MapReduce(简称EMR)具有广泛的应用场景。本文为您介绍EMR的主要应用场景。数据湖场景 DataLake集群类型提供了数据湖分析场景所需的服务和相关湖格式,包括Hadoop、OSS-HDFS、Hive、Spark、Presto等。通过选择OSS-...

什么是阿里云Cloudera CDP

企业数据云平台Cloudera Data Platform(简称阿里云CDP),是阿里云和Cloudera联合打造的阿里云上的大数据平台。前置概念 阅读本文前,您可能需要了解如下概念:什么是边缘计算?什么是人工智能(AI)?什么是SQL?Cloudera CDP企业数据云...

什么是开放平台

阿里云工业开放平台是基于阿里大数据的一体化计算平台,通过数据工厂对企业系统数据、工厂设备数据、传感器数据、人员管理数据等多方工业企业数据进行汇集,并借助图像、视频识别、机器学习和人工智能算法,来激活海量数据价值。...

实验介绍

重要 该案例是基于DataWorks使用 开源大数据平台 E-MapReduce、云原生数据计算服务MaxCompute、开源全托管服务EMR Serverless StarRocks 或 开源全托管服务EMR Serverless Spark 这四种产品其一为数据源操作的,确保拥有其一即可。...

数据治理能力解读

以下为您系列讲解阿里数据治理能力解读。数据治理的产品介绍 主要产品:DataWorks 课程时长:25分钟 DataWorks数据治理能力的最佳实践 主要产品:DataWorks、MaxCompute 课程时长:19分钟

计算设置概述

华为 FusionInsight 8.x Hadoop 华为推出的基于Apache开源社区软件进行功能增强的企业级数据存储、查询和分析的大数据平台。亚信DP5.3 Hadoop 基于开源生态,依托电信级技术能力构建的数据生产运营一体化支撑平台。星环ArgoDB ...

开源大数据平台 E-MapReduce

开源大数据平台E-MapReduce(Elastic MapReduce)是运行在阿里云平台上的一种数据处理的系统解决方案。

大数据开发治理平台 DataWorks

大数据开发治理平台 DataWorks基于MaxCompute/EMR/MC-Hologres等大数据计算引擎,为客户提供专业高效、安全可靠的一站式大数据开发与治理平台,自带阿里巴巴数据中台与数据治理最佳实践,赋能各行业数字化转型。每天阿里巴巴集团内部有数万...

ETL工作流快速体验

案例提供的数据仅用于阿里大数据开发治理平台DataWorks数据应用体验。仅 空间管理员 角色可导入ETL模板至目标工作空间。如需给账号授予空间管理员角色,请参见 空间级模块权限管控。导入ETL工作流模板 您可以将DataWorks ETL工作流模板...

功能特性

离线数据集成(DataWorks+MaxCompute)可以将数据服务中的平台系统表、产品属性时序表、产品事件表和自定义存储表数据,集成到阿里大数据开发治理平台(DataWorks)中构建数据仓库,以提升数据应用效率。实时数据集成(Flink版)可以将...

准备环境

本教程提供数据仅作为阿里大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据,并且只支持在数据集成模块读取数据。在 私有OSS环境准备 步骤中创建的OSS对象存储的 Bucket 将用于接收MySQL数据源的用户信息数据与...

数据建模新能力解读

以下为您系列讲解阿里云智能数据建模新能力解读。数据建模的发展背景 主要产品:DataWorks 课程时长:5分钟 当前主流的数据建模方法论 主要产品:DataWorks 课程时长:4分钟 数据建模的主要能力解读 主要产品:DataWorks 课程时长:22分钟 ...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...

产品简介

它为企业提供了一站式的数据平台服务,包括任务开发、调试、调度和运维等,极地简化了数据处理的全生命周期工作流程。使用EMR Serverless Spark,企业可以更专注于数据分析和价值提炼,提高工作效率。关于EMR Serverless Spark的更多介绍...

阿里云电子政务云产品全家福

阿里云电子政务云平台提供弹性计算类、网络、数据库、存储、大数据、中间件、IoT等品类丰富的产品及高标准的安全合规服务,用以支撑多种政务类业务场景,例如:城市大脑,合规应用平台等。截至文档发布时间,阿里云电子政务云共计上线95款...

大数据AI公共数据集分析

教程简介 阿里云DataWorks基于多种大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。本教程通过DataWorks,联合云原生大数据计算服务MaxCompute,使用大数据AI公共数据集(淘宝、飞猪、阿里音乐、...

常见问题

1.售前咨询渠道 尊敬的“准”大数据专家服务用户您好:如果您准备购买阿里大数据专家服务,但是遇到如服务范围、规格、服务选择等售前方面的问题,您可以通过钉钉与我们联系,您将“当面”获得阿里大数据专家咨询专家的建议。...

EMR数据开发停止更新公告

作为一站式大数据开发治理平台,DataWorks沉淀阿里巴巴十多年大数据建设方法论,为客户完成从入湖、建模、开发、调度、治理、安全等全链路数据湖开发治理能力,帮助客户提升数据的应用效率。迁移流程 阿里云DataWorks on EMR团队提供了完善...

客户案例

阿里妈妈 公司介绍 阿里妈妈广告业务主要是一种 P4P(Pay for Performance)形式的广告业务系统,而报表中心作为阿里妈妈向广告主透出广告效果数据的唯一平台,在阿里巴巴大平台丰富多样的商业场景下,为客户提供优质,高效,可靠的数据...

技术架构选型

本教程中使用阿里大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

网络方案概述

使用阿里云Dataphin可以实现零部署成本、零运维成本构建智能大数据研发与治理平台。使用阿里云Dataphin时,若已有的数据源部署在本地IDC机房,首先需要打通本地IDC机房与阿里云Dataphin网络。本文将介绍本地IDC机房数据源与阿里云Dataphin...

网络方案概述

使用阿里云Dataphin可以实现零部署成本、零运维成本构建智能大数据研发与治理平台。使用阿里云Dataphin时,若已有的数据源部署在本地IDC机房,首先需要打通本地IDC机房与阿里云Dataphin网络。本文将介绍本地IDC机房数据源与阿里云Dataphin...

阿里云主账号访问

本文以同阿里云主账号下的DataWorks资源组与数据源(目标网络环境下的数据库、数据服务或其他数据)为例,介绍如何进行网络连通。背景信息 网络连通方案选择取决于数据源与DataWorks工作空间资源组之间的环境关系。详情请参见 网络连通方案...

阿里云主账号访问

本文以同阿里云主账号下的DataWorks资源组与数据源(目标网络环境下的数据库、数据服务或其他数据)为例,介绍如何进行网络连通。背景信息 网络连通方案选择取决于数据源与DataWorks工作空间资源组之间的环境关系。详情请参见 网络连通方案...

注册EMR集群至DataWorks

背景信息 开源大数据开发平台 E-MapReduce(简称EMR),是运行在阿里平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还...

核心能力

数据资源平台提供了一站式数据资产定义、生产、管理与服务平台,提供企业级数据资产构建能力和一致性使用体验,助力客户快速构建数据智能平台,实现数据资源统一管理,挖掘潜在规律,优化业务决策,让大数据真正的驱动客户业务。...

客户案例

解决方案 玩物得志基于阿里云DataWorks+MaxCompute框架搭建大数据平台,使用其核心存储、计算等组件、上层可视化及业务查询能力,在开源方案的基础上进行了二次开发。解决方案架构如下。详细案例信息,请参见 玩物得志案例。互联网社交案例...

迁移方案概览

数据迁移功能帮助您实现同构或异构数据源之间的数据迁移,适用于数据上云迁移、阿里云内部跨实例数据迁移、数据库拆分扩容等业务场景。本文将介绍数据迁移功能支持的数据库、版本和迁移类型,以及具体的配置文档。说明 数据迁移在某些场景...

数据资源平台

阿里数据资源平台是构建数据智能的全流程平台,提供数据汇聚、规范设计、指标与标签体系构建、数据质量管控、数据资产管理、数据资产服务与共享、智能分析等核心功能,支持行业知识内容沉淀,帮助金融、政府及企业客户快速构建智能数据中...

上海新能源汽车车辆基础数据

客户感言 2019年开始上海市新能源汽车大数据平台从自建Hadoop集群迁移至阿里云Lindorm+DLA Spark产品,有效解决了我们平台存储和计算的横向动态扩容瓶颈,同时借助其产品中间件LTS实现了我们平台数据的冷热分离,有效降低了数据存储成本,...

Elasticsearch数据迁移至MaxCompute

本文为您介绍如何通过DataWorks数据同步功能,迁移阿里云Elasticsearch集群上的数据至MaxCompute。前提条件 已开通MaxCompute服务。开通指导,详情请参见 开通MaxCompute和DataWorks。已开通DataWorks服务。开通指导,详情请参见 开通...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用