整合数据平台

_相关内容

开源大数据平台 E-MapReduce

开源大数据平台E-MapReduce(Elastic MapReduce)是运行在阿里云平台上的一种大数据处理的系统解决方案。

DataWorks交流钉钉群

DataWorks作为阿里云大数据平台操作系统,对接各种大数据计算引擎,以all in one box的方式提供专业高效、安全可靠的全域智能大数据平台,高效率完成数据全链路研发流程,建设企业数据治理体系,同时提供优质高效的交流服务,本文为您介绍...

BI工具集成

本章节展示如何将BI工具与大数据平台集成,构建高效的数据可视化解决方案。使用Power BI连接EMR Serverless Spark并进行数据可视化

应用场景

建立数据平台 得益于其开放式架构设计,EMR Serverless Spark极大地简化并提升了在数据湖环境中对结构化和非结构化数据进行高效分析处理的能力。EMR Serverless Spark不仅集成了任务调度系统,使得您能够便捷地构建与管理数据ETL流程,轻松...

01创建解决方案

已创建“全域数据平台”应用,具体操作,请参见 新建API归属应用。已创建“银行客户根据证件号码查询”API,具体操作,请参见 新建API-向导模式。背景信息 根据应用关联对应资源信息,包括服务、物理表、逻辑表、场景、场景节点、单节点、...

Paimon

目前阿里云开源大数据平台E-MapReduce常见的计算引擎(例如Flink、Spark、Hive或Trino)都与Paimon有着较为完善的集成度。您可以借助Apache Paimon快速地在HDFS或者云端OSS上构建自己的数据湖存储服务,并接入上述计算引擎实现数据湖的分析...

DataWorks On CDP/CDH使用说明

CDP是跨平台收集和整合客户数据的公共数据平台,可帮助您收集实时数据,并将其构建为单独的用户数据使用。您可在DataWorks中注册CDH及CDP集群,基于业务需求进行相关任务开发、调度、数据地图(元数据管理)和数据质量等一系列的数据开发和...

产品简介

预案演练:帮助客户在阿里云大数据平台上进行核心业务无损、风险可控的预案演练(容灾、扩容、缩容等集群维护动作)、培养平台运维团队的预案处置能力,发现并解决系统与平台的稳定性隐患。(仅限混合云)。容灾演练:帮助客户基于阿里云大...

创建及管理来源系统

数据应用层:包含整合后的主题数据,提供面向分析和报表的整合数据,通常以多维模型的形式呈现,支持各种分析和报表需求。数据服务(API):通过API等方式将数据提供给不同的应用程序和服务,支持企业内部和外部的数据访问需求。报表应用:...

创建及管理来源系统

数据应用层:包含整合后的主题数据,提供面向分析和报表的整合数据,通常以多维模型的形式呈现,支持各种分析和报表需求。数据服务(API):通过API等方式将数据提供给不同的应用程序和服务,支持企业内部和外部的数据访问需求。报表应用:...

综合:网站用户画像分析

计算引擎 云原生大数据计算服务MaxCompute 本案例中,基于DataWorks使用 云原生大数据计算服务MaxCompute、开源全托管服务EMR Serverless StarRocks、开源大数据平台 E-MapReduce 或 开源全托管服务EMR Serverless Spark 中的任意一种作为 ...

项目分配与安全

在为企业级大数据平台创建项目时,建议您对ODS层、DWD及DWS层的数据按照业务板块的粒度建立项目,对于ADS层的数据,按照应用的粒度建立项目。项目分配 在本教程中,建议参考下图建立您的MaxCompute项目,图中的每一个方块代表一个项目。...

基于MaxCompute进行大数据BI分析

通过MaxCompute、AnalyticDB MySQL强大的数据加工和分析能力,降低大数据平台建设的门槛,轻松解决了海量数据的计算问题。同时有效降低企业成本,并保障数据安全。与第三方开源生态无缝对接,在不侵入用户应用的情况下,传输日志至日志服务...

Data+AI概览

您也可以将这些功能作为基础能力集成到您自己的数据平台中使用,建设属于企业独有的数据平台。产品优势 流批一体技术,支持20多种数据实时、离线集成。低代码开发。100%兼容Flink、Spark。支持链路及开发过程中的数据安全。分钟级调度。多...

产品形态选型

阿里云开放的大数据平台 E‑MapReduce(EMR)提供了多种产品形态,以满足不同用户的业务需求。根据部署方式可分为 EMR Serverless Spark、EMR Serverless StarRocks、EMR on ECS 和 EMR on ACK。为帮助用户选择合适的产品,以下整理了各产品...

什么是EMR Serverless Spark

该产品为企业提供了一站式的数据平台服务,包括任务开发、调试、调度及运维等功能,显著简化了数据处理与模型训练的全流程。同时,它100%兼容开源Spark生态,能够无缝集成到客户现有的数据平台。通过使用EMR Serverless Spark,企业可以...

ClickHouse

开源大数据平台E-MapReduce(简称EMR)的ClickHouse提供了开源OLAP分析引擎ClickHouse的云上托管服务。EMR ClickHouse完全兼容开源版本的产品特性,同时提供集群快速部署、集群管理、扩容、缩容和监控告警等云上产品功能,并且在开源的基础...

什么是EMR on ACK

阿里云E-MapReduce(简称EMR)on ACK提供了全新构建大数据平台的方式。您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注...

选择业务场景

若您的业务需集成特定组合的组件,您可创建自定义集群,灵活组合EMR提供的组件,打造适配业务特性的大数据平台。本文将为您介绍这些集群的区别,帮助您快速选型。业务场景选型 业务场景(集群类型)支持的组件 核心能力 适用场景 数据湖...

应用场景

解决方案 DataWorks 联合 MaxCompute、Hologres 等云原生大数据引擎,提供一套 湖仓一体、流批融合 的一站式智能数据平台解决方案,帮助企业打破数据处理的时效壁垒。统一的数据接入与分层 通过 DataWorks 数据集成(Data Integration),...

DataWorks模块使用指引

数据上云与集成:使用 数据集成 模块将源业务系统的数据采集至大数据平台。支持离线(批量)、实时(流式)、全量及增量等多种同步方式。规范模型设计:在进行大规模数据开发前,进行规范化的模型设计,以保证数据体系的有序与可维护性。此...

运营

数据资产编目,数据管理者对平台数据资产进行梳理,确定其共享属性,并按照技术标准,进行数据类目定义。数据资产上线,将已经注册管理的高质量数据资产资源发布,供数据使用者查询和使用。数据资产申请,数据使用者向数据管理方提出使用...

功能简介

数据资产编目,数据管理者对平台数据资产进行梳理,确定其共享属性,并按照技术标准,进行数据类目定义。数据资产上线,将已经注册管理的高质量数据资产资源发布,供数据使用者查询和使用。数据资产申请,数据使用者向数据管理方提出使用...

数据服务

数据服务作为统一的数据服务出口,实现了数据的统一市场化管理,有效地降低数据开放门槛的同时保障了数据开放安全。5分钟快速了解 前提条件 已购买 数据服务 增值服务并且当前租户已开通 数据服务 模块。功能说明 因Dataphin数据源功能已...

数据服务概述

数据服务作为统一的数据服务出口,实现了数据的统一市场化管理,有效地降低数据开放门槛的同时,保障了数据开放的安全。5分钟快速了解 前提条件 已购买 数据服务 增值服务,开通Dataphin 功能说明 因Dataphin数据源功能已下线,您可以使用...

亿海蓝-航运大数据的可视化案例

方案亮点:千亿级船舶轨迹时空分析、多元时空数据整合、开发周期短。客户感言“阿里 Ganos 产品很好地提升了我们对异构时空数据的处理能力。Lindorm高性能、低延迟、高吞吐、稳定性让我们节省了不少运维投入,更多精力投入到业务实现上。...

Hadoop集群迁移至DataLake集群

背景信息 E-MapReduce(简称EMR)新版控制台是EMR发布的下一代云原生开源大数据平台,为用户提供全新平台体验、全新开发平台、全新资源形态和全新分析场景。新版控制台的功能特点,详情请参见 EMR新版控制台上线公告。EMR on ECS作为EMR...

添加DataV Atlas地理数据服务

多源数据整合:支持快速集成不同格式的地理数据(CSV、TSV、GeoJSON、SHP),提升数据管理能力。前提条件 开通DataV Atlas服务。DataV Atlas产品中创建项目、发布数据服务并添加数据服务令牌,请参见 创建及管理项目、数据服务管理、数据...

ApsaraDB For OceanBase数据

实时读 OceanBase为分布式关系型数据库,可以将物理分布不同的多个数据库上的数据整合为一个完整的逻辑数据库。但实时同步OceanBase的数据至 AnalyticDB for MySQL,目前仅支持同步单个物理库的数据,不支持同步逻辑库数据。说明 在整库...

什么是DataWorks

将阿里所有的数据整合到云梯2,打造集团统一数据平台。第三阶段(2018)数据中台支撑业务可持续发展 数据驱动业务发展:小二(运营人员)覆盖用户生命周期的精细化运营策略。实现个性化的智能营销。“生意参谋”探索数据业务化。业务走向实时...

客户案例

价值体现 从大数据平台上云整体“降本增效”的方案快速切入,迁移到大数据MaxCompute、实时计算、DataWorks后,部分任务有10倍以上的性能提升,存储从自建Hadoop 3PB降到900T,利用Flink实时数据处理能力,将宝宝树现有的场景实时化(...

Cloudera CDP 企业数据平台

企业数据云平台Cloudera Data Platform(简称阿里云CDP),是阿里云和Cloudera联合打造阿里云上的大数据平台

购买及登录数据资源平台

使用数据资源平台时,需先购买并登录数据资源平台。本文为介绍如何购买及登录数据资源平台。前提条件 已创建阿里云账号,具体操作,请参见 创建阿里云账号。背景信息 数据资源平台账号登录体系与阿里云保持一致。购买数据资源平台数据...

数据资源平台

阿里云数据资源平台是构建数据智能的全流程平台,提供数据汇聚、规范设计、指标与标签体系构建、数据质量管控、数据资产管理、数据资产服务与共享、智能分析等核心功能,支持行业知识内容沉淀,帮助金融、政府及企业客户快速构建智能数据中...

什么是阿里云Cloudera CDP

企业数据云平台Cloudera Data Platform(简称阿里云CDP),是阿里云和Cloudera联合打造的阿里云上的大数据平台。前置概念 阅读本文前,您可能需要了解如下概念:什么是边缘计算?什么是人工智能(AI)?什么是SQL?Cloudera CDP企业数据云...

新建API归属应用

创建归属应用以备创建API时使用。本文介绍如何新建API应用。...已创建“信息中心(xxzx)”工作组,具体操作...配置项 示例 应用名称 全域数据平台 应用code qysjpt 应用描述 创建数据API归属的应用 预期结果 在 应用管理 列表可查看新建的应用。

到期提醒与停机策略

本文将为您介绍数据资源平台的到期提醒与停机策略。到期提醒 数据资源平台实例到期前的168小时(7天)、72小时、24小时,系统将会给您发短信,提醒您所购买的实例即将到期。请您及时备份数据或续费,避免影响正常使用。停机策略 数据资源...

产品服务等级协议

本服务等级协议(Service Level Agreement,以下简称“SLA”)约定了阿里云向客户提供的数据资源平台的服务可用性等级指标及赔偿方案。特别提示您,除非另有约定,本协议不适用于数据资源平台公测、邀测、免费的功能及版本,也不适用于数据...

购买指引

本文为您介绍数据资源平台实例售卖支持的地域、版本及购买时长。背景信息 购买数据资源平台前,请您了解以下几点:购买前建议您先联系阿里云 售前咨询 并提供企业数据建设需求及背景信息。待阿里云售前咨询帮您确认数据资源平台当前版本及...

入门概述

快速入门简要介绍了如何快速上手数据资源平台,包括不限于数据的接入、治理、建模等。本文介绍数据资源平台入门概述。快速使用说明 准备工作:在使用数据资源平台前,需要完成的准备工作,具体操作,请参见 创建阿里云账号 和 购买及登录...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用