开源数据中台

_相关内容

通过控制台访问开源组件Web界面

本文将介绍如何设置安全组规则和访问链接,以便查看集群中开源组件的UI界面。说明 开源组件Web界面访问方式选择,请参见 查看开源组件 Web 界面。前提条件 已创建E-MapReduce集群,详情请参见 创建集群。进入访问链接与端口 您可进入 访问...

SSH隧道访问开源组件Web界面

除了通过EMR控制提供的链接地址访问开源组件Web界面外,还可通过SSH隧道方式进行安全访问。通过SSH隧道和SOCKS代理,您可在不暴露集群内部网络结构的情况下访问开源组件Web界面。说明 开源组件Web界面访问方式选择,请参见 查看开源组件 ...

查看开源组件 Web 界面

在EMR集群,为了确保集群安全,Hadoop、Spark和Flink等开源组件的Web界面端口均未对外开放。如果您想直接访问开源组件的Web界面,可根据实际场景选择 原生UI地址、Knox代理地址、SSH本地端口转发 或 SSH动态端口转发 方式进行访问。快速...

SmartData常见问题

JindoFS是阿里云开源数据E-MapReduce产品提供的一套Hadoop文件系统,主要对Hadoop和Spark大数据生态系统使用阿里云OSS提供多层次的封装支持和优化。基础功能提供适配OSS和支持访问,您可以直接使用JindoFS SDK;标准功能针对OSS提供分布...

快速使用EMR Notebook

EMR Notebook提供了全托管的兼容开源Jupyter的Notebook服务,同时内置了SQL Editor的功能。支持SparkSQL、Hive、StarRocks、PySpark等应用程序的开发和运行。本文以Hive查询为例,为您介绍如何使用EMR Notebook。前提条件 已完成系统角色...

EMR Spark功能增强

阿里云E-MapReduce产品构建于阿里云云服务器ECS上,基于开源的Apache Hadoop和Apache Spark,做了大量优化。本文为您介绍E-MapReduce(简称EMR)Spark相对开源增强的功能。背景信息 阿里云EMR 100%采用社区开源组件,随开源版本升级迭代,...

Hive

Hive是一个基于Hadoop的数据仓库框架,在大数据业务场景,主要用来进行数据提取、转化和加载(ETL)以及元数据管理。Hive结构 名称 说明 HiveServer2 HiveQL查询服务器,可以配置为Thrift或者HTTP协议,接收来自JDBC客户端提交的SQL请求...

Flink(VVR)作业配置

EMR-3.27.x及之前版本使用Flink社区开源版本,EMR-3.27.x之后版本使用完全兼容开源Flink的企业版(VVR)。本文介绍如何配置Flink(VVR)类型的作业。背景信息 Flink企业版由Apache Flink创始团队官方出品,拥有全球统一商业化品牌。VVR提供...

使用JindoFS加速OSS文件访问

背景信息 Fluid是一个开源的Kubernetes原生的分布式数据集编排和加速引擎,主要服务于云原生场景下的数据密集型应用,例如大数据应用和AI应用等。有关Fluid的更多介绍,请参见 数据加速Fluid概述。JindoRuntime来源于阿里云EMR团队JindoFS...

示例项目使用说明

集群运行 开源项目运行示例如下:Spark SparkWordCount:spark-submit-class SparkWordCount examples-1.0-SNAPSHOT-shaded.jar inputPath outputPath numPartition 参数说明如下:参数 描述 inputPath 输入数据路径。outputPath 输出路径...

什么是EMR Serverless Spark

同时,它100%兼容开源Spark生态,能够无缝集成到客户现有的数据平台。通过使用EMR Serverless Spark,企业可以更加专注于数据处理分析及模型训练的优化,从而提升工作效率。前置概念 阅读本文前,您可能需要了解如下概念:什么是云原生?...

Kafka Manager

操作步骤 使用SSH隧道方式访问Web页面,详情请参见 通过SSH隧道方式访问开源组件Web UI。说明 建议您首次使用Kafka Manager时修改默认密码。为了防止8085端口暴露,建议使用SSH隧道方式来访问Web界面。如果使用 http://localhost:8085 方式...

EMR Serverless Spark商业化公告

产品优势如下:云原生极速计算引擎 内置Fusion Engine(Spark Native Engine),相对开源版本性能提升300%。内置Celeborn(Remote Shuffle Service),支持PB级Shuffle数据,计算资源总成本最高下降30%。开放化的数据湖架构 支持计算存储分离...

快速使用EMR Workflow

EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据仓库,并为生产任务的稳定运行提供保障。本文以...

EMR Serverless StarRocks商业化发布

EMR Serverless StarRocks介绍 EMR Serverless StarRocks是开源StarRocks在阿里云上的全托管服务,您可以通过其灵活地创建和管理实例以及数据。本文为您介绍StarRocks的核心特性,并详述EMR Serverless StarRocks在此基础之上所引入的诸多...

HDFS Web UI介绍

访问HDFS Web UI 您可以通过SSH隧道和控制两种方式访问HDFS Web UI,具体操作请参见 通过SSH隧道方式访问开源组件Web UI 和 访问链接与端口。NameNode服务地址 版本 访问地址 说明 hadoop 3.x http://${namenode_hostname}:9870${...

JindoSDK下载安装和升级

JindoSDK提供了丰富的API和功能,简化了在应用程序集成和使用这些数据服务的过程。JindoSDK 查询版本 如:jindosdk-6.5.6-linux ls-l/opt/apps/JINDOSDK 版本说明 不同版本的功能可能存在差异,请选择适合的版本进行使用。详情请参见 ...

EMR Workflow商业化公告

EMR Workflow介绍 EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据仓库,并为生产任务的稳定运行...

快速使用EMR on ACK

kubectl apply-f spark-pi.yaml-namespace 集群对应的namespace 本文示例代码的 集群对应的namespace,需要替换为集群的命名空间,您可以登录E-MapReduce on ACK控制,在 集群详情 页面查看。返回如下信息。sparkapplication....

支持倚天云服务器

阿里云E-MapReduce支持使用倚天云服务器构建开源数据集群。适用客户 全网用户 新增功能/规格 阿里云E-MapReduce(简称EMR)支持使用倚天云服务器构建开源数据集群。与现有X86架构实例体验完全相同的情况下,具有更高的性价比,帮助用户...

DLF-Auth

DLF-Auth组件是数据湖构建DLF(Data Lake Formation)产品提供的,通过该组件可以开启数据湖构建DLF的数据权限功能,可以对数据库、数据表、数据列、函数进行细粒度权限控制,实现数据湖上统一的数据权限管理。本文为您介绍如何开启DLF-...

E-MapReduce Serverless StarRocks服务等级协议(SLA...

2023年6月1日起,E-MapReduce Serverless StarRocks服务等级协议(SLA)生效。详情请参见 开源数据平台E-MapReduce Serverless服务等级协议。

组件操作

HDFS概述 HDFS常用命令 JVM内存调优 HBase HBase是一种分布式、面向列的开源数据库,其基于Hadoop文件系统构建,旨在为大型数据集提供低延迟的随机读写访问和高可靠性存储。使用HBase快照 使用HBase Shell 常见问题和故障诊断 Celeborn ...

Paimon

目前阿里云开源数据平台E-MapReduce常见的计算引擎(例如Flink、Spark、Hive或Trino)都与Paimon有着较为完善的集成度。您可以借助Apache Paimon快速地在HDFS或者云端OSS上构建自己的数据湖存储服务,并接入上述计算引擎实现数据湖的分析...

新版监控诊断功能发布

EMR on ECS发布基于大模型构建的新版监控诊断功能 适用客户 全网用户 新增功能/规格 EMR on ECS新版监控诊断是基于大模型构建的智能运维辅助功能,结合了阿里云EMR团队在开源数据领域的知识经验、阿里云EMR可观测能力和技术专家的诊断...

授权信息

操作(Action)下表是 开源数据平台 E-MapReduce 定义的操作,这些操作可以在 RAM 权限策略语句的 Action 元素使用,用来授予执行该操作的权限。下面对表的具体项提供说明:操作:是指具体的权限点。API:是指操作对应的 API 接口。...

连接外部元数据

本章节介绍如何连接外部元数据服务,确保数据湖和数据仓库的元数据一致性。连接外部Hive Metastore Service

EMR与自建Hadoop集群对比优势

与自建Hadoop集群相比,开源数据开发平台EMR提供弹性资源管理和自动化运维,降低运维复杂度,通过用户管理、数据加密和权限管理等为数据安全保驾护航,同时EMR集成了丰富的开源组件并打通开源生态与阿里云生态,便于快速搭建大数据处理和...

Hive访问TableStore数据

本文通过示例为您介绍EMR Hive作业如何处理TableStore数据。前提条件 已创建DataLake集群,详情请参见 创建集群。已登录集群,详情请参见 登录集群。已获取下方JAR包并上传到集群。JAR包名称 获取方法 参考下载链接 emr-tablestore-X.X...

授权信息

操作(Action)下表是 开源数据平台 E-MapReduce 定义的操作,这些操作可以在 RAM 权限策略语句的 Action 元素使用,用来授予执行该操作的权限。下面对表的具体项提供说明:操作:是指具体的权限点。API:是指操作对应的 API 接口。...

准备环境

说明 该 私有OSS数据源 指的是您自己的 OSS对象存储 创建的OSS数据源,用来存储从DataWorks文档提供的MySQL导入的用户信息数据与存储从DataWorks文档提供的OSS对象存储创建的HttpFile数据导入的日志数据。在 管理中心 页面,单击进入...

授权信息

操作(Action)下表是 开源数据平台 E-MapReduce 定义的操作,这些操作可以在 RAM 权限策略语句的 Action 元素使用,用来授予执行该操作的权限。下面对表的具体项提供说明:操作:是指具体的权限点。API:是指操作对应的 API 接口。...

准备环境

业务背景 为了更好地制定企业经营策略,现需要从用户网站行为获取网站用户群体基本画像数据,例如,用户群体的地理属性、社会属性等,实现定时定点进行画像分析,进而实现网站流量精细化运营操作。操作前须知 为了顺利进行教程操作,请您...

Shell

开源Zeppelin相比,E-MapReduce(简称EMR)数据开发集群的Shell解释器支持在不同EMR集群环境里切换。本文通过示例为您介绍如何在Zeppelin使用Shell。使用示例 运行hadoop命令 执行如下命令会显示当前EMR集群根目录下的所有文件,切换...

EMR on ACK商业化公告

您可以将开源数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注大数据任务本身。收费标准 阿里云EMR on ACK正式商业化后,将根据集群...

通过DataWorks连接StarRocks实例

登录 DataWorks控制,切换至目标地域,单击左侧导航栏的 数据集成 数据集成,在下拉框选择对应工作空间后单击 进入数据集成。在左侧导航栏单击 数据源,然后单击 新增数据源。新增StarRocks数据源。在 新增数据源 的搜索栏,输入并...

EMR Serverless StarRocks服务等级协议更新

开源数据平台E-MapReduce Serverless服务等级协议》已于2024年02月02日修订,并将于2024年03月01日生效。当前服务等级协议详情,请在 服务等级协议 查看。变更生效时间 2024年03年01日 变更范围 EMR Serverless StarRocks(标准版)...

性能测试

写入耗时的测试结果如下:数据库 写入耗时 云原生多模数据库 Lindorm Ganos 引擎 7分钟 开源GeoMesa(HBase)13分钟 云数据库MongoDB分片集群 34分钟 创建时空索引后的时空数据存储空间占用情况 创建时空主键索引场景,Lindorm Ganos ...

数据可视化展现

登录 DataWorks控制,切换至目标地域后,单击左侧导航栏的 数据分析与服务 数据分析,单击 进入数据分析 页面,单击左侧导航栏的 SQL查询 进入SQL查询页面。配置SQL查询数据数据源 授权。在数据分析使用数据源,需要先给数据源授权...

数据可视化展现

登录 DataWorks控制,切换至目标地域后,单击左侧导航栏的 数据分析与服务 数据分析,单击 进入数据分析 页面,单击左侧导航栏的 SQL查询 进入SQL查询页面。配置SQL查询数据数据源 授权。在数据分析使用数据源,需要先给数据源授权...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用