即时通信工具开源-即时通信工具开源文档介绍内容-移动阿里云

使用OpenAPI

本文为您介绍使用开源大数据平台E-MapReduce OpenAPI的基本信息。关于使用阿里云OpenAPI的详细介绍，请参见使用OpenAPI。基本信息版本说明 E-MapReduce 版本号说明 2021-03-20 推荐使用。EMR Workbench 版本号说明 2024-04-30 推荐使用...

产品优势

特性 Lindorm文件引擎开源HDFS 功能定位分布式文件系统分布式文件系统 HDFS兼容性 HDFS通信协议支持支持基础读写接口完整支持完整支持高级管理接口完整支持完整支持成本存储单价（实际费用以购买页面为准）最低0.12元/GB/月 ...

开源生态

主要工具网络通信框架 SOFABolt、生产级高性能 Java 实现 SOFAJRaft、自动化测试框架 SOFAActs、轻量级类隔离容器 SOFAArk。生态项目高性能可扩展安全网络代理 MOSN、简单可扩展自治事务框架 Seata。同时，SOFAStack 也积极参与了多个...

智能运维：EMR AI助手快速上手

EMR AI助手（EMR Agent）是阿里云EMR推出的一款智能化工具，旨在助您更高效地管理和运维 EMR集群。通过合理利用EMR AI助手的各项功能，可以快速查询资源信息、唤起相关操作、诊断组件异常、获取技术支持等，能帮您提升运维效率和操作体验。...

Hadoop DistCp介绍

Hadoop DistCp（分布式复制）是一个用于大型集群间或集群内数据复制的工具，通过MapReduce实现复制过程中数据的分发、错误处理、恢复及报告。本文为您介绍Hadoop DistCp与Jindo DistCp的区别、Hadoop DistCp使用方法以及常见问题。说明 ...

产品架构

架构图 MyBase on ECS MyBase on ACK 架构说明云数据库专属集群MyBase开放版由四类产品组成：社区开源产品集成社区开源数据库引擎和管控工具，例如MySQL，Orchestrator、Prometheus等。MyBase开源增强 MyBase给予开源社区版本的组件，...

OpenLDAP

OpenLDAP是一种开源软件，您可以使用OpenLDAP提供的命令行工具ldapadd、ldapdelete、ldapmodify等来管理用户，使用ldif文件进行用户管理。这种方式需要参考OpenLDAP开源社区的文档来进行操作。开源文档请参见 OpenLDAP。

开源大数据平台 E-MapReduce

开源大数据平台E-MapReduce（Elastic MapReduce）是运行在阿里云平台上的一种大数据处理的系统解决方案。

音视频通信

音视频通信RTC（Real-Time Communication）是阿里云覆盖全球的实时音视频开发平台，提供高可用、高品质、超低延时的实时网络服务，适用于在线教育、互动娱乐、视频会议、保险定损、调度指挥等场景。使用阿里云RTC SDK，您可以在移动、Web、...

接入工具

在左侧导航栏选择接入工具，进入接入工具界面。可选：生成Token。单击 Token生成器页签，输入生成Token所需要的参数。参数描述 AppID 应用ID，在控制台应用管理页面中创建和查看。具体操作，请参见应用管理。AppKey 应用AppKey，在...

接入工具

在左侧导航栏选择接入工具，进入接入工具界面。可选：生成Token。单击 Token生成器页签，输入生成Token所需要的参数。参数描述 AppID 应用ID，在控制台应用管理页面中创建和查看。具体操作，请参见应用管理。AppKey 应用AppKey，在...

什么是EMR Notebook

兼容开源 EMR Notebook兼容开源Jupyter Notebook，您可以通过文件导入、导出的方式实现开发工具的自由切换，从而降低了使用门槛。产品功能交互式编程环境支持逐步执行SQL和Python代码，并根据运行结果调整后续代码。多种数据源类型支持...

控制台介绍

音视频通信控制台提供了观星台、用量查询、统计分析、应用管理、接入工具、配置管理、服务授权管理的配置与使用。通过阅读本文，您可以了解控制台概览及各功能的简介。操作步骤登录音视频通信RTC控制台。查看控制台概览。功能区名称说明...

SmartData 3.1.x版本简介

功能变更 JindoFS存储优化 JindoFS缓存优化 JindoTable计算优化 JindoManager系统管理 JindoTools工具集 JindoFS生态支持 JindoFS存储优化支持文件的checksum功能，对齐开源HDFS checksum相关接口，支持MD5MD5CRC和COMPOSITE_CRC两种算法...

组件操作

EMR提供的组件包括开源和自研两大类，涵盖数据开发、计算引擎、数据服务、资源管理、数据存储、数据集成等领域，您可以按需选择和配置。说明在创建集群时，如果没有您想使用的组件，或者想使用的开源组件仅对存量用户开放，您可以自行安装...

什么是EMR Serverless Spark

生态无缝兼容全面兼容开源Spark：无需修改代码即可直接运行，提供用法兼容的 spark-submit 和 spark-sql 工具，降低迁移门槛。深度集成主流湖仓格式：全面支持Apache Paimon、Iceberg、Delta、Hudi等主流湖仓格式，满足多样化数据存储需求...

通过 Gateway 向全托管 spark 提交任务

通过Livy，您可以利用Airflow中的livy_operator以及spark_magic等开源项目，向Serverless Spark提交任务、查询任务状态并获取计算结果。Kyuubi提供了JDBC/ODBC接口，支持通过SQL查询或BI工具（如Tableau、Power BI）直接连接Serverless ...

Gateway管理

通过Livy，您可以利用Airflow中的livy_operator以及spark_magic等开源项目，向Serverless Spark提交任务、查询任务状态并获取计算结果。Kyuubi提供了JDBC/ODBC接口，支持通过SQL查询或BI工具（如Tableau、Power BI）直接连接Serverless ...

Flink

Flink核心是一个流式的数据流执行引擎，其针对数据流的分布式计算提供了数据分布、数据通信以及容错机制等功能。基于流执行引擎，Flink提供了更高抽象层的API以便您编写分布式任务。背景信息 EMR Flink完全兼容开源Flink，相关内容请参见...

Serverless Spark集成 Notebook

Serverless Spark支持通过Notebook进行交互式开发适用客户全网用户新增功能/规格 Notebook 为您提供了一个交互式的工作环境，支持 PySpark、Markdown 的开发，您可以编写代码、运行查询、可视化数据并即时查看结果。Notebook 促进了数据...

概览

控制台提供了观星台、用量查询、统计分析、应用管理、接入工具、配置管理、服务授权管理的配置与使用。通过阅读本文，您可以了解控制台概览及各功能的简介。操作步骤登录音视频通信RTC控制台。查看控制台概览。功能区名称说明昨日用量 ...

什么是EMR on ECS

EMR on ECS是指在ECS上运行EMR，它将EMR的大数据处理能力与ECS的弹性灵活优势相结合，使得您能够更加便捷地配置和管理EMR集群，同时支持多种开源和自研大数据组件，适用于复杂的大数据处理和分析场景。产品架构 EMR主要由四部分组成，分别...

SmartData（仅对存量用户开放）

工具集：提供相关的工具集，例如Jindo tool和迁移工具Jindo DistCp。各种Connectors：包括Hadoop connector、Flink connector和TensorFlow connector，支持Kite SDK、Apache Beams、Flume、Sqoop和Kafka。SmartData目前通过JindoFS和...

2025-01-20版本

通过Kyuubi Gateway，以兼容开源Kyuubi的方式提交SQL任务。数据目录支持使用RAM用户（子账号）身份访问DLF。支持访问DLF 2.0 Hive Catalog。资源观测支持观测工作空间、队列的资源消耗情况。运行环境 Spark Submit工具支持通过配置参数-...

产品形态选型

提供自动数据冷热分层存储和丰富的运维工具以降低总体成本。弹性伸缩：可按时间或负载动态调整集群规模，支持多种弹性资源类型。深度集成：与阿里云 OSS、DataWorks、DLF（数据湖构建）等服务深度集成，支持在 DataWorks 使用 EMR 作为作业...

Kerberos

在这种高安全级别的集群中，所有开源组件均采用Kerberos安全模式启动，确保只有经过Kerberos认证的客户端能够访问集群提供的服务（例如HDFS）。背景信息集群开启Kerberos之后：客户端：可以对可信任的客户端提供认证，使得可信任客户端...

Superset（仅对存量用户开放）

Superset是一款轻量级BI工具。您可以使用Superset连接多个数据源自助分析并可视化、定义图表和看板、导入或导出看板，并且可以对用户和角色进行权限管理。本文以EMR-3.34.0版本的集群为例为您介绍如何使用Superset。背景信息 Superset对E-...

BI工具集成

本章节展示如何将BI工具与大数据平台集成，构建高效的数据可视化解决方案。使用Power BI连接EMR Serverless Spark并进行数据可视化

查看开源组件 Web 界面

在EMR集群中，为了确保集群安全，Hadoop、Spark和Flink等开源组件的Web界面端口均未对外开放。如果您想直接访问开源组件的Web界面，可根据实际场景选择原生UI地址、Knox代理地址、SSH本地端口转发或 SSH动态端口转发方式进行访问。快速...

开源组件常用端口

本文为您介绍开源组件常用端口。服务端口描述 Hadoop 2.X 50070 HDFS Web UI的端口。配置参数为 dfs.namenode.http-address 或 dfs.http.address 。说明 dfs.http.address 已过期但仍能使用。50075 DataNode Web UI的端口。50010 ...

基础工具与操作

本章节提供基础工具的操作指南，帮助用户高效完成数据存储、管理和运维相关任务。在Notebook中使用Hadoop命令操作OSS/OSS-HDFS

Flink版本调整公告

为了更好地融入开源生态，提供更加开放和多样化的计算服务，阿里云E-MapReduce（简称EMR）从EMR-5.17.0和EMR-3.51.0版本开始，将Flink引擎版本从Flink企业版Ververica Runtime（简称VVR）调整为Flink社区开源版本，同时引入RocksDB作为存储...

产品简介

开源大数据开发平台E-MapReduce（简称EMR）是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark，让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

常用工具参考

工具简介命令行工具ossutil 2.0（预览版）ossutil是OSS的新版命令行管理工具，方便您高效使用OSS。更多信息，请参见命令行工具ossutil 2.0（预览版）。阿里云CLI 阿里云CLI（Command Line Interface）是一种命令行工具，允许用户在终端...

EMR Studio（已不支持新购）

EMR Studio是E-MapReduce提供的开源大数据开发套件，包含Apache Zeppelin、Jupyter Notebook和Apache Airflow等开源组件。能够无缝关联EMR集群（EMR on ECS和EMR on ACK）的计算引擎提交任务，并提供了交互式开发、任务调度和任务监控等...

基础使用

本文为您介绍如何连接...执行以下命令，使用命令行工具 zkCli.sh 连接ZooKeeper。zkCli.sh-server master-1-1:2181 连接成功后，即可输入 help 显示所有命令。相关文档关于ZooKeeper的更多介绍，请参见 ZooKeeper Getting Started Guide。

EMR与自建Hadoop集群对比优势

与自建Hadoop集群相比，开源大数据开发平台EMR提供弹性资源管理和自动化运维，降低运维复杂度，通过用户管理、数据加密和权限管理等为数据安全保驾护航，同时EMR集成了丰富的开源组件并打通开源生态与阿里云生态，便于快速搭建大数据处理和...

会话管理

Spark Thrift Server会话：Spark Thrift Server是Apache Spark提供的一种服务，支持通过JDBC或ODBC连接并执行SQL查询，从而便捷地将Spark环境与现有的商业智能（BI）工具、数据可视化工具及其他数据分析工具集成。相关文档管理SQL会话 ...

实践教程

即席查询数仓场景：增量数据实时统计数仓场景：分钟级准实时分析 EMR Serverless Spark 通过Serverless Spark提交PySpark流任务通过spark-submit命令行工具提交Spark任务通过Apache Airflow使用Livy Operator提交任务通过Apache ...

Zeppelin常见问题

EMR Studio上的Zeppelin与开源版本一致吗？如何设置Zeppelin Note的权限？Zeppelin执行时无法正常启动Interpreter EMR Studio上的Zeppelin与开源版本一致吗？EMR Studio上的Zeppelin是增强版的Zeppelin，与开源版本不一致。E-MapReduce的...