阿里云CLI 支持 阿里云命令行工具(Alibaba Cloud Command Line Interface)是在Alibaba Cloud SDK for Go之上构建的开源工具。阿里云CLI提供了对阿里云云产品OpenAPI的直接访问。您可以在命令行Shell中,使用 aliyun 命令与阿里云服务进行...
Kafka Manager是专门为Kafka设计的集群管理工具,提供简洁的Web界面来管理和监控Kafka集群。Kafka Manager 自研 DLF-Auth DLF-Auth是数据湖构建DLF产品提供,可以对DLF管理的数据库、数据表、数据列、函数等进行细粒度权限控制,实现数据湖...
简单来说,企业自建测试自动化体系,分为三种形式:形式一:基于开源测试自动化工具 很多企业自建测试自动化,都是从选择一个开源测试自动化工具开始的。一个开源测试自动化工具,往往包含以下几部分(以 RobotFramework 为例):1.测试...
其设计理念是打造一个统一平台,融合多种应用场景,让用户无需切换工具即可高效完成从数据分析到模型训练的全流程工作。平台能力层 该系统主要为上层场景提供支撑,通过工作流编排实现批处理、流计算以及人工智能作业的多场景混合调度。...
说明 本文部分内容来源于开源StarRocks的 什么是StarRocks。StarRocks特性 StarRocks的架构设计融合了MPP数据库,以及分布式系统的设计思想,其特性如下所示。架构精简 StarRocks内部通过MPP计算框架完成SQL的具体执行工作。MPP框架能够...
开源Cassandra挑战 开源Cassandra是基于Amazon DynamoDB和Google Bigtable设计的一款分布式NoSQL数据库,具备无中心、一致性可调、提供类SQL查询语言CQL等优点。但在实际使用中,Cassandra存在一些难以解决的挑战。比如Cassandra存储和计算...
复杂报表设计 强大的分析和计算能力 支持数据透视表和内嵌图表,轻松完成多维分析。报表端分析模式支持一键报表进行分析。支持数据库函数、日期和时间函数、财务函数等多种类的函数类型,可兼容400种以上的Excel公式。请参见 电子表格配置...
复杂报表设计 强大的分析和计算能力 1.支持数据透视表和内嵌图表,轻松完成多维分析。2.报表端分析模式支持一键报表进行分析。3.支持数据库函数、日期和时间函数、财务函数等多种类的函数类型,可兼容400种以上的Excel公式。请参见 电子...
Kafka Manager是专为Kafka设计的集群管理工具,提供了WebUI界面,允许用户通过图形化界面便捷地管理Kafka集群。本文为您介绍如何访问Kafka Manager的WebUI,并将集群添加至Kafka Manager的WebUI界面。前提条件 已创建选择了Kafka服务的...
Apache Doris是一个高性能、实时的分析型数据库,能够较好的满足报表分析、即席查询、数据湖联邦查询加速等使用场景。本文为您介绍Apache Doris。背景信息 关于更多Apache Doris信息,详情请参见 Doris介绍。使用场景 数据源经过各种数据...
对比项 Data Warehouse Data Lake Delta Lake 架构 计算存储一体或分离 计算存储分离 计算存储分离 存储管理 严格、非通用 原生格式 通用格式、轻量级 场景 报表、分析 报表、分析、数据科学 报表、分析、数据科学 灵活性 低 高 较高 数据...
特性对比 Lindorm VS 开源HBase VS 开源Cassandra Lindorm宽表引擎是面向海量半结构化、结构化数据设计的分布式存储,兼容HBase、Phoenix(SQL)、Cassandra等开源标准接口,下表介绍Lindorm与开源HBase和开源Cassandra的区别。特性 云原生多...
适用场景 OLAP 多维分析:支持灵活的多维分析与即席查询(Ad Hoc),广泛应用于运营报表、用户画像、指标中台、BI 分析等场景,助力数据驱动决策。实时数据仓库:秒级数据摄入与更新,适用于实时库存监控、订单追踪、用户行为分析、实时风...
MaxCompute平台支持丰富的数据上传和下载工具(其中大部分工具已经在GitHub公开源代码,以开源社区的方式进行维护)。您可以根据实际应用场景,选择合适的工具进行数据的上传和下载。阿里云数加产品 MaxCompute客户端(Tunnel通道系列)...
阿里云E-MapReduce产品构建于阿里云云服务器ECS上,基于开源的Apache Hadoop和Apache Spark,做了大量优化。本文为您介绍E-MapReduce(简称EMR)Spark相对开源增强的功能。背景信息 阿里云EMR 100%采用社区开源组件,随开源版本升级迭代,...
开源项目 2018 年 4 月,蚂蚁集团宣布开源 SOFAStack 金融级分布式架构。得益于社区的信任和支持,目前已经累积超过 3.4 万的 Star 数和超过 100 家企业用户,并持续向打造金融级云原生多个技术领域的标杆努力(数据统计截止时间为 2020 月...
EMR on ECS 功能集 功能 功能描述 参考文档 集群管理 创建集群 您可以轻松构建和运行Hadoop、Spark、Hive、Presto等开源大数据框架,以进行大规模数据处理和分析等操作。创建集群 释放集群 在完成EMR集群任务后及时释放集群,可以释放资源...
Hadoop DistCp和Jindo DistCp的区别 DistCp类型 功能 使用场景 Hadoop DistCp 开源Hadoop内置的DistCp工具,用于大型集群间或集群内数据的复制。HDFS到HDFS间的数据复制。Jindo DistCp JindoFS的数据迁移工具,支持OSS、OSS-HDFS服务、兼容...
本文介绍阿里云IDaaS在开发过程中所依赖或引用的开源组件、框架及工具,帮助开发者了解系统的技术背景、合规性要求及潜在的开源协议限制。适用场景 企业应用需对接阿里云IDaaS实现身份认证、单点登录(SSO)或身份管理集成。开源代码库 ...
架构图 MyBase on ECS MyBase on ACK 架构说明 云数据库专属集群MyBase开放版 由四类产品组成:社区开源产品 集成社区开源数据库引擎和管控工具,例如MySQL,Orchestrator、Prometheus等。MyBase开源增强 MyBase给予开源社区版本的组件,...
报表中心功能通过综合分析表、合规分析报表、性能分析报表、安全运营分析报表、数据库业务和会话分析表,展示您数据库资产的审计情况和安全风险的分析结果。您可以根据业务需要使用对应的报表。本文介绍支持的报表类型,以及如何通过报表...
OpenLDAP是一种开源软件,您可以使用OpenLDAP提供的命令行工具ldapadd、ldapdelete、ldapmodify等来管理用户,使用ldif文件进行用户管理。这种方式需要参考OpenLDAP开源社区的文档来进行操作。开源文档请参见 OpenLDAP。
开源大数据平台E-MapReduce(Elastic MapReduce)是运行在阿里云平台上的一种大数据处理的系统解决方案。
EMR Serverless StarRocks兼容开源StarRocks的SQL语法和函数,您可以参考以下文档进行开发设计。StarRocks版本 参考文档 3.3系列 SQL参考 函数参考 3.2系列 SQL参考 函数参考 2.5系列 SQL参考 函数参考
兼容开源 EMR Notebook兼容开源Jupyter Notebook,您可以通过文件导入、导出的方式实现开发工具的自由切换,从而降低了使用门槛。产品功能 交互式编程环境 支持逐步执行SQL和Python代码,并根据运行结果调整后续代码。多种数据源类型 支持...
功能变更 JindoFS存储优化 JindoFS缓存优化 JindoTable计算优化 JindoManager系统管理 JindoTools工具集 JindoFS生态支持 JindoFS存储优化 支持文件的checksum功能,对齐开源HDFS checksum相关接口,支持MD5MD5CRC和COMPOSITE_CRC两种算法...
Notebook 促进了数据分析师和数据工程师之间的协作,支持快速原型设计和实验,是探索数据、开发机器学习模型以及进行数据驱动决策的关键工具。EMR Serverless Spark支持通过Notebook进行交互式开发。本文带您快速体验Notebook的创建、运行...
核心能力 Apache Iceberg设计初衷是为了解决Hive数仓上云的问题,经过多年迭代已经发展成为云上构建数据湖服务的表格式标准。关于Apache Iceberg的更多介绍,请参见 Apache Iceberg官网。目前Iceberg提供以下核心能力:基于HDFS或者对象...
Apache Celeborn是阿里云开源的中间数据服务,旨在提升大数据计算引擎的性能、稳定性和灵活性。Celeborn设计独立于具体引擎,支持Spark、Flink、MapReduce(MR)和 Tez,并且是目前最流行的Remote Shuffle Service的实现。Celeborn架构 ...
通过Livy,您可以利用Airflow中的livy_operator以及spark_magic等开源项目,向Serverless Spark提交任务、查询任务状态并获取计算结果。Kyuubi提供了JDBC/ODBC接口,支持通过SQL查询或BI工具(如Tableau、Power BI)直接连接Serverless ...
通过Livy,您可以利用Airflow中的livy_operator以及spark_magic等开源项目,向Serverless Spark提交任务、查询任务状态并获取计算结果。Kyuubi提供了JDBC/ODBC接口,支持通过SQL查询或BI工具(如Tableau、Power BI)直接连接Serverless ...
EMR Serverless Spark介绍 EMR Serverless Spark是一款云原生,专为大规模数据处理和分析而设计的全托管Serverless产品。产品优势如下:云原生极速计算引擎 内置Fusion Engine(Spark Native Engine),相对开源版本性能提升300%。内置...
Trino(即原PrestoSQL)是一个开源的分布式SQL查询引擎,适用于交互式分析查询。EMR-3.44.0和EMR-5.10.0版本开始改用社区正式名称Trino,之前各版本控制台显示为Presto,内核其实是Trino,使用时请注意区分。基本特性 Trino使用Java语言...
应用场景 Presto是定位在数据仓库和数据分析业务的分布式SQL引擎,适合以下应用场景:ETL Ad-Hoc查询 海量结构化数据或半结构化数据分析 海量多维数据聚合或报表分析 重要 Presto是一个数仓类产品,因为其对事务支持有限,所以不适合在线...
EMR on ECS是指在ECS上运行EMR,它将EMR的大数据处理能力与ECS的弹性灵活优势相结合,使得您能够更加便捷地配置和管理EMR集群,同时支持多种开源和自研大数据组件,适用于复杂的大数据处理和分析场景。产品架构 EMR主要由四部分组成,分别...
EMR AI助手(EMR Agent)是阿里云EMR推出的一款智能化工具,旨在助您更高效地管理和运维 EMR集群。通过合理利用EMR AI助手的各项功能,可以快速查询资源信息、唤起相关操作、诊断组件异常、获取技术支持等,能帮您提升运维效率和操作体验。...
开源大数据平台E-MapReduce(简称EMR)的ClickHouse提供了开源OLAP分析引擎ClickHouse的云上托管服务。EMR ClickHouse完全兼容开源版本的产品特性,同时提供集群快速部署、集群管理、扩容、缩容和监控告警等云上产品功能,并且在开源的基础...
工具集:提供相关的工具集,例如Jindo tool和迁移工具Jindo DistCp。各种Connectors:包括Hadoop connector、Flink connector和TensorFlow connector,支持Kite SDK、Apache Beams、Flume、Sqoop和Kafka。SmartData目前通过JindoFS和...
通过Kyuubi Gateway,以兼容开源Kyuubi的方式提交SQL任务。数据目录 支持使用RAM用户(子账号)身份访问DLF。支持访问DLF 2.0 Hive Catalog。资源观测 支持观测工作空间、队列的资源消耗情况。运行环境 Spark Submit工具支持通过配置参数-...
背景信息 EMR Flink完全兼容开源Flink,相关内容请参见社区文档。例如:DataStream API Table API&SQ Python API 使用场景 Flink广泛应用于大数据实时化的场景,本文从技术领域和企业应用场景进行介绍。技术领域 从技术领域的角度,Flink...