开源分析-开源分析文档介绍内容-移动阿里云

Iceberg概述

无 x√自动合并小文件无 x√说明以上信息是在2021年9月份，客观分析开源Iceberg和商业版Iceberg现状之后制定的表格。随着后续版本的不断迭代升级，对比项状态可能发生变化。适用场景 Iceberg作为通用数据湖解决方案中最核心的组件之一，...

ClickHouse概述

开源大数据平台E-MapReduce（简称EMR）的ClickHouse提供了开源OLAP分析引擎ClickHouse的云上托管服务。EMR ClickHouse完全兼容开源版本的产品特性，同时提供集群快速部署、集群管理、扩容、缩容和监控告警等云上产品功能，并且在开源的基础...

通过开源链路追踪客户端获取异常信息

本文介绍如何使用开源链路追踪客户端进行异常埋点，并在可观测链路 OpenTelemetry 版中进行异常分析。前提条件您已通过开源客户端接入可观测链路 OpenTelemetry 版，具体操作，请参见接入指南。设置Span的异常信息 OpenTelemetry异常...

通过开源链路追踪客户端获取异常信息

本文介绍如何使用开源链路追踪客户端进行异常埋点，并在可观测链路 OpenTelemetry 版中进行异常分析。前提条件您已通过开源客户端接入可观测链路 OpenTelemetry 版，具体操作，请参见接入指南。设置Span的异常信息 OpenTelemetry异常...

StarRocks快速使用数据湖分析版实例

StarRocks快速使用数据湖分析版，无数据迁移可实现快速数据湖分析适用客户全网用户新增功能/规格数据湖分析版实例适用于查询存储在Apache Hive、Apache Iceberg、Apache Hudi以及Apache Paimon等多种数据湖上的数据，并涵盖OSS、OSS-...

可视化弹性成本分析

EMR新增了对弹性资源（按量付费、抢占式实例节点）进行成本分析的功能，可多维度地了解集群资源使用量及成本分布情况，从而协助您评估集群弹性成本节省效果，优化集群资源利用。本文为您介绍如何查看弹性成本可视化大盘。前提条件已根据...

启动实时检测与分析

如果您需要实时获取任务的健康分析和风险项分析，则需要开通EMR Doctor。开启健康检查功能的具体操作，请参见开通EMR Doctor（Hadoop集群类型）。启动实时检测进入基础信息页面。登录 EMR on ECS控制台。在顶部菜单栏处，根据实际情况...

支持的开源API

Elasticsearch Serverless服务支持开源的API，本文介绍7.10版本应用支持的开源API URI和对应的Method。注意事项在使用API查询应用索引时，应用配额为12 CU和24 CU的企业版存在以下限制：暂不支持以下Agg查询类型：FiltersAggregation、...

开通并配置OSS存储分析

EMR Doctor支持分析OSS上的数据，开通OSS存储分析功能可以帮助您进一步了解OSS存储资源的使用情况和健康状态，让您更好地治理存储在OSS上的数据。背景信息 OSS提供了存储清单功能，配置该功能后会定期为Bucket生成清单文件，清单文件中保存...

E-MapReduce弹性低成本离线大数据分析

大数据是一项涉及不同业务和技术领域的技术和工具的集合，海量离线数据分析可以应用于多种商业系统环境，例如，电商海量日志分析、用户行为画像分析、科研行业的海量离线计算分析任务等场景。离线大数据分析概述主流的三大分布式计算框架...

启用Trino语法进行数据湖分析

StarRocks 3.x版本在进行数据湖分析时，支持兼容Trino语法。本文介绍如何在StarRocks中利用Trino语法进行数据湖分析，特别是针对从Trino迁移至StarRocks的用户，旨在实现无缝切换且无需更改原有SQL语句。前提条件已创建数据湖分析版...