开源分析

_相关内容

Iceberg概述

无 x√自动合并小文件 无 x√说明 以上信息是在2021年9月份,客观分析开源Iceberg和商业版Iceberg现状之后制定的表格。随着后续版本的不断迭代升级,对比项状态可能发生变化。适用场景 Iceberg作为通用数据湖解决方案中最核心的组件之一,...

ClickHouse概述

开源大数据平台E-MapReduce(简称EMR)的ClickHouse提供了开源OLAP分析引擎ClickHouse的云上托管服务。EMR ClickHouse完全兼容开源版本的产品特性,同时提供集群快速部署、集群管理、扩容、缩容和监控告警等云上产品功能,并且在开源的基础...

通过开源链路追踪客户端获取异常信息

本文介绍如何使用开源链路追踪客户端进行异常埋点,并在 可观测链路 OpenTelemetry 版 中进行异常分析。前提条件 您已通过开源客户端接入 可观测链路 OpenTelemetry 版,具体操作,请参见 接入指南。设置Span的异常信息 OpenTelemetry异常...

通过开源链路追踪客户端获取异常信息

本文介绍如何使用开源链路追踪客户端进行异常埋点,并在 可观测链路 OpenTelemetry 版 中进行异常分析。前提条件 您已通过开源客户端接入 可观测链路 OpenTelemetry 版,具体操作,请参见 接入指南。设置Span的异常信息 OpenTelemetry异常...

StarRocks快速使用数据湖分析版实例

StarRocks快速使用数据湖分析版,无数据迁移可实现快速数据湖分析 适用客户 全网用户 新增功能/规格 数据湖分析版实例适用于查询存储在Apache Hive、Apache Iceberg、Apache Hudi以及Apache Paimon等多种数据湖上的数据,并涵盖OSS、OSS-...

可视化弹性成本分析

EMR新增了对弹性资源(按量付费、抢占式实例节点)进行成本分析的功能,可多维度地了解集群资源使用量及成本分布情况,从而协助您评估集群弹性成本节省效果,优化集群资源利用。本文为您介绍如何查看弹性成本可视化大盘。前提条件 已根据...

启动实时检测与分析

如果您需要实时获取任务的健康分析和风险项分析,则需要开通EMR Doctor。开启健康检查功能的具体操作,请参见 开通EMR Doctor(Hadoop集群类型)。启动实时检测 进入基础信息页面。登录 EMR on ECS控制台。在顶部菜单栏处,根据实际情况...

支持的开源API

Elasticsearch Serverless服务支持开源的API,本文介绍7.10版本应用支持的开源API URI和对应的Method。注意事项 在使用API查询应用索引时,应用配额为12 CU和24 CU的企业版存在以下限制:暂不支持以下Agg查询类型:FiltersAggregation、...

开通并配置OSS存储分析

EMR Doctor支持分析OSS上的数据,开通OSS存储分析功能可以帮助您进一步了解OSS存储资源的使用情况和健康状态,让您更好地治理存储在OSS上的数据。背景信息 OSS提供了存储清单功能,配置该功能后会定期为Bucket生成清单文件,清单文件中保存...

E-MapReduce弹性低成本离线大数据分析

大数据是一项涉及不同业务和技术领域的技术和工具的集合,海量离线数据分析可以应用于多种商业系统环境,例如,电商海量日志分析、用户行为画像分析、科研行业的海量离线计算分析任务等场景。离线大数据分析概述 主流的三大分布式计算框架...

启用Trino语法进行数据湖分析

StarRocks 3.x版本在进行数据湖分析时,支持兼容Trino语法。本文介绍如何在StarRocks中利用Trino语法进行数据湖分析,特别是针对从Trino迁移至StarRocks的用户,旨在实现无缝切换且无需更改原有SQL语句。前提条件 已创建数据湖分析版...

文件元数据离线分析

EMR-3.30.0及后续版本的Block模式,支持dump整个namespace的元数据信息至OSS中,并通过Jindo Sql工具直接分析元数信息。背景信息 在HDFS文件系统中,整个分布式文件的元数据存储在名为fsimage的快照文件中。文件中包含了整个文件系统的命名...

文件元数据离线分析

EMR-3.30.0及后续版本的Block模式,支持dump整个namespace的元数据信息至OSS中,并通过Jindo Sql工具直接分析元数信息。背景信息 在HDFS文件系统中,整个分布式文件的元数据存储在名为fsimage的快照文件中。文件中包含了整个文件系统的命名...

文件元数据离线分析

EMR-3.30.0及后续版本的Block模式,支持dump整个namespace的元数据信息至OSS中,并通过Jindo Sql工具直接分析元数信息。背景信息 在HDFS文件系统中,整个分布式文件的元数据存储在名为fsimage的快照文件中。文件中包含了整个文件系统的命名...

文件元数据离线分析

EMR-3.30.0及后续版本的Block模式,支持dump整个namespace的元数据信息至OSS中,并通过Jindo Sql工具直接分析元数信息。背景信息 在HDFS文件系统中,整个分布式文件的元数据存储在名为fsimage的快照文件中。文件中包含了整个文件系统的命名...

文件元数据离线分析

EMR-3.30.0及后续版本的Block模式,支持dump整个namespace的元数据信息至OSS中,并通过Jindo Sql工具直接分析元数信息。背景信息 在HDFS文件系统中,整个分布式文件的元数据存储在名为fsimage的快照文件中。文件中包含了整个文件系统的命名...

文件元数据离线分析

EMR-3.30.0及后续版本的Block模式,支持dump整个namespace的元数据信息至OSS中,并通过Jindo Sql工具直接分析元数信息。背景信息 在HDFS文件系统中,整个分布式文件的元数据存储在名为fsimage的快照文件中。文件中包含了整个文件系统的命名...

文件元数据离线分析

EMR-3.30.0及后续版本的Block模式,支持dump整个namespace的元数据信息至OSS中,并通过Jindo Sql工具直接分析元数信息。背景信息 在HDFS文件系统中,整个分布式文件的元数据存储在名为fsimage的快照文件中。文件中包含了整个文件系统的命名...

文件元数据离线分析

EMR-3.30.0及后续版本的Block模式,支持dump整个namespace的元数据信息至OSS中,并通过Jindo Sql工具直接分析元数信息。背景信息 在HDFS文件系统中,整个分布式文件的元数据存储在名为fsimage的快照文件中。文件中包含了整个文件系统的命名...

Query Profile介绍

通过Query Profile,您可以进行可视化的分析来快速识别影响StarRocks实例查询性能的瓶颈。启用 Query Profile 如果您当前的实例未启用Query Profile功能,则可以通过将变量 enable_profile 设置为 true 以启用Query Profile。SET enable_...

测试结果

本次测试采用3种不同的测试场景,针对开源自建的Hadoop+Spark集群与阿里云云原生数据湖分析DLA Spark在执行Terasort基准测试的性能做了对比分析。本文档主要展示了开源自建Spark和DLA Spark在3种测试场景下的测试结果及性能对比分析。1 TB...

GetDoctorApplication-获取单个任务分析结果

通过EMR Doctor获取任务分析信息。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权信息透出。请求参数 名称 类型 必填 描述 ...

Redis数据源

本文介绍如何使用Redis数据源进行数据分析或者交互式开发。建表语法 CREATE TABLE tbName[(columnName dataType[,columnName dataType]*)]USING redis OPTIONS(propertyKey=propertyValue[,propertyKey=propertyValue]*);Table Schema 创建...

Jindo sql命令介绍

Jindo sql命令是JindoFS自带的工具,方便您分析JindoFS访问日志、元数据和OSS访问日志。本文为您介绍如何使用Jindo sql命令,分析JindoFS访问日志、元数据和OSS访问日志的数据。前提条件 本地安装了Java JDK 8。已创建集群,详情请参见 ...

Jindo sql命令介绍

Jindo sql命令是JindoFS自带的工具,方便您分析JindoFS访问日志、元数据和OSS访问日志。本文为您介绍如何使用Jindo sql命令,分析JindoFS访问日志、元数据和OSS访问日志的数据。前提条件 本地安装了Java JDK 8。已创建集群,详情请参见 ...

Druid数据源

本文介绍如何使用Druid数据源进行数据分析或者交互式开发。建表语法 create table tbName using druid options(propertyKey=propertyValue[,propertyKey=propertyValue]*);Table Schema 创建Druid数据表时,无需显式地定义表的字段信息,...

DataHub数据源

本文介绍如何使用DataHub数据源进行数据分析或者交互式开发。建表语法 CREATE TABLE tbName USING datahub OPTIONS(propertyName=propertyValue[,propertyName=propertyValue]*);Table Schema 创建DataHub表时,无需显式定义表的字段信息,...

ListDoctorApplications-批量获取任务分析结果

通过EMR Doctor获取批量任务分析结果。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权信息透出。请求参数 名称 类型 必填 ...

快速使用数据湖分析版实例

数据湖分析版实例适用于查询存储在Apache Hive、Apache Iceberg、Apache Hudi以及Apache Paimon等多种数据湖上的数据,并涵盖OSS、OSS-HDFS、HDFS等平台,无需数据迁移即可实现快速的数据湖查询分析,且其性能比Presto高出3到5倍。...

查询OSS数据

本文为您介绍如何使用StarRocks的数据湖分析能力查询阿里云OSS。前提条件 已创建StarRocks集群,详情请参见 创建StarRocks集群。说明 此文档仅适用于EMR-5.12.0之前版本或EMR-3.46.0之前版本的StarRocks集群。已开通OSS服务,详情请参见 ...

Kafka数据源

本文介绍如何使用Kafka数据源进行数据分析或者交互式开发。建表语法 CREATE TABLE tbName[(columnName dataType[,columnName dataType]*)]USING kafka OPTIONS(propertyName=propertyValue[,propertyName=propertyValue]*);配置参数说明 ...

GetDoctorHDFSUGI-获取特定属主或属组HDFS分析结果

通过EMR Doctor获取特定属主或者属组的HDFS分析结果。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权信息透出。请求参数 ...

TableStore数据源

本文介绍如何使用TableStore数据源进行数据分析或者交互式开发。建表语法 CREATE TABLE tbName USING tablestore OPTIONS(propertyName=propertyValue[,propertyName=propertyValue]*);Table Schema 创建TableStore表时,无需显式定义表的...

ListDoctorHDFSUGI-批量获取属主或属组HDFS分析结果

通过EMR Doctor批量获取属主或者属组的HDFS分析结果。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权信息透出。请求参数 ...

开源Elasticsearch FAQ

本文列举了一些开源Elasticsearch(ES)相关的常见问题,例如,如何配置索引线程池大小,如何重新分配索引分片,如何批量删除索引等。常见问题概览 如何配置索引线程池大小?出现内存溢出OOM(OutOfMemory)的错误,如何处理?如何手动对...

概述

Alluxio是一个面向基于云的数据分析和人工智能的开源的数据编排技术。Alluxio为数据驱动型应用和存储系统构建了桥梁,将数据从存储层移动到距离数据驱动型应用更近的位置,从而能够更容易被访问,同时使得应用程序能够通过一个公共接口连接...

JindoFS实战演示

Impala如何高效查询OSS数据 Impala如何高效查询OSS数据 2021-06-08 Apache Impala是一个开源的大数据查询分析引擎,能够快速查询分析存储在Hadoop集群的PB级数据。如果您已将HDFS数据迁移至OSS中,可通过在Impala中使用JindoFS SDK,高效...

检索分析服务 Elasticsearch版

检索分析服务Elasticsearch版是基于开源Elasticsearch构建的全托管云服务,在100%兼容开源功能的同时,支持开箱即用、按需付费。不仅提供云上开箱即用的Elasticsearch、Logstash、Kibana、Beats在内的Elastic Stack生态组件,还与Elastic...

选型配置说明

Flink、Kafka、YARN OLAP 数据分析场景,其中核心组件ClickHouse是一个面向联机分析处理(OLAP)的开源的面向列式存储的DBMS,与Hadoop和Spark相比,ClickHouse更轻量级。ClickHouse支持线性扩展,简单方便,具有高可靠性和高容错。...

什么是阿里云Elasticsearch

开源Elasticsearch是一个基于Lucene的实时分布式的搜索与分析引擎,是遵从Apache开源条款的一款开源产品,是当前主流的企业级搜索引擎。作为一款基于RESTful API的分布式服务,Elasticsearch可以快速地、近乎于准实时地存储、查询和分析...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用