平台大数据采集

_相关内容

DataWorks模块使用指引

数据上云与集成:使用 数据集成 模块将源业务系统的数据采集大数据平台。支持离线(批量)、实时(流式)、全量及增量等多种同步方式。规范模型设计:在进行大规模数据开发前,进行规范化的模型设计,以保证数据体系的有序与可维护性。此...

客户案例

迁移完成后,飞天大数据平台覆盖数据采集 存储&计算 实时/离线分析等游戏数据运营全链路。游戏行业:37手游重构数据体系建设 客户简介 37手游致力于手机游戏发行业务,在中国内地地区,存在近10%的市场占有率。迄今为止,成功发行二十余款...

设备协议

设备协议模块可创建的协议以及各协议的功能如下:设备采集协议:将设备数据自动推送到云控平台数据采集端口。数据转化协议:将数据采集协议推动上来的设备数据转化为交通云控平台的标准格式。数据(控制)下发协议:使交通云控平台下发的...

开源大数据平台 E-MapReduce

开源大数据平台E-MapReduce(Elastic MapReduce)是运行在阿里云平台上的一种大数据处理的系统解决方案。

快速体验

数据治理:大数据开发治理平台 DataWorks数据质量(必选)、大数据开发治理平台 DataWorks数据地图(必选)、大数据开发治理平台 DataWorks数据保护伞(必选),基础版DataWorks已包含。数据展示:智能分析套件Quick BI(必选),您可根据...

Cloudera CDP 企业数据平台

企业数据云平台Cloudera Data Platform(简称阿里云CDP),是阿里云和Cloudera联合打造阿里云上的大数据平台

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户...,赋能技术团队具备大数据平台建设、架构设计、AI算法建模以及运维保障能力...

DataWorks交流钉钉群

DataWorks作为阿里云大数据平台操作系统,对接各种大数据计算引擎,以all in one box的方式提供专业高效、安全可靠的全域智能大数据平台,高效率完成数据全链路研发流程,建设企业数据治理体系,同时提供优质高效的交流服务,本文为您介绍...

什么是EMR on ACK

阿里云E-MapReduce(简称EMR)on ACK提供了全新构建大数据平台的方式。您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注...

BI工具集成

本章节展示如何将BI工具与大数据平台集成,构建高效的数据可视化解决方案。使用Power BI连接EMR Serverless Spark并进行数据可视化

什么是阿里云Cloudera CDP

企业数据云平台Cloudera Data Platform(简称阿里云CDP),是阿里云和Cloudera联合打造的阿里云上的大数据平台。前置概念 阅读本文前,您可能需要了解如下概念:什么是边缘计算?什么是人工智能(AI)?什么是SQL?Cloudera CDP企业数据云...

什么是EMR on ECS

EMR on ECS是指在ECS上运行EMR,它将EMR的大数据处理能力与ECS的弹性灵活优势相结合,使得您能够更加便捷地配置和管理EMR集群,同时支持多种开源和自研大数据组件,适用于复杂的大数据处理和分析场景。产品架构 EMR主要由四部分组成,分别...

文件

DataWorks 文件是专为大数据平台设计的、支持多计算节点共享访问的文件存储服务。本文系统阐述了其核心概念、应用场景、功能特性与操作方法,助您构建统一、高效的数据开发与协作环境。

产品形态选型

阿里云开放的大数据平台 E‑MapReduce(EMR)提供了多种产品形态,以满足不同用户的业务需求。根据部署方式可分为 EMR Serverless Spark、EMR Serverless StarRocks、EMR on ECS 和 EMR on ACK。为帮助用户选择合适的产品,以下整理了各产品...

Paimon

目前阿里云开源大数据平台E-MapReduce常见的计算引擎(例如Flink、Spark、Hive或Trino)都与Paimon有着较为完善的集成度。您可以借助Apache Paimon快速地在HDFS或者云端OSS上构建自己的数据湖存储服务,并接入上述计算引擎实现数据湖的分析...

综合:网站用户画像分析

计算引擎 云原生大数据计算服务MaxCompute 本案例中,基于DataWorks使用 云原生大数据计算服务MaxCompute、开源全托管服务EMR Serverless StarRocks、开源大数据平台 E-MapReduce 或 开源全托管服务EMR Serverless Spark 中的任意一种作为 ...

配置并开启审计模式

流量采集(Agent)RDS PolarDB 自建数据库(需要在资产中心开启)通过私网连接(PrivateLink)打通数据采集链路,并在访问数据库的应用服务器或数据库服务器中部署Agent,使用Agent将日志流量转发给 DSC 审计服务器完成日志采集。...

LoongCollector采集异常问题汇总排查

在使用LoongCollector进行数据采集时,可能会遇到采集异常问题。本文将介绍排查采集异常问题的流程,以及一些常见场景下的处理示例。采集异常问题排查指引 采集异常问题的成因复杂多样,且不同原因可能导致相同表象,甚至有时异常无法及时...

项目分配与安全

在为企业级大数据平台创建项目时,建议您对ODS层、DWD及DWS层的数据按照业务板块的粒度建立项目,对于ADS层的数据,按照应用的粒度建立项目。项目分配 在本教程中,建议参考下图建立您的MaxCompute项目,图中的每一个方块代表一个项目。...

ClickHouse

开源大数据平台E-MapReduce(简称EMR)的ClickHouse提供了开源OLAP分析引擎ClickHouse的云上托管服务。EMR ClickHouse完全兼容开源版本的产品特性,同时提供集群快速部署、集群管理、扩容、缩容和监控告警等云上产品功能,并且在开源的基础...

选择业务场景

若您的业务需集成特定组合的组件,您可创建自定义集群,灵活组合EMR提供的组件,打造适配业务特性的大数据平台。本文将为您介绍这些集群的区别,帮助您快速选型。业务场景选型 业务场景(集群类型)支持的组件 核心能力 适用场景 数据湖...

Hadoop集群迁移至DataLake集群

背景信息 E-MapReduce(简称EMR)新版控制台是EMR发布的下一代云原生开源大数据平台,为用户提供全新平台体验、全新开发平台、全新资源形态和全新分析场景。新版控制台的功能特点,详情请参见 EMR新版控制台上线公告。EMR on ECS作为EMR...

米连科技

但是随着业务发展、架构的升级、数据量的增长,伊对需要寻找更强大的数据采集、处理和分析平台来满足运营团队日益增长的数据分析需求,保持伊对高速的用户增长率。业务痛点 伊对面临的主要挑战如下:数据来源分散 客户使用不同的计算存储...

任务上云与跨平台迁移

您可以通过一站式湖仓大数据迁移平台(Lakehouse Migration)调度迁移工具将以下平台的数据迁移至DataWorks,更多平台服务和迁移方案,详情可参见 调度迁移功能概览。开源平台。DolphinScheduler Airflow Oozie Azkaban HUE 其他云平台。...

DataWorks on EMR Serverless StarRocks最佳实践

了解DataWorks on EMR Serverless StarRocks DataWorks作为阿里云一站式大数据开发治理平台,通过数据源对接EMR Serverless StarRocks,可实现EMR Serverless StarRocks的数据集成、作业周期性调度,同时结合StarRocks引擎在数据分析和数据...

什么是数据资源平台

协同 数据同步:数据同步可实现离线、实时多源异构数据的便捷同步或接入,系统可提供完善的数据接入配置、数据模板配置、数据同步任务运行监控等功能,有效保障数据接入的稳定性和可控性,满足各类平台数据源及应用系统间的数据汇聚需求...

什么是DataWorks

DataWorks是一站式智能大数据开发治理平台,适配阿里云MaxCompute、E-MapReduce、Hologres、Flink、AnalyticDB、StarRocks、PAI 等数十种大数据和AI计算服务,为数据仓库、数据湖、湖仓一体、Data+AI解决方案提供全链路智能化的数据集成、...

主机可观测

探针Serverless化 集中管理:通过托管的Prometheus Agent统一管理数据采集,简化监控架构,提高运维效率,且用户对数据采集链路无感知。高效能:因为抽象了监控算法的复杂性,使用Agent可以减少误配的可能性,提高监控数据的准确性和时效性...

API概览

本产品(大数据开发治理平台 DataWorks/2024-05-18)的OpenAPI采用 RPC 签名风格,签名细节参见 签名机制说明。我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

核心能力

数据资源平台提供了一站式数据资产定义、生产、管理与服务平台,提供企业级数据资产构建能力和一致性使用体验,助力客户快速构建数据智能平台,实现数据资源统一管理,挖掘潜在规律,优化业务决策,让大数据真正的驱动客户业务。...

接入Go程序性能数据

您可以通过 日志服务 全栈可观测中的Golang拉取功能采集Go Pprof性能数据,以及在全栈可观测中分析及可视化展示数据。前提条件 已创建全栈可观测实例。具体操作,请参见 创建实例。使用限制 Logtail为Linux Logtail 1.7及以上版本。工作...

Prometheus 探针版本发布说明

云服务 提供更及时的数据处理能力,规模数据采集场景,指标时延增量降低到秒级。新接入云产品时的指标采集生效时间从分钟级降低到秒级。新增自定义选择云服务产品Tag注入到指标的能力。由于架构调整,原Prometheus Agent相关自监控指标...

Prometheus 探针版本发布说明

云服务 提供更及时的数据处理能力,规模数据采集场景,指标时延增量降低到秒级。新接入云产品时的指标采集生效时间从分钟级降低到秒级。新增自定义选择云服务产品Tag注入到指标的能力。由于架构调整,原Prometheus Agent相关自监控指标...

Prometheus 探针版本发布说明

云服务 提供更及时的数据处理能力,规模数据采集场景,指标时延增量降低到秒级。新接入云产品时的指标采集生效时间从分钟级降低到秒级。新增自定义选择云服务产品Tag注入到指标的能力。由于架构调整,原Prometheus Agent相关自监控指标...

接入Kubernetes Go程序性能数据

依托于日志采集组件多维度Kubernetes资源选择能力,采集Go程序的性能指标数据时,也支持通过环境变量、Kubernetes Labels、Namespace、Pod名称、容器名称过滤数据。更多信息,请参见 日志采集组件多维度Kubernetes资源选择能力。另外,Go...

大数据开发治理平台 DataWorks

大数据开发治理平台 DataWorks基于MaxCompute/EMR/Hologres等大数据计算引擎,为客户提供专业高效、安全可靠的一站式大数据开发与治理平台,自带阿里巴巴数据中台与数据治理最佳实践,赋能各行业数字化转型。每天阿里巴巴集团内部有数万名...

CreateDatasourceAuthorization-数据源关联关系授权

创建数据库关联授权,在您指定的业务空间,对指定的数据源进行关联关系的创建,创建后可以对数据源下的表结构进行采集。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成...

Logtail发布历史

修复 修复Logtail使用历史数据采集之后进程无法优雅退出的问题。1.8.6 发布时间:2024.01.30 优化 Golang插件指标数据和上报逻辑优化,指标统一通过C++指标模块上报 修复 修复开启高精度时间戳开关后Golang模块误加载问题 1.8.5 发布时间:...

大数据开发治理平台 DataWorks系统权限策略参考

本文描述大数据开发治理平台 DataWorks支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用