线上大数据分析

_相关内容

E-MapReduce弹性低成本离线大数据分析

大数据是一项涉及不同业务和技术领域的技术和工具的集合,海量离线数据分析可以应用于多种商业系统环境,例如,电商海量日志分析、用户行为画像分析、科研行业的海量离线计算分析任务等场景。离线大数据分析概述 主流的三大分布式计算框架...

常见问题

数据湖后端存储使用OSS,用户使用数据湖构建面向大数据分析和机器学习场景可以获得集中式权限管理和统一的元数据视图,更容易对接云大数据和分析产品。什么情况下我需要使用数据湖构建?在云有数据分析和机器学习需求,希望构建云的...

账单数据订阅及查询分析

您可在用户中心订阅不同类型的账单数据,例如,计费项明细账单、计费项账单按天汇总等。订阅成功后,账单数据将会定时同步至MaxCompute,您...相关文档 大数据分析工具的常见问题和解决方法,详情请参见 大数据分析工具的常见问题和解决方法。

背景信息以及准备工作

或者对存储在 阿里云对象存储服务(Object Storage Service,简称 OSS)、表格存储(Table Store)大数据进行分析之后,通过DLA把结果数据回写到MongoDB,供前台业务使用。前提条件 使用DLA读写MongoDB数据前,您需要通过以下操作在...

基础分析

注意:关联性分析是以全部重复来电数据为分析对象,通过对大量数据分析找出高频的关联标签。重复来电是以某个客户为分析对象,找出他每通电话的标签,进而分析两通电话之间的关系。通话量趋势 通话量的趋势是分析全部通话的随时间的变化...

创建GreenPlum数据

背景信息 Greenplum是一款大数据分析引擎,作用于分析、机器学习和AI等领域。其架构主要针对管理大规模分析型数据仓库以及商业智能工作负载而设计。更多详情,请参见 GreenPlum官网。使用限制 Dataphin仅支持超级管理员、数据源管理员、...

实例画像

数据库自治服务DAS(Database Autonomy Service)提供实例画像功能,基于数据库实例的运行特征表现,通过AI大数据分析构建的一种“千人千面”画像服务。实例画像可以帮助您直观地了解数据库实例全貌,快速确认数据库实例是否存在异常与缺陷...

实例画像

数据库自治服务DAS(Database Autonomy Service)提供实例画像功能,基于数据库实例的运行特征表现,通过AI大数据分析构建的一种“千人千面”画像服务。实例画像可以帮助您直观地了解数据库实例全貌,快速确认数据库实例是否存在异常与缺陷...

创建GreenPlum数据

背景信息 Greenplum是一款大数据分析引擎,作用于分析、机器学习和AI等领域。其架构主要针对管理大规模分析型数据仓库以及商业智能工作负载而设计。更多详情,请参见 GreenPlum官网。使用限制 Dataphin仅支持超级管理员、数据源管理员、...

实例画像

数据库自治服务DAS(Database Autonomy Service)提供实例画像功能,基于数据库实例的运行特征表现,通过AI大数据分析构建的一种“千人千面”画像服务。实例画像可以帮助您直观地了解数据库实例全貌,快速确认数据库实例是否存在异常与缺陷...

读写RDS MySQL数据

因为RDS本身能承载的数据量有限,不适合大数据分析。更多的场景是在DLA中对存储在OSS、Tablestore中的大数据进行分析,分析完成之后把结果数据回写到RDS中,供前台业务使用。DLA如何读取OSS中的数据,请参见 操作步骤。以 person 表为例,...

T+1多库合并建仓

上述方案可解决因数据量大而导致的用户体验问题,但在对分库分表数据进行大数据分析时,逻辑的一个表被拆成了多张表,由于没有类似TDDL中间件来屏蔽物理表的拆分,进行数据分析时变得十分复杂。解决方案 T+1多库合并建仓是指通过DLA控制...

Napatech案例

Lindorm支持海量数据的低成本存储、快速批量导入和实时访问,具备高效的增量及全量数据通道,可轻松与各类大数据平台集成,完成数据的大规模离线分析。基于Lindorm的解决方案,用户在采用到100Gbps+流量产生的大量数据包元数据直接通过...

数据分析作业

MaxCompute是适用于数据分析场景的企业级SaaS模式云数据仓库,支持在多种工具使用MaxCompute运行大数据计算分析作业。如果您需要进行简单的查询等数据分析作业,推荐您使用SQL查询或DataWorks的临时查询等工具,高效便捷地完成数据分析...

读写Elasticsearch数据

云原生数据分析DLA(Data Lake Analytics)中支持接入Elasticsearch,通过标准SQL语句读取Elasticsearch中的数据,从而实现Elasticsearch中的数据与其他数据源的数据联合查询等业务需求。本文档主要介绍了DLA读写Elasticsearch数据的操作...

应用场景

大数据场景:海量数据存储与分析 Lindorm支持海量数据的低成本存储、快速批量导入和实时访问,具备高效的增量及全量数据通道,可轻松与Spark、MaxCompute等大数据平台集成,完成数据的大规模离线分析。优势 低成本:高压缩比,数据冷热分离...

Quick BI v4.5版本说明

数据分析能力升级 数据大屏图表优化,地图动效支持Tooltips轮播。数据大屏交互式分析能力增强,支持联动、钻取、跳转。查询控件相对时间新增T的时间粒度选择。仪表板跳转能力增强,携带的查询控件支持度量、参数和占位符。数据构建模块优化...

互联网、电商行业离线大数据分析

通过阿里云MaxCompute、云数据库RDS MySQL、DataWorks等产品,可以实现互联网、电商网站的离线数据分析,且支持通过DataV大屏展示分析后的业务指标数据。概述 电商网站的销售数据通过大数据进行分析后,可以在大屏幕展示销售指标、客户指标...

DLA Lakehouse实时入湖

数据库路径 数据表路径 数据表文件 进行数据分析。工作负载任务启动成功后,在 数据湖管理>元数据管理 页面中,查看从RDS数据源同步过来的元数据信息。单击 操作 列的 查询数据,在 Serverless Presto>SQL执行 页面,查看从RDS数据源同步...

发现并处理Key和热Key

线全量Key分析 优点:可对历史备份数据进行分析,对线上服务无影响。缺点:时效性差,RDB文件较时耗时较长。对 Tair 的RDB备份文件进行定制化的分析,帮助您发现实例中的Key,掌握Key在内存中的占用和分布、Key过期时间等信息,为您...

发现并处理Redis的Key和热Key

线全量Key分析 优点:可对历史备份数据进行分析,对线上服务无影响。缺点:时效性差,RDB文件较时耗时较长。对Redis的RDB备份文件进行定制化的分析,帮助您发现实例中的Key,掌握Key在内存中的占用和分布、Key过期时间等信息,为您的...

版本发布记录

接入DataWorks任务调度 接入DataWorks任务调度,使得用户能够可视化轻松定制数据湖分析的数据处理流程,实现云上大数据WorkFlow。接入函数计算 接入函数计算,使得用户能够基于这两款Serverless化云产品,构建云原生Serverless工作流。接入...

什么是Quick BI

极易上手完成报表制作 便捷数据准备 ETL引擎0代码完成数据准备,让数据自助分析不再有门槛 全场景 多端数据呈现 适配PC端、移动端和大屏端,实现不同设备数据分析与呈现 无缝办公协同 可集成至办公IM应用(钉钉、企业微信、飞书)中,...

智能小Q

中国信通院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会(CCSA TC601),联合50余家企业的100余位专家共同镇制完成了《大模型驱动的智能数据分析工具》标准,瓴羊为核心参编企业之一。标准包含数据准备能力、大模型...

智能小Q:引领数据消费新范式

中国信通院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会(CCSA TC601),联合50余家企业的100余位专家共同镇制完成了《大模型驱动的智能数据分析工具》标准,瓴羊为核心参编企业之一。标准包含数据准备能力、大模型...

基于MaxCompute进行大数据BI分析

方案介绍 基于MaxCompute进行大数据BI分析的流程如下:通过数据集成同步业务数据和日志数据至MaxCompute。通过MaxCompute、DataWorks对数据进行ETL处理。同步处理后的结果数据至AnalyticDB MySQL。通过Quick BI可视化建立用户画像。方案...

运维阶段

开发人员根据影响分析的结果判断是否对线上数据应用有影响。如果有影响,需要开发人员及时推送告警信息至任务责任人,并判断原因、确定可行性解决方案。如果无影响,则无需处理。制定与实施方案。开发人员提交线上变更申请。审批人员...

基于GitHub公开事件数据集的离线实时一体化实践

本文为您介绍如何基于GitHub实时事件数据通过MaxCompute构建离线数仓、通过Flink和Hologres构建实时数仓,然后通过Hologres和MaxCompute分别进行实时与离线数据分析,从而实现实时离线一体化解决方案。背景信息 随着社会数字化发展,企业对...

MaxFrame概述

处理数据量、处理逻辑复杂,需要基于MaxCompute海量数据及弹性计算资源、MaxFrame分布式能力进行规模数据分析、处理及数据挖掘,提高开发效率。面向Data+AI开发,需要依赖第三方或自定义镜像完成数据开发、模型开发等整体流程。支持的...

功能特性

相较于其它引擎会把中间数据落盘的执行方式,Presto在执行速度有很的优势,特别适合用来做Adhoc查询、BI分析、轻量级ETL等数据分析工作。Serverless Presto概述 DLA Serverless Spark DLA Serverless Spark基于云原生架构,提供面向...

典型场景

大数据分析平台 对于MaxCompute、Hadoop和Spark中保存的海量数据,可通过采用数据集成服务(DataX)或通过对象存储服务(OSS),快速批量导入到 云原生数据仓库AnalyticDB PostgreSQL版,帮助您实现高性能分析处理和在线数据探索。...

数据模型

数据库在存储数据时,会将同一条时间线的数据尽量聚类存储,提升时间线数据访问效率,同时更好的支持时序数据压缩。在时序表中,Tag列的值都相同的一系列数据行构成了一条时间线。时序数据库提供一系列特有的数据访问操作,包括聚合...

可观测性能力介绍

同时,云数据库Redis版 还基于三大数据支柱进行信息聚合,提供数据分析能力,下表为云数据库Redis与原生Redis的可观测性能力对比。为便于浏览和内容表达,表格约定使用下述注释:✔️表示支持。❌表示不支持。➖表示不涉及。可观测性能力 ...

可观测性能力

同时,云原生内存数据库Tair 还基于三大数据支柱进行信息聚合,提供数据分析能力,下表为 云原生内存数据库Tair、云数据库Redis与原生Redis的可观测性能力对比。为便于浏览和内容表达,表格约定使用下述注释:✔️表示支持。❌表示不支持。...

上线离线数据同步任务

新增离线数据同步任务后,需对任务进行上线操作,同步任务上线后会按照创建同步任务中设置的调度周期执行。本文介绍如何上线离线数据同步任务。前提条件 已新增离线数据同步任务,具体操作,请参见 新增离线数据同步任务、批量新增离线数据...

上线离线数据同步任务

新增离线数据同步任务后,需对任务进行上线操作,同步任务上线后会按照创建同步任务中设置的调度周期执行。本文介绍如何上线离线数据同步任务。前提条件 已新增离线数据同步任务,具体操作,请参见 新增离线数据同步任务、批量新增离线数据...

数据分析整体趋势

Hadoop也在早期的MapReduce接口基础增加了SQL接口,SQL语法逐渐成为大数据分析系统的标准配置。随着AWS,Azure,Alibaba,Google等云厂商的出现,云原生分布式数据仓库成为目前数据分析技术的主要解决方案,代表性云服务包括Amazon ...

SQL查询

数据源白名单访问控制 当使用数据分析操作MaxCompute表数据时,如果MaxCompute项目空间开启了白名单访问控制,数据分析的相关服务(例如,费用计算、数据下载、维表使用、数据上传等)可能会出现报错。为保证DataWorks数据分析服务能顺利...

Serverless Presto概述

因此它采用全内存流水线化的执行引擎,相较于其它引擎会把中间数据落盘的执行方式,Presto在执行速度有很的优势,特别适合用来做Adhoc查询、BI分析、轻量级ETL等数据分析工作。阿里云数据湖分析团队在Presto之又进行了很多的优化,...

数据分析概述

例如,数据分析师、运营人员需要手工维护一张线上的MaxCompute表。如果不使用维表功能,每当数据发生变化,都需要执行以下流程:运营人员向数据分析师描述需求。数据分析师提交需求给开发人员。开发人员使用DataWorks编辑SQL语句,创建...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用