互联网电商行业离线大数据分析
互联网电商行业离线大<em>数据</em>分析
电商网站销售数据通过大数据分析后将业务指标数据在大屏幕上展示,如销售指标、客户指标、销售排名、订单地区分布等。大屏上销售数据可视化动态展示,效果震撼,触控大屏支持用户自助查询数据,极大地增强数据的可读性。
适用场景  电商网站数据看板  全国/全球业务态势分析  联网金融风险数据监控 方案架构 本实践方案架构如下所示: 用户订单等数据同步到MaxCompute  通过Dataworks对原始数据进行处理并形成开放API  需要展示的结果数据以API的形式通过DataV在大屏上展示互联网电商行业离线大数据分析 最佳实践概述 方案优势 ...
来自: 最佳实践 相关产品:云服务器ECS,云数据库RDS MySQL 版,DataWorks,大数据计算服务 MaxCompute,DataV数据可视化,API网关,云速搭CADT
Spark on ECI大数据分析
Spark on ECI大<em>数据</em>分析
场景描述 方案优势 1.计算引擎弹性扩缩容,兼顾资源弹性与计 算资源成本优化。 2.计算与存储分离架构,结合阿里云原生云 存储产品,海量数据湖优势。 3.Kubernetes原生的调度性能优势,提升在 大规模分析作业时的分析性能优势分。 4.集群资源隔离和按需分配。 解决问题 1.计算资源弹性能力不足,计算资源成本管 控能力欠缺. 2.集群资源调度能力和隔离能力不足。 3.计算与存储无法分离,大数据量分析时出 现数据存储资源瓶颈。 4.Spark submit方式提交分析作业参数支持 有限等缺点。 产品列表 容器服务Kubernetes版(ACK) 弹性容器实例(ECI) 文件存储HDFS 对象存储OSS 专有网络VPC 容器镜像服务ACR
Spark on Kubernetes解决方案的用户 对 Spark大数据分析平台计算资源成本控制考虑的用户 需要有灵活可扩展计算平台资源弹性及管控的用户 名词解释 文件存储 HDFS:阿里云文件存储 HDFS是面向阿里云 ECS实例及容器服务等计 算资源的文件存储服务,允许用户像在 Hadoop分布式文件系统中管理和访问 ,无需对数据分析应用做...
来自: 最佳实践 | 相关产品:专有网络 VPC,对象存储 OSS,容器服务 ACK,弹性容器实例 ECI,文件存储HDFS
基于DataWorks的大数据一站式开发及数据治理
基于DataWorks的大数据一站式开发及<em>数据</em>治理
概述 基于Dataworks做大数据一站式开发,包含数据实时采集到kafka通过实时计算对数据进行ETL写入HDFS,使用Hive进行数据分析。通过Dataworks进行数据治理,数据地图查看数据信息和血缘关系,数据质量监控异常和报警。 适用场景  日志采集、处理及分析  日志使用Flink实时写入HDFS  日志数据实时ETL  日志HIVE分析  基于dataworks一站式开发  数据治理 方案优势  大数据一站式开发,完善的数据治理能力。  性能优越:高吞吐,高扩展性。  安全稳定:Exactly-Once,故障自动恢复,资源隔离。  简单易用:SQL语言,在线开发,全面支持UDX。  功能强大:支持SQL进行实时及离线数据清洗、数据分析、数据同步、异构数据源计算等Data Lake相关功能 ,以及各种流式及静态数据源关联查询。
文档版本:20201020 43 基于 Dataworks的大数据一站式开发及数据治理 数据治理 步骤4 添加规格,比如本例监控错误的波动情况,如果波动上升进行报警,即错误率飙升 的时候给我们报警,进一步查询错误原因。步骤5 可以先试跑测试数据规则。步骤6 关联调度,每次调度后都会检测数据规则。步骤7 添加 hive_log节点进行关联,...
来自: 最佳实践 | 相关产品:块存储,云服务器ECS,E-MapReduce,DataWorks,实时计算,云速搭
EMR本地盘实例大规模数据集测试
场景描述 阿里云为了满足大数据场景下的存储需求,在云 上推出了本地盘D1机型,这个系列提供了本地 盘而非云盘作为存储,提高了磁盘的吞吐能力, 发挥Hadoop的就近计算优势。阿里云EMR 产品针对本地盘机型,推出了一整套的自动化运 维方案,帮助用户方便可靠地使用本地盘机型, 不需要关注整个运维过程同时数据的高可靠和 服务的高可用。 解决问题 1.云盘多份冗余数据导致成本高 2.磁盘吞吐量不高 3.节点的高可靠分布问题 4.本地盘与节点的故障监控问题 5.数据迁移时自动决策问题 6.自动故障节点迁移与数据平衡问题 产品列表 EMR(E-MapReduce) 本地盘 VPC
Master节点 通常可以生成 1TB的数据进行基准性能测试,首先进入 hive-testbench目录下执行如 下脚本并加载测试数据 参数说明:数据集规模参数单位为 GB,1000表示生成的数据量为 1TB/tpcdata/tpcds 为表数据生成的目录,目录不存在就自动生成,如果不指定目录, 目录就默认生成到/tmp/tpcds目录下 cd hive-testbench#如果...
来自: 最佳实践 | 相关产品:块存储,云服务器ECS,E-MapReduce
基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测
基于湖仓一体架构使用MaxCompute对OSS湖<em>数据</em>分析预测
本篇最佳实践先创建EMR集群作为数据湖对象,Hive元数据存储在DLF,外表数据存储在OSS。然后使用阿里云数据仓库MaxCompute以创建外部项目的方式与存储在DLF的元数据库映射打通,实现元数据统一。最后通过一个毒蘑菇的训练和预测demo,演示云数仓MaxCompute如何对于存储在EMR数据湖的数据进行加工处理以达到业务预期。
基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测实践 业务架构 场景描述 数据湖和数据仓库是当前大数据技术条件下构建分布式系 统的两种数据架构设计取向,数据湖偏向灵活性,数据仓 库侧重成本、性能、安全、治理等企业级特性。但是数据 湖和数据仓库的边界正在慢慢模糊,数据湖自身的治理能 力、数据仓库延伸到外部...
来自: 最佳实践 | 相关产品:对象存储 OSS,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,API网关,数据湖构建,云速搭
基于弹性供应组构建大数据分析集群
基于弹性供应组构建大<em>数据</em>分析集群
场景描述 基于弹性供应组(APG)搭建spark计算集 群,提供一键开启跨售卖方式、跨可用区、 跨实例规格的计算集群交付模式的实践。 方案优势 1.超低成本:跨售卖方式提供计算实 例,按秒计费,可全部使用spot实例 交付,最高可省90%成本。 2.稳定可靠:跨可用域、跨实例规格, 降低spot被集体释放的风险;自动托 管,分钟级巡检,动态保证集群的算 力。 3.快速交付:单次可在5分钟内交付 2000个实例。 4.多策略组合:可分别指定spot和按量 实例的交付策略,以及差额补足的策 略,包括成本最低、打散和折中。 解决问题 1.大规模计算集群成本高。 2.创建ECS实例方式单一,无法跨计费 方式、可用区及规格等核心参数。 3.当可用区资源紧张,无法自动保证基于 spot类型的稳定算力。 产品列表 专有网络VPC 云服务器ECS
相关概念介绍 Spark是一种快速、通用、可扩展的大数据分析引擎,2009年诞生于加州大学伯克利 分校 AMPLab,2010年开源,2013年 6月成为 Apache孵化项目,2014年 2月成为 Apache优质项目。目前,Spark生态系统已经发展成为一个包含多个子项目的集合,其中包含 SparkSQL、Spark Streaming、GraphX、MLlib等子项目,Spark是...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,弹性公网IP
新版产品集合页
基于丰富的产品,将计算、存储、网络、数据库、大数据、人工智能等最新产品技术与场景深度融合,为开发者打造稳定可靠的云基础设施以及云原生的开发环境。
图计算服务 GraphCompute新一代一站式图数据管理和分析平台,可帮助您轻松构建海量关系数据的图应用服务。数据湖开源大数据平台 E-MapReduce免费试用云原生开源大数据平台,为客户提供简单易集成的 Hadoop、Hive、Spark、StarRocks、Presto 等开源大数据计算和存储引擎数据湖构建 Data Lake Formation作为云原生数据湖架构...
来自: 云产品
E-MapReduce Serverless Spark 版
E-MapReduce Serverless Spark 是阿里云 E-MapReduce 基于 Spark 提供的一款全托管、一站式的数据计算平台。它为用户提供任务开发、调试、发布、调度和运维等全方位的产品化服务,显著简化了大数据计算的工作流程,使用户能更专注于数据分析和价值提炼。
云原生极速计算引擎.支持计算存储分离,计算可弹性伸缩、存储可按量付费;对接 OSS-HDFS,完全兼容 HDFS 的云上存储,无缝平滑迁移上云;中心化的 DLF 元数据,全面打通湖仓元数据.开放化的数据湖架构.提供作业开发、调试、发布、调度等一站式数据开发体验;内置版本管理、开发与生产隔离,满足企业级开发与发布标准.一站式...
来自: 云产品
对象存储 OSS
阿里云对象存储 OSS(Object Storage Service)是一款海量、安全、低成本、高可靠的云备份服务,提供最高可达 99.995 % 的服务可用性。多种存储类型供选择,全面优化存储成本。
面向生态的云原生企业级数据湖OSS 可构建云原生的企业级数据湖,作为统一的存储池,可以存储任意规模的数据,对接丰富的计算引擎,支持多种数据输入方式,并且在对象协议的基础上兼容 HDFS 协议,无缝对接 Hadoop 生态。查看更多去控制台体验更多功能产品选型数据存储数据传输数据处理与安全购买更多对象存储 OSS 资源包...
来自: 云产品
OA云资源申请流程自动化
OA云资源申请流程自动化
在企业级客户场景中,对云资源的使用通常需要经过内部OA流程审批通过后再进行部署。本最佳实践致力于提供一个通用解决方案,以解决OA云资源申请流程中的自动化问题,提高运维效率,以更好地支撑业务创新。
文档版本:20240130 30 OA云资源申请流程自动化 CADT自动化集成配置 4.CADT 自动化集成配置 章节 3创建的申请流程,在审批通过后会通过 OA的流程流转集成功能,将申请单数同 步到 RDS的数据库表 cadt_task_21中,并且标记字段 status 为“approved”,所以需 要在 cadt-agent-ecs上对此表上的任务进行扫描后然后执行相应...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,云速搭
向量检索服务
向量检索服务基于阿里云自研的向量引擎 Proxima 内核,提供具备水平拓展、全托管、云原生的高效向量检索服务。向量检索服务将强大的向量管理、查询等能力,通过简洁易用的 SDK/API 接口透出,方便在大模型知识库搭建、多模态AI搜索等多种应用场景上集成。
通过与分布式调度引擎的结合离线数据检索和训练,实现在有限成本下获得最大化性能并满足业务需求.高性能低成本.引入复合检索算法,精于工程实现和算法优化,低成本实现高效率的检索方法,单片索引可达几十亿的规模.超大规模索引和检索.结合超参调优和复合索引等方法,解决数据场景智能适配问题,提高系统的自动化能力,增强...
来自: 云产品
MRACC加速倚天ECS实例Flink集群性能
MRACC加速倚天ECS实例Flink集群性能
希望了解Flink集群on倚天的部署架构。 通过神龙大数据加速引擎 Mracc 提升Flink集群性能。 希望实测了解倚天ECS实例运行Flink集群的性能 架构设计:利用阿里云官方架构设计模版,在此基础上二次定制(调整规格、资源数量、配置调整)。 快速完成PoC和生产环境的设计和部署
N/A N/A 操作系统 Alibaba Cloud Linux 3.2104 LTS 64位 ARM版 Linux内 5.10.134-14.al8.aarch64 核 方案优势 快速标准化 PoC,10分钟内可以完成整个 PoC的环境搭建及集群部署 整体掌握压测架构及方案成本 产品介绍 神龙大数据加速引擎 MRACC:神龙大数据加速引擎 MRACC 是基于阿里云 IaaS资源推出的大数据加速引擎,用于...
来自: 最佳实践 | 相关产品:云服务器ECS,云速搭
交通云控平台
阿里云交通云控平台为构建下一代智慧交通系统提供地图、数据、智能算法、云边协同、控制下发、视觉渲染六大能力。行业开发者可利用这些能力对城市交通、高速运营、大型枢纽调度等业务场景进行智慧化改造,用创新的、智能的应用和优化方案服务于交通管理者和交通出行者。
互联网数据和设备数据融合,交通评价更精准.全息数字化还原.城市级仿真推演时间从几小时缩短到几分钟.大规模实时仿真.全局协同的信号优化方案、十种高速公路主动交通管控策略.智能优化调度方案.云边端一体化协同,海量边缘节点云端轻松运维.全域多端交互协同.98%.高速纵横:智慧高速管控平台.千方科技基于云控平台提供的...
来自: 云产品
基于MaxCompute的大数据BI分析
基于MaxCompute的大数据BI分析
场景描述 本文以电商行业为例,将业务数据和日志数据使用 MaxCompute做ETL之后,同步到ADB进行实时 分析,之后通过QuickBI进行快速可视化展示。 解决问题 1.互联网行业、电商、游戏行业等网站、App、 小程序应用内BI分析场景。 2.可扩展到各类网站BI分析场景使用。 产品列表 1.MaxCompute 2.分析型数据MySQL版 3.日志服务SLS 4.QuickBI 5.云服务器ECS 6.RDSMySQL版
文档版本:20211213 1 基于 MaxCompute的大数据 BI分析 最佳实践概述 方案优势 以 Hologres+QuickBI快速实时数据分析的核心能力为切入点,将客户的业务 、日志数据引导至阿里云的日志服务和分析性数据库。融合阿里云的日志服务 SLS 的生态,增强用户体验(如无缝对接 Flink、Elasticsearch、RDS、Hologres、EMR、dataV ...
来自: 最佳实践 | 相关产品:日志服务(SLS),大数据计算服务 MaxCompute,云原生数据仓库AnalyticDB My,Quick BI,云速搭CADT
云原生内存数据库Tair
云原生内存数据库Tair是阿里云推出的,基于云原生架构的内存数据库,兼容Redis API,支持内存、持久内存、ESSD三种存储介质,并提供大量扩展型数据结构及企业级能力。
2020年底,图引擎作为国内唯一入选的图数据库产品,进入国际权威市场调研机构Forrester发布的图数据平台分析报告,并在高可用和灾难恢复评测项目中,取得了最高的成绩.基于高性能存储的原生图引擎.更多产品与服务.Tair 企业新用户专享2GB 3个月免费试用.Tair内存型(原性能增强型)新购、续费年付6折、月付7折.从容应对秒杀...
来自: 云产品
通过PAI-灵骏分布式训练和部署Llama 2模型
以 Meta 最新开源的大语言模型 Llama2 为例,通过PAI-灵骏完成了大语言模型的高效分布式训练、三阶段指令微调、模型离线推理验证以及在线服务部署等完整的开发链路。
训练基于Megatron-LM引擎支持了数据并行、算子拆分、流水并行、序列并行、Flashattention等技术,保障模型效果且大幅提升大模型训练分布式效率相关产品智算服务 PAI-灵骏交互式建模 PAI-DSW机器学习 PAI-DLC模型在线服务 PAI-EAS对象存储 OSS文件存储 NAS在线咨询方案优势企业级应用基于软硬件一体优化技术,构建高性能异构...
来自: 解决方案
智能媒资服务
智能媒资服务是阿里云提供的媒体内容资产管理和处理服务,提供标签、审核、检索、视频封面、智能处理等核心功能,提高海量内容的利用分发管理效率。
视频内容检索用于音视频间相似片段搜索,通过深度模型理解视频,提取视频内容特征,建立视频搜索引擎。支持以图像搜索视频、以视频搜索包含相似片段的视频和音频搜索相似片段的音频,有效避免视频格式转换、编辑、剪辑拼接、压缩旋转等变换对视频搜索的影响。可广泛用于版权鉴定、广告跟踪、视频检索、短查长推荐、极速审核...
来自: 云产品
云数据库RDS PostgreSQL
云数据库RDS PostgreSQL 版完全兼容开源PostgreSQL,基于云原生架构,软硬协同优化,提供稳定可靠、高性价比的数据库服务。通过丰富的插件拓展,支撑各领域场景化业务,如自研Ganos多维多模时空引擎及开源PostGIS地理信息引擎、向量引擎、时序引擎等百余款插件。
为路径规划、导航、自动驾驶、热力分析、LBS、物流追踪等领域提供专业的时空数据存储和计算。引擎历经高德、千寻、菜鸟、哈啰等不同GIS场景磨炼,使用简单高效,在稳定性、功能和性能上堪称PostGIS+.平面几何、球面几何、栅格模型、时空轨迹模型、点云模型、拓扑网络模型、网格模型、快显模型.专业的时空多模类型.导航、...
来自: 云产品
机器翻译
阿里云机器翻译提供多行业、多场景、多模态的语言服务。机器翻译涵盖通用版/专业版/定制版机器翻译引擎、语种识别、图片翻译、文档翻译、语音/视频翻译、人机协同翻译平台、电商内容多语言工具、机器翻译自学习平台等产品。
译员在平台所产生的双语语料,客户还可用于自主的训练专属机器翻译引擎,形成数据闭环,不断提升机器翻译结果的质量,减少机器翻译译文编辑的成本.人机协同翻译平台.NLP自学习平台.推荐搭配使用.计算机辅助翻译(CAT).金融、医疗等领域下,有海量的外语信息需要翻译,依赖人工成本高、耗时长.提供分领域的专业翻译引擎及...
来自: 云产品
云原生多模数据库Lindorm
云原生多模数据库Lindorm提供各规模、多模型的云原生数据库服务。可兼容HBase/Cassandra、OpenTSDB、Solr、SQL、HDFS等多种开源标准接口。支持海量数据的低成本存储处理和弹性按需付费,是互联网、IoT、车联网、广告、社交等场景首选数据库,也是为阿里核心业务提供支撑的数据库之一。
基于云原生存储构建多种数据引擎,提供统一多模查询和独立开源接口两种方式,让开发更灵活,运行更高效.融合的多数据模型.智能冷热分离.数据自动冷热分层,灵活调整分割线,并且应用零改造、全透明访问,冷数据存储成本大幅减少,热数据访问性能有效提升.支持多种存储介质,覆盖高性能、低成本等多种业务场景.多种引擎共享...
来自: 云产品
< 1 2 3 4 ... 12 >
共有12页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用