数据集成 Data Integration
阿里云数据集成 Data Integration是跨异构数据、低成本、弹性扩展的数据采集同步平台,为DataX的商业版,支持ETL,支持50+数据源跨网络离线(全量/增量)同步。
数据集成 Data Integration是阿里集团对外提供的可跨异构数据存储系统的、可靠、安全、低成本、可弹性扩展的数据同步平台,为400对数据源提供不同网络环境下的全量/增量数据进出通道.20+种异构数据源.20+种异构数据源.支持关系型数据库、大数据存储、非结构化存储、NoSql数据库之间的数据同步.支持经典/专有等网络环境.支持...
来自: 云产品
弹性高性能计算E-HPC
弹性高性能计算(E-HPC)基于阿里云基础设施,拥有公有云、专有云等多种产品形态,为用户提供一站式HPC/HPDA平台服务,面向科研、生产、教育和行业大计算,提供快捷,弹性,安全的服务和拥有与阿里云产品互通的高性能计算服务平台。
通过E-HPC优化器功能,可以监控作业运行的集群性能数据,包括实时数据和历史数据,同时还可以选择所需进程进行性能剖析.45A_【标题】行业实战场景.谢赟辉,靖鑫,也树.阿里云高性能计算在科学数据的存储、传输、计算、分析、应用等各环节提供高效一体化的云计算解决方案,具有科研计算资源支撑和交叉学科科研数据共享能力,...
来自: 云产品
高性能计算存储解决方案
基于阿里云强大的存储产品能力,助力AI、基因、自动驾驶、天文和能源等行业打造高性能计算平台。
基于阿里云丰富的存储产品能力,助力 AI、基因、自动驾驶、天文和能源等行业打造高性能计算平台,为计算引擎提供高吞吐、高 IOPS 和大容量的数据存储和管理能力,并提供线下、线上和混合云等多种架构设计,满足不同场景下的业务需求,快速支撑业务和提升市场竞争力.高性能解决方案蓝皮书.谢赟辉,靖鑫,也树.高性能计算存储...
来自: 解决方案
利用交互式分析(Hologres)进行数据查询
利用交互式分析(Hologres)进行<em>数据</em>查询
场景描述:随着收集数据的方式不断丰富,企业信息化 程度越来越高,企业掌握的数据量呈TB、 PB或EB级别增长。同时,数据中台的快 速推进,使数据应用主要为数据支撑、用户 画像、实时圈人及广告精准投放等核心业务 服务。高可靠和低延时地数据服务成为企业 数字化转型的关键。 Hologres致力于低成本和高性能地大规模 计算型存储和强大的查询能力,为您提供海 量数据的实时数据仓库解决方案和实时交 互式查询服务。 解决问题 1.加速查询MaxCompute数据 2.快速搭建实时数据仓库 3.无缝对接主流BI工具 产品列表 MaxCompute Hologres 实时计算Flink 专有网络VPC DataWorks DataV
Hologres常见使用场景 联邦分析实时数据和离线数据 业务数据分为冷数据和热数据,冷数据存储在离线数据仓库MaxCompute中,热 存储在Hologres中。Hologres可以联邦分析实时数据和离线数据,对接BI分析 工具,快速响应简单查询与复杂查询的业务需求。图1.联邦分析架构图 实时数据仓库 实时写入业务数据实时计算,使用...
来自: 最佳实践 | 相关产品:大数据计算服务 MaxCompute,DataV数据可视化,实时计算,Hologres,云速搭CADT
云上数据集成解决方案
云上数据集成解决方案提供可跨异构数据存储系统、可靠、安全、低成本、可弹性扩展的数据传输交互服务,有效帮助您解 决云环境、个人站点环境下异构数据存储系统的数据互通难题,让您数据不再成为孤岛!助您实现大数据分析和实时商务智能。
离线(批量)的数据同步主要通过定义数据来源和去向的数据源和数据集,由数据集成提供一套抽象化的数据抽取插件(称之为Reader)、数据写入插件(称之为Writer),并基于此框架设计一套简化版的中间数据传输格式,从而达到任意结构化、半结构化数据源之间数据传输的目的。这期间也会涉及到数据源本身所处的网络,针对于各种...
来自: 解决方案
数据湖-在线学习场景数据分析
<em>数据</em>湖-在线学习场景<em>数据</em>分析
场景描述 本场景以在线教育中一个答题闯关类的应用为 例,使用WebServer来模拟演示这类日志数据 的分析处理。通过Nginx和Pythonflask搭建 WebServer,模拟应用中的关键页面,比如登 录、课程内容等,之后构造若干用户使用的模拟 日志数据,投递到数据湖进行分析后获取应用 PV、UV、课程内容访问排行、平均得分等等。 解决问题 基于数据湖(EMR+OSS)搭建大数据平台。 EMR和OSS使用和配置。 数据统一存储到OSS。 产品列表 E-MapReduce 对象存储OSS 云服务器ECS 访问控制RAM 专有网络VPC
 支持元数据实时备份和重建集群快速恢复导入。 支持数据归档备份和重建集群快速数据恢复。 支持冷热数据分层存储,可以对目录/表进行cache/archive操作。 支持缓存加速能力,提高数据吞吐100%以上,多个集群可以共享同一份缓存数据。 支持细化的数据湖权限管理,支持Ranger 权限集成。 支持Hadoop,Hive,Spark...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,访问控制,E-MapReduce
智能数据建设与治理Dataphin
Dataphin遵循阿里巴巴集团多年实战沉淀的大数据建设OneData体系(OneModel、OneID、OneService),集产品、技术、方法论于一体,一站式地为您提供集数据引入、规范定义、智能建模研发、数据萃取、数据资产管理、数据服务等的全链路智能数据构建及管理服务。助您打造属于自己的标准统一、资产化、服务化和闭环自优化的智能数据体系,驱动创新。
智能数据建设与治理 Dataphin.Dataphin是阿里巴巴集团OneData数据治理方法论内部实践的云化输出,一站式提供数据采、建、管、用全生命周期的大数据能力,以助力企业显著提升数据治理水平,构建质量可靠、消费便捷、生产安全经济的企业级数据中台。Dataphin提供多种计算平台支持及可拓展的开放能力,以适应各行业企业的平台...
来自: 云产品
云Clickhouse冷热数据分层存储
云Clickhouse冷热<em>数据</em>分层存储
基于云ClickHouse可以给电商、游戏、互联网以及其他行业提供高性能、高稳定性、低维护成本、高性价比的实时数据分析、精准营销、业务运营、业务分析、业务预警、业务营销、数仓加速等场景化方案,本实践会向客户提供数据库低维护成本、数据库链路构建、冷热分层存储、快熟分析等操作实践。 解决问题 1. 维护成本低不用建设维护体系,稳定性高,数据倾斜自动均衡。 2. 完善的数据同步链路,可以平滑将业务库、大数据、日志服务的数据同步到Clickhouse,降低研发成本。 3. 平滑升级版本,业务中断小。 冷热分层后透明读取,帮客户节约整体数据存储成本。
利用云控制台水平扩容云 ClickHouse 本章节介绍如何通过云控制台进行水平扩容云 ClickHouse集群,增加节点,提升集 群 资 源 容 量,水 平 扩 容 参 考 文 档:https://help.aliyun.com/document_detail/172411.html;水平扩容后费用将会发生变化,费用变化参考:...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,数据传输,日志服务(SLS),云数据库 ClickHouse
游戏数据运营融合分析
游戏<em>数据</em>运营融合分析
场景描述 1.游戏行业有结构化和非结构化数据融合分 析需求的客户。 2.游戏行业有数据实时分析需求的客户,无法 接受T+1延迟。 3.对数据成本有一定诉求的客户,希望物尽其 用尽量优化成本。 4.其他行业有类似需求的客户。 方案优势/解决问题 1.秒级实时分析:依托ADB计算密集型实例, 秒级监控DAU等数据,为广告投放效果提 供有力的在线决策支撑。 2.高效数据融合分析:打通结构化和非结构化 数据,支撑产品体验分析;广告买量投放效 果实时(分钟级)分析,渠道的评估更准确。 3.低成本:DLA融合冷数据分析+ADB存储密 集型温数据分析+ADB计算密集型热数据分 析,在满足各种分析场景需求的同时,有效 地降低的客户的总体使用成本。 4.学习成本低:DLA和ADB兼容标准SQL语 法,无需额外学习其他技术。 产品列表 专有网络VPC、负载均衡SLB、NAT网关、弹性公网IP 云服务器ECS、日志服务SLS、对象存储OSS 数据库RDSMySQL、数据传输服务DTS、数据管理DMS 分析型数据库MySQL版ADS 数据湖分析DLA、QuickBI
数据融合分析:文档版本:20210224 3 游戏数据运营融合分析 最佳实践概述 ᅳ DLA融合分析(冷数据,全周期,低频查询、大范围跨度查询、关联 ADB 维度数据分析)+ADB存储密集型分析(温数据,1-3个月批量数据分析)+ADB计算密集型(热数据实时分析)。ᅳ 真正实现云原生数据处理、分析链路闭环,极大提高客户收益。方案...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,对象存储 OSS,云原生数据仓库AnalyticDB My,数据湖分析,Quick BI
超级计算集群实现自然语言处理训练
超级<em>计算</em>集群实现自然语言处理训练
场景描述 本方案适用于自然语言训练场景,使用神龙 GPU云服务器(SCCGN6)+CPFS进行NLP的 训练,采用Bert模型。这里不使用容器,直接 使用裸机进行NLP的Bert训练,使用飞天AI加 速训练工具可以有效提升多机多卡的训练效率。 解决问题 使用神龙GPU云服务器搭建NLP训练环 境 使用SCC的RDMA网络 使用CPFS存储训练数据 使用飞天AI加速训练工具加速训练 产品列表 神龙GPU云服务器(SCCGN6) SCC超级计算集群 CPFS共享存储
 超级计算集群(SuperComputingCluster,SCC)使用高速RDMA网络互联的 CPU以及GPU等异构加速设备,面向高性能计算、人工智能/机器学习、科学/工程计算数据分析、音视频处理等应用,提供极致计算性能和并行效率的计算 集群服务。更多信息,请参见超级计算集群https://cn.aliyun.com/product/scc。 CPFS...
来自: 最佳实践 | 相关产品:文件存储NAS,超级计算集群
互联网电商行业离线大数据分析
互联网电商行业离线大<em>数据</em>分析
电商网站销售数据通过大数据分析后将业务指标数据在大屏幕上展示,如销售指标、客户指标、销售排名、订单地区分布等。大屏上销售数据可视化动态展示,效果震撼,触控大屏支持用户自助查询数据,极大地增强数据的可读性。
互联网电商行业离线大数据分析 最佳实践 业务架构 场景描述 本实践介绍了使用阿里云MaxCompute、数据库(RDS)、DataWorks等产品实现电商网站离线数据分 析,分析后的业务指标数据实时在大屏展示。通过完整 的实践Demo为例,提供从电商网站搭建,数据从RDS 同步到MaxCompute、再到DataWorks进行数据分析,最后在大屏上展示...
来自: 最佳实践 | 相关产品:云服务器ECS,云数据库RDS MySQL 版,DataWorks,大数据计算服务 MaxCompute,DataV数据可视化,API网关,云速搭CADT
基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测
基于湖仓一体架构使用MaxCompute对OSS湖<em>数据</em>分析预测
本篇最佳实践先创建EMR集群作为数据湖对象,Hive元数据存储在DLF,外表数据存储在OSS。然后使用阿里云数据仓库MaxCompute以创建外部项目的方式与存储在DLF的元数据库映射打通,实现元数据统一。最后通过一个毒蘑菇的训练和预测demo,演示云数仓MaxCompute如何对于存储在EMR数据湖的数据进行加工处理以达到业务预期。
基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测实践 业务架构 场景描述 数据湖和数据仓库是当前大数据技术条件下构建分布式系 统的两种数据架构设计取向,数据湖偏向灵活性,数据仓 库侧重成本、性能、安全、治理等企业级特性。但是数据 湖和数据仓库的边界正在慢慢模糊,数据湖自身的治理能 力、数据仓库延伸到外部...
来自: 最佳实践 | 相关产品:对象存储 OSS,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,API网关,数据湖构建,云速搭
函数计算实现弹性音视频处理系统
函数<em>计算</em>实现弹性音视频处理系统
场景描述 本示例通过函数计算部署一个高弹性高可用的 音视频处理系统。尤其适合视频网站使用,每天 有大量的上传视频,需要及时转码处理以适配各 种终端及网络条件,要求短时间内准备大量的计 算资源进行大规模并行转码处理,同时希望基于 FFmpeg自建的转码服务能简单迁移。 解决问题 1.如何使用函数计算部署音视频处理系统。 2.如何进行系统的压测。 产品列表 函数计算服务 文件存储NAS 对象存储OSS 函数工作流FnF 日志服务SLS
全面提升海量日志处理能力,实时挖掘数据价值,智能 助力研发/运维/运营/安全等场景。详见 https://cn.aliyun.com/product/sls 文档版本:20201228(发布日期)III Function Compute 实现弹性音视频处理系统 前言 FFmpeg:是视频处理领域非常常用的一个开源软件。详见 https://www.ffmpeg.org/ 文档版本:20201228(发布...
来自: 最佳实践 | 相关产品:专有网络 VPC,对象存储 OSS,文件存储NAS,日志服务(SLS),Serverless 工作流
数据传输服务DTS
阿里云数据传输服务集数据迁移、订阅及实时同步功能于一体,能够解决公共云、混合云场景下,远距离、毫秒级异步数据传输难题,支持关系型数据库、NoSQL、大数据(OLAP)等数据源,其底层基础设施采用阿里双11异地多活架构,为数千下游应用提供实时数据流,已在线上稳定运行7年之久。
支持多种数据源间的数据实时同步 轻松支持异地灾备、异地多活及数据实时分析等应用场景 丰富的同步场景 支持RDS->RDS、RDS->NewSQL、NoSQL->NoSQL等多个场景的同步。如支持MySQL->MySQL、MySQL->AnalyticDB for MySQL、Redis->Redis等多个场景的数据同步,打通各种数据库生态,支持用户多样的业务场景。查看同步支持的...
来自: 云产品
跨云迁移单写双读过渡架构
跨云迁移单写双读过渡架构
概述 在搬站场景下,涉及迁移跨度较长,在过渡阶段客户需要跨云访问,如何保障数据链路的高可用尤为关键,采用专线和公网双备的方案保障数据传输的高可用,也降低双专线的迁移成本。 适用场景 数据迁移链路的高可用 跨云迁移过渡期架构 读写分类架构设计 技术架构 本实践方案基于如下图所示的技术架构和主要流程编写操作步骤: 方案优势 在迁移时间持续较长的情况下,使用单写双读架构降低业务改造成本。 使用数据库网关做专线和公网互备。 流量逐渐灰度验证,保障迁移平滑过渡。 安全:原生的多租户系统,以项目进行隔离,所有计算任务在安全沙箱中运行。
它底层的数据流基础设施为阿里双 11异地多 活基础架构,为千下游应用提供实时数据流,已在线上稳定运行 6年之久。您 可以使用数据传输轻松构建安全、可扩展、高可用的数据架构。详见:https://www.aliyun.com/product/dts 云企业网:阿里云致力于为用户提供优质、高效、稳定的网络传输环境,云企业网(Cloud Enterprise ...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,数据传输,性能测试 PTS,云企业网,云速搭CADT
云速搭部署Flink应用
云速搭部署Flink应用
本水煎通过云速搭实现一个DataHub+Flink的实时流计算引擎架构,利用DataHub收集原始数据,推送到Flink进行基于流式数据的分析和应用。
文档版本:20211103 18 云速搭部署 Flink应用 CADT设计部署服务 此外,本实践创建的 datahub,可以将海量数据同步到实时流计算引擎 flink中,并进 行相关的作业开发。步骤10 开发配置 Flink 可参考 https://bp.aliyun.com/detail/155 中第 4章的“实时数仓搭建”。文档版本:20211103 19 云速搭部署 Flink应用 产品支持 3....
来自: 最佳实践 | 相关产品:专有网络 VPC,对象存储 OSS,实时计算,数据总线,云速搭CADT
表格存储Tablestore
表格存储Tablestore是阿里云自研的面向海量结构化数据存储的Serverless分布式数据库,它可提供低成本、高性能的存储方案,同时也可提供稳定与极致的数据服务。
单表PB级数据规模及千万级QPS让表格存储轻松满足IoT设备、监控系统等时序数据的存储需求,大数据分析SQL直读以及高效的增量流式读接口让数据轻松完成离线分析与实时流计算.超大规模IoT设备、监控系统等时序数据需要PB级数据存储.需要长期存储数据,要求能够监控查询与数据分析.需要高并发写入实时数据,对数据进行实时计算...
来自: 云产品
智能商业分析 Quick BI
瓴羊智能商业分析 Quick BI 是阿里云用户臻选的数据可视化工具,大幅提升数据分析和报表开发效率,一站式满足企业各种场景的数据分析和决策的诉求。
一站式交互式填报解决复杂表格数据收集问题将报表展示和填报录入相结合,综合计算填报数据数据集取结果,从填报任务下发、数据录入、权限管理、入库审批等多链路确保数据采集和数据分析的顺畅度。产品功能个人版高级版专业版数据分析仪表板支持支持支持即席分析不支持不支持支持模板市场支持查看所有模块支持查看所有...
来自: 云产品
专有云敏捷版
专有云敏捷版为云化各阶段客户提供大数据、数据库、云原生Paas三大优势场景的轻量化产品组合,支持与阿里云公共云、企业版形成一朵云,构建中心+分支的多级云平台。
离线、实时和在线分析治理:智能大数据分析、批一体计算实时离线混合计算.大数据&AI一体化:300+自研分布式机器学习法、大数据+机器学习一体化架构、基于大数据平台充分利用已有资源.政务中台将数据和服务整合拉通,信息做到共享,群众少填报、工作人员少审核,让数据多跑,提高了政务服务的效率和群众满意度.云原生...
来自: 云产品
< 1 2 3 4 ... 14 >
共有14页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用