E-MapReduce Serverless StarRocks 版
E-MapReduce Serverless StarRocks版简称EMR StarRocks,是阿里云提供的全托管服务,内核100%兼容StarRocks,性能比传统OLAP引擎提升3-10倍,助力企业高效构建湖仓分析、高并发查询及实时分析等大数据应用。
支持存储计算分离架构,免 AK 集成访问 OSS 对象存储,弹性可扩展的计算能力,支持高性能的热数据本地 Cache 缓存,在不损失查询性能的情况下极大的降低了存储成本.可通过外表 External Catalog,轻松高效查询存储在 Apache Hive、Apache Iceberg、Apache Hudi、Delta Lake 等数据湖上的数据,无需数据迁移。并支持 Apache ...
来自: 云产品
对象存储 OSS
阿里云对象存储 OSS(Object Storage Service)是一款海量、安全、低成本、高可靠的云备份服务,提供最高可达 99.995 % 的服务可用性。多种存储类型供选择,全面优化存储成本。
精彩回放云栖速递:面向大规模数据智能的阿里云存储创新从云的角度来看,云的存算力,云上提供的数据管理的能力,大数据分析能力和人工智能计算能力,帮助每家企业从数据公司演进到数据驱动的.了解详情产品定价OSS 的资费项包括存储费用、流量费用、请求费用等。您开通 OSS 产品时,默认的付费方式是按量付费,也就是先...
来自: 云产品
E-MapReduce Serverless Spark 版
E-MapReduce Serverless Spark 是阿里云 E-MapReduce 基于 Spark 提供的一款全托管、一站式的数据计算平台。它为用户提供任务开发、调试、发布、调度和运维等全方位的产品化服务,显著简化了大数据计算的工作流程,使用户能更专注于数据分析和价值提炼。
内置 Celeborn(Remote Shuffle Service),支持 PB 级 Shuffle 数据计算资源总成本最高下降 30%\\u00A0.云原生极速计算引擎.支持计算存储分离,计算可弹性伸缩、存储可按量付费;对接 OSS-HDFS,完全兼容 HDFS 的云上存储,无缝平滑迁移上云;中心化的 DLF 元数据,全面打通湖仓元数据.开放化的数据湖架构.提供作业开发、...
来自: 云产品
云数据库 SelectDB 版
阿里云数据库 SelectDB 是现代化实时数据仓库 SelectDB 在阿里云上的全托管服务,内核基于业界领先的开源分析型数据库 Apache Doris 研发,由阿里云和飞轮科技联合打造。阿里云数据库 SelectDB 聚焦于满足企业级大数据分析需求,广泛应用于实时报表分析、即席多维分析、日志检索分析、数据联邦与查询加速等场景,致力于为客户提供极致性能、简单易用的数据分析服务。
支持实时高并发的导入和更新能力数据从产生到可分析仅需秒级。云原生架构解决成本和扩展性问题云原生的存分离架构,可独立、按需地伸缩计算和存储资源。全量数据存储于廉价稳定的对象存储 OSS 中,存储单价降低约 90%。支持多计算集群共享同一份数据,避免存储冗余,同时提供强大的物理和逻辑隔离能力。总拥有成本(TCO...
来自: 云产品
MRACC加速倚天ECS实例Flink集群性能
MRACC加速倚天ECS实例Flink集群性能
希望了解Flink集群on倚天的部署架构。 通过神龙大数据加速引擎 Mracc 提升Flink集群性能。 希望实测了解倚天ECS实例运行Flink集群的性能 架构设计:利用阿里云官方架构设计模版,在此基础上二次定制(调整规格、资源数量、配置调整)。 快速完成PoC和生产环境的设计和部署
数据框架,显著提升数据湖及数据仓库性能。配合资源管理工具 FastMR 快 速构建大数据计算集群,全面提升研发效率。文档版本:20230801 4 倚天ECS实例加速Flink运行 最佳实践概述 VPC:Virtual Private Cloud,简称 VPC。基于阿里云创建的自定义私有网络,不同的专有网络之间二层逻辑隔离,可以在自己创建的专有网络内创建...
来自: 最佳实践 | 相关产品:云服务器ECS,云速搭
Flink+Hologres搭建实时数仓
Flink+Hologres搭建实时数仓解决方案将Hologres与Flink深度集成,提供一体化的实时数仓联合解决方案,实现了数仓分层之间实时数据的高效流动,解决实时数仓分层问题。
本方案使用阿里云机器学习平台PAI的强大算法能力,通过对用户数据计算和预测,辅助客户对人群营销决策的判断,在用户召回,流失预测,高价值用户寻找等多个运营场景,帮助客户降低成本,提高效率;客户可通过短信的方式触达用户,完成营销触达的全链路操作。查看详情技术解决方案咨询我们将根据您提交的需求,安排技术...
来自: 解决方案
EMR集群安全认证和授权管理 
EMR集群安全认证和授权管理 
场景描述 阿里云EMR服务Kafka和Hadoop安全集群使 用Kerberos进行用户安全认证,通过Apache Ranger服务进行访问授权管理。本最佳实践中以 Apache Web服务器日志为例,演示基于Kafka 和Hadoop的生态组件构建日志大数据仓库,并 介绍在整个数据流程中,如何通过Kerberos和 Ranger进行认证和授权的相关配置。 解决问题 1.创建基于Kerberos的EMR Kafka和 Hadoop集群。 2.EMR服务的Kafka和Hadoop集群中 Kerberos相关配置和使用方法。 3.Ranger中添加Kafka、HDFS、Hive和 Hbase服务和访问策略。 4.Flume中和Kafka、HDFS相关的安全配 置。 产品列表:E-MapReduce、专有网络VPC、云服务器ECS、云数据库RDS版
随着 Apache YARN的出现,Hadoop平台现在可以支持 真正的数据湖架构。企业可以在多租户环境中运行多个工作负载。Hadoop内的 数据安全性需要发展以支持多种用例进行数据访问,同时还需要提供一个框架来 对安全策略进行集中管理并监视用户访问。详情请查看 ranger.apache.org 文档版本:20200330 V EMR集群安全认证和授权管理...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,E-MapReduce
离线实时一体化数仓
将OLAP分析、即席分析、在线服务等多个系统统一, 能够极大简化数仓架构,并实现一份数据、多种查询分析与服务,为企业大数据平台降本提效。
Flink的实时计算能力与Hologres的实时查询分析能力结合,同时利用MaxCompute中离线的历史数据,提供完整、实时的数据分析能力,助力业务数据洞察与运营。日志等半结构化数据分析随着移动端应用的普及,应用埋点、用户标签计算等场景开始诞生,为了更好地支撑这类场景,越来越多的大数据系统开始使用半结构化JSON格式来存储...
来自: 解决方案
阿里云大数据&AI
阿里云大数据和AI产品服务。开放数据处理服务ODPS提供强大的数据分析和管理功能;开源大数据产品支持更加灵活地构建大数据平台;AI和机器学习产品提供AI工程平台和智算服务。
通过更加开放的对数据湖的支持以及对数据分析多样化统一管理的湖仓一体能力.通过一份数据的基础不断追求对数仓的实时化和在线化的能力结合.通过DataWorks自顶向下和自底向上的双向建模的能力,以及数据治理与企业数据评估模型的新能力来帮助企业更加直观地感受到自身的数据成熟度.实时计算Flink版.推荐搭配使用.云原生一体...
来自: 云产品
EMR HBase on OSS存分离集群快速恢复
EMR HBase on OSS存<em>算</em>分离集群快速恢复
OSS-HDFS服务(JindoFS服务)是一款云原生数据湖存储产品。基于统一的元数据管理能力,在完全兼容HDFS文件系统接口的同时,提供充分的POSIX能力支持,能更好地满足大数据和AI等领域的数据湖计算场景。
基于统一的元数据管理能力,在完全兼容 HDFS文件系统接口的同时,提供充分的 POSIX能力支持,更好地 满足大数据和 AI 等 领 域 的 场 景。详见:https://help.aliyun.com/document_detail/405089.html EMR:开源大数据平台 E-MapReduce(简称“EMR”)是云原生开源大数据平台,向客户提供简单易集成的 ...
来自: 最佳实践 | 相关产品:专有网络 VPC,对象存储 OSS,E-MapReduce,云速搭CADT
大数据系统基准性能测试最佳实践
大数据系统基准性能测试最佳实践
本方案适用于在阿里云上进行大数据基准性能测试的场景,包括 Teragen和Terasort测试,TestDFSIO测试。本文采用CADT工具结合阿里云的E-MapReduce服务快速构建测试集群,并提供了Teragen和Terasort测试,TestDFSIO测试的测试脚本,便于迅速开展测试。
✓ 集成了数据湖构建(Data Lake Formation),实现数据湖场景下多引擎的统一元数据管理。基准性能测试介绍 本示例提供两个测试脚本:Teragen&Terasort测试 文档版本:20210301 2 大数据系统基准性能测试最佳实践 最佳实践概述 ✓ Teragen程序会根据需要生成一些随机的数据,然后利用 Terasort将这些数据进行 sort排 序。是...
来自: 最佳实践 | 相关产品:专有网络 VPC,E-MapReduce,云速搭CADT
E-MapReduce
阿里云E-MapReduce(简称EMR)是阿里云云原生数据湖的核心计算引擎,全面支持Hadoop、Spark、HBase、Hive、Flink等大数据组件,为客户提供企业级开源大数据平台服务。通过有效弹性伸缩和数据分层存储机制,相较于传统HDFS固定集群方式,可节省50%以上的费用,同时支持创建抢占式实例,相比按量付费的购买方式,可节省50%~80%的费用。
为了减轻现有集群的压力,禾使用阿里云EMR落地了适合禾当前业务的数据湖,可以任意规模存储结构化和非结构化数据,运用不同类型的引擎进行分析,为业务发展提供了更好的决策依据.凯叔讲故事是中国知名的儿童内容教育品牌。刚开始凯叔讲故事使用第三方SAAS平台作为运营支撑,周期长、展示死板,个性化开发受到很大局限,...
来自: 云产品
专有云敏捷版
专有云敏捷版为云化各阶段客户提供大数据、数据库、云原生Paas三大优势场景的轻量化产品组合,支持与阿里云公共云、企业版形成一朵云,构建中心+分支的多级云平台。
数据计算、处理分析较同类开源产品提升倍.数据存储较开源体系压缩3-5倍.运行态势全感知、故障自动预警.更轻量化的大数据和AI输出方案,全面覆盖大数据所有场景,包括离线计算、实时计算数据开发治理和AI智能化等能力;通过架构重构等方式,根据选择的产品数量不同,最少服务器节点数量在9-20台,且适配海光、鲲鹏和飞腾...
来自: 云产品
中小企业自建Hadoop集群上云解决方案
中小企业自建 Hadoop 集群上云解决方案,助力自建 Hadoop 用户快速构建云上半托管开源大数据平台,在保持原组件使用习惯延续的同时,充分利用云上服务特点,更加便捷地迭代企业大数据平台架构,聚焦业务价值开发。
云原生数据湖.云原生数据湖.企业对数据的处理,往往同时存在需要批量处理和流式处理的不同环节。本方案构建了安全的数据传输网络,基于 Apache Flink 官方产品Ververica,提供可选的实时计算平台半托管服务,在兼容开源 Flink 的基础上提供商业增值能力,可广泛用于实时 ETL、数据库 CDC、实时风控、实时入仓(湖)、实时...
来自: 解决方案
云原生多模数据库Lindorm
云原生多模数据库Lindorm提供各规模、多模型的云原生数据库服务。可兼容HBase/Cassandra、OpenTSDB、Solr、SQL、HDFS等多种开源标准接口。支持海量数据的低成本存储处理和弹性按需付费,是互联网、IoT、车联网、广告、社交等场景首选数据库,也是为阿里核心业务提供支撑的数据库之一。
使用Lindorm存储来自工业物联网场景下的海量异构IT&OT数据,通过Lindorm计算引擎提供的低成本、高性能、稳定可靠的分布式计算能力,满足您在数智化生产、交互式数据探索分析、AI/ML数据处理和大规模图计算等场景中的计算需求。工业生产数据链路上下游各方围绕阿里云Lindorm数据云平台,将数据进行同构、汇聚、融合,打破...
来自: 云产品
云数据库产品总览(瑶池)
阿里云提供完善的数据库解决方案,多款数据库产品,满足99%的业务场景,荣获Gartner、信通院等国内外多项认证。轻松满足高可靠、高可用性、高性能等数据库需求;运维工作量大幅减少,让企业一站式享受数据上云及分布式架构的技术红利!
另一方面利用DLA的强大计算能力,细致分析活动投放效果,进一步增强了加和智能流量平台为品牌营销带来的销售转化率.云原生数据库 PolarDB 分布式版产品解决了小打卡社交场景中的圈子日记查询功能。小打卡用户每天在十万的兴趣圈子中活跃,发布百万条打卡日记,PolarDB 分布式版的分库分表场景很好地解决了客户需求,...
来自: 云产品
表格存储Tablestore
表格存储Tablestore是阿里云自研的面向海量结构化数据存储的Serverless分布式数据库,它可提供低成本、高性能的存储方案,同时也可提供稳定与极致的数据服务。
同时支持数据实时投递至OSS,搭建数据湖架构.上下游数据集成.开放的计算生态对接.查看全部日志.提供分布式可横向扩展结构化数据存储,在海量规模下仍提供低延迟访问。适用于海量账单、IM消息、Feeds流、媒资元数据等场景.对接Spark、Flink、Maxcompute等计算引擎作为维表、结果表以及源表存储,提供可弹性扩展、高并发低...
来自: 云产品
DataWorks
大数据开发治理平台 DataWorks基于MaxCompute/EMR/MC-Hologres等大数据计算引擎,为客户提供专业高效、安全可靠的一站式大数据开发与治理平台。每天阿里巴巴集团内部有数万名数据/算法工程师正在使用DataWorks,承担集团99%数据业务构建。
依托于EMR、OSS、DataWorks产品组合的数据湖,满分通过了信通院云原生数据湖评测,评测分数排名第一,解决方案全面兼容HDFS,湖权限和生命周期管理能力升级。DataWorks on EMR全链路数据湖治理解决方案提供了基于EMR数据湖的一站式湖开发、运维、治理平台,帮助用户快速基于阿里云数据湖构建自己的数据中台.满分通过中国...
来自: 云产品
云存储解决方案
云存储解决方案面向大数据存储、多媒体存储(视频存储)、视频监控、基因生命科学、数据迁移、自动驾驶、在线教育、混合云存储、数据迁移、数据容灾备份等多个行业用户的多元化场景,提供更安全稳定、更优化、无缝上云的智能数据存储服务,为企业上云、实现数字化转型奠定数据基础。
2.丰富的云上数据计算生态:OSS 灵活与周边产品打通,提供诸如文档转换、媒体转码等能力;3.深入场景的内容分析能力:配置智能媒体管理,挖掘课堂质量问题;4.强大的元数据管理:配合 TableStore,灵活查询检索数据,深入数据分析.在线教育解决方案.1.混合云存储将客户本地与公共云存储无缝的结合,提供了混合云架构下数据...
来自: 解决方案
< 1 2 3 4 ... 10 >
共有10页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用