自建Hadoop迁移到阿里云EMR
自建Hadoop迁移到阿里云EMR
场景描述 场景1:自建Hadoop集群数据(HDFS)迁移到 阿里云EMR集群的HDFS文件系统; 场景2:自建Hadoop集群数据(HDFS)迁移到 计算存储分离架构的阿里云EMR集群,以OSS 和JindoFS作为EMR集群的后端存储。 解决的问题 客户自建Hadoop迁移到阿里云EMR集群的 技术方案; 基于IPSecVPN隧道构建安全和低成本数据 传输链路 产品列表 E-MapReduce,VPC,ECS,OSS,VPN网关。
详情请查看 https://www.aliyun.com/product/emapreduce HDFS Hadoop 分布式文件系统(HDFS)被设计成适合运行在通用硬件上的分布式 系统,它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式 文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉 价的机器上。HDFS能提供高吞吐量的...
来自: 最佳实践 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,VPN网关,E-MapReduce,云速搭
自建Hive数据仓库跨版本迁移到阿里云Databricks数据洞察
自建Hive数据仓库跨版本迁移到阿里云Databricks数据洞察
场景描述 客户在IDC或者公有云环境自建Hadoop集群构建数据仓库和分析系统,购买阿里云Databricks数据洞察集群之后,涉及到数仓数据和元数据的迁移以及Hive版本的订正更新。 方案优势 1. 全托管Spark集群免运维,节省人力成本。 2. Databricks数据洞察与阿里云其他产品(OSS、RDS、MaxCompute、EMR)进行深度整合,支持以这些产品为数据源的输入和输出。 3. 使用Databricks Runtime商业版引擎相比开源Spark性能有3-5倍的提升。 解决问题 1. Hive数仓数据迁移OSS方案。 2. Hive元数据库迁移阿里云RDS方案。 3. Hive跨版本迁移到Databricks数据洞察使用Delta表查询以提高查询效率。
基于阿里云分布式文件系统和 SSD盘 高性能存储,RDS支持 MySQL、SQL Server、PostgreSQL、PPAS(高度兼容 Oracle)和 MariaDB引擎,并且提供了容灾、备份、恢复、监控、迁移等方面的 全套解决方案。详见:https://www.aliyun.com/product/rds/mysql 文档版本:20210425 III 自建 Hive数据仓库跨版本迁移到阿里云 Databricks...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,文件存储HDFS,spark
Spark on ECI大数据分析
Spark on ECI大数据分析
场景描述 方案优势 1.计算引擎弹性扩缩容,兼顾资源弹性与计 算资源成本优化。 2.计算与存储分离架构,结合阿里云原生云 存储产品,海量数据湖优势。 3.Kubernetes原生的调度性能优势,提升在 大规模分析作业时的分析性能优势分。 4.集群资源隔离和按需分配。 解决问题 1.计算资源弹性能力不足,计算资源成本管 控能力欠缺. 2.集群资源调度能力和隔离能力不足。 3.计算与存储无法分离,大数据量分析时出 现数据存储资源瓶颈。 4.Spark submit方式提交分析作业参数支持 有限等缺点。 产品列表 容器服务Kubernetes版(ACK) 弹性容器实例(ECI) 文件存储HDFS 对象存储OSS 专有网络VPC 容器镜像服务ACR
应用范围 需要使用 Spark on Kubernetes解决方案的用户 对 Spark大数据分析平台计算资源成本控制考虑的用户 需要有灵活可扩展计算平台资源弹性及管控的用户 名词解释 文件存储 HDFS:阿里云文件存储 HDFS是面向阿里云 ECS实例及容器服务等计 算资源的文件存储服务,允许用户像在 Hadoop分布式文件系统中管理和访问数 据,...
来自: 最佳实践 | 相关产品:专有网络 VPC,对象存储 OSS,容器服务 ACK,弹性容器实例 ECI,文件存储HDFS
自建Hive数仓迁移到阿里云EMR
自建Hive数仓迁移到阿里云EMR
场景描述 客户在IDC或者公有云环境自建Hadoop集群构 建数据仓库和分析系统,购买阿里云EMR集群之 后,涉及到将数据仓库和Hive元数据的数据库迁 移上云。目前主流Hive数据仓库迁移场景为1.x 版本迁移到阿里云EMR(Hive2.x版本),涉及到 数据订正更新步骤。 解决的问题 Hive数据仓库的数据迁移方案 Hive元数据库的迁移方案 Hive跨版本迁移后的数据订正 产品列表 E-MapReduce,VPC,ECS,OSS,VPN网关。
基于阿里云分布式文件系统和 SSD盘高性能 存储,RDS支持 MySQL、SQL Server、PostgreSQL、PPAS(高度兼容 Oracle)和 MariaDB引擎,并且提供了容灾、备份、恢复、监控、迁移等方面的全套解决 方案。文档版本:20210721 IV 自建Hive数据仓库跨版本迁移到阿里云 EMR 目录 目录 文档版本信息.I 法律声明.II 前言.III 目录.V ...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,VPN网关,E-MapReduce,云速搭
自建Hadoop迁移MaxCompute
自建Hadoop迁移MaxCompute
场景描述 客户基于ECS、IDC自建或在友商云平台自建了大数 据集群,为了降低企业大数据计算平台的成本,提高 大数据应用开发效率,更有效保障数据安全,把大数 据集群的数据、作业、调度任务以及业务数据库整体 迁移到MaxCompute和其他云产品。 解决的问题 自建Hadoop集群搬迁到MaxCompute 自建Hbase集群搬迁到云Hbase 自建Kafka或应用数据准实时同步到 MaxCompute 自建Azkaban任务迁移到Dataworks任务 产品列表 MaxCompute,Dataworks、云数据库Hbase版、Datahub、VPC,ECS。
名词解释 HDFS Hadoop 分布式文件系统(HDFS)被设计成适合运行在通用硬件上的分布式 系统,它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式 文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉 价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应 用。VPN...
来自: 最佳实践 | 相关产品:云服务器ECS,DataWorks,大数据计算服务 MaxCompute,云数据库 HBase 版,数据总线,云速搭
CDH迁移升级CDP最佳实践
CDH迁移升级CDP最佳实践
当前 CDH 免费版停止下载,终止服务,针对需要企业版服务能力并且CDH 升级过程对业务影响较小的客户,通过安装新的 CDP 集群,将现有数据拷贝至新集群,然后将新集群切换为生产集群,升级过程没有数据丢失风险,停机时间较短,适合大部分互联网客户升级使用。
4.单击 View as XML,并插入capacity-scheduler.xml由转换器工具生成的完整 。5.添加必要的配置属性。6.单击保存更改。7.搜索yarn-site并找到 yarn-site.xml的 YARN 服务高级配置片段(安全阀)。8.单击以 XML 格式查看并以 XML 格式添加所需的配置。(可选)使用+和-来添加和删除属性。9.单击保存更改。10.重新启动 ...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云速搭
通过RocketMQ事务消息实现分布式事务
在日益复杂的分布式系统中,确保数据一致性成为一大挑战。本方案利用RocketMQ强大事务消息能力,确保跨服务事务的高可靠与最终一致性,同时还实现了事务处理的高效执行,是构建高性能、高可用分布式系统的关键路径。
在日益复杂的分布式系统中,确保数据一致性成为一大挑战。本方案利用RocketMQ强大事务消息能力,确保跨服务事务的高可靠与最终一致性,同时还实现了事务处理的高效执行,是构建高性能、高可用分布式系统的关键路径。通过RocketMQ事务消息实现分布式事务 在日益复杂的分布式系统中,确保数据一致性成为一大挑战。本方案利用...
灵活配置,高效执行,快速集成分布式任务调度
企业级应用中经常会遇到数据定时处理、文件处理、报表生成等定时处理的任务,对于任务配置和执行率有较高要求,本文介绍如何利用SchedulerX来实施企业级定时任务的调度与管理,为定时任务提供高效、稳定和灵活的解决方案。
在线部署 适用客户 有托管任务管理需求 需要处理大规模数据处理任务 实现复杂任务编排与多样化任务类型支持的场景 方案优势 为什么选择 SchedulerX 阿里云分布式任务调度服务(SchedulerX)通过高可用性、高可靠性、强大的分布式架构和丰富的调度策略,为企业提供了一种灵活、高效、安全的任务调度解决方案。高可用性与高...
通过PAI-灵骏分布式训练和部署Llama 2模型
灵骏支持业界各类流行的开源大语言模型,包括Llama2系列、Bloom系列、Falcon系列、GLM/ChatGLM系列,以及领域大模型galactica等的高效训练和部署。本方案整体可用于企业样本标注、创意文本生成、智能对话助手、文本类创作辅助等场景。
人工智能平台 PAI 对象存储 文件存储NAS 应用场景 技术方案的广泛应用场景 企业智能客服 在无需准备过多语料素材的情况下,实现专属定制版企业适配大语言模型。智能方案推荐 定制化的模型拥有分析学习能力,结合实际需求,辅助给出个性化且高度定制化的方案推荐。游戏场景NPC对话 通过Llama2构建的游戏NPC对话模型,相较于...
文件下载加速及成本优化
方案使用阿里云CDN来加快源站内容的分发速度,通过分布于全球的CDN节点来缓存源站的文件内容,并且调度用户请求到最近的CDN节点上快速下载所需文件,因此能够加快文件下载速度,提高网站性能。核心优势包括改善用户体验,提高网站可访问性,在降低源站服务器负载的同时,还能够节约源站的流量成本。
在线部署 适用客户 寻求成本效益高的内容分发解决方案 需提升应用加载速度和全球访问体验 需在不同地区提供一致的访问速度 方案优势 为什么使用CDN实现文件下载加速 CDN具有全球节点分布,智能调度系统,以及高效的缓存和安全技术等优势,确保快速、稳定的内容分发和卓越的用户体验。降低流量成本 将OSS上的文件缓存到CDN...
告别资源瓶颈,函数计算驱动多媒体文件处理
本方案推荐使用函数计算,利用事件驱动和异步任务的方式,将文件处理任务与核心应用解耦,同时依靠函数计算自动弹性扩展和按使用付费的优势,提升高并发的处理效率和服务稳定性。
在应用中处理文件 使用函数计算处理文件 稳定性弱 计算资源消耗大,容易产生CPU、内存和IO资源争抢和系统负载过高,影响系统稳定性。稳定性 高可用保障 解耦核心业务和文件处理,文件处理函数由云厂商提供高可用保障。扩展难度大 动态扩展难,处理峰值流量需要预先配置大量计算资源。扩展性 弹性伸缩 自动弹性伸缩,应对...
CentOS到Alinux操作系统迁移
操作系统迁移解决方案为企业提供ECS实例运行的操作系统EOL(生命周期结束)后的替换或升级服务。满足在控制台一键备份和迁移的能力,具有界面易用、过程可靠、数据安全的优势。
操作系统迁移解决方案为企业提供ECS实例运行的操作系统EOL(生命周期结束)后的替换或升级服务。满足在控制台一键备份和迁移的能力,具有界面易用、过程可靠、数据安全的优势。CentOS到Alinux操作系统迁移 操作系统迁移解决方案为企业提供ECS实例运行的操作系统EOL(生命周期结束)后的替换或升级服务。满足在控制台一键...
云速搭部署 NAS 文件系统
云速搭部署 NAS <em>文件系统</em>
本实践通过云速搭构建一个 NAS,并将 NAS 文件系统挂载到 ECS 的目录上。
详见 https://www.aliyun.com/product/ecs 文件存储 NAS:阿里云文件存储 NAS(Apsara File Storage NAS)是一个可大 规模共享访问,弹性扩展的高性能云原生分布式文件系统。支持智能冷热数据 层,有效降低数据存储成本。广泛应用于企业级应用数据共享、容器、AI机器学 习、Web 服务和内容管理、应用程序开发和测试、媒体...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,文件存储NAS,云速搭CADT
基于OSS Object FC实现非结构化文件实时处理最佳实践
基于OSS Object FC实现非结构化<em>文件</em>实时处理最佳实践
现在绝大多数客户都有很多非结构化的数据存在OSS中,以图片,视频,音频居多。举一个图片处理的场景,现在各种终端种类繁多,不同的终端对图片的格式、分辨率要求也不同,所以一张图片往往会有很多张衍生图,那如果所有的衍生图都存在OSS中,那存储的成本会增加,所以就可以通过OSS Object FC的方案,在不同的终端请求时,对OSS中的原图基于终端的要求做实时处理,然后响应返回,这样OSS中只需要存储原图即可。音视频也有类似的场景。
基于OSSObjectFC实现非结构化文件实时处理最佳实践 业务架构 场景描述 基于阿里云OSS和函数计算共同实现的产品化 集成解决方案OSSObjectFC,实现可以OSS 中的非结构化数据在读取时插入自定义业务逻 辑,对非结构化数据做实时处理后再返回。应用场景 现在绝大多数客户都有很多非结构化的数据存 在OSS中,以图片,视频,音频...
来自: 最佳实践 | 相关产品:对象存储 OSS,函数计算
大模型RAG对话系统部署
大模型RAG对话<em>系统</em>部署
大模型RAG对话系统最佳实践,旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术,从而显著提升对话系统的性能,使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践,您可以掌握构建一个大模型RAG对话系统的完整开发链路。
文档版本:20240131 4 大模型RAG对话系统部署最佳实践 最佳实践概述 人工智能平台 PAI(Platform of Artificial Intelligence):是面向企业客户及开发者,提供轻量化、高性价比的云原生人工智能,涵盖 DSW交互建模、Designer拖 拽可视化建模、DLC分布式训练到 EAS模型在线部署的全流程。检索分析服务 Elasticsearch版...
来自: 最佳实践 | 相关产品:Elasticsearch,机器学习PAI-EAS,机器学习平台,云速搭
基于云速搭CADT快速构建药物筛选批量计算环境-serverless版
基于云速搭CADT快速构建药物筛选批量计算环境-serverless版
本方案基于云速搭 CADT提供一个快速构建云上Serverless版HPC批量计算环境的模板,针对生物制药领域的药物筛选场景,提供开箱即用的整套解决方案工具包,整个云上环境仅需1个小时即可完成自动化部署搭建。
文件存储 NAS:阿里云文件存储 NAS是一个可共享访问,弹性扩展,高可靠,高性 能的分布式文件系统。它基于 POSIX 文件接口,天然适配原生操作系统,提供共 享访问,同时保证数据一致性和锁互斥。文件存储 NAS中的数据自动地在可用区 内以多副本冗余方式存储,避免数据的单点故障风险,提供高达 99.999999999%的 数据可靠性...
来自: 最佳实践 | 相关产品:弹性公网IP,文件存储NAS,日志服务(SLS),容器镜像服务 ACR,操作审计,密钥管理服务,云防火墙,弹性高性能计算E-HPC,云速搭
文件存储NAS
文件存储(Network Attached Storage,简称NAS),是阿里云对外提供的兼容POSXI接口的分布式文件存储,容量和处理能力的弹性扩展,按实际容量付费真正使您专注于核心业务。
文件存储 NAS播放视频 阿里云文件存储 NAS(Apsara File Storage NAS)是一个可大规模共享访问,弹性扩展的分布式文件系统。广泛应用于企业级应用数据共享、容器数据存储、AI 机器学习、Web 服务和内容管理、应用程序开发和测试、媒体和娱乐工作流、数据库备份等场景。“存”享优惠火热来袭,存储全产品百元包年 开通/...
来自: 云产品
云上高并发系统改造
云上高并发<em>系统</em>改造
场景描述 随着业务的发展,系统并发压力越来越大,如何 进行系统改造以满足高并发场景的业务需求成 为了一个技术难题。本实践抽象于客户的实际场 景,提供高并发下系统改造的理论指导和部分实 操演示。主要适用于以下场景: 1.系统并发压力大,需要进行系统应用改造。 2.数据层并发压力大,需进行分库分表改造。 3.数据库数据量巨大,亟待分库分表解决查询 和写入瓶颈的场景。 方案优势/解决问题 1.在水平扩展阶段,我们除了通过SLB做负载 均衡外,我们可以通过SLB下挂nginx的方 式,增加负载均衡侧的可扩展性 2.在数据库拆分阶段,在做好数据规划后,我 们借助DTS进行数据迁移,通过DRDS将 RDS MySQL的数据拆分到多个分库和分 表中。 产品列表 专用网络VPC 负载均衡SLB 云服务器ECS 数据库RDSMySQL 数据传输服务DTS PrivateZone 分布式关系型数据库DRDS
基于阿里云分布式文件系统和 SSD盘高性能存储,RDS 支持 MySQL、SQL Server、PostgreSQL、PPAS和 MariaDB引擎,提供了容 文档版本:20220506(发布日期)III 云上高并发系统改造 前言 灾、备份、恢复、监控、迁移等方面的全套解决方案,彻底解决数据库运维的 烦恼。更多信息,请参见:...
来自: 最佳实践 | 相关产品:云服务器ECS,云数据库RDS MySQL 版,数据传输,云解析 PrivateZone,云原生分布式数据库PolarDB-X,云速搭CADT
Function Compute构建高弹性大数据采集系统
Function Compute构建高弹性大数据采集<em>系统</em>
当前互联网很多场景都存在需要将大量的数据信息采集起来然后传输到后端的各类系统服务中,对数据进行处理、分析,形成业务闭环。比如游戏行业中的游戏发行、游戏运营,产互行业中的数字营销,物联网、车联网行业中的硬件、车辆信息上报等等。这些场景普遍存在数据采集量大、数据传输需要稳定且吞吐量大的特点,给整个数据采集传输系统带来很大的挑战。在这个场景中,有三个关键的环节,数据采集、数据传输、数据处理。该最佳实践主要涉
基于阿里云分布式文件系统和 SSD盘高性能 存储,RDS支持 MySQL、SQL Server、PostgreSQL、PPAS(Postgre Plus Advanced Server,高度兼容 Oracle数据库)和 MariaDB TX引擎,并且提供了 容灾、备份、恢复、监控、迁移等方面的全套解决方案,彻底解决数据库运维的烦 恼。更多信息,请参见:www.aliyun.com/product/rds 函数...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,日志服务(SLS),函数计算,消息队列 Kafka 版,云速搭CADT
系统运维管理 OOS
阿里云系统运维管理(简称OOS)提供的云上自动化运维服务,通过执行模板来完成任务的自动化运行,可以使用OOS管理ECS、RDS、SLB、VPC等云产品,提升日常运维管理效率
产品解决方案文档与社区权益中心定价云市场合作伙伴支持与服务了解阿里云AI 助理备案控制台系统运维管理产品简介产品优势产品功能入门与试用技术解决方案安全合规常见问题系统运维管理 OOS云上统一的自动化管理与运维平台,支持对ECS、RDS、SLB等多种云产品进行编排,提升日常运维管理效率。立即购买免费试用快捷入口控制台...
来自: 云产品
< 1 2 3 4 >
共有4页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用