Spark on ECI大数据分析
Spark on ECI大数据分析
场景描述 方案优势 1.计算引擎弹性扩缩容,兼顾资源弹性与计 算资源成本优化。 2.计算与存储分离架构,结合阿里云原生云 存储产品,海量数据湖优势。 3.Kubernetes原生的调度性能优势,提升在 大规模分析作业时的分析性能优势分。 4.集群资源隔离和按需分配。 解决问题 1.计算资源弹性能力不足,计算资源成本管 控能力欠缺. 2.集群资源调度能力和隔离能力不足。 3.计算与存储无法分离,大数据量分析时出 现数据存储资源瓶颈。 4.Spark submit方式提交分析作业参数支持 有限等缺点。 产品列表 容器服务Kubernetes版(ACK) 弹性容器实例(ECI) 文件存储HDFS 对象存储OSS 专有网络VPC 容器镜像服务ACR
同时结合阿里云原生的文件存储 HDFS/对象存储 OSS等存储产品,将大数据分析作业运行在 Kubernetes集群上采用 Spark on ACK+ECI的方案架构,同时利用 Spark Operator方式做到轻松完成在计 算与存储分离架构的云原生平台上运行大数据分析作业。文档版本:20200409 2 Spark on ECI大数据分析 环境准备 1.环境准备 1.1.创建容器...
来自: 最佳实践 相关产品:专有网络 VPC,对象存储 OSS,容器服务 ACK,弹性容器实例 ECI,文件存储HDFS
影视数据分发汇集与传输加速
影视数据分发汇集与传输加速
场景描述 使用阿里云对象存储服务OSS及OSSBrowser 工具,实现影视数据多用户多地域分发、汇集, 以及传输加速的最佳实践。 解决问题 1.跨地域、多角色、分权限文件上传、下载。 2.基于OSS及其客户端实现Serverless文件 分发服务(可替换传统FTP服务)。 3.OSS文件传输全球加速。 产品列表 lOSS lRAM
影视数据分发汇集与传输加速 场景描述 业务架构 使用阿里云对象存储服务 OSS及 OSSBrowser 工具,实现影视数据多用户多地域分发、汇集,以及传输加速的最佳实践。解决问题 1.跨地域、多角色、分权限文件上传、下载。2.基于 OSS及其客户端实现 Serverless文件 分发服务(可替换传统 FTP服务)。3.OSS文件传输全球加速。产品...
来自: 最佳实践 | 相关产品:对象存储 OSS,访问控制
云速搭部署Flink应用
云速搭部署Flink应用
本水煎通过云速搭实现一个DataHub+Flink的实时流计算引擎架构,利用DataHub收集原始数据,推送到Flink进行基于流式数据的分析和应用。
已开通以下服务:ᅳ 专有网络 VPC ᅳ 云速搭 CADT ᅳ 实时计算 Flink ᅳ 数据总线 DataHub ᅳ 对象存储 OSS 文档版本:20211103 2 云速搭部署 Flink应用 产品介绍 产品介绍 云速搭 CADT:是一款为上云应用提供自助式云架构管理的产品,显著地降低应 用云上管理的难度和时间成本。本产品提供丰富的预制应用架构模板,同时也...
来自: 最佳实践 | 相关产品:专有网络 VPC,对象存储 OSS,实时计算,数据总线,云速搭CADT
数据湖-在线学习场景数据分析
数据湖-在线学习场景数据分析
场景描述 本场景以在线教育中一个答题闯关类的应用为 例,使用WebServer来模拟演示这类日志数据 的分析处理。通过Nginx和Pythonflask搭建 WebServer,模拟应用中的关键页面,比如登 录、课程内容等,之后构造若干用户使用的模拟 日志数据,投递到数据湖进行分析后获取应用 PV、UV、课程内容访问排行、平均得分等等。 解决问题 基于数据湖(EMR+OSS)搭建大数据平台。 EMR和OSS使用和配置。 数据统一存储到OSS。 产品列表 E-MapReduce 对象存储OSS 云服务器ECS 访问控制RAM 专有网络VPC
此外,对于Hadoop集群上的任务,不同类型的任务对于机器配置的要求不同,比如 推荐和算法业务可能集群的计算能力要求较高,而 ETL 类型的任务,可能又对存 或内存要求较高。因此我们通过EMR和OSS的方案,可以通过EMR集群指定 机型来达到优化架构、减低成本的要求。1.2.JindoFS简介 当数据量达到一定级别时,比如日...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,访问控制,E-MapReduce
自建Hadoop迁移到阿里云EMR
自建Hadoop迁移到阿里云EMR
场景描述 场景1:自建Hadoop集群数据(HDFS)迁移到 阿里云EMR集群的HDFS文件系统; 场景2:自建Hadoop集群数据(HDFS)迁移到 计算存储分离架构的阿里云EMR集群,以OSS 和JindoFS作为EMR集群的后端存储。 解决的问题 客户自建Hadoop迁移到阿里云EMR集群的 技术方案; 基于IPSecVPN隧道构建安全和低成本数据 传输链路 产品列表 E-MapReduce,VPC,ECS,OSS,VPN网关。
OSS 对象存储服务(Object Storage Service,OSS)是一种海量、安全、低成本、高 可靠的云存储服务,适合存放任意类型的文件。容量和处理能力弹性扩展,多种 存储类型供选择,全面优化存储成本。JindoFS JindoFS是一种云原生的文件系统,结合 OSS和本地存储,成为 E-MapReduce 产品的新一代存储系统,为上层计算提供了高效...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,VPN网关,E-MapReduce,云速搭
云速搭部署基于OSS的Nextcloud网盘
云速搭部署基于OSS的Nextcloud网盘
通过云速搭实现基于OSS的NextCloud网盘的部署,这里使用ECS的UserData特性自动安装MySQL等组件,减少配置工作量。
资源分类 资源名称 网段 Region 成都-VPC vpc-chengdu-001 192.168.0.0/16 AZ vswitch-a 192.168.0.0/24 云服务器 ECS ecs-对象存储 OSS nextcloud-test-112-文档版本:20220328 10 云速搭部署基于 OSS的 Nextcloud 网盘 CADT部署基于OSS的Nextcloud网盘应用架构 2.CADT部署基于 OSS的 Nextcloud网盘应用架构 2.1....
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,云速搭CADT
E-HPC低成本实现量化策略回测
E-HPC低成本实现量化策略回测
在量化交易场景下,量化策略的构建流程一般包括:想法、数据获取、建模、回测、结果分析等,在回测过程中往往需要海量的算力,进行大量数据的分析和处理,如何快速、高效和低成本的进行批量任务的调度,并快速获取结果是量化领域遇到的普遍挑战,这也是云计算能够带给客户的巨大优势。
需要高弹性高性能方案 – 快速扩缩容、专有网络 VPC 分布式并行处理、快速获取高规格的服 对象存储 OSS 务器(例如大内存,高 CPU数,多 GPU 弹性高性能计算 E-HPC 卡)等。弹性公网 IP 文件存储 NAS 最佳实践频道 阿里云最佳实践分享群 云服务器 ECS(产品名称)文档模板(手册名称)/文档版本信息 阿里云 E-HPC低成本实现...
来自: 最佳实践 | 相关产品:专有网络 VPC,对象存储 OSS,弹性公网IP,文件存储NAS,弹性高性能计算E-HPC,云速搭
数据迁移上云
数据迁移上云
随着越来越多的企业选择将业务系统上云,各种类型的数据如何便捷、平滑的迁移上 云,成了用户上云较为关注的点;业务上云后,因为业务或者其他方面调整等因素, 也存在如跨区域,跨账号等数据迁移的场景。针对以上需求,阿里云上提供了较为丰 富的工具(如ossimport)、服务(在线迁移服务),旨在能够帮助客户便捷进行数据迁 移。 本文通过云架构设计工具CADT来快速创建云上基础资源,并以杭州区域来模拟线 下IDC(或友商),深圳区域模拟阿里云云上资源。通过云上的工具命令、服务来提 供常见数据迁移场景的最佳实践。
使用在线迁移服务,节省您 部署迁移工具的时间,另外图形化的界面也更方便您将第三方数据轻松迁移至阿里云 对象存储 OSS,也可以在对象存储 OSS 之间进行灵活的数据迁移。本最佳实践以 IDC的 FTP服务器的文件迁移至 OSS作为测试场景。其中杭州 ECS 安装 FTP服务,模拟 IDC的 FTP服务器。在线迁移需注意以下问题:(1)线...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,文件存储NAS,云企业网,云速搭CADT
企业上云数据安全
企业上云数据安全
场景描述 企业是否选择上公共云,或者哪些系统或数据上 公共云,对数据安全的关心是重要因素之一。本 最佳实践重点在于介绍狭义的数据加密存储安 全范畴,即首先使用SDDP产品进行敏感数据发 现和分级分类,然后对高级别敏感数据进行按 需、不同类型的全链路加密存储。 解决问题 1.帮助客户发现敏感数据 2.对敏感数据进行分类、分级 3.对不同级别的数据如何选择加密方式 4.具体如何进行加密 产品列表 敏感数据识别SDDP 密钥管理服务KMS 云数据库RDS 对象存储OSS
具体如何进行加密 产品列表 敏感数据识别 SDDP 密钥管理服务 KMS 云数据库 RDS 对象存储 OSS 阿里云最佳实践分享群 最佳实践频道 如二维码过期,请搜索群号:31852400 文档版本信息 企业上云数据安全 阿里云 企业上云数据安全 最佳实践 文档版本:20150122(发布日期)II 文档版本信息 企业上云数据安全 文档版本信息 文本...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,密钥管理服务,敏感数据保护,云速搭CADT
EHPC分子动力学最佳实践
EHPC分子动力学最佳实践
本文档以一个简单的分子动力学算例,介绍阿里云EHPC分子动力学最佳实践。
阿里云账号下已开通以下阿里云服务:ᅳ EHPC服务 ᅳ 文件存储 NAS服务 ᅳ 对象存储 OSS ᅳ 云服务器 ECS ᅳ 云速搭 CADT 下载本文用到的操作命令和代码:以 CentOS主机为例:#yum-y install git#git clone https://code.aliyun.com/best-practice/230.git 其中,samplecode.sh包含了所有使用的命令。如果你是 windows主机,...
来自: 最佳实践 | 相关产品:云服务器ECS,对象存储 OSS,文件存储NAS,弹性高性能计算E-HPC,云速搭CADT
数据库异地灾备
数据库异地灾备
场景描述 适用于不满足于单地域,对数据可靠性 (RPO)和服务可用性(RTO)要求更高 的,希望防范断电、断网等机房故障,抵 御地震、台风等自然灾害,具备异地容灾 备份恢复能力的客户业务场景。 解决问题 1.实时备份,RPO达到秒级 2.表级恢复,故障恢复时间大大缩短 3.长期归档,自动管理备份生命周期 4.异地灾备,构建数据库灾备中心 产品列表 专有网络VPC 云服务器ECS 弹性公网IP(EIP) 负载均衡SLB 云数据库RDSMySQL 数据库备份服务DBS 对象存储服务OSS 数据湖分析服务DLA 数据管理服务DMS 数据传输服务DTS
(风险说明:选择“遇到同名 则重命名”选项后,在恢复期间,存在小概率情况,增量数据无法恢复,推 荐方案:恢复前,手工处理目标数据库同名对象)本例中选遇到同名对象则重命名。恢复对象:ᅳ 源数据库对象:可以选择恢复全部数据库,或者选择恢复其中一个数据库,或 者恢复其中几张表。ᅳ 已选择数据库对象:DBS恢复...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,对象存储 OSS,数据管理,数据湖分析,数据库备份DBS,云速搭CADT
基于湖仓一体架构使用MaxComputeOSS湖数据分析预测
基于湖仓一体架构使用MaxCompute<em>对</em>OSS湖数据分析预测
本篇最佳实践先创建EMR集群作为数据湖对象,Hive元数据存储在DLF,外表数据存储在OSS。然后使用阿里云数据仓库MaxCompute以创建外部项目的方式与存储在DLF的元数据库映射打通,实现元数据统一。最后通过一个毒蘑菇的训练和预测demo,演示云数仓MaxCompute如何对于存储在EMR数据湖的数据进行加工处理以达到业务预期。
E-MapReduceEMR 最佳实践频道  对象存储OSS http://bp.aliyun.com  日志服务SLS 阿里云最佳实践分享群  云速搭CADT 钉钉搜索钉群号31852400入群 微服务引擎MSE用户交流群 钉钉搜索钉群号43525005207入群云服务器ECS(产品名称)文档模板(手册名称)/文档版本信息 基于湖仓一体架构使用MaxComputeOSS湖 数据分析...
来自: 最佳实践 | 相关产品:对象存储 OSS,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,API网关,数据湖构建,云速搭
自建ElasticSearch迁移阿里云
自建ElasticSearch迁移阿里云
场景描述 以ElasticSearch为例,演示搭建模拟业务系统、 VPN网关和IPSecVPN隧道,介绍如何通过快照 的方式,将ElasticSearch索引数据安全备份到 阿里云OSS存储空间,以及介绍如何将备份在 OSS的快照仓库恢复到阿里云ElasticSearch实 例,进一步达到ElasticSearch迁移上云的目的。 解决的问题 自建ElasticSearch的云上/跨云备份需求。 自建ElasticSearch迁移到阿里云 ElasticSearch服务实例。 产品列表 VPC,ECS,VPN网关,OSS,阿里云ElasticSearch,云速搭CADT
创建 V1.1 2019/09/19 筱晖-文档优化 V1.2 2019/12/03 云魁 增加快照恢复 到阿里云 ElasticSearch 实例 V1.3 2021/08/02 游士 使用 CADT迭 代文档并优化 文档版本:20210802 I 自建 ElasticSearch快照备份 OSS 前言 前言 概述 客户业务系统部署在 IDC或者公有云环境,通常会部署基于 ELK的日志收集、 、分析和展现系统...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,VPN网关,Elasticsearch,云速搭
利用低成本链路完成业务数据迁移上云
利用低成本链路完成业务数据迁移上云
场景描述 随着云计算被越来越多的客户所接受,除业务系 统上云外,很多客户已经把业务数据搬迁上云。 业务数据量一般都比较大,迁移上云需要大量的 网络带宽,BGP费用比较高。阿里云对用户开 放所需地域购买静态单线共享带宽包的权限(移 动/联通/电信均可),可用为迁移数据有效降低 成本。 解决问题 1.业务数据上云网络成本高 产品列表 专有网络VPC 云服务器ECS 网络存储NAS 共享带宽包
SAG(智能接入网关):https://help.aliyun.com/document_detail/69845.html  ECS(弹性计算云服务器)调用:https://help.aliyun.com/document_detail/102988.html  RDS(数据库):https://help.aliyun.com/document_detail/26224.html  OSS(对象存储):https://help.aliyun.com/document_detail/31948.html  ...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,文件存储NAS
FastGPU极速AI训练/推理
FastGPU极速AI训练/推理
利用 FastGPU工具一键构建阿里云上的AI训练/推理环境,并使用AIACC加速工具进行加速。
快速进行 AI POC性能测试 产品列表 如二维码过期,GPU云服务器 请搜索群号:31852400 文件存储 NAS(CPFS)对象存储 OSS 专有网络 VPC 云服务器 ECS(产品名称)文档模板(手册名称)/文档版本信息 阿里云 企业上云实践 FastGPU极速 AI训练/推理 最佳实践 文档版本:2021015 文档版本:20150122(发布日期)II FastGPU极速 ...
来自: 最佳实践 | 相关产品:块存储,专有网络 VPC,对象存储 OSS,文件存储NAS,文件存储 CPFS,GPU云服务器
EHPC工业仿真
EHPC工业仿真
场景描述 本实践适用于使用弹性高性能计算EHPC+ 对象存储OSS运行仿真软件进行模型仿真 的场景中,这里运行的是LAMMPS这款开 源的仿真软件,数据通过OSS上传。 解决问题 1.使用EHPC运行工业仿真软件 2.使用OSS存储数据和代码 3.可视化计算结果 产品列表 弹性高性能计算E-HPC 对象存储OSS
EHPC工业仿真 最佳实践 场景描述 部署架构图 本实践适用于使用弹性高性能计算 EHPC+对象存储 OSS运行仿真软件进行模型仿真的 场景中,这里运行的是 LAMMPS这款开源的 仿真软件,数据通过 OSS上传。解决问题 1.使用 EHPC运行工业仿真软件 2.使用 OSS存储数据和代码 3.可视化计算结果 产品列表 弹性高性能计算 E-HPC 对象存储...
来自: 最佳实践 | 相关产品:云服务器ECS,对象存储 OSS,弹性高性能计算E-HPC
游戏数据运营融合分析
游戏数据运营融合分析
场景描述 1.游戏行业有结构化和非结构化数据融合分 析需求的客户。 2.游戏行业有数据实时分析需求的客户,无法 接受T+1延迟。 3.对数据成本有一定诉求的客户,希望物尽其 用尽量优化成本。 4.其他行业有类似需求的客户。 方案优势/解决问题 1.秒级实时分析:依托ADB计算密集型实例, 秒级监控DAU等数据,为广告投放效果提 供有力的在线决策支撑。 2.高效数据融合分析:打通结构化和非结构化 数据,支撑产品体验分析;广告买量投放效 果实时(分钟级)分析,渠道的评估更准确。 3.低成本:DLA融合冷数据分析+ADB存储密 集型温数据分析+ADB计算密集型热数据分 析,在满足各种分析场景需求的同时,有效 地降低的客户的总体使用成本。 4.学习成本低:DLA和ADB兼容标准SQL语 法,无需额外学习其他技术。 产品列表 专有网络VPC、负载均衡SLB、NAT网关、弹性公网IP 云服务器ECS、日志服务SLS、对象存储OSS 数据库RDSMySQL、数据传输服务DTS、数据管理DMS 分析型数据库MySQL版ADS 数据湖分析DLA、QuickBI
产品列表 专有网络 VPC、负载均衡 SLB、NAT网关、弹性公网 IP 云服务器 ECS、日志服务 SLS、 象存储 OSS 数据库 RDS MySQL、数据传输服 务 DTS、数据管理 DMS 分析型数据库 MySQL版 ADS 数据湖分析 DLA、Quick BI 云服务器 ECS(产品名称)文档模板(手册名称)/文档版本信息 阿里云 游戏数据运营融合分析 最佳实践 文档...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,对象存储 OSS,云原生数据仓库AnalyticDB My,数据湖分析,Quick BI
Serverless图片分类和身份证过滤
Serverless图片分类和身份证过滤
场景描述 场景一:大型图库智能管理通过深度学习算法,自动识别图像中的常见的场景,客户可以基于函数计算对接智能媒体管理的图像识别功能,轻松实现图片的自动管理和分组,完成大型图像库的智能管理。 场景二:身份证图片过滤 通过扫描存储在OSSbucket中的图片,通 过智能媒体管理进行身份证识别,找到海量图片中的身份证图片,对敏感信息进行处理。 解决问题 1.通过无服务器计算实现图片处理自动化 2.OSS触发器的使用 3.使用函数计算调用阿里云的AIP或SDK 产品列表 函数计算 智能媒体管理IMM 对象存储OSS
使用函数计算调用阿里云的 AIP或 SDK 最佳实践频道 阿里云最佳实践技术分享群 产品列表 函数计算 智能媒体管理 IMM 对象存储 OSS 如二维码过期,请搜索群号:31852400 Serverless图片分类和身份证过滤 文档版本信息 阿里云 企业上云实践 Serverless图片分类和身份证过滤 文档版本:20200120 文档版本:20150122(发布日期)...
来自: 最佳实践 | 相关产品:对象存储 OSS,函数计算,智能媒体管理
云平台内部操作透明化
云平台内部操作透明化
场景描述 云平台基于用户的请求或监管要求等,进行的内 部操作对用户如果不可见,用户可能会担心自己 的数据是否收到了影响或者是否被触碰了,影响 用户对平台的信任。 解决问题 1.内部操作对用户可见 2.增强用户对平台的可信度 产品列表 操作审计Actiontrail 对象存储OSS 日志服务SLS
增强用户平台的可信度 产品列表  操作审计Actiontrail  对象存储OSS  日志服务SLS云服务器ECS(产品名称)文档模板(手册名称)/文档版本信息 阿里云 云平台内部操作透明化 最佳实践 文档版本:20200630 文档版本:20150122(发布日期)2云平台内部操作透明化 文档版本信息 文档版本信息 文本信息 属性 内容 文档...
来自: 最佳实践 | 相关产品:对象存储 OSS,日志服务(SLS),操作审计
自建Hive数据仓库跨版本迁移到阿里云Databricks数据洞察
自建Hive数据仓库跨版本迁移到阿里云Databricks数据洞察
场景描述 客户在IDC或者公有云环境自建Hadoop集群构建数据仓库和分析系统,购买阿里云Databricks数据洞察集群之后,涉及到数仓数据和元数据的迁移以及Hive版本的订正更新。 方案优势 1. 全托管Spark集群免运维,节省人力成本。 2. Databricks数据洞察与阿里云其他产品(OSS、RDS、MaxCompute、EMR)进行深度整合,支持以这些产品为数据源的输入和输出。 3. 使用Databricks Runtime商业版引擎相比开源Spark性能有3-5倍的提升。 解决问题 1. Hive数仓数据迁移OSS方案。 2. Hive元数据库迁移阿里云RDS方案。 3. Hive跨版本迁移到Databricks数据洞察使用Delta表查询以提高查询效率。
对象存储 OSS 3.Hive跨版本迁移到 Databricks数据洞察 专有网络 VPC 使用 Delta表查询以提高查询效率。阿里云最佳实践分享群 最佳实践频道 如二维码过期,请搜索群号:31852400 云服务器 ECS(产品名称)文档模板(手册名称)/文档版本信息 阿里云 自建Hive 数据仓库跨版本迁移到 阿里云Databricks数据洞察 文档版本:...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,文件存储HDFS,spark
< 1 2 3 4 ... 6 >
共有6页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用