基于弹性计算的AI推理
基于弹性计算的AI推理
场景描述 本方案适用于使用GPU进行AI在线推理的场 景。在推理之前,模型已经训练完成。例如,刷脸 支付中,我们在刷脸的时候,就是推理的一个过 程。再比如图像分类,目标检测,语音识别,语 义分析等返回结果的过程。 解决问题 使用GPU云服务器搭建推理环境 使用容器服务Kubernetes版构建推理 环境 使用NAS存储模型数据 使用飞天AI加速推理工具加速推理 产品列表 GPU云服务器 容器服务Kubernetes版 NAS共享存储
发布日期:20220320 I 企业上云实践 基于弹性计算的 AI推理最佳实践|演示环境说明 方案架构 用户通过域名访问推理服务,如 demo中通过 notebook提供网页式的运行环境,推理服务器部署在 中模型和文件都存放在共享存储 NAS上。发布日期:20220320 II 企业上云实践 基于弹性计算的 AI推理最佳实践|演示环境说明 最佳实践...
来自: 最佳实践 相关产品:云服务器ECS,文件存储NAS,容器服务 ACK
云服务器 ECS
阿里云服务器ECS是一种处理能力可弹性伸缩的云主机虚拟服务器,它使服务器托管更安全稳定,可降低开发运维成本,支持包年包月、按量付费等模式,方便财务更好管理
相关产品云服务器ECS本产品专有网络 VPC弹性公网 IP负载均衡SLB云数据库RDS一键部署电商行业业务及数据库上云电商行业业务及数据库上云的常见架构,推荐使用通用型u1实例,提供充足的库存和算力保障降本增效将电商业务和数据库上云,减少了硬件投入和运维成本;同时ECS的弹性伸缩和自动化运维能力,可以根据业务需求自动...
来自: 云产品
专有云企业版
阿里云专有云企业版是面向政企客户的全栈云平台,可一键式弹性扩展至公共云,提供不同应用场景需求下的混合云方案,支撑企业级核心应用平滑上云。
通用关系数据库场景.分布式关系数据库PolarDB-X,解决并发性能瓶颈问题,分布式SQL引擎、弹性平滑扩展、读写分离、高性能.高并发在线访问场景.数据仓库AnalyticDB,适用超大规模、高性能、高可靠在线实时计算查询,以及数据仓库复杂数据处理场景.大规模实时分析场景.数据传输工具DTS,支持25+数据源引擎,支持跨引擎、跨...
来自: 云产品
混合云存储
阿里云混合云存储包括混合云存储阵列、混合云CPFS存储、混合云分布式存储等多种产品类型。本地存储可以通过云缓存、云同步、云备份等方式无缝连通云存储,轻松实现云端一体。
通用存储协议全支持,一个产品满足多种存储类型需求.3节点起步,线性横向扩,最高支持4096节点.统一资源池,支持盘级粒度定义存储服务类型.解决方案与优势.可实现一套产品统一数据中心多样化的存储需求.可实现敏捷部署和按需灵活扩.方案效果与价值.对象存储OSS.混合云备份HBR.混合云容灾HDR.推荐搭配使用.混合云分布式...
来自: 云产品
云上成本优化workshop
云上成本优化workshop
某金融科技公司,它主要提供信贷,理财,电商等 服务,目前已经拥有千万级注册用户。该公司在将 在线业务系统和大数据业务从自建 IDC 机房迁移 到阿里云后,今年大数据集群经历过多次因为资 源不足导致弹性扩容失败的故障,运维负责人非 常苦恼。由于该公司从事互联网金融的借贷业务, 白天的催收非常依赖晚上大数据计算的结果,若 因为资源不足导致计算结果失败则意味着白天催 收业务员无事可做,会对公司业务造成严重影响。 后来,通过阿里云解决方案架构师建议的方案,将 大数据集群迁移到资源较充足的可用区以及配置 弹性伸缩多规格 ECS 选型增加交付成功率等方 法,目前已阶段性的解决因资源不足导致弹性扩 容失败的问题,但该方案在 Spot 计算资源不足 时,启用大量按量收费算力,带来了较高的成本, 并且抢占式实例和按量付费实例都不保证资源 100%交付,还是存在交付失败的可能性,特别是 在双 11 期间由于其他客户的资源需求上升带来 的资源挤兑客观上存在,就进一步增加了弹性扩 容失败的风险,从而影响业务正常运行。
在本案例里,采用 serverless版本的 Kubernetes来模拟业务应用的运行平台,这种 类型的托管服务,无需创建和管理 K8s里面的 Master和 worker,其底层基于 ECI 实例,按容器实例的使用资源量和时长(秒)计费 ASK的主要有以下几点优势:降低用户 kubernetes的门槛,无需管理 Node节点 无需考虑节点的容量规划 以 Pod为...
来自: 最佳实践 | 相关产品:云服务器ECS,负载均衡 SLB,弹性公网IP,容器服务 ACK,日志服务(SLS),NAT网关,函数计算,E-MapReduce,云数据库PolarDB,弹性容器实例 ECI,存储容量单位包,预留实例券,Hologres
超级计算集群实现自然语言处理训练
超级计算集群实现自然语言处理训练
场景描述 本方案适用于自然语言训练场景,使用神龙 GPU云服务器(SCCGN6)+CPFS进行NLP的 训练,采用Bert模型。这里不使用容器,直接 使用裸机进行NLP的Bert训练,使用飞天AI加 速训练工具可以有效提升多机多卡的训练效率。 解决问题 使用神龙GPU云服务器搭建NLP训练环 境 使用SCC的RDMA网络 使用CPFS存储训练数据 使用飞天AI加速训练工具加速训练 产品列表 神龙GPU云服务器(SCCGN6) SCC超级计算集群 CPFS共享存储
这里不使 用容器,直接使用裸机进行NLP的Bert训 练,使用AIACC可以有效提升多机多卡的 训练效率。解决问题  使用神龙GPU云服务器搭建NLP训练 环境  使用SCC的RDMA网络 使用CPFS存储训练数据   使用AIACC加速训练 产品列表  神龙GPU云服务器(SCCGN6) SCC超级计算集群  CPFS共享存储云服务器ECS(产品名称)...
来自: 最佳实践 | 相关产品:文件存储NAS,超级计算集群
RAM角色集成企业OpenLDAP身份认证
RAM角色集成企业OpenLDAP身份认证
场景描述 本文介绍阿里云RAM使用KeyCloak集成企业OpenLDAP, 管理员工的身份及权限。配置RAM角色与KeyCloak 用户 /用户组的映射关系,实现企业员工使用企业OpenLDAP账 号以单点登录(SSO)的方式访问阿里云控制台。 解决问题 快速部署OpenLDAP及用户创建。 快速部署KeyCloak,并与OpenLDAP实现用户联 合。 阿里云角色SSO配置。 KeyCloak用户绑定RAM角色SSO。 KeyCloak用户组绑定RAM角色SSO。 产品列表 访问控制RAM 专有网络VPC 云服务器ECS 容器镜像服务ACR
产品或服务 配置项 说明 专有网络 名称 demo IPv4网段 推荐网段 192.168.0.0/16 交换机 名称 vsw_a 可用区 张家口 可用区 A IPv4网段 192.168.0.0/24 云服务器 计费方式 按量付费 地域 华北 3(张家口)可用区 A 实例 架构:x86计算 分类:计算 计算 c6 ecs.c6.2xlarge(8 vCPU,16 GiB)购买实例数量:1 台 镜像 公共镜像...
来自: 最佳实践 | 相关产品:块存储,专有网络 VPC,云服务器ECS,访问控制,容器镜像服务 ACR,云速搭
基于弹性供应组构建大数据分析集群
基于弹性供应组构建大数据分析集群
场景描述 基于弹性供应组(APG)搭建spark计算集 群,提供一键开启跨售卖方式、跨可用区、 跨实例规格的计算集群交付模式的实践。 方案优势 1.超低成本:跨售卖方式提供计算实 例,按秒计费,可全部使用spot实例 交付,最高可省90%成本。 2.稳定可靠:跨可用域、跨实例规格, 降低spot被集体释放的风险;自动托 管,分钟级巡检,动态保证集群的算 力。 3.快速交付:单次可在5分钟内交付 2000个实例。 4.多策略组合:可分别指定spot和按量 实例的交付策略,以及差额补足的策 略,包括成本最低、打散和折中。 解决问题 1.大规模计算集群成本高。 2.创建ECS实例方式单一,无法跨计费 方式、可用区及规格等核心参数。 3.当可用区资源紧张,无法自动保证基于 spot类型的稳定算力。 产品列表 专有网络VPC 云服务器ECS
集群计算能力规划中,即是实例规格的 vCPU来作为权 重,整个供应组的容量就是 48vCPU。并按照 1.2.集群计算能力规划中的规划,来配 置供应组容量。步骤4 在模板设置页面,完成以下配置,并单击下一步:确认创建。模板主要分为启动模板和扩展模板,启动模板是利用了实例启动模板的能力,配置实 例的操作系统、cloud-init...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,弹性公网IP
阿里云解决方案基因专题
阿里云解决方案包括通用解决方案, 行业解决方案和生态解决方案,沉淀阿里云十年、百万用户最全面的业务场景,结合阿里巴巴集团技术创新能力,提供云原生、数据智能、零售、金融、制造等多个领域的解决方案。
3.本地IDC集群提供无服务化的集群扩,可以在公有云快速创建资源,加入到线下的集群中,解决业务高峰的问题.应用统一管理,线上线下跨地域融合.基因数据管理方案.生物信息分析流程管理.基因行业弹性高性能计算.基因行业容器混合云.下载阿里云基因行业介绍.提供快速、敏捷、低成本的大规模基因数据存储分析服务.云上基因...
来自: 解决方案
智能应对流量变化,容器化集群的弹性攻略
本方案使用ALB和ACK智能分配网络流量,提高应用的高可用性和吞吐量,使用Kubernetes的cluster-autoscaler社区开源组件以及HPA内置组件进行弹性伸缩,提升资源利用率。
产品解决方案文档与社区权益中心定价云市场合作伙伴支持与服务了解阿里云备案控制台容器化集群的弹性攻略容器化应用的弹性伸缩方案介绍方案优势方案部署方案权益智能应对流量变化,容器化集群的弹性攻略本方案使用应用负载均衡(ALB)和容器服务 Kubernetes 版(ACK)智能分配网络流量,提高应用的高可用性和吞吐量,使用...
来自: 解决方案
灵活调度,高效编排,容器化管理云上应用
本方案介绍如何快速地使用容器镜像服务ACR构建镜像,使用镜像在ACK中部署应用,使用ALB作为Ingress对外提供服务。
一键部署手动部署方案权益优惠购买免费试用解决方案推荐智能应对流量变化,容器化集群的弹性攻略本方案使用应用负载均衡(ALB)和容器服务 Kubernetes 版(ACK)智能分配网络流量,提高应用的高可用性和吞吐量,使用Kubernetes的cluster-autoscaler社区开源组件以及Kubernetes的Horizontal Pod Autoscaler(HPA)内置组件...
来自: 解决方案
容器多云统一监控日志
<em>容器</em>多云统一监控日志
多云、混合云成为常态,Forrester 报告中指出,未来 89% 的企业至少使用两个云,74% 的企业至少使用三个甚至更多公有云,在面对多云/混合云这样大的趋势下,Gartner报告指出,安全、运维复杂性、财务复杂性是多云架构的主要挑战,本方案给出了在多云/混合云场景下,构建基于容器环境下的统一管理、统一监控和统一日志方案,解决多云、混合云场景下,运维复杂性问题。 应用场景 客户在阿里云以外的其他云服务商(AWS、Azure、GCP、TencentCloud、HuaweiCloud等)或者IDC基于容器(Kubernetes)运行业务系统,希望构建容器场景下的统一监控日志系统,方便做不同大屏和问题分析定位。 解决问题 •构建容器多云统一监控和日志系统,在一个平台可以看到不同环境系统的运行情况。
 分布式云容器平台ACKOne:是阿里云面向混合云、多集群、分布式计算、 灾等场景推出的企业级云原生平台,ACKOne可以连接并管理您任何地域、任 何基础设施上的Kubernetes集群,并提供一致的管理和社区兼容的API,支持 对计算、网络、存储、安全、监控、日志、作业、应用、流量等进行统一运维管 控。 日志服务SLS:是云...
来自: 最佳实践 | 相关产品:专有网络 VPC,容器服务 ACK,日志服务(SLS),应用实时监控服务 ARMS ,微服务引擎
容器场景下的应用性能监控、调用链拓扑、内存剖析
<em>容器</em>场景下的应用性能监控、调用链拓扑、内存剖析
场景描述 随着云原生及微服务技术的普及,越来越多的系统已经通过云原生和微服务技术实现企业的降本增效,同时因微服务及云原生的复杂性给系统运维带来非常大的挑战,云原生应用监控arms通过全链路应用监控,从端到端及代码级别的链路下钻能力、CPU、内存持续剖析及诊断能力,帮助客户降低系统故障定位难度,此demo,您将体验arms的链路监控、内存剖析等能力 应用场景 微服务+容器场景下链路调用拓扑,调用链可以显示出服务之间的调用顺序和层次关系,帮助开发人员理解和追踪代码的执行流程 在分布式系统中,一个请求往往需要通过多个服务来完成。当出现问题时,如请求超时、错误或异常,很难快速定位问题所在。 解决问题 调用链可以帮助运维人员解决以下问题: · 故障排查:当请求失败或出现错误时,调用链可以显示整个请求的路径和每个服务的执行情况,从而帮助运维人员快速定位问题所在。 · 性能优化:通过调用链,运维人员可以了解请求在系统中的执行时间和瓶颈所在,从而进行优化。 · 系统监测:调用链可以提供实时的系统监测和分析,帮助运维人员了解系统的健康状况和资源利用情况。
请阅读计费模式后,点击立即开通 文档版本:20240329 25容器场景下的应用性能监控、调用链拓扑、内存剖析 场景验证 点 击 应 列 表,切 换 到 新 版 控 制 台 当 看 到 应 名 称 后 出 现每秒请求等信息,表明部署成功。以下截图为新版本ARMS控制台 文档版本:20240329 26容器场景下的应用性能监控、调用链拓扑、内存...
来自: 最佳实践 | 相关产品:弹性公网IP,容器服务 ACK,NAT网关,微服务引擎
通过ES兼容接口方式使用Kibana访问SLS数据
通过ES兼容接口方式使用Kibana访问SLS数据
自建ELK日志系统的客户迁移到阿里云日志服务SLS后,对SLS查询分析语法不太熟悉的客户,可以继续沿用原有的查询分析习惯,在不改变使用方式习惯的情况下,通过Elasticsearch兼容接口的方式使用Kibana访问SLS。
解决问题  如何使用ACK部署Wordpress应用,并使 SLS采集容器日志到SLS  最大程度保障Elasticsearch查询分析方 案迁移SLS的平滑度; 降低将日志引擎从Elasticsearch切换为 日志服务的使用难度;产品列表  专有网络VPC  云服务器ECS  容器服务Kubernetes版  日志服务SLS  阿里云交换机 最佳实践频道 最佳...
来自: 最佳实践 | 相关产品:云服务器ECS,容器服务 ACK,日志服务(SLS)
基于MSE云原生网关实现全链路灰度
基于MSE云原生网关实现全链路灰度
在微服务场景中,应用间的调用是随机的。当您部署的Spring Cloud应用或Dubbo应用存在升级版本时,可能会导致无法将具有一定特征的流量路由到应用的目标版本。通过MSE提供的全链路灰度能力,您无需修改业务代码,就可以实现端到端的全链路流量控制。泳道可以将应用的相关版本隔离成一个独立的运行环境。通过设置泳道规则,可以将满足规则的请求流量路由到目标版本的应用。
此次方案涉及到云产品费用10.381元/时(不含流量产品,数据参考20240428官网数据)步骤9等待分钟级后,查看应用状态为“部署成功”部署时长与产品有关系,本次方案涉及到ACK等云产品,预计部署10分钟左右。文档版本:20240429 12基于MSE云原生网关实现全链路灰度最佳实践 步骤10部署完成后,可查看部署报告,方便以后运维...
来自: 最佳实践 | 相关产品:弹性公网IP,容器服务 ACK,NAT网关,微服务引擎
SAE-ACK应用双跑最佳实践
SAE-ACK应用双跑最佳实践
场景描述 实现ACK、SAE中部署的应用在东西向和南北向互通,实现SAE-ACK应用双跑。 应用场景 该最佳实践应用于两类场景: l 因为SAE支持更丰富自动扩缩指标(比如QPS,RT,TCP连接数等),所以将相对稳态的应用部署在ACK中,将相对弹性波动大的应用部署在SAE,借助SAE更强大的自动扩缩应对流量洪峰。 l 将K8s架构迁移到Serverless架构时,需要平滑过渡,所以该最佳实践中的双跑架构可以有效帮用户平滑的完成迁移。
容器服务 Kubernetes 版 ACK(ContainerServiceforKubernetes):全球首批通过 Kubernetes一致性认证的容器服务平台,提供高性能的容器应用管理服务,支持企业级 Kubernetes容器化应用的生命周期管理,让您轻松高效地在云端运行Kubernetes容器化应 。 微服务引擎MSE(MicroservicesEngine):一个面向业界主流开源...
来自: 最佳实践 | 相关产品:容器服务 ACK,Serverless 应用引擎,微服务引擎
基于MSE云原生网关同城多活
基于MSE云原生网关同城多活
借助云原生微服务MSE网关,MSE配置注册中心的同城容灾多活微服务应用。构建一个经典的微服务场景,实现同城容灾的步骤,体现云原生相关产品在用户上云,高可用同城容灾多活场景下的能力。
容器服务 Kubernetes 版 ACK:容器服务 Kubernetes 版(简称 ACK)提供高性 能且可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。在 2021 年,ACK 成为国内唯一连续三年入选 Gartner 公共云容器报告的产品,同 时在 2022 年成为国内唯一进入 Forrester 领导者象限的产品。ACK 整合了阿里 云的虚拟化、...
来自: 最佳实践 | 相关产品:弹性公网IP,容器服务 ACK,NAT网关,微服务引擎
容器安全
阿里云容器安全,为云原生安全容器化环境提供全链路的容器生命周期产品解决方案和安全应用防护能力,针对容器运行时威胁检测与防御,帮助企业构建容器化应用安全体系。
立即购买免费试用快捷入口控制台文档API价格计算器产品定价01:40检测K8s集群被植入挖矿容器产品动态内容甄选新功能容器主动防御能力默认策略发布2023.09.08新功能容器防篡改功能二期优化功能发布2023.09.15新功能支持容器资产暴露面检测2023.07.03配置指导如何接入K8s自建集群2023.05.18视频专区容器安全功能演示2022.09.14...
来自: 云产品
基于云速搭CADT快速构建药物筛选批量计算环境-serverless版
基于云速搭CADT快速构建药物筛选批量计算环境-serverless版
本方案基于云速搭 CADT提供一个快速构建云上Serverless版HPC批量计算环境的模板,针对生物制药领域的药物筛选场景,提供开箱即用的整套解决方案工具包,整个云上环境仅需1个小时即可完成自动化部署搭建。
基于云速搭 CADT快速部署药物筛选批量计算环境-Serverless版 场景描述 部署架构 本方案基于云速搭 CADT 提供一个快速构建云上 Serverless版 HPC批量计算环境的模板,针对生物 制药领域的药物筛选场景,提供开箱即的整套解 决方案工具包,整个云上环境仅需 1个小时即可完 成自动化部署搭建。解决问题 快速构建适用于药物...
来自: 最佳实践 | 相关产品:弹性公网IP,文件存储NAS,日志服务(SLS),容器镜像服务 ACR,操作审计,密钥管理服务,云防火墙,弹性高性能计算E-HPC,云速搭
< 1 2 3 4 5 >
共有5页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用