场景描述 本方案适用于自然语言训练场景,使用神龙 GPU云服务器(SCCGN6)+CPFS进行NLP的 训练,采用Bert模型。这里不使用容器,直接 使用裸机进行NLP的Bert训练,使用飞天AI加 速训练工具可以有效提升多机多卡的训练效率。 解决问题 使用神龙GPU云服务器搭建NLP训练环 境 使用SCC的RDMA网络 使用CPFS存储训练数据 使用飞天AI加速训练工具加速训练 产品列表 神龙GPU云服务器(SCCGN6) SCC超级计算集群 CPFS共享存储
类别 配置项 说明 基础配置 计费方式 按量付费 地域 华东2(上海)可用区G 实例 架构:超级计算集群 分类:GPU型 实例规格:企业级GPU计算型sccgn6 ecs.sccgn6.24xlarge(96vCPU,384GiB) 购买实例数量:2台 5企业上云实践 基于超级计算集群的自然语言处理AI训练 最小购买数量:2台 镜像 公共镜像 CentOS 7.564...