场景描述 本方案适用于自然语言训练场景,使用神龙 GPU云服务器(SCCGN6)+CPFS进行NLP的 训练,采用Bert模型。这里不使用容器,直接 使用裸机进行NLP的Bert训练,使用飞天AI加 速训练工具可以有效提升多机多卡的训练效率。 解决问题 使用神龙GPU云服务器搭建NLP训练环 境 使用SCC的RDMA网络 使用CPFS存储训练数据 使用飞天AI加速训练工具加速训练 产品列表 神龙GPU云服务器(SCCGN6) SCC超级计算集群 CPFS共享存储
审核人 说明 V1.0 2019/07/15 敬海 游圣行夜 创建 V1.1 2019/11/20 敬海 增加首页概览页,更新git地址 V1.2 2019/12/09 敬海 产品更新 V1.3 2020/02/02 敬海 更新架构图 V1.4 2020/12/10 敬海 AIACC更新及demo更新 V1.5 2021/03/08 敬海 更新文件链接等 I企业上云实践 超级计算集群实现自然语言处理训练 前言 概述 本文介绍...