场景描述 本方案适用于自然语言训练场景,使用神龙 GPU云服务器(SCCGN6)+CPFS进行NLP的 训练,采用Bert模型。这里不使用容器,直接 使用裸机进行NLP的Bert训练,使用飞天AI加 速训练工具可以有效提升多机多卡的训练效率。 解决问题 使用神龙GPU云服务器搭建NLP训练环 境 使用SCC的RDMA网络 使用CPFS存储训练数据 使用飞天AI加速训练工具加速训练 产品列表 神龙GPU云服务器(SCCGN6) SCC超级计算集群 CPFS共享存储
在CPFS文件系 统处于运行状态时,禁止对该安全组进行修改、删除等操作,否则会影响CPFS的IO业务。3.3.挂载文件系统 参考 https://help.aliyun.com/document_detail/185156.html 步骤1 查询挂载点对应的管理节点安全组信息 登录云服务器ECS控制台。 在左侧导航栏,单击网络与安全>安全组。 在安全组列表页面,在顶部...