寒武纪推出第二代云端AI芯片，采用16nm工艺性能比上代提升4倍-阿里云开发者社区

寒武纪推出第二代云端AI芯片，采用16nm工艺性能比上代提升4倍

2019-06-20 1701

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 寒武纪宣布推出第二代云端AI芯片思元270（MLU270）及板卡产品，目标是提供速度更快、功耗更低、性价比更高的AI加速解决方案。

雷锋网消息，2019年6月20日，寒武纪宣布推出第二代云端AI芯片思元270（MLU270）及板卡产品，目标是提供速度更快、功耗更低、性价比更高的AI加速解决方案。

据悉，思元270芯片采用TSMC 16nm工艺制造，其板卡产品可以通过PCIe接口快速部署在服务器和工作站内。寒武纪本次公开的思元270板卡产品面向人工智能推断任务，在ResNet50上推理性能超过10000fps。MLU270-S4 型板卡（半高半长）面向数据中心部署，集成16GB DDR4 内存，支持ECC；MLU270-F4型板卡（全高全长）采用主动散热设计，面向非数据中心部署场景，集成16GB DDR4 内存，支持ECC。面向人工智能训练任务的思元270训练版板卡产品将于本年度第四季度推出。

思元270采用寒武纪公司自主研发的MLUv02指令集，可支持视觉、语音、自然语言处理以及传统机器学习等高度多样化的人工智能应用，更为视觉应用集成了充裕的视频和图像编解码硬件单元。思元270芯片处理非稀疏深度学习模型的理论峰值性能提升至上一代MLU100的4倍，达到128TOPS（INT8）；同时兼容INT4和INT16运算，理论峰值分别达到256TOPS和64TOPS；支持浮点运算和混合精度运算。

官方表示，寒武纪在定点训练领域已实现关键性突破，思元270训练版板卡将可通过8位或16位定点运算提供卓越的人工智能训练性能，该技术有望成为AI芯片发展的重要里程碑。在系统软件和工具链方面，思元270继续支持寒武纪Neuware软件工具链，支持业内各主流编程框架。此外，为方便开发者更好地挖掘思元270超强的运算能力、开拓更多的应用领域，寒武纪将在近期向社区和开发者开放专用编程语言。