12年来最大飞跃!黄仁勋发布史上最强GPU,世界首个实时光线追踪新一代图灵架构

简介: 刚刚,英伟达CEO黄仁勋在SIGGRAPH 2018上大秀肌肉,推出世界首个实时光线追踪GPU,基于图灵架构,这是自2006年以来GPU实现的最最重大的飞跃,每秒处理高达10GB Rays,这将彻底改变整个计算机图形处理界的工作流程。

“我们努力了十年。”黄仁勋说:“这是GPU自2006年以来最重大的飞跃。”

在刚刚的SIGGRAPH 2018主旨演讲中,黄仁勋将英伟达的GPU实力展现得淋漓尽致。

虽然摩尔定律已见终点,但对于英伟达GPU来说,似乎完全不存在。黄仁勋认为,历史正处于一个转折点,存在一个全新的定律——“GPU加速定律”(注:不是黄教主本人说的)。

307890cdb86b0ea6ae79e2fb9f2ea100da96b823

在演讲中,黄仁勋发布了世界首款实时光线追踪GPU——NVDIA QUADRO RTX,每秒处理高达10GB Rays,做AI能够达到每秒500 Trillion Tensor Ops,16TFLOPS + 16TIPS,使用NVLink 扩展后,每秒处理速度最高能达到100GB。


在长达5分钟的时间里,黄仁勋骄傲地举起实物,“以前有谁曾用GB做过单位?有谁曾经想过能够用GB做单位?”

黄仁勋自豪地重复了很多遍:“每秒10 GB Rays!”

735f3e774467edcf1a74dd974b677f46c6450d0b

实时渲染光线在环境中的反射和散射,是计算机图形处理界的“圣杯”,这个过程非常复杂,涉及光线在各种不同介质上的多次反射和散射。在上世纪70年代,相关算法年首次提出时,一小时只能模拟一帧,相当于每小时处理60像素。

而现在,英伟达让它提升到了“每秒10 GB Rays”。

这样得益于两大核心技术:英伟达全新研发的基于图灵架构的升级版光线实时追踪RT Core,以及深度学习Tensor Core。

4c1441dff2a0082076beec04a5909adb1e97e76f

黄仁勋感叹,为了设计RT Core架构,英伟达用了整整十年时间研发,终于实现了在一块GPU上进行光线实时追踪,这个以前业界曾经认为不可能的事情。

全新的Turing架构,“这是GPU自2006年以来最重大的飞跃。”黄仁勋说。

从Step-function到Realism,全新的混合渲染模型,光线追踪、计算以及AI,现在好用,也考虑到了未来。

英伟达再一次,实力展现了深度学习时代GPU超乎想象的计算力。

c042baf9b251932371ff326311cfc62c8643b325

实时渲染光线变化效果

全新图灵架构,全球首个实时光线追踪GPU!

黄仁勋表示,英伟达RTX是首款基于 Turing™架构的 GPU,革新了 5000 万设计师和艺术家的工作,使他们能够实时渲染逼真的场景,为其工作流程添加基于 AI 的新功能,享受复杂模型和场景的交互性。

dd301fa8478b035a3eaba41e201b479a9c8f0e23

PASCAL和TURING架构对比

cdf954ec59cc034836a2e80276f4b8734bac45bb

关键在于结合深度学习(Tensor Core)和全新实时光线追踪架构(RT Core)

4c92298d9d420a4bf5a5070a56155e81743aa7a8

图灵架构相比PASCAL实现6倍速度提升


黄仁勋还发布了NVIDIA Quadro RTX 8000Quadro RTX 6000Quadro RTX 5000,实现不同性能的硬件加速光线追踪、AI、先进的阴影和模拟等。

27a012d4271ef74261ebe1db5faca697fa7a4024

同时推出的还有完整的软件堆栈:

105e9e734614d3e45492041252de56470df3b217

以及 Quadro RTX Server,这是一种参考架构,用于从数据中心提供高度可配置、按需呈现和虚拟工作站解决方案。

504a8ef547e7e7c0e8e620ebb3de391099cb77aa

在展示Quadro RTX Server时,黄仁勋在现场展示了他最喜欢的前后对比:

71b1ccb8ef6ffdf521115927ed81975f28efa1ac

现在的渲染集群

3e7586a82bc9b7eaa5a6ddd14fda9061348d1610

使用英伟达RTX服务器

只要1万美元,简直是抢钱啊,”黄仁勋感叹,然后是那句经典的:

“你买得越多,省得越多。”

提前5年实现,彻底革新计算机图形处理

英伟达专业可视化副总裁 Bob Pette 表示:“Quadro RTX 标志着全球计算机图形行业新纪元的开始。”

“用户现在可以享受的强大功能,原来被认为至少是 5 年后才可能实现的。设计师和艺术家现在可以通过光线追踪照片写实的细节,实现复杂的设计和视觉效果。电影工作室和制片公司现在可以通过渲染工作负载实现更高的吞吐量,从而大大节省时间和成本。”

e4f01e54bcd7ab466881c7ddd6e87ca0fd913fe9

Quadro RTX 专业 GPU

Quadro RTX GPU 专为要求最苛刻的视觉计算工作负载而设计,例如用于电影和视频内容创建; 汽车和建筑设计; 以及科学可视化。

它们突破性的技术远远超过上一代,包括:

新的 RT Cores ,可以通过物理上精确的阴影、反射、折射和全局光照,实时跟踪物体和环境的光线。
Turing Tensor Cores 可加速深度神经网络训练和推理,这对于 AI 增强的渲染、产品和服务至关重要。
新的 Turing Streaming Multiprocessor 架构 ,具有多达 4608 个 CUDA 内核,可并行提供高达每秒 16 万亿次浮点运算和每秒 16 万亿次整数运算,可加速真实世界的复杂模拟。
先进的 可编程着色技术 ,可提高复杂视觉效果和图形密集型体验的性能。
首次实现超高速三星 16Gb GDDR6 内存 ,支持更复杂的设计,庞大的建筑数据集,8K 电影内容等。
NVIDIANVLink 将两个 GPU 与一个高速链路结合,可将内存容量扩展至 96GB,并通过高达 100GB/s 的数据传输提高驱动性能。
提供 USB Type-C和 VirtualLink的硬件支持 ,这是一种新的开放行业标准,旨在通过单个 USB-C™连接器满足下一代 VR 耳机的功率,显示和带宽要求。
提高 VR 应用性能的新技术 ,包括可变速率着色、多视图渲染和 VRWorks 音频。

Quadro RTX 服务器

Quadro RTX 服务器为数据中心的按需渲染定义了一个新标准,可以轻松配置按需渲染节点以进行批处理和交互式渲染。

Quadro RTX 服务器将 Quadro RTX GPU 与新的 Quadro Infinity 软件(将在 2019 年第一季度推出)相结合,提供强大而灵活的架构,以满足创意专业人士的需求。Quadro Infinity 将允许多个用户通过虚拟工作站访问单个 GPU,从而显着提高数据中心的密度。最终用户还可以根据他们的特定需求轻松配置渲染节点和工作站。

Quadro RTX 服务器预装了业界领先的内容创建和渲染软件,提供功能强大且易于部署的渲染解决方案,可从小型安装扩展到最大的数据中心,成本仅为只有 CPU 渲染的四分之一。

e4e454178f4a727b446ee2d462650d8698cf3d27


原文发布时间为:2018-08-14本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。原文链接: 12年来最大飞跃!黄仁勋发布史上最强GPU,世界首个实时光线追踪新一代图灵架构
相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
30天前
|
人工智能 缓存 机器人
【2024】英伟达吞噬世界!新架构超级GPU问世,AI算力一步提升30倍
英伟达在加州圣荷西的GTC大会上发布了全新的Blackwell GPU,这款拥有2080亿个晶体管的芯片将AI性能推向新高度,是公司对通用计算时代的超越。Blackwell采用多芯片封装设计,通过两颗GPU集成,解决了内存局部性和缓存问题,提供20 petaflops的FP4算力,是上一代产品的5倍。此外,新平台降低了构建和运行大规模AI模型的成本和能耗,使得大型语言模型推理速度提升30倍。黄仁勋表示,Blackwell标志着AI算力在近八年内增长了一千倍,引领了技术边界拓宽的新趋势。
|
1月前
|
存储 机器学习/深度学习 并行计算
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、高性能计算架构区别
在我们选购阿里云服务器的时候,云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选,有的用户并不清楚他们之间有何区别,本文主要简单介绍下不同类型的云服务器有何不同,主要特点及适用场景有哪些。
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、高性能计算架构区别
|
2月前
|
机器学习/深度学习 存储 算法
【GPU】深入理解GPU硬件架构及运行机制
【GPU】深入理解GPU硬件架构及运行机制
149 0
|
3月前
|
人工智能 自然语言处理 大数据
大模型+知识图谱双驱架构:新一代《知识语义框架SPG》白皮书
白皮书展望了SPG与LLM双向驱动的技术架构。通过基于SPG构建统一的图谱技术框架,可以屏蔽复杂的技术细节以支持新业务的快速部署,真正实现知识图谱技术的框架化、平民化、普惠化。
|
6月前
|
机器学习/深度学习 TensorFlow Go
美团视觉GPU推理服务部署架构优化实战
美团视觉GPU推理服务部署架构优化实战
131 0
|
8月前
|
机器学习/深度学习 弹性计算 并行计算
阿里云服务器租用收费价格参考,GPU/FPGA/ASIC架构云服务器收费价格表
GPU/FPGA/ASIC架构阿里云服务器有GPU计算型gn7r、GPU计算型gn7i、GPU计算型gn6v、GPU计算型gn6i等实例规格可选,不同实例规格的租用收费价格是不一样的,本文为大家汇总了目前基于GPU/FPGA/ASIC架构下的各个实例规格的阿里云服务器收费标准,以供参考。
阿里云服务器租用收费价格参考,GPU/FPGA/ASIC架构云服务器收费价格表
|
3月前
|
人工智能 机器人 Serverless
魔搭大模型一键部署到阿里云函数计算,GPU 闲置计费功能可大幅降低开销
魔搭大模型一键部署到阿里云函数计算,GPU 闲置计费功能可大幅降低开销
580 2
|
4月前
|
机器学习/深度学习 存储 弹性计算
阿里云GPU云服务器有哪些版本
阿里云GPU云服务器有哪些版本
|
4月前
|
机器学习/深度学习 人工智能 弹性计算
阿里云GPU云服务器有哪些方案
阿里云GPU云服务器有哪些方案
|
1月前
|
机器学习/深度学习 存储 弹性计算
阿里云GPU服务器价格多少钱?2024年阿里云GPU服务器价格配置及性能测评
2024年阿里云GPU服务器是一款高性能的计算服务器,基于GPU应用的计算服务,多适用于视频解码、图形渲染、深度学习、科学计算等应用场景。阿里云GPU服务器具有超强的计算能力、网络性能出色、购买方式灵活、高性能实例存储等特点。 阿里云提供了多种配置的GPU服务器,包括gn6v、gn6i、vgn6i-vws和gn6e等,这些服务器配备了不同型号的GPU计算卡、不同规格的内存和存储空间,可以满足不同用户的计算需求。同时,阿里云还为新用户提供了特惠价格,包年购买更是低至3折起,使得用户可以更加经济地购买到高性能的GPU服务器。
149 0

热门文章

最新文章