请选择 进入手机版 | 继续访问电脑版

热点推荐

查看: 1036|回复: 31

NVIDIA GPU加速计算之路

[复制链接]

708

主题

716

帖子

8万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
80511
QQ
发表于 2019-12-30 13:38:13 来自手机 | 显示全部楼层 |阅读模式
NVIDIA从提出GPU以及CUDA中心开端,NVIDIA便开端逐渐迈出游戏圈,不断向全新的核算范畴建议攻势。时至今日,NVIDIA GPU核算从机器人、主动驾驶,一路扩展到云核算、医疗乃至是NASA火星登录方案。

是的,正如GTC CHINA 2019上,NVIDIA创始人兼CEO黄仁勋所言,就算摩尔定律走向完结,GPU加快核算将有机会成为未来的发展方向,GPU正在变得无所不能,也将无处不在。

NVIDIA GPU加快核算之路

云游戏与光线追寻全面开花以游戏发家的NVIDIA开场少不了游戏的戏份。开场黄仁勋便展现了《我的国际》RTX版本,这也是GTC主题讲演上首次展现《我的国际》RTX视频。

经过对光影的添加,这款沙盘化的游戏有了全新的演绎,不只水面变得更为真实,跟着视角、气候、时间变化,光影也呈现出不同的作用。



这套实时光纤追寻技能能够让开发者在添加光源之后,依托GeForce RTX显卡中的RT Core演算出光线途径,然后获得天然的光线作用,一起也减轻了游戏开发者手动考虑光影贴图的繁琐作业。

除了《我的国际》添加的光线追寻特效,GTC上黄仁勋还宣告了六款游戏正引进光线追寻,包含《边境》(Boundary)、《铃兰方案》(Convallaria)、《暗影火炬》(F.I.S.T.)、Project X(项目代号)、《无限法则》(Ring of Elysium)以及《轩辕剑柒》(Xuan-Yuan Sword VII)。



一起老黄还特意在台上演示了《光亮记忆:无限》的光线追寻DEMO。重点在于担任《光亮记忆》的飞燕群岛个人作业室主力仅有一人,经过一人之力完结美术、程序以及最新的光线追寻技能功用,也足以见得虚幻引擎对光线追寻现已供给了相当优秀的支撑,能够更为轻松调用GeForce RTX的光线追寻功用。



此外,现在宣告支撑光线追寻游戏阵营包含:《光亮记忆:无限》(Bright Memory: Infinite)、《赛博朋克2077》(Cyberpunk 2077)、《消逝的光芒2》(Dying Light 2)、《我的国际》(Minecraft)、《逆水寒》(Justice)、《剑侠情缘叁网络版》(JX3 Online)、《重生边际》(SYNCED: Off-Planet)、《仙剑奇侠传七》(Sword And Fairy 7)、《看门狗:军团》《Watch Dogs: Legion》以及《吸血鬼:避世血族2》 (Vampire: The Masquerade – Bloodlines 2)。

在推动光线追寻技能进驻预习的一起,NVIDIA与腾讯游戏协作的START云游戏服务也进入了测验阶段。

类似NVIDIA在北美和欧洲推出的GeForce NOW云游戏服务,腾讯START能够让玩家在在配置不足的设备上也能玩AAA游戏。腾讯游戏方案将扩展其云游戏产品。

NVIDIA与腾讯还将建立一个一个游戏联合创新实验室。两边将共同探究AI在游戏、游戏引擎优化和新光照技能(包含光线追寻和光线烘焙)中的新运用。借着START服务春风,英伟达的云游戏技能也总算能够在国内付诸实践。



RTX Studio加快内容创造显卡功用也早已不局限在游戏中,英伟达针对RTX Studio的产品线覆盖也现已从GeForce RTX 2060笔记本覆盖到8路Quadro RTX 8000作业站。在加上NVIDIA OMNIVERSE所供给的3D制作流程的协作渠道,创造者能够经过不同的分工协同作业。



现在NVIDIA OMNIVERSE也现已正式进驻建筑行业AEC,能够做到不管本地仍是云端,干流运用都能依托NVIDIA RTX展开建模、上色、动画、视觉作用等等。在讲演台上,老黄也豪气的演示怎么运用8 路 RTX 8000 的 RTX 服务器对深圳华润大厦实时烘托。



在电影、视觉特效范畴,瑞云云端烘托渠道也宣告装备NVIDIA RTX GPU。瑞云现在是全亚洲最大的云烘托渠道,2019年火爆的《战狼2》、《哪吒》、《流浪地球》烘托均来自瑞云,超过85%的中国电影作业室都是瑞云的客户。很快,第一批5000片RTX GPU也将会在2020年上线。

在现场,黄仁勋也不忘搬出那句经典台词:“买的越多,省得越多。”针对烘托作业,RTX GPU能够做到速度比CPU快12倍,价格低7倍。本来CPU上需求花费485个小时的烘托场景,交给RTX GPU现在或许只需求40个小时就能完结。



让未来所见所得跳出大家耳熟能详的游戏、烘托范畴,NVIDIA也现已将视野放向了外太空。NASA方案在2030年将6位宇航员送向火星,着陆器将以12000千米/小时的速度进入火星大气层,而且必须准确焚烧减速并在6分钟内降落在火星外表。

为此NASA凭借NVIDIA GPU经过FUN3D流体李璇软件进行了数十万次火星着陆场景模仿,将发生的150TB数据变成了可视化,现在,NVIDIA DGX-2上现已能够凭借Magnum IO GPU Direct Storage技能,对数据进行可视化处理,这在曾经是不敢想象的。



假如登陆火星还不行,科研人员也正在凭借GPU内的CUDA中心对全基因组进行测序。经过全基因组测序剖析整个基因序列,能够检测由遗传性疾病引起的DNA变异。为此,NVIDIA推出了一套Parabricks 基因组剖析工具包,凭借CUDA基因测序能够加快到30-50倍完结。

而行将到来的5G与NVIDIA也相同有关系。现在NVIDIA现已与爱立信展开协作,经过CUDA中心,能够进步5G vRAN功用,特别是在杂乱的空间内,CUDA能够加快处理物理空间内的信号优化的问题。

针对国际上最普及的ARM,NVIDIA也给出了一套能够与ARM配套的处理方案。得益于PCIe标准,GPU也能够轻松与ARM完结衔接。根据ARM,NVIDIA推出了NVIDIA HPC for ARM首个参阅架构,能够运用Marvell、Ampere、富士通亦或许其他ARM的HPC处理器与Volta GPU衔接。更厉害的是,每个ARM CPU最多能够衔接4块Volta GPU,扩展功用极端恐惧。



在现场,黄仁勋也毫不小气的经过VMD ON ARM经过CUDA演示NAMD分子动力学模型的结果可视化处理,凭借Marvell ThunderX2以及NVIDIA V100,并经过NVIDIA Optix光线追寻器,并完成远程流式传输。

与此一起,TensorFlow作为当今最重要的可言、云核算、工业、上也范畴的HPC运用,也相同被NVIDIA CUDA on ARM所支撑。

而跟着深度学习不断发掘,NVIDIA在5年左右的时间内将练习功用进步了300倍以上,凭借Volta、Tensor Core GPU、Chip-on-wafer封装、HBM 3D堆栈存储器、NVLink、DGX体系,AI加快变得更快。



事实上NVIDIA AI现已影响到了各行各业,它出现在运输、医疗、金融、零售中,NVIDIA也不断为每种场景打造不同的渠道,例如用于深度学习练习的DGX,用于超大规模云的HGX,用于边际核算的EGX,用于自治体系的AGX。

现在,NVIDIA AI也现已被运用到百度引荐体系中,100多个引荐模型在百度中付诸实践,这些模型每周都会进行更新,主动学习用户潜在兴趣,新条目和特征被持续更新。现在百度巨大的用户潜在兴趣数据包含了千亿维稀少离散特征和10TB embedding词表,只要经过GPU加快练习,才能在如此大规模的练习中加快且节约成本。

相同,阿里巴巴也接祖了NVIDIA加快核算渠道大规模布置先进的AI技能,包含T4 GPU、cuBLAS、自界说混合精度和推理加快软件等。确保双十一期间2684亿人民币,每秒几十亿次引荐请求,确保全天销售额顺利推动,所以一切也都凭借了NVIDIA AI的运算支撑。在NVIDA AI加持下,阿里巴巴现已嫩稳固支撑比过去杂乱6倍的模型,然后使点击率进步10%。比较于CPU,T4将咱们最大模型的吞吐量进步了100倍。



TensorRT 7的功用攀升在协助各大厂商推动AI的一起,NVIDIA也发布了全新的NVIDIA TensorRT 7推理软件,内置新式深度学习编译器。

该编译器能够主动优化和加快递归神经网络与根据转换器的神经网络。这些日益杂乱的神经网络是AI语音运用所必需的。与在CPU上运行时比较,会话式AI组件速度进步了10倍以上,然后将延迟降低到实时交互所需的300毫秒阈值以下。



也就是说,在一套端到端的流程中,CPU推理延迟大约在3秒左右,但在T4 GPU上,整个过程只需求0.3秒。更重要的,本来TensorRT 5大约智能完成数十种不同的核算变化和优化,但到了TensorRT 7,现已能够做到1000种以上。

黄仁勋表示,现在技能现已进入了一个机器能够实时了解人类言语的AI新时代。在原有的TensorRT 5的基础上,各地开发人员能够更快布置会话式AI服务,然后完成更天然的AI人机交互。在第一批运用NVIDIA会话式AI加快才能的企业中,包含了阿里巴巴、百度、滴滴出行、美团、快手、平安、搜狗、腾讯和字节跳动等中国企业。



持续为主动驾驶做足铺垫针对主动驾驶范畴,NVIDIA发布了Xavier继任者NVIDIA DRIVE AGX Orin。

顾名思义,Orin是下一代机器人处理器SoC,它参数非常亮眼,包含170亿个晶体管,8核64位CPU,200TOPS深度学习算例,重点是,它的核算功用相当于Xavier的7倍。这意味着这是一个从底层架构上更新的AGX处理器,它的规划最早来自超算,拥有全新的功用安全特性,能够使CPU、GPU锁步运行而进步容错性,并且装备了全新的安全引擎维护数据不受网络攻击,以及与上一代Xavier兼容。

经过不同的组合,NVIDIA DRIVE 能够适配L2到L5级别的主动驾驶功用,其间Orin能做到与Xavier兼容,完全由软件界说。



在Orin宣告的一起,NVIDIA也宣告为滴滴供给主动驾驶和云核算处理方案,经过NVIDIA DRIVE,以及数据中心的NVIDIA GPU练习机器学习算法,滴滴现已能够完成L4几倍的主动驾驶推理才能。

作为滴滴主动驾驶AI处理的一部分,NVIDIA DRIVE凭借多个深度神经网络融合来自各类传感器(摄像头、激光雷达、雷达等)的数据,然后完成对轿车周围环境360度全方位的了解,并规划出安全的行进途径。



用软件界说机器人渠道整场讲演的重头戏,最终留给了Isaac SDK。Isaac SDK包含Isaac Robotics Engine(供给运用程序框架),Isaac GEM(预先构建的深度神经网络模型、算法、库、驱动程序和API),用于室内物流的参阅运用程序以及Isaac Sim的第一个版本(供给导航功用)。

全新Isaac SDK能够大大加快研究人员、开发人员、草创企业和制造商开发和测验机器人的速度。它使机器人能够经过仿真获得由人工智能技能驱动的感知和练习功用,然后能够在各种环境和情况下对机器人进行测验和验证。



这个套件包含了Training-in-Sim作业流,运用随机域生成6D姿势图像,用于练习方针检测、像素分割、2D姿势、3D姿势等诸多内容。

最终现场,NVIDIA也给咱们展现了一个会卖萌的Leonardo物体操作机器人。经过模仿和真是国际的学习,Leonardo学会了怎么恪守物理规矩,在模仿的核算部分则运用到了GPU的PhysX 5.0物理引擎。



写在最终能够看到长达2小时的GTC CHINA 2019讲演中,新推出的芯片只要Orin一块。NVIDIA更多的重心放在了软件渠道和AI智能优化上,经过硬件与软件配合,发挥CUDA给GPU带来的大规模并行处理优势,使得GPU走出游戏和烘托,找到了一个更宽广的空间。

NVIDIA造GPU无疑是最拿手的,怎么用好GPU,则需求很多工程师尽力发掘答案。不管是超算、AI、主动驾驶、边际核算,NVIDIA都现已牢牢占住了自己的方位,足以见得GPU对专业范畴而言,相同具有强烈的吸引力。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x




上一篇:LEMO产品进入EPLAN Data Portal部件数据库
下一篇:2020年全球智能手机出货量同比下降10.6%,全球市场将萎缩2.3%


回复

使用道具 举报

0

主题

24

帖子

146

积分

注册会员

Rank: 2

积分
146
发表于 2019-12-30 02:18:46 | 显示全部楼层
沙发!沙发!
回复

使用道具 举报

0

主题

18

帖子

110

积分

注册会员

Rank: 2

积分
110
发表于 2019-12-30 02:19:20 | 显示全部楼层
科技报技术好!
回复

使用道具 举报

0

主题

28

帖子

170

积分

注册会员

Rank: 2

积分
170
发表于 2019-12-30 10:11:33 | 显示全部楼层
科技报就是牛逼!
回复

使用道具 举报

0

主题

32

帖子

194

积分

注册会员

Rank: 2

积分
194
发表于 2019-12-30 22:52:42 | 显示全部楼层
科技报就是牛逼!
回复

使用道具 举报

0

主题

28

帖子

170

积分

注册会员

Rank: 2

积分
170
发表于 2019-12-30 00:01:49 | 显示全部楼层
科技报就是牛逼!
回复

使用道具 举报

0

主题

26

帖子

158

积分

注册会员

Rank: 2

积分
158
发表于 2019-12-30 00:00:51 | 显示全部楼层
科技报就找九天视频教育
回复

使用道具 举报

0

主题

26

帖子

158

积分

注册会员

Rank: 2

积分
158
发表于 2019-12-30 21:22:33 | 显示全部楼层
科技报就是牛逼!
回复

使用道具 举报

0

主题

18

帖子

110

积分

注册会员

Rank: 2

积分
110
发表于 2019-12-30 04:55:16 | 显示全部楼层
科技报技术好!
回复

使用道具 举报

0

主题

25

帖子

152

积分

注册会员

Rank: 2

积分
152
发表于 2019-12-30 02:20:31 | 显示全部楼层
科技报技术好!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

 
在线客服
点击这里给我发消息 点击这里给我发消息 点击这里给我发消息 点击这里给我发消息
售前咨询热线
130-6608-3753

微信扫一扫,私享最新原创实用干货
快速回复 返回顶部 返回列表