拿下比亚迪发布新GPU,英伟达继续笑傲

2023/5/2 来源:不详

北京哪里治疗白癜风手术好 https://wapjbk.39.net/yiyuanfengcai/yyjs_bjzkbdfyy/
原创文章未经授权请勿转载

3月22日,英伟达GTC上,黄仁勋宣布了一系列新产品,从全新的数据中心GPU、CPU到用于自动驾驶的下一代计算平台Hyperion9,英伟达推出的新品在性能上都至少将是翻倍的。

尽管这场发布会的主角是用于数据中心的HGPU和GraceCPU,但在自动驾驶方面,英伟达也公布了相当多的新消息。

Hyperion9将从年开始上车,该参考设计包含2颗Atlan芯片,传感器配置方面,包括14个摄像头、9个雷达、3个激光雷达和20个超声波传感器。

按照之前英伟达公布的Atlan性能,Hyperion9的计算平台算力将达到TOPS,英伟达也表示,由于传感器数量的增加,Hyperion9处理的传感器数据量将两倍于Hyperion8。

Orin将于本月(3月)开始发售,这意味着新势力的新车型交付也许将会加快。老黄已经把芯片拿出,交不出来车,老黄可不背锅。

Atlan此前公布的SOP时间是年,按照本次公布的Hyperion9推出时间,这个时间预计将不会发生调整,这也意味着,Orin将在未来的三年内继续担当英伟达自动驾驶芯片的旗舰重任。

合作方面,英伟达在大会上宣布与比亚迪达成合作,比亚迪将从年上半年开始投产的汽车上搭载DRIVEOrin计算平台。

另外,英伟达还公布了在自动驾驶地图和仿真方面的情况。英伟达预计到年底,将完成绘制并创建北美、西欧和亚洲所有主要公路的数字孪生,总长度约为50万公里。

数据中心业务方面,英伟达推出了AGPU的继任者H,在所有的数据格式下,H的性能都至少是A的三倍,同时功耗也达到了惊人的W。

此前,特斯拉、蔚来等主机厂已经向英伟达购买A用于自动驾驶训练,H的出现,预计将会进一步提升自动驾驶训练的效率。

黄仁勋表示,之前的AI以感知和模式识别为中心,例如图像识别、语音理解、推荐算法等,下一代AI浪潮是机器人,AI要有相应的规划和行动,英伟达正在构建多个机器人平台,包括用于自动驾驶的NVIDIADRIVE,Omniverse将是构建这些平台的核心。

英伟达对Omniverse寄予厚望,野心之大,已经希望将整个地球进行数字孪生,相比之下,自动驾驶可能只是Omniverse中的一个应用。

机器人,是英伟达为自动驾驶找到的分类,也是黄仁勋所认为的下一代AI浪潮。

关于如何打造一个机器人系统,黄仁勋将其简化为四部分:

收集和生成真值数据;

创建AI模型;

使用数字孪生进行仿真;

操作机器人。

其实我们也可以将这四步理解为:感知、训练、仿真、执行。

到了自动驾驶领域,英伟达规划了一套全栈的端到端方案NVIDIADRIVE。

对于真值数据,英伟达通过DeepMap高精地图、人工标记数据和OmniverseReplicator(用于数据合成)来进行收集和生成;

对于训练自动驾驶的AI模型,NVIDIAAI软件平台和DGX超级计算机可以提供相应的服务;

对于仿真,英伟达通过Omniverse中的DriveSim来进行;

DRIVEAV则是运行在英伟达车载芯片上的自动驾驶应用,包含了软件和算法模块。

而上述的Drive平台得以建立,还需要在终端部署强悍的自动驾驶硬件架构,即自动驾驶计算平台和传感器配置。

这其中,又以自动驾驶芯片为最关键。

年,英伟达发布TegraX1,实质性放弃移动端的竞争,开始战略性转向汽车市场。

到年,英伟达发布Xavier,引入DLA(深度学习加速器),英伟达开始真正在汽车市场找到感觉。

到了Orin的发布,英伟达在自动驾驶领域开始大放异彩,几乎囊括了所有主流的汽车制造商和自动驾驶公司。

英伟达曾经表示,从Xavier开始,Orin和Atlan在外形尺寸上、计算平台上,与Xavier都是兼容的,这意味着,英伟达的自动驾驶芯片和计算平台设计将不断趋于成熟。

除了自动驾驶芯片,英伟达的历代自动驾驶计算平台也颇具看点。

早在年,英伟达就推出了第一代的PX平台和CX平台,分别用于自动驾驶和座舱;

年,英伟达推出的PX2平台,引入了独立GPU,英伟达称可以支持多系统,如IVI、仪表和ADAS系统,特斯拉是这一平台的客户;

年推出的PXPegasus(也就是Hyperion7.1),采用了Xavier芯片和图灵架构GPU,虽然算力喜人,但功耗也非常高,基本是自动驾驶公司在用;

年推出的Hyperion8.1首次将传感器纳入参考设计中,并采用了两颗Orin,不再包括单独的GPU,奔驰、捷豹路虎目前是这一代产品的用户;

本次推出的Hyperion9,不论是在算力上还是传感器上,都进入到一个全新的水平,但同时量产时间也到了年。

与自动驾驶芯片相比,新势力等车企并不愿意直接搭载英伟达的计算平台,而是选择Tier1来代工,自己搞定软件和算法,英伟达计算平台的客户也并不多。

Hyperion8将从年起搭载到在梅赛德斯-奔驰的汽车上,年搭载到捷豹路虎的汽车上;Hyperion9目前还没有公布客户。

数据中心业务,从深度学习浪潮以来成为英伟达的核心业务,也是最重要的利润来源。现在,黄仁勋称数据中心为“AI工厂”。

黄仁勋表示,一些公司通过处理和提炼数据来打造AI,构建智能,其数据中心就是AI工厂。

英伟达为这些AI工厂打造全新的引擎,这就涉及到了英伟达的数据中心三芯战略:包括用于加速计算的GPU、用于通用计算的CPU、用于处理和移动数据中心数据的DPU。

这里我们主要介绍下数据中心GPU。

H是英伟达本次GTC重磅发布的产品,作为AGPU的继任者,H采用全新的Hopper架构,台积电4N工艺制造,拥有亿个晶体管,搭载了HBM3显存,片上带宽为4.9TB/s,显存容量为80G。另外,H也是首个支持PCIe5.0的GPU。

相比之下,英伟达的A,采用Ampere架构,7nm工艺制程,拥有亿颗晶体管,采用了HBM2显存,显存带宽为GB/s,最高版本显存为80G。

算力方面,

H在FP8格式下的算力为TFLOPS,是A的6倍;

FP16格式下算力为TFLOPS,是A的3倍;

FP32格式下算力为0TFLOPS,是A的3倍;

FP64/FP32格式下算力为60TFLOPS,是A的3倍。

其中,FP8是英伟达最新引入的Tensor处理格式。

H采用风冷和液冷设计,功耗也达到了W。

而英伟达A的TDP功耗是W,特斯拉Dojo的D1芯片的TDP功耗是W,两者在性能上也比较接近,这也意味着,H的性能将远超特斯拉D1芯片。

多实例GPU(MIG)是英伟达数据中心显卡的一项重要功能。

在A上,多实例GPU可将A划分为多达7个实例,每个实例均与各自的高带宽显存、缓存和计算核心完全隔离,可在单GPU上同时运行推理、训练和高性能计算工作负载,并为每项工作负载提供适当规模的GPU实例,在开发灵活性和GPU利用率方面较为友好。

H同样可以被切割为7个实例,每个实例的性能相当于两个完整的T4(英伟达用于云端推理的GPU,int8算力为TOPS)。

黄仁勋表示,H已经开始投产,将于三季度开始供货。

乍看起来,H似乎和汽车产业并没有关系,但由于自动驾驶的推进,云端训练中心正在成为车企的一项重要工作。

英伟达曾经表示,一支由50辆测试车组成的车队如果每天行驶6小时,每天会产生1.6PB数据。

年,英伟达中国的一位员工在一次公开课上表示,开发L2级别辅助驾驶系统,需要在数据中心布置0-个GPU进行云端训练,L3级别辅助驾驶系统则需要1万个GPU,L4/L5级别自动驾驶系统需要2.5万个GPU。

来自这名员工的消息称,年,特斯拉对外公布了由张英伟达A80G组成的Dojo原型机,在此之前,特斯拉已经购买了上万张的英伟达V,在Dojo原型机之后,特斯拉又继续购入英伟达A,目前特斯拉已经从英伟达处购买了2万张GPU。

除了特斯拉,蔚来也在年底宣布将采用英伟达A80G和MellanoxInfiniBandConnectX-6打造超级计算机。

以特斯拉的数据来看,英伟达上述预测可能偏保守,特斯拉在仅有多万辆车队的情况下,就已经用掉了2万张GPU。如果全世界所有的车辆都将配备自动驾驶功能,未来用于自动驾驶训练和仿真的GPU用量至少还有上千倍的增长空间。

毫无疑问,这对于英伟达是好消息。

尽管特斯拉打造了D1和Dojo,但特斯拉曾经也在年财报会上表示,打造自研(云端)芯片并不是必须的,自研芯片主要是为了提高效率、降低成本。

如今,H在性能上极大领先英伟达A和特斯拉D1,并且将于三季度开始供货,对于还没有量产的特斯拉D1来说,压力自然来到了特斯拉这一边。

是选择打造专用的方案,还是选择英伟达的通用方案,对于特斯拉和很多车企来说,主要在于成本和收益的取舍。

Omniverse,这一词汇,越来越频繁地出现在英伟达的各种场合,自然也是本次GTC的重点。

Omniverse相当于是英伟达软硬件技术的集大成者,融合了英伟达在图形、物理学、仿真、AI和计算技术等方面的能力,英伟达希望通过该平台来为各行业各业赋能,并最终通过Omniverse实现地球的数字孪生。

Omniverse,是基于英伟达光线追踪GPU和皮克斯的USD(UniversalSceneDescription)数据格式的实时图形和仿真模拟平台,可进行3D虚拟世界实时模拟和协作,Omniverse遵循物理规律,可以模拟粒子、流体、材料、弹簧和线缆。

年10月,英伟达发布Omniverse,侧重于仿真测试;

年4月,Omniverse发布企业版本;

年11月,发布Avatar和Replicator,强化在软件端布局。

为了支持Omniverse,英伟达在本次GTC上发布了第一代OVXOmniverse计算机,这台计算机的重要特性是时间同步和低数据传输延迟。

黄仁勋表示,Omniverse是DRIVE等平台的核心。

Omniverse目前在自动驾驶领域有两个主要应用:DriveMap和Drivesim。

先说DriveMap。

黄仁勋称,DriveMap是一种多模态地图引擎,包括摄像头、雷达和激光雷达的数据,它可以单独定位到地图每一层。

DriveMap有两个地图引擎:真值测绘地图(DepthMapGroundTruth)和众包车队地图。

英伟达预计到年底,将完成绘制并创建北美、西欧和亚洲所有主要公路的数字孪生,总长度约为50万公里,数百万乘用车将不断拓展和更新该地图。

英伟达在年收购了高精地图初创公司DeepMap,从黄仁勋的PPT上看,这家公司将主要承担DriveMap业务,这家公司在去年也发布了高精地图开放平台DeepMapRoadMemory。

Drivesim方面,英伟达本次介绍了两种场景仿真方法。

第一种,以DriveMap为主,可以为整个世界创建高度精确的3D表现形式,地图将会被加载到Omniverse中,建筑、植被和其他路边目标均会生成,系统对之前驾驶过程中遇到的运动目标、汽车和行人进行推理和定位,并放入数字孪生中,然后就可以进行仿真和测试了。

第二种方法是使用神经图形AI(NeuralGraphicsAI)和Omniverse,将预先录制的驾驶视频转换为可回放和可修改的驾驶过程,重建3D场景之后,英伟达可以改变现有车辆的行为或添加车辆,来进行闭环仿真和测试。

关于Drivesim,值得多说几句。

在Drivesim之前,英伟达发布过自动驾驶仿真平台DRIVEConstellation,值得注意的是,这个平台并不基于Omniverse,而Drivesim相当于是基于Omniverse的高阶自动驾驶仿真平台。

相对于常规的自动驾驶模拟平台,有了Omniverse能力的加成,DRIVESim主要有两个特点:感知仿真和数据合成。

感知仿真

借助英伟达的光追技术,可以将现实世界和传感器更加真实准确地模拟出来,进行感知的模拟,并对感知算法做验证。

感知仿真的加入,使得英伟达DRIVESim在自动驾驶感知、规划、控制的验证上实现了闭环,可进行自动驾驶端到端的模拟仿真。

数据合成

使用DRIVESimReplicator生成高保真的合成数据,这些数据能够训练车辆的感知系统或测试决策流程。

DRIVESimReplicator主要针对一些难以标记的数据,以合成方式生成难以标记的真值数据,在收集到真实数据之前就可以训练AI模型,以填补在对真实场景下无法有效标记的数据缺口。

合成数据可以扩展训练数据,尤其是在车企或自动驾驶公司刚开始进行自动驾驶训练时,采集数据规模不够的时候,是比较友好的。特斯拉在去年的AIDay上也公布了关于合成数据用于自动驾驶仿真的方案。

在介绍完了上述产品之后,黄仁勋仍不忘表示,不论是DRIVEMap、DRIVESim、Hyperion8还是DRIVEAV栈,车企既可以单独使用,也可以打包使用,彰显着英伟达的开放姿态。

结语

英伟达既是人工智能时代的推动者,也是这个时代的巨无霸。

它很难再被定义为一家显卡厂商或芯片厂商,它的能力已经覆盖到了硬件、系统软件和库、软件平台、AI和机器人应用框四个层级,并提供一站式的AI输出能力。

英伟达所涉及的行业也已经不再是游戏、娱乐等行业,而是渗透到了汽车、医疗、能源、交通、零售、金融、娱乐等各个领域。

英伟达试图在成为AI时代的基础设施,并通过一种通用方案为其他行业赋能,以加速AI的进展。

假如有一天,通用人工智能实现了,人们回望起21世纪20年代,历史会怎样书写英伟达?

建约车评只做有价值的汽车科技报道

转载请注明:
http://www.3g-city.net/gjyby/4540.html
  • 上一篇文章:

  • 下一篇文章:
  • 网站首页 版权信息 发布优势 合作伙伴 隐私保护 服务条款 网站地图 网站简介

    温馨提示:本站信息不能作为诊断和医疗依据
    版权所有2014-2024 冀ICP备19027023号-6
    今天是: