GPU核弹英伟达20年传奇崛起路四
2023/5/19 来源:不详英伟达(Nvidia)成立于年,目前是全球最大的独立GPU供应商,也是AI芯片市场的领军者。上市初期,NvidiaGPU主要专注PC图形业务,公司产品与PC出货存在较高程度的绑定,以OEM形式销售显卡也是公司重要的收入来源之一。经济危机后,随着智能手机、平板电脑等消费电子新应用的兴起,终端需求呈现多元化,全球PC出货量开始进入下行通道,Nvidia开始将业务重心转向高端游戏卡市场。
年起,公司几乎每两年刷新一次游戏GPU架构,优异的硬件性能和良好的兼容性使其逐渐扩大了对AMD的市占率领先优势,一度在PC独显市场将AMD市占率压制在20%以下。-年,公司游戏GPU出货量年复合增速为9%,-年年复合增速上升至14%。同时,借助平均销售单价强势上升,公司-年游戏业务收入实现了21%的复合增速,而-年这一数字更攀升至29%。
本期的智能内参,我们推荐中金公司的研究报告《英伟达:从绘图到计算,从GPU到AI芯片》,复盘Nvidia发展历程,发掘Nvidia成功要素,为中国计算芯片行业发展提供借鉴。
本期内参来源:中金公司
原标题:
《英伟达:从绘图到计算,从GPU到AI芯片》
作者:黄乐平、丁宁、成乔升分析师。
一、GPU核弹的二十年辉煌史
英伟达(NvidiaCorporation,NVDAUS)成立于年1月,创始人为LSILogic走出的JensonHuang(黄仁勋)及来自于SunMicrosystem的两位工程师ChrisMalachowsky和CurtisPriem,现已成为全球可编程图形处理技术的领袖,并在未来AI时代所需的高性能计算领域取得了良好的先发优势。公司于成立初期(-)相继发布了NV1及Riva系列图形显示芯片,但并未获得良好的市场认可。
-,开启发展之路,迂回中前进。年,公司于台积电正式建立策略联盟伙伴关系,以无晶圆(Fabless)模式的英伟达在奠定产能及工艺基础的同时,也与台积电一并开启了自己的发展之路。年公司在NASDAQ上市,发行时市值2.3亿美元左右。同年,英伟达推出GeForce——世界上第一款功能齐全,可从真正意义上替代CPU渲染的图形处理单元(GPU)就此诞生。年公司收购九十年代末至二十世纪初的显卡芯片领导者3dfx,技术储备得到进一步壮大。但年后,公司与微软在Xbox图形芯片上失败的合作经历使其收入出现下滑,DirectX9的兼容性问题也是其产品竞争力被在与AMD竞争中落败。然而,通过不懈的努力,Nvidia最终争取到了SonyPS3的订单,并与Intel达成了交叉授权协议,重回增长轨道。年英伟达收入超过40亿美元,相比上市时成长了近5倍。
-:上市后首度受挫,但迅速恢复。年受到全球经济危机影响,半导体行业也在互联网泡沫后再度受到重挫,Nvidia业务同样受到影响。此外,CUDA的推出使Nvidia必须在GPU设计中增加相关逻辑电路,使得芯片面积增大、散热增加、故障率增高,G84/G86核心的产品出现了过热而导致花屏的“显卡门”事件,Nvidia也因此付出了近2亿美元的一次性支出代价,来解决产品质量问题。年随着Fermi架构GPU推出,公司经营得以快速恢复。
-,聚焦高端游戏市场,实现收入对超威半导体(AMD)的超越,并同步发展GPU通用计算。在经济危机过后,笔电、平板等多元化应用分散了PC的需求,PC及PC独立显卡出货量均开始呈下滑趋势。英伟达则将战略中心转移至高端游戏卡市场,加快GPU架构的迭代速度,实现与PC市场成功解绑。
与此同时,年公司营业收入成长至50亿美金左右,总市值突破亿美元,实现对AMD的反超。与此同时,用于运算的Tesla显卡也随着GPU架构的升级得到不断更新,为后期数据中心业务发力做出了充足的储备。
-:数据中心业务发力,虚拟货币挖矿潮及自动驾驶美好蓝图推动公司市值爆发式增长,但随后又经历第二次重大挫折。进入年后,半导体行业迎来数据中心建设驱动的新一轮成长周期。
随着云数据中心数量及计算任务需求不断上升,Nvidia的通用计算GPU(GPGPU)迎来收获季。公司数据中心业务收入单季度增速一度超过%,且强势一直维持至了七个季度之久(2QFY17-4QFY18)。加之数字货币价格暴涨,资本市场对自动驾驶预期持续走高使英伟达市值快速爬升,巅峰时一度突破0亿美元,是上市时的近倍。FY(截止于/1/31)公司收入97亿美元,相比年又翻了一番。
而进入年,半导体行业周期转为下行,比特币退潮、AI相关应用预期大打折扣等利空因素导致英伟达股价市值腰斩,单季度收入也出现20%以上同比下滑,公司遭遇上市后第二次重大挫折。目前,随着支持实时光线追踪的Turing架构显卡上市,公司再度聚焦游戏主业,经营状况逐渐从底部走出。
▲NVIDIA单季度收入及同比增长率
自上市以来,Nvidia业绩及股价表现大幅跑赢行业。尽管发展中历经多次起落,作为硬件市场的一枚“核弹”,Nvidia仍然凭借其强大的内生增长使收入及净利润增速大幅跑赢可比公司。-年间,Nvidia实现了19.9%/27.4%的收入/净利润年复合增速。
行业平均来看,全球半导体行业销售额(不含存储)-年间的年复合增长仅为5.2%;可比公司来看,全球第一大半导体公司英特尔(Intel)收入/净利润复合增速为4.7%/5.3%,同业者超微半导体(AMD)收入复合增速为4.4%,均大幅跑输Nvidia。
此外,公司在自身不断创造价值的同时也为二级市场投资者带来了丰厚的回报:相比费城半导体指数(SOX)、Intel及AMD近20年来的仅一倍股价上涨,Nvidia自年至今实现了50倍的涨幅,也成为了资本市场中的一枚“核弹”。
Nvidia自上市以来研发投入绝对值呈现持续增长,单季度研发费用率平均值超20%。目前公司最新财季研发费用已经超过7亿美元,是AMD的一倍之多。AMD在未剥离GlobalFoundries时采用IDM模式经营,因此研发费用率及研发费用绝对值在前期领先于Nvidia,但Nvidia在年后完成了反超。
值得注意的是,AMD的研发费用被分配于GPU及CPU两种产品上,而Nvidia基本上将全部的研发投入用于GPU产品(历史年份Tegra处理器收入占比均不足20%),投入力度可见一斑。
长期研发投入与积累使公司产品技术壁垒及竞争力得以充分提升,利好盈利能力成长。通过观察公司上市以来的毛利率,及营业利润率变化情况来看,剔除经济危机时期影响,Nvidia的利润率基本保持上行。与同业者相比,Nvidia的利润率表现也十分优秀,根据市场一致预期,年公司毛利率有望与Intel达到同一水平。
▲研发费用绝对值对比:Nvidiavs.AMD
▲研发费用率对比:Nvidiavs.AMD
▲计算芯片厂商利润率对比
二、AI芯片的领导地位是如何炼成的
1、第一阶段:从PC图形芯片到游戏显卡
在GPU推出初期,由于市场终端应用以PC为主,笔记本及平板的普及度尚低,Nvidia的产品与PC出货存在较高程度的绑定,以OEM形式销售显卡也是公司重要的收入来源之一。但是,随着半导体行业发展,终端应用趋于多元化,PC市场热度从年起开始出现明显下降。
根据Gartner统计,全球PC出货量从1Q12起基本呈现同比负增长趋势。此外,随着集成显卡性能的提升,独立桌面显卡出货情况也开始出现衰退。在此市场环境下,Nvidia将自身的战略核心转移至高端游戏卡领域。根据公司披露,-年在全球PC市场逐步倒退的情况下,Nvidia游戏显卡出货量5年实现9%的年复合增长,销售均价及收入分别呈现11%/21%的年复合增长,成功与下行的行业趋势实现剥离。
而若以-年为时间区间计算,公司游戏显卡出货量、销售均价及收入的年复合增长率达到14%/14%/29%,表现十分优异。正确的战略转型使Nvidia游戏业务销售收入在FY(截止于/1/31)一举达到62.5亿美元,是FY的三倍之多。
▲Nvidia游戏显卡出货量,ASP及收入情况
▲Nvidia游戏业务单季度收入及同比增长率
收入结构拆分来看,FY(截止于/01/31)公司来自于游戏业务的收入占比为37%,而OEM/IP收入占比与游戏业务持平,公司业绩与全球PC整机出货情况仍有比较高的绑定关联度。随着Nvidia战略重心的转移,FY(截止于/1/31)公司游戏业务已经为其贡献了过半营收,而OEM/IP业务收入占比下降至仅6%。
放眼高端、深耕游戏卡的市场战略也让Nvidia着实取得了成功。自年起,Nvidia几乎每两年翻新一次其GPU架构,从年的Fermi到年的Turing已经经历了四次迭代(计算卡的Volta架构不计入在内)。尽管AMD产品的平面图像清晰度更占优,但为了良好支持游戏应用,更胜于3D渲染能力和软件优化的NvidiaGPU还是精准抓住了用户的需求,公司市占率从1H10的50%一路提升,曾一度将AMD在独立显卡市场的市场份额压制在20%以下。
从Steam游戏平台的调查数据来看,Nvidia游戏GPU在消费者中的偏好度在近三年来也逐步提升,目前已经以大规模优优势击败AMD及Intel,年采用N卡进行游戏的玩家占比已超过75%。此外,我们看到,更具备性价比的AMDRaedonGPU并未得到大规模的市场认可,反而售价高昂的NvidiaGPU获得了更好的用户粘性,反映出Nvidia产品优异的实际体验。
▲独立GPU市占率变化情况
▲Steam游戏平台数据显示玩家对Nvidia显卡偏好度持续提升
▲目前主要游戏显卡参数对比(Nvidiavs.AMD)
强劲的游戏业务为Nvidia创造了确定的业绩增长与健康的现金流。我们认为,在数据中心业务还未真正开始爆发式增长前,Nvidia正是靠着游戏市场的成功,为公司大力研发通用计算型GPU及AI相关应用提供了坚实的后盾,在Nvidia练就AI芯片市场王者地位的道路上,游戏业务功不可没。
2、第二阶段:软硬件结合构筑AI芯片龙头地位
CUDA是颇具遇见性的发明,但起初经历众多艰辛。事实上,在游戏业务蓬勃发展的同时,Nvidia在很早就开始颇具先见性地着手将GPU用于通用计算的问题。GPU由于最初面对的是图形应用,处理的是高度统一、大规模相互无依赖的数据,因此结构中包含大量的算数逻辑单元(ALU),并行运算能力强。十余年前,Nvidia首席科学家DavidKirk就在考虑是否可以赋予GPU合适的编程模型,将丰富的并行运算资源分享给开发者,使PC的计算性能大大提升,这一思想最终得到了NvidiaCEOJensenHuang的采纳。
因此,Nvidia开始投入大量资源,在年研发出了能够让GPU计算变得通用化的CUDA(ComputeUnifiedDeviceArchitecture)技术,并让未来每一颗GPU都支持CUDA。年,Nvidia推出了第一代Tesla大规模并行运算芯片(并不具备绘图能力)专注通用计算。
当时,加入由于必须在硬件设计中增加相关CUDA逻辑电路,使得GPUdiesize增大、散热增加、成本上升、故障率增高,之后还出现了GF84/86系列芯片的“显卡门事件”;同时,还要保证每款产品的软件驱动都支持CUDA,这对Nvidia的工程师来说是巨大的工作量。但公司全员通过不懈的努力,顺利度过了艰苦期。
▲CUDA示意图
在完成CUDA的开发后,英伟达开始积极构建通用计算系统生态。Tesla系列GPU自年推出后得到了持续的发展更新,成为Nvidia在实现通用计算中的硬件基础。与GeForce、Quadro等产品线不同,Tesla系列GPU通过优化架构设计,最大限度发挥计算能力,而没有绘图功能。近几年,针对日益攀升的算力需求,Nvidia又推出了DGX系列超级计算机,丰富硬件支持。
为更好的服务AI普及后的深度学习应用,NVIDIA开发了用于深度神经网络的GPU加速库cuDNN,在保证性能和易用性的同时尽可能降低内存占用,cuDNN还可以集成到更高级别的机器学习框架中(比如caffe);TensorRT是Nvidia开发的深度推理学习工具(本质是C++库),可加速TensorFlow推理,使TeslaP40/P4/T40等硬件性能在深度学习中得到更好发挥;而DeepStream是通过借助NVIDIATeslaGPU的硬件特性(如优异的解码性能、可通过降低精度加速推理、低功耗等),帮助开发人员快速构建高效、高性能的视频分析的应用程序。除了上述内容之外,Nvidia也针对高性能计算、数据中心管理提供了软件、开发者工具及库,通用计算生态系统逐步完善。上述配套系统加强了NvidiaGPU的竞争力。
强大的硬件性能及良好的生态使Nvidia成为AI的领路人,借行业东风,年起数据中心业务开始爆发式增长。半导体行业在经历了智能手机及消费电子驱动的周期后,迎来数据中心引领发展的时代,CISCO预计,-21年全球数据中心负载将成长近三倍。云数据中心/超级数据中心的加速建设、AI深度学习及高性能计算等应用在云端落地助力在硬件算力及生态环境两方面具有充足储备的Nvidia乘势而上,于数据中心GPU市场力拔头筹。自年起(对应英伟达FY17),公司数据中心业务收入一路攀升,同比增长率连续七个季度(2QFY17-4QFY18)超%。与公司其余业务线比较来看,数据中心业务增速领先一直持续了两年时间,增速基本为游戏业务的2-3倍。
▲Nvidia最新一代数据中心用TeslaGPU
▲Nvidia数据中心业务单季收入及同比增长率
NvidiaGPU在全球主要云厂商中获得了极大的认可。根据Liftr于年5月的调查数据显示,在阿里云、AWS、微软Azure及GoogleCloud中,Tesla系列GPU的市场占有率相比AMD(产品主要为FireProS7工作站级GPU)、Xilinx(产品主要为VirtexUltrascale+VU9PFPGA)及Intel(产品主要为Arria10GX1FPGA)大幅领先,且覆盖Kepler架构至Volta架构的四代产品,充分说明NvidiaTesla系列GPU在通用计算市场的强大竞争力。目前云端AI训练及推理任务均离不开NvidiaGPU的支持。FY(截止于/1/31)英伟达数据中心业务收入占比已经达到26%,成为游戏业务外公司的最重要的增长点,公司AI芯片龙头地位已经形成。
▲四大云厂商中AI芯片市场份额:Nvidia占据绝对领导地位
3、第三阶段:遭遇挫折,估值收缩,市值减半
币价大跌是英伟达股价在二级市场受到重挫的直接导火索。在数据中心业务成长同时,一种被称之为“数字货币”的加密资产也在逐渐被人们所熟悉和认可。年起,区块奖励减半,避险货币属性增加更推动了数字货币价格的上涨,比特币价格曾一度接近20,美元大关,以太币价格也突破了1,美元。市场近乎疯狂的“炒币热潮”也对半导体行业需求端造成了短期内的强劲拉动。由于GPU架构内含有多个流处理器,非常适合进行简单而重复的运算,这与数字货币“挖矿”需求高度重合。高性能游戏GPU便被赋予了“挖矿芯片”的属性,渠道内更出现了一卡难求的情况。
之后加密货币市场进入寒冬,随着币价远不及去年创下的高价位,以及新币开采成本持续攀升,越来越多的矿商出售挖矿设备,导致二手游戏GPU涌入市场,其中便包括Nvidia的PascalGPU。迅速攀升的渠道库存极大的影响了Nvidia游戏GPU的销售,先前几季的销售高增量迅速向渠道回吐。这一环境变化使Nvidia猝不及防,不得不交出3QFY19(截止于/10/31)业绩及指引均低于预期的答卷,导致股价在一个交易日内蒸发亿美元。
AI及自动驾驶市场预期乐观度下降,导致估值收缩影响股价。数据中心资本开支在经历了自年起的激进扩张后,年下半年起进入消化期,全球数据中心硬件库存水平也攀升至高位,致使半导体行业需求端疲软,部分地区数据中心客户采购甚至出现停滞。Nvidia数据中心业务收入因此受到较大影响,增速严重放缓,并逐渐出现单季度负增长。行业性的需求疲软使投资者意识到,虽然坚持看好AI长期为数据中心行业带来的结构性增长是正确的,但目前资本市场对于AI在数据中心迅速落地,并强劲拉动半导体需求的一致预期有些为时过早。
此外,总体来说,年自动驾驶行业并没有取得实质性突破,且整个行业都被聚焦于3月Uber无人车出现意外致行人丧生一案上。调查显示,测试车虽然检测到了路边的行人,但反应时间长达6秒,且安全员当时并没有集中注意力,导致了悲剧的发生。该事件证明,Uber自动驾驶车的传感器与计算机系统显然还不能在生死攸关的时刻做到百分之百可靠。另外,Waymo与Cruise在路测中也遇到了不同程度的问题。上述事件的发生,导致自动驾驶行业的发展现状受到投资者质疑,加之监管机构对安全的愈发重视,汽车真正走向自动驾驶的时间点更变成了一个未知数。Nvidia汽车业务也因此并未实现高速增长4QFY18/1QFY19两季表现甚至与去年同期几乎持平。
4、第四阶段:游戏、数据中心、自动驾驶“三驾马车”助力公司迈向千亿美金市场
电子竞技为台式机游戏市场带来成长空间。电子竞技被新生代游戏玩家所追捧。根据Newzoo预计,在年全球电子竞技观众数量将超过5亿,PC游戏玩家将有望增长至3.5亿。电子竞技对于每秒传输帧数(Framespersecond,FPS)的需求继续增加,有望推动公司高端游戏卡销售,继续拉动公司游戏业务实现增长。
NvidiaGPU在电子竞技市场的渗透率目前仍然偏低。虽然电子竞技的观众数量在持续提升,但观众中真正玩游戏并为满足游戏配置需求而购买NvidiaGPU的人数占比并不高。根据Newzoo预计,年5月份仅有58%的“狂热”电子竞技观众玩他们平常所观看的游戏。这当中只有一半的人使用台式机,而其中又有一半的热门游戏对GPU的配置要求并不高,这些游戏使用算力较低的集成式GPU就已经能够获得较好的游戏体验。独立高端游戏卡的发展空间依然广阔,有望在未来继续推动公司收入规模扩大。
Nvidia在VR市场布局较好。Nvidia是少数建立了VR生态的公司之一。Nvidia通过HolodeckVR平台助力于设计师大型3D模型的协同开发。和PC游戏类似,性能对于VR设备至关重要。目前PC游戏对画面的配置要求平均是30FPS帧率、×分辨率。Nvidia认为VR设备最低的配置要求是前者的7倍(即90FPS帧率、×分辨率),推荐的配置要求是前者的20倍。
VR设备的高性能需求将使得Nvidia产品进一步高端化。公司计划将GeForceGTX或者更高端的GPU用于具备VR功能的台式机或者笔记本。Nvidia的GeForceGTX目前的售价为美元,性能更强大的GeForceGTX和目前的售价则分别为美元和美元。而市场上分离式GPU目前的平均售价仅约94美元。
▲VR对图像处理性能的要求超过PC游戏7倍之多
Nvidia率先推出光线追踪GPU。光线追踪算法通过计算光线照射的位置,模拟彼此相互作用的效果,就像人眼看到真实的光线、阴影和反射一样,以实现更逼真的阴影和反射,大幅改善半透明和散射效果。过去,光线追踪算法由于需要消耗大量的算力,仅仅被应用于电影和电视节目的后期渲染。年,Nvidia在Games