长期以来,英伟达作为GPU阵营的核心厂商,凭借AI“卖铲人”的定位获取了巨大利润和话语权。但随着各种量变的积累,AI产业已经体现出质的变化。技术的推进与AI企业的选择,正在削弱英伟达的统治地位。
最为耀眼的变革,来自DeepSeek-R1模型,它以全新的算法架构,仅使用少量芯片就达到了比肩OpenAI o1模型的算力。这一“四两拨千斤”式的成功,使得业界开始怀疑“堆算力出奇迹”的传统路径,英伟达的股价也随之应声而落。
另一方面,出自AWS、Meta等云服务企业出于成本考虑,早就开始转型ASIC方案。博通、Marvell联合AI大厂与晶圆代工厂“合纵连横”,对英伟达又是一个不小的威胁。看起来,AI产业的“接力棒”要从英伟达手中分散出去,从一家独占转变为多元化的格局。
DeepSeek让大模型不再昂贵
数据指出,DeepSeek-V3的训练成本仅为557.6万美元,却能实现与OpenAI的o1模型相媲美的性能。这种低成本的训练方式,得益于DeepSeek在算法优化和工程创新上的突破。
在各种先进策略的加持下,DeepSeek团队将H800 GPU的MFU(模型FLOP利用率)提升至23%,远超行业平均15%的水平。集群级负载均衡方面,DeepSeek在2048块H800 GPU集群上实现了98.7%的持续利用率,相较传统训练方案提升了20个百分点。这保证了在多GPU集群环境下,硬件资源能够得到充分利用,最大化生产效率。
DeepSeek的低成本模型对高算力GPU的需求产生了直接冲击。由于其训练成本显著降低,市场对高端GPU的需求预期也随之下降。摩根士丹利观察到,DeepSeek的技术路径降低了对先进算力的依赖,导致市场对英伟达高端GPU(如GB200芯片)的需求预期大幅下调,其报告将英伟达2025年GB200出货量预测从3万件下调至2万件,引发英伟达股价短期暴跌23.8%。
云服务方案商的ASIC布局
与此同时,云服务方案商如AWS、Meta等纷纷加大ASIC的使用。ASIC(专用集成电路)可以针对AI推理、训练等场景进行优化,提供比通用芯片更优的性能功耗比,并为云服务商提供更大的技术掌控权。例如,Marvell与亚马逊合作的Trainium 2,算力能力大致位于A100至H100之间的水平,这也是公司2024年ASIC收入最主要的增长源。
随着云服务方案商对ASIC的大量采用,GPU在AI算力市场中的主导地位正面临挑战。英伟达作为GPU市场的领导者,其股价的波动反映了市场对其未来盈利能力的担忧。以往,GPU与ASIC被看做是互补关系,两者在同一个项目中可发挥各自优势。但随着云服务供应商的降本取向日益加强,未来会把更多资源投入ASIC的开发。
在这一市场格局变化中,博通和Marvell等企业成为受益者。博通在ASIC市场中占据最大份额,受益于谷歌TPU的出货增长,2024年的ASIC收入达到了80亿美元以上,并且在定制AI芯片市场占有70%份额。Marvell则通过与亚马逊、谷歌的深度合作,证明其定制化ASIC能力已获市场认可,未来市场占有率有望实现反超。英伟达与这两家企业的竞争关系,也越来越明确。
结语:GPU大厂需要适应与转变
长期以来,AI产业的“C位”都是英伟达牢牢占据,但现如今的变化,需要这家老牌巨头加以适应并做出改变。DeepSeek与众多ASIC阵营的发展路径,都是对高成本路径的反叛,而这一路径长期以来的主导者就是英伟达。曾几何时,英伟达CEO称自家芯片是“买得越多越省钱”,如今面对这一金牌销售的话术,各大企业与团队也都在做出自己的选择。
不论是开发端还是应用端,其实都对成本与价格相当敏感,未来的发展路径,必然会倒逼芯片厂商开发高性价比的方案,作为GPU第一大厂的英伟达,不仅是要面对可能出现的利润退坡,更要适应AI产业话语权的多元化现实。