削弱英伟达 是英特尔押注AI重振雄风的第一步
虽然可能是最早将人工智能(AI)渗透到各个行业的先驱者,但对英特尔来说,全面AI爆发的时代似乎辛酸远大于甜蜜,即使依然守住了2023年半导体销售额的年度冠军,可是看着英伟达翻倍的年销售额以及两者近在咫尺的营收差距,这个年度销冠的头衔这次丢掉之后还能否如前几年一样再抢回来实在心里没底。如果再参考英伟达几乎15倍于英特尔的市值规模对比,都是姓“英”的华尔街咋就这么看不起人呢?
从公司策略的角度上,英特尔似乎还是以夯实基础(工艺)作为重振雄风的第一步,只是IDM2.0战略再成功,也很难短期内让英特尔的股价摆脱老对手AMD的贴身纠缠,毕竟相比于TSMC那常年稳定在40%以上的净利润,英特尔的内部结算报告中制造业务的净利润率实在没法给股市足够买入的信心。因此,面对诸多消费业务的稳步不前,英特尔要重振雄风还是只能押注在人工智能方面,不过英特尔意识到自己要向人工智能整体软硬件方案提供商不会是一蹴而就的过程,这需要一个漫长的过程,这个过程的第一步是先尝试削弱英伟达在AI领域的统治力。
如果说英伟达是人工智能浪潮的最大受益者,那么作为最早将AI推广到各个细分市场的先驱者,英特尔在这波浪潮中绝对是迷失方向的巨轮。只不过,随着一众AI硬件创业公司的落寞,相比于同样在AI浪潮中受益匪浅的博通和Arm,真正具有削弱英伟达AI统治力潜质的,可能非英特尔莫属。
从Movidius到Habana再到Loihi,英特尔始终没有放弃NPU这条战略赛道,这是英特尔相比其他厂商更有机会削弱英伟达的前提,同样的英特尔虽然没有参与到重新编译CUDA的工作,至少英特尔的OneAPI支持的硬件产品数量越来越多,在软件开发方面依然埋下伏笔。尽管英特尔拥有CPU、GPU、NPU和FPGA四大平台,Gaudi目前来看是这一战略的核心部分,在Intel Vision上推出的AI ASIC Gaudi 3,声称与Gaudi 2相比,FP8操作的AI计算量提高了2倍,BF16操作的AI运算量提高了4倍,网络带宽提高了1倍,内存带宽提高了1.5倍。Gaudi3将提供三种外形尺寸:夹层卡、通用底板和PCIe卡。Gaudi3的第一个目标是超越NVIDIA的H100,声称推理的相对功率效率为50%,训练速度快40%,当然英特尔也从不掩饰对H200市场的觊觎。
不过,光有产品是远远不够的,正如当初英特尔在服务器处理器方面超过9成的市占率一样,在AI服务器加速和推理训练等方面,英伟达的CUDA几乎成为行业不二标准,在这样的竞争形式下,英特尔要做的是让客户逐步认可其解决方案的价值,才能有机会成为英伟达(NVIDIA)的替代品。毕竟,这也是很多客户翘首以盼的新局面。AI行业需要一个NVIDIA的竞争对手,而英特尔似乎是目前看潜力和能力最接近的竞争对手。竞争有助于保持低价格,有助于使供应链多样化以减少短缺,并有助于避免专利锁定。
所以,当英伟达成为AI的寡头之后,英特尔需要适应自己的新角色,一个Runner up恰好是容易被客户们更为青睐的位置,虽然过去英特尔从来没有适应过这样的角色,但要重振英特尔的销售额与市值,这又是不得不接受的位置。毕竟以TechInsights的最近进行的研究发现,在3月的某一周内,没有任何一块NVIDIA H100可从AWS按需购买。TechInsights研究还表明目前公共云中部署的所有加速器中,94%来自NVIDIA,而云服务商自行设计的加速器(如谷歌的TPU和AWS的Inferentia)所谓的应用也基本流于形式(barely scratching the surface),英特尔的Gaudi 2只能从单个地区的单个云提供商那里获得。这种供应情况注定是不正常的,替代加速器供应商对市场有利。
必须削弱NVIDIA,这是服务器厂商心底的呼声,自然代表着英特尔这类厂商的机会。但是,挑战英伟达之前英特尔自己面临着什么呢?
英特尔面临着来自CPU基本盘特别是服务器领域的威胁。2023年,英特尔占云终端用户处理器消费量的73%。AMD占19%,基于Arm的专属芯片约占6%。英特尔仍然占据主导地位,但相比于五年之前几乎看不到对手的市场占有率,这个比例变化是非常危险的。在剔除制造业务后的最新一季度细分部门营收统计中,英特尔的数据中心集团DCAI收入为30亿美元,营业收入为5亿美元,这种业绩停滞不前在英伟达和AMD利润营收双增长的映衬下让人担忧。虽然在新的季度开始,英特尔强势推出至强6系列数据中心CPU和Gaudi 3人工智能加速器解决方案,但即使如此,今年预计也只能为公司带来约5亿美元的收入。相比之下,AMD预计将从其MI300X GPU中获得约35亿美元的收入,而英伟达今年将从其人工智能产品中获得450亿至500亿美元的营收。
最值得注意的是,无论性价比如何,最终用户都会向AMD和Arm寻求更便宜的云实例和物理服务器。例如,在AWS美国东部地区,基于英特尔的t3实例比AMD实例贵10%,比同等的Graviton高20%。当如此巨大的差异摆在终端用户面前,在供应时云门户网站上清晰地显示出来时,终端用户真的会费心测试性价比吗?英特尔在保密计算技术方面确实有优势,这可能会让最终用户与合作伙伴谷歌云和微软Azure在云上支付隐含的溢价。
所以,削弱英伟达的第一步是摆脱一个尴尬定位——英特尔的人工智能战略已经无法吸引客户了。虽然很早就布局了人工智能,但为什么英特尔没有看到一条通往其数据中心人工智能雄心的平行道路呢?也许英特尔过分信任自己CPU在从传统服务器计算到AI计算过渡的竞争力,英特尔一直试图在人工智能推理方面向市场推销其CPU的价值。当他发现GPU的强势后又试图推出一系列数据中心GPU产品,与AMD和英伟达直接竞争,现在,它又希望下一代Gaudi加速器最终会赢下未来,但是这种传统的方式还需要客户的认可,这个认可不是基于行业统治者英特尔,而是行业颠覆者英特尔。
英特尔拥有晶圆厂(尤其是在美国)、品牌和人员,问题是,这些能说服客户英特尔是一个有效的选择吗?这是一个经济和营销问题,而不仅仅是技术问题。英特尔的做法必须大胆。提高性能和创新技术固然很重要,但要想削弱英伟达的统治力,英特尔需要明显比英伟达便宜,性能或使用性不会下降。AI服务器的选型不会采用直接比较成本的方式,而是以每瓦价格低于竞争对手为目标。每瓦的价格是一个更公平的价值衡量标准。但市场上的买家并不一定是理性的,许多人没有时间或意愿进行公平的评估。在云时代,开发人员和解决方案架构师真的不想在基准测试和性价比上乱来,甚至这种性价比压力在构建早期原型或概念验证时也不想面对。这种便宜不单单是硬件成本上的,更是解决方案甚至是包括转换成本的总部署成本。英特尔必须证明其人工智能加速器不仅更便宜,而且非常便宜,足以证明重新培训开发人员的转换成本是合理的,而且值得冒险。它需要赢得云提供商的支持,这样开发人员就可以在世界上任何地方试用Gaudi。
此外,英特尔需要挑战自己的传统习惯以及开发者成本与心理问题之间的鸿沟,英特尔有自己的英特尔开发云支持开发者进行实验,但人们通常更喜欢在他们习惯的平台上进行实验。该公司必须与规模更大的云提供商达成协议,以使访问在世界各地无处不在,并具有价格竞争力。英特尔较低的功耗应该会降低虚拟机成本,但云提供商也需要较低的单位成本来降低虚拟机价格。许多本地用户可能会通过云来指导他们的购买决策。一个大胆的举措是补贴云提供商的“免费层”使用,用补贴助力英特尔的产品逐步渗透到已经习惯了英伟达CUDA的开发群体。
除非迫不得已的压力,开发者都是有一定开发“惰性”,英特尔必须想办法说服这群开发者们,英特尔的平台是他们值得冒险跳一次的新乐园。
评论