苹果表示其AI模型是在谷歌的定制芯片上训练的
苹果在论文中表示,支持其Apple Intelligence AI系统的人工智能模型是在谷歌设计的处理器上预训练的,这表明大科技公司在训练前沿AI时正在寻找替代Nvidia的方法。
本文引用地址://www.cazqn.com/article/202407/461513.htm苹果选择谷歌自家设计的Tensor Processing Unit(TPU)进行训练,这在公司刚刚发布的技术论文中有详细说明。苹果周一还发布了Apple Intelligence的预览版。
Nvidia昂贵的图形处理单元(GPU)在高端AI训练芯片市场占据主导地位,过去几年需求旺盛,以至于很难以所需数量采购到。OpenAI、微软和Anthropic都在使用Nvidia的GPU进行模型训练,而其他科技公司,包括谷歌、Meta、甲骨文和特斯拉,也在大量采购这些芯片来构建他们的AI系统和产品。
Meta首席执行官马克·扎克伯格和Alphabet首席执行官桑达尔·皮查伊上周都表示,他们的公司和行业中的其他公司可能在AI基础设施上过度投资,但承认不这样做的商业风险太高。
“落后的坏处在于,你在未来10到15年最重要的技术上处于不利位置,”扎克伯格在与彭博社的Emily Chang的播客中说。
苹果在其47页的论文中没有提到谷歌或Nvidia,但确实提到其Apple Foundation Model(AFM)和AFM服务器是在“云TPU集群”上训练的。这意味着苹果租用了云提供商的服务器来进行计算。
“该系统使我们能够高效、可扩展地训练AFM模型,包括AFM-on-device、AFM-server和更大模型,”苹果在论文中说。
苹果和谷歌的代表没有回应置评请求。
健康的AI怀疑态度对技术行业有益,Light Street的Glen Kacher说健康的AI怀疑态度对技术行业有益,Light Street的Glen Kacher说
苹果比许多同行更晚披露其AI计划,这些同行在OpenAI于2022年底推出ChatGPT后很快就大声宣布了生成性AI的拥抱。周一,苹果推出了Apple Intelligence。该系统包括几个新功能,例如Siri的新外观、更好的自然语言处理以及文本字段中的AI生成摘要。
在接下来的一年中,苹果计划推出基于生成性AI的功能,包括图像生成、表情符号生成以及可以访问用户个人信息并在应用程序内执行操作的增强版Siri。
在周一的论文中,苹果表示,AFM-on-device是在一个由2048个TPU v5p芯片协同工作的一片“切片”上训练的。这是最先进的TPU,首次发布于去年12月。AFM-server是在8192个TPU v4芯片上训练的,这些芯片通过数据中心网络配置为八片切片协同工作。
根据谷歌的网站,谷歌最新的TPU在提前预订三年的情况下,每小时使用成本低于2美元。谷歌首次在2015年推出其TPU用于内部工作负载,并于2017年向公众开放。它们现在是专为人工智能设计的最成熟的定制芯片之一。
尽管如此,谷歌仍是Nvidia的顶级客户之一。它在自己的TPU上使用Nvidia的GPU进行AI系统训练,还在其云端出售Nvidia技术的访问权限。
苹果此前曾表示,推理,即使用预训练的AI模型生成内容或做出预测,将部分在其数据中心的苹果自家芯片上进行。
这是苹果发布的关于其AI系统的第二篇技术论文,此前在6月发布了一版更为通用的版本。苹果当时表示,在开发其AI模型时使用了TPU。
苹果计划在周四交易结束后公布季度业绩。
评论