
被Open AI甩开的两年,谁该为苹果的AI掉队买单

知名科技记者马克·古尔曼曾在3月爆料,苹果公司的Siri可能要到2027年才能真正实现现代化的对话式功能。
这个爆料并非空穴来风。苹果向来是科技行业的风向标,其遵循押注未来科技发展趋势,而非仅追求当前利益。在2023年,库克就宣布计划每年花费10亿美元开发生成式AI产品,但事实却是——与其他科技巨头相比,苹果的AI步伐迟缓无比。
The Information的记者Wayne Ma通过对苹果内部员工的独家深度采访,试图还原苹果Siri在AI转型上失败的原因:战略的摇摆、领导层的变动、团队的对立、激励机制的失衡……
苹果在AI上的举步维艰,是在生成式AI时代下,创新者窘境的典型代表,硅兔君编译了这篇报道,其对不同阶段的企业创新而言也是关键参考。
以下为The Information的文章编译:
去年6月在苹果年度开发者大会上,苹果公司进行了一场令人眼花缭乱的演示。在这场演示中,苹果展示了人工智能如何增强iPhone虚拟助手Siri的功能。然而,在随后的几个月里,Siri团队一直无法确定实现这一切所需的基本技术。
据一位熟悉该项目的苹果前员工透露,他们最初考虑的一个方案是构建小型和大型语言模型,并分别命名为“Mini Mouse”和“Mighty Mouse”。小型模型将在iPhone上运行,并处理一些简单的任务,例如使用Siri设置闹钟。大型模型将在云端运行,并执行更复杂的任务,例如自动预订Uber接送iPhone用户前往会场。
随后,Siri的领导层决定另辟蹊径,构建一个能够处理所有事情的大型模型,这么一来,就需要在云端运行Siri的软件。而这与之前出于隐私考虑,将大部分Siri软件迁移到设备上的做法截然不同。随后,Siri又经历了其他重大的技术转型,这让Siri员工感到沮丧,甚至导致一些员工离开苹果。这也使得苹果在今年发布Siri新功能的目标岌岌可危。
重大决策上的犹豫不决,是导致苹果上个月宣布将Siri 新功能发布时间推迟到 2026 年的因素之一。据四位知情人士透露,苹果内部告诉员工,他们将解除AI主管约翰·詹南德雷亚 (John Giannandrea) 及其副手罗比·沃克 (Robby Walker) 对Siri的职责,后者负责监督苹果的日常运营。
据三位知情人士透露,苹果公司表示,其软件工程主管克雷格·费德里吉 (Craig Federighi) 将接替沃克负责 Siri 的开发,而曾领导 Vision Pro 混合现实头显开发的苹果高管迈克·罗克韦尔 (Mike Rockwell) 将负责沃克之前的职责。
克雷格·费德里吉 (Craig Federighi)
此次功能发布的推迟,对苹果在人工智能领域来说是一个挫折,并且充满尴尬,因为就在九个月前,苹果在开发者大会上向投资者保证,将通过Siri 升级和其他功能,证明苹果在人工智能领域取得的突破。
尽管苹果长期以来一直因在Siri上的“挤牙膏”式创新而饱受诟病,但近年来,随着OpenAI 的 ChatGPT 和其他人工智能产品的火爆,这些批评之声愈演愈烈。
如何利用人工智能,可能是全球最有价值的公司——苹果目前面临的最重大挑战之一——这可能将决定 iPhone 和其他苹果产品能否继续保持其技术优势。
苹果在人工智能领域的一些困境源于根深蒂固的公司价值观——例如,其对用户隐私的强硬立场,这使得该公司难以获取用于训练模型的大量数据,也难以验证人工智能功能是否在设备上运行。
但据多位曾在人工智能和软件工程部门工作过的人士透露,苹果内部的性格冲突也是一个同样重要的因素。超过六名曾在詹南德雷亚领导的人工智能和机器学习部门(简称AI/ML)工作的苹果前员工告诉《The Information》,糟糕的领导层是导致执行力问题的原因。他们指出,沃克在设计Siri的未来版本时既缺乏雄心壮志,也缺乏承担风险的意愿。
在苹果公司内部的工程师们看来,该人工智能团队宽松的文化和执行力上的不足甚至为其赢得了一个不友好的绰号,即其首字母缩写:AIMLess。
苹果公司许多部门对该团队的内部看法都很悲观,这与费德里吉自2012 年以来一直负责的苹果软件工程团队形成了鲜明对比。该团队在苹果操作系统以及消息、照片、邮件和其他应用程序方面的工作,为苹果赢得了高效和执行力的声誉。
苹果前员工曾将Siri 称为“烫手山芋”,不断在不同的团队之间辗转,包括苹果服务主管艾迪·库伊 (Eddy Cue) 和费德里吉 (Federighi) 领导的团队。然而,这些重组均未显著提升 Siri 的性能。
如今,七年过去了,该部门又回到了费德里吉的监管之下。一些前苹果员工表示,这一变化早就应该发生了,尤其是考虑到该人工智能部门的糟糕业绩记录。
例如,费德里吉的团队也拥有自己的机器学习团队,该团队随着时间的推移承担了越来越多的AI职责,这引发了与詹南德雷亚的部分团队的冲突。费德里吉领导下的AI团队负责了迄今为止成功发布的许多AI功能,这些功能被归类为“Apple Intelligence”。
苹果发言人拒绝发表评论。
Siri的问题
在最近陷入困境之前,Siri的问题早已暴露。
2018年,詹南德雷亚从谷歌来到苹果,执掌新成立的人工智能部门。科技界认为,他的加入对苹果来说是一次重大胜利。尽管一些高管认为詹南德雷亚对监管公司目前已搁置的自动驾驶汽车项目更感兴趣,但据一位知情人士透露,詹南德雷亚对Siri特别感兴趣。
当时,苹果于2011 年在 iPhone 上推出的 Siri 功能已经开始停滞不前——它难以回答一般性的问题,并且对第三方应用的支持也十分有限。
甚至在詹南德雷亚接手Siri 助手之前,Siri 团队的成员就感觉自己在苹果公司就像“二等公民”。据知情的前苹果员工透露,Siri 工程师们对软件工程团队对 iOS 更新的控制感到沮丧,认为他们没有优先修复 Siri 的问题,而软件工程师们则认为 Siri 团队无法支持费德里吉团队推出的新功能。
约翰·詹南德雷亚 John Giannandrea
詹南德雷亚告诉其他人,他有信心可以借鉴谷歌打造自家AI语音助手的策略来修复Siri的问题。据一位与他交谈过的人透露,他认为苹果只需要合适的训练数据,改进从网络上抓取答案的能力,以实现回答一些常识性的问题。
在某些方面,詹南德雷亚在苹果的同事中脱颖而出。曾与他共事的人形容他轻松、安静、不爱争吵——这与苹果高管团队的许多其他成员形成了鲜明对比,其中一些人以苛刻人格而闻名。
詹南德雷亚经常向员工阐述他的信念:机器学习可以逐步改进产品,最终带来巨大的收益,他将这一理念称为“爬山”。他过去也曾表达过对聊天机器人的悲观看法,在 ChatGPT 发布前后,他曾告诉苹果员工,他认为聊天机器人不会为用户带来太多价值。
据曾在苹果人工智能部门工作的前员工称,他加入后,一些同事告诉詹南德雷亚,他应该重组Siri 的领导层,但他并没有这样做。
沃克是Siri 的领导者之一,他经常受到同事的批评。他于 2013 年加入苹果,并于 2022 年底负责公司的日常运营。在批评者看来,沃克不愿在 Siri 上冒大风险,而是专注于那些对 Siri 性能没有太大影响的指标,沃克显然没有对彻底改革语音助手抱有宏伟的愿景。
例如,据苹果前工程师称,沃克经常会因为一些微小的进步而庆祝,比如将用户向Siri 提问和 Siri 做出回应之间的延迟缩短几个百分点。他们表示,沃克的另一个心头好是从用于调用语音助手的“嘿 Siri”语音命令中移除“嘿”,而这个项目耗时两年多才完成。
据一位知情人士透露,去年,沃克拒绝了一个工程师团队的尝试,该团队试图利用LLM(大语言模型)来提高Siri 的情感敏感度,以便使它能够检测出处于困境中的用户并给出适当的回应。
沃克告诉同事,他想专注于Siri 的下一个版本,而不是为该项目投入资源。在他不知情的情况下,该项目的工程师绕过了他,继续与软件工程组的安全和定位团队合作开发这些功能。
失衡的激励机制
随着时间的推移,费德里吉的软件工程团队和詹南德雷亚的人工智能团队之间的关系变得越来越紧张,有时甚至完全失调。
从风格上看,两位高管截然不同。费德里吉强硬苛刻的管理风格与詹南德雷亚轻松随意的作风形成鲜明对比。据曾与他们开会的人士透露,费德里吉会向同事提出各种问题,而詹南德雷亚则更善于倾听。
其他的抱怨情绪也随之滋生。软件工程组的一些人对人工智能组的同事获得的更高薪水和更快的晋升感到不满。他们还对人工智能组的一些工程师似乎可以享受更长的假期,并在周五提前下班,而他们自己却面临着更繁重的工作安排感到不满。
两个团队之间的不信任变得如此严重,以至于今年早些时候,詹南德雷亚的一名副手要求工程师详细记录联合项目的开发过程,这样如果项目失败,费德里吉的团队就不能把责任推给人工智能团队。
当费德里吉开始组建自己的团队(由数百名机器学习工程师组成)时,这并没有改善两个团体之间的关系,该团队名为“智能系统”(Intelligent Systems),由费德里吉的一位高级副手塞巴斯蒂安·马里诺-梅斯 (Sebastien Marineau-Mes)领导。
多年来,“智能系统”团队一直在训练自己的模型,并构建演示程序,使用户能够通过语音命令控制应用程序,通常无需Siri 团队的帮助。这导致该公司与 Siri 团队的关系紧张。
据两位知情人士透露,在一次苹果内部演示中,“智能系统”团队的一名成员展示了一张幻灯片,其中动画描绘了两座山峰相撞并被夷为平地。一些人认为,这是对詹南德雷亚“爬山”哲学的微妙嘲讽。
据四位直接了解该项目的前苹果员工透露,大约在2022年,“智能系统”团队开始与沃克和Vision Pro负责人罗克韦尔合作开展一个代号为“Link”的项目,但该项目很快就失败了,该项目的目标是开发语音命令来控制应用程序并完成混合现实头显和未来增强现实眼镜的任务。
参加三方合作会议的工程师们对罗克韦尔和马里诺-梅斯对 Siri 日常负责人沃克的公开敌意感到震惊。两人经常向沃克表达,对Siri 在支持 Vision Pro 方面进展缓慢的不满。
例如,罗克韦尔希望让佩戴耳机的用户能够使用Siri 浏览网页,并仅通过语音调整窗口大小。他还希望在虚拟空间中相互交流的两个人能够一起与 Siri 互动,比如计划一次共同的假期。
但Siri 团队的一些成员对这一目标表示怀疑。知情人士称,最终,由于 Siri 团队无法实现,罗克韦尔为 Vision Pro 设想的许多 Siri 功能被削减。
人工智能引发的兴奋高潮
2022年11月,OpenAI发布了ChatGPT,在科技界和公众中引起了强烈反响。然而,据当时在詹南德雷亚的AI团队工作的前工程师透露,高层领导并没有表现出紧迫感。
费德里吉的软件工程团队内部的反应则截然不同。多位苹果前员工表示,“智能系统”团队的高层领导立即开始分享LLM的论文,并公开讨论如何利用这些论文来改进iPhone。
在“智能系统”团队成员向费德里吉演示了人工智能在iPhone 上可以实现的成果后,软件工程团队内部开始沸腾起来。这些演示利用 OpenAI 的模型,展示了人工智能如何理解用户手机屏幕上的内容,并支持更符合对话的语音来导航应用程序和执行其他任务。
苹果前员工表示,人工智能和软件工程部门的高管们争相宣称拥有LLM所支持的新功能。在很多情况下,软件工程凭借其卓越的成果声誉脱颖而出。
尽管该公司对OpenAI 的模型进行了试验,但苹果管理人员在2023 年告诉他们的工程师,他们不能在最终的苹果产品中包含来自外部公司的模型,而只能用它们来与其内部模型进行对比。
然而,据多位在2023 年和 2024 年使用过这些模型的 Apple 前员工称,这些模型的性能远不及 OpenAI 的技术。
一场令人疑惑的演示
最后,苹果公司于去年6 月宣布推出一套名为 Apple Intelligence 的 AI 功能套件。该套件包含写作和图像生成工具、新的照片编辑和邮件功能以及 Siri 升级版。
此外,苹果公司一改以往反对与其他公司AI 模型合作的立场,宣布与 OpenAI 合作,并提供ChatGPT 作为扩展程序,用于回答问题或执行其自身模型无法处理的任务。
在大会的台上演示中,一位苹果高管询问Siri,她妈妈的航班何时降落。语音助手访问了她的电子邮件和实时航班数据,并提供了当前的到达时间。然后,她让 Siri 提醒她午餐计划,语音助手从她的 iPhone 信息中提取详细信息,并规划了从机场到餐厅的路线。
然而,对于苹果Siri团队的成员来说,这次演示却令人意外。据一位前苹果员工称,他们从未见过这些功能的可运行版本。这位前员工表示,当时演示中唯一在测试设备上激活的新功能是一条闪烁的彩色丝带,当用户调用Siri时,它会出现在iPhone屏幕边缘。
对苹果来说,Siri 的演示打破了以往的惯例。以往,苹果只会在发布会上展示那些已经在测试设备上运行,并且经过营销团队审核以确保能够按时发布的功能和产品。
尽管如此,此次发布会还是给外界留下了深刻的印象。苹果股价在发布这些功能后的两天内飙升了10%以上,华尔街对该公司推出人工智能计划感到欣慰。
一些前苹果员工表示,他们对费德里吉和罗克韦尔能够扭转Siri 的局面持乐观态度,因为他们二人通常比詹南德雷亚和沃克更亲力亲为,而后者则更依赖直接下属来管理事情。
费德里吉是其中之一,他通常比从事软件项目的初级工程师更了解软件项目的技术细节。罗克韦尔于2015年加入苹果,在公司内部被视为一位有远见的领导者,能够为项目带来新思路,同时又能巧妙地驾驭企业文化。
费德里吉已经改变了现状。据一位知情人士透露,他一改之前的策略,指示Siri 的机器学习工程师竭尽全力打造最佳的人工智能功能,即使这意味着将在其软件产品中使用其他公司的开源模型,而不是苹果自己的模型。
参考文章:How Apple Fumbled Siri’s AI Makeover(The Information)
*:not([class*="icon"]):not([class*="fa"]):not([class*="logo"]):not([class*="mi"]):not([class*="code"]):not(i){font-family:PingFang SC,Arial,"Material Icons Extended",stonefont,iknow-qb_share_icons,review-iconfont,mui-act-font,fontAwesome,tm-detail-font,office365icons,MWF-MDL2,global-iconfont,"Bowtie" !important;}[class*="code"]{font-family: Consolas !important}