全球资讯

独家揭秘 Meta AI 大裁员:Llama 4 落后 DeepSeek 的恐慌

文章来源:TechWeb

Meta AI 业务大地震!新主管上任三个月后,挥起裁员大刀,基础研究部门遭受重创,连明星大牛研究员都不幸失业。扎克伯格这是急功近利,自毁长城;还是在精简机构,重振业务?

前 Meta AI 部门员工向 《硅谷观察》 讲述了他开发 Llama 大模型的亲身经历,揭开了 Meta AI 部门大裁员的背后故事。

在他看来,正是开源大模型 Llama 4 明显落后 DeepSeek 等中国竞争对手,给扎克伯格带来了强烈的危机感,促使他下定决心、不惜血本从外部挖来 AI 负责人与精英人才,对 Meta AI 业务与战略进行彻底重组。

Meta 裁员 AI 部门

AI 行业的竞争已经进入白热化,人才成为各家竞相争夺的最紧俏资产。谷歌和微软等诸多科技巨头为了集中资源,投入 AI 研发竞争,在继续扩张 AI 研发部门的同时,甚至不惜对其他非核心部门进行大裁员。

然而,Meta 一边在求贤若渴,开出天价薪酬挖角竞争对手,一边却将裁员大斧砍向自家的 AI 部门,开掉了高达 600 名员工,甚至包括了业界知名的资深研究员。这让很多观察人士感到迷惑与惊讶,也让诸多 AI 同行看到了招募人才的大好机会。

上周三,Meta 宣布对旗下人工智能部门进行重组,裁员大约 600 人。这一消息是由 Meta 首席 AI 官、超级智能实验室负责人亚历山大·王 (Alexandr Wang) 宣布的,属于部门内部调整。

亚历山大·王在发给员工的备忘录中这样写道:「通过缩减团队规模,做决策所需的对话将会减少,每个人将承担更多责任,拥有更大的范围和影响力。」 在他来到 Meta 之后,一直致力于削减臃肿的机构与人员规模。

裁员后,Meta AI 部门的员工总数降至不到 3000 人 。受影响的员工被告知 11 月 21 日为离职日期,在此之前他们处于」 非工作通知期」,期间内部访问权限被移除。

按照加州裁员法规要求,被裁人员将保留两个月的合同与薪水,具体补偿则另行决定。一些持有 H1B 工作签证的员工,则需要在两个月内找到新雇主,才能保住签证继续留在美国。

核心部门毫发无伤

简单介绍下 Meta 目前的 AI 部门,即超级智能实验室,旗下包括了四个部门:TBD Lab(模型训练与扩展部门)、FAIR(基础 AI 研究部门)、产品应用 (产品集成部门) 以及 MSL Infra(基础设施部门)。

此次裁员涉及到其中的三个部门,只有 TBD Lab 并没有受到影响,而且还会继续扩张招聘。显然,这才是扎克伯格最看重的 AI 战略部门,精简其他部门人员,是为了更好支持 TBD Labs。毕竟这个部门背负着研发 Meta 大模型和 AI 产品的核心职责。

TBD Lab 是 Meta 今年 6 月底,随着亚历山大·王空降到来,才组建的一个全新的 AI 团队,而且是由亚历山大·王亲自负责,专注于开发下一代基础模型,包括 Llama 系列的迭代,目标是实现更强的推理能力以及 「超级智能」。

TBD Lab 包括了数十名骨干员工,不仅包括了原先 AI 团队的精英力量,更囊括了扎克伯格在过去几个月不惜重金从谷歌、OpenAI、苹果等竞争对手挖来的诸多业内知名 AI 人才。平均薪酬水准更比其他三个部门高出了一大截。

TBD Lab 部门阵容有多豪华?这里集结了 AI 行业最顶级的技术人才。Meta 挥舞着支票本,到处挖角 AI 公司的明星员工。他们一次性从 OpenAI 打包带走了八名核心开发人才,包括 OpenAI 开发 GPT-4 的几位核心架构师。他们又挖来了苹果 AI 大模型团队负责人庞若名,甚至开出了令人难以置信的两亿美元天价合同。

外来高管空降 Meta

实际上,此次 Meta 对 AI 部门进行重组调整,或许早在外界预料之中。今年 6 月扎克伯格引入亚历山大·王全权负责 AI 部门的时候,外界就预计他会对 Meta 的几大 AI 业务重心与资源分配进行重大调整,尤其是 FAIR 基础研究部门。

今年 6 月,扎克伯格拍板 Meta 向创业公司 Scale AI 投资 148 亿美元,获得了后者没有投票权的半数股权;作为交易一部分,扎克伯格同时将 Scale AI 的创始人兼 CEO 亚历山大·王带到了 Meta,全权负责 AI 业务。

只要觉得对公司具有战略意义,扎克伯格交易出手向来慷慨。随着 Meta 的投资,Scale AI 的估值达到 300 亿美元,也让亚历山大·王的个人资产达到 45 亿美元。彻底财富自由的他可以安心放下自己创办的公司,来到 Meta 统领 AI 业务。

扎克伯格看中了亚历山大·王什么?作为 Scale AI 的联合创始人兼 CEO,他对 AI 模型的训练数据、数据基础设施以及如何高效构建和评估 AI 模型有着深刻的理解和实践经验。这是 Meta 发展和优化其 AI 模型 (尤其是大型语言模型和生成式 AI) 所急需的核心能力。Meta 甚至表示,引入亚历山大后将 「深化我们在为 AI 模型生产数据方面所做的工作」。

而且,亚历山大·王不仅拥有技术背景,更具备卓越的商业头脑和执行能力。扎克伯格这次押注的是一种不同类型的领导力——更偏向于商业思维和实际落地,而非纯粹的研究者。在 AI 军备竞赛中,快速将研究成果转化为可用的产品和能力至关重要。

然而,领导创业公司的亚历山大·王来到 Meta 之后,认为 Meta AI 部门存在臃肿低效的问题,因此必然会进行大刀阔斧的整改,裁员只是一个时间问题。他希望看到一个更加精简,更加灵活,执行力更高的部门。

Llama 惨败是根源

亚历山大·王空降领导 Meta AI 部门,以及此次 AI 部门大裁员,或许都与 Llama 4 的孱弱表现有着直接关系。众所周知,Meta 的旗舰开源模型 Llama 系列在 2023 年 2 月发布后,在全球获得了大量关注与好评。但今年 4 月发布的 Llama 4 却表现令人大失所望。与此同时,以 DeepSeek 为代表的中国模型迅猛崛起,更给 Llama 团队施加了巨大的压力。

为什么 Llama 4 会表现糟糕?一位曾在 Llama 团队直接参与开发的前 Meta 员工透露,这更多是来自中高层的决策问题。Llama 团队原本优先投入在多模态方向,因为 Meta 有多元化的产品生态,如元宇宙,智能眼镜,社交媒体等。

但是今年年初 DeepSeek 出现之后,推理能力显著超越了 Llama,让 Meta 团队内部 「非常恐慌」。团队两头都想做好,但时间已经来不及了,这就导致了产品的混乱。

这位已经离职的 Meta 前员工看来,Meta AI 团队问题的根源是在于人不配位。一些原本做产品的 Meta 中高层,去领导真正做 AI 的人,这就是所谓的 「外行管内行」。这种话语权的错位,是让他决定离职的重要原因之一。(注:他是在扎克伯格引入亚历山大·王之前就离开了 Meta。)

这位前 Meta 员工看来,扎克伯格与首席产品官考克斯 (Chris Cox) 等管理层很有远见,是很强的企业领导者,也深度参与了 Llama 的开发过程,但他们只能关注到大方向部署,不可能关注所有细节,Llama 4 的失败,与一些本身 AI 背景薄弱的中高层的判断失误不无关系。

他认为,扎克伯格已经意识到 Llama 4 失败背后存在严重的团队领导问题,但又认为自己很难通过内部手段带来改变,他需要寻找外部的鲶鱼来让团队重新具备竞争力。这就是扎克伯格找亚历山大·王来领导 Meta AI 部门的直接原因。

虽然扎克伯格并没有让 Llama 团队的这些高层为产品失败承担责任,但他随后找来亚历山大·王空降领导所有 AI 部门,任命 OpenAI 挖来的赵盛嘉为首席科学家,等于变相让原先的 AI 团队边缘化或者降级。

亚历山大·王到来之后组建自己直属的精英团队,又高薪从竞争对手那里挖来顶级 AI 开发人才,直接拉开了与原先 Llama 团队的薪资差距。这种落差在 Meta AI 部门内部士气造成了一定影响,促使一些原先员工寻求跳槽机会。

但这位前 Meta 员工看来,扎克伯格的这一战略不无道理。在他看来,那些新加入的明星员工都有其过人之处。「AI 这个赛道竞争激烈,产品快速迭代,哪怕是 15%-20% 的差距都会决定胜负生死,因此扎克伯格才会如此不惜重金不计代价的投入。」

基础研究成牺牲品

然而,亚历山大到来之后,原本 Meta 的首席科学家、AI 知名学者杨立昆 (Yann LeCun,法国人,自己取的中文名) 的位置就显得逐渐边缘化。杨立昆是 AI 界」 三大教父」 之一,是图灵奖获得者,是 FAIR 部门的创建者,也是 Meta AI 部门的一张招牌名片。

FAIR 于 2013 年 12 月由扎克伯格和杨立昆创立,使命宣言是」 通过开放研究推进人工智能的最新技术,造福所有人」。在过去的十几年间,FAIR 在 AI 研究方面做出了大量基础性工作。

不同于产品开发的紧张节奏,基础研究需要更为宽松的工作氛围。因此在扎克伯格的支持下,FAIR 团队享受着完全不同于 Llama 开发部门的宽松环境。但这也是研究与研发的差别,同样的状况也存在于微软研究院。

但亚历山大·王到来之后,杨立昆领导的基础研究团队 FAIR 也被扎克伯格并入了超级智能实验室。或许,从那时起,这个基础研究部门就注定要成为了亚历山大·王的整改牺牲品。

此次裁员,杨立昆或许不会感到开心,因为许多被裁掉的人都直接在他手下工作。Meta 内部已经有传言称,「杨立昆很快就会离开,去创办自己的开源 AI 初创公司」 。

一位 FAIR 团队的前员工表示,杨立昆给整个 AI 领域做出了很多贡献,希望社会可以尊重和宽容这样的科学家。「他的成就已经非常高了,往前走也肩负着很多东西,有着很强的使命感,毕竟名利都已经够了。」

为什么亚历山大·王要对 FAIR 这样的研究团队裁员,是因为他们会与产品模型开发团队经常争夺计算资源吗?从事 Llama 开发工作的前 Meta 员工否认了这一说法。根据他的介绍,FAIR 团队并不需要多少算力支持,Meta 几乎是向 Llama 开发部门提供了毫无保留的支持,采购的绝大多数英伟达 GPU 都部署在他们的开发团队。

此次整合或许体现出扎克伯格与亚历山大·王的战略考量。在新 AI 负责人的领导下,FAIR 团队的职责也会发生变化。Meta 会更为积极地把 FAIR 的许多研究想法整合到 TBD Lab 运营的项目中,传统的发表论文的研究角色正被能够推出产品的工程角色所取代。

显然,扎克伯格目前的 AI 优先事项是加速开发模型与产品,获得即时回报,而不是无休止地投入在一些十年后才会看到价值的基础研究上。虽然 Meta 会继续推进 AI 基础研究,但可能会在优先事项与公司下一阶段保持一致的,才会得到一定支持。

人才流失同行庆幸

然而,扎克伯格在天价招募 AI 人才的同时,又允许亚历山大·王大举裁员,这相当于将诸多资深 AI 研究人员,倒贴送给竞争对手。值得一提的是,FAIR 团队的研究总监、知名华人 AI 研究员田渊栋也在裁员范围。这个消息让很多业内人士大感震惊。

田渊栋是 FAIR 的研究科学家总监,在业内享有很高声望。他毕业于上海交通大学和卡内基梅隆大学,在强化学习和大语言模型领域发表了诸多具有影响力的论文。田渊栋向 《硅谷观察》 证实了这一消息,但婉拒了采访要求。

在 Meta 工作期间,田渊栋领导开发了早于 AlphaGo 的围棋 AI DarkForestGo 及 OpenGo,后者单卡推理以 20 比 0 的战绩连续战胜了 4 位韩国职业棋手 (棋手方不限时),包括现在排名第一的申真谞。在大模型领域,23 年发现的注意力汇聚 (Attention Sink) 现象被广泛关注,并在开源 GPT 模型中被使用。

去年他团队推出 Searchformer 和 Dualformer 较早发现了超长思维链对 Scaling Laws 的正面影响,及长短混合思维链推理的可能性,团队还开创性地提出了 「连续思维链」(Coconut) 范式,并证明其对离散思维链的优越性。最近发现并刻画了神经网络涌现和顿悟的动力学机制,值得一提的是,他还是一个科幻小说家。

值得一提的是,几个月前,田渊栋的团队被从 FAIR 的核心项目调离,去紧急解决 Llama 4 发布前的问题,然而这并没有改变 Llama 4 的失败结果。而现在,他自己也被裁员了。田渊栋在 X 上发帖称:「对问题负责的人并不是被裁掉的人」,这一句显然意味深长。

作为业界知名研究员,他并不需要担心自己的未来,发帖主要是为了自己组内被裁员的同事寻求工作机会。得益于田渊栋的业内声望,他的 X 文 「欢迎联系我」,立即成为了在线招聘会。

来自 OpenAI、xAI 等热门 AI 创业公司的同行纷纷在下面留言,感慨这是 Meta 犯下的大错误,并希望田渊栋和他的被裁同事可以加入自己的公司。「田渊栋无疑是世界上最优秀的 AI 科学家之一。Meta 让他离开真是遗憾。」 有评论这样写道。

不可否认的是,原本领先的 Llama 大模型被中国产品超越,让扎克伯格陷入了深深的危机感,促使他去改变团队现状与组织结构。或许,只有时间才能证明扎克伯格引入亚历山大·王,对 Meta AI 部门进行的这场重组是否成功。(郑峻)