阿联酋推出低成本 AI 推理模型宣称「性价比」超同行 20 倍

文章来源：财联社

财联社 9 月 9 日讯（编辑赵昊）当地时间周二（9 月 9 日），阿联酋穆罕默德·本·扎耶德人工智能大学（MBZUAI）在官网宣布，其与 G42 共同推出了一款低成本的推理模型「K2 Think」。

新闻稿声称，K2 Think 仅需 320 亿个参数，却能超越其他公司的、规模大 20 倍的推理模型。该模型基于阿里巴巴开源 Qwen 2.5 模型构建，并在 Cerebras 提供的硬件上运行和测试。

MBZUAI 基础模型研究所所长 Hector Liu 告诉媒体，团队通过多种方法实现了高性能表现，包括：长链式思维监督微调（CoT）—— 一种逐步推理的方法；推理阶段扩展（test-time scaling）—— 在推理阶段分配更多计算资源来提升表现。

Liu 表示：「特别之处在于，我们把它当作一个系统来对待，而不仅仅是一个模型。和普通的开源模型仅仅『发布』不同，我们会实际部署该模型，并观察如何随着时间的推移改进模型。」「如果问哪一步最关键，很难单独指出。这更像是一整套方法的组合，才得出了最终结果。」

新闻稿写道，「K2 Think 不仅仅是一项技术成就，更是阿联酋人工智能领域的一个决定性时刻。」

近年来，阿联酋也试图将自己定位为 AI 全球领导者，以提升地缘政治影响力，并减少对原油的依赖。

阿联酋的 AI 企业 G42 就是其突围的例子。但其竞争对手包括邻国沙特，后者今年 5 月通过主权基金成立 Humain，致力于打造全栈 AI 能力。

更宏观来看，阿联酋 AI 产业要追赶中美仍有很长路要走。美国的 OpenAI 和科技巨头已占据先机，中国也早已把 AI 列为战略重点。

尽管 K2 Think 的表现可与 OpenAI 相媲美，开发者强调，他们的目标并不是打造另一个 ChatGPT。

MBZUAI 基础模型研究所总经理 Richard Morton 解释说，这个模型是为数学、科学等特定应用领域而设计。

他说：「人类大脑的基本推理能力是所有思维过程的基石。这个应用能把原本需要 1000 到 2000 人耗费五年时间才能完成的问题思考或临床实验，大大缩短周期。」

此外，它还能让缺乏美国那样资本与基础设施的地区，也能使用先进 AI 技术。Morton 总结道：「我们正在发现，用更少的资源，其实可以做到更多。」

黑马财经