2025 年 9 月 10 日 8 时 05 分 09 秒
股市风云

阿联酋推出低成本 AI 推理模型 宣称 「性价比」 超同行 20 倍

文章来源:财联社

财联社 9 月 9 日讯 (编辑 赵昊)当地时间周二 (9 月 9 日),阿联酋穆罕默德·本·扎耶德人工智能大学 (MBZUAI) 在官网宣布,其与 G42 共同推出了一款低成本的推理模型 「K2 Think」。

image

新闻稿声称,K2 Think 仅需 320 亿个参数,却能超越其他公司的、规模大 20 倍的推理模型。该模型基于阿里巴巴开源 Qwen 2.5 模型构建,并在 Cerebras 提供的硬件上运行和测试。

MBZUAI 基础模型研究所所长 Hector Liu 告诉媒体,团队通过多种方法实现了高性能表现,包括:长链式思维监督微调 (CoT)—— 一种逐步推理的方法;推理阶段扩展 (test-time scaling)—— 在推理阶段分配更多计算资源来提升表现。

Liu 表示:「特别之处在于,我们把它当作一个系统来对待,而不仅仅是一个模型。和普通的开源模型仅仅 『发布』 不同,我们会实际部署该模型,并观察如何随着时间的推移改进模型。」「如果问哪一步最关键,很难单独指出。这更像是一整套方法的组合,才得出了最终结果。」

新闻稿写道,「K2 Think 不仅仅是一项技术成就,更是阿联酋人工智能领域的一个决定性时刻。」

近年来,阿联酋也试图将自己定位为 AI 全球领导者,以提升地缘政治影响力,并减少对原油的依赖。

阿联酋的 AI 企业 G42 就是其突围的例子。但其竞争对手包括邻国沙特,后者今年 5 月通过主权基金成立 Humain,致力于打造全栈 AI 能力。

更宏观来看,阿联酋 AI 产业要追赶中美仍有很长路要走。美国的 OpenAI 和科技巨头已占据先机,中国也早已把 AI 列为战略重点。

尽管 K2 Think 的表现可与 OpenAI 相媲美,开发者强调,他们的目标并不是打造另一个 ChatGPT。

MBZUAI 基础模型研究所总经理 Richard Morton 解释说,这个模型是为数学、科学等特定应用领域而设计。

他说:「人类大脑的基本推理能力是所有思维过程的基石。这个应用能把原本需要 1000 到 2000 人耗费五年时间才能完成的问题思考或临床实验,大大缩短周期。」

此外,它还能让缺乏美国那样资本与基础设施的地区,也能使用先进 AI 技术。Morton 总结道:「我们正在发现,用更少的资源,其实可以做到更多。」

推荐阅读

百度股价创今年新高!李彦宏 700 万元重奖技术团队

admin

固态电池产业催化密集 上游供应商或迎定点关键期

admin

基金圈也上演 「喜芯厌酒」,8 月大涨基金 「确定性抱团」,22 只产品年内翻倍

admin