文章来源:财联社
财联社 9 月 9 日讯 (编辑 赵昊)当地时间周二 (9 月 9 日),阿联酋穆罕默德·本·扎耶德人工智能大学 (MBZUAI) 在官网宣布,其与 G42 共同推出了一款低成本的推理模型 「K2 Think」。
新闻稿声称,K2 Think 仅需 320 亿个参数,却能超越其他公司的、规模大 20 倍的推理模型。该模型基于阿里巴巴开源 Qwen 2.5 模型构建,并在 Cerebras 提供的硬件上运行和测试。
MBZUAI 基础模型研究所所长 Hector Liu 告诉媒体,团队通过多种方法实现了高性能表现,包括:长链式思维监督微调 (CoT)—— 一种逐步推理的方法;推理阶段扩展 (test-time scaling)—— 在推理阶段分配更多计算资源来提升表现。
Liu 表示:「特别之处在于,我们把它当作一个系统来对待,而不仅仅是一个模型。和普通的开源模型仅仅 『发布』 不同,我们会实际部署该模型,并观察如何随着时间的推移改进模型。」「如果问哪一步最关键,很难单独指出。这更像是一整套方法的组合,才得出了最终结果。」
新闻稿写道,「K2 Think 不仅仅是一项技术成就,更是阿联酋人工智能领域的一个决定性时刻。」
近年来,阿联酋也试图将自己定位为 AI 全球领导者,以提升地缘政治影响力,并减少对原油的依赖。
阿联酋的 AI 企业 G42 就是其突围的例子。但其竞争对手包括邻国沙特,后者今年 5 月通过主权基金成立 Humain,致力于打造全栈 AI 能力。
更宏观来看,阿联酋 AI 产业要追赶中美仍有很长路要走。美国的 OpenAI 和科技巨头已占据先机,中国也早已把 AI 列为战略重点。
尽管 K2 Think 的表现可与 OpenAI 相媲美,开发者强调,他们的目标并不是打造另一个 ChatGPT。
MBZUAI 基础模型研究所总经理 Richard Morton 解释说,这个模型是为数学、科学等特定应用领域而设计。
他说:「人类大脑的基本推理能力是所有思维过程的基石。这个应用能把原本需要 1000 到 2000 人耗费五年时间才能完成的问题思考或临床实验,大大缩短周期。」
此外,它还能让缺乏美国那样资本与基础设施的地区,也能使用先进 AI 技术。Morton 总结道:「我们正在发现,用更少的资源,其实可以做到更多。」