2025 年 9 月 2 日 17 时 57 分 06 秒
前沿科技

OpenAI 发布全新 GPT-5 外媒:进步显著,但离取代人还很远

8 月 8 日消息,周四,美国人工智能企业 OpenAI 正式推出备受期待的全新 AI 模型 GPT-5,旨在通过更强大的性能,保持其在激烈竞争中的行业领先地位。

GPT-5 于当天的直播活动中正式亮相,其在编程、创意写作以及复杂问题推理等方面的能力均有显著提升。OpenAI 首席执行官萨姆·奥特曼 (Sam Altman) 在本周早些时候的记者吹风会上,称其为公司现有模型的一次 「重大升级」,并表示 GPT-5 首次 「真正让人感觉是在与各领域专家直接对话」。

从周四起,OpenAI 将向所有用户开放 GPT-5。付费客户将享有更高使用额度,Pro 会员可访问 GPT-5 Pro 版本,免费用户在配额用尽后将被切换至 GPT-5 mini 模型。教育和企业客户预计下周获得访问权限。

近三年前,OpenAI 发布的聊天机器人 ChatGPT(当时由 GPT-3.5 驱动) 引爆了生成式 AI 热潮。此后,OpenAI 陆续推出了一系列日益复杂的系统,包括可模拟人类推理过程的模型,以及几乎无需人工干预、可代替用户执行任务的 AI 智能体。

今年以来,围绕 GPT-5 的猜测甚嚣尘上,其中部分信息源自奥特曼本人的 「推波助澜」。 今年 4 月,他曾表示 GPT-5 将 「比公司最初预期好得多」,近期更直言新模型的能力 「让他本人都感到压力」。奥特曼回忆:「我收到一封邮件,问题我没太看懂,于是将其输入 GPT-5,结果它给出了完美答案。那一刻,与 AI 相比,我感觉自己毫无用处。」

OpenAI 的 ChatGPT 团队负责人尼克·特利 (Nick Turley) 表示,新模型响应速度更快,解答更精准,产生事实性错误的频率也大幅减少。「当你和它对话时,感觉更加自然,」 特利说。

作为此次发布的一部分,OpenAI 还推出了四种预设 「人格」 供 ChatGPT 用户选择,以更好地定制与聊天机器人的互动。这些选项目前以 「研究预览」 的形式开放,其中包括 「犬儒」(Cynic)、机器人 (Robot)、「倾听者」(Listener) 和 「书呆子」(Nerd)。

OpenAI 称,GPT-5 可自动判断何时需要更深入思考,以及应投入多少时间,从而免去用户在常规大模型与推理系统之间手动切换的麻烦。此机制既可优化算力资源,也能提升回答质量。

尤为关键的是,OpenAI 将 GPT-5 定位为一款强大的编程工具。随着越来越多科技巨头和初创公司推出 AI 编程助手,「氛围编程 (vibe coding)」 已成为趋势。奥特曼说:「『软件按需生成』 将成为 GPT-5 时代的标志性特征。」

在周三的现场演示中,一位研究员展示了如何利用 GPT-5 快速构建一个用于教英语使用者法语的网页应用。在提出 「美观、高度互动」 并包含单词卡、测验和一个 「老鼠吃奶酪」 小游戏的需求后,ChatGPT 在几分钟内就生成了完整的软件。

为验证模型能力,OpenAI 邀请了多家公司作为早期测试伙伴,其中包括热门 AI 编程助手 Cursor 的开发商 Anysphere,以及瑞典 「氛围编程」 初创公司 Lovable。

Lovable 的联合创始人兼 CEO 安东·奥西卡 (Anton Osika) 在接受采访时评价称,GPT-5 在快速构建复杂应用方面表现优于其他模型。他举例说,在构建一个内嵌聊天机器人的财务规划应用这类复杂软件时,开发者通常需要反复迭代,但新模型生成的代码更易于维护,并且在修复程序漏洞方面也表现出色。

一次审慎的飞跃:GPT-5 性能亮眼,但 AGI 仍遥远

路透社认为,GPT-5 有望继续推动全球商业和文化的变革,但其发布正值 AI 行业的一个关键时刻。报道援引经济学作家诺亚·史密斯 (Noah Smith) 的观点称:「到目前为止,企业的 AI 支出一直相当疲软,但消费者支出则相对强劲……但仅靠消费者的支出,远不足以支撑数据中心所投入的巨额资金。」

《金融时报》 也指出,GPT-5 在数学、科学与编程方面的能力表现突出,但仍未跳脱 「增量提升」 的范畴,通用人工智能尚未到来。该报还提到,GPT-5 在编程能力基准测试 SWE-bench Verified 上的得分,略微超过了该领域的领先者 Anthropic 的最新模型。不过,马斯克旗下 xAI 公司于上月推出的 Grok 4 Heavy 模型,在一些评估推理和知识能力的测试中仍优于 GPT-5。

尽管新模型在编码和科学问题解决能力上表现亮眼,但部分早期测试用户认为,此次从 GPT-4 到 GPT-5 的性能飞跃,并未达到公司前几次产品迭代时的颠覆性程度,且远未达到能完全取代人类的水平。就连奥特曼本人也承认,GPT-5 仍然缺乏自主学习能力,而这正是让 AI 比肩人类能力的关键。

科技媒体 The Verge 则特别指出,发布会上演示的部分图表存在严重的视觉误导 (例如横轴比例失真),引发了外界对 GPT-5 透明度及数据准确性的质疑。奥特曼事后承认这是一个 「重大图表失误」,并表示营销团队已道歉并公布了修正后的图表。

彭博社认为,OpenAI 发布 GPT-5,是其应对来自中美 AI 企业激烈竞争的最新举措。尽管 OpenAI 长期领跑 AI 市场,但如今正面临多方挑战,其中不乏来自前员工和盟友的竞争。谷歌、Anthropic 以及由 OpenAI 联合创始人埃隆·马斯克创办的 xAI,都已发布了对标 OpenAI 的推理模型和智能体产品,并全力角逐 AI 辅助编程市场。与此同时,像 DeepSeek 这样的中国公司也在迅速崛起。Meta 更是投入巨资为新成立的 AI 实验室招募顶尖人才,甚至不惜从 OpenAI 直接挖走了十多名员工。

为了保持领先优势,目前估值高达 3000 亿美元的 OpenAI 已筹集到数百亿美元资金,用于支付构建和支持 GPT-5 等尖端模型所需的人才、芯片和数据中心费用。据报道,OpenAI 还在就潜在的员工售股进行初步谈判,估值约为 5000 亿美元。

其核心护城河依然是家喻户晓的聊天机器人 ChatGPT。作为公司各种付费服务的 「门户产品」,ChatGPT 的周活跃用户已近 7 亿,付费企业用户达 500 万。为进一步扩大影响力,OpenAI 本周三表示,将以每年 1 美元的象征性费用向美国联邦机构提供 ChatGPT 的访问权限;本周早些时候,公司还发布了两款免费开源模型,以应对来自 DeepSeek 和 Meta 的竞争。

美联社指出,GPT 模型的更新是衡量生成式 AI 发展进程的关键指标,备受业界关注。市场之所以对 GPT-5 抱有极高期望,很大程度上是因为 OpenAI 长期以来都将自身的技术迭代,描绘为一条通往通用人工智能 (AGI) 的必经之路。

康奈尔大学计算机科学助理教授约翰·锡克斯顿 (John Thickstun) 认为,从技术层面看,GPT-5 在最新基准测试中显示出 「适度但显著的改进」,且与 GPT-4 相比,其架构已焕然一新,这可能为未来的创新奠定基础。他补充道:「我并非 『工作终结论』 的信徒,也不认为 AI 能解决人类的所有问题。但我坚信,OpenAI 及该领域的其他参与者,在持续改进技术方面仍有巨大的探索空间,而不是仅仅满足于对现有成果的利用。」

高德纳 (Gartner) 分析师奇拉格·德卡特 (Chirag Dekate) 则给出了更为审慎的评价:「GPT-5 在技术性能方面符合预期,在任务推理和编码方面有所提升,但在其他领域则表现平平……其在写作质量上只是渐进式的提升。」

但分析普遍认为,即便只是渐进式的提升,在 OpenAI 与竞争对手的商业博弈中也具有重要意义。(辰辰)

推荐阅读

任天堂官网删除 Switch 2 底座模式 VRR 功能描述,原因成谜

admin

微信漏洞曝光:一键让好友 「喊爸爸」,官方或将紧急修复

admin

Manus「出走」 中国,为哪般?

admin