OpenAI 发布全新 GPT-5 外媒：进步显著，但离取代人还很远

8 月 8 日消息，周四，美国人工智能企业 OpenAI 正式推出备受期待的全新 AI 模型 GPT-5，旨在通过更强大的性能，保持其在激烈竞争中的行业领先地位。

GPT-5 于当天的直播活动中正式亮相，其在编程、创意写作以及复杂问题推理等方面的能力均有显著提升。OpenAI 首席执行官萨姆·奥特曼（Sam Altman）在本周早些时候的记者吹风会上，称其为公司现有模型的一次「重大升级」，并表示 GPT-5 首次「真正让人感觉是在与各领域专家直接对话」。

从周四起，OpenAI 将向所有用户开放 GPT-5。付费客户将享有更高使用额度，Pro 会员可访问 GPT-5 Pro 版本，免费用户在配额用尽后将被切换至 GPT-5 mini 模型。教育和企业客户预计下周获得访问权限。

近三年前，OpenAI 发布的聊天机器人 ChatGPT（当时由 GPT-3.5 驱动）引爆了生成式 AI 热潮。此后，OpenAI 陆续推出了一系列日益复杂的系统，包括可模拟人类推理过程的模型，以及几乎无需人工干预、可代替用户执行任务的 AI 智能体。

今年以来，围绕 GPT-5 的猜测甚嚣尘上，其中部分信息源自奥特曼本人的「推波助澜」。今年 4 月，他曾表示 GPT-5 将「比公司最初预期好得多」，近期更直言新模型的能力「让他本人都感到压力」。奥特曼回忆：「我收到一封邮件，问题我没太看懂，于是将其输入 GPT-5，结果它给出了完美答案。那一刻，与 AI 相比，我感觉自己毫无用处。」

OpenAI 的 ChatGPT 团队负责人尼克·特利（Nick Turley）表示，新模型响应速度更快，解答更精准，产生事实性错误的频率也大幅减少。「当你和它对话时，感觉更加自然，」特利说。

作为此次发布的一部分，OpenAI 还推出了四种预设「人格」供 ChatGPT 用户选择，以更好地定制与聊天机器人的互动。这些选项目前以「研究预览」的形式开放，其中包括「犬儒」（Cynic）、机器人（Robot）、「倾听者」（Listener）和「书呆子」（Nerd）。

OpenAI 称，GPT-5 可自动判断何时需要更深入思考，以及应投入多少时间，从而免去用户在常规大模型与推理系统之间手动切换的麻烦。此机制既可优化算力资源，也能提升回答质量。

尤为关键的是，OpenAI 将 GPT-5 定位为一款强大的编程工具。随着越来越多科技巨头和初创公司推出 AI 编程助手，「氛围编程（vibe coding）」已成为趋势。奥特曼说：「『软件按需生成』将成为 GPT-5 时代的标志性特征。」

在周三的现场演示中，一位研究员展示了如何利用 GPT-5 快速构建一个用于教英语使用者法语的网页应用。在提出「美观、高度互动」并包含单词卡、测验和一个「老鼠吃奶酪」小游戏的需求后，ChatGPT 在几分钟内就生成了完整的软件。

为验证模型能力，OpenAI 邀请了多家公司作为早期测试伙伴，其中包括热门 AI 编程助手 Cursor 的开发商 Anysphere，以及瑞典「氛围编程」初创公司 Lovable。

Lovable 的联合创始人兼 CEO 安东·奥西卡（Anton Osika）在接受采访时评价称，GPT-5 在快速构建复杂应用方面表现优于其他模型。他举例说，在构建一个内嵌聊天机器人的财务规划应用这类复杂软件时，开发者通常需要反复迭代，但新模型生成的代码更易于维护，并且在修复程序漏洞方面也表现出色。

一次审慎的飞跃：GPT-5 性能亮眼，但 AGI 仍遥远

路透社认为，GPT-5 有望继续推动全球商业和文化的变革，但其发布正值 AI 行业的一个关键时刻。报道援引经济学作家诺亚·史密斯（Noah Smith）的观点称：「到目前为止，企业的 AI 支出一直相当疲软，但消费者支出则相对强劲……但仅靠消费者的支出，远不足以支撑数据中心所投入的巨额资金。」

《金融时报》也指出，GPT-5 在数学、科学与编程方面的能力表现突出，但仍未跳脱「增量提升」的范畴，通用人工智能尚未到来。该报还提到，GPT-5 在编程能力基准测试 SWE-bench Verified 上的得分，略微超过了该领域的领先者 Anthropic 的最新模型。不过，马斯克旗下 xAI 公司于上月推出的 Grok 4 Heavy 模型，在一些评估推理和知识能力的测试中仍优于 GPT-5。

尽管新模型在编码和科学问题解决能力上表现亮眼，但部分早期测试用户认为，此次从 GPT-4 到 GPT-5 的性能飞跃，并未达到公司前几次产品迭代时的颠覆性程度，且远未达到能完全取代人类的水平。就连奥特曼本人也承认，GPT-5 仍然缺乏自主学习能力，而这正是让 AI 比肩人类能力的关键。

科技媒体 The Verge 则特别指出，发布会上演示的部分图表存在严重的视觉误导（例如横轴比例失真），引发了外界对 GPT-5 透明度及数据准确性的质疑。奥特曼事后承认这是一个「重大图表失误」，并表示营销团队已道歉并公布了修正后的图表。

彭博社认为，OpenAI 发布 GPT-5，是其应对来自中美 AI 企业激烈竞争的最新举措。尽管 OpenAI 长期领跑 AI 市场，但如今正面临多方挑战，其中不乏来自前员工和盟友的竞争。谷歌、Anthropic 以及由 OpenAI 联合创始人埃隆·马斯克创办的 xAI，都已发布了对标 OpenAI 的推理模型和智能体产品，并全力角逐 AI 辅助编程市场。与此同时，像 DeepSeek 这样的中国公司也在迅速崛起。Meta 更是投入巨资为新成立的 AI 实验室招募顶尖人才，甚至不惜从 OpenAI 直接挖走了十多名员工。

为了保持领先优势，目前估值高达 3000 亿美元的 OpenAI 已筹集到数百亿美元资金，用于支付构建和支持 GPT-5 等尖端模型所需的人才、芯片和数据中心费用。据报道，OpenAI 还在就潜在的员工售股进行初步谈判，估值约为 5000 亿美元。

其核心护城河依然是家喻户晓的聊天机器人 ChatGPT。作为公司各种付费服务的「门户产品」，ChatGPT 的周活跃用户已近 7 亿，付费企业用户达 500 万。为进一步扩大影响力，OpenAI 本周三表示，将以每年 1 美元的象征性费用向美国联邦机构提供 ChatGPT 的访问权限；本周早些时候，公司还发布了两款免费开源模型，以应对来自 DeepSeek 和 Meta 的竞争。

美联社指出，GPT 模型的更新是衡量生成式 AI 发展进程的关键指标，备受业界关注。市场之所以对 GPT-5 抱有极高期望，很大程度上是因为 OpenAI 长期以来都将自身的技术迭代，描绘为一条通往通用人工智能（AGI）的必经之路。

康奈尔大学计算机科学助理教授约翰·锡克斯顿（John Thickstun）认为，从技术层面看，GPT-5 在最新基准测试中显示出「适度但显著的改进」，且与 GPT-4 相比，其架构已焕然一新，这可能为未来的创新奠定基础。他补充道：「我并非『工作终结论』的信徒，也不认为 AI 能解决人类的所有问题。但我坚信，OpenAI 及该领域的其他参与者，在持续改进技术方面仍有巨大的探索空间，而不是仅仅满足于对现有成果的利用。」

高德纳（Gartner）分析师奇拉格·德卡特（Chirag Dekate）则给出了更为审慎的评价：「GPT-5 在技术性能方面符合预期，在任务推理和编码方面有所提升，但在其他领域则表现平平……其在写作质量上只是渐进式的提升。」

但分析普遍认为，即便只是渐进式的提升，在 OpenAI 与竞争对手的商业博弈中也具有重要意义。（辰辰）

银河证券：A 股估值仍处于合理区间部分行业估值偏高

管制五年，中国芯片产能却暴涨 7 倍？

黄金交易提醒：降息风暴来袭，全球乱局点燃避险火药桶，金价狂飙直逼历史高点！

利润暴跌 1277%，江淮巨亏 17 亿，靠华为百万豪车改命？

美国人欢度劳动节之际警钟响起：超 120 万移民劳动力大军消失！

天津周六福黄金多少钱一克（2025 年 8 月 29 日）

印尼股市反弹，雅加达综合指数一度上涨 1.3%

藏在半年报里的户储「密码」：业绩冷暖不同，海外是主战场……

苹果今年有望为 iPhone 17 系列采购近 1.3 亿块 OLED 显示屏

收评：三大指数回调沪指跌 0.45% 银行股逆市走强

中报季后 A 股怎么买？券商 9 月金股转向成长风格电子股最热

九三阅兵，就在明天！新型装备亮相、将实现多个「首次」

9 月 2 日财经早餐：美联储降息押注提振，金价距离历史高点只差 10 美元，白银十四年来首次突破 40 美元

中国车主：买最好的车，挨最毒的骂

苹果供应链将迎来大重整？供应商若不自动化生产将失去未来合同

重庆六福今日黄金价格多少钱一克（2025 年 8 月 29 日）

半年减员 2.6 万，日赚 37 亿：六大行中报里的 A 面与 B 面 | 巴伦精选

海外中国股票 ETF 规模大增

消息称台积电二季度在全球晶圆代工市场份额超过 70%

原油交易提醒：俄乌冲突导致俄罗斯炼油产能受损，WTI 升至 64.82 美元，市场等待 OPEC+会议信号

黑马财经

OpenAI 发布全新 GPT-5 外媒：进步显著，但离取代人还很远

推荐阅读