实测阿里万亿参数大模型：开源路线跑通了吗？

文章来源：钛媒体

文 | 划重点 KeyPoints

划重点：

1、阿里发布史上最大模型，参数量超过 1 万亿，编程能力直接反超 Claude，证明 Scaling Law 依旧在奏效。

2、阿里「模+云」的策略形成了从技术研发到商业化落地的最短路径，是 Qwen 能够取得后来者居上成绩的关键之一。

3、阿里开源模式的核心挑战在于如何平衡开放与收益。Qwen 未来不仅需要在技术上持续突破，更需要在商业模式和组织能力上证明自己。

昨天 Anthropic 刚玩了一手「极端措施」，阿里深夜一波大的直接反手一记重拳——推出其史上最大的模型，Qwen3-Max-Preview，参数量足足超 1 万亿！

用「通义大模型」微信公众号官方的标题来形容它的能力，就是「强得不止一点」。

因为从基准测试结果来看，Qwen3-Max-Preview 已经超越了此前自家的 Qwen3-235B-A22B-2507。

并且官方还放出了与 Kimi K2、Claude Opus 4（Non-thinking），以及 DeepSeek-V3.1 的对比结果。

从下面的表格中不难看出，Qwen3-Max-Preview 已经在 SuperGPQA、AIME2025、LiveCodeBench V6、Arena-Hard V2 和 LiveBench 等基准测试中，均超越了其它选手。

尤其是在编程能力方面，此前 Claude 默认是业内最强，这次 Qwen3-Max-Preview 直接以大力出奇迹的方式实现了反超，也是让一众网友惊叹不已。

Qwen 在 X 上的推文中似乎也是一语道破「玄机」：Scaling works（规模化扩展是有效的）。

01 实测阿里史上最大模型

目前，Qwen3-Max-Preview 已经可以体验，只需在模型下拉选项中选择即可：

体验地址：https://chat.qwen.ai

并且官方的 API 服务也已经开放：https://bailian.console.aliyun.com/?tab=model#/model-market（搜索 Qwen3-Max-Preview）。

在实际效果方面，已经有不少国内外的网友们展开了实测；例如 X 上的知名博主 AK，他就在 HuggingFace 集成了 Qwen3-Max-Preview 的项目 AnyCoder 中，输入了这样的 Prompt：

Design and create a very creative, elaborate, and detailed voxel art scene of a pagoda in a beautiful garden with trees, including some cherry blossoms. Make the scene impressive and varied and use colorful voxels. Use whatever libraries to get this done.

然后，据 AK 的描述，Qwen3-Max-Preview 一次性就实现了如下的效果：

当我们在官网中输入这样的 Prompt：

Create a beautiful celebratory landing page for the launch of Qwen3 Max.

只需短短几秒钟的时间，Qwen3-Max-Preview 就生成了一个完整的庆祝页面，响应速度实测是非常快的：

接下来，我们加大难度，直接上经典的编程问题——弹跳球模拟碰撞。

先小试牛刀一个：

Write a javascript code that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically, implement it in javascript and html.

可以看到，小球会基于物理规律在六边形的框内运行；并且在用「向上键」去给小球一个力时，它也能立即做出响应。

当我们把球的数量设置到 10 个，一次性生成的效果也是相当自然：

最后，我们再让 Qwen3-Max-Preview 生成一个小游戏：

做一个《愤怒的小鸟》的小游戏。

不过虽然是一次性生成成功，但或许因为 Prompt 过于简单，这个小游戏还是有一些小瑕疵，例如怪物的位置不是很准确；感兴趣的小伙伴可以多次尝试一下。

02 Qwen 凭什么后来者居上？

从这次阿里直接从千亿参数模型飙升到万亿规模（近四倍提升），并且一举在众多评测中拿下第一来看，Qwen 已然在全球范围内站稳了第一梯队的位置。

但有一说一，纵观整场 AI 大模型的竞赛，阿里并不是最早在中国推出对标 ChatGPT 产品的公司，但绝对属于后来者居上的那一个。

相较于国内先行者（如百度），阿里大模型初期可以说是相对低调，不过它的路径却是格外的清晰——用模型开源来构建生态，用自研闭源探索技术前沿。

例如在开源这件事上，从 2023 年开始，Qwen 就以惊人的速度向全球开发者开源多个版本模型。从 70 亿参数的 Qwen-7B 到 140 亿、720 亿参数，再到视觉、音频等多模态模型，几乎覆盖所有主流尺寸和应用场景。更关键的是，阿里不仅开源模型权重，还开放商业化授权，极大激发了中小企业和个人开发者的热情。

这一系列动作让它迅速在 Hugging Face 等全球顶级开源社区建立广泛影响力，吸引了大量开发者围绕 Qwen 生态创新开发，形成强大社区驱动力。这种广积粮的策略为通义千问赢得了宝贵的开发者心智和应用场景数据，这可以说是闭源模型难以企及的优势。

但在开源之外，阿里内部也从没有停止对模型能力上限的探索。正如官方发布万亿参数模型时所言，Scaling works（规模化扩展有效）。这背后是对 Scaling Law 的一种笃信——随着模型参数、数据量和计算量指数级增长，模型能力会涌现质的飞跃。

训练 Qwen3 Max Preview 这样的万亿参数模型，不仅是资源堆砌，更要求在超大规模计算集群稳定性、分布式训练算法效率、数据处理精细度以及工程优化的每个细节上都做到极致。

这背后是阿里数年来在算力基础设施上的巨大投入，以及在 AI 工程化领域的深厚积累。正是这种大力出奇迹式的饱和投入，让 Qwen 在编程、推理等核心能力上实现了对 Claude Opus 等顶级模型的反超。

在开源模型和能力探索之外，阿里云，也是 Qwen 能够后来者居上的关键一环。

毕竟大模型训练推理是名副其实的算力吞金兽，阿里云为 Qwen 研发提供了稳定高效的算力基础设施，整合了从数据标注、模型开发、分布式训练到部署推理的全链路工具，极大降低了研发团队工程负担，使其专注算法和模型创新。

并且在模型的应用和普及方面，同样是因为阿里云的 MaaS 战略，可以让 Qwen 快速在各行各业中深耕；例如企业客户无需从零训练模型，可直接在阿里云调用 Qwen API，或利用平台工具对开源 Qwen 模型微调，快速构建 AI 应用。

这种「模+云」的策略形成了从技术研发到商业化落地的最短路径。

03 但也并非完美

虽然阿里在大模型发展的战略和选择促成了它后来者居上的优势，但这并不意味着现阶段的 Qwen 没有隐患。

因为阿里选择的开源模型引流、云服务变现可以说是一条机遇与挑战并存的道路；它与 Meta 的 Llama 系列相似，目标通过开放生态快速抢占市场份额和开发者心智，最终将商业价值导向自家基础设施。

这与 OpenAI、Anthropic 等闭源+API 的精英路线形成鲜明对比，它们优势在于更好保护核心技术，维持技术代差，通过高价值 API 服务直接获得高额利润。

而阿里开源策略虽能快速普及技术，但这也意味着其最先进模型很难与竞争对手拉开绝对差距，商业模式也更加迂回，需要客户首先认可其云平台价值。

开源模式的核心挑战在于如何平衡开放与收益，当企业可以免费获取并私有化部署性能足够好的开源模型时，他们为官方云服务付费的意愿又会有多强呢？

换言之，阿里云不仅要提供简单模型托管，还必须提供远超开源版本的性能优化、安全保障、以及强大工具链和企业级服务，才能构建足够深的护城河。如何让庞大开源用户群体有效转化为高价值付费云客户，是这条道路上最关键的商业惊险一跃。

除了商业化的挑战之外，在顶尖 AI 人才争夺进入白热化的今天，任何核心人才流失都可能对团队造成深远影响。

近年来，包括 AI 框架和基础设施领域关键人物贾扬清在内的一些核心技术人才先后离开阿里，投身创业浪潮或加入其他巨头。虽然对于阿里这样体量的公司而言，个别人员离开未必动摇根基，但负面影响依然存在。

毕竟核心领军人物离开可能影响团队士气，对外传递负面信号，增加后续吸引顶尖人才的难度；在关键技术方向上，领军人物的变动还可能给项目长期战略延续性带来不确定性。

也正像 Meta 在硅谷持续上演的抢人大战，离开的人才往往成为新竞争对手，他们对原有体系优劣势了如指掌，可能在细分领域构成更精准威胁。

因此，阿里如何在高强度竞争下持续保持对全球顶尖 AI 人才的吸引力，并建立稳定可持续的人才梯队，是它在未来发展过程中必须面对的严肃课题。

结语

总体来看，阿里通义千问无疑是中国乃至全球大模型领域的顶级力量。它凭借「开源与自研并行」的清晰战略、依托阿里云的强大生态、以及深厚技术人才积累，成功在激烈竞争中占据领先地位。万亿参数模型的发布更是彰显了其在 Scaling Law 上的决心和实力。

然而，成功之路也伴随着清晰挑战。以开源换生态的商业模式，其盈利能力的持续性仍需市场检验；与 OpenAI 等闭源巨头的技术代差追逐将是长期过程；而顶级人才的保留与吸引，则是维持创新活力的生命线。

Qwen 在未来不仅需要在技术上持续突破，更需要在商业模式和组织能力上证明自己的独特价值。它能否将今天的技术优势转化为明天不可动摇的市场胜势，将是整个行业、包括资本市场关注的焦点。这也是阿里未来市值能否更上一层楼的关键。

参考链接：

1、https://x.com/Alibaba_Qwen/status/1963991502440562976

2、https://chat.qwen.ai/

3、https://x.com/_akhaliq/status/1964001592710975971

AI 芯片赛道「黑马」来袭，英伟达 4 万亿市值红线受威胁

2025 慕尼黑车展前瞻：德系主场坐镇下，中国汽车新能源与智能化之战

智谱打响中场战事

上海今日黄金价格多少钱一克（2025 年 9 月 3 日）

天通股份董事长郑晓彬：蓝宝石晶圆成后摩尔时代关键材料

OpenAI 重组 ChatGPT 个性研究团队！

闪电式突袭，美国抓捕大批韩国人，包括工厂工程师，特朗普发声

安克创新，如何从「浅海」游向深海

广州今日黄金价格多少钱一克（2025 年 9 月 3 日）

科创板分红哪家强？今年半年度 79 家企业金额同比增 18.2% 这家公司分红比例最高

特朗普威胁对欧盟发起贸易调查冲冠一怒竟是为了谷歌！