阿里通义千问发布小尺寸模型 Qwen3-4B，性能超越 GPT4.1-Nano

【旭才科技】阿里通义千问今日宣布，其新发布的 Qwen3-4B 模型系列中的两个新模型——Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507——已经在魔搭社区和 HuggingFace 平台上正式开源。

新模型在非推理领域表现出色，Qwen3-4B-Instruct-2507 全面超越了闭源的小尺寸模型 GPT4.1-Nano，并在性能上接近中等规模的 Qwen3-30B-A3B（non-thinking）。在推理领域，Qwen3-4B-Thinking-2507 的表现甚至可以与 Qwen3-30B-A3B（thinking）相媲美。

官方指出，2507 版本的 Qwen3-4B 模型特别适合在手机等端侧硬件上部署，这将使得手机等移动设备能够高效地运行这些模型。

Qwen3-4B-Instruct-2507 模型的通用能力得到了大幅提升，不仅超越了商业闭源的小尺寸模型 GPT-4.1-nano，而且在性能上接近 Qwen3-30B-A3B（non-thinking）。新模型还覆盖了更多语言的长尾知识，并在主观和开放性任务中增强了人类偏好对齐，能够提供更符合人们需求的答复。此外，模型的上下文理解能力扩展至 256K，使得小模型也能够处理长文本。

Qwen3-4B-Thinking-2507 模型在推理能力上得到了大幅增强，AIME25 得分高达 81.3 分，推理表现可以媲美 Qwen3-30B-Thinking 模型。特别是在 AIME25 测评中，该模型在数学能力方面表现出色，以 4B 参数量获得了 81.3 分的高分。此外，该模型的 Agent 分数也非常突出，相关评测均超越了更大尺寸的 Qwen3-30B-Thinking 模型。模型的 256K tokens 上下文理解能力支持更复杂的文档分析、长篇内容生成、跨段落推理等场景，为用户提供更加丰富的应用体验。

节日采购潮与原油联袂助推，棕榈油突破倒计时还剩什么变量？

停产计划生变？DDR4 价格罕见「倒挂」两大内存巨头延长生产！

新华财经晚报：A 股 8 月新开户数同比增长 165%

农夫山泉：「大自然的搬运工」搬不动了？

历史上的牛市都涨哪些资产？

券商晨会精华：半年报业绩压力释放，看好地产板块后续弹性空间

上海六福黄金现在多少钱一克（2025 年 8 月 29 日）

抢先 Meta 量产！前锤子科技 CTO 创业的 AI 眼镜已交付数百万元订单｜独家

现代汽车 8 月份销量同比环比双双下滑起亚环比也有下滑

AI 唱主角！特斯拉发布「宏图 4.0」马斯克：未来 80% 价值来自机器人

银河证券：A 股估值仍处于合理区间部分行业估值偏高

管制五年，中国芯片产能却暴涨 7 倍？

黄金交易提醒：降息风暴来袭，全球乱局点燃避险火药桶，金价狂飙直逼历史高点！

利润暴跌 1277%，江淮巨亏 17 亿，靠华为百万豪车改命？

美国人欢度劳动节之际警钟响起：超 120 万移民劳动力大军消失！

天津周六福黄金多少钱一克（2025 年 8 月 29 日）

印尼股市反弹，雅加达综合指数一度上涨 1.3%

藏在半年报里的户储「密码」：业绩冷暖不同，海外是主战场……

苹果今年有望为 iPhone 17 系列采购近 1.3 亿块 OLED 显示屏

收评：三大指数回调沪指跌 0.45% 银行股逆市走强

黑马财经

阿里通义千问发布小尺寸模型 Qwen3-4B，性能超越 GPT4.1-Nano

推荐阅读