2025 年 9 月 2 日 19 时 15 分 01 秒
前沿科技

阿里通义千问发布小尺寸模型 Qwen3-4B,性能超越 GPT4.1-Nano

【旭才科技】 阿里通义千问今日宣布,其新发布的 Qwen3-4B 模型系列中的两个新模型——Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507——已经在魔搭社区和 HuggingFace 平台上正式开源。

新模型在非推理领域表现出色,Qwen3-4B-Instruct-2507 全面超越了闭源的小尺寸模型 GPT4.1-Nano,并在性能上接近中等规模的 Qwen3-30B-A3B(non-thinking)。在推理领域,Qwen3-4B-Thinking-2507 的表现甚至可以与 Qwen3-30B-A3B(thinking) 相媲美。

官方指出,2507 版本的 Qwen3-4B 模型特别适合在手机等端侧硬件上部署,这将使得手机等移动设备能够高效地运行这些模型。

Qwen3-4B-Instruct-2507 模型的通用能力得到了大幅提升,不仅超越了商业闭源的小尺寸模型 GPT-4.1-nano,而且在性能上接近 Qwen3-30B-A3B(non-thinking)。新模型还覆盖了更多语言的长尾知识,并在主观和开放性任务中增强了人类偏好对齐,能够提供更符合人们需求的答复。此外,模型的上下文理解能力扩展至 256K,使得小模型也能够处理长文本。

Qwen3-4B-Thinking-2507 模型在推理能力上得到了大幅增强,AIME25 得分高达 81.3 分,推理表现可以媲美 Qwen3-30B-Thinking 模型。特别是在 AIME25 测评中,该模型在数学能力方面表现出色,以 4B 参数量获得了 81.3 分的高分。此外,该模型的 Agent 分数也非常突出,相关评测均超越了更大尺寸的 Qwen3-30B-Thinking 模型。模型的 256K tokens 上下文理解能力支持更复杂的文档分析、长篇内容生成、跨段落推理等场景,为用户提供更加丰富的应用体验。
 

推荐阅读

数据搭建大模型应用基石,厂商试水软硬件新融合

admin

:懂车帝测试公平性遭质疑,巴菲特疯狂囤现金

admin

:马斯克回应中国消费者冷落特斯拉,苹果又面临集体诉讼

admin