文章来源:techweb
【旭才科技】9 月 11 日消息,在 9 日举办的 WAVE SUMMIT 深度学习开发者大会 2025 现场,百度开源最新的思考模型 ERNIE-4.5-21B-A3B-Thinking。
据 HuggingFace 官网数据,截至 2025 年 9 月 11 日,百度最新开源的文心思考模型 ERNIE-4.5-21B-A3B-Thinking,在 HuggingFace 文本模型趋势榜上排名第一,模型总榜排名第三。
ERNIE-4.5-21B-A3B-Thinking 采用了混合专家 (MoE) 架构,总参数规模达 21B,每个 token 激活 3B 参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。
ERNIE-4.5-21B-A3B-Thinking 作为一款 21B 总参数量,激活仅 3B 的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近 SOTA 的智能表现。