GPT 革命｜DeepSeek 发布新开源模型称仅用 2048 卡训练、能力与 GPT-4o 相当

: 资料图：DeepSeek 公司 logo。

　　【旭才科技】开源模型还在不断进化。12 月 26 日，国内私募机构幻方量化旗下的 DeepSeek 发布新一代开源大模型 DeepSeek-v3，DeepSeek 称该模型是目前最强的开源大模型，能力与闭源的 GPT-4o 相近，而训练仅需要 2048 张英伟达 H800AI 芯片。作为参考，OpenAI 训练最新模型单集群算力规模超过万卡。

　　具体来看，DeepSeek 此次发布的模型为 MoE（混合专家架构）架构，即将任务分类后分配给不同的专家模型解决，参数量为 6710 亿，激活参数为 370 亿。

　　DeepSeek 提供的评测结果显示，该模型在考察百科知识、代码、数学能力的多个评测集中得分超过阿里云 Qwen2.5-72B 和 Meta 的 Llama-3.1-405B 这两个最强的开源模型；在这些榜单中，DeepSeek-v3 得分与 OpenAI 于 2024 年 5 月发布的 GPT-4o，以及 Anthropic 于 6 月发布的 Claude-3.5-Sonnet 两个标杆闭源模型。

中报季后 A 股怎么买？券商 9 月金股转向成长风格电子股最热

九三阅兵，就在明天！新型装备亮相、将实现多个「首次」

9 月 2 日财经早餐：美联储降息押注提振，金价距离历史高点只差 10 美元，白银十四年来首次突破 40 美元

中国车主：买最好的车，挨最毒的骂

苹果供应链将迎来大重整？供应商若不自动化生产将失去未来合同

重庆六福今日黄金价格多少钱一克（2025 年 8 月 29 日）

半年减员 2.6 万，日赚 37 亿：六大行中报里的 A 面与 B 面 | 巴伦精选

海外中国股票 ETF 规模大增

消息称台积电二季度在全球晶圆代工市场份额超过 70%

原油交易提醒：俄乌冲突导致俄罗斯炼油产能受损，WTI 升至 64.82 美元，市场等待 OPEC+会议信号

习近平主持中俄蒙元首第七次会晤

老股民的那套方法论，不好使了？

美国住房市场拉响警报：新房供应过剩，创大衰退以来最高水平！

市场全天震荡调整，创业板指冲高回落跌 2.85%，机器人概念午后逆势拉升

石家庄周大福黄金价格今天多少一克（2025 年 8 月 29 日）

中央汇金扫货路线图：大举增持 ETF 1.28 万亿规模创新高

债市日报：9 月 2 日

欧元即将快速升值？背后原因令人意想不到

欧佩克+或紧急刹车，本周将迎增产潮后的首次观望

AI 赋能热梗、表情包创作 App 翻红，「傻瓜式」AI 应用迎来发展机遇

黑马财经

GPT 革命｜DeepSeek 发布新开源模型称仅用 2048 卡训练、能力与 GPT-4o 相当

推荐阅读