前沿科技

DeepSeek 知乎独家发文收官开源周 首次披露理论利润率达 545%

【旭才科技】3 月 1 日消息,DeepSeek 于知乎开设官方账号,独家发布 《DeepSeek-V3/R1 推理系统概览》 技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息。

DeepSeeK 文章写道:「DeepSeek-V3 / R1 推理系统的优化目标是:更大的吞吐,更低的延迟。」 为实现这两个目标,DeepSeek 的方案是使用大规模跨节点专家并行 (EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用 EP 增长批量大小 (batch size)、隐藏传输耗时以及进行负载均衡。

值得一提的是,文章还率先披露了 DeepSeek 的成本和利润率等关键信息。「假定 GPU 租赁成本为 2 美金/小时,总成本为 $87,072/天。……如果所有 tokens 全部按照 DeepSeek R1 的定价计算,理论上一天的总收入为 $562,027,成本利润率 545%。」

据了解,「DeepSeek 开源周」 自 2 月 24 日至 2 月 28 日,陆续开源最新技术进展。其中包括,FlashMLA、DeepEP、DeepGEMM 和 3FS 四个开源项目,以及 DualPipe、EPLB 等代码库。

有业内人士认为,「DeepSeek 开源周」 的重要性已经超过了不久前 OpenAI 的发布会。DeepSeek 用 「量大管饱」 的开源有力回击了欧美关于 DeepSeek 故意说低训练成本的说法,并且证明了在训练链路上存在极大的优化空间。

推荐阅读

京东 618 开门红 1 小时:成交额、订单量、下单用户数同比增长均超 200%

admin

蚂蚁集团 WAIC 发布大模型密算平台,助力大模型破解数据供给挑战

admin

《全职高手 3》 动画热播 IP 授权合作超 30 个创新纪录

admin