商业动态

DeepSeek 周末大事不断,首次披露理论利润率

3 月 1 日,DeepSeek 接连传出两则重磅消息:

1、DeepSeek 首次披露:其 V3/R1 推理系统的理论成本利润率高达 545%,展现出显著的技术与成本优势。

2、潞晨科技宣布暂停 DeepSeek API 服务:用户需尽快使用账户余额,未使用部分将全额退款。

消息揭示了 DeepSeek 在技术创新与商业模式之间的双重挑战。

// DeepSeek 首次披露理论利润率 //

3 月 1 日,DeepSeek 在知乎平台开设了官方账号,并发布一篇技术文章——《DeepSeek-V3/R1 推理系统概览》。文章显示,DeepSeek-V3/R1 推理系统的优化目标是实现更大的吞吐量和更低的延迟。为了达成这两个目标,DeepSeek 采用了大规模跨节点专家并行 (EP) 方案。这种方案虽然增加了系统的复杂性,但能有效提升性能。

DeepSeek 在文章中详细介绍了如何通过 EP 技术增长批量大小、隐藏传输耗时以及进行负载均衡,从而优化整个推理系统的性能。通过这些技术手段,DeepSeek 能够处理更大规模的数据,同时保持或提高响应速度。以下是预填充阶段的计算-通信重叠示意图:

解码阶段也采用了类似的策略,但更加精细,将 Attention 层进一步细分为两步,使用了五阶段流水线 (5-stage pipeline),实现更流畅的通信-计算重叠。

在成本控制方面,DeepSeek 的表现尤为突出。根据官方披露的数据,V3/R1 的训练成本仅为 557.6 万美元,不到 OpenAI GPT-4o 模型的 1/20。其推理成本也极具竞争力,每百万 token 的定价仅为 16 元,相比 OpenAI 低了近 70%。基于这些优化,DeepSeek 的理论利润率高达 545%,显示出其在成本控制和效率提升方面的巨大潜力

// 潞晨科技暂停 DeepSeek API 服务 //

尽管 DeepSeek 在技术上取得了显著突破,但其基于 MaaS 的商业模式却面临严峻挑战。3 月 1 日,潞晨科技官微宣布:「尊敬的用户,潞晨云将在一周后停止提供 DeepSeek API 服务,请尽快用完您的余额。如果没用完,我们全额退款。」

当天下午,潞晨科技 CEO 尤洋发文回应 DeepSeek 公布的理论成本利润率。争议焦点主要集中在以下几点:

数据参考性问题:尤洋认为文章中合并计算了 DeepSeek 网页、APP 和 MaaS API 的 token 数,无法准确反映 MaaS 的真实成本和使用情况。MaaS 是 ToB 工具,与 ToC 的网页和 APP 在性能要求和成本结构上存在显著差异。

MaaS 性能与稳定性:春节期间 DeepSeek APP 和网页频繁掉线,延迟高达 15 分钟以上,无法满足 ToB 客户对低延迟和高稳定性的要求。MaaS 作为 ToB 服务,需保证首字响应≤2 秒、单 token 处理≤100ms,现有技术难以达标。

商业模式可持续性:MaaS 需时刻保持超负荷运转,且需准备 5 倍于实际需求的机器资源以应对突发流量,导致成本高企。高投入与低毛利的矛盾使得 MaaS 模式难以盈利。

技术创新的实际贡献:DeepSeek 在 AI 基础设施上依赖英伟达 GPU 和已有技术 (如 MOE 架构、PD 分离),并未提出颠覆性算法。中小云厂商吹嘘推理速度提升 10 倍,但缺乏实际盈利案例,技术优势未能转化为商业成功。

推荐阅读

港股十月首日开盘!浙江 「创二代」 夫妻携卡罗特登陆港交所主板

admin

又一上市公司实控人被留置并立案,此前已被罚 1050 万元

admin

窒息事故!3 名研究人员死亡,现代汽车企紧急回应

admin