理论成本利润率545%！DeepSeek 知乎发文引业内震动

3月1日，DeepSeek官方认证账号在知乎发布了《DeepSeek-V3/R1推理系统概览》(下称《概览》)一文，首次公布模型推理系统的核心优化方案，并披露理论成本利润率高达545%，刷新了全球AI大模型领域的盈利高点，引发业内震动。

《概览》显示，DeepSeek-V3/R1推理系统的优化目标是更大的吞吐、更低的延迟。

为了实现上述两个目标，DeepSeek使用大规模跨节点专家并行(EP）。首先EP使得批量尺寸大大增加，从而提高图形处理器(GPU)矩阵乘法的效率，提高吞吐。其次 EP 使得专家分散在不同的 GPU上，每个GPU只需要计算很少的专家，因此更少的访存需求，从而降低延迟。

EP同时也增加了系统的复杂性。因此，《概览》就如何使用EP增大批量尺寸、如何隐藏传输的耗时、如何进行负载均衡等进行了讲解。

DeepSeek还披露了DeepSeek的理论成本和利润率等关键信息。

文章称，在北京时间2月27日12:00 至2月28日12:00，DeepSeekV3和R1推理服务占用节点总和，峰值占用为278个节点，平均占用226.75个节点(每个节点为8 个H800 GPU)。假定GPU租赁成本为2美元/小时，总成本约为8.71万美元/天。

如果所有tokens全部按照DeepSeek R1的定价计算，理论上一天的总收入大约56.20万美元，成本利润率为545%。

DeepSeek此次披露的数据，不仅验证了其技术路线的商业可行性，也预示着AI大模型的盈利闭环已从理想照进现实。此前发布的DeepSeek-V3模型训练成本仅557.6万美元，是同类产品的1%-5%。

DeepSeek此次在知乎发布《概览》，引来近600条评论、5000多点赞。有网友称，今日发布的《概览》技术文章是“开源周彩蛋”，直接亮出了底牌。有网友称赞：“太强了，AI算力成为水电的基础是要足够便宜，Deepseek迈出了一大步”。

《概览》发布也标志着全球关注的“DeepSeek开源周”正式收官。“DeepSeek开源周”自2月24日至2月28日，陆续开源最新技术进展。其中，包括FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目，以及DualPipe、EPLB等代码库。

鸟击引起发动机起火，一波音飞机在美国新泽西州起飞后迫降