理论成本利润率545%!DeepSeek 知乎发文引业内震动

理论成本利润率545%!DeepSeek 知乎发文引业内震动

孤寂好友 2025-03-01 科技报 36 次浏览 0个评论

3月1日,DeepSeek官方认证账号在知乎发布了《DeepSeek-V3/R1推理系统概览》(下称《概览》)一文,首次公布模型推理系统的核心优化方案,并披露理论成本利润率高达545%,刷新了全球AI大模型领域的盈利高点,引发业内震动。

《概览》显示,DeepSeek-V3/R1推理系统的优化目标是更大的吞吐、更低的延迟

为了实现上述两个目标,DeepSeek使用大规模跨节点专家并行(EP)。首先EP使得批量尺寸大大增加,从而提高图形处理器(GPU)矩阵乘法的效率,提高吞吐。其次 EP 使得专家分散在不同的 GPU上,每个GPU只需要计算很少的专家因此更少的访存需求,从而降低延迟。

EP同时也增加了系统的复杂性。因此,《概览》就如何使用EP增大批量尺寸、如何隐藏传输的耗时、如何进行负载均衡等进行了讲解。

DeepSeek还披露了DeepSeek的理论成本和利润率等关键信息。

文章称,在北京时间2月27日12:00 至2月28日12:00,DeepSeekV3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为8 个H800 GPU)。假定GPU租赁成本为2美元/小时,总成本约为8.71万美元/天。

理论成本利润率545%!DeepSeek 知乎发文引业内震动

如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入大约56.20万美元,成本利润率为545%。

理论成本利润率545%!DeepSeek 知乎发文引业内震动
图片来源:《DeepSeek-V3/R1 推理系统概览》

DeepSeek此次披露的数据,不仅验证了其技术路线的商业可行性,也预示着AI大模型的盈利闭环已从理想照进现实。此前发布的DeepSeek-V3模型训练成本仅557.6万美元,是同类产品的1%-5%。

DeepSeek此次在知乎发布《概览》,引来近600条评论、5000多点赞。有网友称,今日发布的《概览》技术文章是“开源周彩蛋”,直接亮出了底牌。有网友称赞:“太强了,AI算力成为水电的基础是要足够便宜,Deepseek迈出了一大步”。

《概览》发布也标志着全球关注的“DeepSeek开源周”正式收官。“DeepSeek开源周”自2月24日至2月28日,陆续开源最新技术进展。其中,包括FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目,以及DualPipe、EPLB等代码库。

 

 

 

 

 

转载请注明来自个人学习使用0830,本文标题:《理论成本利润率545%!DeepSeek 知乎发文引业内震动》

每一天,每一秒,你所做的决定都会改变你的人生!
Top
网站统计代码