3月1日,DeepSeek在开源周最后一天发布的数据引发了广泛关注。数据显示,V3/R1推理系统理论日利润高达346万元人民币(47.5万美元)。这一数字背后反映了AI模型服务商业化的问题。尽管有人认为即便按照更严格的计算标准,DeepSeek仍然能够盈利,但关于API销售商能否赚钱,业内存在争议。
DeepSeek统计了2月27日至2月28日的24小时内,V3和R1推理服务占用节点总数,峰值为278个节点,平均值为226.75个节点(每个节点包含8个H800 GPU)。假设GPU租赁成本为每小时2美元,每日总成本约为8.7万美元(折合人民币约63万元)。
如果所有token都以DeepSeek-R1的价格计费,每日总收入将达到56.2万美元(折合人民币约409万元),成本利润率可达545%。然而,实际收入远低于这一理论数值,因为V3定价较低且收费服务仅占一部分,网页端和应用程序免费,并且夜间还有折扣。
根据官方公布的理论数据,每日收入56.2万美元减去GPU成本8.7万美元,理论上最高每天可盈利47.5万美元(折合人民币约346万元)。DeepSeek创始人梁文锋曾表示,公司的原则是不亏本也不追求暴利,价格设定在成本之上略有利润。当时,DeepSeek降低API价格引发了行业内的价格战。
DeepSeek能够实现高利润率,部分原因在于团队将优化做到了极致,实现了对GPU的最大限度利用。为了达到更大吞吐量和更低延迟的目标,DeepSeek采用了大规模跨节点专家并行技术,每个GPU只需计算少量专家,从而减少延迟需求。
最近一周,DeepSeek不仅在国外平台发布了相关信息,还在国内知乎平台上发布了推理系统的详细概览。硅基流动创始人袁进辉评论称,DeepSeek披露的成本和收益再次颠覆了许多人的认知。他指出,许多供应商无法达到这一水平,主要是由于V3/R1架构与其他主流模型差异较大,导致现有系统不再有效,必须按DeepSeek的方法才能达到最佳效率。DeepSeek已将主要模块开源,降低了社区复现难度。