美股開市前:美股指期貨全線反彈!黃金升破4800美元,原油重挫1.5%,比特幣跌穿8.8萬美元
週末,DeepSeek又放大招,首次披露大模型的盈利情況,引爆投資圈。
理論獲利率達545%
3月1日,DeepSeek發文披露了大規模V3、R1部署的成本和收益,成為了第一個詳細披露了自己成本結構的大模型公司。
據DeepSeek計算,運營一天V3和R1的算力成本為87072美元,而以R1定價來看,收入理論上為562027美元,獲利率為545%。
據介紹,DeepSeek V3和R1的所有服務均使用H800 GPU,使用和訓練一致的精度。
由於白天的服務負荷高,晚上的服務負荷低,因此DeepSeek實現了一套機制。 在白天負荷高的時候,用所有節點部署推理服務。 晚上負荷低的時候,減少推理節點,以用來做研究和訓練。
在2025年02月27日12:00至2025年02月28日12:00,DeepSeek V3和R1推理服務佔用節點總和,峰值佔用為278個節點,平均佔用226.75個節點(每個節點為8個H800 GPU)。 假定 GPU 租賃成本為2美金/小時,總成本為87,072美元/天。

在24小時統計時段內,DeepSeek V3和 R1的網頁、APP和API的所有負載如下:
輸入token總數為608B,其中 342B tokens(56.3%)命中KVCache硬碟緩存。
輸出 token總數為168B。 平均輸出速率為20~22tps,平均每輸出一個token的KVCache長度是4989。
平均每台H800的輸送量為:對於prefill任務,輸入輸送約73.7k tokens/s(含緩存命中); 對於decode任務,輸出吞吐約14.8k tokens/s。
如果所有tokens全部按照DeepSeek R1的定價計算,理論上一天的總收入為562,027美元(摺合人民幣409.36萬元),成本獲利率545%。

以此計算,DeepSeek理論上最高每天可盈利47. 5萬美元(摺合人民幣約346萬元)。
不過,DeepSeek也表示,實際上沒有這麼多收入,因為V3的定價更低,同時收費服務只佔了一部分,另外夜間還會有折扣。
巨大的盈利下,有投資人開始按計算機,稱其在美國應該是一家估值超百億美元的公司。
MenloVentures投資人Deedy表示:「理論ARR(年收入)2億美元、獲利率超過500%,這樣的商業效率理應是一家值100億美元的公司。 ”

還有網友評論,DeepSeek掀起了行業新一輪卷Infra熱潮。
DeepSeek官方直接披露內部的成本利潤細節,這下所有做Infra的兄弟都要被老闆上壓力了——如果獲利率達不到DeepSeek的水準,就說明自家的Infra團隊菜。
開源周收官
本周,DeepSeek進行了開源周,連續放了5天Infra相關的庫。
第一天,開源專案 FlashMLA 正式發佈,專為Hopper GPU優化的高效MLA解碼內核,支援變長序列處理。

第二天,DeepEP發佈,DeepEP是一個專為混合專家系統(MoE)和專家並行(EP)設計的通信庫。

第三天,DeepGEMM發佈,DeepGEMM 是一個專為簡潔高效的FP8通用矩陣乘法(GEMM)設計的庫,具有細粒度縮放功能。

第四天,DualPipe與EPLB發佈,DualPipe是一種創新的雙向管道並行演算法。 EPLB即專家並行負載均衡器,自動平衡GPU負載,避免部分顯卡過載或閑置。

最後一天,3FS檔系統發佈,並行文件系統Fire-Flyer File System,利用SSD和RDMA網路技術,顯著加速數據處理。

週六,DeepSeek又披露了盈利情況,算是為開源周做了一個很好的收尾。
想搵到被市場忽略嘅好股?InvestingPro公允價值工具幫到你。多角度分析,由現金流、收入、淨利等數據全面評估股票價值。
訂閱InvestingPro,仲有更多超值功能:
- AI ProPicks:AI精選股票,業績斐然。
- 股票篩選器:100+篩選條件,輕鬆搵好股。
- 沃倫·巴菲特、大空頭、索羅斯投資組合:一鍵睇見頂尖投資者動向。
