DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元
Feb 15,25
DeepSeek令人驚訝的具有成本效益的AI模型挑戰了行業巨頭。這家中國初創公司是高級對衝基金的子公司,擁有競爭性的AI,DeepSeek V3,據稱使用2048 GPU接受了600萬美元的培訓。但是,這個數字具有誤導性。
圖像:ensigame.com
DeepSeek V3利用創新技術:多token預測(MTP),以提高準確性和效率; 專家(MOE)的混合物,利用256個神經網絡(八個激活的令牌); 多頭潛在注意力(MLA)指出關鍵的句子元素。這些進步有助於其令人印象深刻的表現。
圖像:ensigame.com
與最初的索賠相反,半分析揭示了DeepSeek的實際基礎設施涉及約50,000個NVIDIA HOPPER GPU,約為16億美元的投資,運營成本約為9.44億美元。這種大規模的基礎設施分布在多個數據中心,燃料AI培訓,研究和財務建模。 DeepSeek的自籌資金和對數據中心的所有權有助於其敏捷性和快速創新。
圖像:ensigame.com
該公司吸引了頂尖人才,一些研究人員每年收入超過130萬美元,主要來自中國大學。雖然DeepSeek的600萬美元培訓成本是嚴重低估的,不包括研究,改進,數據處理和基礎設施,但與更大,更官僚的競爭者相比,其精益結構可以有效地創新。 AI開發的總投資超過5億美元。
圖像:ensigame.com
DeepSeek的成功凸顯了資金充足的獨立AI公司的潛力。盡管“革命性預算”索賠被誇大了,但其成本效益相對於競爭對手(例如,Chatgpt4的1億美元培訓成本與DeepSeek的R1相比)仍然值得注意。最終,DeepSeek的成就源於大量投資,技術突破和高技能的團隊。
熱門新聞
更多