DeepSeek的負擔能力是一個神話：革命性的AI實際上花費了16億美元

首頁 > 新聞 > DeepSeek的負擔能力是一個神話：革命性的AI實際上花費了16億美元

DeepSeek的負擔能力是一個神話：革命性的AI實際上花費了16億美元

Feb 15,25

DeepSeek令人驚訝的具有成本效益的AI模型挑戰了行業巨頭。這家中國初創公司是高級對衝基金的子公司，擁有競爭性的AI，DeepSeek V3，據稱使用2048 GPU接受了600萬美元的培訓。但是，這個數字具有誤導性。

DeepSeek Test 圖像：ensigame.com

DeepSeek V3利用創新技術：多token預測（MTP)，以提高準確性和效率； 專家（MOE)的混合物，利用256個神經網絡（八個激活的令牌)； 多頭潛在注意力（MLA)指出關鍵的句子元素。這些進步有助於其令人印象深刻的表現。

DeepSeek V3 圖像：ensigame.com

與最初的索賠相反，半分析揭示了DeepSeek的實際基礎設施涉及約50,000個NVIDIA HOPPER GPU，約為16億美元的投資，運營成本約為9.44億美元。這種大規模的基礎設施分布在多個數據中心，燃料AI培訓，研究和財務建模。 DeepSeek的自籌資金和對數據中心的所有權有助於其敏捷性和快速創新。

DeepSeek 圖像：ensigame.com

該公司吸引了頂尖人才，一些研究人員每年收入超過130萬美元，主要來自中國大學。雖然DeepSeek的600萬美元培訓成本是嚴重低估的，不包括研究，改進，數據處理和基礎設施，但與更大，更官僚的競爭者相比，其精益結構可以有效地創新。 AI開發的總投資超過5億美元。

DeepSeek 圖像：ensigame.com

DeepSeek的成功凸顯了資金充足的獨立AI公司的潛力。盡管“革命性預算”索賠被誇大了，但其成本效益相對於競爭對手（例如，Chatgpt4的1億美元培訓成本與DeepSeek的R1相比)仍然值得注意。最終，DeepSeek的成就源於大量投資，技術突破和高技能的團隊。

無限尼基：在哪裏可以找到特定的底部

熱門新聞