DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元
Feb 15,25
DeepSeek令人惊讶的具有成本效益的AI模型挑战了行业巨头。这家中国初创公司是高级对冲基金的子公司,拥有竞争性的AI,DeepSeek V3,据称使用2048 GPU接受了600万美元的培训。但是,这个数字具有误导性。
图像:ensigame.com
DeepSeek V3利用创新技术:多token预测(MTP),以提高准确性和效率; 专家(MOE)的混合物,利用256个神经网络(八个激活的令牌); 多头潜在注意力(MLA)指出关键的句子元素。这些进步有助于其令人印象深刻的表现。
图像:ensigame.com
与最初的索赔相反,半分析揭示了DeepSeek的实际基础设施涉及约50,000个NVIDIA HOPPER GPU,约为16亿美元的投资,运营成本约为9.44亿美元。这种大规模的基础设施分布在多个数据中心,燃料AI培训,研究和财务建模。 DeepSeek的自筹资金和对数据中心的所有权有助于其敏捷性和快速创新。
图像:ensigame.com
该公司吸引了顶尖人才,一些研究人员每年收入超过130万美元,主要来自中国大学。虽然DeepSeek的600万美元培训成本是严重低估的,不包括研究,改进,数据处理和基础设施,但与更大,更官僚的竞争者相比,其精益结构可以有效地创新。 AI开发的总投资超过5亿美元。
图像:ensigame.com
DeepSeek的成功凸显了资金充足的独立AI公司的潜力。尽管“革命性预算”索赔被夸大了,但其成本效益相对于竞争对手(例如,Chatgpt4的1亿美元培训成本与DeepSeek的R1相比)仍然值得注意。最终,DeepSeek的成就源于大量投资,技术突破和高技能的团队。
热门新闻
更多