DeepSeek的负担能力是一个神话：革命性的AI实际上花费了16亿美元

首页 > 新闻 > DeepSeek的负担能力是一个神话：革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话：革命性的AI实际上花费了16亿美元

Feb 15,25

DeepSeek令人惊讶的具有成本效益的AI模型挑战了行业巨头。这家中国初创公司是高级对冲基金的子公司，拥有竞争性的AI，DeepSeek V3，据称使用2048 GPU接受了600万美元的培训。但是，这个数字具有误导性。

DeepSeek Test 图像：ensigame.com

DeepSeek V3利用创新技术：多token预测（MTP)，以提高准确性和效率； 专家（MOE)的混合物，利用256个神经网络（八个激活的令牌)； 多头潜在注意力（MLA)指出关键的句子元素。这些进步有助于其令人印象深刻的表现。

DeepSeek V3 图像：ensigame.com

与最初的索赔相反，半分析揭示了DeepSeek的实际基础设施涉及约50,000个NVIDIA HOPPER GPU，约为16亿美元的投资，运营成本约为9.44亿美元。这种大规模的基础设施分布在多个数据中心，燃料AI培训，研究和财务建模。 DeepSeek的自筹资金和对数据中心的所有权有助于其敏捷性和快速创新。

DeepSeek 图像：ensigame.com

该公司吸引了顶尖人才，一些研究人员每年收入超过130万美元，主要来自中国大学。虽然DeepSeek的600万美元培训成本是严重低估的，不包括研究，改进，数据处理和基础设施，但与更大，更官僚的竞争者相比，其精益结构可以有效地创新。 AI开发的总投资超过5亿美元。

DeepSeek 图像：ensigame.com

DeepSeek的成功凸显了资金充足的独立AI公司的潜力。尽管“革命性预算”索赔被夸大了，但其成本效益相对于竞争对手（例如，Chatgpt4的1亿美元培训成本与DeepSeek的R1相比)仍然值得注意。最终，DeepSeek的成就源于大量投资，技术突破和高技能的团队。

无限尼基：在哪里可以找到特定的底部

热门新闻