Deepseekの手頃な価格は神話です。革新的なAIは実際には16億ドルの費用がかかります。

Feb 15,25

Deepseekの驚くほど費用対効果の高いAIモデルは、業界の巨人に挑戦しています。この中国の新興企業は、高級ヘッジファンドの子会社であり、2048 GPUを使用してわずか600万ドルの訓練を受けたと言われています。しかし、この数字は誤解を招くものです。

DeepSeek Test画像:Ensigame.com

Deepseek V3は革新的なテクノロジーを活用しています:マルチトークン予測(MTP)精度と効率を向上させるため。 256のニューラルネットワーク(トークンごとにアクティブ化された8つ)を使用して、専門家(MOE)の混合物(MOE)。および重要な文要素を特定するために、マルチヘッド潜在的注意(MLA)。これらの進歩は、その印象的なパフォーマンスに貢献しています。

DeepSeek V3画像:Ensigame.com

初期の主張に反して、Semianalysisは、Deepseekの実際のインフラストラクチャには約50,000のNvidia Hopper GPUが関与しており、16億ドルの投資と9億4,400万ドルの運用コストを表しています。この大規模なインフラストラクチャは、複数のデータセンターに広がり、AIトレーニング、研究、財務モデリングを促進します。 Deepseekの自己資金とそのデータセンターの所有権は、その敏ility性と迅速な革新に貢献しています。

DeepSeek画像:Ensigame.com

同社はトップの才能を引き付け、一部の研究者は主に中国の大学で年間130万ドル以上を稼いでいます。 DeepSeekの600万ドルのトレーニングコストは、研究、洗練、データ処理、インフラストラクチャを除く総額過小評価ですが、その無駄のない構造により、より大きく、より官僚的な競合他社と比較して効率的なイノベーションが可能になります。 AI開発への総投資は5億ドルを超えています。

DeepSeek画像:Ensigame.com

Deepseekの成功は、資金提供された独立したAI企業の可能性を強調しています。 「革新的な予算」の請求は誇張されていますが、競合他社に対する費用対効果(たとえば、CHATGPT4の1億ドルのトレーニングコストとDeepseekのR1の500万ドル)は依然として注目に値します。最終的に、Deepseekの成果は、実質的な投資、技術的なブレークスルー、高度なスキルのあるチームに由来しています。

トップニュース
もっと
Copyright © 2024 kuko.cc All rights reserved.