L'accessibilità economica di DeepSeek è un mito: l'intelligenza artificiale rivoluzionaria in realtà costa $ 1,6 miliardi per lo sviluppo

Feb 15,25

Il modello di intelligenza artificiale sorprendentemente conveniente di Deepseek sfida i giganti del settore. Questa startup cinese, una consociata di hedge fund ad alto frigo, vanta un'intelligenza artificiale competitiva, Deepseek V3, presumibilmente addestrata per soli $ 6 milioni utilizzando 2048 GPU. Tuttavia, questa cifra è fuorviante.

DeepSeek TestImmagine: Ensigame.com

DeepSeek V3 sfrutta le tecnologie innovative: Previsione multi-token (MTP) per una maggiore precisione ed efficienza; Mixture di esperti (MOE) , utilizzando 256 reti neurali (otto attivate per token); e Attenzione latente multi-testa (MLA) per individuare elementi di frase cruciali. Questi progressi contribuiscono alla sua straordinaria prestazione.

DeepSeek V3Immagine: Ensigame.com

Contrariamente alle affermazioni iniziali, la semianalisi rivela l'infrastruttura effettiva di DeepSeek coinvolge circa 50.000 GPU di Nvidia Hopper, che rappresentano un investimento di ~ $ 1,6 miliardi e ~ $ 944 milioni di costi operativi. Questa massiccia infrastruttura, si è diffusa su più data center, formazione ai carburanti, ricerca e modellazione finanziaria. L'autofinanziamento e la proprietà di Deepseek dei suoi data center contribuiscono alla sua agilità e rapida innovazione.

DeepSeekImmagine: Ensigame.com

La società attira i migliori talenti, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno, principalmente dalle università cinesi. Mentre il costo di formazione da 6 milioni di dollari di Deepseek è un lordo sottovalutato, escluso la ricerca, la raffinatezza, l'elaborazione dei dati e le infrastrutture, la sua struttura snella consente un'innovazione efficiente rispetto a concorrenti più grandi e burocratici. L'investimento totale nello sviluppo dell'IA supera $ 500 milioni.

DeepSeekImmagine: Ensigame.com

Il successo di Deepseek evidenzia il potenziale di società di intelligenza artificiale indipendenti ben finanziate. Mentre l'affermazione del "budget rivoluzionario" è esagerata, il suo rapporto costo-efficacia rispetto ai concorrenti (ad esempio, il costo di allenamento di $ 100 milioni di CHATGPT4 rispetto a $ 5 milioni di Deepseek per R1) rimane degno di nota. Alla fine, i risultati di Deepseek derivano da investimenti sostanziali, scoperte tecnologiche e una squadra altamente qualificata.

Notizie principali
Di più
Copyright © 2024 kuko.cc All rights reserved.