La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

Feb 15,25

El modelo de IA sorprendentemente rentable de Deepseek desafía a los gigantes de la industria. Esta startup china, una subsidiaria de High-Flyer Hedge Fund, cuenta con una IA competitiva, Deepseek V3, supuestamente entrenada por solo $ 6 millones utilizando 2048 GPU. Sin embargo, esta figura es engañosa.

DeepSeek TestImagen: Ensigame.com

Deepseek V3 aprovecha tecnologías innovadoras: Predicción de token múltiple (MTP) para una mayor precisión y eficiencia; Mezcla de expertos (MOE) , utilizando 256 redes neuronales (ocho activadas por token); y Atención latente de múltiples cabezas (MLA) para identificar elementos de oración cruciales. Estos avances contribuyen a su impresionante rendimiento.

DeepSeek V3Imagen: Ensigame.com

Al contrario de las afirmaciones iniciales, el semianálisis revela que la infraestructura real de Deepseek implica aproximadamente 50,000 GPU Nvidia Hopper, que representa una inversión de ~ $ 1.6 mil millones y ~ $ 944 millones en costos operativos. Esta infraestructura masiva, extendida a través de múltiples centros de datos, alimenta la capacitación de IA, la investigación y el modelado financiero. La autofinización y la propiedad de Deepseek de sus centros de datos contribuyen a su agilidad e innovación rápida.

DeepSeekImagen: Ensigame.com

La compañía atrae a los mejores talentos, con algunos investigadores ganando más de $ 1.3 millones anuales, principalmente de universidades chinas. Si bien el costo de capacitación de $ 6 millones de Deepseek es una subestimación bruta, excluyendo la investigación, el refinamiento, el procesamiento de datos e infraestructura, su estructura magra permite una innovación eficiente en comparación con competidores más grandes y burocráticos. La inversión total en el desarrollo de IA supera los $ 500 millones.

DeepSeekImagen: Ensigame.com

El éxito de Deepseek destaca el potencial de las compañías de IA independientes bien financiadas. Si bien el reclamo de "presupuesto revolucionario" es exagerado, su costo-efectividad en relación con los competidores (por ejemplo, el costo de capacitación de $ 100 millones de ChatPPT4 versus los $ 5 millones de Deepseek para R1) sigue siendo notable. En última instancia, los logros de Deepseek provienen de una inversión sustancial, avances tecnológicos y un equipo altamente calificado.

Las noticias más importantes
Más
Copyright © 2024 kuko.cc All rights reserved.