L'abordabilité de Deepseek est un mythe: l'IA révolutionnaire a coûté 1,6 milliard de dollars pour développer

Feb 15,25

Deepseek est étonnamment rentable, le modèle d'IA défie les géants de l'industrie. Cette startup chinoise, une filiale du hedge fund de haut vol, possède une IA compétitive, Deepseek V3, qui aurait été formé pour seulement 6 millions de dollars utilisant 2048 GPU. Cependant, ce chiffre est trompeur.

DeepSeek Test Image: esigame.com

Deepseek V3 exploite les technologies innovantes: Prédiction multi-token (MTP) pour une précision et une efficacité améliorées; Mélange d'experts (MOE) , en utilisant 256 réseaux neuronaux (huit activés par jeton); et Attention latente multi-tête (MLA) pour identifier les éléments de phrase cruciaux. Ces progrès contribuent à sa performance impressionnante.

DeepSeek V3 Image: esigame.com

Contrairement aux réclamations initiales, la semianalyse révèle que l'infrastructure réelle de Deepseek implique environ 50 000 GPU Nvidia Hopper, représentant un investissement de ~ 1,6 milliard de dollars et ~ 944 millions de dollars en coûts opérationnels. Cette infrastructure massive, répartie sur plusieurs centres de données, alimente la formation, la recherche et la modélisation financière de l'IA. L'auto-financement et la propriété de Deepseek de ses centres de données contribuent à son agilité et à son innovation rapide.

DeepSeek Image: esigame.com

La société attire les meilleurs talents, certains chercheurs gagnant plus de 1,3 million de dollars par an, principalement des universités chinoises. Alors que le coût de formation de 6 millions de dollars de Deepseek est une sous-estimation brute, à l'exclusion de la recherche, du raffinement, du traitement des données et des infrastructures, sa structure allégée permet une innovation efficace par rapport aux concurrents plus bureaucratiques plus importants. L'investissement total dans le développement de l'IA dépasse 500 millions de dollars.

DeepSeek Image: esigame.com

Le succès de Deepseek met en évidence le potentiel de sociétés d'IA indépendantes bien financées. Bien que la réclamation du "budget révolutionnaire" soit exagérée, sa rentabilité par rapport aux concurrents (par exemple, le coût de formation de 100 millions de dollars de ChatGPT4 contre les 5 millions de dollars de Deepseek pour R1) reste à noter. En fin de compte, les réalisations de Deepseek découlent d'investissements substantiels, de percées technologiques et d'une équipe hautement qualifiée.

Actualité à la Une
Plus
Copyright © 2024 kuko.cc All rights reserved.