A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver

Feb 15,25

O modelo surpreendentemente econômico de Deepseek desafia os gigantes da indústria. Esta startup chinesa, uma subsidiária do High-Flyer Hedge Fund, possui uma IA competitiva, Deepseek V3, supostamente treinada por meros US $ 6 milhões usando 2048 GPUs. No entanto, esse número é enganoso.

DeepSeek Testimagem: ensigame.com

A Deepseek V3 aproveita as tecnologias inovadoras: Previsão com vários toques (MTP) para maior precisão e eficiência; Mistura de especialistas (MOE) , utilizando 256 redes neurais (oito ativadas por token); e atenção latente de várias cabeças (MLA) para identificar os elementos cruciais da frase. Esses avanços contribuem para seu desempenho impressionante.

DeepSeek V3imagem: ensigame.com

Ao contrário das reivindicações iniciais, a semiânica revela a infraestrutura real da Deepseek envolve aproximadamente 50.000 GPUs da NVIDIA Hopper, representando um investimento de ~ US $ 1,6 bilhão e ~ US $ 944 milhões em custos operacionais. Essa infraestrutura maciça, espalhada por vários data centers, alimenta o treinamento, a pesquisa e a modelagem financeira da IA. O autofinanciamento e a propriedade da Deepseek de seus data centers contribuem para sua agilidade e inovação rápida.

DeepSeekimagem: ensigame.com

A empresa atrai os melhores talentos, com alguns pesquisadores ganhando mais de US $ 1,3 milhão anualmente, principalmente das universidades chinesas. Embora o custo de treinamento de US $ 6 milhões da Deepseek seja subestimado bruto, excluindo pesquisas, refinamento, processamento de dados e infraestrutura, sua estrutura magra permite inovação eficiente em comparação com concorrentes maiores e mais burocráticos. O investimento total no desenvolvimento da IA ​​excede US $ 500 milhões.

DeepSeekimagem: ensigame.com

O sucesso da Deepseek destaca o potencial de empresas independentes de IA bem financiadas. Embora a reivindicação do "orçamento revolucionário" seja exagerada, sua relação custo-benefício em relação aos concorrentes (por exemplo, o custo de treinamento de US $ 100 milhões do ChatGPT4 contra o custo de US $ 5 milhões de Deepseek por R1) permanece digno de nota. Por fim, as realizações de Deepseek decorrem de investimentos substanciais, avanços tecnológicos e uma equipe altamente qualificada.

Manchetes
Mais
Copyright © 2024 kuko.cc All rights reserved.