A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver
O modelo surpreendentemente econômico de Deepseek desafia os gigantes da indústria. Esta startup chinesa, uma subsidiária do High-Flyer Hedge Fund, possui uma IA competitiva, Deepseek V3, supostamente treinada por meros US $ 6 milhões usando 2048 GPUs. No entanto, esse número é enganoso.
imagem: ensigame.com
A Deepseek V3 aproveita as tecnologias inovadoras: Previsão com vários toques (MTP) para maior precisão e eficiência; Mistura de especialistas (MOE) , utilizando 256 redes neurais (oito ativadas por token); e atenção latente de várias cabeças (MLA) para identificar os elementos cruciais da frase. Esses avanços contribuem para seu desempenho impressionante.
imagem: ensigame.com
Ao contrário das reivindicações iniciais, a semiânica revela a infraestrutura real da Deepseek envolve aproximadamente 50.000 GPUs da NVIDIA Hopper, representando um investimento de ~ US $ 1,6 bilhão e ~ US $ 944 milhões em custos operacionais. Essa infraestrutura maciça, espalhada por vários data centers, alimenta o treinamento, a pesquisa e a modelagem financeira da IA. O autofinanciamento e a propriedade da Deepseek de seus data centers contribuem para sua agilidade e inovação rápida.
imagem: ensigame.com
A empresa atrai os melhores talentos, com alguns pesquisadores ganhando mais de US $ 1,3 milhão anualmente, principalmente das universidades chinesas. Embora o custo de treinamento de US $ 6 milhões da Deepseek seja subestimado bruto, excluindo pesquisas, refinamento, processamento de dados e infraestrutura, sua estrutura magra permite inovação eficiente em comparação com concorrentes maiores e mais burocráticos. O investimento total no desenvolvimento da IA excede US $ 500 milhões.
imagem: ensigame.com
O sucesso da Deepseek destaca o potencial de empresas independentes de IA bem financiadas. Embora a reivindicação do "orçamento revolucionário" seja exagerada, sua relação custo-benefício em relação aos concorrentes (por exemplo, o custo de treinamento de US $ 100 milhões do ChatGPT4 contra o custo de US $ 5 milhões de Deepseek por R1) permanece digno de nota. Por fim, as realizações de Deepseek decorrem de investimentos substanciais, avanços tecnológicos e uma equipe altamente qualificada.
-
Jan 18,25Roblox Grace: todos os comandos e como usá-los Links rápidosTodos os comandos GraceComo usar os comandos GraceGrace é uma experiência Roblox onde você terá que navegar por vários níveis com entidades assustadoras esperando por você. Este jogo é bastante desafiador, pois você precisará ser rápido e reagir rapidamente, além de procurar maneiras de neutralizar a entidade.
-
Dec 25,24Pré-visualização da atualização do Zenless Zone Zero 1.5 Atualização do Zenless Zone Zero versão 1.5: caracteres de banner vazados revelados Novos vazamentos para Zenless Zone Zero revelam a programação de personagens para a próxima atualização da versão 1.5, incluindo reprises de personagens altamente antecipadas. Este RPG de ação HoYoverse continua a expandir sua lista de personagens poderosos, de
-
Apr 11,25"Lista de camadas dos principais heróis para quebra -cabeças e sobrevivência em 2025" Uma lista de camadas para quebra -cabeças e sobrevivência é uma ferramenta essencial para jogadores que desejam otimizar sua jogabilidade. Ajuda a identificar os heróis mais eficazes para vários modos de jogo, como batalhas Match-3, defesa básica e combate de PVP. Dada a ampla variedade de heróis do jogo, classificando -os de acordo com
-
Feb 02,25Heroes Awakening: Guia da lista de camadas da saga isekai Isekai Saga: Awaken: Uma lista abrangente de níveis dos heróis mais fortes Isekai Saga: Awaken, um novo RPG cativante ocioso, apresenta um vasto sistema de gacha, permitindo que os jogadores coletem Chibi Waifus adorável. Esta lista de níveis destaca os heróis mais poderosos para acelerar seus Progress. Heróis são categori