DeepSeek의 경제성은 신화입니다. 혁명 AI는 실제로 개발하는 데 16 억 달러가 들었습니다.
DeepSeek의 놀랍도록 비용 효율적인 AI 모델은 업계 거인에게 도전합니다. High-Flyer 헤지 펀드의 자회사 인이 중국 스타트 업은 경쟁력있는 AI 인 Deepseek V3을 자랑하며 2048 GPU를 사용하여 6 백만 달러에 불과한 것으로 추정됩니다. 그러나이 수치는 오해의 소지가 있습니다.
이미지 : ensigame.com
DeepSeek V3는 혁신적인 기술을 활용합니다. 정확도와 효율성을 높이기 위해 MTP (Multi-Token Prediction) ; 전문가 혼합 (MOE) , 256 개의 신경망을 활용 (토큰 당 8 개의 활성화); 그리고 MLA (Multi-Head Sentent Attention) 중요한 문장 요소를 정확히 찾아냅니다. 이러한 발전은 인상적인 성능에 기여합니다.
이미지 : ensigame.com
초기 청구와는 달리 Semianalysis는 DeepSeek의 실제 인프라에 약 50,000 NVIDIA HOPPER GPU가 포함되어 있으며, 이는 ~ 16 억 달러의 투자와 ~ 944 백만 달러의 운영 비용을 나타냅니다. 이 대규모 인프라는 여러 데이터 센터에 퍼져 AI 교육, 연구 및 재무 모델링에 연료를 공급합니다. Deepseek의 자체 펀딩과 데이터 센터의 소유권은 민첩성과 빠른 혁신에 기여합니다.
이미지 : ensigame.com
이 회사는 최고의 인재를 유치하며 일부 연구자들은 주로 중국 대학에서 매년 130 만 달러 이상을 벌고 있습니다. DeepSeek의 6 백만 달러 규모의 교육 비용은 연구, 정제, 데이터 처리 및 인프라를 제외하고는 심한 과소 평가이지만, 린 구조는 더 큰 관료적 경쟁자에 비해 효율적인 혁신을 허용합니다. AI 개발에 대한 총 투자는 5 억 달러를 초과합니다.
이미지 : ensigame.com
Deepseek의 성공은 잘 자금을 지원하는 독립 AI 회사의 잠재력을 강조합니다. "혁명 예산"주장은 과장되지만, 경쟁 업체 (예 : ChatGPT4의 1 억 달러 규모의 교육 비용과 DeepSeek의 R1에 대한 비용 효율성은 주목할만한 비용으로 남아 있습니다. 궁극적으로 DeepSeek의 업적은 상당한 투자, 기술 혁신 및 고도로 숙련 된 팀에서 비롯됩니다.