DeepSeek-V2, AI 산업을 뒤흔들다: 놀라운 성능과 믿을 수 없을 정도의 저렴한 가격
항저우에 기반을 둔 DeepSeek AI Tech의 2세대 Mixture of Experts (MoE) 대규모 모델인 DeepSeek-V2가 저렴한 가격과 경쟁력 있는 성능으로 주목을 받고 있습니다. 퀀트 헤지펀드 Huanfang의 자회사에서 개발된 DeepSeek-V2는 OpenAI의 GPT-4와 성능은 맞추면서도 가격은 거의 1/100 수준이어서 '가격 도살자'라는 별명을 얻었습니다. 2360억 개의 매개변수와 매우 효율적인 학습 능력을 가진 DeepSeek-V2는 전 세계적으로 선도적인 AI 모델에 큰 도전이 되고 있습니다.
핵심 사항
- 성능과 비용: DeepSeek-V2는 중국어와 영어 벤치마크에서 우수한 성능을 보여, GPT-4와 LLaMA3-70B와 같은 최고 모델들을 능가합니다. 특히 비용 효율성이 두드러지는데, 입력 시 100만 토큰당 1 RMB, 출력 시 2 RMB로 책정되어 GPT4 대비 1%에 불과합니다.
- 기관 지원: DeepSeek는 Huanfang Quantitative의 전략적 지원을 받고 있으며, 이 회사는 AI 기술에 깊이 관여하며 수천 대의 Nvidia A100 GPU를 포함한 막대한 투자와 인프라를 활용하고 있습니다.
- 시장 영향: DeepSeek-V2의 출시는 고성능 AI 기능을 대폭 저렴한 가격에 제공함으로써 시장 역학을 재정의할 것으로 보이며, 대형 기술 기업의 주도권을 위협하고 AI 기술 경쟁 구도를 변화시킬 수 있습니다.
- 수익성 및 확장성: 저렴한 가격에도 불구하고 DeepSeek는 훌륭한 학습 효율성과 서버 활용도 덕분에 70% 이상의 견고한 이윤율을 유지하고 있습니다.
- CTOL-Human-F1 테스트: 공식 API를 사용하여 자체 개발한 CTOL-Human-F1 테스트 셋으로 DeepSeek V2를 시험한 결과, Llama 3 70B를 이기지 못했지만 격차가 크지 않았습니다. 이는 시험이 영어로 진행된 반면 DeepSeek2가 중국어 과제에서 다른 모델을 능가하기 때문인 것으로 보입니다. 하지만 향후 DeepSeek가 Llama 3 70B를 능가할 것으로 기대됩니다.
분석
DeepSeek-V2의 시장 진출은 단순한 기술 진보를 넘어서 AI 산업의 경제 모델 자체를 뒤흔드는 전략적 움직임입니다. Huanfang의 기존 인프라와 연구 능력을 활용하여 DeepSeek는 성능이 뛰어날 뿐만 아니라 비용도 획기적으로 낮출 수 있었습니다. 80.1조 개의 토큰으로 학습하고도 뛰어난 처리 속도를 달성한 이 모델은 보다 경제적으로 지속 가능한 AI 실행 방식으로의 중요한 전환을 보여줍니다. 특히 비용이 걸림돌이었던 기업의 AI 활용에 엄청난 영향을 미칠 것입니다.
더욱이 대규모 언어 모델(LLM) 산업은 중대한 혼란에 직면할 수 있습니다. OpenAI는 모델 추론의 효율성을 높이지 않으면 선두 자리를 잃을 위험이 있습니다. 이 치열한 경쟁 부문에서 혁신 속도 둔화와 소비자 지향 제품 개발 역량 부족은 OpenAI의 주도권에 추가적인 위협이 됩니다. OpenAI의 주요 클라우드 협력사인 Microsoft와 다른 경쟁업체(Amazon, Google)도 일반 AI 부문에 막대한 투자를 했음에도 불구하고 기대에 못 미치는 성과를 보였기 때문에 상당한 재무적 타격을 받을 수 있습니다.
알아두면 좋은 사실
- 주식 시장을 위한 AI? Huanfang 경영진은 DeepSeek 등의 AI 발전이 주식 시장 조작을 위한 것이 아니라 더 큰 의의를 갖는다고 단언합니다.
- AI에 대한 대규모 투자: Huanfang은 2019년 이래 AI 학습 플랫폼에 막대한 투자를 해왔으며, 최근 1만 대의 Nvidia A100 GPU를 갖춘 Yinghuo-2를 지원하며 AI 개발을 선도하겠다는 의지를 보였습니다.
- 전략적 입지: DeepSeek는 베이징 海淀区에 테니스 코트 20개 크기의 대규모 사무실을 구축하는 등 AI 혁신을 추진하기 위한 규모의 확장을 진행하고 있습니다.