미스트랄 AI, 시장을 뒤흔드는 혁신적인 언어 모델 '라지 2' 공개
프랑스의 AI 기업 미스트랄 AI가 메타의 라마 3와 경쟁하는 효율성이 뛰어난 언어 모델 '라지 2'를 출시했다. 라지 2는 미스트랄 AI 모델의 고급 버전으로, 코드 생성, 수학, 다국어 지원 등 다양한 분야에서 뛰어난 성능을 발휘하며, 80개 이상의 프로그래밍 언어와 다양한 인간 언어를 지원한다. 또한 128,000개의 토큰을 처리할 수 있는 넓은 문맥 창을 갖추고 있어 프랑스어부터 한국어까지 다양한 언어를 지원한다.
벤치마크 측면에서 라지 2는 대규모 다중 작업 언어 이해(MMLU)에서 84.0%의 정확도를 달성하여 오픈 모델 중 성능과 비용의 비율을 새로운 기록을 세웠다. 이는 라마 3의 4050억 개의 파라미터에 비해 仅 四分之一에 불과한 라지 2가 GPT-4o와 클로드 3.5 소네트 등의 모델을 코딩 작업에서 뛰어난 성능을 발휘한 것이다.
미스트랄 AI는 라지 2의 추론 능력을 향상시키고 부정확한 정보 생성 경향을 줄이는 데 주력하여 모델의 신뢰성과 신중한 응답을 높였다. 또한 복잡한 함수 호출을 지원하여 고급 비즈니스 애플리케이션에 적합하다.
라지 2는 이제 Azure AI Studio와 Google Vertex AI를 포함한 다양한 플랫폼을 통해 접근할 수 있다. 모델의 가중치는 연구 라이선스 하에 HuggingFace에서 다운로드할 수 있으며, 상업적 사용을 위해서는 별도의 라이선스가 필요하다.
라지 2의 빠른 출시는 메타의 라마 3에 대응하여 대규모 언어 모델(LLM) 시장의 경쟁이 심화되고 있음을 의미한다. 비용이 감소하고 개발비가 지속적으로 높아지면서 업계는 혁신과 확장에 대한 압력을 받고 있으며, 이는 투자자들의 높은 평가를 정당화하기 위해 필요하다.
주요 요약
- 미스트랄 AI가 메타의 라마 3보다 효율적인 언어 모델 '라지 2'를 출시했다.
- 라지 2는 128,000개의 토큰을 처리할 수 있는 문맥 창을 지원하며 80개 이상의 프로그래밍 언어를 지원한다.
- 라지 2는 더 적은 파라미터로 경쟁사인 GPT-4o와 클로드 3.5 소네트를 능가한다.
- 라지 2는 추론 능력을 향상시키고 응답 중 "환각"을 최소화한다.
- 여러 플랫폼에서 사용할 수 있으며, 상업적 사용을 위해서는 상업 라이선스가 필요하다.
분석
미스트랄 AI의 라지 2 출시는 LLM 시장의 경쟁을 가속화하고 메타와 다른 기술 대기업에 중요한 영향을 미친다. 라지 2의 우수한 효율성과 성능은 특히 코딩 및 다국어 애플리케이션에서 기존 AI 배치를 잠재적으로 파괴할 수 있다. 단기적으로는 혁신 가속화와 시장 분열이 예상되며, 장기적으로는 가장 효율적인 모델만이 살아남을 수 있는 업계 내 통합이 발생할 수 있다. 또한 AI 주식과 관련된 금융 상품은 변동성을 겪을 수 있다. 라지 2의 오픈 소스 가중치는 보다 광범위한 AI 연구 및 개발을 촉진하여 스타트업 및 학술 기관에 잠재적으로 이익이 될 수 있다.
알고 계셨나요?
- 미스트랄 AI의 라지 2:
- 효율성과 성능: 라지 2는 미스트랄 AI가 개발한 언어 모델로 메타의 라마 3와 경쟁한다. 우수한 효율성으로 주목받으며, 80개 이상의 프로그래밍 언어를 처리하고 128,000개의 토큰 문맥 창을 가지고 있으며, 라마 3에 비해 훨씬 적은 파라미터로 이를 달성했다.
- 벤치마크 결과: 라지 2는 MMLU 벤치마크에서 84.0%의 정확도를 달성하여 오픈 모델 중 성능과 비용의 비율을 새로운 기록을 세웠다. 특히 코딩 작업에서 GPT-4o와 클로드 3.5 소네트 등의 모델을 능가했다.
- 향상된 기능: 모델은 추론 능력을 향상시키고, 부정확한 정보 생성을 줄이며, 복잡한 함수 호출을 지원하여 고급 비즈니스 애플리케이션에 적합하다.
- 대규모 다중 작업 언어 이해(MMLU):
- 벤치마크 개요: MMLU는 언어 모델을 광범위한 작업에 걸쳐 평가한다. 이는 모델이 다양한 질문에 정확하게 이해하고 응답할 수 있는 능력을 평가하는 데 사용된다.
- AI 개발의 중요성: MMLU에서 높은 정확도를 달성하는 것은 중요한 이정표로, 모델이 복잡하고 다양한 작업을 효과적으로 처리할 수 있음을 나타낸다.
- 토큰 문맥 창:
- 정의와 중요성: 토큰 문맥 창은 언어 모델이 한 번에 처리할 수 있는 최대 토큰 수를 나타내며, 깊은 이해와 장거리 의존성을 필요로 하는 작업에 중요하다.
- 모델 성능에 미치는 영향: 128,000개의 토큰 문맥 창을 가진 라지 2는 더 광범위한 입력을 처리할 수 있어 코드 생성 및 복잡한 추론과 같은 작업에 필수적이다.