스탠포드 AI 팀이 표절 스캔들에 휩싸였습니다: Llama 3-V가 청화대학의 모델을 복사했다는 혐의

스탠퍼드 AI 팀이 표절 스캔들에 휩싸여: Llama 3-V가 청화대의 모델을 복사했다고 혐의

5월 29일, 스탠퍼드 대학 팀이 Llama 3-V라는 혁신적인 AI 모델을 개발했다고 발표했습니다. 이 모델은 GPT-4V, Gemini Ultra, Claude Opus 등 선두 모델들을 능가한다고 주장했지만, 크기와 학습 비용도 크게 줄였다고 합니다. 그러나 이 기쁨도 잠시, 표절 혐의가 제기되면서 파문이 일었습니다. Llama 3-V가 청화대의 AI 기업 Mianbi Intelligence가 개발한 MiniCPM-Llama3-V 2.5 모델에서 많은 부분을 차용했다는 것입니다. 이 논란은 점점 증폭되어, Llama 3-V가 MiniCPM 모델을 상당 부분 복사했다는 증거가 나오면서 AI 커뮤니티에서 뜨거운 debate가 벌어지고 있습니다.

주요 내용

모델 발표: 스탠퍼드 팀은 Llama 3-V가 다른 선두 AI 모델들을 능가하는 비용 효율적인 모델이라고 주장했습니다.
표절 혐의: Llama 3-V가 청화대의 MiniCPM-Llama3-V 2.5를 복사했다는 혐의가 제기되었습니다.
표절 증거: 두 모델의 구조와 코드가 매우 유사하다는 점이 드러났습니다.
스탠퍼드의 변론: 스탠퍼드 팀은 MiniCPM의 토크나이저만 사용했다고 반박했습니다.
증거 삭제: 논란 이후 스탠퍼드 팀이 관련 게시물과 저장소를 삭제해 의혹을 더 불러일으켰습니다.

분석

이 스캔들은 스탠퍼드 팀이 Llama 3-V의 역량을 자랑하는 기사를 Medium에 게시하면서 시작되었습니다. 이 모델은 경량화되고 비용 효율적이라고 홍보되었지만, 곧 Llama 3-V가 청화대의 MiniCPM-Llama3-V 2.5와 놀라울 정도로 유사하다는 지적이 나왔습니다.

다음과 같은 증거들이 제시되었습니다:

모델 구조와 코드: 두 모델의 구조와 구성이 거의 동일하며, 변수명만 다를 뿐이었습니다.
토크나이제이션 프로세스: 스탠퍼드 팀은 MiniCPM의 토크나이저만 사용했다고 주장했지만, 이 토크나이저가 Llama 3-V 개발 전에는 공개되지 않았다는 점이 지적되었습니다.
행동 유사성: 두 모델의 성능과 오류가 매우 흡사하다는 것이 밝혀졌습니다.
삭제된 저장소: 스탠퍼드 팀이 GitHub와 HuggingFace 저장소를 갑자기 삭제한 것도 의혹을 부추겼습니다.

이에 대해 스탠퍼드 팀은 MiniCPM-Llama3-V 2.5 공개 전에 자신들의 작업이 이뤄졌다고 주장했지만, 이해하기 어려운 설명이었고 두 모델의 유사성이 너무 컸기 때문에 신뢰받지 못했습니다.

결국 Mianbi Intelligence 팀이 고대 중국어 문자(청화 죽간) 인식 등 MiniCPM-Llama3-V 2.5의 고유 기능을 Llama 3-V도 구현하고 있다는 증거를 제시하면서, 이 수준의 세부사항은 자사 데이터에 접근하지 않고는 구현할 수 없다고 주장했습니다.

알아두면 좋은 점

다중 모달 AI 모델: Llama 3-V와 MiniCPM-Llama3-V 2.5 같은 모델은 텍스트, 이미지 등 다양한 형태의 데이터를 동시에 처리할 수 있어 활용도가 높습니다.
토크나이저: 텍스트를 토큰화하는 이 핵심 요소의 특수성과 맞춤화가 모델의 정확도와 효율성에 큰 영향을 미칩니다.
청화 죽간: 이 고대 중국어 문헌은 전국시대(BC 475-221)의 매우 귀중한 자료로, 이를 인식할 수 있는 AI 모델의 수준이 높다는 것을 보여줍니다.

Llama 3-V 표절 스캔들은 AI 연구 분야의 윤리적 도전과 경쟁 압력을 부각시켰습니다. 이 논란의 결과는 AI 개발에서의 학술 윤리와 지적 재산권에 중대한 영향을 미칠 것입니다.

스탠포드 AI 팀이 표절 스캔들에 휩싸였습니다: Llama 3-V가 청화대학의 모델을 복사했다는 혐의

스탠퍼드 AI 팀이 표절 스캔들에 휩싸여: Llama 3-V가 청화대의 모델을 복사했다고 혐의

주요 내용

분석

알아두면 좋은 점

당신도 좋아할지도 모릅니다

뉴스레터 구독하기