새로운 투기적 RAG 방법이 검색 보강 생성 시스템을 향상시킵니다

새로운 투기적 RAG 방법이 검색 보강 생성 시스템을 향상시킵니다

작성자
Ananya Patel
6 분 독서

추측적 RAG: 언어 모델의 효율성과 정확성을 혁신적으로 향상시키다

연구자들은 검색 강화 생성(RAG) 시스템을 혁신하기 위해 설계된 "추측적 RAG"라는 돌파구 방법을 공개했습니다. 이 혁신적인 접근 방식은 두 가지 개별 언어 모델을 통합하여 대규모 언어 모델(LLM) 처리의 효율성과 정확성을 높이고 오류와 "환각"을 최소화합니다.

추측적 RAG 방법은 검색된 문서의 서로 다른 하위 집합에서 여러 고품질 답변 옵션을 동시에 생성하는 "RAG 드래프터"라는 작은 특화 모델을 도입합니다. 이 특화 모델은 질문-답변-문서 관계를 위해 특별히 훈련되었습니다. 또한 "RAG 검증자"라는 더 큰 범용 모델이 RAG 드래프터가 생성한 옵션 중 가장 정확한 답변을 선택하고 검토합니다.

캘리포니아 대학과 구글이 실시한 광범위한 평가에서 인상적인 결과를 보여주었습니다. 테스트에 따르면 추측적 RAG는 기존 RAG 시스템에 비해 최대 12.97% 높은 정확도를 달성하면서 지연 시간을 51% 줄였습니다. 특히 이 이중 모델 시스템은 AI 상호 작용의 효율성과 정확성을 크게 향상시킵니다.

이 접근 방식의 잠재적 영향은 특히 AI 기술 제공업체와 사용자 측면에서 상당합니다. AI를 전문으로 하는 기술 회사의 제품 효율성과 신뢰성을 향상시킬 뿐만 아니라 의료 및 금융과 같이 정확성이 매우 중요한 중요 분야에서 AI 채택을 가속화할 가능성이 있습니다. 또한 이는 AI 모델에 대한 연구 개발 투자를 증가시키고 결국 AI 성능에 대한 업계 표준을 재편성할 수 있습니다.

주요 내용

  • "추측적 RAG"는 작은 "RAG 드래프터"와 큰 "RAG 검증자"를 결합하여 RAG 효율성을 향상시킵니다.
  • "RAG 드래프터"는 여러 답변 제안을 동시에 생성하여 입력 토큰을 줄입니다.
  • "RAG 검증자"는 최선의 답변을 선택하여 긴 문맥 처리 없이 정확성을 향상시킵니다.
  • 추측적 RAG는 벤치마크 테스트에서 최대 12.97% 높은 정확도와 51% 낮은 지연 시간을 보였습니다.
  • 이 이중 모델 접근 방식은 지식 집약적 작업을 위해 RAG 시스템을 보다 효율적으로 만드는 것을 목표로 합니다.

분석

캘리포니아 대학과 구글이 추측적 RAG를 도입하면서 AI 기술 제공업체와 사용자에게 상당한 영향을 미칠 것으로 예상됩니다. 이중 모델 접근 방식은 지연 시간과 오류 문제를 효과적으로 해결하여 경쟁업체가 유사한 혁신을 추진할 수 있게 합니다. 이는 AI 모델에 대한 연구 개발 투자를 증가시키고 AI 성능에 대한 업계 표준을 재정의할 것으로 기대됩니다. 이 혁신은 또한 의료 및 금융과 같이 정확성이 중요한 분야에서 AI 채택을 가속화할 수 있습니다.

알고 계셨나요?

- **추측적 RAG**:
  - **설명**: 추측적 RAG는 두 가지 개별 언어 모델을 통합하여 검색 강화 생성(RAG) 시스템의 효율성과 정확성을 향상시키는 새로운 방법입니다. 검색된 문서의 서로 다른 하위 집합에서 여러 고품질 답변 옵션을 생성하는 "RAG 드래프터"라는 작은 특화 모델과 가장 정확한 답변을 선택하는 "RAG 검증자"라는 더 큰 범용 모델을 활용합니다. 이 접근 방식은 대규모 언어 모델 처리의 지연 시간을 크게 줄이고 정확성을 향상시킵니다.

- **RAG 드래프터**:
  - **설명**: RAG 드래프터는 검색된 문서의 서로 다른 하위 집합에서 여러 고품질 답변 옵션을 동시에 생성하도록 설계된 작은 특화 언어 모델입니다. 질문-답변-문서 관계를 위해 특별히 훈련되어 입력 토큰을 줄이고 RAG 시스템의 전체 응답 시간을 단축하면서 다양한 가능성 있는 답변을 빠르게 생성할 수 있습니다.

- **RAG 검증자**:
  - **설명**: RAG 검증자는 RAG 드래프터가 생성한 여러 답변 옵션을 검토하는 더 큰 범용 언어 모델입니다. 그 주요 기능은 제공된 옵션 중 가장 정확한 답변을 선택하는 것으로, 긴 문맥 처리를 요구하지 않으면서 시스템의 전반적인 정확성을 향상시킵니다. 이 모델은 최종 출력이 신뢰할 수 있고 정확하도록 보장하여 추측적 RAG 방법의 성능을 향상시킵니다.

당신도 좋아할지도 모릅니다

이 기사는 사용자가 뉴스 제출 규칙 및 지침에 따라 제출한 것입니다. 표지 사진은 설명을 위한 컴퓨터 생성 아트일 뿐이며 실제 내용을 나타내지 않습니다. 이 기사가 저작권을 침해한다고 생각되면, 우리에게 이메일을 보내 신고해 주십시오. 당신의 경계심과 협력은 우리가 예의 바르고 법적으로 준수하는 커뮤니티를 유지하는 데 중요합니다.

뉴스레터 구독하기

최신 기업 비즈니스 및 기술 정보를 독점적으로 엿보며 새로운 오퍼링을 확인하세요