⚠️ 주의: 이 글은 우리의 '실험 시대' 작품입니다 — 열정✨, 카페인☕, 그리고 유저 제출 콘텐츠가 만들어낸 아름다운 혼란🤹. 우리 여정의 일부라 남겨두었습니다🛤️ (누구나 흑역사는 있죠😅).
미국 기업 마이크로소프트가 새로운 멀티모달 언어 모델인 Phi-3-vision을 선보였습니다. Phi-3-vision은 이미지를 분석하고 내용에 대한 설명을 제공할 수 있는 4.2억 개의 매개변수로 구성된 모델입니다. 이 모델은 텍스트와 이미지를 모두 이해할 수 있는 멀티모달 기술을 활용하여, 특히 모바일 기기에 적합한 솔루션을 제공합니다. 기존 이미지 중심 AI 모델과 달리 Phi-3-vision은 이미지를 생성하지 않지만, 이미지 분석 능력이 뛰어납니다. Phi-3 가족에는 Phi-3-mini, Phi-3-small, Phi-3-medium 등이 포함되며, 이들은 Azure 모델 라이브러리에서 이용할 수 있습니다. 이는 비용 효율적이고 계산 집약적이지 않은 AI 서비스에 대한 수요 증가 추세를 반영하고 있습니다.