미국 기업 마이크로소프트가 새로운 멀티모달 언어 모델인 Phi-3-vision을 선보였습니다. Phi-3-vision은 이미지를 분석하고 내용에 대한 설명을 제공할 수 있는 4.2억 개의 매개변수로 구성된 모델입니다. 이 모델은 텍스트와 이미지를 모두 이해할 수 있는 멀티모달 기술을 활용하여, 특히 모바일 기기에 적합한 솔루션을 제공합니다. 기존 이미지 중심 AI 모델과 달리 Phi-3-vision은 이미지를 생성하지 않지만, 이미지 분석 능력이 뛰어납니다. Phi-3 가족에는 Phi-3-mini, Phi-3-small, Phi-3-medium 등이 포함되며, 이들은 Azure 모델 라이브러리에서 이용할 수 있습니다. 이는 비용 효율적이고 계산 집약적이지 않은 AI 서비스에 대한 수요 증가 추세를 반영하고 있습니다.