마이크로소프트가 Phi-3-vision을 공개했습니다: 혁신적인 멀티모달 언어 모델

마이크로소프트가 Phi-3-vision을 공개했습니다: 혁신적인 멀티모달 언어 모델

작성자
Luisa Rodriguez
1 분 독서

미국 기업 마이크로소프트가 새로운 멀티모달 언어 모델인 Phi-3-vision을 선보였습니다. Phi-3-vision은 이미지를 분석하고 내용에 대한 설명을 제공할 수 있는 4.2억 개의 매개변수로 구성된 모델입니다. 이 모델은 텍스트와 이미지를 모두 이해할 수 있는 멀티모달 기술을 활용하여, 특히 모바일 기기에 적합한 솔루션을 제공합니다. 기존 이미지 중심 AI 모델과 달리 Phi-3-vision은 이미지를 생성하지 않지만, 이미지 분석 능력이 뛰어납니다. Phi-3 가족에는 Phi-3-mini, Phi-3-small, Phi-3-medium 등이 포함되며, 이들은 Azure 모델 라이브러리에서 이용할 수 있습니다. 이는 비용 효율적이고 계산 집약적이지 않은 AI 서비스에 대한 수요 증가 추세를 반영하고 있습니다.

당신도 좋아할지도 모릅니다

이 기사는 사용자가 뉴스 제출 규칙 및 지침에 따라 제출한 것입니다. 표지 사진은 설명을 위한 컴퓨터 생성 아트일 뿐이며 실제 내용을 나타내지 않습니다. 이 기사가 저작권을 침해한다고 생각되면, 우리에게 이메일을 보내 신고해 주십시오. 당신의 경계심과 협력은 우리가 예의 바르고 법적으로 준수하는 커뮤니티를 유지하는 데 중요합니다.

뉴스레터 구독하기

최신 기업 비즈니스 및 기술 정보를 독점적으로 엿보며 새로운 오퍼링을 확인하세요