마이크로소프트가 Phi-3-vision을 공개했습니다: 혁신적인 멀티모달 언어 모델

2024년 5월 21일

작성자

Luisa Rodriguez

1 분 독서

⚠️ 주의: 이 글은 우리의 '실험 시대' 작품입니다 — 열정✨, 카페인☕, 그리고 유저 제출 콘텐츠가 만들어낸 아름다운 혼란🤹. 우리 여정의 일부라 남겨두었습니다🛤️ (누구나 흑역사는 있죠😅).

미국 기업 마이크로소프트가 새로운 멀티모달 언어 모델인 Phi-3-vision을 선보였습니다. Phi-3-vision은 이미지를 분석하고 내용에 대한 설명을 제공할 수 있는 4.2억 개의 매개변수로 구성된 모델입니다. 이 모델은 텍스트와 이미지를 모두 이해할 수 있는 멀티모달 기술을 활용하여, 특히 모바일 기기에 적합한 솔루션을 제공합니다. 기존 이미지 중심 AI 모델과 달리 Phi-3-vision은 이미지를 생성하지 않지만, 이미지 분석 능력이 뛰어납니다. Phi-3 가족에는 Phi-3-mini, Phi-3-small, Phi-3-medium 등이 포함되며, 이들은 Azure 모델 라이브러리에서 이용할 수 있습니다. 이는 비용 효율적이고 계산 집약적이지 않은 AI 서비스에 대한 수요 증가 추세를 반영하고 있습니다.

당신도 좋아할지도 모릅니다

뉴스레터 구독하기

최신 기업 비즈니스 및 기술 정보를 독점적으로 엿보며 새로운 오퍼링을 확인하세요

저희 웹사이트는 특정 기능을 활성화하고, 더 관련성 있는 정보를 제공하며, 귀하의 웹사이트 경험을 최적화하기 위해 쿠키를 사용합니다. 자세한 정보는 저희의 개인정보 보호 정책 및 서비스 약관 에서 확인하실 수 있습니다. 필수 정보는 법적 고지