유사한 내용을 간단하고 쉽게 표현하면 다음과 같습니다:
최근 연구 결과에 따르면, 최신 대규모 멀티모달 모델(LMMs)이 의료 진단 문제에서 무작위 추측보다 더 나쁜 성능을 보였습니다. 연구팀은 의료 이미징 진단 능력을 평가하는 새로운 데이터셋인 ProbMed를 소개했습니다. 이 연구 결과는 현재 LMM 모델의 의료 진단 능력에 심각한 한계가 있음을 보여주었습니다. 이는 의료 인공지능에 대한 대중의 신뢰와 투자에 부정적인 영향을 줄 수 있습니다. 따라서 이러한 한계를 극복하고 의료 인공지능의 안전성과 신뢰성을 높이기 위한 지속적인 노력이 필요할 것 같습니다.