OpenAI, ChatGPT에 실시간 비디오 기능 마침내 출시

OpenAI, ChatGPT에 실시간 비디오 기능 마침내 출시

작성자
Jane Park
8 분 독서

OpenAI, ChatGPT에 실시간 비디오 기능 추가로 AI 상호작용 혁신

OpenAI가 ChatGPT에 실시간 비디오 기능을 공식 출시했습니다. 이는 통합된 시각 기능을 갖춘 고급 음성 모드에 대한 중요한 개선으로, 사용자들이 시각 정보를 이용해 ChatGPT와 상호 작용할 수 있도록 해줍니다. 이 혁신적인 기능은 AI가 실제 상황을 더욱 원활하게 이해하고 반응하는 능력을 크게 향상시킵니다.

주요 기능

시각 입력: 새로운 실시간 비디오 기능을 사용하면 사용자가 스마트폰 카메라로 물체를 비추어 ChatGPT가 거의 즉시 시각 정보를 분석하고 논의할 수 있습니다. 이 기능은 ChatGPT를 더욱 상호 작용적이고 직관적인 어시스턴트로 변화시켜 카메라가 캡처하는 내용에 기반한 자세한 통찰력을 제공합니다.

화면 공유: 시각 입력 외에도 ChatGPT는 이제 기기 화면에 표시되는 콘텐츠를 해석할 수 있습니다. 설정 메뉴를 탐색하거나 복잡한 수학 방정식을 푸는 등 AI는 명확한 설명과 실용적인 제안을 제공하여 사용자 경험과 생산성을 향상시킵니다.

음성 상호 작용: 기존 고급 음성 모드를 기반으로 시각 입력과 음성 명령의 통합은 더욱 포괄적이고 역동적인 상호 작용을 만듭니다. 사용자는 음성과 시각 신호를 모두 사용하여 ChatGPT와 대화할 수 있어 AI 어시스턴트가 다양한 요구에 더욱 다재다능하고 신속하게 반응합니다.

이용 가능 여부 및 접근 방식

OpenAI의 실시간 비디오 기능은 현재 ChatGPT Plus, Team 및 Pro 구독자에게 제공됩니다. 사용자는 ChatGPT 모바일 앱을 통해 이 기능에 접근하여 원활하고 사용자 친화적인 경험을 보장할 수 있습니다. 2024년 12월 12일에 출시가 시작되었으며, 일주일 이내에 완료될 것으로 예상됩니다. 새로운 기능을 사용하려면 다음과 같은 간단한 단계를 따르세요.

  1. ChatGPT 채팅창 옆에 있는 음성 아이콘을 탭합니다.
  2. 왼쪽 하단의 비디오 아이콘을 선택하여 비디오 입력을 시작합니다.
  3. 화면 공유의 경우, 세 점 메뉴를 탭하고 "화면 공유"를 선택합니다.

제한 사항 및 향후 계획

새로운 기능은 상당한 발전을 나타내지만, 현재 ChatGPT Enterprise 및 Edu 사용자는 제외되며 2025년 1월에 이용할 수 있게 됩니다. 또한 EU, 스위스, 아이슬란드, 노르웨이 및 리히텐슈타인 사용자의 경우 규제 승인 및 규정 준수 조치를 기다리는 중이어서 이용 가능 시점이 확정되지 않았습니다.

추가 기능

즐거운 추가 기능으로 OpenAI는 ChatGPT의 고급 음성 모드에서 산타클로스의 목소리를 사전 설정 옵션으로 포함하는 "산타 모드"를 도입했습니다. 프롬프트 바 옆에 있는 눈송이 아이콘을 탭하여 접근할 수 있는 이 기능은 휴가철 사용자 상호 작용에 계절적인 분위기를 더하여 전반적인 사용자 경험을 향상시킵니다.

개발 및 과제

실시간 비디오 기능의 도입은 여러 차례의 지연을 겪었는데, 주로 기능이 완전히 준비되기 전에 OpenAI가 조기에 발표했기 때문입니다. 4월에 "몇 주 이내"에 빠른 출시를 계획했지만, 회사는 기술을 개선하고 최적의 성능을 보장하기 위해 추가 시간이 필요했습니다.

유망한 잠재력에도 불구하고 이 기술은 과제가 없는 것은 아닙니다. CNN의 "60 Minutes" 데모에서 시스템은 해부학 그림을 정확하게 식별했지만 기하학 문제에서는 어려움을 겪어 환각 및 부정확성에 대한 잠재적인 문제점을 보여주었습니다. 이러한 과제는 신뢰성과 신뢰도를 높이기 위해 지속적인 개선이 필요함을 강조합니다.

사용자 반응

테크 커뮤니티와 사용자들은 OpenAI의 최신 혁신에 열광적으로 반응했습니다. 초기 사용자들은 향상된 상호 작용과 AI가 실시간으로 맥락을 인식하는 응답을 제공하는 능력을 칭찬했습니다. 그러나 일부 사용자는 출시 일정과 접근성에 대해 우려를 표명하며 OpenAI가 더 넓은 사용자에게 이용 가능성을 신속하게 제공할 것을 촉구했습니다.

업계 영향

OpenAI가 ChatGPT에 실시간 비디오 기능을 통합한 것은 텍스트, 오디오 및 시각 데이터를 처리할 수 있는 다중 모드 AI 시스템을 개발하는 더 넓은 추세와 일치합니다. 이러한 발전은 AI와 인간의 상호 작용에 대한 새로운 기준을 설정할 뿐만 아니라 최근 유사한 실시간 처리 기능을 갖춘 2세대 AI 모델인 Gemini를 출시한 Google과 같은 업계 거장들과의 경쟁력을 확보합니다.

이 기능의 성공적인 배포는 더욱 개인화되고 효율적인 AI 기반 솔루션을 가능하게 함으로써 소매, 의료 및 교육을 포함한 다양한 부문에서 상당한 발전을 이끌어낼 것으로 예상됩니다.

미래 전망

앞으로 OpenAI는 규제 및 기술적 장애를 극복하는 것을 조건으로 더 많은 사용자 그룹과 지역에 기능의 이용 가능성을 확대할 계획입니다. 회사는 부정확성을 최소화하고 사용자 신뢰도를 높이기 위해 기술을 개선하여 ChatGPT가 AI 혁신을 계속해서 주도하도록 노력하고 있습니다.

결론적으로 OpenAI의 ChatGPT용 실시간 비디오 기능은 인공 지능 분야에서 혁신적인 도약을 나타내며, 더욱 자연스럽고 다재다능한 상호 작용을 제공합니다. 기술이 성숙하고 더 널리 이용 가능해짐에 따라 개인과 기업이 일상적인 작업과 복잡한 문제 해결에 AI를 활용하는 방식을 혁신할 것으로 예상됩니다.

당신도 좋아할지도 모릅니다

이 기사는 사용자가 뉴스 제출 규칙 및 지침에 따라 제출한 것입니다. 표지 사진은 설명을 위한 컴퓨터 생성 아트일 뿐이며 실제 내용을 나타내지 않습니다. 이 기사가 저작권을 침해한다고 생각되면, 우리에게 이메일을 보내 신고해 주십시오. 당신의 경계심과 협력은 우리가 예의 바르고 법적으로 준수하는 커뮤니티를 유지하는 데 중요합니다.

뉴스레터 구독하기

최신 기업 비즈니스 및 기술 정보를 독점적으로 엿보며 새로운 오퍼링을 확인하세요