OpenAI는 o3와 o4-mini가 이제 코드를 실행하고 차트를 생성하는 것부터 실시간 웹 데이터를 가져오고 이미지를 분석하는 것까지 도구를 사용하는 방법과 시기를 독립적으로 결정할 수 있게 되었다고 밝혔습니다. 이는 단순한 업그레이드가 아니라 철학적인 전환입니다.
이 모델들은 단순히 질문에 답하는 대신 인간 분석가처럼 문제를 접근합니다. 즉, 문제를 부분으로 나누고, 적절한 도구를 선택하고, 다양한 형식으로 정보를 종합하여 자율적으로 수행합니다.
한 시연에서 o3는 복잡한 에너지 사용량 쿼리를 처리했습니다. 이 모델은 웹을 사용하여 소비 데이터를 찾고, Python 코드를 실행하여 분석하고, 차트를 생성하고, 경제적 의미와 함께 결과를 상황에 맞게 설명했습니다. 이 모든 것이 1분 안에 이루어졌습니다. 이는 스크립트된 오케스트레이션이 아니라 전략적 의사 결정이었습니다.
한 독립적인 AI 연구원은 "여기서 중요한 것은 도구를 사용했다는 것이 아니라 도구를 사용하여 사고하는 방법을 알았다는 것입니다. 이는 완전히 다른 종류의 지능입니다."라고 언급했습니다.
o3 모델은 현재 수학, 프로그래밍, 소프트웨어 엔지니어링, 멀티모달 추론에서 업계 벤치마크를 선도하고 있습니다. OpenAI에 따르면 특히 비즈니스 전략, 과학적 가설 생성, 창의적 아이디어 발상과 같은 분야에서 이전 모델보다 심각한 오류를 20% 적게 발생시킵니다.
한편 o4-mini는 기대 이상의 성능을 보여줍니다. 속도와 비용에 최적화된 축소 모델임에도 불구하고 Python과 함께 사용했을 때 AIME 2025 벤치마크에서 99.5%의 정확도를 달성했습니다. 매일 수천 건의 쿼리를 실행하는 개발자에게는 가격 대비 성능 비율을 무시하기 어렵습니다.
한 퀀트 헤지 펀드 엔지니어는 "크기가 절반인 모델에서 업계 수준 작업에 대한 포화 수준의 결과를 보고 있습니다. 이는 효율성일 뿐만 아니라 혁신입니다."라고 말했습니다.
o4-mini가 ChatGPT의 무료 티어에 통합되고 두 모델 모두 API와 데스크톱 도구를 통해 사용할 수 있게 되면서 OpenAI는 플랫폼 전환을 시작하고 있습니다. o3의 추론을 사용하는 경량 터미널 기반 에이전트인 Codex CLI는 오픈 소스이며 이미 GitHub에서 사용할 수 있습니다. 개발자는 스크린샷, 스케치 또는 로컬 코드베이스를 연결할 수 있으며 모델은 셸 내에서 직접 응답합니다.
이는 OpenAI를 "에이전트 인터페이스 전쟁"이라고 부르는 내부자들보다 앞서게 합니다. 즉, 디버깅 코드, MRI 스캔 해석 또는 광고 예산 최적화와 같이 워크플로 전반에서 자율 협력자로 작동하는 도구로의 전환입니다.
이번 움직임은 또한 전략적입니다. GPT-5가 눈앞에 다가옴에 따라 회사는 o-시리즈를 곧 출시될 모델과 정렬하여 심층 추론과 자연스러운 대화 간의 더 긴밀한 통합을 약속합니다.
하지만 성능이 급증하더라도 한계는 여전히 남아 있습니다. o4-mini와 같은 소형 모델은 특히 역사 또는 전기적 지식과 같은 영역에서 사실적 기억 작업에서 더 낮은 성능을 보입니다. PersonQA 평가에서 o4-mini는 매개변수 수 감소 및 훈련 압축으로 인해 이전 모델보다 뒤쳐졌습니다.
또 다른 문제는 과신입니다. o3 모델은 더 똑똑하지만 정보가 모호할 때 더 많은 주장(정확한 주장과 부정확한 주장 모두)을 생성하는 경향이 있습니다. 이것은 단순한 버그가 아니라 설계상의 딜레마입니다. 모델이 추론 능력을 얻을수록 복잡한 추론을 할 가능성이 높아져 미묘한 환각의 위험이 커집니다.
한 시스템 통합자는 "양날의 검입니다. 추론을 잘할수록 더 자신감을 갖게 됩니다. 하지만 입력이 불안정하면 출력이 너무 불안정할 수 있습니다. 이는 규제 산업에서 큰 문제입니다."라고 설명했습니다.
출시 주기는 공격적입니다. o3, o4-mini, o4-mini-high는 이미 Plus, Pro, Team 요금제의 유료 ChatGPT 사용자에게 제공됩니다. 무료 티어 사용자는 "생각하기" 범주에서 o4-mini를 테스트할 수 있으며 엔터프라이즈 및 EDU 롤아웃이 곧 예상됩니다.
전체 도구 액세스 권한이 있는 향상된 o3-pro 모델이 몇 주 안에 출시될 예정입니다. 개발자는 채팅 완료 및 새로운 응답 API를 통해 액세스할 수 있지만 고급 기능에는 확인이 필요할 수 있습니다.
OpenAI는 또한 인센티브를 제공하고 있습니다. Codex CLI 및 에이전트 기능을 사용하여 구축하는 개발자를 위해 API 크레딧 100만 달러 보조금이 책정되어 있습니다.
분명한 메시지는 이것이 단순한 제품 업데이트가 아니라는 것입니다. 이는 멀티모달, 멀티 도구, 다단계 지능을 중심으로 한 플랫폼 재정렬입니다.
미미한 업그레이드와 과장된 광고로 가득 찬 AI 환경에서 OpenAI의 o3와 o4-mini는 다르게 느껴집니다. 그들은 단순히 대답하지 않습니다. 그들은 행동합니다. 그들은 단순히 보지 않습니다. 그들은 생각합니다.
처음으로 인공 지능은 도구 상자의 도구일 뿐이 아닙니다. 렌치를 건네주는 동료입니다.
그리고 그것은 모든 것을 바꿉니다.
당신도 좋아할지도 모릅니다
이 기사는 사용자가 뉴스 제출 규칙 및 지침에 따라 제출한 것입니다. 표지 사진은 설명을 위한 컴퓨터 생성 아트일 뿐이며 실제 내용을 나타내지 않습니다. 이 기사가 저작권을 침해한다고 생각되면, 우리에게 이메일을 보내 신고해 주십시오. 당신의 경계심과 협력은 우리가 예의 바르고 법적으로 준수하는 커뮤니티를 유지하는 데 중요합니다.
뉴스레터 구독하기
최신 기업 비즈니스 및 기술 정보를 독점적으로 엿보며 새로운 오퍼링을 확인하세요
저희 웹사이트는 특정 기능을 활성화하고, 더 관련성 있는 정보를 제공하며, 귀하의 웹사이트 경험을 최적화하기 위해 쿠키를 사용합니다. 자세한 정보는 저희의 개인정보 보호 정책 및 서비스 약관 에서 확인하실 수 있습니다. 필수 정보는 법적 고지