GPU 부족과 오픈AI의 GPT-5 훈련에 미치는 영향
전 세계 GPU 부족은 오픈AI와 앤소로픽과 같은 생성 AI 회사에 가장 큰 타격을 주고 있습니다. 이들 회사는 대규모 AI 모델 훈련을 위해 고급 GPU에 크게 의존하기 때문입니다. 다른 산업과는 달리, 생성 AI 모델 훈련은 상당한 처리 능력을 요구하여, 기업들이 엔비디아의 고성능 칩(예: H100 모델)에 접근하기 위해 경쟁하는 상황에서 병목 현상이 발생하고 있습니다. 오픈AI에 있어 이 부족은 GPT-5와 같은 모델 훈련에 지연을 초래했으며, 회사는 새로운 자금 조달 라운드에 대한 투자자 관심을 높이기 위해 gpt o1 모델을 예상보다 훨씬 일찍 출시해야 했습니다. 우리의 독점 소식통에 따르면, 이는 오픈AI가 AMD로 방향을 전환하고 자체 맞춤형 칩을 개발하는 주된 이유입니다.
브로드컴과 TSMC와의 맞춤형 AI 칩 개발: 로이터
자립성을 향한 중요한 단계로, 오픈AI는 추론 작업을 처리할 수 있는 맞춤형 AI 칩을 개발하고 있습니다. 이 새로운 칩은 반도체 대기업인 브로드컴과 TSMC의 도움으로 생산될 예정이며, 이는 외부 공급업체에 대한 의존도를 줄이려는 오픈AI의 더 큰 임무의 일환입니다. 브로드컴은 이 칩의 디자인을 조정하기 위해 오픈AI와 밀접하게 협력하고 있으며, 고성능 AI 계산에서 중요한 데이터 이동 효율성에 초점을 맞추고 있습니다. 디자인이 완료되면, 이 칩은 TSMC의 최첨단 제조 시설로 이동하여 생산됩니다.
2026년까지 준비될 것으로 예상되는 오픈AI의 내부 칩 개발 이니셔티브는 운영 전략의 중대한 변화를 나타내지만, 시장 수요와 기술 발전에 따라 시간표가 조정될 수 있습니다. 성공할 경우, 이 맞춤형 칩은 오픈AI가 더 높은 비용 효율성으로 운영되고 AI 모델에 더 일관된 성능을 제공할 수 있도록 할 것입니다. 또한, 이는 오픈AI를 구글, 아마존, 마이크로소프트, 메타와 같은 주요 기술 기업들이 이미 맞춤형 AI 칩에 투자하고 있는 증가하는 추세와 일치시킵니다.
애저에 AMD 기술 추가로 즉각적인 확장
맞춤형 칩이 개발되는 동안, 오픈AI는 또한 AMD의 최신 MI300X 칩을 마이크로소프트 애저에 통합하여 AI 능력을 즉각적으로 강화하고 있습니다. 이 조치는 지난 1년 동안 데이터 센터 시장에서 사업을 두 배로 늘린 AMD의 확장에 대한 응답으로 이루어졌습니다. AI 작업 부하를 처리하는 데 높은 효율성과 성능으로 잘 알려진 MI300X 칩은 엔비디아 GPU의 강력한 대안입니다. 오픈AI는 애저를 플랫폼으로 삼아 AMD 기술을 통합함으로써 엔비디아의 공급에 완전히 의존하지 않고도 고성능 AI 컴퓨팅 자원에 접근할 수 있습니다.
이 즉각적인 해결책은 오픈AI에 필수적입니다. 엔비디아는 AI GPU 시장의 80% 이상을 차지하고 있어, 오로지 엔비디아의 하드웨어에 의존하는 기업들에게 잠재적인 병목과 가격 압박을 초래하고 있습니다. 애저에서 AMD 칩을 사용할 수 있게 됨으로써 오픈AI는 더 저렴하게 확장할 수 있는 유연성을 얻고, AI 부문에 영향을 미친 일부 GPU 부족을 상쇄할 수 있습니다.
전략적 리더십 및 팀 노력
오픈AI의 맞춤형 칩 프로젝트는 AI 하드웨어 경험이 풍부한 약 20명의 엔지니어 팀이 이끌고 있습니다. 특히, 이 팀은 이전에 구글의 텐서 프로세싱 유닛(TPU) 개발에 참여한 전 구글 엔지니어인 토마스 노리와 리차드 호가 이끌고 있습니다. 그들의 전문성은 오픈AI의 야심찬 칩 디자인 노력에 중추적이며, 구글의 AI 하드웨어 생태계에서 수집한 통찰을 오픈AI의 내부 프로젝트에 접목시키고 있습니다.
이 팀은 소규모이지만, AI 중심 하드웨어 디자인에서의 집중적인 경험이 혁신과 효율성을 이끌 것으로 기대되고 있습니다. 오픈AI는 이 팀을 확장하는 데 신중한 접근 방식을 취하고 있으며, 엔비디아와 같은 주요 산업 파트너와의 관계를 방해하지 않도록 노력하고 있습니다.
재무 및 시장 현실
오픈AI가 하드웨어 이니셔티브를 강화함에 따라, 회사는 이중 접근 방식에 긴급함을 더하는 재정적 도전 과제에 직면하고 있습니다. 오픈AI는 2024년에 50억 달러의 손실을 예상하며, 수익은 37억 달러에 이를 것으로 보입니다. 이 비용의 상당 부분은 컴퓨팅 비용에서 발생하며, 맞춤형 칩과 다양화된 하드웨어가 이를 크게 줄이는 데 도움이 될 수 있습니다. 높은 비용은 오픈AI가 새로운 자금 조달 경로를 탐색하도록 이끌었으며, 하드웨어 투자가 재정적 지속 가능성을 개선하기 위한 전략의 중요한 부분을 형성하고 있습니다.
더 넓은 시장에서 엔비디아는 AI GPU 시장 점유율의 80% 이상을 계속해서 차지하고 있으며, AMD는 2024년 AI 칩 판매에서 45억 달러를 예상하고 있습니다. 다른 주요 기술 회사들이 칩 공급망을 다양화하거나 맞춤형 칩에 투자함에 따라, 오픈AI는 늦게 시작했지만 따라잡기로 결심했습니다. 성공한다면, 오픈AI의 하드웨어 다양화는 비용을 줄이고 AI 분야에서 보다 자립적인 플레이어로 자리잡을 수 있게 할 것입니다.
산업의 더 넓은 영향 및 미래의 의미
오픈AI의 접근 방식은 이미 칩 공급을 다양화했거나 맞춤형 하드웨어에 투자하여 증가하는 AI 수요를 충족한 다른 기술 대기업들의 움직임을 반영합니다. 이러한 조치를 통해 오픈AI는 기술 부문의 더 넓은 추세에 영향을 미치고, 다른 AI 기업들이 엔비디아 생태계 외부에서 하드웨어 솔루션을 모색하도록 장려할 수 있습니다. 오픈AI의 전략적 전환은 또한 단일 공급업체에 대한 의존도를 줄이는 산업의 증가하는 추세를 반영하며, 특히 칩 부족과 비용 상승이 기업들이 더 탄력적인 솔루션을 찾도록 압박을 가하고 있습니다.
애저에 AMD 기술을 추가하고, 오픈AI의 맞춤형 칩 개발을 결합함으로써 AI 기업들이 신뢰할 수 있고 비용 효과적인 하드웨어 옵션을 여러 개 갖게 된 미래를 암시합니다. 오픈AI가 소프트웨어와 하드웨어 양쪽에서 혁신을 계속함에 따라, 이들의 선택은 AI 산업의 경쟁 환경을 재편성하고, 하드웨어 제공자에게 새로운 기회와 여전히 엔비디아 칩에 크게 의존하는 기업에게 새로운 도전을 초래할 수 있습니다.
결론
이중 하드웨어 전략을 통해 오픈AI는 엔비디아에 대한 의존성을 능동적으로 해결하고, 성능을 개선하고 비용을 줄이며 고성능 AI 칩의 안정적인 공급을 확보할 목표를 가지고 있습니다. 브로드컴 및 TSMC와의 맞춤형 AI 칩 협력과 마이크로소프트 애저 플랫폼을 통한 AMD의 MI300X 칩의 즉각적인 통합은 오픈AI의 AI 분야에서의 장기적 안정성과 혁신에 대한 의지를 보여줍니다. 이 회사가 이러한 하드웨어 이니셔티브를 통해 앞으로 나아가면서, 시장 수요와 기술적 제약 모두에 맞추어 AI 발전의 최전선에 남을 것으로 기대됩니다.