구글, 추론에 최적화된 TPU, 오픈 AI 에이전트 프로토콜 및 엔터프라이즈용 풀 스택 생성 미디어 제품군 공개

구글의 대담한 AI 삼박자: Ironwood, Agent2Agent, Vertex 생성 미디어가 엔터프라이즈 AI의 새로운 패러다임을 제시하다

오늘 Cloud Next 25 컨퍼런스에서 Google Cloud는 엔터프라이즈 인공지능의 인프라, 상호 운용성 및 창의적 역량에 지각 변동을 예고하는 획기적인 AI 발표 3가지를 공개했습니다. 각 릴리스인 Ironwood TPU, Agent2Agent 프로토콜 및 Vertex AI Generative Media 제품군은 그 자체로도 큰 성과입니다. 하지만 이들은 함께 AI의 미래는 추론 우선, 에이전트 주도, 기본적으로 멀티모달이라는 설득력 있는 명제를 형성합니다.

Ironwood의 놀라운 42.5 엑사플롭스의 추론 최적화 컴퓨팅으로 슈퍼컴퓨팅을 재정의하는 것부터, Agent2Agent로 AI 에이전트 통신을 표준화하는 것, Vertex의 생성 파이프라인으로 몇 주 걸리는 창작 작업을 몇 시간으로 압축하는 것까지, Google Cloud는 단순한 반복 작업을 하는 것이 아닙니다. Google Cloud는 오늘날의 파편화되고 리소스 집약적인 표준을 훨씬 뛰어넘는 야심을 가지고 엔터프라이즈 AI 상부 구조를 조율하고 있습니다.

"추론의 시대": Ironwood TPU가 AI 인프라를 재정의하다

액체 냉각의 산업적인 소리와 하이퍼스케일 데이터 센터의 빛 아래에서 새로운 종류의 지능이 탄생하고 있습니다. 학습이 아니라 이해에서 말입니다. Google의 7세대 Tensor Processing Unit인 Ironwood는 AI 하드웨어 진화에서 결정적인 전환점을 나타냅니다. 즉, 이미 훈련된 모델을 배포하여 대규모로 추론, 응답 및 반응하는 행위인 추론을 위해 특별히 제작된 회사의 첫 번째 칩입니다.

Ironwood 배포에 정통한 한 시스템 설계자는 "이것은 새로운 컴퓨팅 영역입니다"라고 언급했습니다. "우리는 10년 동안 훈련 중심 하드웨어를 사용해 왔습니다. 그러나 추론은 사용자, 워크플로, 비즈니스 결과에 실시간 가치를 제공하는 곳입니다."

최대 9,216개의 액체 냉각 칩이 상상할 수 없는 42.5 엑사플롭스를 제공하는 Ironwood는 세계 최고 슈퍼컴퓨터인 El Capitan조차도 24배 능가합니다. SparseCore 업그레이드, 칩당 192GB HBM 및 1.2Tbps 칩 간 네트워킹은 대규모 언어 모델과 과학 시뮬레이션의 분산된 요구에 최적화된 낮은 대기 시간, 높은 대역폭 메시를 만듭니다.

하지만 가장 주목할 만한 점은 Ironwood가 이전 제품보다 와트당 2배의 성능을 제공하고 2018 TPU v1보다 거의 30배 더 효율적이라는 점입니다. 이는 대규모 AI 배포에 대한 새로운 경제적, 환경적 타당성을 알리는 아키텍처적 도약입니다.

한 클라우드 분석가는 "수조 개의 토큰에 대해 실시간으로, 여러 양식에 걸쳐 추론을 유지할 수 있는 시스템을 보고 있으며 에너지 비용은 절반으로 줄일 수 있습니다"라고 언급했습니다. "이는 단순한 성능이 아닙니다. 전략적 활용입니다."

Agent2Agent: AI의 가장 시급한 통합 문제 해결

Ironwood가 원시 컴퓨팅 능력을 과시하는 동안 Google의 Agent2Agent 프로토콜은 또 다른 문제인 에이전트 통신을 해결합니다. 오늘날 Salesforce, SAP, PayPal 및 Deloitte를 포함한 50개 이상의 엔터프라이즈 파트너의 지원을 받아 출시된 A2A는 AI 에이전트가 사일로화된 시스템, 프레임워크 및 공급업체 간에 작업을 조정하고 컨텍스트를 교환할 수 있도록 하는 개방형 프로토콜을 도입합니다.

핵심적으로 A2A는 오랫동안 제기된 업계의 딜레마에 답하고자 합니다. 모든 AI 도구가 자체적인 walled garden에서 작동한다면 엔드투엔드 비즈니스 문제를 해결하기 위해 어떻게 함께 작업할 수 있을까요?

HTTP, JSON-RPC 및 SSE를 기반으로 구축된 A2A의 오픈 소스 디자인은 보안 우선 아키텍처, 피드백 루프가 있는 장기 작업 지원, 양식에 구애받지 않는 메시징(텍스트, 비디오, 오디오) 및 도구 종속성 없는 완전한 에이전트 자율성의 5가지 기본 원칙을 따릅니다. 기능 검색을 위한 에이전트 카드 및 복잡한 협업을 위한 구조를 제공하는 작업 라이프사이클과 같은 주요 기능이 있습니다.

설득력 있는 사용 사례는 무엇일까요? 채용입니다. 관리자는 AI 어시스턴트에게 후보자 소싱을 지시할 수 있습니다. 해당 에이전트는 특화된 소싱 에이전트를 참여시키고, 인터뷰를 예약하고, 피드백 루프를 관리하고, 규정 준수 점검을 실행합니다. 이 모든 것이 A2A 지원 에이전트 간 메시징을 통해 이루어집니다.

분석가들은 장기적인 영향이 단순한 생산성 향상보다 더 클 수 있다고 제안합니다.

Vertex AI Generative Media: 하나의 플랫폼, 모든 양식, 엔터프라이즈급

Ironwood가 백엔드를 강화하고 Agent2Agent가 워크플로를 조율하는 동안 Vertex AI의 확장된 Generative Media Suite를 통해 기업은 텍스트 프롬프트에서 모든 경험을 만들고, 브랜딩하고, 제공할 수 있습니다.

주요 추가 기능은 다양한 장르에서 고음질의 감정적으로 미묘한 오디오를 생성하는 텍스트-음악 모델인 Lyria입니다. 기업은 캠페인 분위기 및 내러티브에 맞춰진 맞춤형, 로열티 프리 사운드트랙으로 스톡 라이브러리를 대체하는 데 이미 이를 활용하고 있습니다.

한편 Veo 2는 인페인팅, 아웃페인팅 및 카메라 경로 제어와 같은 편집 도구를 통해 영화 같은 비디오 생성을 도입하여 에이전시에 새로운 수준의 창의적 방향을 제시합니다. Chirp 3는 단 10초의 입력과 일기 기능을 통해 맞춤형 음성 복제를 제공하여 접근성, 브랜딩 및 오디오 분석에서 새로운 사용 사례를 제공합니다. Imagen 3는 이미지 생성에서 디테일, 조명 및 개체 제거를 개선하여 전문가 수준의 시각적 콘텐츠에 대한 Google의 약속을 강화합니다.

결정적으로 모든 결과물은 엔터프라이즈 안전 기능에 의해 관리됩니다.

추적성을 위한 SynthID 워터마킹
유해한 프롬프트를 차단하는 안전 필터
고객 훈련 데이터를 보호하기 위한 데이터 거버넌스
기업을 저작권 침해로부터 보호하기 위한 IP 면책

전략적 종합: 부분의 합을 넘어서는 비전

이 세 가지가 인상적인 출시 그 이상이 되는 이유는 그들 사이의 철학적 일관성 때문입니다. 각 제품은 고립된 상태에서 경쟁사를 능가하는 것뿐만 아니라 상호 연결된 시스템으로 작동하도록 설계되었습니다.

Ironwood는 실시간 모델 제공을 위한 확장 가능하고 추론에 최적화된 백본을 제공합니다.
Agent2Agent는 이러한 모델로 구동되는 자율 에이전트가 시스템 간에 유연하게 작동할 수 있도록 합니다.
Vertex Generative Media는 창의적인 페이로드를 제공하여 지능을 즉시 대규모로 출력으로 변환합니다.

이 스택은 단순한 기술 업그레이드 그 이상입니다. 그것은 선언문입니다. AI는 사전 예방적이고 구성 가능하며 엔터프라이즈에 안전해야 합니다. 여러 플랫폼에서 사용자를 대신하여 행동해야 합니다. 마찰 없이 창조해야 합니다. 그리고 에너지, 윤리 또는 통합에 대해 타협하지 않고 그렇게 해야 합니다.

폐쇄된 생태계와 좁은 솔루션으로 가득 찬 시장에서 Google Cloud의 모듈식, 개방형 및 확장 가능한 접근 방식은 차세대 AI 네이티브 기업을 위한 인프라 계층으로 부상할 수 있습니다.

한 독립 AI 연구원은 "그들이 구축한 것은 제품이 아닙니다"라고 말했습니다. "그것은 엔터프라이즈 AI 경제를 위한 운영 체제입니다."

마지막 말: 인프라의 획기적인 발전, 그러나 실제 혁신은 기업에서 일어나고 있지 않습니다.

Google의 발표는 Ironwood의 추론 최적화 아키텍처에서 Agent2Agent의 우아한 개방성, Vertex의 엔드투엔드 생성 능력에 이르기까지 기술적으로 인상적이지만(적어도 자체 주장의 PR 릴리스에서) 이러한 발전이 기존 엔터프라이즈 환경에서 단기적인 변화를 주도할 것이라고는 회의적입니다.

사실, 우리는 실제 혁신이 다른 곳에서 펼쳐지고 있다고 믿습니다. 즉, 기존 조직의 벽 외부에서 제품을 구축하는 소비자, 제작자 및 LLM 네이티브 스타트업에서 말입니다. Andrej Karpathy가 언급했듯이 이는 일반적인 하향식 채택 곡선을 뒤집는 최초의 변혁적 기술일 수 있습니다. 즉, 기업이나 정부가 잠재력을 완전히 흡수하기 훨씬 전에 개인에게 기하급수적인 가치를 제공합니다.

오늘날의 AI 스택은 아무리 정교하더라도 기존 시스템, 규정 준수 오버헤드, 브랜드 가이드레일 및 위험 회피와 같은 동일한 엔터프라이즈 마찰에 직면해 있습니다. 대규모 조직의 경우 최고의 도구조차도 종종 이미 하고 있는 일을 점진적으로 개선하는 데 도움이 될 뿐이며, 이는 우리가 굳게 믿고 있는 미래가 아닙니다.