구글이 I/O 2026에서 8세대 TPU를 공개했다. 이번 세대부터 훈련과 추론을 분리한 듀얼 칩 아키텍처를 도입한다.
TPU 8t는 대규모 사전학습에 최적화됐다. 이전 세대 대비 약 3배의 원시 연산력을 제공한다. TPU 8i는 추론 전용으로 설계돼 속도와 효율에 집중했다. 두 칩 모두 와트당 성능이 이전 세대의 2배다. 구글은 현재 전 세계에 분산된 100만 개 이상의 TPU로 AI 훈련을 수행할 수 있다고 밝혔다.
훈련과 추론의 워크로드 특성이 근본적으로 다르다는 점을 칩 설계에 반영한 것이다. 구글 클라우드 넥스트에서 처음 예고됐던 TPU 8이 정식으로 모습을 드러낸 셈이며 제미나이 3.5 플래시의 4배 빠른 출력 속도도 TPU 8i의 추론 최적화 덕분으로 보인다.