구글, 훈련·추론 분리한 듀얼 칩 TPU 8 공개

구글이 I/O 2026에서 8세대 TPU를 공개했다. 이번 세대부터 훈련과 추론을 분리한 듀얼 칩 아키텍처를 도입한다.

TPU 8t는 대규모 사전학습에 최적화됐다. 이전 세대 대비 약 3배의 원시 연산력을 제공한다. TPU 8i는 추론 전용으로 설계돼 속도와 효율에 집중했다. 두 칩 모두 와트당 성능이 이전 세대의 2배다. 구글은 현재 전 세계에 분산된 100만 개 이상의 TPU로 AI 훈련을 수행할 수 있다고 밝혔다.

훈련과 추론의 워크로드 특성이 근본적으로 다르다는 점을 칩 설계에 반영한 것이다. 구글 클라우드 넥스트에서 처음 예고됐던 TPU 8이 정식으로 모습을 드러낸 셈이며 제미나이 3.5 플래시의 4배 빠른 출력 속도도 TPU 8i의 추론 최적화 덕분으로 보인다.

FAQ

TPU(Tensor Processing Unit)란?

구글이 AI 연산을 위해 자체 설계한 커스텀 칩이다. 엔비디아 GPU와 경쟁한다.

듀얼 칩 아키텍처란?

훈련용(TPU 8t)과 추론용(TPU 8i) 칩을 분리 설계하는 방식이다. 각 워크로드에 최적화된 성능을 낸다.

훈련과 추론의 차이는?

훈련은 대량의 데이터로 AI 모델을 학습시키는 과정이고, 추론은 학습된 모델이 실제 사용자 요청에 응답하는 과정이다.

구글, 훈련·추론 분리한 듀얼 칩 TPU 8 공개

FAQ

댓글