샤오펑(XPeng)이 오토 차이나(Auto China) 2026에서 공개한 휴머노이드 로봇 아이언(Iron)은 자사 ADAS(첨단 운전자 보조 시스템)와 동일한 비전-언어-행동(Vision-Language-Action, VLA) 아키텍처를 사용한다. 자동차가 도로 환경을 인식하고 주행 판단을 내리는 것과 같은 AI가 로봇의 두 팔과 다리를 움직이는 것이다. 이동 수단 AI와 로봇 AI의 경계가 사라지는 순간이다.
이는 단순한 기술 시연이 아니라 전략적 전환을 의미한다. 중국 자동차 업체들이 AI를 ‘자동차에 탑재하는 기능’이 아니라 ‘다양한 물리적 형태에 배치할 수 있는 기반 역량’으로 취급하기 시작한 것이다. 자동차 회사가 로봇 회사로 변모하는 흐름이다. 메타(Meta)가 휴머노이드 로봇 지능 기업 ARI를 인수하고 피규어(Figure)가 Figure 03 생산을 24배 확대한 것도 같은 방향을 가리킨다.
핵심은 VLA라는 단일 아키텍처가 자동차와 로봇이라는 전혀 다른 물리적 플랫폼에서 작동한다는 점이다. 개별 제품마다 AI를 따로 개발하는 대신 하나의 AI 엔진을 여러 형태의 기계에 이식하는 접근법은 개발 비용을 낮추고 기술 축적 속도를 높인다. 자율주행 데이터가 로봇 학습에, 로봇 조작 데이터가 자율주행 판단에 상호 기여하는 선순환 구조가 가능해지는 셈이다.