Allen Institute for AI가 오픈소스 브라우저 에이전트 MolmoWeb을 공개했다. 웹페이지 스크린샷을 해석해 클릭, 스크롤, 텍스트 입력 등을 자율적으로 수행하는 에이전트다. 8B 파라미터 버전이 내비게이션 벤치마크에서 OpenAI, 구글, 앤스로픽의 일부 상용 에이전트를 능가하는 성능을 보였다.
비영리 연구소의 오픈소스 모델이 수십억 달러를 투자한 빅테크의 상용 시스템 일부를 넘어선 것은 의미가 크다. Q1에만 267개 AI 모델이 출시되고 OpenClaw가 AI의 상품화 순간을 가져온 흐름 속에서, 오픈소스가 특정 작업에서 상용 모델을 압도하는 사례가 늘고 있다. 4B와 8B 버전이 Hugging Face와 GitHub에 공개돼 있어 누구나 사용할 수 있다.
브라우저 에이전트는 AI가 실제 웹을 탐색하고 작업을 완수하는 핵심 기술이다. OpenAI가 Atlas 브라우저를 슈퍼앱에 통합하고 Manus가 데스크톱 My Computer를 출시한 것과 같은 맥락에서, 브라우저 에이전트 기술의 오픈소스화는 AI 에이전트 생태계의 저변을 넓히는 역할을 한다.