Skip to content
맥갤러리 로고 맥갤러리:Macgallery
Go back
Allen Institute, 오픈소스 브라우저 에이전트 MolmoWeb 공개 — 빅테크 상용 모델 능가
AI

Allen Institute, 오픈소스 브라우저 에이전트 MolmoWeb 공개 — 빅테크 상용 모델 능가

Allen Institute for AI가 오픈소스 브라우저 에이전트 MolmoWeb을 공개했다. 8B 파라미터 버전이 OpenAI, 구글, 앤스로픽의 일부 상용 에이전트를 내비게이션 벤치마크에서 능가한다.

오힘찬 ·
via TechStartups

Allen Institute for AI가 오픈소스 브라우저 에이전트 MolmoWeb을 공개했다. 웹페이지 스크린샷을 해석해 클릭, 스크롤, 텍스트 입력 등을 자율적으로 수행하는 에이전트다. 8B 파라미터 버전이 내비게이션 벤치마크에서 OpenAI, 구글, 앤스로픽의 일부 상용 에이전트를 능가하는 성능을 보였다.

비영리 연구소의 오픈소스 모델이 수십억 달러를 투자한 빅테크의 상용 시스템 일부를 넘어선 것은 의미가 크다. Q1에만 267개 AI 모델이 출시되고 OpenClaw가 AI의 상품화 순간을 가져온 흐름 속에서, 오픈소스가 특정 작업에서 상용 모델을 압도하는 사례가 늘고 있다. 4B와 8B 버전이 Hugging Face와 GitHub에 공개돼 있어 누구나 사용할 수 있다.

브라우저 에이전트는 AI가 실제 웹을 탐색하고 작업을 완수하는 핵심 기술이다. OpenAI가 Atlas 브라우저를 슈퍼앱에 통합하고 Manus가 데스크톱 My Computer를 출시한 것과 같은 맥락에서, 브라우저 에이전트 기술의 오픈소스화는 AI 에이전트 생태계의 저변을 넓히는 역할을 한다.

FAQ

MolmoWeb이 뭘 하나?

웹페이지의 스크린샷을 보고 해석한 뒤, 클릭, 스크롤, 텍스트 입력 등의 동작을 자율적으로 수행하는 브라우저 에이전트다. 사람이 웹을 탐색하는 방식을 AI가 모방한다.

빅테크 모델보다 나은 이유는?

비영리 연구소가 만든 8B 규모의 작은 모델이 훨씬 큰 상용 모델의 일부를 벤치마크에서 넘어선 것이다. 오픈소스의 힘과 특화된 학습 데이터가 범용 모델 대비 특정 작업에서 우위를 가질 수 있다는 증거다.

어디서 쓸 수 있나?

Hugging Face와 GitHub에 공개돼 있다. 4B(경량)와 8B(고성능) 버전이 있어 용도에 맞게 선택할 수 있다.


댓글