전 오픈AI 공동창업자 안드레이 카파시(Andrej Karpathy)가 AI 코딩 에이전트가 머신러닝 실험을 자율적으로 수행하는 Autoresearch 프레임워크를 깃허브에 오픈소스로 공개했다. 단일 GPU 환경에서 작동하는 이 프레임워크는 에이전트가 실험 설계부터 결과 분석까지 사람 개입 없이 반복 수행하는 방식으로 구동된다. 카파시는 이 시스템으로 2일간 700번의 실험을 돌려 소형 언어 모델의 학습 속도를 11% 높이는 최적화 기법 20개를 발견했다.
반응은 즉각적이었다. 쇼피파이(Shopify) CEO 토비아스 뤼케(Tobias Lütke)는 Autoresearch를 자사 내부 데이터에 적용해 하룻밤 사이 37번의 실험을 실행, 19%의 성능 향상을 끌어냈다고 밝혔다. 기업 수준의 데이터와 결합했을 때 자율 실험의 효과가 얼마나 빠르게 나타날 수 있는지를 보여준 사례다.
이번 공개는 AI가 연구 실험 자체를 자동화하는 ‘자율 연구’ 시대의 가능성을 본격적으로 열었다는 점에서 주목받는다. 연구자가 수개월을 투자하던 실험 반복 과정을 에이전트가 며칠 만에 소화하면서, 연구 생산성의 기준선 자체가 달라질 수 있다. 다만 실험 결과의 신뢰성 검증과 재현 가능성 확보는 자율 연구가 풀어야 할 남은 과제로 지적된다.