앤스로픽(Anthropic) 공동창업자 잭 클라크(Jack Clark)가 “2028년 말까지 AI가 스스로 더 나은 버전을 만드는 재귀적 자기 개선이 실현될 확률이 60% 이상”이라고 예측했다.
근거는 벤치마크 추세다. 실제 GitHub 이슈를 해결하는 SWE-Bench에서 성공률이 클로드 2(2023년 말) 약 2%에서 현재 93.9%로 급증했다. AI가 AI 연구 개발을 가속하는 징후가 이미 나타나고 있다는 것이다.
핵심 우려는 감독 문제다. “AI 시스템이 감독하는 인간이나 시스템보다 훨씬 똑똑해지면 현재의 정렬(alignment) 기법이 깨질 수 있다”고 경고했다. 앤스로픽은 자사 업무가 AI 도구로 얼마나 빨라졌는지에 대한 상세 데이터를 공개하겠다고 약속했다. 클로드 미토스가 1개월간 10,000건 취약점을 발견한 것 자체가 AI 능력 가속의 증거이기도 하다.