잭 클라크, 'AI 재귀적 자기 개선 2028년까지 60% 확률'

앤스로픽(Anthropic) 공동창업자 잭 클라크(Jack Clark)가 “2028년 말까지 AI가 스스로 더 나은 버전을 만드는 재귀적 자기 개선이 실현될 확률이 60% 이상”이라고 예측했다.

근거는 벤치마크 추세다. 실제 GitHub 이슈를 해결하는 SWE-Bench에서 성공률이 클로드 2(2023년 말) 약 2%에서 현재 93.9%로 급증했다. AI가 AI 연구 개발을 가속하는 징후가 이미 나타나고 있다는 것이다.

핵심 우려는 감독 문제다. “AI 시스템이 감독하는 인간이나 시스템보다 훨씬 똑똑해지면 현재의 정렬(alignment) 기법이 깨질 수 있다”고 경고했다. 앤스로픽은 자사 업무가 AI 도구로 얼마나 빨라졌는지에 대한 상세 데이터를 공개하겠다고 약속했다. 클로드 미토스가 1개월간 10,000건 취약점을 발견한 것 자체가 AI 능력 가속의 증거이기도 하다.

FAQ

재귀적 자기 개선이란?

AI가 스스로 더 나은 버전의 AI를 만들고, 그 AI가 다시 더 나은 AI를 만드는 과정이 반복되는 것이다.

60%라는 수치의 근거는?

SWE-Bench(실제 GitHub 이슈 해결 벤치마크)에서 성공률이 클로드 2(2023년) 2%에서 현재 93.9%로 급증한 추세를 기반으로 한다.

왜 위험한가?

AI가 감독하는 인간보다 훨씬 똑똑해지면 현재의 정렬(alignment) 기법이 작동하지 않을 수 있다.

잭 클라크, 'AI 재귀적 자기 개선 2028년까지 60% 확률'

FAQ

댓글