백과사전 브리태니커와 사전 메리엄-웹스터가 OpenAI를 맨해튼 연방법원에 저작권 침해로 소송했다. 10만 온라인 기사를 무단 스크래핑해 LLM 학습에 사용하고, ChatGPT의 RAG에서 원문을 거의 그대로 재생산했다는 것이 핵심 주장이다. “ChatGPT가 사용자 쿼리에 대한 답변을 생성해 브리태니커 같은 출판사의 수익을 빼앗고 있다”고 밝혔다.
특이한 점은 상표법(Lanham Act) 위반도 함께 청구한 것이다. AI가 만들어낸 할루시네이션을 브리태니커 이름으로 귀속시켜 출판사의 신뢰도를 훼손했다는 논리다. OpenAI는 “공개적으로 이용 가능한 데이터로 학습됐고 공정 사용에 기반한다”고 반박했다. 트럼프 AI 입법 프레임워크가 저작권 문제를 법원에 맡기겠다고 밝힌 가운데, 이 소송은 AI 학습과 저작권의 경계를 결정하는 핵심 사건 중 하나가 될 전망이다.
뉴욕타임스, Ziff Davis(CNET, IGN, PC Mag), 미국·캐나다 12개 이상 신문사가 이미 유사 소송을 진행 중이다. 브리태니커는 Perplexity도 별도로 소송했다. AI 학습 데이터의 공정 사용 범위가 법적으로 확정되기 전까지, 이런 소송은 계속 늘어날 전망이다.