브리태니커·메리엄-웹스터, OpenAI 저작권 소송 — 10만 기사 무단 스크래핑

백과사전 브리태니커와 사전 메리엄-웹스터가 OpenAI를 맨해튼 연방법원에 저작권 침해로 소송했다. 10만 온라인 기사를 무단 스크래핑해 LLM 학습에 사용하고, ChatGPT의 RAG에서 원문을 거의 그대로 재생산했다는 것이 핵심 주장이다. “ChatGPT가 사용자 쿼리에 대한 답변을 생성해 브리태니커 같은 출판사의 수익을 빼앗고 있다”고 밝혔다.

특이한 점은 상표법(Lanham Act) 위반도 함께 청구한 것이다. AI가 만들어낸 할루시네이션을 브리태니커 이름으로 귀속시켜 출판사의 신뢰도를 훼손했다는 논리다. OpenAI는 “공개적으로 이용 가능한 데이터로 학습됐고 공정 사용에 기반한다”고 반박했다. 트럼프 AI 입법 프레임워크가 저작권 문제를 법원에 맡기겠다고 밝힌 가운데, 이 소송은 AI 학습과 저작권의 경계를 결정하는 핵심 사건 중 하나가 될 전망이다.

뉴욕타임스, Ziff Davis(CNET, IGN, PC Mag), 미국·캐나다 12개 이상 신문사가 이미 유사 소송을 진행 중이다. 브리태니커는 Perplexity도 별도로 소송했다. AI 학습 데이터의 공정 사용 범위가 법적으로 확정되기 전까지, 이런 소송은 계속 늘어날 전망이다.

FAQ

구체적으로 뭘 문제 삼나?

세 가지다. 1) 10만 기사를 허락 없이 스크래핑해 모델 학습에 사용 2) ChatGPT의 RAG(검색 증강 생성)에서 브리태니커 기사를 거의 그대로 복제해 출력 3) AI가 만들어낸 거짓 정보(할루시네이션)를 브리태니커 이름으로 귀속시켜 신뢰도 훼손.

OpenAI의 반박은?

OpenAI는 '모델은 혁신을 촉진하며, 공개적으로 이용 가능한 데이터로 학습됐고 공정 사용에 기반한다'고 밝혔다. 공정 사용(fair use)이 핵심 쟁점이 될 전망이다.

다른 소송도 있나?

뉴욕타임스, Ziff Davis(CNET, IGN, PC Mag 등), 미국·캐나다 12개 이상 신문사가 유사한 이유로 OpenAI를 소송 중이다. 브리태니커는 Perplexity도 별도로 소송했다.

브리태니커·메리엄-웹스터, OpenAI 저작권 소송 — 10만 기사 무단 스크래핑

FAQ

댓글