메타 CEO 마크 저커버그가 유튜브의 불법 콘텐츠 제거 싸움을 자신의 회사가 저작권이 있는 전자책 데이터를 사용한 방어 논리로 활용한 것으로 보인다고, 지난해 말 그가 한 증언의 일부가 새롭게 공개되었습니다.
이번 증언은 ‘Kadrey v. Meta’라는 AI 저작권 소송과 관련이 있으며, 이는 AI 기업들이 저자 및 기타 지식재산권(IP) 소유자들과 대립하는 여러 소송 중 하나입니다. 이 소송에서 대부분의 피고인인 AI 기업들은 저작권이 있는 콘텐츠를 학습에 사용하는 것이 “공정 사용(fair use)”이라고 주장하고 있습니다. 그러나 많은 저작권 소유자들은 이에 반대하고 있습니다.
저커버그는 증언 중 “예를 들어, 유튜브는 사람들이 불법 복제한 콘텐츠를 일정 기간 동안 올릴 수 있지만, 유튜브는 그 콘텐츠를 제거하려고 노력하고 있다”고 말했습니다. 그는 또 “유튜브에 있는 대부분의 콘텐츠는 아마도 합법적이며, 그들은 그 콘텐츠에 대한 라이센스를 가지고 있을 것”이라고 덧붙였습니다.
저커버그의 증언에서 저작권 콘텐츠와 공정 사용에 대한 그의 생각을 엿볼 수 있는 단서들이 포함되어 있습니다. 다만, 전체 증언록은 공개되지 않았습니다. TechCrunch는 메타에 추가적인 정보를 요청했으며, 회사가 답변하면 기사를 업데이트할 예정입니다.
저커버그는 이번 증언에서 메타가 ‘LibGen’이라는 전자책 데이터셋을 사용하여 자사의 AI 모델인 ‘Llama’를 훈련시킨 것에 대해 방어하고 있는 것으로 보입니다. Llama는 OpenAI의 모델들과 경쟁하고 있습니다.
LibGen은 ‘링크 집합체’라고 자신을 소개하며, Cengage Learning, Macmillan Learning, McGraw Hill, Pearson Education 등 여러 출판사의 저작권이 있는 작품에 접근할 수 있도록 합니다. LibGen은 여러 차례 저작권 침해로 고소를 당하고, 차단 명령을 받으며, 수천만 달러의 벌금을 부과받은 바 있습니다.
이번 주에 공개된 법원 서류에 따르면, 저커버그는 메타의 Llama 모델 중 적어도 하나를 훈련시키기 위해 LibGen의 사용을 승인했다고 합니다. 이에 대해 메타 내부의 AI 팀과 연구팀에서는 법적 문제를 우려했다는 주장도 있습니다.
또한, 원고 측 변호사는 메타 직원들이 LibGen을 “우리가 불법 복제된 데이터셋으로 알고 있는 자료”라고 언급했다고 주장하며, 이 데이터셋의 사용이 “규제 기관과의 협상에서 메타의 입장을 약화시킬 수 있다”고 경고했다고 밝혔습니다.
저커버그는 증언 중 “LibGen에 대해 잘 들어본 적이 없다”고 말하며, “나는 그 구체적인 내용에 대해서는 잘 알지 못한다”고 설명했습니다. 또한, “유튜브에서 일부 콘텐츠가 저작권이 있을 수 있다고 해서 유튜브 사용을 금지하는 정책을 세우는 것이 불합리한가?”라는 질문에 “그렇다”고 답하며, “그런 일반적인 금지가 옳지 않을 수 있다”고 언급했습니다.
저커버그는 메타가 저작권이 있는 자료로 훈련할 때 “조심해야 한다”고 말하며, “사람들이 의도적으로 다른 사람의 권리를 침해하려는 웹사이트를 제공하는 경우에는 그것과 어떻게 상호작용할지 신중을 기해야 한다”고 덧붙였습니다.
새로운 주장들
‘Kadrey v. Meta’ 소송에서 원고 측 변호사들은 2023년 캘리포니아 북부지방법원에 제출된 후 여러 차례 소장을 수정했습니다. 최신 소장에서는 메타가 LibGen에서 불법 복제된 책과 저작권이 있는 책을 대조하여 라이센스 계약을 체결할지 여부를 결정했다는 새로운 주장이 포함되었습니다.
원고들은 메타가 최신 Llama 모델인 Llama 3을 훈련시키기 위해 LibGen을 사용했다고 주장하며, 메타가 다음 세대 모델인 Llama 4의 훈련에도 이 데이터셋을 사용했다고 덧붙였습니다.
또한, 원고 측은 메타 연구원들이 Llama 모델이 저작권이 있는 자료로 훈련되었음을 숨기기 위해 “감독된 샘플”을 추가했다고 주장했습니다. 그리고 메타는 최근 2024년 4월에도 Llama 훈련을 위해 Z-Library에서 불법 전자책을 다운로드했다고 주장합니다.
Z-Library는 여러 출판사로부터 법적 조치를 받았으며, 2022년에는 이 사이트를 운영한 러시아인이 저작권 침해, 전자 사기 및 돈세탁 혐의로 기소되었습니다.