AI의 전장, 저작권법

2024년 3월 14일, explained

저작권법이 생성 AI의 미래를 결정한다.

2024년 1월 11일 오픈AI CEO 샘 올트먼이 미국 국회의사당을 방문했다. 사진: Kent Nishimura, Getty Images
NOW THIS

미국 소설가 세 명이 지난 8일 엔비디아를 상대로 저작권 침해 소송을 제기했다. 엔비디아가 자사 챗봇 ‘네모’를 개발할 때 19만 권의 책을 학습시켰는데, 여기에 자신들의 작품이 들어가 있다는 것이다. 이들이 청구할 수 있는 손해 배상액은 결정되지 않았지만, 수억 달러에 이를 전망이다. 엔비디아는 “우리는 저작권법을 준수해 네모를 만들었다”고 밝혔다.

WHY NOW

생성 AI 기업에 저작권 침해 논란이 잇따르고 있다. 《뉴욕타임스(NYT)》는 지난해 12월 오픈AI가 자사 기사 수백만 건을 챗봇 훈련에 무단으로 이용했다며 소송을 제기했다. 게티이미지도 이미지 생성 AI 기업인 스태빌리티AI를 상대로 법적 공방을 벌이고 있다. AI 기술의 방향이 입법이나 규제보다 저작권법에서 결정될 가능성이 커지고 있다.

냅스터

1999년 냅스터가 나왔다. 사실상 세계 최초의 P2P 음원 공유 서비스였다. CD와 테이프에 담겨 음반 단위로 유통되던 음악 상품을 MP3 포맷으로, 곡 단위로, 무료로 주고받을 수 있게 했다. 2001년 미국 법원은 저작권 침해를 이유로 냅스터에 폐쇄 명령을 내렸다. 냅스터가 음악 산업의 지적 재산(IP)을 강탈했듯, 지금 생성 AI 기업들은 텍스트, 이미지, 비디오, 사운드, 모든 영역의 IP를 강탈하고 있다.

데이터

데이터는 21세기의 석유다. 그런데 생성 AI 기업은 기름값을 내지 않는다. 생성 AI가 무에서 유를 만들어 내는 것처럼 보이지만, 실제로는 그렇지 않다. 생성 AI는 수십억 개의 매개 변수에 의해 훈련된다. AI는 데이터의 패턴을 분석해서 규칙을 만들고, 사용자의 명령에 응답한다. 인터넷상의 거의 모든 정보가 AI의 학습 데이터가 된다. 데이터가 없으면 AI도 없다.

판례

그런데 이런 데이터가 저작권자의 허락 없이 사용되고 있다. 최근 잇따르는 소송이 이런 경우다. 내 허락도 없이 내가 쓴 글을 AI가 학습하는 것이다. 콘텐츠 영역만의 문제가 아니다. 자율주행차, 바이오, 로봇 등 머신러닝이 사용되는 모든 비즈니스에서 데이터의 소유권이 문제가 될 수 있다. 문제는 AI 기술의 발전이 너무 빨라서 법도 없고 판례도 없다는 것이다.

공정 이용

소송의 결과는 ‘공정 이용’의 해석에 달렸다. 공정 이용이란 저작권자의 허락 없이 저작물을 사용할 수 있는 특수한 경우를 의미하는데, 보도, 비평, 교육, 연구 등을 위해서는 정당한 범위 안에서 저작물을 허가 없이 이용할 수 있다. 예를 들어 교육 목적으로 고등학교 교실에서 학생들을 상대로 한 방송사의 다큐멘터리를 틀어 줬다면 저작권 침해로 보지 않는 것이다.

무임승차

창작자들은 AI가 저작물 일부를 발췌하는 게 아니라 사실상 저작물을 통째로 흡수하고 재배열하기 때문에 공정 이용의 대상이 아니라는 입장이다. AI 기업들이 공정 이용을 남용해 개인의 저작물에 무임승차한다는 것이다. NYT는 퓰리처상을 수상한 자사 기사를 챗GPT가 그대로 인용한 예를 들며, 생성 AI가 훈련된 데이터를 변형하지 않았으므로 공정 이용이 아니라고 주장한다.

패턴 매칭

생성 AI 기업들은 학습 데이터 이용이 공정 이용에 해당한다고 주장한다. 생성 AI는 학습한 내용을 바탕으로 프롬프트와 가장 유사한 작업을 예측하고 작성하는 패턴 매칭 기술이기 때문에 저작권 침해가 아니라는 입장이다. 오픈AI는 NYT가 챗GPT의 답변이 자사 기사와 똑같이 나올 때까지 같은 질문을 수만 번 반복했다고 주장한다. 또한 일부 질문은 사용 약관을 위반한 ‘기만적인 프롬프트’였다고 밝혔다.

비인간의 창작

문제는 또 있다. AI의 데이터 학습만이 유일한 법적 문제는 아니다. 저작권은 인간이 창작한 작품에만 적용된다. AI가 만든 콘텐츠에 저작권을 주장할 수는 없다. 그렇다면 생성 AI가 미키마우스 그림을 그리고, 디즈니가 이를 저작권 침해로 소송을 제기하면 법원은 저작권 침해의 책임을 누구에게 물어야 할까. AI를 개발한 연구원일까, 회사일까, 프롬프트를 입력한 사용자일까.

IT MATTERS

인류는 이번 세기 가장 중요한 법적 질문 앞에 섰다. 저작권법이 AI의 학습을 허용할 것인가. 소송의 결과가 기술의 미래를 결정하게 된다. 그런데 사실 저작권법은 AI의 영향에 대응하기 위해 만들어진 법이 아니다. 창작자의 권리를 보호하기 위해 만들어진 법이 AI로 인한 인간의 노동, 창작의 의미, 사회 변화, 모든 걸 바꾸게 될 수 있다. 저작권법에만, 법원에만 맡겨 두기엔 너무나 크고 중요한 문제다. 우리에겐 철학적 고민과 사회적 합의를 거친 새로운 법이 필요하다.
 
이연대 에디터
#AI #테크 #법 #미국 #explained
다음 이야기가 궁금하신가요?
프라임 멤버가 되시고 모든 콘텐츠를 무제한 이용하세요.
프라임 가입하기
추천 콘텐츠
Close