[뉴스토마토 신상민 기자] 생성형 인공지능(AI)의 학습 과정에서 저작권을 어떻게 다뤄야 할지를 두고 미국에서 '공정이용'의 기준이 제시되는 등 법·제도화에 가속이 붙고 있습니다. 반면 한국의 경우 뉴스 데이터를 둘러싼 보상 문제와 관련한 소송이 이제 막 시작됐고, 제도 논의 또한 아직 걸음마 단계인 상황입니다.
미국 저작권청은 2023년 'AI 이니셔티브'를 출범하고 AI 관련 법제 정비를 위해 총 3부작 보고서를 발간했습니다. 제1부(2024년 7월)는 AI 창작물의 저작권 인정 여부, 제2부(2025년 1월)는 AI 생성물의 저작권 등록 기준, 가장 최근 발표된 제3부는 AI 학습 단계에서의 저작권 침해 가능성과 공정이용 판단 기준에 초점을 맞췄습니다.
보고서는 AI 개발 과정에서 △웹 크롤링을 통한 대규모 데이터 수집 △학습 과정에서의 복제·토큰화·임시저장 △파라미터 형태의 내재화(메모리제이션) △출력 결과물 생성까지 모든 단계에서 저작권 침해 가능성이 존재한다고 지적했습니다. 특히 모델이 학습 데이터의 표현을 그대로 재현하는 '메모리제이션' 현상은 복제권·2차적 저작물 작성권을 침해할 수 있는 위험 요소로 분류됐습니다.
공정이용의 기준 또한 구체화됐습니다. 보고서는 △AI 학습 목적이 변형성 △학습 데이터의 합법적 수집 △학습 결과가 원저작물 시장을 대체·침해 여부를 핵심 판단 기준으로 제시했습니다. 또한 AI가 상업적 목적으로 기존 창작물과 경쟁하는 결과물을 대량 생산할 경우 공정이용 범위를 벗어날 수 있다고 설명했습니다.
미국은 정부가 강제적으로 라이선스를 도입하기보다는 시장 기반의 자율적·집단 라이선스 체계를 통해 대응하는 것이 바람직하다는 입장입니다.
한국은 아직까지는 보상과 책임 관련 갈등이 불거지는 단계입니다. 지상파 3사(KBS·MBC·SBS)는 네이버가 뉴스 콘텐츠를 사전 동의 없이 하이퍼클로바X 학습에 활용했다며 손해배상 소송을 제기했습니다. 최근 서울중앙지법에서 첫 변론이 열렸는데 네이버는 기존 뉴스 제공 계약과 시사보도의 저작권 예외 조항을 근거로 반박하고 있습니다.
이와 별개로 국회 차원에서 AI 학습에 대한 정당한 보상을 두고 논의가 이뤄지고는 있는데요. 지난 22일 열린 국회 세미나에서는 AI기업이 지상파 뉴스 데이터를 학습에 사용할 경우 지불해야 할 저작권료가 연간 약 877억원에 달한다는 추정치가 발표됐습니다. 이는 AI 모델의 한국어 이해도와 최신성 향상에 뉴스 데이터가 가장 크게 기여한다는 분석을 바탕으로 합니다.
이성엽 고려대 기술경영전문대학원 교수는 "우리도 법제화가 계속 논의되고 있지만 입법이 안 되고 있는 상황"이라며 "소송 부분은 중요한 게 그 대가를 어느 정도 산정할 것이냐의 문제인데 당장 입법이 힘들다면 정부가 적정한 가이드를 만드는 작업도 필요해 보인다"고 밝혔습니다.
생성형 AI 기업과 미디어 창작자의 상생 발전 방안 세미나 현장. (사진=한국방송협회)
신상민 기자 lmez0810@etomato.com
이 기사는 뉴스토마토 보도준칙 및 윤리강령에 따라 김나볏 테크지식산업부장이 최종 확인·수정했습니다.
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지