• 프린트
  • 메일
  • 스크랩
  • 글자크기
  • 크게
  • 작게

[스타트업 법률 가이드] AI 학습과 저작권 침해의 관계

 

김나래 법무법인 디엘지 변호사 | narae.kim@dlglaw.co.kr | 2026.04.21 12:03:52
[프라임경제] AI 모델을 개발하는 과정에서 방대한 양의 데이터 학습은 기본 전제다. 그런데 AI 모델의 학습 또는 TDM(텍스트·데이터 마이닝) 과정에서, AI가 학습데이터를 수집하고 이를 입력할 때 입력데이터의 복제가 수반될 수밖에 없다. 이 때 입력데이터에 대한 적법한 사용권한이 없다면 저작권 침해로 이어질 수 있다.
 
저작권법은 '인간의 사상 또는 감정을 "표현"한 창작물'로서의 저작물을 보호하고 있다. 따라서 단순히 데이터를 수치화해 입력하는 AI 학습은 '비표현적 이용(non-expressive)'에 해당해 복제권 침해로 구성하기 어렵다는 주장도 있다. 특히 미국에서는 이러한 비표현적 이용을 저작물의 변형적 이용(transformative use)으로 보고 저작권 침해를 구성하지 않는다고 판시한 판례도 있으나(Bartz v. Anthropic PBC), 사안에 따라 공정이용이 부정된 판례도 다수 존재한다.

이렇듯 법적 불확실성이 존재하는 상황에서, AI 학습 시 저작물을 적법하게 이용할 수 있도록 하는 법적 근거로서 1) 저작물의 공정이용 또는 2) TDM 면책 규정을 두는 방법이 가능하다.

공정이용이란, 이용목적을 특정하지 않고 공정하다고 판단되는 모든 이용행위에 대해 저작권의 제한을 인정하는 포괄적 일반조항이다. 우리나라 저작권법 제35조의5에 따른 저작물 공정이용 규정은 "저작물의 일반적인 이용 방법과 충돌하지 않고, 저작자의 정당한 이익을 부당하게 해치지 않는 경우에는 저작물을 이용할 수 있다"고 정하며, 그 판단 시 이용의 목적 및 성격, 저작물의 종류 및 용도, 이용된 부분이 저작물 전체에서 차지하는 비중과 중요성, 저작물의 이용이 현재 또는 잠재적 시장이나 가치에 미치는 영향을 고려해야 한다고 규정한다. 

관련해 대법원은 '공정이용 해당 여부를 판단할 경우에는 법령상 열거된 요소들을 종합적으로 고려해야 하고, 열거되지 않은 이용의 경위나 방법 등의 사항도 판단 요소로 고려할 수 있다'고 판시했다. 즉 공정이용은 어느 하나의 요소로 결정되는 것이 아니라 제반 사정을 종합하는 판단해야 하는 문제이다. 그렇기 때문에 사전에 공정이용에 해당하는지를 예측하기 어렵고, AI 스타트업 입장에서는 학습데이터 수집 단계에서부터 법적 불확실성을 감수해야 하는 셈이다.

반면 TDM 면책 규정은 공정이용과 같은 포괄적 일반조항과 달리, AI 학습·연구 목적의 TDM 행위를 저작권 침해의 예외로서 법률에 명시적으로 규정하는 방식이다. 면책 요건을 충족하는지를 비교적 명확하게 판단할 수 있어, 공정이용에 비해 법적 안정성이 높다고 볼 여지는 있다.

해외에서는 이미 TDM 면책 규정을 도입하는 경우가 확인된다. 유럽연합은 2019년 DSM(Digital Single Market) 저작권 지침을 통해 TDM 면책 규정을 도입했는데, 연구기관 등이 연구 목적으로 수행하는 TDM에 대해서는 폭넓은 면책을 인정하고(제3조), 영리 목적을 포함한 일반적인 TDM에 대해서도 저작권자가 기계판독 가능한 방식으로 이용을 명시적으로 거부하지 않는 한 면책을 허용한다(제4조). 

일본은 이보다 앞서 2018년 저작권법 개정을 통해, 저작물에 표현된 사상·감정의 향수를 목적으로 하지 않는 정보 분석 행위에 대해 목적이나 영리성을 불문하고 저작권자의 허락 없이 저작물을 이용할 수 있도록 하는 규정(제30조의4)을 두고 있다. 

우리나라 저작권법은 현재 TDM에 관한 명시적 면책 규정을 두고 있지 않아, AI 학습 목적의 저작물 이용은 제35조의5의 공정이용 일반조항에 의존할 수밖에 없다. 이러한 상황에서 국내에서도 AI 학습 목적의 저작물 이용을 둘러싼 분쟁이 시작되고 있다. 최근 방송 3사는 네이버가 생성형 인공지능 서비스 학습에 자신들의 방송기사를 무단 이용한 것이 저작권법 및 부정경쟁방지법상 위반이라고 주장, 소송을 제기했다. 

이에 대해 네이버는 방송기사의 저작물성 자체를 부정하는 취지로 다투고 있으므로 일단 저작물성 자체가 인정돼야 비로소 공정이용에 대한 판단이 이뤄질 것으로 보인다. 만약 법원이 방송기사의 저작물성을 인정한다며, 이 사건은 국내에서 AI 학습과 저작권의 관계를 다루는 최초의 주요 판례가 될 것으로 예상된다. 공정이용 해당 여부를 어떻게 판단하냐에 따라, 국내 AI 기업들의 학습데이터 수집 및 이용 전략 전반에 상당한 영향을 미칠 것으로 보인다.



김나래 법무법인 디엘지 변호사/공학박사
(前) 산업통상자원부 국가기술표준원

  • 이 기사를 공유해보세요  
  •  
  •  
  •    
맨 위로

ⓒ 프라임경제(http://www.newsprime.co.kr) 무단전재 및 재배포금지