AI 뉴스 데이터 활용, 공짜는 없다

[우리의 주장] 편집위원회

생성형 인공지능(AI)의 뉴스 저작권 침해 논란이 불붙었다. 뉴욕타임스와 가디언 등 해외 언론이 챗GPT봇 접근을 차단해 콘텐츠 무단도용에 맞선데 이어 국내 언론들도 공동대응에 나서고 있다. 네이버가 자체 개발한 생성형 AI ‘하이퍼클로바X’를 지난달 선보였는데, 뉴스 50년 치에 달한 한국어 데이터를 학습했다고 알려져 저작권 논쟁이 가열됐다. 언론사와 맺은 약관에 근거해 뉴스 콘텐츠 활용 동의가 필요 없고 사용료를 지불하지 않아도 되는 것처럼 말해 불씨가 당겨졌다. 네이버와 카카오, 구글 등 생성형 AI를 개발하는 업체들은 저작권법에 적시된 ‘공정이용’ 규정을 들어 저작권 침해가 아니라고 방어벽을 치고 있다.


그렇다면 언론사들이 포털과 맺은 콘텐츠 제휴는 AI와 같은 새로운 기술 개발에 언제든 꺼내 쓸 수 있는 만능키라도 되는가. 언론계 반응은 사뭇 다르다. 온라인신문협회는 “AI 학습은 기존 약관에 규정된 서비스와 질적으로 차원이 다른 차원의 가공물”이라며 저작권 침해라고 맞서고 있다. 기업들의 ‘공정이용’ 주장에 대해서도 언론사의 이익을 침해하는 방식으로 콘텐츠가 활용되는 것까지 언론사가 동의한 것은 아니라며 “불공정 행위다”라고 반박했다. 신문협회도 “생성형 AI가 원작자에 대한 보상과 출처 표기 없이 정보를 가공해 전파하는 것은 저작권 침해”라고 가세했다.


포털과 언론사가 뉴스 저작권을 바라보는 시각차가 워낙 크다. AI 뉴스콘텐츠 활용 가이드라인 제정이 시급하지만 기술진보 속도가 빨라 넋 놓고 있을 순 없다. 합의 가능한 최소한 부분부터 시작해야 한다. AI의 뉴스 콘텐츠 활용 기준과 보상체계를 새로 정립하는 게 마땅하다. 과거 언론사와 포털이 콘텐츠 제휴를 맺을 때 지금과 같은 기술 혁신을 예견했다고 보기 어렵다. 뉴스를 담는 새 그릇이 생겼는데, 기존 약관 타령을 해선 안 된다. 이미 몇몇 언론은 자사 콘텐츠에 ‘AI학습 금지’ 약관을 신설하며 자체적으로 대응하고 있다. 다른 언론으로 확산할 것은 시간문제다. 뒤이어 저작권 침해 소송으로 번질 수 있다. 결국 포털은 기술개발이 지체되는 상황에 직면할 수 있다. 협상이 시작되면 합당한 사용료 지불이 불가피하다. 어떤 기준으로 어떻게 보상할 것인지 머리를 맞댈 필요가 있다. 국회에서도 저작권법 개정안을 추진하고 있어 해결책을 함께 마련할 방법은 없는지 찾아보기 바란다.


언론계가 요구하는 AI 학습 데이터의 투명한 출처 공개는 가짜뉴스 차단을 위해서도 필요하다. 이미 인공지능으로 만든 ‘딥페이크(가짜) 영상’이 사실인 양 SNS를 중심으로 급속하게 퍼지는 일을 심심치 않게 보고 있다. 빌 게이츠는 “AI 가짜뉴스가 민주주의에 악영향을 미칠 것”이라고까지 경고했다. 출처가 어디인지 알 수 없는 뉴스들이 인터넷 공간에 차고 넘친다. 뉴스 출처를 투명하게 밝히는 것은 결국 인공지능이 ‘가짜뉴스’를 만드는 것을 예방하는 일이기도 하다. 깨끗한 물이 넘치면 흙탕물은 자연정화 된다. 뉴스 콘텐츠를 긁어모아 AI를 학습시키는 데만 골몰한 채 뉴스 생태계를 악화시키는 데 나몰라라 하는 것은 미디어의 건강성을 해치는 데 동조하는 일이다. 포털의 책임있는 태도가 요구된다.


언론사들은 AI가 뉴스 콘텐츠를 활용해 더 나은 공동체의 가치를 실현하기를 바란다. 기술의 진보가 인간 삶의 질을 개선하는데 마다할 이유가 없다. 어쩌면 빅테크 기업들과 상생을 통해 기술 혁신에 기여하고 싶기도 하다. 언론사들이 원하는 것은 콘텐츠에 대한 가치 인정이다. 오랜 시간 공들여 만든 뉴스 상품을 어떤 동의도 없이 무단으로 사용하는 것을 반대할 뿐이다. 인공지능 시대, 공짜는 없다.

맨 위로