생성형 인공지능(AI)의 답변이 미디어와 저널리즘 콘텐츠에 크게 의존한다는 조사 결과가 나와 주목된다. AI 검색 서비스 전체에서 27%, 시의성 있는 정보가 필요한 질문에선 거의 절반이 저널리즘 콘텐츠를 인용하고 있다는 게 골자다. AI 시대 ‘제로 트래픽’ 우려가 나오는 상황에서 언론사들이 이 같은 뉴스의 가치에 기반해 불공정한 비즈니스 구조를 개선할 방안을 모색할 필요성이 커지고 있다.
한국언론진흥재단은 20일 KPF미디어브리프 ‘AI 검색 서비스의 저널리즘 콘텐츠 인용 현황과 언론산업의 대응전략’(2025년 8호, 이현우 언론재단 선임연구위원) 보고서를 통해 AI 검색 서비스들의 저널리즘 콘텐츠 인용 실태, 패턴을 살핀 해외 연구결과를 소개했다. AI 기반 PR 플랫폼 ‘제너러티브 펄스(Generative Pulse)’가 7월 발표한 연구(‘What is AI Reading?’)는 한 달 간 100만개 이상 링크를 수집, AI가 사용자 프롬프트에 응답할 때 어떤 출처를 인용하는지 체계적으로 분석했다.
연구에 따르면 AI가 인용하는 링크의 95% 이상이 비광고 콘텐츠였는데 저널리즘 콘텐츠가 전체 인용의 27%를 차지했다. 특히 최신 정보를 요구하는 질문에선 저널리즘 콘텐츠 인용 비율이 절반(49%)까지 상승한 것으로 나타났다. 이는 AI 플랫폼이 시의성 있는 정보를 제공할 때 언론 매체를 주요 소스로 활용하고 있다는 점을 시사한다.
이는 질문 유형에 따른 AI의 인용 패턴에서도 나타났는데 조언이나 의견을 구했을 땐 기업형 블로그 및 콘텐츠를 인용되는 반면, 최근 사건에 대한 업데이트나 사실확인 질문에선 저널리즘 소스가 압도적으로 많이 활용됐다. 시간적 측면에선 최근 12개월 이내 발행된 저널리즘 콘텐츠가 많이 인용되고 있었고 해외 유수 언론, 즉 권위 있는 매체들이 일관되게 상위 인용 출처로 나타났다는 게 보고서의 요지다.
언론재단은 “AI 검색 서비스가 로이터, AP, 파이낸셜타임스 같은 권위 있는 언론사를 일관되게 상위 인용 출처로 활용하고, 최신성이 요구되는 쿼리에서 저널리즘 인용이 절반의 비중을 차지한다는 점은 객관적 검증과 시의적절한 정보 제공이라는 저널리즘의 본질적 역할이 AI시대에 오히려 더욱 중요해졌음을 시사한다”고 분석했다.
AI 모델에 따라 인용하는 매체나 방식에 차이가 있다는 점도 나타났다. 챗GPT는 로이터(Reuters), AP, 파이낸셜타임스(FT), 악시오스(Axios), 타임(Time), 포브스(Forbes)를 가장 자주 인용했고, 최신 콘텐츠에 대한 선호도(인용된 저널리즘 콘텐츠 56%가 12개월 이내 발행)가 가장 높은 것으로 나타났다. 제미나이는 챗GPT와 유사하게 로이터, 파이낸셜타임스, 악시오스를 자주 인용했지만 인베스토피디아(Investopedia) 같은 전문 정보 사이트도 상위권에 포함하는 양태를 보였다.
반면 클로드에선 현저히 다른 패턴이 나타났는데 전통 뉴스매체 인용비율은 상대적으로 적었고, 대신 CNBC, 하버드비즈니스리뷰(HBR), 굿하우스키핑(Good Housekeeping) 등 더 다양한 출처를 활용하는 모습이 나타났다. 로이터를 인용한 빈도가 제미나이의 20분의 1, 챗GPT의 50분의 1 수준이었다. 12개월 이내 최신 저널리즘 콘텐츠 인용 비율(36%)도 오픈AI 모델의 56%보다 낮았다.
산업 유형에 따라 AI 검색 서비스의 콘텐츠 인용 패턴도 차이가 있었다. ‘헬스케어’와 ‘여행/항공’ 산업 분야에선 공신력 있는 정부 기관, 산업 협회 자료가 주로 인용됐고, 특히 ‘헬스케어’의 경우 정부/NGO 출처 인용률(18%)이 가장 높게 나타났다. ‘에너지’ 산업에선 전문기관 자료, ‘기술’ 산업은 온라인 교육플랫폼, 기술 블로그를 주로 활용하고 있었다. 저널리즘 콘텐츠가 가장 많이 인용되는 분야는 ‘금융/보험’(37%), ‘정부’(36%), ‘미디어/엔터테인먼트’(37%)인 것으로 나타났다.
다만 AI 기업들이 콘텐츠를 대량 수집하면서도 언론사 웹사이트들의 트래픽에 대한 기여로는 이어지지 못하는 ‘제로 트래픽’ 우려가 나오는 게 현실이다. 실제 연구는 챗GPT를 개발한 오픈AI가 1700회 크롤링당 1회, 클로드를 내놓은 앤스로픽은 7만3000회 크롤링당 1회만 사이트를 추천한다는 내용을 담기도 했다. 콘텐츠를 무단으로 활용하면서도 광고 수익 기반이 되는 트래픽은 보내지 않는 불공정한 비즈니스 구조에서 저널리즘 산업의 영속을 위한 전략적 접근이 요구되는 상황이다.
이에 대안으로 언론재단은 ‘콘텐츠 무단이용 차단’을 제시하며 웹 인프라 기업 클라우드플레어의 ‘크롤링당 결제’ 시스템 사례를 소개했다. 전 세계 웹사이트의 20%를 처리하는 해당 기업은 2025년 7월 ‘크롤링당 결제(Pay per Crawl)’ 시스템을 도입해 AI 크롤러를 기본적으로 차단한다. 웹사이트 운영자가 허용한 크롤러에 한해서만 접근을 허가하고, 콘텐츠 수집 시마다 소액의 사용료를 부과하는 방식이다.
언론재단은 AI 기업들의 크롤링 행태에 대해 “과거 구글이 14회 크롤링당 1회 추천으로 트래픽을 보장했던 것과는 완전히 다른 구조로, AI 기업들이 대량의 콘텐츠 수집에도 불구하고 실제 트래픽 기여는 미미하다는 것을 보여준다”며 “콘데 나스트, 타임, AP, 애틀랜틱 등 주요 언론사들이 이미 기본 차단 정책이 동참했다는 사실은 언론 산업계가 이러한 불균형에 대응하기 시작했음을 시사한다”고 평했다.
‘공정한 콘텐츠 보상 체계 마련’의 맥락에서 해외 AI 검색 서비스 중 하나인 프로라타(ProRata)의 수익 분배 솔루션도 유의미하게 언급됐다. 이 시스템은 AI가 생성한 답변을 실시간으로 분석, 각 출처의 기여도를 100밀리 초 내에 계산한다. A매체에서 20%, B매체에서 5% 등 각 언론사의 기여도를 정확히 측정하고 광고수익의 50%를 이러한 비율에 따라 콘텐츠 제공자에게 배분한다.
언론재단은 “프로라타의 핵심은 표절 방지 소프트웨어와 유사한 기술을 활용하여 AI 답변의 모든 문장을 500개 이상 언론사의 허가받은 데이터셋과 대조하는 것”이라며 “단순한 라이선싱 계약을 넘어 구조적 해결책을 제시한다”고 적었다.
언론사 차원에서 ‘사용자 경험의 혁신’에 나서야 한다며 e-커머스를 벤치마킹 할 필요성도 거론됐다. 최근 세계뉴스미디어협회(INMA) 라틴아메리카 컨퍼런스에선 뉴스 미디어들이 e-커머스 산업의 개인화 전략을 벤치마킹해야한다는 주장이 제기됐는데 이용자들의 구매 이력과 브라우징 습관을 활용해 맞춤형 상품을 추천하듯 뉴스미디어도 보유한 1차 데이터를 잘 활용해야 한다는 것이다.
언론재단은 “사용자가 선호하는 콘텐츠 형식(오디오, 비디오, 텍스트)과 관심 주제를 파악하고 장바구니에 담았다가 구매하지 않은 상품을 재노출하듯 이용자가 관심을 표현한 뉴스 주제를 전략적으로 다시 제공하는 것”이라며 뉴스레터를 통한 충성독자층 확보, 시간대별 개인화, 특정 주제로 수렴된 브랜드 콘텐츠의 통합, 원클릭 구독 같은 UX 설계 등을 제언했다.