"기자들이여, 숫자와 데이터를 이해하라"

[스페셜리스트 | IT·뉴미디어] 김익현 지디넷코리아 미디어연구소장·언론학 박사

‘AP 스타일북’은 AP통신 뿐 아니라 미국 언론들의 기사쓰기 교본으로 통한다. 1953년 첫 발간된 ‘AP 스타일북’엔 맞춤법을 비롯해 기사 쓸 때 참고할 각종 사항들이 빼곡하게 담겨 있다. AP는 매년 스타일북을 업데이트하면서 변화된 상황을 반영하고 있다. 지난해엔 “인터넷을 더 이상 대문자로 쓰지 않겠다”고 선언해 관심을 모았다. “인터넷도 전기나 전화기처럼 일반적인 명칭이 됐다”는 게 그 이유였다. 이후 뉴욕타임스를 비롯한 많은 언론들도 ‘인터넷’이란 단어를 소문자로 쓰기 시작했다.


그런데 올해는 더 흥미로운 내용이 추가됐다. 최근 발간된 ‘AP 스타일북’ 2017년 판에 데이터 저널리즘이 별도 챕터로 포함됐다. 왜 데이터 저널리즘 챕터를 추가했을까? 이유는 명확했다. 정부기관, 기업을 비롯한 많은 기관들이 데이터나 통계 형태로 소통하기 때문이다. 그러니 취재 기자들 역시 그들이 사용하는 언어, 즉 데이터나 통계에 능통할 필요가 있다는 게 AP의 설명이다.


미국 저널리즘 연구기관인 니먼랩이 ‘AP 스타일북’에 추가된 데이터 저널리즘 관련 내용 몇 가지를 소개했다. 그런데 그 내용들이 자못 흥미롭다. AP는 우선 데이터 자료를 받을 땐 ‘전자형태’로 받도록 권고하고 있다. 그래야만 엑셀을 비롯한 각종 소프트웨어를 활용해 데이터를 분석할 수 있기 때문이다. 종이로 된 자료를 스캔해서 활용하다보면 분석 작업하는 데 애로 사항이 적지 않다는 친절한 설명까지 곁들였다.


디지털 데이터가 있는 사이트를 ‘긁어서(scrape)’ 자료를 수집하는 건 가급적 삼가라는 권고도 있다. 가능하면 직접 요청을 해서 원자료를 받도록 하란 얘기다. 잘못 긁을 경우 해당 사이트가 악성 공격으로 오인할 수도 있다는 충고도 함께 담았다.


분석 결과의 투명성 확보를 위한 조치들도 함께 제시했다. 입수한 데이터를 토대로 한 분석 결과는 다시 확인해보라고 권고했다. 기사화하기 전에 같은 결과가 나오는지 한번 더 체크해보라는 얘기다. 이와 함께 가능하면 독자들이 분석에 사용한 데이터를 내려받을 수 있도록 해 주라는 권고도 있다. 이 두 가지는 학자들의 연구 논문에서도 강조하는 내용이다. 자신이 어떤 데이터를 사용해 그런 결과가 나왔는지 공개함으로써 다른 사람들도 그 실험을 재현할 수 있도록 하는 건 학계에서도 늘 권장하는 부분이다.


우리는 흔히 데이터 저널리즘이라고 하면 거창한 자료를 기반으로 한 엄청난 분석을 떠올린다. 그래서 웬만한 언론사나 기자들은 섣불리 엄두를 내기 힘들다고 생각하기 쉽다. 물론 데이터 저널리즘 프로젝트는 대부분 대형 탐사보도인 경우가 많다. 데이터를 기반으로 한 탐사보도는 저널리즘의 소중한 자산인 건 분명하다.


하지만 데이터 저널리즘엔 거창한 프로젝트만 있는 게 아니다. 기자들이 일상적으로 접하는 수많은 자료들 속에 포함돼 있는 각종 통계나 수치들 역시 중요한 데이터 저널리즘의 소재가 될 수 있다. 기업들이 매분기 발표하는 실적 자료들도 잘 모아놓으면 훌륭한 분석 자료로 활용할 수 있다.


바야흐로 ‘데이터의 시대’다. 이런 시대를 살아가는 기자들에게 ‘데이터 리터러시’는 글을 쓰는 능력만큼이나 중요한 덕목이다. 숫자와 데이터를 읽고 분석하는 방법 정도는 알고 있어야 한단 얘기다. 출입처들이 ‘숫자’와 ‘데이터’를 일상적으로 활용하는 상황에서, 기자들이 관련 지식을 갖추는 건 기본 요건이나 다름없기 때문이다. 그래서일까? AP가 ‘스타일북’에 데이터 저널리즘 관련 내용을 포함시킨 게 예사롭지 않아 보인다.

맨 위로