[인터뷰] “데이터 저널리즘, 쉬운 것부터 시작하세요”

일시_ 2015년 12월 15일    장소_ 서울 여의도   인터뷰_ KBS 정수영 기자(네트워크부)

하나의 유령이 언론계 안팎을 떠돌고 있다. 데이터 저널리즘이라는 유령이. 기자라면 다들 한 번쯤 궁금했을 법한 ‘무림 비기’武林 祕器, 데이터 저널리즘을 전담하고 있는 사람이 KBS에 있다. 올해 입사 22년 차를 맞은 김태형 기자가 그 주인공이다. ‘메르스 감염 경로 추적’, ‘보행자 교통사고 지도’ 등 돋보이는 데이터 저널리즘 결과물을 내놓을 수 있었던 비결을 들어봤다.

엑셀 파일을 돌려야 나오는 저널리즘

데이터 저널리즘을 활용해 보고는 싶지만, 생소하게 여기는 기자들이 많습니다. 데이터 저널리즘을 쉽게 설명해 주신다면요?
“말 그대로 데이터를 활용한, 데이터가 강조된 저널리즘이라고 할 수 있는데요. 간단한 사건 사고 기사부터 시작해서 데이터가 들어가지 않는 기사는 찾아보기 어렵죠. 언론 기사에서 흔히 얘기하는 ‘5W1H’ 자체가 사실 데이터거든요. ‘누가, 언제, 어디서, 무엇을, 어떻게, 왜’ 중에 ‘왜’를 빼고 나머지 5개가 다 엑셀 파일에 들어가는 정보라고 볼 수 있습니다. 쉽게 생각하면 엑셀 파일을 돌려야 찾고자 하는 답을 끄집어낼 수 있는 그 정도의 데이터를 다루는 기사가 데이터 저널리즘이라고 할 수 있겠죠.”

데이터 저널리즘을 활용해서 좋은 결과를 낸 아이템을 소개해 주시죠.
“전국의 초등학교 이름만 입력하면 반경 300m 이내 보행자 교통사고가 언제, 어디서, 어떻게 일어났는지 확인할 수 있도록 한 디지털 기사를 냈습니다. 그 과정에서 스쿨존에서 보행자 사고 대부분이 일어나는데 실제로는 스쿨존이 법 규정보다 협소하게 지정된 경우가 대부분이라는 걸 밝혀낼 수 있었죠. 또 운전면허 취득 과정에서 야간 운전에 관한 교육 과정은 없는데 실제로는 초보 운전자들이 밤에 사고를 많이 내더라는 사실도 보도했습니다. 특수 활동비가 국회에서 논란이 되기 몇 달 전에 청와대와 국회, 주요 정부부처 특수 활동비를 분석해 기사화한 적도 있었죠. 데이터 저널리즘이 아니면 소화하기 힘들었던 자료들이 아닐까 싶습니다.”

데이터 저널리즘은 정보공개청구가 중요

데이터를 분석하고 이해하기 쉽게 시각화하는 일도 중요합니다. 하지만 기자 입장에서는 어떤 자료를, 어떻게 입수할지에 대한 고민이 가장 크기 마련인데요. 경험을 토대로 조언해 주세요.
“데이터 분석, 시각화, 그리고 데이터 수집이 따로 떨어져 있는 것 같진 않고요. 데이터를 분석할 수 있는 능력이 있고, 시각화할 수 있는 능력이 있으면 데이터 수집의 폭이 넓어지는 것 같아요. 예를 들어 보행자 교통사고 지도도 자료를 엑셀 파일로 받은 건데, 이걸 분석할 수 있는 능력이 없으면 눈앞에 있어도 여기서 기삿거리가 나온다고 생각하기가 힘들죠. 데이터 수집은 정보공개청구 제도를 많이 이용할 수밖에 없고요. 그러다 보니까 취재하는 데 시간이 오래 걸리고, 품이 많이 들어갑니다.”

정보공개청구가 데이터 저널리즘에 중요한 부분이라는 점, 주목할 만한 부분인 것 같은데요. 효율적인 정보공개청구 노하우를 알려주세요.
“제일 좋은 방법 가운데 하나는 관련법을 찾아보는 것입니다. 단순히 법만 찾아보는 게 아니라 시행령, 시행규칙을 찾다보면 어떻게 기록해야 하는가에 대한 내용이 나와 있는 경우도 많거든요. 예를 들면 저희가 대기 오염 측정소 문제를 몇 차례에 걸쳐 기사를 썼는데요. 정보공개청구를 하기 전, 대기오염을 측정할 때 기록하는 양식을 먼저 찾아봤습니다. 그 양식에는 어떤 정보를 기록하게 돼 있다고 나와 있었죠. 그래서 ‘이러이러한 법규에 따르면 어떻게 기록하게 돼 있는데 그 기록을 청구한다’ 이렇게 했어요. 그러면 정부 쪽에서도 그걸 비공개하거나 모른 척하게 되는 게 힘들어지는 거죠. 법에 근거해서 청구하게 되니까.”

일단 데이터를 손에 넣은 뒤 자료를 분석하고 시각화하는 데는 어떤 도구를 사용하셨나요?
“아무래도 제일 많이 쓰는 건 엑셀이고 그래프 같은 것을 인터랙티브 방식으로 구현할 수 있고요. 지리정보 GIS의 경우 구글의 퓨전 테이블을 사용했습니다. 데이터 저널리즘이 컴퓨터가 바탕이 되기 때문에 소프트웨어적 측면이 있어서 해보면 해볼수록 좋아집니다. 예컨대 지도로 그래프를 한번 만들어보면 3개월이나 6개월 후에는 지난번 만들었던 것 위에다가 새로 얹어볼 수 있거든요. 쉬운 것부터 시작하면서 계속 반복하다 보면 기술이 계속 쌓이는 거죠.”

데이터 저널리즘을 원한다면 엑셀과 친해져라

데이터 저널리즘을 처음 활용해 보려는 기자들에게 조언해주실 점이 있다면요?
“엑셀 공부를 먼저 하라고 말씀드리고 싶고요. 관심 있는 취재 분야에서 관련 엑셀 파일을 찾아서 일단 짧은 기사부터 조금씩 써보는 게 제일 좋은 방법이 아닐까 생각이 들어요. 엑셀을 전혀 써보지 않은 사람들은 엑셀을 안 쓰는 데서 오는 불편함이 전혀 없거든요. 엑셀을 계속 사용하던 사람한테서 빼앗으면 되게 불편해할 텐데 말이죠. 엑셀을 어렵게 생각하지 말고, 사칙연산부터 시작하다보면 되게 편하다는 걸 느끼게 돼요. 엑셀이 탄탄하면 다른 도구들은 쉽게 익힐 수 있으니까 엑셀부터 시작하는 게 좋을 것 같습니다.”

앞으로 해보고자 하는 데이터 저널리즘 아이템이 있다면요?
“사람들이 ‘헬조선’이라고 얘기를 많이 하잖아요. 데이터로 진짜 분석해보고 싶어요. 대한민국이 어떤 나라인지 객관적으로 바라볼 수 있는 거죠. 저널리즘 세계에서 빅데이터인가 스몰데이터인가는 큰 의미가 없거든요. 아무리 작은 데이터라고 할지라도 거기에 중요하고 값어치 있는 정보가 들어있으면 그건 사실 엄청나게 큰 데이터라고도 볼 수 있는 거죠. 넓게 찾아보고 분석해서 한국 사회가 지금 어떤 모습인가, 어디로 가고 있는가 이런 것을 데이터로 보여줄 수 있는 걸 해 보고 싶고요. 데이터 저널리즘의 절반은 거의 탐사보도라고 생각합니다. 데이터 저널리즘팀이 조금 더 보강되면 탐사보도 쪽의 일을, 또 제가 꼭 아니더라도 탐사보도와 관련된 일을 많이 해야 하지 않을까 생각합니다.”