‘마법’을 공부하기 시작했습니다_MBC 김혜성 기자

가이드8-김혜성01

 

 

가이드8-김혜성02

 

 

‘빅 데이터Big Data의 시대’가 열렸다고 합니다. 빅 데이터를 어떻게 활용하느냐가 중요한 경쟁력이 된다는 이야기는 이제는 식상하리만치 익숙해진 느낌이지만, 정작 나 스스로 그러한 환경 속에서 어떤 위치를 점하고 있는지에 대해선 이상하리만치 무감각했습니다. 벌써 몇 년 전, 아마존Amazon 사이트에서 내가 클릭한 물건의 아래쪽에 ‘위 제품을 구매한 사람들이 구매한 다른 제품들’이 좌우 스크롤 형태로 끝없이 늘어선 걸 보며 신기해하던 기억. 그걸 따라 클릭하면 꼬리를 물고 소개되는 새로운 (그러면서도 내 관심 범위를 벗어나지 않는) 물건들의 홍수 속에서 몇 시간씩 허우적대던 기억. 그게 다 빅 데이터를 기반으로 한 CRM(Customer Relationship Management: 고객관계 관리)이 짜놓은 것이었다는 사실은 한참 뒤에 알았습니다.

그날
빅 데이터에 대한 이 정도의 체험을 갖고, 지난 5월 15일 방송기자연합회에서 <저널리즘 아카데미 탐사보도 과정> 강의를 들었습니다. 강의는 빅 데이터를 보도에 활용하는 방법론, 즉 CAR(Computer-Assisted Reporting)에 초점이 맞춰졌습니다. 1차 충격은 KBS 김태형 기자의 <CAR의 시작, 구글링> 강의를 통해서였습니다. 미국 탐사보도협회IRE: Investigative Reporters and Editors의 구글Google 검색 특강 내용을 간단명료하게 정리했는데, site별 검색, filetype검색, image검색 기능 등을 차근차근 배우고 익힐 수 있었습니다. 10년 넘도록 아이템을 찾고 기사 쓸 때마다 해 온 구글 검색에도 쉽고 빠른 지름길이 있다는 사실은 부끄럽게도 처음 알았습니다. 역시 아는 게 힘! 불과 며칠 뒤, 북한의 식량 상황을 분석한 보고서를 수출입은행 사이트에서 ‘구글 사이트 검색’ 기능을 통해 찾아내 리포트에 반영할 수 있었습니다.

권혜진 데이터 저널리즘 연구소장의 <진화하는 CAR, 데이터 저널리즘과 엑셀을 이용한 자료관리> 강의는 2차 충격. 먼저, 국정원 댓글 사건에 관련된 트위터 계정 수백 개의 트윗 수십만 건을 분석했던 뉴스타파의 취재 과정을 들었습니다. 또, 로 데이터raw data(선관위의 정당, 후원회 수입 지출내역)에서 내가 원하는 항목으로 정리된 자료를 엑셀을 통해 뽑아내는 방법을 실제로 연습해 봤습니다. 항목을 어떻게 정하고 어떤 기능을 사용하느냐에 따라 모금액 순위, 정당별, 후원자별, 지역별 등 원하는 항목별로 정렬되고 합산, 비율까지 순식간에 정리되는 자료를 보니 신기할 따름. 유난히 MBC 기자들이 많았던 수업에선 서로 노트북을 흘끔거리며 “이렇게 하는 거 맞아?”, “어떻게 한 거야?”라며 시끌시끌했습니다.


수업을 끝내고 모인 MBC 기자들은 이구동성, “엑셀이 아니라 마법이다!”, “이대로는 안 되겠다. 공부하자!”라며 의기투합, 스터디 모임을 조직했습니다. 아직 볼만한 자료를 공유하는 정도지만 조만간 본격적인 공부를 시작할 계획입니다. 모임의 타이틀이 뭐냐고요? 바로 ‘빅 데이터의 시대’입니다.