제133회 기획보도부문_고교생 논문 저자 어떻게 만들어지나_MBC 장슬기 기자

데이터 기반 탐사보도: 고등학생 논문저자 추적기
 
시작은 3개월 전이었습니다. 고등학생 논문저자에 대한 교육부의 조사가 2017년 12월 이후 네차례나 이어지고 있었지만 발표 때마다 고등학생 논문 저자의 숫자는 늘어났고, ‘여전히 부실하다’는 지적이 계속됐습니다. 탐사기획팀은 고등학생 논문저자에 대한 종합적인 접근을 위해 국내 최대 학술정보포털인 디비피아(DBpia)의 저자 정보 페이지를 수집하기 시작했습니다. 9백만 페이지에 걸쳐 있는 약 1백만명의 저자정보를 python을 통해 크롤링(수집)하는데만 두 달 가까이 걸렸습니다.  데이터를 모으던 중 조국 후보자 자녀 논문 관련 논란이 불거졌습니다. 시의성을 확보하기 위해 데이터 수집 속도를 올리고 데이터 정리와 취재를 동시에 진행해 9월 첫 예고보도를 시작으로, 10월에 연속보도 했습니다. 
데이터 수집을 통해 저자 중 한명이라도 소속이 고등학교로 된 논문과 발표자료 6백건을 추렸습니다. 고등학교 소속으로 되어 있다고 하더라도 꼭 고등학생은 아닐 수 있기에 모두 출력해 학생이 쓴 논문을 확인해 최종적으로 고등학생 논문 4백여건을 확보할 수 있었습니다. 이 4백여건의 논문과 학술발표자료가 취재의 토대가 되어 고교생 논문저자가 만들어지는 과정에 대한 입체적인 보도가 가능했습니다. 이 가운데 19편은 교육부가 미처 파악하고 있지 못한 논문으로 MBC 탐사기획팀 취재를 통해 밝혀져 교육부에서 추가조사를 각 대학에 지시하기도 했습니다.
 
“내 자식이지만 너무 뛰어나”
이 데이터에 기반해 확인해보니 2000년대 우리나라 학계에 갑자기 고등학생 논문 저자들이 등장하기 시작합니다. 대학 입시에 논문이 활용되기 시작한 입시 제도의 변화 과정과 일치합니다. 석 달에 걸쳐 약 100개의 대학과 100명의 교수/연구자들을 직접 연락하고 만나 고등학생 논문저자가 탄생한 배경을 확인할 수 있었습니다. 상당수는 교수인 부모가, 아니면 부모의 혈연, 학연, 지연이 도와줬고, 이마저도 아니면 입시 학원이 끼어들어 도와준 결과였습니다. 하나같이 공저자인 고등학생이 영어도 잘하고 똑똑했고, 규정을 어긴 바가 없다고 항변했습니다. 취재 시점을 고려하면 이해가 되지 않는 반응들이었습니다. 평범한 학생들은 쉽게 접근할 수 없는 그들만의 리그에서 은밀하게 학벌 대물림이 뤄지고 있는 건 아닌지 씁쓸할 수밖에 없습니다.
 
추가제보 통해 후속보도…가짜학회 이용하기도해
보도 이후 약 800건의 고등학생 논문저자가 있다며 제보가 들어왔고, 추가 취재를 통해 이 중 29건 이상이 기존 교육부 조사에서 누락됐음을 확인했습니다. 이 중 7편 이상이 부모 교수가 자녀와 함께 쓴 경우였습니다. 7편을 포함한 29편의 논문과 발표자료에 대해서도 각 대학에서 연구진실성위원회가 열릴 예정입니다. 뿐만 아니라 가짜학회까지 이용하는 고등학생 논문저자들을 찾아 실태를 고발하는 후속 보도를 이어갔습니다.
모든 논문에 등장하는 고등학생들이 자격이 없다는 건 아닙니다. 다만 박사를 졸업하더라도 제대로 구색을 갖춘 논문 한 편을 쓰기 어렵습니다. 그만큼 논문을 쓰는 것의 무게가 무겁습니다. 저희가 찾은 400여편의 논문에 1200여명 고등학생 저자와 이 논문에 함께 이름을 올린 수 많은 연구자가 연구물에 대해서 얼마나 책임감을 가졌는지는 어렴풋이 짐작만 할 수 있었을 뿐입니다.