김 단장은 “건보공단의 빅데이터는 엄청난 임팩트를 일으킬 만한 정보”라며 “박근혜 정부의 가장 성공적인 사업으로 남을 가능성이 크다”고 평가했다. 빅데이터를 국민 건강에 도움이 되게 사용하려면 데이터를 단순 공개하기보다는 전략적인 활용 방법을 고려해야 한다는 말도 덧붙였다.
건보공단은 성·연령·소득분위별 표준화를 거쳐 △국민을 대표하는 100만 명의 건강정보 표본 DB(2002∼2010년) △5차례 이상 건강검진을 받은 240만 명의 DB(2001∼2010년) △크론병 등 희귀질환자 DB 등 세 가지 DB를 구축했다. 용량은 296.5GB에 이를 정도로 방대하다.
발제자로 나선 이준영 고려대 의대 교수는 “건강보험이 건강 결과에 미치는 영향을 연구할 수 있는 기초가 구축돼 기쁘다. 그동안 접근이 어려웠던 희귀난치성 질환 분야 연구에도 토대가 마련됐다”고 평가했다.
토론자들은 건보공단 빅데이터의 다양한 활용방법을 제시했다. 박유성 고려대 통계학과 교수는 “표본 설계로 만족할 만한 신뢰도 수준의 자료가 구축됐지만 왜곡된 해석을 내릴 가능성도 높다. 공개 전에 차분한 검증 작업이 뒤따라야 한다”고 말했다. 그는 학술용과 비학술용으로 공개에 차등을 두는 방안과 자료 관리를 위한 유료화를 제안했다.
오상우 동국대 의대 교수(대한비만학회 이사)는 공개의 절차를 강조했다. 그는 “1996년 논문을 쓸 때 102명의 자료를 모으려고 밤새워 의무기록을 찾으며 6개월 동안 고생한 기억이 있다”고 DB 구축을 반가워했다. 그러나 “연구자 누구나 볼 수 있도록 하되 분석의 질을 유지하기 위한 노력이 뒤따라야 한다. 시범 사업을 거쳐 공개 범위를 정해야 한다”고 제안했다.
이철희 서울대 경제학부 교수(한국보건경제정책학회 위원)는 “전부 공개하는 것이 어렵다면 여러 버전을 만들어서라도 가급적 빨리 많은 사람에게 공개하는 것이 좋겠다. 의학에 문외한인 사람도 알도록 자세한 매뉴얼을 함께 개발해야 한다”고 말했다.
건보공단은 우선 협약을 체결한 학회에 한해 100만 명의 진료기록과 함께 건강검진 DB에서 추출한 기록(연간 5만∼6만 건)을 함께 제공할 계획이다. 개인정보는 드러나지 않도록 한다.
건보공단 관계자는 “DB를 연구용으로 우선 제공하고 내년 상반기에 일반에 공개하는 방안을 검토하고 있다”고 말했다.
댓글 0