뉴스 트렌드 생활정보 International edition 매체

“유전자 연구 미래는 빅데이터 처리능력에 달려”

입력 | 2015-05-25 03:00:00

‘맵알테크놀로지스’ 앨런 데이 박사




“앞으로 생명과학 분야에서 빅데이터 처리가 더욱 중요한 문제가 될 것입니다. 유전자 분석을 통해 나오는 자료는 모두 빅데이터죠.”

다국적 빅데이터 전문기업 ‘맵알테크놀로지스’의 수석 데이터 과학자 앨런 데이 박사(37·사진)를 21일 서울 강남구 삼성동 아셈타워에서 만났다. 맵알은 지난해 7월 구글 캐피털 등으로부터 1억1000만 달러(약 1200억 원) 투자를 유치하면서 빅데이터 업계에서 가장 ‘핫’한 기업으로 떠올랐다. 빅데이터 분석시장의 90% 이상을 점유하고 있는 ‘하둡(HADOOP)’이란 플랫폼 활용 분야에서 세계 3대 기업으로 꼽힌다. 현재 우리나라를 포함한 11개국에 700개 이상이 맵알 서비스를 이용한다.

데이 박사는 바이오전문 연구기관이나 기업들이 수년 내 큰 난관에 봉착할 확률이 높다고 밝혔다. 그는 “2000년 닷컴기업 버블(거품)이 꺼지며 많은 정보기술(IT) 기업이 쇠락했다”며 “그 이유 중 하나는 기하급수적으로 증가한 데이터를 효율적으로 소화하지 못하면서 늘어난 처리비용을 견디지 못했기 때문”이라고 지적했다.

그는 이런 부담이 곧 세계 각국의 유전자 연구기업에도 찾아올 것으로 내다봤다. 최근 유전자 분석 기술의 급격한 발달로 처음엔 13년 이상 걸렸던 개인 유전자 분석을 며칠 이내에 끝낼 수 있게 됐다. 한 사람의 유전정보는 최종적으로 3MB(메가바이트) 정도지만 분석 과정에서 훨씬 많은 정보량과 고성능 처리 능력이 필요하다. 개인 1명의 유전정보는 3MB에 불과하지만 우리나라 국민 전체라면 이를 합한 150TB(테라바이트)의 정보를 소화할 수 있는 시스템이 필요하다. 생명과학 분야 연구의 미래는 빅데이터 처리 시스템을 얼마나 잘 갖췄느냐에 달려 있다는 의미다.

데이 박사는 이 문제에 대한 해결책으로 ‘아웃소싱’을 권장했다. 시스템 확보를 서두르는 등 대응은 필요하지만, 이 문제를 독자적으로 전담할 경우 처리비용의 급증이 바이오 기업 및 연구기관 등에 큰 부담이 될 수 있기 때문이다. 그는 “전문 빅데이터 기업의 역량을 활용하면 최소 10%까지 처리비용을 낮출 수 있을 것“이라고 말했다.

이우상 동아사이언스 기자 idol@donga.com