질병유전자 쉽게 찾아내… 신약개발 비용 절감

동아일보
입력 2018년 3월 27일 03시 00분

코멘트: 개

좋아요: 개

코멘트: 개

UNIST, 기존보다 2∼5배 효율높여

남덕우 울산과학기술원(UNIST) 생명과학부 교수팀이 빅데이터 분석 알고리즘 ‘GSA-SNP2’를 이용한 질병 유전자 예측 시뮬레이션 결과를 보고 있다. UNIST 제공

국내 연구진이 유전체 빅데이터에서 질병에 관여하는 유전자 후보군을 기존보다 2배 이상 많이 발굴해낼 수 있는 분석법을 개발했다. 신약 개발과 질병 연구에 들어가는 비용과 시간을 획기적으로 줄일 수 있을 것으로 전망된다.

울산과학기술원(UNIST)은 수학자 출신인 남덕우 생명과학부 교수 연구팀이 1만 명 미만의 적은 유전체 데이터만으로도 질병 유전자 후보군을 신속하고 정확하게 찾아낼 수 있는 통계 알고리즘 ‘GSA-SNP2’를 개발했다고 26일 밝혔다.

기존에는 통계적인 방법으로 찾아낼 수 있는 질병 유전자 후보군이 전체의 10∼40%에 불과했다. 나머지는 오랜 시간에 걸친 실험을 통해 밝힐 수밖에 없었다. 하지만 GSA-SNP2를 활용하면 특정 질병에 관여하는 유전자 후보군을 80% 가까이 밝힐 수 있는 것으로 나타났다. 남 교수는 “이 후보군에 대해 우선적으로 검증을 할 수 있기 때문에 그만큼 실험의 효율을 높일 수 있다”고 설명했다.

연구진이 이미 발병에 관여하는 유전자 군을 알고 있는 당뇨병에 대해 예측 시뮬레이션을 한 결과 GSA-SNP2는 시중 최고 성능의 ‘마그마(MAGMA)’ 알고리즘보다 당뇨병 유전자를 2배 더 많이 찾아냈다. 가장 많이 쓰이는 알고리즘인 ‘마젠타(MAGENTA)’보다는 5배 이상 많았다. 그러면서도 오답을 내놓을 확률은 마젠타, 마그마와 마찬가지로 0에 가까웠다.

또 기존에는 유의미한 질병 유전자 후보군을 가려내려면 최소 1만 명의 유전체 데이터가 필요했다. 하지만 GSA-SNP2를 활용할 경우 수천 명 단위에서도 질병 유전자 후보군을 정확하게 찾아낼 수 있는 것으로 나타났다. 분석 시간은 일반 노트북 기준 2분 남짓이다. 같은 조건에서 30분에서 열흘 이상까지 걸렸던 기존 알고리즘보다 훨씬 효율적이다. 연구 결과는 국제학술지 ‘뉴클레익 애시드 리서치’ 19일자 온라인판에 게재됐다.

송경은 동아사이언스 기자 kyungeun@donga.com

#unist #질병유전자 #빅데이터 #신약 #유전자