인공지능으로 단백질 구조 학습… 생물학의 새 시대 연 ‘알파폴드’

  • 동아일보
  • 입력 2022년 4월 22일 03시 00분


코멘트

소스코드 공개로 연구활동 ‘새바람’

알파폴드가 해독한 여러 단백질의 3차원(3D) 구조. 다양한 단백질 구조를 통해 생명 현상에 관여하는 단백질의 기능이 구현된다. 딥마인드 제공
알파폴드가 해독한 여러 단백질의 3차원(3D) 구조. 다양한 단백질 구조를 통해 생명 현상에 관여하는 단백질의 기능이 구현된다. 딥마인드 제공
구글의 인공지능(AI) 자회사 딥마인드는 2018년 ‘알파폴드’라는 AI 기반 단백질 구조 예측도구를 공개했다. 알파폴드는 기존에 습득한 데이터를 통해 단백질 구조를 파악한다. 2020년 12월 단백질 구조 예측 학술대회(CASP)에서 우승하며 과학계의 이목을 끈 이후 최근 들어 각종 생명과학 연구에 활력을 주고 있다.

1000여 개 단백질이 30개 이상의 구조로 이뤄진 ‘뉴클레오포린’ 단백질 구조를 밝히는 데에도 혁혁한 공을 세웠다. 지난해 7월 딥마인드가 알파폴드의 소스코드를 공개하자 마르틴 베크 독일 막스플랑크 생물물리학연구소장 연구팀은 이를 활용해 지난 10년에 걸쳐 했던 연구량을 단 3개월 만에 해낼 수 있었다.

○ 생물학 연구 판도 바꾼 ‘알파폴드’

단백질은 모든 생명현상에 관여하는 생체 분자로 수백 개에서 수천 개의 아미노산 결합 구조에 따라 다양한 특성과 기능을 갖는다. 20여 종의 아미노산이 복잡한 사슬 구조로 연결된 단백질은 사슬 구조가 꼬이고 얽히며 접히면서 3차원(3D) 입체 구조를 형성한다. 단백질 구조를 빠르게 알아낼 수 있다면 인류가 아직 확인하지 못한 생명현상은 물론 새로운 화합물의 약물로서의 효능을 밝혀낼 수 있다.

과학자들은 지금까지 X선이나 극저온 전자현미경 등 장비를 활용해 10만여 종의 단백질 구조를 해독했지만 수십억 종에 달하는 단백질 중 극히 일부에 불과하다. 컴퓨터 모델을 이용해 3D 구조를 파악하는 연구도 이뤄졌지만 정확도와 신뢰도가 신통치 않았다. 하지만 알파폴드는 기존 실험을 통해 확인된 수십만 개의 단백질 구조와 아미노산 서열을 학습한 뒤 미지의 단백질이 주어지면 ‘똑똑하게’ 구조를 해독·예측한다.

딥마인드는 올해 총 1억 개 이상의 단백질 구조 해독 결과를 추가로 공개할 계획이다. 4월 기준 40만 명의 연구자가 알파폴드의 데이터베이스를 활용한 다양한 연구를 이어가며 생물학 연구의 판도를 바꾸고 있다.

토마스 보에센 덴마크 오르후스대 구조생물학 교수는 구름 속 얼음 형성을 촉진하는 박테리아의 단백질 구조를 모델링하는 데 알파폴드를 활용하고 있다. 크리스틴 오렝고 영국 유니버시티칼리지런던(UCL) 컴퓨터생물학 교수는 알파폴드를 이용해 플라스틱을 먹어 치우는 새로운 효소를 식별하기 위한 연구를 진행 중이다. 수천 개의 단백질 구조를 빠르게 추려내고 플라스틱을 분해하는 효소가 어떻게 진화했는지, 또 분해 능력을 높이기 위한 방안은 무엇인지 찾는 연구다.

보통 진화생물학은 유전자 염기서열을 비교해 특정 종의 친척과 진화 방향을 확인한다. 유전체 차이가 크면 연구 대상에서 제외된다. 하지만 유전체보다 느리게 변화하는 단백질 구조를 비교하면 확인하기 어려운 진화적 관계를 복원할 수 있다. 페드로 벨트라오 스위스 취리히연방공과대 컴퓨터생물학자 교수는 “알파폴드는 단백질의 진화와 생명의 기원을 연구할 수 있는 놀라운 기회를 열어주고 있다”고 말했다.

○ 돌연변이 단백질 해독은 어려워… 아직 한계도

알파폴드의 한계도 분명히 있다는 지적이 나온다. 단백질 구조 해독과 예측에 제 역할을 하기 어려운 분야가 있다는 것이다. 예를 들어 암 발생 초기에 단백질의 구조를 파괴하는 다양한 돌연변이를 해독하기는 쉽지 않다.

딥마인드는 알파폴드가 새로운 돌연변이 단백질을 해독하고 예측할 수 있도록 설계를 변경하는 방안을 연구 중이다. 단백질의 3차원 구조에서 어떻게 아미노산이 접히고 바뀌는지를 더 잘 예측할 수 있는 방안을 찾고 있다. 차세대 신경망을 개발하는 도전이 필요하다는 분석이다. 과학자들은 알파폴드가 가져온 생물학 연구 혁명을 통해 개별 단백질과 복합체뿐만 아니라 전체 세포 소기관 또는 세포를 개별 단백질 분자 수준까지 모델링할 수 있을 것으로 기대하고 있다. 마르틴 베크 소장은 “알파폴드는 게임 체인저가 되고 있다”며 “생물학은 알파폴드가 소스코드를 공개한 2021년 7월 이전과 이후로 나뉠 것”이라고 말했다.


김민수 동아사이언스 기자 reborn@donga.com
#인공지능#단백질 구조 학습#알파폴드
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스