인공지능은 최근 몇 년간 빠른 발전을 이루며 주목받고 있다. 사실 인공지능이라는 개념은 과거부터 존재했지만, 이제는 일상 생활에서 이 단어를 접할 수 있을 정도로 흔한 개념이 됐다. 특히 몇 년 전, 지금까지 인공지능이 넘지 못했던 '바둑' 종목에서 알파고가 인간에게 승리하면서 인공지능에 대한 기대 역시 커져가고 있다.
최근 인공지능은 우리 일상에서 사용할 정도로 익숙한 용어가 됐다(출처=IT동아)
인공지능이란 인간 지능의 본질을 규명하고, 이를 인공적으로 재현하는 기술이라고 정의할 수 있다. 구현 방법은 다양하지만, 결과적으로는 인간의 인지능력, 학습능력, 추론능력 등을 구현하는 것이 목표다. 이미 인공지능은 자동 번역이나 사진 인식 등 일반적인 영역은 물론, 의학, 금융 등 전문 지식을 학습해 전문가와 비슷한 수준의 자문까지 할 수 있게 됐다.
이러한 동향은 사이버 보안도 변화시키고 있다. KISA 정보보호R&D기술공유센터 강필용 센터장은 "최근 인터넷에 연결할 수 있는 기기가 늘어나면서 보안의 영역도 넓어졌으며, 이에 따라 전통적인 보안으로는 대응하는 데 한계가 생길 수밖에 없다. 지난해 새롭게 발견된 변종 악성코드는 약 7억 건에 이르며, 전문가가 일일이 이러한 상황에 대응하기는 어려운 상황이다"고 말했다.
하루 동안 발생한 사이버 보안 위협(출처=KISA)
방대한 데이터 학습 및 빠른 신규 데이터 분석을 통해 비정상/악성 행위를 탐지하고 공격을 저지하는 것은 물론, 운영체계 및 소프트웨어의 취약점을 스스로 발견하고 제거하며, 주요 보안 포인트에 대한 반복 점검을 자동으로 할 수 있다.
이러한 인공지능 기반 사이버 보안은 기존의 보안 관련 기업뿐만 아니라 구글, 아마존, 마이크로소프트 등 클라우드 등 인프라 기업을 중심으로도 활발한 연구가 이뤄지고 있다. 인공지능 연구 및 성능 강화에 있어서 가장 중요한 것은 학습이다. 인공지능이 양질의 데이터를 통해 학습해야 정확한 성능을 낼 수 있기 때문이다. 예를 들어 과거 MS의 인공지능 테이의 경우 일부 네티즌이 접근해 인종차별 발언이나 혐오발언 등을 가르쳤고, 이 때문에 테이 역시 이러한 성향의 발언을 하게 됐다. 이처럼 데이터는 인공지능의 학습에 가장 중요한 요소다.
인공지능 연구에 있어서, 인공지능이 학습하는데 사용하는 데이터의 중요성이 크다(출처=IT동아)
글로벌 대기업의 경우 자사의 서비스를 통해 발상하는 데이터만으로도 인공지능 학습에 필요한 데이터를 충분히 얻을 수 있다. 이들이 자신의 '데이터 셋'을 일부 공개하는 경우도 있지만, 이 데이터셋을 기반으로 서비스를 개발할 경우 결국에는 이들의 서비스에 종속되는 결과를 낳는다. KISA는 국내 기업의 경우 상대적으로 영세한 경우가 많은 만큼 양질의 데이터를 확보하기 어려우며 특히 보안과 관련해서는 악성코드 샘플보다 정상코드 샘플 확보에 더 어려움을 겪고 있다고 설명했다.
사이버 보안 영역에 있어서도 악성코드 데이터와 정상코드 데이터를 충분히 확보하고 학습시켜야 수준 높은 인공지능을 개발할 수 있다(출처=KISA)
강필용 센터장은 "이 때문에 KISA에서는 데이터를 확보하고, 인공지능을 기반으로 모바일 결제사기 통합 대응 기술, 행위 기반 유사/변종 악성코드 분류 기술, 자가학습형 사이버 면역기술 등을 개발하고 있으며, 이러한 성과를 민간에 공급하고 있다"고 말했다.
하지만 인공지능이 보안 전문가의 자리를 완전히 대체할 수는 없다는 것이 현재 시각이다. 가령 앞서 언급한 테이의 경우 혐오발언을 했지만, 그 발언이 사회적으로 어떤 의미를 가지고 있는지에 대한 가치판단은 현재로서는 할 수 없다. 이와 마찬가지로 사이버 보안 영역의 인공지능 역시 복잡하고 양이 많은 데이터를 분류/분석하는 속도는 인간보다 빠르지만, 스스로 가치를 판단해 행동하는 것은 아니라는 의미다.
동아닷컴 IT전문 이상우 기자 lswoo@donga.com