글 : 차미영 IBS 수리 및 계산과학 연구단 CI
AI·빅데이터 초기 탐지·확진···다방면 활용

IBS(기초과학연구원)는 코로나바이러스감염증-19(코로나19)와 코로나19의 원인인 사스-코로나바이러스-2(SARS-CoV-2 또는 2019-nCoV)에 대한 과학 지식과 최신연구 동향을 담은 <코로나19 과학 리포트>를 발행합니다. IBS 과학자들이 국내외 최신 연구동향과 과학적 이슈, 신종 바이러스 예방·진단·치료에 도움이 될 만한 연구진행 상황과 아이디어 등을 시민들과 공유하고자 합니다. <코로나19 과학 리포트 바로가기>

사상 세 번째 팬데믹이 선언됐다. 최초 코로나-19 확진자가 발생한지 100일도 채 안된 현재, 전 세계적으로 확진자는 12만 명, 사망자는 4300명을 넘어섰다. 질병의 공세 앞에 많은 이들이 맞서 싸우고 있다. 의학‧보건‧바이오 등 생명과학 분야나 행정 전문가들뿐만 아니라 여러 과학기술 분야에서 질병을 예방하고, 피해를 줄이기 위한 연구에 돌입했다. 인공지능(AI) 분야도 그중 하나다.[1] AI는 이미 코로나-19의 초기 탐지, 확진, 전파 예측의 전 과정에서 활약하고 있다.

◆ 中, AI로 폐 손상정도 진단 시작

현재 코로나-19는 실시간 유전자증폭기술(rt-PCR)을 통해 확진한다. 검체 운반‧사전 준비‧검사‧결과 전달 등의 모든 과정을 거치려면 6시간 이상 소요된다. 확진자의 경우 폐 컴퓨터단층촬영(CT)으로 질환의 진행 정도를 진단한다. 폐 CT 만으로 바이러스의 감염 여부를 확진할 수는 없지만, 전문가의 분석을 통해 15분이라는 짧은 시간에 폐 손상과 질병의 진행 정도를 파악할 수 있다.

이때 전문가의 분석을 AI가 도울 수 있다. 지난 2월 18일 중국 톈진의과대학병원 등 연구진은 폐 CT 결과를 통해 코로나-19 감염 여부를 진단해낼 수 있는 AI를 개발했다고 밝혔다. 논문은 의학 분야 학술논문 사전공개 사이트(medRxiv)에 공개됐다.[2] 연구진은 코로나-19 확진 판정을 받은 453명의 폐 CT 이미지를 인공지능에게 학습시켜 코로나바이러스-19로 인한 폐 손상의 특징을 구분하도록 했다. 연구진은 논문에서 폐에 감염을 유발할 수 있는 여러 요인들 중 코로나바이러스-19에 의한 손상만을 정확히 구분해내는 건 의료진에게도 까다로운 일이라고 설명했다. 개발된 AI는 코로나-19 감염 여부를 82.9%의 정확도로 분석할 수 있다.

중국 톈진의대 연구진은 코로나-19 다수의 확진자와 일반인의 폐 CT 이미지를 인공지능에 입력했다. 연구진은 이미지를 딥러닝하는 대표적인 알고리즘인 합성곱신경망(CNN‧Convolutional Neural Network)을 이용해 이미지를 학습했다. 우리 눈의 시신경이 가로, 세로, 전체적인 모습, 세부적인 모습을 관찰하듯 CNN은 여러 블록 구조를 통해 진단을 위한 특징을 추출하고 학습한다. 학습된 AI는 새로운 폐 CT 이미지를 보고 스스로 분석해 감염여부를 판단할 수 있다. [2] <사진=IBS 제공>
중국 톈진의대 연구진은 코로나-19 다수의 확진자와 일반인의 폐 CT 이미지를 인공지능에 입력했다. 연구진은 이미지를 딥러닝하는 대표적인 알고리즘인 합성곱신경망(CNN‧Convolutional Neural Network)을 이용해 이미지를 학습했다. 우리 눈의 시신경이 가로, 세로, 전체적인 모습, 세부적인 모습을 관찰하듯 CNN은 여러 블록 구조를 통해 진단을 위한 특징을 추출하고 학습한다. 학습된 AI는 새로운 폐 CT 이미지를 보고 스스로 분석해 감염여부를 판단할 수 있다. [2] <사진=IBS 제공>
이어 2월 27일 중국 원저우의과대학병원 등 연구진은 폐 CT와 함께 코로나-19 환자들의 공통적 증상까지 확인하는 진단AI도 제시했다.[3] 이들 연구진은 확진자 32명과 비확진자 85명의 임상적 증상(열, 기침 등)을 AI에게 학습시키고, 확진자에게만 특이적으로 발견되는 18개 증상을 구분해냈다. 연구진은 폐 CT 영상과 함께 이들 18개 지표를 종합해 결론을 내린다면, AI로 빠르고 정확한 진단이 가능할 것이라고 설명했다.

중국의 IT기업 알리바바는 실제로 폐 CT를 통한 AI 검진시스템을 지난 2일부터 실전에 도입했다. 알리바바의 AI는 폐 CT 사진을 분석하고, 20초 만에 96%의 정확도로 확진자를 분별해낼 수 있다. 이처럼 AI를 진단에 적용하면 업무의 효율을 높여줄 뿐만 아니라, 환자와의 접촉을 최소화하여 바이러스 감염으로부터 의료진을 보호할 수 있다는 장점도 있다.

◆ AI로 감염병 초기 탐지하고 전파도 예측
 

감염병 초기 탐지 및 확산 예측에도 AI가 활약한다. AI는 의학‧지리‧행정적 정보뿐만 아니라 뉴스, 소셜네크워크서비스(SNS), 항공 운항과 같은 데이터까지 종합적으로 고려해 기존의 역학조사보다 빠르게 질병의 전파를 예측할 수 있다.

실제로 캐나다의 AI 의료 플랫폼 업체 블루닷(BlueDot)은 세계보건기구(WHO) 보다 앞서 코로나-19 사태를 경고했다. 블루닷은 사스(SARS) 사태 당시 동료들이 사망하고 감염되는 것을 최전선에서 목격한 의사들이 창업한 회사다. 이들은 '제2의 사스 사태'를 방지하고자 감염병이 확산되는 경로를 집중 연구하기 시작했다. 블루닷은 지난해 12월 31일 중국 우한에서 신종 코로나바이러스가 발병한 뒤 서울, 도쿄, 홍콩, 마카오 등으로 확산될 가능성이 있다고 경고했다. WHO는 이보다 9일 늦은 1월 9일 확산을 경고했다.

블루닷은 행정 정보(인구수, 지리적 위치), 바이러스의 특징(유전자 분석, 감염 방식, 잠복기) 그리고 기존 다른 감염병의 확산 양상 등을 종합해 특정 지역에 감염병이 나타날 가능성을 분석한다. 이후 항공권 이용 정보와 같은 이동 정보까지 포함해 바이러스가 진원지를 벗어나 다른 지역으로 퍼져나갈 확률도 계산한다.

블루닷은 Geneious와 같은 상용 생물정보학 시퀀스 데이터 분석에 사용되는 소프트웨어와 RAxML이나 BEAST 등의 공개된 데이터마이닝 알고리즘을 예측에 주로 사용한다. 특히 블루닷이 애용하는 BEAST(Bayesian Evolutionary Analysis Sampling Tree)는 생물 계통 발생을 분석하는데 많이 활용되는 알고리즘이다. 이 알고리즘은 가설(예컨대, 코로나-19가 전 세계적으로 확산될 수 있다)에 추가 확보한 정보를 도입해가며 가설의 확률을 업데이트 하는 방식으로, 예측이 힘든 사건을 분석할 수 있다는 장점이 있다.

국제사회에 보고되지 않았던 대규모 발병 사건을 찾아낸 사례도 있다. 블루닷은 2016년 1월 국제학술지 '셀(Cell)'을 통해 지카바이러스가 국제적으로 확산될 것이라고 예측했다. 이후 2016년 2월 WHO는 국제적 공중보건 비상사태(PHEIC)을 선포했고, 같은 해 11월 비상사태를 해제했다. 이후에도 블루닷은 여행자의 지카바이러스 감염 사례를 꾸준히 추적 조사했고, 비상사태가 해제된 약 7개월 후 쿠바에서 다수의 지카바이러스 감염자가 발생했을 것이라는 분석을 내놨다. 확인 결과 '숨은 발병 사례'를 보고한 이 분석은 사실로 판명됐다.[5]

블루닷은 항공으로 미국 플로리다와 유럽에 입국한 지카바이러스 감염자의 출발지를 분석했다(A). 2017년 6월~12월 감염 입국자의 98% 이상이 쿠바에서 출국했다는 점을 토대로 해당 기간 쿠바에 대규모 발병이 있었을 것으로 추정했다. 또한 지카 바이러스 매개체인 이집트숲모기가 서식하기 적합하며, 쿠바에서 입국한 사람이 2만 명이 넘는 국가들을 선별해 지카바이러스 추가 발병 위험이 있다고 경고했다(B). [5] <사진=IBS 제공>
블루닷은 항공으로 미국 플로리다와 유럽에 입국한 지카바이러스 감염자의 출발지를 분석했다(A). 2017년 6월~12월 감염 입국자의 98% 이상이 쿠바에서 출국했다는 점을 토대로 해당 기간 쿠바에 대규모 발병이 있었을 것으로 추정했다. 또한 지카 바이러스 매개체인 이집트숲모기가 서식하기 적합하며, 쿠바에서 입국한 사람이 2만 명이 넘는 국가들을 선별해 지카바이러스 추가 발병 위험이 있다고 경고했다(B). [5] <사진=IBS 제공>
◆ 감염 위험 높지만 대처 능력 적은 국가 선별

AI는 코로나-19에 취약한 나라를 추론하고 이를 통해 WHO가 인력과 자원을 적재적소에 배치하도록 도움을 줄 수 있다.[4,5,6] 지난 2월 20일 프랑스 소르본대 연구팀은 아프리카 대륙의 코로나-19 발병 위험을 분석할 수 있는 모델을 개발하고, 그 분석결과를 '란셋(Lancet)'에 발표했다.

연구진은 아프리카 국가들과 중국 간 항공 운항 횟수를 토대로 바이러스가 상대적으로 빨리 유입될 것으로 예상되는 국가를 찾아냈다. 이후 국가별 보건 능력을 측정할 수 있는 지표인 SPAR(The State Party Self-Assessment Annual Reporting)와 IDVI(The Infectious Disease Vulnerability Index)를 통해 WHO의 지원이 시급한 국가를 선별했다.

연구진은 아프리카 국가를 3개 그룹으로 구분했다. 아래 그림에서 1그룹(빨간색)은 바이러스가 빨리 유입되지만 보건 능력을 갖춘 국가, 2그룹(파란색)은 감염자가 상대적으로 느리게 발생하지만 보건 능력이 부족한 국가, 3그룹(초록색)은 위험이 거의 없을 것으로 추정되는 국가다. 이들은 이 분석을 통해 의료 인프라가 취약한 2그룹 국가들의 경우 WHO의 지원이 시급하다고 의견을 냈다.

프랑스 소르본대 연구진은 코로나바이러스-19 진원지인 중국에서 아프리카로 들어오는 항공편을 토대로 빠른 시일 안에 바이러스가 유입될 위험이 있는 국가를 분석했다. ‘신혼부부 격리사건’이 발생했던 모리셔스의 경우 바이러스가 빠르게 유입될 가능성이 있지만, 자력으로 환자를 격리‧치료할 능력이 있는 국가(1그룹, 빨간색)에 해당된다. [4] <사진=IBS 제공>
프랑스 소르본대 연구진은 코로나바이러스-19 진원지인 중국에서 아프리카로 들어오는 항공편을 토대로 빠른 시일 안에 바이러스가 유입될 위험이 있는 국가를 분석했다. ‘신혼부부 격리사건’이 발생했던 모리셔스의 경우 바이러스가 빠르게 유입될 가능성이 있지만, 자력으로 환자를 격리‧치료할 능력이 있는 국가(1그룹, 빨간색)에 해당된다. [4] <사진=IBS 제공>
이 연구에서 연구진은 이집트, 남아프리카공화국, 알제리가 아프리카 국가 중 감염자가 빨리 발생할 수 있는 상위 3개국이라는 예측결과도 내놨다. 실제로 아프리카 대륙의 첫 확진자는 이집트에서 발생했다. 3월 12일 현재 이집트에서는 60명, 남아프리카공화국 7명, 알제리 20명의 확진자가 발생했다.

이밖에도 AI는 계절에 따른 코로나바이러스-19의 확산 양상을 예측하는 데도 도움이 될 수 있다.[1] 기존 코로나 바이러스(사스, 메르스)들은 겨울에 정점을 찍고, 날씨가 따뜻해지면서 약화되는 경향을 보였다. 이와 같은 데이터를 분석한다면 4월과 5월에 접어들면서 코로나-19 감염 양상이 어떻게 변화할지를 추측할 수 있다. 바이러스 확산 추이를 예측하는 것은 불안해진 경제와 사회를 안정화하는 데 기여할 것이다.

이처럼 AI와 빅데이터는 코로나-19를 초기에 탐지하고 진단하는 것은 물론 질병의 확산을 예측하고 예방하는 데도 도움을 줄 수 있다. 이번 사태뿐만 아니라 새로운 감염병의 등장에 있어서도 꾸준한 역할을 할 것이다. AI의 폭넓은 활용을 통해 인류가 바이러스와의 싸움에서 더 정확한 정보를 갖고 빠르게 승리할 수 있길 바란다.

관련기사

저작권자 © 헬로디디 무단전재 및 재배포 금지