남호정 GIST 교수, "국내 토종 생약에서 신약후보물질 추출해 질병치료 기대"
컴퓨터 이용 약물 지식베이스시스템 연구···신약개발 성공가능성 극대화

멀고도 험한 길로 비유되는 신약개발에 도전장을 던진 이들. 남호정 GIST 박사 연구팀은 약물 기전 정보를 이용해 신약 개발 시간을 단축하는 연구를 하고 있다. 힘든 연구에도 연구실에는 웃음꽃이 끊이질 않는다.<사진=박은희 기자>
멀고도 험한 길로 비유되는 신약개발에 도전장을 던진 이들. 남호정 GIST 박사 연구팀은 약물 기전 정보를 이용해 신약 개발 시간을 단축하는 연구를 하고 있다. 힘든 연구에도 연구실에는 웃음꽃이 끊이질 않는다.<사진=박은희 기자>
신약개발은 멀고도 험한 길이다. 후보물질 발굴부터 신약개발까지 짧게 걸려도 10년 이상이며, 수천억 원을 쏟아 붓고도 중간에 접어야 할 때도 있다. 1만개 이상의 후보 물질 중 1개만이 최종적으로 신약 승인을 받는다. 그만큼 위험이 큰 사업이다. 그럼에도 신약개발 성공은 '대박'을 담보하기에 차세대 동력산업으로 통한다. 
 
최근에는 신약개발의 기간과 비용을 줄이기 위해 신약 후보물질을 선발하는데 AI(인공지능)와 지식데이터를 활용한 연구가 주목 받고 있다. 수동적인 실험에 의존하던 과정을 대폭 축소함과 동시에 정확도까지 높일 수 있기 때문이다. 

유전자동의보감사업단(단장 이도헌) 남호정 GIST(광주과학기술원) 교수와 김상우 연세대학교 공동연구팀이 펼치는 '컴퓨터를 이용한 약물 지식베이스시스템 연구'가 바로 그것. 

컴퓨터와 정보통신 기술을 이용해 신약개발에 드는 천문학적 시간과 비용을 획기적으로 절감, 신약개발에 대한 최종 성공가능성을 극대화 하는 것이 연구의 목표다. 

남호정 교수는 "요즘 대중들에게 익숙한 '알파고'로 비유하자면 알파고가 얼마만큼 많은 '기보' 정보를 학습하느냐에 따라 대국승률이 달라지듯, 신약개발에서도 이러한 약물의 기초 및 기전 정보를 얼마만큼 많이 이용하느냐에 따라 효율적인 신규 약물의 개발과정이 달라질 수 있다"고 강조했다. 

◆ 축적된 약물 기전 정보 활용···컴퓨터가 족집게 역할 '톡톡'

"신약개발은 '낙타가 바늘구멍을 통과하는 것'으로 비유될 정도로 어려운 과정입니다. 오랜 시간과 엄청난 비용이 발생합니다. 하지만 축적돼 있는 약물 기전 정보를 이용하면 신약개발 시간을 효과적으로 단축할 수 있습니다."

남 교수 연구팀이 주목하는 연구는 신약개발을 위한 후보물질의 '지식베이스'를 구축하는 것이다. 기초·탐색 연구, 비임상 실험, 임상 실험 등의 단계로 이뤄진 신약개발 단계에서 정보와 컴퓨터를 활용해 기초·탐색 연구 기간을 줄이는데 기여한다. 

특히 약물 표적 및 기전 정보는 빠른 속도로 축적되고 있기 때문에 약물 표적과 기전 정보를 잘 분석해 활용하면 기존의 약물을 새로운 질병에 대한 치료제로 개발할 수 있다.

예를 들어, 해열진통제로 널리 알려진 아스피린의 경우 그 기전의 분석을 통해 항암제로도 사용될 수 있다는 연구가 나오고 있다. 실제 아스피린의 알려진 기전을 분석해 항암제로 사용이 가능하게 된다면 기존의 약물개발 방법에 비해 훨씬 적은 시간과 노력으로 새로운 항암제 약물 하나를 얻는 효과를 갖게 되는 것이다. 

남 교수는 "신약 후보 물질을 찾는 것을 시작으로 최종적으로 신약이 나오기까지 전체 기간이 15년 정도 된다. 상당 시간이 걸리는 기초·탐색 연구에서 시간을 단축할 경우 신약개발 기간을 크게 앞당길 수 있다"며 "최근 컴퓨터와 정보통신 기술의 발달이 빨라지고 있어 제약회사들도 적극적으로 나서고 있다"고 말했다.

문제는 얼마나 효율적으로 자료를 확보하는 데 있다. 단순히 약물 정보와 약물 기전을 수집하는 것은 '데이터베이스(DB)'에 불과, 신약 후보 물질로 가치를 갖는 정보만을 모은 '지식베이스'를 구축해야 한다.  

남 교수는 "약물개발의 '기보'는 바둑알을 놓는 순서와 같이 단순한 형태가 아니라 생체 및 세포 내에 작용하는 다양한 분자수준의 수많은 기작으로 구성된 정보이기에 정보의 가공과 구축 자체에 노력이 따라야 한다"고 강조했다. 

◆"시간이 갈수록 똑똑해 진다"···천연물 기반 신약개발 시간·비용 축소 목표 

남 교수가 학생의 질문에 조언하고 있다.<사진=박은희 기자>
남 교수가 학생의 질문에 조언하고 있다.<사진=박은희 기자>
연구단이 사업단에 합류한 것은 2015년. 1년 여 만에 70만4000개의 약물을 지식데이터베이스로 구축하고, 약물과 유전자와의 포함·상호작용 관계로 연결돼 있음을 알아냈다. 

이런 결과는 방대한 양의 데이터를 저장할 수 있는 데이터저장소와 데이터를 고속 처리할 수 있는 계산 서버가 있어 가능했다. 연구실에 설치된 대형 컴퓨터는 대용량 데이터 저장장치(250TB)와 300여개의 코어가 동작하는 클러스터 계산서버가 탑재돼 있다. 

남 교수는 "컴퓨터를 이용한 약물 효과 및 기전 분석의 가장 큰 장점은 하나는 약물의 수나 표적 단백질의 수를 제한할 필요가 없다는 것"이라며 "현재 분석하고 있는 약물의 수는 약물 구조나 기본 화합물 정보가 알려진 1000만개 이상의 약물을 다루고 있다"고 설명했다. 

현재 사업 참여 2년째에 불과하지만 지식베이스 자가 검증 알고리즘 및 약물표적 단백질 예측 연구성과를 거뒀다. 대규모의 약물 정보를 활용해 기계학습 모델링 기반 표적 단백질 예측 모델을 구축했다. 이후 교차검증을 통해 모델의 성능이 우수함을 확인했고, 이 모델을 이용해 당뇨, 고혈압, 천식 등에 효과가 있다고 알려진 천연물의 화합물의 표적 단백질 후보들을 예측했다. 

연구단은 예측된 단백질 후보들이 실제로 대부분 각 질병에 관련이 있음을 문헌으로 확인했으며, 예측된 화합물들이 '리핀스키의 5법칙(Lipinski's rule of five test)'을 통한 높은 약물 유사도를 갖고 있음도 확인했다. 

그는 "이 연구를 통해 단백질과 화합물의 반응을 예측할 수 있는 모델을 구축했고 표적 단백질 예측 모델의 성능이 좋다는 것도 확인했다"며 "연구결과는 그 중요성을 인정받아 관련분야 국제저널에 게재 예정"이라고 말했다. 

◆ 신약개발, 인류 위해 인류가 풀어야 과제···제약회사와 공동연구 추진

연구단이 만든 지식베이스는 실제 사업단의 가상인체모델 시스템에 연결돼 사용되고 있다. 연구단의 책임이 클 수밖에 없는 이유다. 올바른 데이터를 제시해야 보다 정확한 결과를 얻을 수 있기 때문이다. 

남 교수는 "사람이 제공한 데이터를 컴퓨터가 처리하면 그 결과를 사람이 다시 검토한다. 처음에 제공하는 데이터가 중요한데, 생각보다 잘못된 오류나 거짓된 정보가 많다"고 토로했다. 

또 약물 뿐만 아니라 생명현상, 컴퓨터이론까지 다양한 분야의 깊이 있는 연구내용이 응용돼 사용되는 만큼 깊이 있는 연구를 해야 한다. 

그는 "컴퓨터를 이용한 약물 개발은 유럽, 미국 등 주요 제약회사들에서 먼저 흥미를 느끼고 연구를 수행했다"며 "최근 들어서는 약물의 주요 속성으로 알려진 약의 흡수, 분포, 대사, 배출 외에 약물 상호작용, 표적 단백질 및 표적 분자경로 예측 등 연구수준이 확대되고 있다"고 밝혔다. 

깊고 넓은 연구 범위로 어려움도 있지만 그만큼 기대도 크다는 남 교수는 "약효가 있다고 알려진 천연물 화합물의 경우라도 그 작용기전이 밝혀진 경우가 많지 않아 천연물 기반의 약물을 개발하는 과정에서 많은 어려움이 있지만 만약 천연물 화합물의 표적 단백질 후보를 예측할 수 있다면 천연물 기반 치료제 개발에 큰 도움을 줄 수 있을 것"이라고 말했다. 

그는 인터뷰 말미 연구팀의 계획과 함께 개인적인 포부도 밝혔다. "연구를 통해 도출된 가능성 높은 신약후보 물질은 추후 제약회사들과 공동연구로 이어갈 계획입니다. 궁극적으로 국내 토종 생약으로부터 추출된 신약후보물질을 도출해 질병치료와 국가경쟁력 고조에 이바지 하고 싶습니다. 은퇴하기 전에 질병치료를 위한 신약을 꼭 만들어 보고 싶습니다. 신약개발은 인류를 돕기 위한 인류가 꼭 풀어야하는 과제니까요."

남 교수는 수시로 학생들과 연구 방향과 결과 등에 대해 의견을 나눈다.<사진=박은희 기자>
남 교수는 수시로 학생들과 연구 방향과 결과 등에 대해 의견을 나눈다.<사진=박은희 기자>
저작권자 © 헬로디디 무단전재 및 재배포 금지