메뉴열기 검색열기

[알아봅시다] 전염병 잡는 `바이오인포매틱스`

남도영 기자   namdo0@
입력 2017-08-09 18:00

빅데이터로 시뮬레이션 분석 … 바이러스 변이·확산 예측
정보화 취약국가 질병 발생정보 데이터화
주요 교역국과 정보공유로 사전 모니터링
첨단 인공지능 활용 질병위험성 사전탐지


[알아봅시다] 전염병 잡는 `바이오인포매틱스`



'바이오인포매틱스'(Bioinformatics)란 생명을 뜻하는 단어인 '바이오'(Bio)와 정보학을 뜻하는 단어인 '인포매틱스'(Informatics)의 합성어로 컴퓨터를 이용해 대규모의 생명정보를 처리하는 학문을 말합니다.
2000년대 초반 국내에도 바이오인포매틱스가 처음 소개된 이후 초고속 네트워킹과 컴퓨터 인프라 기술의 급속한 발전에 힘입어 빠른 속도로 발전을 거듭하고 있습니다. 특히 최근 바이오인포매틱스는 2009년 신종플루, 2015년 메르스(MERS·중동호흡기증후군) 등을 겪으며 심각한 사회 현안으로 떠오르고 있는 신종 감염병 문제를 해결할 구원투수로 주목을 받고 있습니다.

[알아봅시다] 전염병 잡는 `바이오인포매틱스`

◇감염병 예측 기술의 발달=감염병이란 세균, 바이러스, 곰팡이균, 기생충 등에 우리 몸이 감염돼 발생하는 질환으로, 이 중에서도 바이러스는 세계적인 감염병 대유행을 발생시키기에 매우 유리한 조건을 갖고 있습니다.

일반적으로 바이러스에 의한 감염병 대유행은 △기존의 병원체와 다른 변이의 발생 △인체 내에서의 빠른 증식 △다양한 전파매체를 통한 사람 대 사람 간 빠른 전파라는 세 가지 특성을 갖고 있습니다. 이 중에서 바이오인포매틱스 기술을 활용해 예측할 수 있는 요소는 바이러스의 변이 패턴과 확산 양상 등입니다.

감염병을 예측하는 기술의 발달은 △수학적인 알고리듬 중심의 예측기술 △슈퍼컴퓨터와 같은 고성능 컴퓨팅 인프라 중심의 예측기술 △예측 대상 지역의 유동인구 패턴을 설명하는 빅데이터 연계 시뮬레이션 기반 기술 등의 단계를 거쳐 진화하고 있습니다.

수식 기반의 이론역학의 기원은 1760년 네덜란드의 물리학자이자 수학자였던 다니엘 베르누이가 내놓은 천연두 발생과 관련한 수학모델에서 찾을 수 있습니다. 이후 1927년 영국의 커맥과 맥캔드릭이 제안한 질병구획 중심의 미분방정식은 지금까지 다양한 질병 확산 모델링에 사용되고 있습니다.



질병의 확산을 예측하기 위한 노력은 2009년 세계적인 독감 대유행을 발생시킨 '신종플루' 이후 미국의 질병통제예방센터(CDC)를 중심으로 독감의 미국 내 확산을 그래프 형식으로 나타낼 수 있는 초창기 시뮬레이션 프로그램 개발로 이어졌습니다. 대표적 사례인 '커뮤니티플루'(CommunityFlu) 프로그램은 초기 감염자 수, 잠복기, 유동인구 패턴, 주당 근로일 수, 마스크 사용률 등 변수를 입력하면 감염병 확진 환자수를 예측해 그래프 형식으로 제공합니다. 하지만 이런 초창기 예측 프로그램은 실무자들이 직접 예측에 필요한 모든 변수들을 수치로 입력해야 하고, 간단한 수준의 계산만이 가능해 질병이 발생한 지역의 인구학적·지리학적 특성을 제대로 반영하기에는 무리가 있었습니다.
◇빅데이터 활용한 감염병 예측=이후 2007년 미국 IBM은 '시공간 감염병 모델러'(STEM)를 개발해 무료로 배포했습니다. STEP은 기존의 질병 확산 모델에 해당 지역의 지리적 위치 정보와 인구집단에서의 상호작용 정보를 추가해 질병 확산위협을 시간적, 공간적으로 모델링할 수 있는 프로그램으로, 전 세계 224개국의 지리정보와 인구구조, 인구이동을 위한 운송시스템 등을 제공합니다. 특히 STEM은 시뮬레이션 결과를 지도 상에 시각적으로 표시할 수 있어 활용도 면에서 높은 평가를 받았습니다.

유럽연합(EU)에서 서비스 중인 'GLEaMviz'는 29개 국가 8만645개의 행정구역, 512만9516 구역 간 통근 인원 기록을 재구성해 구역 간 인구이동을 구현했습니다. 전 세계 인구를 220개 국가 내 3362개의 부분집단으로 나눠 총 1만6846개의 전 세계 항공노선의 약 99%를 포함한 확산 시뮬레이션을 수행합니다. 질병 확산 시뮬레이션 과정에 인구·사회학적인 이동을 설명할 수 있는 통근 및 항공기 노선 빅데이터를 접목해 현실 세계에 한걸음 더 다가간 시뮬레이션 분석을 추구했다는 평가를 받고 있습니다.

빅데이터를 활용한 신종 감염병의 발생을 조기에 예측하기 위해서는 글로벌 수준에서 질병의 발생과 확산 현황을 사전에 모니터링하는 일이 중요합니다. 'GBD'(Global Burden of Disease)는 국제적인 협력 네트워크로, 주로 아프리카나 동남아시아 일부 국가들과 같이 정보화에 취약한 국가들로부터 새로운 질병의 발생 정보를 데이터화해 주요 교역국들이 공유하는 것을 목적으로 합니다. 이 과정에 수집된 빅데이터는 질병과 관련된 글로벌 우선순위를 정하고 확산 가능성을 가늠하는데 활용됩니다.

◇실시간·인공지능 예측으로 진화=감염병 예측과 관련된 국내 연구는 최근 빅데이터 분석에 대한 관심이 높아지면서 의료 빅데이터를 보유하고 있는 국민건강보험공단이나 건강보험심사평가원 등을 중심으로 시범사업들이 진행 중입니다. 건보공단은 자체적으로 보유한 국민건강정보 DB와 식약처, 기상청, 환경부가 보유한 식중독, 기상기후 및 환경자료, 민간의 소셜미디어 정보 등을 활용해서 지역·시기별로 감기·눈병·식중독·천식·피부염 등 5대 질병의 위험도를 알려주는 '국민건강알람서비스'를 개발해 서비스하고 있습니다.

감염병의 사전예측 기술은 4차 산업혁명의 두 가지 핵심요소인 초연결성·초지능성과 매우 밀접한 관련이 있습니다. 앞으로 감염병 예측 기술은 주변국으로부터 새로운 질병의 발생정보를 실시간으로 파악하고, 질병의 위험성 수준을 첨단 인공지능 기술을 활용해 사전에 탐지해 대비하는 방향으로 진화할 전망입니다.

남도영기자 namdo0@dt.co.kr
도움말=생명공학정책연구센터

[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]