Google Cloud Platform을 사용해 지카 바이러스 확산을 모델링한 노스이스턴 대학교의 연구원

노스이스턴 대학교의 MoBS(Modeling of Biological and Socio-technical Systems) 연구소에는 지카 바이러스를 신속하게 모델링할 방법이 필요했습니다. MoBS는 GCE와 선점형 가상 머신을 활용해 1천만 개 이상의 시뮬레이션을 실행하고 데이터를 분석하는 데 걸리는 시간을 대폭 단축했습니다.

2015년, 모기를 매개로 전파되는 지카 바이러스가 미대륙에 빠르게 퍼지자 여행 금지 및 격리 조치가 내려졌고 2016년 브라질 올림픽을 취소하라는 목소리가 나오기도 했습니다. 세계 보건 기구는 국제 공중 보건 비상사태를 선포했고 영향을 받은 각국 정부에는 새로운 감염이 발생하는 속도와 위치를 정확하게 예측할 방법이 필요했습니다. 지카 바이러스는 증상이 발현되는 경우가 20퍼센트에 불과하기 때문에 바이러스 예측이 특히 까다롭습니다.

2016년 1월, 노스이스턴 대학 MoBS 연구소팀은 감염 질환 추론 및 역학 센터(Center for Inference and Dynamics of Infectious Diseases)의 지원을 받아 보건 당국과 연구자들이 바이러스의 변이와 확산을 더욱 효과적으로 파악할 수 있도록 지카 모델링 프로젝트를 시작했습니다.

"빅데이터와 엄청난 컴퓨팅 성능을 활용하여 연구자들과 공중 보건 담당자들을 지원할 수 있기를 바랍니다."

Matteo Chinazzi, 보조 연구 과학자, 노스이스턴 대학교

필수적인 예측 도구, 분석 도구 등을 제공하는 GCP

이 팀에서는 Google Cloud Platform(GCP)에 기반한 수학적이고 연산적인 접근 방식을 사용하여 지카 바이러스가 확산되는 다양한 시나리오를 연구하고 감염 인구에 미칠 영향을 예측했습니다. 이 모델은 2015년에 바이러스가 발생했던 브라질의 지카 바이러스 초기 확산을 기반으로 합니다. 연구자들은 이제 온도, 모기 수, 인구 규모, 사람들의 여행 패턴 등의 추가 데이터 영역을 도입하여 다른 위치에서도 새로운 감염의 영향을 예측할 수 있게 되었습니다.

팀에서 GCP를 사용하면 여러 병렬 시뮬레이션을 실행하고 모델링된 시나리오에서 생성되는 테라바이트급 용량의 데이터를 분석할 수 있게 됩니다. 노스이스턴 대학교의 보조 연구 과학자 마테오 치나찌는 이렇게 말합니다. “현재 몇 가지 GCP 제품을 사용하고 있습니다. Google Cloud Storage는 우리 대학의 모든 모델링 데이터를 저장할 뿐 아니라 웹사이트를 호스팅합니다. Google Compute Engine(GCE)과 선점형 가상 머신은 질병 확산 시뮬레이션을 실행합니다. Google BigQuery는 시뮬레이션된 시나리오를 검토하며, 시나리오마다 날짜, 감염 수치 같은 변수가 포함됩니다. 지금까지 다 합쳐서 수백 테라바이트에 이루는 엄청난 양의 데이터를 만들어냈습니다. 이 모든 것이 Google Cloud Storage에 저장되어 있습니다.”

대규모 결과의 신속한 이동

MoBS는 GCE와 선점형 가상 머신으로 1천만 개 이상의 시뮬레이션을 실행했습니다. GCE와 BigQuery는 시뮬레이션을 실행하고 데이터를 분석하는 데 걸리는 시간을 대폭 단축했습니다. (두 프로세스에는 이제 몇 주가 아닌 몇 시간이 걸립니다.) 그는 "동시에 수천 개의 독립적인 가상 인스턴스를 유연하게 확장할 수 있으므로 최대 250,000개의 독립적인 시뮬레이션으로 구성된 단일 전염병 시나리오를 하루도 안 돼서 완전히 분석할 수 있습니다"라고 말합니다.

이 모델은 연구자가 지카 바이러스의 확산을 파악할 수 있도록 지원할 뿐만 아니라 뎅기열 같은 다른 전염병을 분석하는 템플릿이 될 수도 있습니다. 세계 보건 기구의 선언에 따라 이제 지카 바이러스로 인한 국제적인 응급 상황은 종료되었지만, 모기로 인한 질병이 발생하는 것을 막기 위해 아직 해야 할 일이 있습니다. MoBS의 팀은 빅데이터와 제한 없는 엄청난 컴퓨팅 성능을 활용하여 연구자와 보건 당국의 성과를 지원할 수 있기를 바랍니다.

“질병 발생에 맞설 때는 시간이 매우 중요한데, GCP 덕분에 대규모로 빠르게 움직일 수 있는 도구가 생겼습니다”라고 치나찌는 말합니다.

MoBS 연구소의 지카 바이러스 연구 및 분석에 관한 자세한 내용은 미국 국립 과학원(National Academy of Sciences of the United States of America)에서 발간한 '미대륙 지카 바이러스의 확산'을 참고하세요.

"동시에 수천 개의 독립적인 가상 인스턴스를 유연하게 확장할 수 있으므로 최대 250,000개의 독립적인 시뮬레이션으로 구성된 하나의 전염병 시나리오를 하루도 안 돼서 완전히 분석할 수 있습니다."

Matteo Chinazzi, 보조 연구 과학자, 노스이스턴 대학교

가입해 주셔서 감사합니다.

관심사를 자세히 알려주세요.