I ricercatori della Northeastern utilizzano Google Cloud Platform per realizzare un modello della diffusione del virus Zika

Il laboratorio Modeling of Biological and Socio-technical Systems (MoBS) della Northeastern University aveva bisogno di un modo per realizzare rapidamente un modello del virus Zika. Grazie a GCE e alle macchine virtuali prerilasciabili, il MoBS ha condotto più di dieci milioni di simulazioni e ha ridotto drasticamente il tempo necessario all'analisi dei dati.

Nel 2015, mentre il virus Zika trasmesso dalle zanzare si diffondeva rapidamente nelle Americhe, sono stati emessi divieti di viaggio e obblighi di quarantena, nonché appelli perché si cancellassero le Olimpiadi del 2016 in Brasile. Mentre l'Organizzazione Mondiale della Sanità dichiarava l'epidemia un'emergenza di salute pubblica internazionale, i governi dei paesi interessati dovevano trovare un modo per prevedere con accuratezza i tassi e le sedi delle nuove infezioni. Poiché solo il 20% dei casi di Zika è sintomatico, si tratta di un virus particolarmente ostico da prevedere.

A gennaio 2016, il team del Mobile and Social Computing Lab della Northeastern University, con il supporto del Center for Inference and Dynamics of Infectious Diseases, ha avviato lo Zika Modeling Project per aiutare le autorità pubbliche e i ricercatori a comprendere meglio l'evoluzione e la diffusione del virus.

"Con l'uso dei big data e di una potenza di elaborazione eccezionale, speriamo di poter aiutare i ricercatori e i funzionari della sanità pubblica."

Matteo Chinazzi, scienziato ricercatore associato, Northeastern University

GCP fornisce strumenti essenziali di previsione, analisi e altro ancora

Servendosi di un approccio matematico e computazionale implementato da Google Cloud Platform (GCP), il team ha studiato diversi scenari di possibile diffusione di Zika, proiettandone l'impatto sulle popolazioni colpite. Il modello si basa sulla diffusione iniziale del virus in Brasile, dove è scoppiato nel 2015. I ricercatori ora sono in grado di prevedere l'impatto delle nuove infezioni in altri luoghi tramite l'inserimento di nuovi livelli di dati, come temperatura, numero di zanzare, dimensione demografica e pattern di viaggio delle persone.

GCP permette al team di eseguire diverse simulazioni in parallelo e di analizzare i terabyte di dati generati dagli scenari modellati. "Utilizziamo diversi prodotti GCP", afferma Matteo Chinazzi, scienziato ricercatore associato alla Northeastern University. "Google Cloud Storage archivia tutti i nostri dati di modellazione e ospita il nostro sito web. Google Compute Engine (GCE) e le macchine virtuali prerilasciabili eseguono le simulazioni della diffusione della malattia. Google BigQuery esamina gli scenari simulati, ognuno dei quali comprende variabili come date e numeri dei casi di infezioni. Finora, abbiamo elaborato una quantità incredibile di dati, centinaia di terabyte in tutto. Google Cloud Storage li archivia tutti".

Ottenere risultati per agire rapidamente su larga scala

Con GCE e macchine virtuali prerilasciabili, il laboratorio MoBS ha condotto più di 10 milioni di simulazioni. GCE e BigQuery hanno ridotto drasticamente il tempo necessario allo svolgimento delle simulazioni e delle analisi dei dati: entrambi i processi adesso richiedono ore invece di settimane. "Abbiamo la flessibilità di raggiungere una scala di diverse migliaia di istanze virtuali indipendenti in parallelo", spiega Chinazzi, "in modo da poter generare in meno di un giorno un'analisi completa per un unico scenario epidemico, che potrebbe comprendere fino a 250.000 simulazioni indipendenti".

Oltre a permettere ai ricercatori di comprendere la diffusione di Zika, questo schema potrebbe diventare un modello per analizzare altre epidemie, come la dengue. Sebbene Zika non rappresenti più un'emergenza internazionale secondo quanto dichiarato dall'Organizzazione Mondiale della Sanità, c'è ancora da fare per prevenire le epidemie di malattie trasmesse dalle zanzare. Con l'uso dei big data e di una potenza di elaborazione senza limiti, il team del MoBS spera di poter aiutare i ricercatori e i funzionari della sanità pubblica a raggiungere questo traguardo.

"Il tempo è fondamentale quando ci si trova di fronte a epidemie di malattie", afferma Chinazzi, "e GCP ci fornisce gli strumenti necessari per agire rapidamente su larga scala".

Per ulteriori informazioni sulla ricerca e sull'analisi di Zika condotte dal laboratorio MoBS, leggi "Spread of Zika virus in the Americas" pubblicato su Proceedings of the National Academy of Sciences of the United States of America.

"Abbiamo la flessibilità di adattare le dimensioni fino a diverse migliaia di istanze virtuali indipendenti in parallelo, in modo da poter generare in meno di un giorno un'analisi completa per un unico scenario epidemico, che potrebbe comprendere anche 250.000 simulazioni indipendenti."

Matteo Chinazzi, scienziato ricercatore associato, Northeastern University

Grazie per aver eseguito la registrazione.

Facci conoscere i tuoi interessi.