Come MUM di Google ha migliorato la ricerca di informazioni sui vaccini

Come MUM di Google ha migliorato la ricerca di informazioni sui vaccini
di Guglielmo Sbano
Sabato 3 Luglio 2021, 12:34
4 Minuti di Lettura

Ci sono cose che possono essere definite in vari modi: pensiamo, ad esempio, a “penna” e “biro” oppure “matita” e “lapis”. Alle volte è una caratteristica della lingua di riferimento, altre volte dipende da tendenze o sfumature culturali, o semplicemente da dove ci troviamo mentre effettuiamo una ricerca.

Un esempio particolarmente significativo è rappresentato dalla sigla COVID-19. Sin dall’inizio della pandemia, le persone in tutto il mondo hanno cominciato a ricercare informazioni sempre più specifiche sui virus.  In Google è stato dunque fondamentale imparare a identificare tutte le diverse frasi usate per riferirsi al nuovo coronavirus, per essere sicuri che il motore di ricerca facesse emergere il più ampio numero di informazioni tempestive e di qualità, messe a disposizione da autorità sanitarie affidabili come l'Organizzazione Mondiale della Sanità (OMS) e i Centri per il controllo e la prevenzione delle malattie.

A distanza di un anno, alla sfida sulle terminologie più diffuse, si è affiancata quella sui nomi dei vari vaccini, ma questa volta a Mountain View hanno messo a punto un nuovo, potente strumento: la tecnologia Multitask Unified Model (MUM).

AstraZeneca, CoronaVac, Moderna, Pfizer, Sputnik e altri vaccini distribuiti su larga scala hanno ciascuno dei nomi diversi in varie parti del mondo: oltre 800, stando all’analisi di Google. Le persone che cercano informazioni sui vaccini possono digitare "Coronavaccin Pfizer," "mRNA-1273," "CoVaccine" - e la lista continua.

La capacità di identificare correttamente tutti questi termini, è fondamentale ad offrire le informazioni più aggiornate ed affidabili sul vaccino. Ma identificare i diversi modi in cui le persone si riferiscono ai vaccini in tutto il mondo, richiede un enorme dispendio di tempo e centinaia di ore in risorse umane. Con MUM (Multitask Unified Model), in pochi secondi si è in grado di identificare oltre 800 varianti di nomi di vaccini in oltre 50 lingue. Dopo la convalida, questi risultati sono stati applicati alla Ricerca Google in modo che questa possa restituire informazioni tempestive e di alta qualità sui vaccini COVID-19 in tutto il mondo.

MUM, dunque, è in grado di fare in pochi secondi un lavoro che avrebbe richiesto diverse settimane, grazie alle sue capacità di trasferimento di conoscenza; può imparare e trasferire i dati attraverso le oltre 75 lingue su cui è stato testato e non deve imparare una nuova funzionalità per ogni lingua, ma può trasferire ciò che apprende tra di loro, aiutando così da trasmettere rapidamente i miglioramenti ottenuti, anche alle lingue meno testate di altre. Questo è in parte merito dell'efficienza del campione di MUM che richiede molti meno input di dati rispetto ai modelli precedenti per realizzare lo stesso compito. Nel caso dei vaccini, con un solo piccolo campione di nomi ufficiali, MUM è stato in grado di identificare rapidamente queste variazioni tra le lingue.

«Questa prima implementazione di MUM ci ha aiutato a fornire alle persone informazioni fondamentali in modo tempestivo, ovunque si trovassero, e siamo impazienti di scoprire i molti modi in cui MUM può rendere la Ricerca ancora più utile per le persone in futuro”, dichiarano da Google. E continuano: “I nostri primi test indicano che non solo MUM sarà in grado di migliorare molti aspetti dei nostri attuali sistemi, ma ci aiuterà anche a creare modi completamente nuovi di cercare ed esplorare le informazioni».

© RIPRODUZIONE RISERVATA