Il governo userà i big data nell'emergenza coronavirus. A partire da quelli di Facebook

Nasce una task force al ministero dell'Innovazione. L'università di Pavia offre uno studio basato sui dati del social network. Le regole per fare contact tracing preservando la privacy

Una squadra di esperti lavorerà spalla a spalla con il governo per sfruttare big data e tecnologie nell'emergenza coronavirus. E ha già un dossier da studiare: un'analisi basata su un set di dati fornito da Facebook all'università di Pavia.

Wired può anticipare le prossime mosse del governo Conte per fronteggiare l'epidemia da Sars-Cov-2.È stata la stessa Organizzazione mondiale della sanità (Oms) a richiamare i governi: la chiusura di attività, scuole e aziende, il cosiddetto lockdown, da sola non basta. “Non abbiamo visto un incremento sufficientemente urgente di test, isolamento e tracciamento dei contatti, che è la spina dorsale della risposta a Covid-19”, ha dichiarato il direttore generale dell'autorità, Tedros Adhamon Ghebreyesus. Paesi come Corea del Sud, Taiwan, Hong Kong e Singapore hanno proprio fatto affidamento sui dati per contenere il contagio da coronavirus, con risultati incoraggianti.

X content

This content can also be viewed on the site it originates from.

A quasi un mese dalla scoperta dei primi casi italiani di pazienti affetti da Covid-19, anche l'Italia arruola la tecnologie per fronteggiare il contagio. La task force di esperti sarà composta da tecnici del ministero dell'Innovazione e da consulenti esterni pro bono.

Tra i quali, secondo quanto può anticipare Wired, c'è un docente dell'università di Pavia, che in dote porterà una sua analisi svolta su dati anonimizzati forniti da Facebook. Nei giorni scorsi anche le più grandi compagnie telefoniche italiane – Tim, Vodafone, Wind Tre e Fastweb – hanno offerto, tramite la loro associazione di categoria, Asstel, set di dati anonimi che aggregano gli spostamenti dei propri utenti per fare contact tracing, ossia rintracciare tutti i contatti di una persona contagiata, o altre forme di monitoraggio.

Le misure del governo

Prende forma il progetto che noi abbiamo in mente fin dall'inizio: creare un team dei dati per scrivere la politica del Paese sui dati e supportare il governo nelle decisioni”, spiega a Wired il ministro dell'Innovazione, Paola Pisano. La task force sul coronavirus è il primo test di uno schema a geometria variabile da ripetere e che, a seconda dei casi da affrontare, aggregherà risorse interne e specialisti interni di diverse discipline per fare analisi basate sui dati.

Le nomine entreranno nell'ultimo decreto di Palazzo Chigi, *Cura Italia. *Delle applicazioni pratiche, tipo app per fare monitoraggio o comunicazione, non sarà il ministero a occuparsi. Pisano spiega che “da giorni siamo in contatto con aziende e startup. L'obiettivo è far crescere il mercato”.

A Wired risulta che tra le prime ricerche che la task force prenderà in esame ce n'è una basata su dati di Facebook. Il social network ha fornito informazioni aggregate e anonimizzate all'università di Pavia, che ha elaborato alcune proiezioni. Lo scambio è avvenuto all'interno del programma Data for Good, sponsorizzato dallo stesso patron dell'azienda, Mark Zuckerberg, tra le iniziative di contrasto al contagio.

Menlo Park ha messo a disposizione data set utili alle università per studiare la diffusione del coronavirus, che comprendono, come afferma lo stesso fondatore del social network, “dati sulla mobilità e mappe sulla densità della popolazione”. A Wired la piattaforma ha fatto sapere che “il progetto Data for Good di Facebook consente a ricercatori e organizzazioni non profit di analizzare trend aggregati, anonimi e non identificabili di mobilità per capire come una malattia potrebbe diffondersi. I dati aggregati sulla mobilità possono essere utili durante catastrofi naturali, per capire se le popolazioni stanno evacuando o ci sono sfollati, oppure durante delle epidemie, dove possono rappresentare uno strumento utile per prevedere lo sviluppo della malattia stessa”.

Cosa c'è nel forziere di Facebook

Secondo quanto Wired ha potuto ricostruire, il programma aggrega dati pubblici e altri in mano a ricercatori sanitari e organizzazioni non-profit, che hanno sottoscritto con il colosso dei social network accordi per la licenza. In Italia , tra quelli pubblici ci sono mappe ad alta risoluzione della densità della popolazione, ottenute integrando statistiche dei censimenti e immagini satellitari, e i flussi di post pubblici sul Covid-19, diffusi su gruppi e pagine Facebook e da alcuni account di Instagram (attraverso CrowdTangle live).

Ai ricercatori sanitari dell'università di Pavia, messi in contatto con la piattaforma all'inizio di marzo dal ministero dell'Innovazione, sono stati consegnati, attraverso un contratto di licenza e accessi riservate ai database, dati aggregati sulla mobilità attraverso un programma di mappe per la prevenzione delle malattie. A quanto risulta a Wired da fonti confidenziali, questo dataset comprende anche informazioni sugli spostamenti dal Nord a Sud avvenuti nella notte tra il 7 e  l'8 marzo, mentre il presidente del Consiglio, Giuseppe Conte, annunciava la chiusura della Lombardia e di 14 province tra Veneto, Emilia Romagna e Piemonte. Facebook non ha fornito dettagli in merito.

I dati però non escono, a quanto assicurano gli interessati, dal perimetro dell'ateneo. “Noi non vediamo i dati di partenza, vedremo solo i risultati dello studio”, spiega Pisano: “La salvaguardia della privacy viene prima di tutto”.

Il nodo della privacy

È proprio la delicatezza delle informazioni utili per fare contact tracing – non solo quelle sanitarie, ma anche quelle relative a spostamenti, contatti, frequentazioni e alle conclusioni a cui si potrebbe giungere, mettendo insieme le tessere del puzzle – ad aver allarmato sui rischi di violazioni del diritto alla riservatezza.

Lo European data protection board (Edpb), l'organismo che vigila sulla tutela delle informazioni nel vecchio continente, lo ha ribadito di recente: il regolamento generale europeo per la protezione dei dati (Gdpr) ammette un allentamento delle briglie in casi di gravi emergenze sanitarie, com'è la pandemia da coronavirus, per esempio omettendo la classica informativa sull'uso.

Tuttavia se si pescano i dati delle comunicazioni elettroniche, che si possono usare per tracciare gli spostamenti di una persona, questi devono essere usati in forma anonima e aggregata, per produrre, per esempio, mappe aggregate sulla concentrazione degli smartphone, per misurare l'affollamento di focolai del contagio o individuare assembramenti. E se i dati non possono essere usati in forma anonima, l'Edpb parla chiaro: prima di adoperarli, un governo deve dotarsi non solo di leggi ad hoc, ma anche di strumenti di controllo sull'uso che ne viene fatto (per esempio, per consentire a una persona di fare ricorso). Tutte previsioni, ricorda Innocenzo Genna, esperto di politiche comunitarie, che il Gdpr già prevede.

L'Italia ha già regole specifiche. Proprio come ha raccontato Wired, il decreto legge del 9 marzo, per potenziare il sistema sanitario, affida alla Protezione civile e a tutte le autorità in trincea contro il Covid-19, dal ministero della Salute all'Istituto superiore di sanità, poteri speciali sull'uso dei dati.

A mancare, secondo il presidente dell'Istituto italiano per la privacy, Luca Bolognini, sono sistemi di controllo a tagliola, che scattino al termine dell'emergenza per ripristinare le consuete protezioni e distruggere le informazioni adoperate. Per Matteo Flora, docente universitario, imprenditore ed esperto di digitale, servirebbe il coinvolgimento di organizzazioni non governative e osservatori esterni proprio per vigilare sull'uso e sul destino di queste informazioni. L'obiettivo è scongiurare quello che definisce un “bad long term standard”: ossia che, abbattuto il muro per questioni di emergenza, si continui a pescare dai silos di dati personali senza controllo.

Ma si può fare un tracciamento anonimo?

In un approfondito video su Youtube Flora spiega che già solo con dati anonimi delle telecomunicazioni si possono ottenere molte applicazioni: analisi di big data sul traffico, individuazione di assembramenti, messaggi a specifici utenti e geofencing (tracciare delle aree e, se vengono superate, far scattare un avvertimento). Ma anche senza cellulare, ci sono molti altri strumenti per fare monitoraggio, dai consumi energetici ai biglietti dei mezzi pubblici, dai pedaggi alla lettura delle targhe.

In Italia i dati che le compagnie telefoniche si sono rese disponibili a fornire sono aggregati. Il garante della privacy, Antonello Soro, lo ripete dall'inizio di febbraio: no ad azioni fai-da-te, bilanciare l'urgenza della lotta al contagio con il diritto alla privacy, scegliere “misure le meno invasive possibili”, come ha ricordato in un'intervista a Radio Radicale. “Sono possibili tutte le deroghe, ma ci deve essere una base giuridica che consenta attraverso i poteri alla Protezione civile di tenere questa fase emergenziale dentro un contesto di garanzie accettabile”, ha aggiunto.

Da settimane Alfonso Fuggetta, docente universitario e presidente di Cefriel (gruppo fondato da università e aziende per l'innovazione tecnologica) e Carlo Alberto Carnevale Maffè, professore di organizzazione aziendale alla School of management dell'università Bocconi di Milano, sostengono di usare i big data nella lotta al coronavirus. “Ci sono varie tecniche che si possono utilizzare, per tracciare i cellulari, capire se si è stati esposti a un rischio per fare prevenzione e segnalazione. Per gestire la crisi servono sistemi di allarme e monitoraggio. Si possono applicare le misure dei paesi asiatici”, suggerisce Fuggetta.

Per Carnevale Maffè, “è fondamentale adottare questi strumenti oggi per gestire l'emergenza, ma anche in prospettiva, disegnando le prospettive per la prossima ripresa della vita economica e sociale. Occorre essere proattivi”. Il docente richiama in particolare due studi, entrambi di centri dell'università di Oxford. Il primo, firmato da un team guidato da Luca Ferretti, studia con modelli matematici gli effetti di un contact tracing digitale, il secondo, a cui ha lavorato Christophe Fraser, analizza nello specifico il caso cinese, mettendo a confronto evidenze scientifiche e anche aspetti etici.

X content

This content can also be viewed on the site it originates from.

La startup italiana Nextome, specializzata nel tracciamento di oggetti in spazi chiusi, potrebbe fornire esempi su cui modellare forme di contact tracing attente alla privacy. Oltre ad aver sviluppato una tecnologia per tracciare quei dispositivi medici di cui c'è scarsa disponibilità negli ospedali, la società di Conversano, nel Barese, ha applicato le soluzioni in via sperimentale al monitoraggio di malati d'Alzheimer in una residenza per anziani e al tracciamento di una patologia attraverso i pazienti infetti. Per uno dei fondatori, Domenico Colucci funziona meglio con strumenti alternativi al telefonino: “Lo smartphone ha molti dati personali. Noi abbiamo utilizzato dei braccialetti a batteria, di cui viene letto l'identificativo, per mantenere più alto il livello di riservatezza”.

Il tracciamento dei contagi è un'arma utile non solo nell'immediato, per contenere il contagio, ma anche per fare prevenzione e impedire in futuro che il coronavirus si diffonda di nuovo. Secondo una ricerca pubblicata sulla rivista scientifica The Lancet e basata sui dati di Wuhan, la città cinese epicentro del contagio, bastano quattro casi introdotti indipendentemente in una comunità per far aumentare del 50% le probabilità che l'infezione dilaghi di nuovo.