I pagamenti elettronici possono rivelare di noi molto più di quanto si creda. Il flusso di dati generato dalle carte di credito è sufficiente a svelare l’identità pressoché di chiunque, anche se, in linea teorica, questi dati sono stati anonimizzati: non contengono, cioè, informazioni sensibili come nome, indirizzo o numero di telefono.
L’inquietante studio è stato pubblicato su Science. Yves-Alexandre de Montjoye, scienziato informatico del MIT di Boston ha analizzato, insieme ai colleghi della Aarhus University in Danimarca, tre mesi di estratti conto di carta di credito di 1,1 milioni di utenti anonimi in una non meglio specificata nazione industrializzata.
DIMMI COSA COMPRI… Il 90% delle persone è risultato individuabile a partire da soltanto 4 stringhe di informazioni (come il negozio dove qualcuno aveva comprato un caffè in un dato giorno, o quello in cui aveva acquistato un paio di scarpe in un’altra occasione).
… E TI DIRÒ CHI SEI. In altre parole, incrociando i dati sui vari acquisti e la possibilità che una stessa persona avessa comprato quella cosa, in quel luogo in un dato momento, è stato possibile ricondurre l’avatar elettronico del compratore, per esempio #2232_8, al suo nome reale, per esempio William Herkewitz, nonostante i tentativi delle varie compagnie di togliere dati troppo specifici dai tracciati delle carte elettroniche.
ULTERIORI INDIZI. Il possesso di dati ancora più specifici, come l’esatto prezzo pagato per un particolare acquisto in un negozio specifico, fa innalzare le probabilità di identificazione di un utente su 1,1 milioni di persone del 22% (se ci aggiungiamo poi che questi dati possono essere incrociati con un tweet in cui ci tagghiamo in un luogo, o una foto su Instagram di un acquisto nuovo di zecca, il cerchio si stringe). I dati di cinque transazioni sono riusciti a scovare la quasi totalità dei soggetti.
I PIÙ FACILI DA TROVARE. I meglio identificabili sono risultati i compratori più ricchi, e le donne, forse perché clienti con abitudini d’acquisto più variegate, e quindi più facilmente distinguibili. La ricerca evidenzia come i metadati con certe proprietà, come la geolocalizzazione, siano difficilmente anonimizzabili. E funzionino bene nel localizzare un utente esattamente come i tracciati di un cellulare.
by Focus