:PROPERTIES:
:ID:       87f9ce21-d880-4b49-b916-7487e28b820f
:ROAM_REFS: @sweeney2013
:END:
#+title: Latanya Sweeney and Akua Abu and Julia Winn :: Identifying Participants in the Personal Genome Project by Name (A Re-identification Experiment)

Données
- 1130 profile du projet PGP -> 579 avec date de naissance, genre et code postal (US) à 5 chiffres
- registre de votant, accès à un site de base de données publique

Méthode: intersection entre PGP et ces 2 bases sur code postal, date de naissance et sexe
À noter que Nom des patients dans le fichier DNA extrait.... ex "enome_Elaine_Smith_Full_629562.txt."

Résultat: avec la base de données des vote : 130 correspondant unique -> 103 noms
sur record publique : 156 unique
donc 241 match cumulé
-> 84% correspondant (97% si on considère les surnoms)

Soit 35% sur le total