#+title: Identifying Participants in the Personal Genome Project by Name (A Re-identification Experiment) #+date: [2024-07-17 Wed 14:47] #+filetags: :bib:facebook: #+identifier: 20240717T144704 #+reference: sweeney2013 Données - 1130 profile du projet PGP -> 579 avec date de naissance, genre et code postal (US) à 5 chiffres - registre de votant, accès à un site de base de données publique Méthode: intersection entre PGP et ces 2 bases sur code postal, date de naissance et sexe À noter que Nom des patients dans le fichier DNA extrait.... ex "enome_Elaine_Smith_Full_629562.txt." Résultat: avec la base de données des vote : 130 correspondant unique -> 103 noms sur record publique : 156 unique donc 241 match cumulé -> 84% correspondant (97% si on considère les surnoms) Soit 35% sur le total