#+title: Projet Facebook #+date: [2024-07-16 mar. 10:41] #+filetags: :cad:projet:auragen: #+identifier: 20240716T104105 Bibliographie pour "privacy attacks":[[file:~/org/reports/biblio_facebook.org]] Schéma - Données = WGS, phénotype et système de santé (DPI etc) - 3 niveaux 1. public : /anonymisation/ que peut-on y mettre ? À ce stade, le CAD s'engage... 2. sous authentification : /pseud-anonymisation/ : qu'y mettre (mais moins important) 3. accès complet Problème: pour >=1 variant et >= 1 phénotype, peut-on garantir l'anonymisation ? A priori, problème non fait Modèle: décipher Idées : - si on a suffisamment de patient, les variants rares vont être "dilués". On s'attend à 50-60 000 génomes - on peut avoir une idée du nombre de SNP identifiants (25) - et du caractère identifiant des phénotypes (voir la notion d'entropie par [cite:@erlich2014])