apraga/org: notes/20240716T104105--projet-facebook__auragen_cad

0
#+title:      Projet Facebook
#+date:       [2024-07-16 mar. 10:41]
#+filetags:   :cad:projet:auragen:
#+identifier: 20240716T104105


Bibliographie pour "privacy attacks":[[file:~/org/reports/biblio_facebook.org]]

Schéma
- Données = WGS, phénotype et système de santé (DPI etc)
- 3 niveaux
  1. public : /anonymisation/ que peut-on y mettre ? À ce stade, le CAD s'engage...
  2. sous authentification : /pseud-anonymisation/ : qu'y mettre (mais moins important)
  3. accès complet

Problème: pour >=1 variant et >= 1 phénotype, peut-on garantir l'anonymisation ?
A priori, problème non fait

Modèle: décipher

Idées :
- si on a suffisamment de patient, les variants rares vont être "dilués". On s'attend à 50-60 000 génomes
- on peut avoir une idée du nombre de SNP identifiants (25)
- et du caractère identifiant des phénotypes (voir la notion d'entropie par [cite:@erlich2014])