#+title:      Deterministic identification of specific individuals from GWAS results
#+date:       [2024-07-17 Wed 14:38]
#+filetags:   :bib:facebook:
#+identifier: 20240717T143830
#+reference:  cai2015


Attribute disclosure

Hypothèse : l'étude a publique
- pour chaque génotype, la fréquence et la corrélaction avec maladie (p-value)
- une matrice corrélation génotype-génotype

* Méthode = inversion du processus d'aggrégation
1. matrice de co-occurence (nombre de fois que g1-g2 a été vu)
2. matrice de "preuve" -génotype (ensemble de sous-séquence des génotype = caractéritisque tu génome d'un individu)
3. pour le génotype da la cible, regarde s'il est dans cette matrice

* Résultats
** Données simulées
8 études de TWCCCC sur 394k loci. Le nombre de patient est entre 1400 et 2000 envirson par étude.
Simulation de 7 GWAS avec NBS comme contrôle
14 génotype sur 75 trouvent des motifs unique dans 1% des cas. N'identifie pas les cas de la population de référenc !
Nombre de cas ré-dentiifé augmente avec le nombre de génotypes
** données publiée
36 génotype disponible: 12 personnes