#+title:      Privacy risks from genomic data-sharing beacons
#+date:       [2024-07-17 Wed 14:46]
#+filetags:   :bib:facebook:
#+identifier: 20240717T144648
#+reference:  shringarpure2015


Service web qui répond oui/non à la question "y a-t-il un nuclétotide donnée à une position données".
Context : GA4GH veut proposer ce service

Peut-on dire si un individu est dans un beacon ?

Hypothèse
- On a un VCF avec les variants (ALT) et génotype à ces positions
- On ne connait pas les fréquences alléliques (pour être plus général) mais elles sont modélisées par une distribution Beta

Modèle stat (likelihood-ratio) pour ré-identifier.

* Méthode
- Données simulées: 500k SNP à partir de 1000 individus
- 100genomes : 65 individus CEU
* Résultat:
- Données simulée : puissance de 95% pour détecter un individu avec 5k requêtes
- données CEU: 250snp : 95% puisson et 5% faux positif
Plus performante si plusieurs popoulation (pas juste CEU)