:PROPERTIES:
:ID:       b6a29038-b7cb-4677-a826-f61a3193d19c
:ROAM_REFS: @shringarpure2015
:END:
#+title: Shringarpure, Suyash S and Bustamante, Carlos D :: Privacy risks from genomic data-sharing beacons

Service web qui répond oui/non à la question "y a-t-il un nuclétotide donnée à une position données".
Context : GA4GH veut proposer ce service

Peut-on dire si un individu est dans un beacon ?

Hypothèse
- On a un VCF avec les variants (ALT) et génotype à ces positions
- On ne connait pas les fréquences alléliques (pour être plus général) mais elles sont modélisées par une distribution Beta

Modèle stat (likelihood-ratio) pour ré-identifier.

* Méthode
- Données simulées: 500k SNP à partir de 1000 individus
- 100genomes : 65 individus CEU
* Résultat:
- Données simulée : puissance de 95% pour détecter un individu avec 5k requêtes
- données CEU: 250snp : 95% puisson et 5% faux positif
Plus performante si plusieurs popoulation (pas juste CEU)