:PROPERTIES:
:ID:       1c36e841-fad4-4345-ab8c-d1d753818dfd
:ROAM_REFS: @dyke2015epigenome
:END:
#+title: Dyke, Stephanie OM and Cheung, Warren A and Joly, Yann and Ammerpohl, Ole and Lutsik, Pavlo and Rothstein, Mark A and Caron, Maxime and Busche, Stephan and Bourque, Guillaume and Rönnblom, Lars and others :: Epigenome data release: a participant-centered approach to privacy protection

Contexe: réidentification des participants par correspondance sur l'ADN = "attribute disclosure attacks using DNA"[cite:@erlich2014]

Ici: peut-on *ré-identifion donnée = attributer à un individu en faisant correspondre information génétique identifée à données anonymisée*
Anomisation totale impossible pour ADN mais donnée épigénomique plus facible

* Données épigénétiques
Principe du whole genome bisulfite sequence = reporte CpG méthylé et non métholyé cytosine

** Informatino génétique dans données de méthylation
Principe : variant qui va perturber la méthylation -> différence entre les 2 brins

Identification de CpG génomique où la methélytaion est du à un variant génétique -> a priori  39k sites qui ont > 98% predictive accuracy  et correspondent à un SNP connu

En pratique, on peut supprimer ces îlots perturbés par SNP sans perdre peaucoup d'information.
Limites (cf conclusion) mais on peut utiliser des masques
* Metadata

nomenclature HPO enlève certains détails trop spécifique lié au patient mais il faut parfois du texte libre
Pour maladies rare, date de naissance et endroit de résidence peut conduire à rédentification
Si syndrome cliniques, peossible stigmalisation

#+begin_quote
1 Is the place of residence provided (even indirectly, for example, in the project name)?
2 Is the rare disease outwardly visible?
3 How rare is the disease?
4 Does the rare disease provide information about the likely geographical location of individuals?
5 Does the rare disease provide information about ethnicity that may be considered potentially stigmatizing?
6 Was the participant aware of the potential risks of data re-identification?
#+end_quote
* Conclusion
- [cite:@erlich2014] on peut retrouver l'identité d'un individé mais il faut dans la majorité des cas données génétique d'une autre source
- Cas spéciaux: exemple du chromosome Y [cite:@Gitschier_2009]
- RNA: complexe pour retrouver