#+title:      Identification of individuals by trait prediction using whole-genome sequencing data
#+date:       [2024-07-17 Wed 14:42]
#+filetags:   :bib:facebook:
#+identifier: 20240717T144259
#+reference:  lippert2017


Contexte: prédictions couleurs de la peau (4 publi), couleur des eyes (morphologie faciable)

Objectif :
- à partir de données de génomes
- préduction morphologie faciale, voix, âge biologie, taille, poids IMC, coleur eyes + pea, sexe

* Méthode
- Génome 30x 1 000 individus san diago (diversité)
- prédictio visage
  - décomposition visage en élément principaux
  - idem pour 1000 "éléments principaux génomiques"  (donc éléments qui "définissent simplement" un individus en se basant la différence avec des SNPs common ? méthode non clair) avec sex, IMC e tage comme covariant
- prédiction voix
  - vecteur 100 élements pour représenter enregistrer de la voix
  - covariate : 1000 éléments princiaux généomique et sex
- âge basé sur la longeur des télomère, perte en mosia¨que du X
- taille, poids, IMC : utilisation de positions associées statistiquement (cf biblio) -> "régularisation stastitique" + ajout composant prinicap génomique + sex.
- eyes : 8 SNP
 couleur peau : 11 gène
* Résultats
- visage : assez variable mais basé sur R^2CV par pixel (visage) et élément du vecteur ->  semble assez bof
  - voix = mauvais (et la métrique est discutable
- Taille moyen, mauvais pour poids IMC
- yeuax, coleur peau correct
** 1 individus parmi N avec un phénotype, comment le retrouver ?
tous les attributs, pool de 50 (= pire cas): 0.45 précision
** N génomes peuvent être apparaisé avec N phénotype ?
tous les attributs, pool de 50 (= pire cas): 0.53 précision

** 10 candidats parmis une cohorte de 100 88%