:PROPERTIES:
:ID:       49509ff4-6e75-40c5-accd-7cf19a22fb23
:END:
#+title: Zhao2020


**** Méthode:
- Génome : NA12878 (TruSeq), synthetic diploid (HiSeq) et simulé (NEAT)
  - NEAT: 1 version avec mutations aléatoires (moyenne 0.002), 1 version défini à partir du (depuis le "golden truth")
- GRCh37
- 4 pipeline: bwamem+GATK, bwamem+deepvariant, Dragen+dragen, dragen+Deepvariant
*mais en GRch37*
- 64 coeurs
- comparaison avec happy + vcfeval
**** Résultat
- bonne concordance des pipeline :
  - SNV: 91.7-9.6% retrouvés par tous les pipeline et 95.3-99.95% par au moins 2
  - indel : 83.5-99.4%
- meilleur performance dragen vs gatk mais pas forcément mieux que deepvariant
- temps d'exécuton:
  - dragen >> autres en total (facteur 5 et 30min à 1h30 d'exécution sur HPC)
  - pour bwa-mem/gatk ou deepvariant, alignement domine appel de variant. Deepvariant ~ gatk pour appel de variant

Limite:
- résultat différent du fda challenge
- GRch37