:PROPERTIES: :ID: 2a9bcff3-0753-40c6-a76d-f9b8782b345f :END: #+title: Jarvis2022 Limite de GRCh38: - toujours incomplet : 150 000 "trous" -> 995 - ne représente pas la diversité du génome (70% = 1 individu et le reste = 19 autres) - difficulté : duplication > taille du reads, SNV et variant structurelle mal capturés par short-read : enzymes utilisées ont des difficultés avec structures complexe (régions riches en GC pour les promoteur) - problème de la réprésentation haploid (= gène représenté une seule fois): - variants de différents haplotype sont regroupés dans le même (pseud-haplotype)) - fausse duplication: soit par un mauvais alignement de régions hétérozygotes qui apparemment comme des paralogue (gènes provenant d'une duplication initiale) (= "false heterotype duplication"), soit quand des régions qui devraient être fusionnées ne le sont pas et sont identifiées comme des duplications (="homotype false duplications), par exemple erreur de séquencage sur long reads - une représentation diploide (= gènes des 2 parents) pour chromosome X et Y et gènes soumis à empreinte Ici T2T semi-automatisé appliqué à HG002