:PROPERTIES: :ID: aa07aa1e-d0de-43cc-b0b2-04dc9bf9065b :END: #+title: Rhie2023 - plupart des "trous" insolubles à cause de de polymorphismes de structures aux extrémitées et nombreux éléments répétés/polymorphes non finis ou mal assemblé - 151Mbp de séquencce inconnues: - péri/sous-télomorique, duplication segmentaire, ADN ribosomal - bras court des 4 chromosomes acrocentrique (13,14,15,21,22), HSat (human satellite repeat array) - certaines régions sont artificielles : dans le centromère, certaines zones du centromère dite alpha satellite (Fig. \ref{fig:alpha-satellite} [fn:35] sont représenté sous forme d'un modèle informatique[fn:34] - régions mal assemblées : bras court du chr21 Méthode: - utilisation d'une mode hydatiform (Complete HM soit CHM) qui ont un caryotype 46XX (perte du complémente maternel avec duplication paternel) - plus part est d'origine européen avec régions introgression nanderthale - pas plus de variant perte de fonction que échantillions du projet 1000 génome, ni d'allèles isolée - ultra-long read pour régions répétées (nanopore) et pacbio hifi pour read 20kb (compromis avec taux d'erreur de 0.1%), + autre (illumina pcr-free, illumina hi-c pour interaction de chromatine, bionano map optinque single cell Strand-seq) Résultat: - 8% du génome: ajout de 238Mbp (4.5% dont 182 exclusif T2T - pas de trous, pas de contig - +5% gène - sur 1000 génomes : diminue faux positifs et faux négatifs - manque 5 régions des ADN ribsomaux les plus répété (9.9Mbp)