#+title: Discovery of non-reference processed pseudogenes in the Swedish population #+date: [2024-07-17 Wed 15:38] #+filetags: :bib:pseudogène: #+identifier: 20240717T153851 #+reference: boer2023processen Objectif : nouveaux processed pseudogene à partir de génome Contexte: déjà fait mais à 5x seulement Code: Processen https://github.com/J35P312/Processen Algorithme - pairs avec reads sur même gène mais exons différent avec taille d'insert plus grande qu'attendue - ces reads sont aligné sur le transcriptome avec Salmon - position : on cherche variants de structure dans le vcf annoté (delly pour appel de variant, VEP) pour annot puis - insertion si une position est proche du début ou fin du gène parent /et/ autre position sur autre chromosome/l'équivalent de la longeur du gène parent - site d'insertion fusionnés si <= 500bp visualation : circos plot (logiciel) Résultats - appliqués au génome de 1000genomes + cohorte SweGen : 3 021 processed pseudogene manquant dans GRch38