#+title:      Identification of Pseudogenes in Brachypodium distachyon Chromosomes
#+date:       [2024-07-17 Wed 17:33]
#+filetags:   :bib:pseudogène:
#+identifier: 20240717T173314
#+reference:  camiolo2018identification

Algorithme de [cite:@camiolo2018identification] , inspiré de [cite:@zhang2006pseudopipe]

Identification
1. séquence peptidique pour exons codons = utilisé pour recherche tPlantN sur une version "hard masked" du génome de référence
2. CDS qui correspondent à > 30% d'une région répétée filtrées
3. exon codant + nucléotide des régions adjacente (entre 51 et 53bp) : on sélection les hit avec > 50% d'intetié et e-value < 10-6
4. fusion des résultat si < 100bp
5. hit overlap > 20% sont groupé et on ne retinent que les meilleures paire pseudègene-requte
6. classification dupliqué/processe/ambigue