:PROPERTIES: :ID: 6a47d6bc-091a-4aa3-afd1-fcf2a0a4e1e2 :END: #+title: Wang2010 * Annotation https://annovar.openbioinformatics.org/en/latest/ - Sur le gène Refseq par défaut (ENSEMBLE, UCSC, GENCODE ou GFF3 "maison") - Basé sur la région: --- régions conservée sur plusieurs espécèse --- site prédiction de liaison pour facteur de transcription --- bandes cytogénétique --- Variants impactant microARN et snoARN (small nucleolar ARN) --- Variants impactant site d'accroches prédits pour microARN --- duplications segmentaire --- variants structurels --- variants publis dans études GWAS (genome-wide association studies) --- zones ENCODE --- variants non codant touchant enhancer, répsesseur, promoteur (prédit par chromHMM par exemple) - peut annoter variants mitochondrial - génome : hg19,hg38 (humain), souris, vers, mouche, levure + autres - intronique, exonique, intergénique, 5'/3' UTR, épissage, upstream/downstram à 1kb - si intronique, retourne les 2 gènes les plus proches - Filtres : - dbSNP, férquence allélique (1000 genomes, exac, gnomad) --- score : - SIFT, polyphen, lrt, muttaionteaster, mutation assesor, fathmm, metasnv, metalr - CADD, GERP++ * Méthode - processus en plusieurs passes - génes "à filtrer" si contiennent variants causant un codon stop mais fréquent (MAF combinée > 1% dans 1000 génomes (par exemple: un variant avec MAF à 0.5 et un autre à 0.8%) * Test - 4 exomes avec 4 variants connus sur /MYH3/