:PROPERTIES: :ID: 94038e1b-de4f-48f2-acc4-0ee0e75cf197 :END: #+title: Curagen #+filetags: filtres auragen * Annotations - Présent gènes filières ("expert") : booléean - HPO: classé à partir des termes rentrés par le prescripteur (phrank) - régions d'homozygotie : voir [[id:92f64d28-a582-484b-8181-ea04c13d850d][ROH]] - transmission : - /homozygote/: 1 allèle alternatix ou VAB >= 90% - /complex/ : 2 allèles alternatifs différents - /undetermined/ si parent manquant/structure familiale complexe - hétérozygote de novo - /de_novo/ : non retrouvé cohorte, >= 2 lectures cas index et < 2 lectures parents - /de_novo_high_ac/ : retrouvé cohorte - /possilbe_de_novo/ : >= 2 reads chez parent mais gT parental 0/0 - hétérozygote hérité d'un parent - /inherited_parental_lineage_1/ ou /_2/ : sans ambiguité - /undetermined/ : si ambiguïté (présent chez 2 parent) - /possible_parent1/2/ : 1 parent non séquencé/génotypé - /mendelian_error/ : 2 parents homozygotes et index hétérozygote par exemple ** Corrélation génotype-phénotype - /segregating/ ou /not-segregating/ (il faut que le parent soit marqué atteint ou non) - pénétrance incomplète si /not_segregating/ : /family_positive/ 2/3 par exemple, /family_negative/ 0/0 - porteur ou non selon le l'allèle alternatif du cas index - rappel : hts = hétérozygote sur allèle alteratif (génotype 0/1), complexe = 2 allèles alt (0/2) - ex: index htz et apparenté htz -> apparenté porteur - idem si index hmz alt - attention si index htz et apparent hmz alt : porteur si non atteinte mais inconclusif si atteint - voir diapos pour différents status - /family_positive/ = nb porteur atteint/nb porteurs (valeur prédictive positive) - /family_negative/ = nb non porteur non atteint/nb non porteurs (valeur prédictive positive) ** Au niveau du transcript transcript - transcript "biallélique" (>= 1 variation sur chaque allèle parental). Rappel: on est à l'échelle d'un gène ! - on ne connait pas le phasage ! On l'infère à partir de la transmission de variants calculée ci-dessus - il y 2 allèles alternatifs à la même position de sûr si taggé /homozygous/ ou /complex/ (par définition, cf supra) - 2 allèles alternatifs pas forcément à la même position si /possible_parent1/ ou /inherited_parental_lineage_1/ - on ne sait pas si /de_novo/ (high_ac ou possible également) ou /undetermined/ - calculé sur le transcrit et appliqué à tous les variants de celui-ci - /biallelic/ : >= 1 certain - /biallelic_de_novo/ : idem mais >= 1 de novo - /possible_biallelic/ si 1 ou 2 incertains - worst impact sur transcrit : si /biallelic/ ou /possible_biallelic/, on prend le pire impact pour chaque allèles - toujours sur le transcrit ! - ex: 1 = modifier, moderate, 2 = high, moderate -> moderate-high - pour un allèle, on prend la pire annotation pour les variants qui sont sur cette allèle de sûr. Sinon la pire annotation des incertains. IDem pour l'autre allèle - ex : - allèle 1 = 0 certains 2 incertains (moderate, high) -> high - allèle 2 : 2 certains (low, modifier) -> low * Filtres - VAF > 10% et au moins 2 reads avec variation ? - VAF >= 25% *et* - impact codant/épissage (HIGH/MODERATE/splice_region_variant) - ou clinvar (probablement) patho - ou impact épissage (CAD phread > 25 ou spliceai >= 0.2) ** Si >= 1 parent - /non/ clinvar (probablement) bénin - *et* - de novo (il faut les 2 parents) - ou transcrit avec variation biallélique (hmz ou htz composite) - ou ségrège dans la famille - ou clinvar (probablement)) patho - *et* - gène en lien avec clinique - ou de novo stricte <= 5 fois dans gnomad (il faut les 2 parent) - ou transcrit avec variation biallélique avec variant impactang codant/épissage /hérité de chaque parent/ ** Pas de parent - AF cohorte < 5 *et* - clinvar (probablement) patho - ou (gène en line avec clinique *et* < 10 fois gnomad)