:PROPERTIES:
:ID:       94038e1b-de4f-48f2-acc4-0ee0e75cf197
:END:
#+title: Curagen
#+filetags: filtres auragen

* Annotations
- Présent gènes filières ("expert") : booléean
- HPO: classé à partir des termes rentrés par le prescripteur (phrank)
- régions d'homozygotie : voir [[id:92f64d28-a582-484b-8181-ea04c13d850d][ROH]]
- transmission :
  - /homozygote/: 1 allèle alternatix ou VAB >= 90%
  - /complex/ : 2 allèles alternatifs différents
  - /undetermined/ si parent manquant/structure familiale complexe
  - hétérozygote de novo
    - /de_novo/ : non retrouvé cohorte, >= 2 lectures cas index et < 2 lectures parents
    - /de_novo_high_ac/ : retrouvé cohorte
    - /possilbe_de_novo/ : >= 2 reads chez parent mais gT parental 0/0
  - hétérozygote hérité d'un parent
    - /inherited_parental_lineage_1/ ou /_2/ : sans ambiguité
    - /undetermined/ : si ambiguïté (présent chez 2 parent)
    - /possible_parent1/2/ : 1 parent non séquencé/génotypé
    - /mendelian_error/ : 2 parents homozygotes et index hétérozygote par exemple
** Corrélation génotype-phénotype
- /segregating/ ou /not-segregating/ (il faut que le parent soit marqué atteint ou non)
- pénétrance incomplète si /not_segregating/ : /family_positive/ 2/3 par exemple, /family_negative/ 0/0
- porteur ou non selon le l'allèle alternatif du cas index
  - rappel : hts = hétérozygote sur allèle alteratif (génotype 0/1), complexe = 2 allèles alt (0/2)
  - ex: index htz et apparenté htz -> apparenté porteur
  - idem si index hmz alt
  - attention si index htz et apparent hmz alt : porteur si non atteinte mais inconclusif si atteint
  - voir diapos pour différents status
- /family_positive/ = nb porteur atteint/nb porteurs (valeur prédictive positive)
- /family_negative/ = nb non porteur non atteint/nb non porteurs (valeur prédictive positive)

** Au niveau du transcript transcript
- transcript "biallélique" (>= 1 variation sur chaque allèle parental). Rappel: on est à l'échelle d'un gène !
  - on ne connait pas le phasage ! On l'infère à partir de la transmission de variants calculée ci-dessus
    - il y 2 allèles alternatifs à la même position de sûr si taggé /homozygous/ ou /complex/ (par définition, cf supra)
    - 2 allèles alternatifs pas forcément à la même position si /possible_parent1/ ou /inherited_parental_lineage_1/
    - on ne sait pas si /de_novo/ (high_ac ou possible également) ou /undetermined/
  - calculé sur le transcrit et appliqué à tous les variants de celui-ci
  - /biallelic/ : >= 1 certain
  - /biallelic_de_novo/ : idem mais >= 1 de novo
  - /possible_biallelic/ si 1 ou 2 incertains

- worst impact sur transcrit : si /biallelic/ ou /possible_biallelic/, on prend le pire impact pour chaque allèles
  - toujours sur le transcrit !
  - ex: 1 = modifier, moderate, 2 = high, moderate -> moderate-high
  - pour un allèle, on prend la pire annotation pour les variants qui sont sur cette allèle de sûr. Sinon la pire annotation des incertains. IDem pour l'autre allèle
    - ex :
      - allèle 1 = 0 certains 2 incertains (moderate, high) -> high
      - allèle 2 : 2 certains (low, modifier) -> low


* Filtres
- VAF > 10% et au moins 2 reads avec variation ?
- VAF >= 25% *et*
  - impact codant/épissage (HIGH/MODERATE/splice_region_variant)
  - ou clinvar (probablement) patho
  - ou impact épissage (CAD phread > 25 ou spliceai >= 0.2)
** Si >= 1 parent
 - /non/ clinvar (probablement) bénin
 - *et*
   - de novo (il faut les 2 parents)
   - ou transcrit avec variation biallélique (hmz ou htz composite)
   - ou ségrège dans la famille
   - ou clinvar (probablement)) patho
 - *et*
   - gène en lien avec clinique
   - ou de novo stricte <= 5 fois dans gnomad (il faut les 2 parent)
   - ou transcrit avec variation biallélique avec variant impactang codant/épissage /hérité de chaque parent/
** Pas de parent
- AF cohorte < 5 *et*
  - clinvar (probablement) patho
  - ou (gène en line avec clinique *et* < 10 fois gnomad)