#+title:      Patterns and rates of exonic de novo mutations in autism spectrum disorders
#+date:       [2024-07-22 Mon 10:41]
#+filetags:   :bib:facebook:
#+identifier: 20240722T104147
#+reference:  neale2012patterns

Méthode : 175 exome en trio

* Calcul du taux de mutation (Supplementary): seulement proba par gène
Veulent tout l’exome mais ce qui nous intéresse est la probabilité d’une mutation d’une base.

Justification pour utiliser le contexte : GC 50% en exome alors que 4 en génome. Les sites les plus cournats sont C->T sur CpG.

Hypothèse : la connaissance des 2 nucléotides adjacent suffit pour estimer la probabilité.
Pré-requis : la probabilité de chaque permutation de chaque triplet soit une matrice 64x3 car
- 4 nucléotides sur 3 position donc 4^3 triplets
- 3 permutations possibles
** Algorithme
- Une estimation de cette matrice donnée par [cite:@kryukov2007most] en utilisant des différences humain-chimpanzée-babouin. Matrice non disponible dans l’article original ! Et méthode non facilement reproductible...
- Une autre estimation est donnée par les auteurs avec donnée 1000Genome
  - restreint aux régions intergéniques orthologues (=ancêtre commun) entre humain et chimpanzé
  - toutes les mutations 1000Genomes en supposant que l’allèle du chimpanzé = ancetre et ALT est l’allèle dérivée
  - arrive à un compte pour tous les configurations + matrice
- la probabilité d’un trinucléotide = nombre de mutation dans ce contexte / nb occurrence trinuclétodie, le tout pondér par une constante $\lambda$
- le taux de mutation de ce nucléotide est donc divisé entre les 3 trinucléotides possibles

* Github
https://github.com/jamesware/denovolyzeR
Donnes la table de proba par gène... (Meme dans data-raw)