Pas très concluant…
AZYRMLWV65VAHND5G3SXGB6DLWR2DO64T7H6C3NIFHW2EBXP3KTQC
32QB2VUPHXYATA4CKX65QOK5QWKULJK36RJCEYRYS2LGA3C3WLHAC
Y2SHXHEPVYTZSL3ZW222W7E76VCBHEVZLFLPAMW6Y5CKAHPK6RPAC
2QF7HCG5CLNOBSZUKSHRI2MR4FHHXWY22ZP7JMWD52ZSO2LO2DLAC
EXXDISQ3I67ZY3JZP7BFBDXLHLL5YIPQMXYMN4IPTNYJFOFPLOPAC
D7C6HJBOMSGMIVHXWDTYRK5GJ2LWWPKQKI3GFQLHN3XHGH4KEKXQC
VF7UKNIF73KICCJULRNI4TBTFIRQDFXIP2SEFXPK7NX5H3B4XMCQC
#+title: Thursday 25 July 2024 15:51
#+date: [2024-07-25 Thu 15:51]
#+filetags: :journal:
#+identifier: 20240725T155128
Biblio facebook sur modèle stat: se base sur le 2 nucléotides adjacent
- 1er modèle [cite:@kryukov2007most] mais ne donne pas de matrice de mutation
- [cite:@neale2012patterns] idem et complète avec 1000 Genomes. Ne la donne pas non plus
- [cite:@samocha2014framework] idem avec des scores d’ajustement. Ne donne que des scores par gènes...
Reproductibilité pour l’instant compliqué (je veux la matrice !)
#+title: Neighboring-nucleotide effects on the rates of germ-line single-base-pair substitution in human genes
#+date: [2024-07-25 Thu 16:23]
#+filetags: :bib:facebook:
#+identifier: 20240725T162345
#+reference: krawczak1998neighboring
Algorithme en bref : maximiser la probabilité d’une mutation (?)
- en supposant que la probabilité d’une mutation $x$ et d’une conséquence "phénotypique" $\alpha$ est le produit de la probabilité de la mutation de l’ADN $\mu(x)$ et de l’"observation clinique" L(\alpha)
Le phénotype est simplement la distance de Grantham
Pas clair comment sont calculées
#+title: Most rare missense alleles are deleterious in humans: implications for complex disease and association studies
#+date: [2024-07-25 Thu 15:36]
#+filetags: :bib:facebook:
#+identifier: 20240725T153619
#+reference: kryukov2007most
Cité par [cite:@neale2012patterns] pour construction d’une matrice de mutation.
Non donnée dans l’article...
* Contexte
- CpG = plus de mutation
- transition plus fréquente que transversion
- Différents modèle
* Matrice
SNV seuls. Il y a 64 triplets possible donc 64x3 permutations possible.
Méthode précise non claire
- "second-ordre" sur les voisins
- calculée à partir du génome humain, chimpanzé et babouins
- les mutation humaines après divergence du chimpazée sont obtenues
- par alignement humain-chimpanze et humain-macacque
- filtre dbSNP
- macque comme controle
Pas lu le reste
Pour calculer le taux de mutation, estimation avec le modèle statistique si dessus
NB: les variant semblent avoir été confirmés en Sanger
* Calcul du taux de mutation
Veulent tout l’exome mais ce qui nous intéresse est la probabilité d’une mutation d’une base.
Justification pour utiliser le contexte : GC 50% en exome alors que 4 en génome. Les sites les plus cournats sont C->T sur CpG.
Hypothèse : la connaissance des 2 nucléotides adjacent suffit pour estimer la probabilité.
Pré-requis : la probabilité de chaque permutation de chaque triplet soit une matrice 64x3 car
- 4 nucléotides sur 3 position donc 4^3 triplets
- 3 permutations possibles
** Algorithme
- Une estimation de cette matrice donnée par [cite:@kryukov2007most] en utilisant des différences humain-chimpanzée-babouin. Matrice non disponible dans l’article original ! Et méthode non facilement reproductible...
- Une autre estimation est donnée par les auteurs avec donnée 1000Genome
- restreint aux régions intergéniques orthologues (=ancêtre commun) entre humain et chimpanzé
- toutes les mutations 1000Genomes en supposant que l’allèle du chimpanzé = ancetre et ALT est l’allèle dérivée
- arrive à un compte pour tous les configurations + matrice
- la probabilité d’un trinuclétodie = nombre de mutation dans ce contexte / nb occurrence trinuclétodie, le tout pondér par une constante $\lambda$
- le taux de mutation de ce nucléotide est donc divisé entre les 3 trinuclétodie possibles
* Modèle de base
À noter que[cite:@krawczak1998neighboring] conseille d’inclure les 5’ et 3’
1. table de probabilité de mutation d’un nucléotide (en se basant sur trinucléotide): idem que [cite:@neale2012patterns] (détaillé dans la note) avec al matrice 1000 génome
On a donc 64x3 possibilités
2. probabilité par gène: pour chaque base du gène, on détermine le trinucléotide et on somme les probabilités dans la table pour les 3 possibilité (3 autres nucléotides possibles)
* Ajustement
- sur la profondeur: on calcule la probabilité d’appeler un variant de novo donc cela dépend de la qualité du séquencage
- sur leur cohorte, s’il y a des trios avec < 10x couverture sur cette base, la probabilité est multilié par un facteur entre 0.9 et 1 (non clair comment)
- sur la divergence avec les singe : pour capture la déviation du taux de mutation
- score de divergence = nombre de sites divergence/site examens pour la région contenant le gène +/-1 MB. Puis modèle liéaire
- score moyen si pas de score de divergence
- sauf que le taux de mutation prédit a été augmenté donc les probabilité ont été ajusté pour lue la somme soit identique après le score
- (timing de réplication ADN (si tardif, plus de mutation): utilisation des Z-score de Koren et al. -> retiré car n’apporte pas d’information !)
Résultat
- [[https://static-content.springer.com/esm/art%3A10.1038%2Fng.3050/MediaObjects/41588_2014_BFng3050_MOESM12_ESM.xls][excel avec mutation par gène]]
:END:
****** TODO A framework for the interpretation of de novo mutation in human disease
:PROPERTIES:
:TITLE: A framework for the interpretation of de novo mutation in human disease
:BTYPE: article
:CUSTOM_ID: samocha2014framework
:AUTHOR: Kaitlin E Samocha and Elise B Robinson and Stephan J Sanders and Christine Stevens and Aniko Sabo and Lauren M McGrath and Jack A Kosmicki and Karola Rehnström and Swapan Mallick and Andrew Kirby and Dennis P Wall and Daniel G MacArthur and Stacey B Gabriel and Mark DePristo and Shaun M Purcell and Aarno Palotie and Eric Boerwinkle and Joseph D Buxbaum and Edwin H Cook and Richard A Gibbs and Gerard D Schellenberg and James S Sutcliffe and Bernie Devlin and Kathryn Roeder and Benjamin M Neale and Mark J Daly
:JOURNAL: Nature Genetics
:YEAR: 2014
:VOLUME: 46
:NUMBER: 9
:PAGES: 944-950
:DOI: 10.1038/ng.3050
:URL: http://dx.doi.org/10.1038/ng.3050
:END:
****** DONE Most rare missense alleles are deleterious in humans: implications for complex disease and association studies
CLOSED: [2024-07-25 Thu 15:40]
:PROPERTIES:
:TITLE: Most rare missense alleles are deleterious in humans: implications for complex disease and association studies
:BTYPE: article
:CUSTOM_ID: kryukov2007most
:AUTHOR: Kryukov, Gregory V and Pennacchio, Len A and Sunyaev, Shamil R
:JOURNAL: The American Journal of Human Genetics
:VOLUME: 80
:NUMBER: 4
:PAGES: 727--739
:YEAR: 2007
:PUBLISHER: Elsevier
:END:
****** KILL Neighboring-nucleotide effects on the rates of germ-line single-base-pair substitution in human genes
CLOSED: [2024-07-25 Thu 17:13]
:PROPERTIES:
:TITLE: Neighboring-nucleotide effects on the rates of germ-line single-base-pair substitution in human genes
:BTYPE: article
:CUSTOM_ID: krawczak1998neighboring
:AUTHOR: Krawczak, Michael and Ball, Edward V and Cooper, David N
:JOURNAL: The American Journal of Human Genetics
:VOLUME: 63
:NUMBER: 2
:PAGES: 474--488
:YEAR: 1998
:PUBLISHER: Elsevier
:END:
****** DONE A framework for the interpretation of de novo mutation in human disease
CLOSED: [2024-07-25 Thu 17:49]
:PROPERTIES:
:TITLE: A framework for the interpretation of de novo mutation in human disease
:BTYPE: article
:CUSTOM_ID: samocha2014framework
:AUTHOR: Kaitlin E Samocha and Elise B Robinson and Stephan J Sanders and Christine Stevens and Aniko Sabo and Lauren M McGrath and Jack A Kosmicki and Karola Rehnström and Swapan Mallick and Andrew Kirby and Dennis P Wall and Daniel G MacArthur and Stacey B Gabriel and Mark DePristo and Shaun M Purcell and Aarno Palotie and Eric Boerwinkle and Joseph D Buxbaum and Edwin H Cook and Richard A Gibbs and Gerard D Schellenberg and James S Sutcliffe and Bernie Devlin and Kathryn Roeder and Benjamin M Neale and Mark J Daly
:JOURNAL: Nature Genetics
:YEAR: 2014
:VOLUME: 46
:NUMBER: 9
:PAGES: 944-950
:DOI: 10.1038/ng.3050
:URL: http://dx.doi.org/10.1038/ng.3050
}
@article{kryukov2007most,
author={Kryukov, Gregory V and Pennacchio, Len A and Sunyaev, Shamil R},
title={Most rare missense alleles are deleterious in humans: implications for complex disease and association studies},
journal={The American Journal of Human Genetics},
year={2007},
volume={80},
number={4},
pages={727--739}
}
@article{krawczak1998neighboring,
author={Krawczak, Michael and Ball, Edward V and Cooper, David N},
title={Neighboring-nucleotide effects on the rates of germ-line single-base-pair substitution in human genes},
journal={The American Journal of Human Genetics},
year={1998},
volume={63},
number={2},
pages={474--488}
** TODO MR-2300938
SCHEDULED: <2024-07-26 Fri>
/Entered on/ [2024-07-25 Thu 11:35]
Suite à auramatcher pour http://172.25.219.90:8080/aurapport/app/#/main/summary?case=MR-2401008-t
TNRC6B diag ?
* Interprétation génomes/Montpellier