XPVVISXCZTDNHTWH63VBGGNBYPB35DJAMR6J46WKNFP7P53SXBRAC
K2YQCGS5Y23D2K4C4XTBMAV47RGT3T4E2VGUHMRHAUITDOAIWMAQC
IHHTA623TCMD3A6IV5PNKNGVPMKAG5HEMLJYJE2IRXYPQGRR3F2QC
Y2SHXHEPVYTZSL3ZW222W7E76VCBHEVZLFLPAMW6Y5CKAHPK6RPAC
245NIQ5D2RXAMRBKA7MA4PWZBNEUGO6HZZB46YZHI7TERUEX2E7QC
EXXDISQ3I67ZY3JZP7BFBDXLHLL5YIPQMXYMN4IPTNYJFOFPLOPAC
D7C6HJBOMSGMIVHXWDTYRK5GJ2LWWPKQKI3GFQLHN3XHGH4KEKXQC
32QB2VUPHXYATA4CKX65QOK5QWKULJK36RJCEYRYS2LGA3C3WLHAC
VF7UKNIF73KICCJULRNI4TBTFIRQDFXIP2SEFXPK7NX5H3B4XMCQC
AZYRMLWV65VAHND5G3SXGB6DLWR2DO64T7H6C3NIFHW2EBXP3KTQC
#+title: Tuesday 30 July 2024 09:48
#+date: [2024-07-30 Tue 09:48]
#+filetags: :journal:
#+identifier: 20240730T094857
** Brainstorming avec Julien <2024-07-29 Mon 14:00>
- Brouillon fait
- OK pour la séparation des différents cas
- Argumentaire v0.1 mais 2 sont incomplets / à revoir
-
- combinaison de variants rare + phénotype rare : c'est le cas qui craint. Pas de solution pour le moment
** Réunion Philippe Jean <2024-07-29 Mon 17:00>
"Projet fini", content de la classification.
Suggestions
- Intro : utiliser le test de paternité comme accroche ?
- Bien définir les termes pour la CNIL (génotype, phénotype...)
- Utiliser les examples pris sur le forum en conclusion (mais anonymisé)
Associer biostat ? Julien va voir
** Précision Juliens sur Slack aujourd'hui
:PROPERTIES:
:CUSTOM_ID: h:c432fed7-380c-4037-a495-cc0b54e57038
:END:
Gestion des variants non présents dans gnomAD
- variants distants : indépendants et proba <1e-6 (nombre de personnes dans gnomAD = 800K ) donc unique
- variants "proches":
- comment définir des variants proches ?
- comment gérer ? probabilité conditionnelle ?
Au final, on part sur
1. un modèle stat pour estimer la probabilité de mutation d'un variant (de novo, à pondérer sur la cohorte ?)
** À faire
- Faire un plan à partir du document de Julien
- Decipher ne montre que des patients vraiment publics ?
#+title: Monday 29 July 2024 11:45
#+date: [2024-07-29 Mon 11:45]
#+filetags: :journal:
#+identifier: 20240729T114519
Matrice de mutation: revue de[cite:@xie2024statistical] (voir tableau)
- [cite:@neale2012patterns]: non donné
- [cite:@samocha2014framework] : pas dans l'article ni dans dépot
- denovolyzeR : donne seulement matrice par gène (tutorial pour le package r [cite:@ware2015interpreting] article décrivant la méthodo mais ne donnant pas la matrice[cite:@samocha2014framework] )
- denovowest [cite:@kaplanis2020evidence] score de prédiction de patho, (mutation suivent une loi de poisson avec \lammbda = 2\mu_gene N, N état la taille de la distribution)
- TADA [cite:@he2013integrated] probabilité des différents trios : probabilité du variant(/de novo/ estimée à partir de la matrice de sustbutition et selon la transmission), pondérée par pénétrance
- extTADA utilise meme matrice de mutation[cite:@nguyen2017integrated]
- TADA-R : [cite:@li2021integrative] idem TADA
- fitDNM : pas de test de poisson car il suppose que toutes les mutations ont le meme impact. Utilise toujours la matrice de mutation (donné par le Dr Sunyaey), pondéré pour avoir un taux de mutation sur le génome de ".18x10-8" puis pondéré par score fonctionne (Polyphen2 ? Le lien github utilise CADD. Matrice disponible ici https://github.com/TNTurnerLab/fitDNM/blob/main/input_data/mutation_rate_by_trinucleotide_matrix.txt :)
- VARPRISM
- TADA-A
- HeartENN
- mTADA
- M-TADA
- DAWN
- N-DATA
- VBASS
- EncoreDNM
- copie d’une séquence homologue d’ADN (donneur) sur une autre (accepteur). Mécanisme = erreur pendant recombinaison homologue duran ala méoiose
- copie d’une séquence homologue d’ADN (donneur) sur une autre (accepteur). Mécanisme = erreur pendant recombinaison homologue durant la méoise
- SNV et indel non dépendant gene conversion
- GTK et deepvariant
- SNV et indel non dépendant gene conversion) vs GTK et Deepvariant
- régions avec une qualité d'alignement à 0 (logique)
- sensibilité de 0 (logique) vs 43% pour chameleolyzer
- région avec aligement unique : sensbilité 86.3% vs 88% chameleo
- délétion homozygotes,
*** TODO Bien comprendre [cite:@samocha2014framework]
SCHEDULED: <2024-07-30 Tue>
*** TODO Bien le modèle stats [cite:@samocha2014framework] :stat:
SCHEDULED: <2024-07-31 Wed>
*** TODO Regarder quand des variants sont indépendants en terme de distance
SCHEDULED: <2024-08-02 Fri>
*** TODO Probabilité que des variants proches (probab conditionelle ?)
SCHEDULED: <2024-08-02 Fri>
*** TODO Revoir consentement decipher
SCHEDULED: <2024-08-01 Thu>
*** TODO Plan détaillé (gdocs) voir [[denote:20240730T094857][Tuesday 30 July 2024 09:48]]
SCHEDULED: <2024-07-31 Wed>