32QB2VUPHXYATA4CKX65QOK5QWKULJK36RJCEYRYS2LGA3C3WLHAC
QJBDJ7LWMXM65Z3YJ4CAWUXEQM7HZ43HPSGRJBIS2YNSC3Z6FVXAC
VF7UKNIF73KICCJULRNI4TBTFIRQDFXIP2SEFXPK7NX5H3B4XMCQC
2QF7HCG5CLNOBSZUKSHRI2MR4FHHXWY22ZP7JMWD52ZSO2LO2DLAC
Y2SHXHEPVYTZSL3ZW222W7E76VCBHEVZLFLPAMW6Y5CKAHPK6RPAC
D73WPSDSMAUT4MJKM4SKYMCKITO3H7MAZMBSZYUTS32YPN66SSMAC
EXXDISQ3I67ZY3JZP7BFBDXLHLL5YIPQMXYMN4IPTNYJFOFPLOPAC
D7C6HJBOMSGMIVHXWDTYRK5GJ2LWWPKQKI3GFQLHN3XHGH4KEKXQC
#+title: Validation
#+date: [2024-07-24 Wed 10:42]
#+filetags: :pipeline:auragen:
#+identifier: 20240724T104200
- SNV hap.py sur données gIAB
- CNV: truvaria sur Chaisson. et al., (2019): Multi-platform discovery of haplotype-resolved structural variation in human genomes
:PROPERTIES:
:ID: cef32d57-e0a3-4b76-afd2-326830576462
:END:
#+title: Problèmes connus
#+filetags: auragen
[[id:2228958a-bcde-4256-819d-00237877e5e5][Limite appels de variants]]
[[id:7310f8fa-7518-48f7-bc11-ec14d8e0cbf1][Limites annotation]]
[[id:f4582bec-9f09-4068-8cd0-65b4fb22413d][Limite rendus]]
:PROPERTIES:
:ID: 30db1b6c-6f95-40db-a363-202b20412d4f
:END:
#+title: Outils pour la détection de variants
- région d'homozygotie [[id:92f64d28-a582-484b-8181-ea04c13d850d][ROH]]
- détection des points de cassure (avec Manta)
- Estimation ploïdie : profondeur sur chromosome/profondeur génome
- non signalées si couveture insuffisante/librairie atypiques (avertissement)
:PROPERTIES:
:ID: 0f58767c-07ff-401b-977d-15d454a3ab0f
:END:
#+title: Exemples de variants structurels
invdup MR-2203330 rendu chr8:g.( ?_8,231,549)_10,888,653delins11,100,482_(12,035,836_?)inv
inversion paracentrique 18q MR-2402177 30Mb chr18:36,491,658-67,312,508
#+title: Runs of Homozygosity (ROH)
#+date: [2024-07-25 Thu 09:55]
#+filetags: :pipeline:auragen:
#+identifier: 20240725T095524
- attention, on renvoie des RoH et LoH (loss of heterozygotie)
- Utile pour voir si consanguinité, disomie uniparentale
- limite basse 2Mb
- résultat sous forme de tableau. Les courbes brutes semblent utiles mais non rendus car on ne sait pas les interpréter ?
#+title: Outils pour la détection des variants
#+date: [2024-07-25 Thu 09:52]
#+filetags: :auragen:pipeline:
#+identifier: 20240725T095212
- région d'homozygotie [[denote:20240725T095524][Runs of Homozygosity (ROH)]]
- détection des points de cassure (avec Manta)
- Estimation ploïdie : profondeur sur chromosome/profondeur génome
- non signalées si couveture insuffisante/librairie atypiques (avertissement)
#+title: Exemples de variants structurels
#+date: [2024-07-25 Thu 09:31]
#+filetags: :auragen:interprétation:
#+identifier: 20240725T093105
invdup MR-2203330 rendu chr8:g.( ?_8,231,549)_10,888,653delins11,100,482_(12,035,836_?)inv
inversion paracentrique 18q MR-2402177 30Mb chr18:36,491,658-67,312,508
#+title: Rétrotranscription de transcrits (GRIPS)
#+date: [2024-07-25 Thu 09:29]
#+filetags: :auragen:pipeline:
#+identifier: 20240725T092957
GRIPS = Retrocopy insertion polymorphism
définition: insertion d'ADN médiée par ARN messager
Le gène rétrotranscrit est fonctionnellement actif (contraiment au pseudogène)
On le voit avec des reads qui sont sur l'exon d'un autre chromosome avec l'autre extrémité du paired-end sur des zones communes (en blue ci-dessous)
Image:
https://genomebiology.biomedcentral.com/articles/10.1186/gb-2013-14-3-r22
Source : https://genomebiology.biomedcentral.com/articles/10.1186/gb-2013-14-3-r22
* Y penser si
Pendant l'interprétation, on soupçone ça si il y a une poly-Tail (plein d'adénosine) avec des BLAT sur des intervalles énormes
[[http://172.25.219.90:8080/help/mroc/faq/slides/PasAPas_grips.pdf][Exemple]] : ARN messager de KYAT3 (chr1) inséré sur le chormosome 6
- augmentation de la profondeur sur les exons d'un gènes
- soft-clip aux jonction introns/exons
- le dernier exon s'aligne à la foir sur le chrome 1 (+ queue poly-A) et sur le chromosome 6
- approche "read depth" = rupture de profondeur (par opposition à Manta [[id:7c2aae7d-c1a3-4ff5-91f4-14888c6fd590][Délétion et duplications 50bp - 21kb]])
- approche "read depth" = rupture de profondeur (par opposition à Manta [[denote:20240725T092255][Délétion et duplications 50pb-21kb]])
#+title: Délétion et duplications 50bp - 21kb
#+date: [2024-07-19 Fri 11:32]
#+filetags: :pipeline:manta:cnv
#+identifier: 20240719T113251
#+title: Délétion et duplications 50pb-21kb
#+date: [2024-07-25 Thu 09:22]
#+filetags: :pipeline:auragen:
#+identifier: 20240725T092255
#+title: Appel de variants
#+date: [2024-07-25 Thu 09:22]
#+filetags: :auragen:pipeline:
#+identifier: 20240725T092233
- SNV et petits indel <= 50bp : haplotypecaller
- taille des indel : haplotypecaller semble monter jusque 108bp ?
- +genotypevcf = appel par groupe après hapolytpecaller
- [[denote:20240725T092255][Délétion et duplications 50pb-21kb]]
- [[denote:20240725T092541][Gains et pertes > 21kb]]
- [[denote:20240725T092901][Variants structurels]]
- STR : [[denote:20240725T093303][ExpansionHunter]]
[[denote:20240725T092157][Limites appel de variant]]
#+title: Limites appel de variant
#+date: [2024-07-25 Thu 09:21]
#+filetags: :auragen:pipeline:
#+identifier: 20240725T092157
* CNV
Ploïdies : voir
* STR
STR avec expansionhunter
- seulement en ciblé
- estimation du nombre de répétition (peu précis)
#+title: Problèmes connus
#+date: [2024-07-25 Thu 09:21]
#+filetags: :auragen:pipeline:
#+identifier: 20240725T092103
[[denote:20240725T092157][Limites appel de variant]]
[[id:7310f8fa-7518-48f7-bc11-ec14d8e0cbf1][Limites annotation]]
[[id:f4582bec-9f09-4068-8cd0-65b4fb22413d][Limite rendus]]
#+title: Absplice
#+date: [2024-07-25 Thu 09:13]
#+filetags: :prédiction:épissage:pipeline:
#+identifier: 20240725T091334
Prédiction des anomales d’épissage (“aberrant”) grâce à l’amélioration récente des outils de prédiction (utilisations de tissus humain)
Apport
- Considère les anomalies "extrêmes" d’épissage (outlier) depuis au moins 2 tissus d'1 individus
- Combine 3 outils : MMSplice, SpliceAI + 1 outil “tissue-specific” SpiceMap
- Données ADN +/- données RNAsq si disponibles pour améliorer les prédiction
- Base de données de test : annotation de tissus basé sur GTEx (49) avec sites accepteur et donneur crée avec [[https://github.com/gagneurlab/FRASER][FRASER]] (le pipeline correspondant est [[https://github.com/gagneurlab/drop][DROP]])
- [[id:cc54e449-12a7-41d6-832b-33937255be92][Contrôle qualité]] et [[id:117f7970-2579-48e1-b7b0-026b4c9fd0a6][Avertissement]]
- [[id:ee261ae7-3511-46e0-8c9a-ad4318850104][Appel de variant]]
- [[denote:20240719T113354][Controle qualité]] et [[denote:20240719T113108][Avertissement]]
- [[denote:20240725T092233][Appel de variants]]
* Prédiction bioinformatique
** Épissage
*** Aberrant splicing prediction across human tissues
:PROPERTIES:
:TITLE: Aberrant splicing prediction across human tissues
:BTYPE: article
:CUSTOM_ID: wagner2023aberrant
:AUTHOR: Wagner, Nils and {\c{C}}elik, Muhammed H and H{\"o}lzlwimmer, Florian R and Mertes, Christian and Prokisch, Holger and Y{\'e}pez, Vicente A and Gagneur, Julien
:JOURNAL: Nature genetics
:VOLUME: 55
:NUMBER: 5
:PAGES: 861--870
:YEAR: 2023
:PUBLISHER: Nature Publishing Group US New York
:URL: https://www.nature.com/articles/s41588-023-01373-3
:END:
*** STRT The risk of re-identification versus the need to identify individuals in rare disease research
SCHEDULED: <2024-07-23 Tue>
*** DONE The risk of re-identification versus the need to identify individuals in rare disease research
CLOSED: [2024-07-24 Wed 18:16] SCHEDULED: <2024-07-23 Tue>