B:BD[
2.33326] → [
2.33326:37097]
] 2300294712_63109236
- [ ] 2300308032_63111581
- [ ] 2300323537_63114209
- [ ] 2300334609_63115535
- [ ] 2300346867_63118093
- [ ] 2300346867_63118093_NA12878
- [ ] 2300348940_63118099
- [ ] 2300359806_63119915
- [ ] 2300380476_63123963
- [ ] 2300382582_63123749
- [ ] 2300384269_63126867
- [ ] 2300407581_63130826
- [ ] 2300407626_63130842
- [ ] 2300409593_63130874
- [ ] 2300409612_63130980
- [ ] 2300417623_63131524
** TODO Variants manqués :missed:
SCHEDULED: <2023-10-21 Sat>
*** DONE 63012582: chr10:g.102230760 filtré par AD :63012582:
CLOSED: [2023-10-08 Sun 23:24] SCHEDULED: <2023-10-08 Sun>
Il est en sortie d'haplotypecaller !
Attention à la position : POS=102230753 noté CG->C
GT:AD:DP:GQ:PL 0/1:26,8:34:99:146,0,671
Filtré par la condition AD <= 10 (porté par 8 reads seulement)
Non confirméen sanger, rendu vous
**** KILL image BAM cento
CLOSED: [2023-10-08 Sun 23:13]
**** DONE image BAM bisonex
CLOSED: [2023-10-08 Sun 23:23] SCHEDULED: <2023-10-08 Sun>
**** DONE Mail Paul
CLOSED: [2023-10-08 Sun 23:24] SCHEDULED: <2023-10-08 Sun>
*** DONE 63060439: chr15:g.26869324 = Problème de profondeur DP=15 :63060439:
CLOSED: [2023-10-08 Sun 23:24] SCHEDULED: <2023-10-08 Sun>
GABRA5
Rendu VOUS avec un variant patho MDB5 pour même patient (VOUS- même)
Non confirmé en Sanger
GT:AD:DP:GQ:PL 0/1:9,6:15:99:103,0,213
**** DONE image BAM bisonex
CLOSED: [2023-10-08 Sun 22:56]
**** DONE Mail Paul
CLOSED: [2023-10-08 Sun 23:24] SCHEDULED: <2023-10-08 Sun>
** TODO Comparer variants cento à sortie bisonex :checkpipeline:
SCHEDULED: <2023-10-21 Sat>
*** TODO Un seul exécutable pour toutes les étapes
SCHEDULED: <2023-10-21 Sat>
Un utilitaire en ligne de commande qui appel les différentes étapes.
On utilise une structure unique pour toutes les étapes mais qui sera remplie au fur et à mesure. En stockant dans un csv à chaque étape
**** DONE parse variants
CLOSED: [2023-10-21 Sat 23:29] SCHEDULED: <2023-10-21 Sat>
**** DONE Ajouter négatifs dans la liste des variants
CLOSED: [2023-10-22 Sun 23:01] SCHEDULED: <2023-10-21 Sat>
**** DONE Mettre à jour liste des variants
CLOSED: [2023-10-22 Sun 23:01] SCHEDULED: <2023-10-21 Sat>
- [X] Régéner la liste des variants
- [ ] Retrouver les variants modifié à la main avec diff
On ne garde que les ajouts
#+begin_src sh
awk -F ',' '{print $1","$2":"$3$4$5}' extracted.csv | ^sort | save -f extracted_concat.csv
xsv select 1-2 ~/annex/data/centogene/variants/variant_genomic.csv | ^sort | save variant_genomic_corr.csv -f
diff extracted_concat.csv variant_genomic_corr.csv | grep '^>' | save -f update.diff
#+end_src
- [X] Ajouter négatifs
345 variants non trouvés avant modification
141 après modification
- [X] Ajouter différence
- [X] Corriger erreurs de parsing
**** KILL Lifter coordonées variants cento génomique en GRCh38
CLOSED: [2023-10-21 Sat 22:47]
**** DONE Un seul type de données
CLOSED: [2023-10-25 Wed 09:13] SCHEDULED: <2023-10-21 Sat>
**** KILL variant_recoder pour avoir les coordonnées VCF
CLOSED: [2023-10-25 Wed 09:13] SCHEDULED: <2023-10-21 Sat>
mobidetails n e trouve pas les ieux transcrits
**** DONE Annotation mobidetails (gene + données gonémique)
CLOSED: [2023-10-25 Wed 09:14]
**** DONE Envoyer liste à Paul
SCHEDULED: <2023-10-26 Thu>
**** TODO compare chaque variant avec la sortie du pipeline
SCHEDULED: <2023-10-21 Sat>
**** TODO confirme ou non en Sanger
SCHEDULED: <2023-10-21 Sat>
* Résultats
** TODO Speed-up BWA-mem
SCHEDULED: <2023-10-29 Sun>
** TODO Speed-up Hapotypecaller
SCHEDULED: <2023-10-29 Sun>
* Communication
** DONE Mail NGS-diag
CLOSED: [2023-10-06 Fri 08:04] SCHEDULED: <2023-10-06 Fri>
/Entered on/ [2023-10-04 Wed 19:33]
] 2300294712_63109236
- [ ] 2300308032_63111581
- [ ] 2300323537_63114209
- [ ] 2300334609_63115535
- [ ] 2300346867_63118093
- [ ] 2300346867_63118093_NA12878
- [ ] 2300348940_63118099
- [ ] 2300359806_63119915
- [ ] 2300380476_63123963
- [ ] 2300382582_63123749
- [ ] 2300384269_63126867
- [ ] 2300407581_63130826
- [ ] 2300407626_63130842
- [ ] 2300409593_63130874
- [ ] 2300409612_63130980
- [ ] 2300417623_63131524
** TODO Variants manqués :missed:
SCHEDULED: <2023-10-21 Sat>
*** DONE 63012582: chr10:g.102230760 filtré par AD :63012582:
CLOSED: [2023-10-08 Sun 23:24] SCHEDULED: <2023-10-08 Sun>
Il est en sortie d'haplotypecaller !
Attention à la position : POS=102230753 noté CG->C
GT:AD:DP:GQ:PL 0/1:26,8:34:99:146,0,671
Filtré par la condition AD <= 10 (porté par 8 reads seulement)
Non confirméen sanger, rendu vous
**** KILL image BAM cento
CLOSED: [2023-10-08 Sun 23:13]
**** DONE image BAM bisonex
CLOSED: [2023-10-08 Sun 23:23] SCHEDULED: <2023-10-08 Sun>
**** DONE Mail Paul
CLOSED: [2023-10-08 Sun 23:24] SCHEDULED: <2023-10-08 Sun>
*** DONE 63060439: chr15:g.26869324 = Problème de profondeur DP=15 :63060439:
CLOSED: [2023-10-08 Sun 23:24] SCHEDULED: <2023-10-08 Sun>
GABRA5
Rendu VOUS avec un variant patho MDB5 pour même patient (VOUS- même)
Non confirmé en Sanger
GT:AD:DP:GQ:PL 0/1:9,6:15:99:103,0,213
**** DONE image BAM bisonex
CLOSED: [2023-10-08 Sun 22:56]
**** DONE Mail Paul
CLOSED: [2023-10-08 Sun 23:24] SCHEDULED: <2023-10-08 Sun>
** TODO Comparer variants cento à sortie bisonex :checkpipeline:
SCHEDULED: <2023-10-21 Sat>
*** TODO Un seul exécutable pour toutes les étapes
SCHEDULED: <2023-10-21 Sat>
Un utilitaire en ligne de commande qui appel les différentes étapes.
On utilise une structure unique pour toutes les étapes mais qui sera remplie au fur et à mesure. En stockant dans un csv à chaque étape
**** DONE parse variants
CLOSED: [2023-10-21 Sat 23:29] SCHEDULED: <2023-10-21 Sat>
**** DONE Ajouter négatifs dans la liste des variants
CLOSED: [2023-10-22 Sun 23:01] SCHEDULED: <2023-10-21 Sat>
**** DONE Mettre à jour liste des variants
CLOSED: [2023-10-22 Sun 23:01] SCHEDULED: <2023-10-21 Sat>
- [X] Régéner la liste des variants
- [ ] Retrouver les variants modifié à la main avec diff
On ne garde que les ajouts
#+begin_src sh
awk -F ',' '{print $1","$2":"$3$4$5}' extracted.csv | ^sort | save -f extracted_concat.csv
xsv select 1-2 ~/annex/data/centogene/variants/variant_genomic.csv | ^sort | save variant_genomic_corr.csv -f
diff extracted_concat.csv variant_genomic_corr.csv | grep '^>' | save -f update.diff
#+end_src
- [X] Ajouter négatifs
345 variants non trouvés avant modification
141 après modification
- [X] Ajouter différence
- [X] Corriger erreurs de parsing
**** KILL Lifter coordonées variants cento génomique en GRCh38
CLOSED: [2023-10-21 Sat 22:47]
**** DONE Un seul type de données
CLOSED: [2023-10-25 Wed 09:13] SCHEDULED: <2023-10-21 Sat>
**** KILL variant_recoder pour avoir les coordonnées VCF
CLOSED: [2023-10-25 Wed 09:13] SCHEDULED: <2023-10-21 Sat>
mobidetails n e trouve pas les ieux transcrits
**** DONE Annotation mobidetails (gene + données gonémique)
CLOSED: [2023-10-25 Wed 09:14]
**** DONE Envoyer liste à Paul
SCHEDULED: <2023-10-26 Thu>
**** TODO compare chaque variant avec la sortie du pipeline
SCHEDULED: <2023-10-21 Sat>
Données brutes
#+begin_src
ls ~/annex/data/bisonex/annotate/full/ | wc -l
261
#+end_src
Parmis les variant annotaté :
#+begin_src sh
cabal run -- checkpipeline search -i variant_annotated.csv -d ~/annex/data/bisonex/annotate/full/ | save out.txt -f
#+end_src
Positifs retrouvés (nombre de patient)
#+begin_src
❯ rg '\\? True' out.txt | rg '"6\d+' -o | sed 's/"//' | ^sort | ^uniq | wc -l
98
#+end_src
Positifs manqués
#+begin_src
❯ rg '\\? False' out.txt | rg '"6\d+' -o | sed 's/"//' | ^sort | ^uniq | wc -l
5
#+end_src
Et les négatifs ?
#+begin_src sh
open variant_extracted.csv | where transcript == negatif | get file | split column ' ' | get column1 | sort | uniq | save negatif.txt -f
ls ~/annex/data/bisonex/annotate/full/ | get name | path basename | split column '-' | get column2 | split column '_' | get column1 | sort | uniq | save -f raw.txt
comm -12 negatif.txt raw.txt | wc -l
136
#+end_src
- 98 positifs retrouvés
- 5 manqué
- 136 rendus négatifs
Total: 239
A faire : chercher le variant pour chaque run
**** TODO confirme ou non en Sanger
SCHEDULED: <2023-10-21 Sat>
* Résultats
** TODO Speed-up BWA-mem
SCHEDULED: <2023-10-29 Sun>
** TODO Speed-up Hapotypecaller
SCHEDULED: <2023-10-29 Sun>
* Communication
** DONE Mail NGS-diag
CLOSED: [2023-10-06 Fri 08:04] SCHEDULED: <2023-10-06 Fri>
/Entered on/ [2023-10-04 Wed 19:33]