On génère les positions à chercher dans clinvar.NB: je ne comprends pas pourquoi les régions ne fonctionne pas bien... On fait juste un grep
#+begin_src sh :dir ~/code/bisonex/test_isec
# bcftools query -f '%CHROM\t%POS\t%POS\n' -i 'ID=@missing_id.txt' dbSNP_common_chr20.vcf.gz > to_search.txt
bcftools query -f '%POS\n' -i 'ID=@missing_id.txt' dbSNP_common_chr20.vcf.gz > to_search.txt
#+end_src
#+RESULTS:
Puis on regarde à la main les variations...
#+begin_src sh :dir ~/code/bisonex/test_isec
bcftools query -f '%POS %REF %ALT\ %INFO/CLNSIG\n' -i 'ID=@missing_id.txt' dbSNP_common_chr20.vcf.gz
bcftools query -f '%POS %REF %ALT %INFO/CLNSIG\n' clinvar_chr20.vcf.gz | zgrep -f to_search.txt > to_check.txt
#+end_src
#+RESULTS:
| 3234173 T A | C | G . | . | . | 2 | 2 | | | | |
| 10658574 G A | T . | 2 | 3 | 2 | 2 | 4 | | | | |
| 10672794 G A | C . | 2 | 3 | 2 | 2 | 0 | 0 | | | |
| 18525868 C T . | 0 | 2 | | | | | | | | |
| 25390747 G C . | 0 | | | | | | | | | |
| 32800145 C G | T . | 2 | 2 | 3 | 0 | 2 | | | | |
| 33412656 C G | T . | . | 2 | 2 | 0 | 2 | | | | |
| 45891622 G A | C | T . | . | 3 | 12 | 3 | | | | |
| 54171651 G A | T . | 12 | 0 | 2 | | | | | | |
| 62172726 G A . | 0 | | | | | | | | | |
| 63349782 G A | C . | 11 | 2 | 2 | 2 | 0 | | | | |
| 63414925 G A | C | T . | 3 | 0 | 3 | 2 | 2 | 2 | 2 | . |
ON ne retrouve que des conflicting !