VAJ4IGPVOC32AVK7ULFHDZSDPD26IZ6LIXNJIRZGUV6HOPGTMSWQC
LEFI7TATKVMWKCX2BIZNQXQH3IHFTGJG6E7NDB54VDO2SQUP3HRQC
RHWQQAAHNHFO3FLCGVB3SIDKNOUFJGZTDNN57IQVBMXXCWX74MKAC
DJY2XLQPXOGPDJHJVQQDYJHPN5HQJ77UKDOBBBVYVPSPF4ZPUP7AC
FXA3ZBV64FML7W47IPHTAJFJHN3J3XHVHFVNYED47XFSBIGMBKRQC
GKG3LEQDLFB5YKEI5DZMJS6FKZRSM6L54ZB6ZMQVSNIZ7SFU7UGAC
YF4W6GSBTMMI3WPNEBWVNYLYNVPUM3LLH5MGM2XMFLWJK4YA765AC
* <2023-02-07 Tue> Workout
- RTO: 30-14-14
Skin-the-cat (avec descente): 2x2
- Muscle-up 3x1 - 2+1+1 - 2+1+1
Extension: 3x22
- FL tucked row : 3x{3+2}
Pistols : 3x4
- Planche tucked push-up: 5+5 - 5+4+1 - 5+5
Compression: 3x9
**** TODO Utiliser seulement exons
***** Utiliser les coordonnées des exons
UCSC knownGene : list des positions des exons par gene selon GENCODE [[http://hgdownload.soe.ucsc.edu/goldenPath/hg38/database/knownGene.txt.gz][Fichier]] [[http://genome.ucsc.edu/cgi-bin/hgTables?hgta_doSchemaDb=hg18&hgta_doSchemaTable=knownGene][Détail]]
inspiré de https://www.nature.com/articles/srep17875
**** TODO Restreindre genome de référence
***** Discussion Alexis
le pipeline prend en compte 5', 3', variant canoniques d'épissage + prédit spip
Le plus simple pour le moment est de restreindre seulement aux exons
GENCODE (version europénne) vs RefSeq: [[https://bmcgenomics.biomedcentral.com/articles/10.1186/1471-2164-16-S8-S2][article 2015]] en faveur de GENCODE mais Alexis conseille Refseq
***** TODO Utiliser seulement exons BestRefSeq
Dans refseq,[[https://www.ncbi.nlm.nih.gov/genome/annotation_euk/process/][2 types de modèles pour le gène]]
- basé sur refseq (NM_, NP_), curée
- basé sur gnomon (XM_ , XP_), prédite
wget https://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/latest_release/gencode.v42.annotation.gtf.gz
gunzip gencode.v42.annotation.gtf.gz
grep exon gencode.v42.annotation.gtf | awk '{print $1" "$4" "$5} > exons.csv
wget https://ftp.ncbi.nlm.nih.gov/refseq/H_sapiens/annotation/GRCh38_latest/refseq_identifiers/GRCh38_latest_genomic.gff.gz
gunzip https://ftp.ncbi.nlm.nih.gov/refseq/H_sapiens/annotation/GRCh38_latest/refseq_identifiers/GRCh38_latest_genomic.gff.gz
À vérifier (sinon refseq)
****** rtg tools
Threshold True-pos-baseline True-pos-call False-pos False-neg Precision Sensitivity F-measure
----------------------------------------------------------------------------------------------------
3.000 1015 910 206 32531 0.8154 0.0303 0.0583
None 1015 910 206 32531 0.8154 0.0303 0.0583