LELKY6NPY7VWL4Y37R3F7GEM22YU2KI66DMC3QLGBXYWF3GMZS4AC
WZF4LZFAVRO4WSZIBHSCTWGSLV4MSB2LGUEKVK37IG76XGSZCIVQC
RUPKCDDFWKIVFSSAXYEIW3WKSEQD422O4RXEJZWWE6FGB2IB7GSAC
577YKK45TPNCUC7YGJDGKWTAR4H6WZMIE7EBAODLBEDLHHKGE2BQC
LFREJUHQSCE6VJ6RRZIVY24B43M6Z3VCTOV3OU53PYAEHRWKHBBQC
AG7OHITHJY4MGMIGT75VST63UGVIIO37GJWFLMMYNKYBF6LH3VLQC
DA3SLPQFZYWFQRMOIUY2DNL7X52AVQ3CAOP6JXP4YBIMHCBDX7WAC
KVTDFHZ3QKPWGPMHX6SVJQ7DJD76XR3MKOYKOPNVMQOTER3TYRCQC
B6APD6LRE4UWIIZNSB5AIUCFY4GTG73LSCDOGNBLZCZMGSJCB5BQC
ZTBFSKO73OZIVCXJWFQ2B6GKEBEBCHPADX432HTSO3XR3P3J4ZSAC
YWZPA2ZEGPE6QSL53PCT5BB4PQS3SVPSG4XFKGPSO7WOATM7RSVQC
2QF7HCG5CLNOBSZUKSHRI2MR4FHHXWY22ZP7JMWD52ZSO2LO2DLAC
KFLC4I2NGCBQBKP52BGLJWATUBZTXA3NAFD4R4T7V3VBPRWCY7AQC
NYVNCQBOFVVGMADGLIF2AHIZBZDWB45EJVGBBJBTFV4UTNOC2PUQC
**** DONE Assets genome GRCh38 :scidataflow:
CLOSED: [2024-05-29 Wed 22:44] SCHEDULED: <2024-05-29 Wed>
**** DONE Assets genome indexé GRCh38 :scidataflow:
CLOSED: [2024-05-29 Wed 22:44] SCHEDULED: <2024-05-29 Wed>
**** DONE Assets dbsnp GRCh38 :scidataflow:
CLOSED: [2024-05-30 Thu 18:55] SCHEDULED: <2024-05-29 Wed>
**** DONE Assets clinvar GRCh38 :scidataflow:
CLOSED: [2024-05-30 Thu 18:55] SCHEDULED: <2024-05-29 Wed>
**** DONE Assets vep GRCh38 :scidataflow:
CLOSED: [2024-05-30 Thu 18:55] SCHEDULED: <2024-05-29 Wed>
**** DONE Assets cadd GRCh38 :scidataflow:
CLOSED: [2024-05-30 Thu 18:55] SCHEDULED: <2024-05-29 Wed>
**** DONE Asset GRch38.p14 (sans index) :scidataflow:
CLOSED: [2024-06-01 Sat 17:19] SCHEDULED: <2024-06-01 Sat>
/Entered on/ [2024-06-01 Sat 16:02]
**** DONE Asset CADD v1.7 :scidataflow:
CLOSED: [2024-06-01 Sat 22:59] SCHEDULED: <2024-06-01 Sat>
/Entered on/ [2024-06-01 Sat 16:02]
*** DONE Résumé présentation :jcadd2024:
CLOSED: [2024-06-01 Sat 23:51] SCHEDULED: <2024-06-01 Sat>
*** WAIT Faire relire résumé Paul+Alexis :jcadd2024:
*** TODO Soumetre résumé :jcadd2024:
DEADLINE: <2024-06-07 Fri>
/Entered on/ [2024-05-19 Sun 13:24]
*** DONE Mail Kamel : présentation en 2 temps JCADD 2024 ?
CLOSED: [2024-05-28 Tue 00:05]
1. Retour d'expérience sur installation nix
2. Résultat thèse
/Entered on/ [2024-05-28 Tue 00:04]
**** TODO Revoir biblio base de données [[id:6f89f301-1b55-43cb-b3be-bf954bbc079e][Base de données pour pipeline constit]]
SCHEDULED: <2024-06-09 Sun>
/Entered on/ [2024-06-06 Thu 22:59]
*** Article
**** DONE Bug noodles : parsing Clinvar vcf fails
CLOSED: [2024-06-06 Thu 21:55] SCHEDULED: <2024-06-06 Thu>
/Entered on/ [2024-06-06 Thu 21:55]
Corrigé https://github.com/zaeleus/noodles/issues/241#issuecomment-2152112680
**** TODO Algorithme rapide intersection VCF-BED
Discussion sur github : pas de réponse
*** TODO Candidater prix logiciel libre de la recherche
SCHEDULED: <2025-04-06 Sun>
https://www.ouvriralascience.fr
/Entered on/ [2024-06-06 Thu 23:00]
* Santé
:PROPERTIES:
:CATEGORY: santé
:END:
** DONE Demander carte de mutuelle
CLOSED: [2024-06-05 Wed 22:08] SCHEDULED: <2024-06-05 Wed>
/Entered on/ [2024-06-05 Wed 22:07]
Sera envoyée par courrier (adresse à mise à jour)
Doit envoyer un code pour accès second espace personnel
:PROPERTIES:
:ID: 717fd62e-db36-4a50-bcfd-f6a5ee41b7d5
:END:
#+title: Formation validation de méthodes
#+filetags: biologie qualité
#+date: 2024-06-06
Estelle Bugni
Société de consulting + biologiste probioqual. Fait aussi de l'éthique
* Théorie
** Objectifs
- différence vérification et validation
- principes de bases
- savoir analyser les risques
- savoir mener un projet + rédiger un dossier (vérif/valid)
- gérer ajouts et extension portée d'accréditation
** Définition
- Vérification : portée A = on utilise le kit non modifié qui a déjà été testé par le fournisseur (= méthode reconnue)
- Validation = portée B = si on modifie le kit/manière de faire ou si on créé un kit (= on ne peut pas utiliser la méthode reconnue)
- Ex: si on change le tube, il faut démontrer que cela marche mais le principe est de rester en portée A
- Répétabilité = le même échantillon, dans les mêmes conditions (oérateur, réactif, instrument échantillonage). Idéalement 30 mesures
- sur toutes les matrices prévues : sang, urine...
- écart-type, moyenne, coefficient de variation (ecart type/moyenne)
- Reproductibilité = fidélité intermédaire = correspond au coefficient de dvariant (= écart type relatif, mesure la dispersion)
- même échantillion mais jour, opérateur différent
- écart-type, moyenne, coefficient de variation (ecart type/moyenne)
- comparaison au CV acceptable défini -> *il faut avoir défini la limite avant* !
- Justesse = correspond à la moyenne (dispersion peut être importante)
- comparaison d'une moyenne à une valeur cible.
- CIQ externalisé (on compare à la moyenne des autres). Comparé à un biais acceptable *défini*
- exactitude = comparaison d'*une seule* valeur -> EEQ. Comparaison à une erreur totale
** Étapes
1. définir les besoins = limites acceptable
2. protocole) = le plus long+++
3. réaliser les tests
4. Écrire le dossier
ex: quantification d'ADN
Objectif montre que la méthode fonctionne /dans les conditions normales du laboratoire/
** Ce qu'il faut respecter
- norme NF EN ISO 15189 version 2012 et 2022 (les 2 existent : si écart sur la norme 2022, on compare à la 2012) = européen
- SH REF 02 = spécifique à la France, par le COFRAC version 7 et 8 (relatiif à la 15189 2012 et 2022 respectivement)
- SH REF 08 version 6 (version 7 en octobre 2021) définit les /règles sur la portées d'accréditation/
- SH INF50 rev 07 = liste des portées
- GEN RFE rev 09 = définit le logo COFRAC -> il faut mentionner les analysées accréditées
** Guide techniques
SH GTA
- 01 rev 02 = version "pour les nuls" !
- 02 = informatique (bien fait !)
- 03 = anapath
- *04 = accréditation de vérification/validation*
- 05 = biologie de la reproduction
- 06 = contrôle qualité
- *07 = génétique* (rien de spécifique)
- 14 = incertitudes de mesures
- 15 = ceux qui appartiennet à des groupements hospitaliers (GHT)
Matériel et réactifs = à valider (surprise... la nouvelle version ne change rien)
*** SH GTA 04 rev 02
- quantitatif = valeur numérique
- qualitiatif = ce qu'on ne peut pas exprimes quantitativement (positif/négatif, identification)
Étapes
1. vérification(portée A)/validation (portée B)
2. déclaration d'aptutide
3. puis il faut se préparer à passer en routine (formation du personnel, documentation, audit interne...)
- Astuce: il faut une "checklist"
4. la méthode est autorisée à être employée
- ajout ou extension (cf ci-dessous)
*** Ajout vs extension
- Ajout : on peut ajouter des examens sur une "ligne" dans une ligne de portée car on considère qu'on est dans le même cadre. C'est plus simple car il faut "juste" remplir un document
- en portée A: ok
- attention à la portée B: il faut 2 méthodes déjà en portée B pour ajouter ! (10.3 du SH REF 08: il faut qu'il y ait une virgule...)
- Sur une autre ligne, il faut une extension et le COFRAC doit venir
- note: basculer de A vers B est une extension !
** Protocole
quantitatif/qualitif : portée A et B identique sur les critère
limite de détection = qualitative
- exceptionnelement, on veut quantifier ... exemple de la cocaîine (< seuil de mesure)
limite de quantification = quantitatif
*** Méthode quantitative
Obligatoire, vérifier sur site
- répétabilité
- fidélité intermédiaire
- justesse/exactitude *obligatoire* ! Comparaison avec autre labo par exemple
- incertitudevariabilité interopérateur
Biblio pour le reste
- intervalle de mesure, limite de quantif, linéarité (mais intéressant de vérifier)
- le plus simple/efficace pour limite de quantif = dilution jusqu'à coefficient de variation (CV) encore correct
- attention au bruit de fond
- contamination échantillion: dépend du système, analyse de risque
- robustesse : flou, obligatoire en portée B. A regarder au cas-par-cas. Exemple: mises au frigo/congélateur
*Pas* de limite de détection, pas de sensibilité/spécificité
**** Incertitude de mesure
- erreur de décalage + erreur de dispersion
- cf SH GTA 14 pour les formules
- sert à savoir si résultat vraiment positif ou négatif (interprétable si zone grise -> refaire dosage)
*** Limite de quantification
- Plus petite valeur mesurée avec fiabilité acceptable et incertitude connue
- ex: multiple dilution
*** Méthode qualitative
Idem quantitif sauf que
- Analyse de risque = le plus important
- *pas* d'intervalle de mesure, limite de linéairité
Attention limite de linéarité données par le fournissieur peut être faux
** Notes
- conserver toutes les données brutes de validation de méthode (durée d'utilisation + 24 mois)
- mettre les données brutes dans le dossier de VDM (plus pratique et + utile pour auditeur COFRAC)
- validation bioinformatique: initiale (résultats = juste) puis au long cours (pas de déviance)
- respecter ce qui est fait au laboratoire -> sinon écart !
- vdm avant utilisation sous accréditation (mais on peut utiliser une technique sans être acrédité)
- si changement sur une technique accréditée, il faut re-valider (ce qui sera évalué sur le prochain audit) avant rendre les résultats patients. Si on passe en portée B, il faut faire venir le COFRAC
- bien suivre le modèle dans SH FORM43
- conclusion par analyse "répond bien au besoin" (qui doit donc être en )
- date d'aptitude (validation OK) != date d'utilisation (= utilisé avec logo cofrac)
- depuis 26 mars 2024 : il faut utiliser un marquage CE. Si on utilise des méthodes non CE, il faut jutsifier que les méthodes CE existantes ne suffisent pas. En pratique, à l'arrêt car "personne n'y croit"
** Comparaison de méthode
Si on remplace une technique/équipement ou 2 techniques/équipements en parallèles (ex: en mirror, en backup, manuel et automatisé)
- analyse des même échantillions en conditinos de routine sur les 2 techniques
- nombre d'échantillons définis par le biologiste (>= 30 si ce n'est pas coûteux)
Méthodes :
- 2 méthodes
- variables quantitatif : rangs signés de Wilcoxon
- variables ordinal : Start-maxwell
- variable binaire : test McNemar, kappa de Cohen
- > 2 :
- variable binaire : Q de Cochran
- sinon ANOVA
Notes: ANOVA permet d'évaluer la variabilité interopérateur
** Contamination inter-échantillons et inter-réactifs
- inter-échantillion: risque en biologie moléculaire
- 3 répétitions par niveau haut et bas puis formule moyenne b1 - moyenne bas 3)/(mohautte haute - moyenne base 3)x100
-> non utile en génétique
- stabilité pré-analytique : moins important qu'en biochimie
** Comment définir les performances acceptables
- Présentation non adaptée à la génétique.
- Pistes : expérience++, kit du fournisseur
* Cas pratique
- Étude VDM somatique Auragen "SH-FORM-43 VDM WGS Illumina DNA Prep génétique somatique manuelle 10.03.22". Très complet mais manque l'analyse de risque (faite par processus mais non mentionnée)
- Qualification extraction d'ADN (Maxwell 48)
- répétabilité : 1 échantillion x7 -> justifier le "7x"
- comparaison interopérateur
- comparaison avec maxwell 16
- il faut des critères d'acceptabilité au long cours -> refaire le point une fois par an
* QCM
- SH FORM non obligatoire, on peut utiliser un excel
- Habilitation portée A et B = obligatoir
- Modif pré-analytique : pas de validation en portée B si pas d'impact !
- aptitude de méthode (ok pour limites de l'analyse)!= autorisation d'emploi (ok pour logo cofrac)
- SH REF2 : écart si non respecté
- SH GTA = guide seul donc pas d'obligation
:PROPERTIES:
:ID: 6f89f301-1b55-43cb-b3be-bf954bbc079e
:END:
#+title: Base de données pour pipeline constit
#+filetags: bisonex article
# Solution existantes
Galaxy = juste un wrapper autour de SRA https://usegalaxy.org/?tool_id=toolshed.g2.bx.psu.edu%2Frepos%2Fiuc%2Fsra_tools%2Fsam_dump%2F3.1.1%2Bgalaxy0&version=latest
refgénie = gère les version de génomes https://refgenie.databio.org/en/latest/
# Données
SRA = dispon sur AWS également https://registry.opendata.aws/ncbi-sra/
1000 génomes sur AWS https://registry.opendata.aws/1000-genomes/
broad genomes = (pas les version intermédiaires ?) https://s3.amazonaws.com/broad-references/broad-references-readme.html
GIAB https://registry.opendata.aws/giab/
1000 génomes avec dragen https://registry.opendata.aws/ilmn-dragen-1kgp/
# Base de test
https://genomics-benchmark-datasets.s3.amazonaws.com/README.txt
https://s3.amazonaws.com/gatk-test-data/gatk-test-data-readme.html
# tangente: et Apache parquet ?
Utile seulement si on a l'infrastructure associée. Pas adapté à mon cas d'usage
exemple https://www.diva-portal.org/smash/get/diva2:1596566/FULLTEXT01.pdf
AWS : clinvar, 1000 genomes https://github.com/aws-samples/data-lake-as-code/tree/roda?tab=readme-ov-file#readme
Azure : gnomAD, 1000 genomes https://techcommunity.microsoft.com/t5/healthcare-and-life-sciences/genomic-data-in-parquet-format-on-azure/ba-p/3150554
** Base de données
PR soumis pour faire un "asset" scidataflow avec dernière version (et génome "pipeline ready")
* TODO Notes validation de méthode
SCHEDULED: <2024-06-06 Thu>
/Entered on/ [2024-06-06 Thu 22:21]
* TODO Notes biblio base de données pipeline
SCHEDULED: <2024-06-06 Thu>
/Entered on/ [2024-06-06 Thu 22:21]
* DONE Assets genome GRCh38 :scidataflow:
CLOSED: [2024-05-29 Wed 22:44] SCHEDULED: <2024-05-29 Wed>
:PROPERTIES:
:ARCHIVE_TIME: 2024-06-06 Thu 22:30
:ARCHIVE_FILE: ~/org/projects.org
:ARCHIVE_OLPATH: Recherche/Bisonex/Article JOSS
:ARCHIVE_CATEGORY: bisonex
:ARCHIVE_TODO: DONE
:ARCHIVE_ITAGS: article joss
:END:
* DONE Assets genome indexé GRCh38 :scidataflow:
CLOSED: [2024-05-29 Wed 22:44] SCHEDULED: <2024-05-29 Wed>
:PROPERTIES:
:ARCHIVE_TIME: 2024-06-06 Thu 22:30
:ARCHIVE_FILE: ~/org/projects.org
:ARCHIVE_OLPATH: Recherche/Bisonex/Article JOSS
:ARCHIVE_CATEGORY: bisonex
:ARCHIVE_TODO: DONE
:ARCHIVE_ITAGS: article joss
:END:
* DONE Assets dbsnp GRCh38 :scidataflow:
CLOSED: [2024-05-30 Thu 18:55] SCHEDULED: <2024-05-29 Wed>
:PROPERTIES:
:ARCHIVE_TIME: 2024-06-06 Thu 22:30
:ARCHIVE_FILE: ~/org/projects.org
:ARCHIVE_OLPATH: Recherche/Bisonex/Article JOSS
:ARCHIVE_CATEGORY: bisonex
:ARCHIVE_TODO: DONE
:ARCHIVE_ITAGS: article joss
:END:
* DONE Assets clinvar GRCh38 :scidataflow:
CLOSED: [2024-05-30 Thu 18:55] SCHEDULED: <2024-05-29 Wed>
:PROPERTIES:
:ARCHIVE_TIME: 2024-06-06 Thu 22:30
:ARCHIVE_FILE: ~/org/projects.org
:ARCHIVE_OLPATH: Recherche/Bisonex/Article JOSS
:ARCHIVE_CATEGORY: bisonex
:ARCHIVE_TODO: DONE
:ARCHIVE_ITAGS: article joss
:END:
* DONE Assets vep GRCh38 :scidataflow:
CLOSED: [2024-05-30 Thu 18:55] SCHEDULED: <2024-05-29 Wed>
:PROPERTIES:
:ARCHIVE_TIME: 2024-06-06 Thu 22:30
:ARCHIVE_FILE: ~/org/projects.org
:ARCHIVE_OLPATH: Recherche/Bisonex/Article JOSS
:ARCHIVE_CATEGORY: bisonex
:ARCHIVE_TODO: DONE
:ARCHIVE_ITAGS: article joss
:END:
* DONE Assets cadd GRCh38 :scidataflow:
CLOSED: [2024-05-30 Thu 18:55] SCHEDULED: <2024-05-29 Wed>
:PROPERTIES:
:ARCHIVE_TIME: 2024-06-06 Thu 22:30
:ARCHIVE_FILE: ~/org/projects.org
:ARCHIVE_OLPATH: Recherche/Bisonex/Article JOSS
:ARCHIVE_CATEGORY: bisonex
:ARCHIVE_TODO: DONE
:ARCHIVE_ITAGS: article joss
:END:
* DONE Vérifier checksum GRCh38 :scidataflow:
CLOSED: [2024-06-01 Sat 15:27] SCHEDULED: <2024-05-30 Thu>
:PROPERTIES:
:ARCHIVE_TIME: 2024-06-06 Thu 22:30
:ARCHIVE_FILE: ~/org/projects.org
:ARCHIVE_OLPATH: Recherche/Bisonex/Article JOSS
:ARCHIVE_CATEGORY: bisonex
:ARCHIVE_TODO: DONE
:ARCHIVE_ITAGS: article joss
:END:
/Entered on/ [2024-05-30 Thu 18:55]
- [X] genome
- [X] vep
- [X] cadd -> script en cours
- [ ] dbsnp -> retélécharger
* DONE Asset GRch38.p14 (sans index) :scidataflow:
CLOSED: [2024-06-01 Sat 17:19] SCHEDULED: <2024-06-01 Sat>
:PROPERTIES:
:ARCHIVE_TIME: 2024-06-06 Thu 22:30
:ARCHIVE_FILE: ~/org/projects.org
:ARCHIVE_OLPATH: Recherche/Bisonex/Article JOSS
:ARCHIVE_CATEGORY: bisonex
:ARCHIVE_TODO: DONE
:ARCHIVE_ITAGS: article joss
:END:
/Entered on/ [2024-06-01 Sat 16:02]
* DONE Asset CADD v1.7 :scidataflow:
CLOSED: [2024-06-01 Sat 22:59] SCHEDULED: <2024-06-01 Sat>
:PROPERTIES:
:ARCHIVE_TIME: 2024-06-06 Thu 22:30
:ARCHIVE_FILE: ~/org/projects.org
:ARCHIVE_OLPATH: Recherche/Bisonex/Article JOSS
:ARCHIVE_CATEGORY: bisonex
:ARCHIVE_TODO: DONE
:ARCHIVE_ITAGS: article joss
:END:
/Entered on/ [2024-06-01 Sat 16:02]
* DONE Résumé présentation :jcadd2024:
CLOSED: [2024-06-01 Sat 23:51] SCHEDULED: <2024-06-01 Sat>
:PROPERTIES:
:ARCHIVE_TIME: 2024-06-06 Thu 22:31
:ARCHIVE_FILE: ~/org/projects.org
:ARCHIVE_OLPATH: Recherche/Bisonex
:ARCHIVE_CATEGORY: bisonex
:ARCHIVE_TODO: DONE
:END:
* DONE Faire relire résumé Paul+Alexis :jcadd2024:
CLOSED: [2024-06-06 Thu 22:31]
:PROPERTIES:
:ARCHIVE_TIME: 2024-06-06 Thu 22:31
:ARCHIVE_FILE: ~/org/projects.org
:ARCHIVE_OLPATH: Recherche/Bisonex
:ARCHIVE_CATEGORY: bisonex
:ARCHIVE_TODO: DONE
:END:
* DONE Soumetre résumé :jcadd2024:
CLOSED: [2024-06-05 Wed 22:07] DEADLINE: <2024-06-07 Fri>
:PROPERTIES:
:ARCHIVE_TIME: 2024-06-06 Thu 22:31
:ARCHIVE_FILE: ~/org/projects.org
:ARCHIVE_OLPATH: Recherche/Bisonex
:ARCHIVE_CATEGORY: bisonex
:ARCHIVE_TODO: DONE
:END:
/Entered on/ [2024-05-19 Sun 13:24]
* DONE Mail Kamel : présentation en 2 temps JCADD 2024 ?
CLOSED: [2024-05-28 Tue 00:05]
:PROPERTIES:
:ARCHIVE_TIME: 2024-06-06 Thu 22:31
:ARCHIVE_FILE: ~/org/projects.org
:ARCHIVE_OLPATH: Recherche/Bisonex
:ARCHIVE_CATEGORY: bisonex
:ARCHIVE_TODO: DONE
:END:
1. Retour d'expérience sur installation nix
2. Résultat thèse
/Entered on/ [2024-05-28 Tue 00:04]