MTS2DOVSHFULFWHKHJ4XJNI2NWXMQCT45ZEAWYMAXNHYELJOHDKAC
LR4KYHBVKLFW4M5UL3SRYEDFCD5MYE2322XA6D467QBJUESYZYIAC
245NIQ5D2RXAMRBKA7MA4PWZBNEUGO6HZZB46YZHI7TERUEX2E7QC
2QF7HCG5CLNOBSZUKSHRI2MR4FHHXWY22ZP7JMWD52ZSO2LO2DLAC
EXXDISQ3I67ZY3JZP7BFBDXLHLL5YIPQMXYMN4IPTNYJFOFPLOPAC
D7C6HJBOMSGMIVHXWDTYRK5GJ2LWWPKQKI3GFQLHN3XHGH4KEKXQC
XPVVISXCZTDNHTWH63VBGGNBYPB35DJAMR6J46WKNFP7P53SXBRAC
MUV2BASF5RFEKSLQHTHVYMNT6YVHL6KCXSWCPSMSXAMMIQIXDNSAC
32QB2VUPHXYATA4CKX65QOK5QWKULJK36RJCEYRYS2LGA3C3WLHAC
AZYRMLWV65VAHND5G3SXGB6DLWR2DO64T7H6C3NIFHW2EBXP3KTQC
VF7UKNIF73KICCJULRNI4TBTFIRQDFXIP2SEFXPK7NX5H3B4XMCQC
1. pour chaque pseudo-gènes annoté par Encode, sélection du gène codant correspondant (en utilisant l'identifiant HGNC /comment ??/)
1. pour chaque pseudo-gènes annoté par Encode, sélection du gène codant correspondant (en utilisant l'identifiant HGNC /NB: les pseudogene se finissent par P ou P$N avec n entier/)
2. Définition des régions avec leur paralogues
1. filtre des régions profondeur < 10
1. fusion de ces régions "proches" selon 3 critères : distance < 250bp, 500bp, 5% de la région (/slopping distance/))
- pour 5% de la liste, on supprime les régions < 50bp
2. pour chaque liste, définition d'un ensemble de région paralogues tels que
- toutes les régions d'un ensemble ont un score d'alignement >= 0.9
- aucune ne s'alignem avec un score >= 0.9 en dehors de l'ensemble
#+title: Investigative genetic genealogy: Current methods, knowledge and practice
#+date: [2024-08-01 jeu. 15:23]
#+filetags: :bib:facebook:
#+identifier: 20240801T152355
#+reference: kling2021investigative
Principe : exploitation de données SNP + généalogique pour identifier des personnel dans un contexte criminel
Non lu
#+title: Tadoku
#+date: [2024-08-01 Thu 13:35]
#+filetags: :jap:
#+identifier: 20240801T133545
* DONE https://tadoku.org/japanese/book/41012/
CLOSED: [2024-08-01 Thu 13:35]