Narzędzia statystyczne do pracy z danymi genomicznymi
Za cel finansowanego ze środków UE projektu RADIANT (Rapid development and distribution of statistical tools for high-throughput sequencing data) przyjęto ulepszenie najpopularniejszych narzędzi analizy danych. Jego głównym założeniem było zintegrowanie pakietów oprogramowania opracowanych przez badaczy z Francji, Niemiec, Szwajcarii, Wielkiej Brytanii i Włoch w jedną platformę obliczeniową.
Jednym z nich jest napisana w języku Python biblioteka HTSeq, która dokonuje wstępnej obróbki danych z sekwencjonowania RNA pod kątem analizy różnicowej ekspresji genów. Pakiet DESeq2 udostępnia metody wykrywania różnicowo ekspresjonowanych genów przy użyciu uogólnionych modeli liniowych. Z kolei w pakiecie BitSeqVB implementowano bayesowską metodę wnioskowania na temat stężenia transkryptów RNA informacyjnego.
Badania prowadzone w ramach projektu RADIANT objęły wszystkie aspekty analizy danych HTS, od kontroli jakości do wizualizacji danych. Dla szeregu czasowego ekspresji genów zaproponowano hierarchiczne modelowanie bayesowskie umożliwiające uzupełnianie brakujących danych w sposób systematyczny, jak i losowy. Przeglądarka genomu RADIANT jest pierwszym narzędziem do wizualizacji danych dotyczących metylacji DNA.
Większość narzędzi zintegrowano w ramach platformy Bioconductor, tworząc jednolite środowisko analizy, dokumentowania i dystrybucji danych HTS. Ogromna liczba pakietów dostępnych na platformie Bioconductor utrudnia jednak mniej doświadczonym użytkownikom rozwiązywanie konkretnych problemów. Opracowano zatem "ściągawkę" dla początkujących, stanowiącą proste, a zarazem kompletne wprowadzenie do zagadnień analizy danych sekwencjonowania RNA.
Dzięki możliwości niezwykle dokładnego badania genomu człowieka techniki sekwencjonowania są obecnie stosowane praktycznie we wszystkich gałęziach badań biologicznych i medycznych. Nowo opracowane narzędzia projektu RADIANT przyczynią się do ugruntowania pozycji analizy danych HTS jako nieodzownego narzędzia naukowego. Przewidywane zastosowania mogą odmienić oblicze badań genomicznych, otwierając drogę ku nieosiągalnym dotąd odkryciom.
Źródło: www.cordis.europa.eu
Tagi: statystyka, genomika, dna, rna, sekwencjonowanie
wstecz Podziel się ze znajomymi
Najdokładniejsze systemy satelitarnego transferu czasu
Nie zawsze zegar atomowy działa lepiej niż kwarcowy.
Ponad połowa chorych z SARS-CoV2 cierpi na długi covid
Przez długi czas może mieć takie objawy jak zmęczenie.
Uniwersytet Warszawski będzie kształcić kadry dla energetyki jądrowej
Przekazał Wydział Fizyki UW.
Recenzje