diy bioinf pt 2
Posted by razor | Filed under Bioinformatika
A hasznos és ingyenes eszközök közül az R és a Bioconductor a következő, amit érdemes megemlíteni (és megtanulni). Az R egy adatokkal való bűvészkedésre, statisztikai számításokra és azok grafikus megjelenítésére specializálódott programozási nyelv. A klasszikus statisztikai tesztektől kezdve a nemlineáris modellezésig sokminden elvégezhető a segítségével. Hihetetlen mennyiségű különböző csomag áll rendelkezésre a CRAN adatbázisban, amelyek segítségével tovább bővíthetők az R lehetőségei.
Kezdő és haladó bioinformatikusok számára a Bioconductor csomaggyűjtemény lehet kifejezetten hasznos. Különböző genomi adatok és kísérletek elemzéséhez és megjelenítéséhez nyújt segítséget, sokszor az R egyéb csomagjaira támaszkodva. Elsősorban DNS microarray csipek elemzésére szolgál, de az alapvető módszereken túl (háttérkorrigálás, normalizálás, változó expressziót mutató gének kiszűrése) rengeteg egyéb funkcióval is rendelkezik, amelyekkel például az ENSEMBL adatbázisait és az ott megtalálható adatokat, annotációkat is a munkafolyamatba integrálhatjuk vagy promóter elemzést végezhetünk. Ezek mellett ChIP-on-chip, tiling adatok kiértékelésére is használható, és a Biostrings nevű csomag segítségével az újgenerációs szekvenáló módszerek eredményit is fel lehet dolgozni.
A parancssoros bioinformatikai programok egyik legfontosabb és és leghasznosabb gyűjteménye az EMBOSS (European Molecular Biology Open Software Suite) programcsomag, aminek az aktuális 6.1-es verziója több 100 programot tartalmaz, amiknek a segítségével a különféle szekvencia és formátumkonverzióktól kezdve, az illesztéseken és motívumkereséseken át, az adatbáziskeresésekig szinte minden megoldható. Az EMBOSS szinte minden létező unix verzión működésre bírható (és még OS X és Windows alatt is megy), egységes parancssori opciókkal rendelkezik, kiváló különböző munkafolyamatok felépítéséhez és szinte minden felbukkanó szekvencia vagy adatbázisformátumot ismer. Ezek mellett sok egyéb programcsomagot is integrálhatunk alá, és több webes vagy asztali grafikus felülettel rendelkezik.
Az EMBOSS webes felületei közül a wEMBOSS érdemel említést, aminek segítségével akár egy egész intézetnyi bioinformatikához és parancssorhoz nem értő kutatónak biztosíthatjuk a különféle bioinformatikai eszközök aránylag barátságos használatát.
Tags: adatelemzés, bioconductor, Bioinformatika, diybio, emboss, linux, r, wemboss