diy bioinf pt 1
Posted by razor | Filed under Bioinformatika
Ha már biopunk és DIYbio, akkor essen néhány szó a bioinformatika részéről is a dolognak, amit jóval könnyebb otthon is csinálni, és még a konyhában sem kell gyanús löttyöket öntögetni mindenfelé, hanem elég egy laptop.
Először is az eszközök: ugyan láttam már embert, egézen pontosan egy darabot, aki Windows alatt próbálkozott a bioinformatikával, de azért jóval egyszerűbb egy használható linuxot felrakni és azzal dolgozni. Kezdőknek Ubuntu, sokat unatkozó kockáknak Gentoo, de tulajdonképpen szinte mindegyik modernebb disztribúció megteszi (melyik linux disztró flame ON). A rendszerrel és a parancssorral való barátkozás után érdemes kissé elmerülni a shellscriptek lelkivilágában is, alapvető adatfeldolgozásnál, manipulációnál igen hasznos lehet.
Rögtön ezután érdemes a Perl alapjait is megismerni, nagyjából mindenre használható, 5 perc alatt nagyon hasznos (és nagyon ronda) dolgokat lehet összeütni. Előnye, hogy hihetetlen mennyiségű kiegészítő modul és modulcsomag van hozzá, amelyek szinte minden felmerülő problémára adnak egy többé-kevésbé használható megoldást. Ezek között a CPAN-on lehet turkálni.
A BioPerl az első program, vagyis modulcsomag, ami kifejezetten bioinformatusoknak való. Az ocsmány és kezelhetetlen dokumentáció, plusz a szövevényes modulok és objektumok ellenére az egyik leghasznosabb eszköz. Szekvenciák, szekvenciaillesztések, keresési eredmények vagy mátrixok manipulálásához nélkülözhetetlen, de a különféle adatbázisokban való kereséshez, a szekvenciák grafikus megjelenítéséhez és külső programok futtatásához is jól használható. Érdemes elolvasni a “Hogyan mentette meg a perl a humán genom programot” című írást is.
Nem BioPerl, de Perl modulcsomag az ENSEMBL adatbázis (amiről később még szó lesz) adatainak kezelésére, manipulálására szolgáló ENSEMBL API is, vagy a Gene Ontology adatainak lekérdezésére szolgáló GO API.
Perl alapozásnak ez bőven elég, folytatás következik.
Tags: adatelemzés, bash, Bioinformatika, bioperl, diybio, ensembl, gene ontology, linux, perl
August 14th, 2009 at 16:47
A Perl nagyon jó, de sok embernek problémát okoz, hogy egy feladatot többféle módon lehet megoldani benne. Azt sem szabad elfelejteni, hogy a Perlhez hasonlóan a Python és a Java is nyújt elég nagy biológiai támogatást (EnsEMBL pl. Javaban is van). A többi nyelv támogatását (biophp, bioc) pedig jobb messziről elkerülni.
August 14th, 2009 at 22:45
Ezt én mind tudom, csak éppen nem akartam mindenről egyszerre írni. A perl meg éppen lehet bonyolult, viszont nagyon gyorsan össze lehet ütni benne ronda, de éppen szükséges scripteket.
February 13th, 2010 at 20:19
[...] odáig, hogy kirakjak még egy kis bioinformatikai alapozást ide, az első két rész itt és itt található. Írtam a BioPerl és a shellscriptek hasznáról is, most néhány egyszerű [...]