open src, science, data

Az elmúlt néhány évben a tudományos folyóiratkiadás területén elég nagy változások történtek, történnek, de ez nem újdonság. Az open access újságoktól kezdve egészen addig, hogy néhányan végre kijelentették, az impakt faktor, és az arra alapuló bírálati rendszerek márpedig szarok, a Nature cikk valójában semmire sem garancia, se a kutatás színvonalára, se annak fontosságára. Az összesített impakt faktor és az idézettség mértéke pedig nem biztos, hogy megfelelően jelzi egy kutató munkájának színvonalát.

A másik nagy változás az adatok publikálása terén történt, egyre több az olyan újság, ahol nincs “data not shown”. A szerver elbírja, tárhely van, csak azért nem lehet valamit kihagyni, mert úgy szebben néz ki a végeredmény. Emellett fontos (lenne) a negatív adatok, eredményre nem vezető kísérletek publikálása is.

A bbgm blogon bukkantam rá a hírre, hogy a PLoS Computational Biology és a PLoS ONE a cikkek mellett szoftverek publikálását is tervezi a jövőben, esetleg különféle adatokét. Néhány további részlet megtalálható az Open Access News blogon és a Genomweb-en, ami sajnos nem teljesen ingyenes.

Most pedig akkor az én ötleteim, és egyéb be nem linkelt blogposztok összefoglalása.

Adatpublikálás: Sajnálatos módon csak kevés adattípusra vannak jól meghatározott formátumok, sztenderdek, és publikus adatbázisok, ahol az eredményeket megfelelően annotálva és formára pofozva tárolni, keresni lehetne. Az NCBI adatbázisai aránylag használhatók, de sokszor a “supplementary material” gusztustalan Excel táblákat tartalmaz, ocsmány kinézetű 3D grafikonokkal és hasonlókkal megtámogatva.

Hova tudom rakni valami értelmes formában például az 500 kukoricacsíra gyökér és hajtásméretet, ha publikálni akarom az adatokat is? Jó lenne több, általános adatformátum, megjelenítő és keresőfelület, ami  legalább egy minimális lehetőséget biztosít az adatok statisztikáinak megjelenítésére, filterezésére. Az ilyen és hasonló esetekben rendszeresen az a végeredmény, hogy ha az excel táblát sikerül is elkerülni, akkor készül valami félig-meddig használható webes felület, amin ötletszerűen elszórva vannak a funkciók, általában nem kompatibilis semmivel, és hamar el is felejtni mindenki. A NAR adatbázis különszámában, vagy a BMC Bioinformatics-ban végtelen mennyiségű ilyen van.

Másrészt mi értelme van az emlegetett NAR különszámban évente közölni egy cikket arról, hogy milyen funkciók frissültek x helyen, azon kívül, hogy nő a publikációs lista és az IF? Az adatbázis természetesen hasznos, de talán külön kéne választani ezt a fajta hasznosságot és értékelést a cikkek publikálásától, mivel az ilyen cikk a szó klasszikus értelmében nem tudományos cikk. Sőt, valamilyen egyéb módon kéne elismerni és jutalmazni azokat az adatokat, adatbázisokat generáló kutatókat és csoportokat, akik valami hasznos, mások által felhasználható, elemezhető dolgot produkáltak.

Ezzel aztán át is kanyarodhatunk a következő témához, a webes szolgáltatásokhoz, amelyeknek a mennyisége szintén hihetetlen mértékben nő. Itt ugyanúgy nem található meg semmilyen sztenderd a szolgáltatások nagyrészénél, pedig kezdeményezések azért vannak, protokollok, amik segítségével ezeket integrálni lehetne, szintén vannak (és most magam ellen is beszélek). Igen jó ötlet lenne, ha maga a szolgáltatás is sokkal komolyabb “peer review” folyamaton esne át, esetleg kötelező lenne beregisztrálni a BioCatalogue-ba, vagy hasonló helyekre. Bónusz, hogy ezek mögött a szolgáltatások mögött van valamilyen módszer, szoftver, amit néha úgy kell kihúzni az üzemeltetőkből, feltéve ha van egyáltalán valami mások által is használható parancssoros, vagy akármilyen verzió belőle.

A szoftverek esetében pedig végképp irritáló, hogy nem tudom a cikkel együtt letölteni, és egyes esetekben fél napi izzadás, mire kikísérletezi az ember, hogy akkor a Make fájl melyik sorát kell átírni, és milyen gcc verzió szükséges a lefordításához, meg kiderül, hogy miért nem fogadja el xy formátumot és hol van a help.

A webes szolgáltatásokra és a szoftverekre is igaz, hogy valamilyen más formában kéne elismerni őket nem pedig a cikkek és idézések számát nézni, mert a BioPerl vagy a BLAST igen fasza, de továbbra is eszköz, és teljesen más típusú “felfedezés”, mint amikor valaki a darabokból összerakja, hogy akkor mi is a DNS szerkezete.

Tags: , , , , , , ,

Comments are closed.

biopunk

A biopunk egy biotech, bioinf csináld-magad szubkultúra némi evolúcióelmélettel, memetikával, szkepticizmussal, futurizmussal és hacker kultúrával körítve.

kategóriák