Nem elveszni az adatokban – a Research Data Alliance rendezvénye az Akadémián

Az egyik oldalon a határtalan lehetőségek ígérete, a másikon az internet zajába fulladó, értékes publikációk sora – a nap mint nap ránk zúduló adatmennyiség az adatok kezelésének újfajta, az eddigieknél sokkal tudatosabb módját teszi szükségessé. Az ennek támogatására és terjesztésére létrejött Research Data Alliance február 7-én „RDA meets Hungarian researchers” címmel az MTA Székházában tartott rendezvényt azzal a céllal, hogy a magyar kutatókkal is megismertesse a tevékenységét. Az RDA-ról és az elhangzottakról Holl András, az MTA Könyvtár és Információs Központ informatikai főigazgató-helyettese beszélt az mta.hu-nak.

2018. február 19.

Napjainkban már-már közhellyé vált a bennünket elérő, szinte kezelhetetlen adatmennyiség emlegetése. De hogyan változtatja meg mindez a tudomány működését?

A tudomány Derek de Solla Price által leírt, egyre gyorsuló bővülése példátlan lehetőségeket kínál, viszont minden eddiginél nagyobb veszélyekkel fenyeget, s nem várt akadályokat gördít elénk. Az adatözön óriáshullámát meg lehet lovagolni, de bele is lehet fulladni. Egyre többen vallják, hogy a tudomány felhígulása, a reprodukálhatatlan eredmények, a visszhang nélkül maradó publikációk vagy az egyre növekvő költségek kihívásaira a tudomány nyitottságának növelése adhat határozott választ. A nyílt tudomány (Open Science) első állomását, a nyílt hozzáférést (Open Access) követte a kutatási adatok nyitottabb kezelését javasló mozgalom zászlóbontása (Open Research Data).

Derek J. de Solla Price (1922–1983) – angol fizikus, tudománytörténész, a modern tudománymetria egyik megalapítója. Nevéhez fűződik többek között a felismerés, hogy a tudományos publikációk száma exponenciálisan nő.

Hogyan segítheti a tudományt a kutatási adatok nyíltabbá tétele?

A kutatási adatok archiválása, elérhetőségük növelése javíthat a kutatások reprodukálhatóságán. Esetenként a szabadon hozzáférhető adatok más kutatási projektekben újra felhasználhatóak lehetnek. Ugyanakkor a személyes adatok vagy például a feltáratlan régészeti lelőhelyek, fenyegetett természeti értékek adatainak nyilvánosságra hozatala veszélyeket is rejt magában. Az általános alapelv: „Legyen nyitott, amennyire lehetséges, de legyen zárt, amennyire szükséges.”

Milyen lenne az ideális adatkezelési gyakorlat?

A jó adatkezelési gyakorlat biztosításában fontos szerepe van a külföldi tudományfinanszírozók által egyre gyakrabban megkövetelt adatkezelési tervnek (Data Management Plan). Ennek ki kell térnie a projekt során keletkező adatok leírására, a használni kívánt szabványok, formátumok ismertetésére, az adatkezelés esetleges etikai vonatkozásaira, az adatok hosszú távú archiválásának, megosztásának és újrafelhasználásának kérdéseire. Az a kívánatos, hogy a keletkező adatok megtalálhatóak, hozzáférhetőek, szabványosak és újrafelhasználhatóak (Findable, Accessible, Interoperable, Reusable = FAIR) legyenek.

Holl András Forrás: MTA KIK

Mi szükséges ahhoz, hogy a lehető legtöbb kutatás adatait hosszú távon megőrizhessük, lehetőség esetén nyilvánossá is tegyük?

Elhatározás, pénz és technológia. Az Európai Bizottság már 2012-ben kiadta a kutatási adatokra vonatkozó irányelveit. Uniós forrásokat is rendelnek majd a feladathoz, és a technikai háttérről is gondoskodni kívánnak a különböző közösségek és nemzetek szervezeteiből és infrastruktúráiból szerveződő hálózattal, az European Open Science Clouddal (EOSC). A technológiáról azonban nem elegendő csak a tudománypolitika szintjén gondolkozni. Szabványokra, formátumokra, jó gyakorlatok terjesztésére van szükség, méghozzá gyakorta tudományterületenként különbözőekre. Ebben a feladatban kíván segíteni a Research Data Alliance.

Mit lehet tudni a szervezetről?

Bár az RDA az Európai Bizottság, az Egyesült Államok Tudományos Kutatási Alapja (National Science Foundation, NSF), Nemzeti Szabványügyi és Technológiai Hivatala (National Institute of Standards and Technology, NIST), valamint Ausztrália Fejlesztési Minisztériuma kezdeményezésére jött létre 2013-ban, teljesen alulról szerveződő közösség. Tevékenységének legfontosabb eredményei az ajánlások, melyek közül ez idáig 15 született (vagy van folyamatban az elfogadása). Struktúrája az állandó témacsoportokra (Interest Groups) és a meghatározott időre adott feladatokra felállított munkacsoportokra (Working Groups) épül. Számos nemzet hozott létre a szervezeten belül nemzeti csoportot – magyar nemzeti csoport még nem létezik, országunkból az egyéni tagok száma is mindössze tucatnyi.

A budapesti rendezvény célja is egy magyar nemzeti csoport megalakításának ösztönzése volt?

Részben igen, legalábbis annyiban, hogy felvesse egy hazai csoport megalakításának lehetőségét. De a rendezvény célja volt természetesen az RDA bemutatása, népszerűsítése is. A szervezetben egyéni tag bárki lehet, az egyéni tagság ingyenes. Azoknak a kutatóknak, akik sokat foglalkoznak tudományos adatok kezelésével, érdemes felkeresniük az RDA weboldalát, és megnézni, létezik-e olyan munkacsoport, amelynek a munkája számukra releváns lehet. Még csak nem is kell feltétlenül csatlakozni, meg lehet várni a készülő ajánlás megjelenését. Azok a kutatók csatlakozzanak, akik kellőképpen motiváltak, hogy egy ajánlás kidolgozásában részt vegyenek. Azon túl, hogy több hazai kutató megismerhetné az RDA ajánlásait, és vehetne részt a szervezet valamelyik munkacsoportjának tevékenységében, a magyar nemzeti csoport létrehozása segíthetne az EOSC-ban való hazai részvétel szervezésében is.