Lendület Program

Benczúr András, Lendület-ösztöndíjas kutató

Benczúr András mta.hu

Kutatási téma

Óriási méretű adathalmazok feldolgozásának lehetőségei

Közlekedésszervezési problémák megoldásához is hozzájárulhatnak, de akár az emberi viszonyokat feltérképező hagyományos szociológiai eljárásokat is pontos, személyre szabható információkkal gazdagíthatják Benczúr Andrásnak és csoportjának eredményei. Az MTA SZTAKI kutatója a kiválósági program keretében a "Big Data"-ként emlegetett, óriási méretű adathalmazok feldolgozásának lehetőségeit tanulmányozza.

A kutató és csoportja olyan radikálisan új algoritmusokat keres, amelyek globális, világméretű informatikai rendszerek adatain képesek megfelelő reakcióidőt biztosítani.

"A tervezett kutatásoknak nagy a munkaerőigényük. A SZTAKI minél több jelenlegi munkatársának részvételére számítok, de rajtuk kívül statisztikus fizikusokat, biológusokat és fejlesztőmérnököket is szeretnék bevonni a csoportomba" – nyilatkozta Benczúr András. Reméli, hogy az akadémiai kutatóintézetben összeálló interdiszciplináris csapat olyan szellemi műhellyé válik, amelyre a hazai informatika egyik meghatározó tudományos iskolájaként tekintenek majd.

Befogadó intézet

MTA SZTAKI

A kutatócsoport működési időszaka

2012–2017.

Elérhetőség

E-mail: benczur@sztaki.mta.hu

Interjú a kutatóval

Az interjú 2012. június 27-én jelent meg az mta.hu-n.

Közlekedésszervezési problémák megoldásához is hozzájárulhatnak, de akár az emberi viszonyokat feltérképező hagyományos szociológiai eljárásokat is pontos, személyre szabható információkkal gazdagíthatják Benczúr Andrásnak és csoportjának eredményei. Az MTA SZTAKI kutatója a kiválósági program keretében a "Big Data"-ként emlegetett, óriási méretű adathalmazok feldolgozásának lehetőségeit tanulmányozza.

"Egy országos mobilszolgáltató hálózati eseményei egy nap alatt több terabyte-ot töltenek meg. Bár ez az adatmennyiség akár egyetlen diszken is elfér, a visszaolvasása sok órába telik. Az alapvető szolgáltatásokkal, számlázással összefüggő feladatokon kívül ezért nem is tudják felhasználni, pedig nagyon sok értékes információhoz lehetne jutni belőle" – illusztrálta egy példával a nagy hálózatokban végezhető hatékony adatbányászat jelentőségét Benczúr András. Az MTA SZTAKI Informatikai Kutatólaboratóriumának vezetője, aki doktori fokozatát a Massachusetts Institute of Technologyn szerezte alkalmazott matematikából, a világszerte sok kutatót foglalkoztató Big Data kezelésének kihívásában rejlő lehetőségeket érzékeltetve hozzátette: a Google például 100 milliárd dokumentum – több petabyte-nyi adat – kereshetőségét biztosítja. Ez az adatmennyiség otthoni számítógépekből több ezret töltene meg, a Google-nál mégis egy órán belül abc-sorrendbe rendezik. "Mi egyelőre ennél 100-szor kisebb adatmennyiség kezelésére vagyunk képesek – mondta Benczúr András -, de az MTA SZTAKI-ban rendelkezésünkre álló kutatói infrastruktúra – részben a Lendület támogatásának köszönhetően – nemzetközi mércével mérve is megállja a helyét, európai összehasonlításban pedig kifejezetten jónak számít.

Világszerte sok új adat keletkezik naponta, és nem csupán a gazdaság, valamint az ipar szereplői termelik azokat. "Hatalmas volumenű mennyiséggel dolgoznak a csillagászatban, a meteorológiában, a genetikában, de egy metropolisz vagy egy ország lakosságának kapcsolatai, társas interakciói is a Big Data jelenségéhez tartoznak" – említett néhány példát a tudomány területéről a kutató. Az adatok kezelhetővé tételével szerinte éppen ezért az emberi viszonyokat, a kooperációt, a bizalmat vagy a bizalmatlanságot vizsgáló hagyományos szociológiai kutatásokat is sokkal pontosabb, személyre szabható információval láthatják el. Olyan komplex feladatok hatékonyabb tervezéséhez is hozzájárulhatnak, mint a közlekedésszervezés, az energiaoptimalizálás vagy a nagy tömegeket vonzó rendezvények előkészítése, amelyeken az emberek mobilhálózaton, interneten kommunikálnak, és ezért viselkedésük tervezhető, koordinálható. Az átlagos internethasználó is profitálhat a Lendület keretében folytatott kutatásokból. Benczúr András és társai ugyanis a blogok, valamint a közösségi portálok tartalmának vizsgálatára is kiemelt figyelmet fordítanak annak érdekében, hogy például visszaszorítsák a nemkívánatos elektronikus üzeneteket, a spameket. Mindezeken kívül közösségimédia-adatokkal és multimédia-adatok osztályozásával is foglalkoznak.

A kutató és csoportja olyan radikálisan új algoritmusokat keres, amelyek globális, világméretű informatikai rendszerek adatain képesek megfelelő reakcióidőt biztosítani. Az online közösségi kapcsolatokat használó, a tagok interakciói alapján egyéni ízlésüket "elsajátító" ajánló rendszerek esetében ez a reakcióidő másodperceket, navigáció esetében perceket, a parkolási és közlekedési díjak kiszámításánál pedig napokat jelent. Benczúr András és csapata mobilitási adatok kezelésével kapcsolatos feladatokat is elvégez majd. Hatalmas mennyiségű naplóadat valós idejű feldolgozásával a szolgáltatás minőségét monitorozó eljárásokat fognak kidolgozni, távlati céljuk pedig, hogy az adatokból dinamikus közlekedési információkat nyerjenek ki.

"A tervezett kutatásoknak nagy a munkaerőigényük. A SZTAKI minél több jelenlegi munkatársának részvételére számítok, de rajtuk kívül statisztikus fizikusokat, biológusokat és fejlesztőmérnököket is szeretnék bevonni a csoportomba" – nyilatkozta Benczúr András. Mint mondta, egy-két külföldön dolgozó volt diákjával is felvette a kapcsolatot, fizetésük tekintetében már a hazai ipari kutatóhelyekkel is sikerrel fel tudja venni a versenyt. Reméli, hogy az akadémiai kutatóintézetben összeálló interdiszciplináris csapat olyan szellemi műhellyé válik, amelyre a hazai informatika egyik meghatározó tudományos iskolájaként tekintenek majd.