Magyar nyelvtechnológiai eredmények a mesterséges intelligencia korában – Prószéky Gábor közgyűlési díszelőadása videón
Mi az a nyelvmodell, és mire használható? Erre a kérdésre adott választ a Magyar Tudományos Akadémia 197. közgyűlésének ünnepi ülésén tartott előadásában Prószéky Gábor nyelvész-matematikus, az MTA doktora, a HUN-REN Nyelvtudományi Kutatóközpont főigazgatója. Az előadásról készített felvétel cikkünkben megnézhető.
A digitális világban egy nyelv jövője több erre irányuló kutatás szerint is azon múlik, hogy a legfontosabb digitális tartalmak, mint például a Wikipédia, rendelkezésre állnak-e a nemzeti nyelven, valamint ma már az is meghatározó, hogy a legmodernebb nyelvtechnológiai eszközök, a mesterségesintelligencia-kutatások következtében kialakult, úgynevezett hatalmas nyelvmodellek elérhetőek-e egy-egy nemzeti nyelven.
Világunkban, ahol az angol nyelv használata minden eddiginél elterjedtebb, az egyes nyelveknek, így a magyarnak is, ezzel a helyzettel meg kell küzdeniük. Az elmúlt évtizedek hazai kutatás-fejlesztéseinek eredményeként a magyar nyelv e tekintetben meglehetősen jól áll, köszönhetően a fent felsorolt eszközök folyamatos létrejöttének. Az utóbbi egy-két évben, a mesterségesintelligencia-hullám megjelentével megnőtt az érdeklődés a hatalmas nyelvmodellek iránt. Az előadás áttekinti ezeknek a technológiáknak a kialakulását, majd alaptípusaikat és legfőképp a magyar nyelvre való alkalmazhatóságuk kérdését.
Prószéky Gábor előadásában a neves nemzetközi intézmények legismertebb rendszerei mellett bemutatta a HUN-REN Nyelvtudományi Kutatóközpontban egy több mint 40 milliárd szóból álló magyar nyelvű tanítóanyag segítségével létrehozott PULI nyelvmodellt, ismertette létrehozásának céljait, működését pedig példák segítségével illusztrálta is.