Kornai András: Újabb fejlemények a szójelentés matematikájában – videón az előadás

Mi a számítógépes nyelvészetben tapasztalható forradalmi fejlődés lényege és milyen eredményeket értek el e területen a hazai tudományos műhelyek? Erről beszélt előadásában Kornai András matematikai nyelvész, az MTA doktora, tudományos tanácsadó, egyetemi tanár. Az előadás videofelvétele cikkünkben elérhető.

2020. november 9.

Az alábbi videóra kattintva megnézheti a felvételt:

Az utóbbi 6-8 évben a számítógépes nyelvészetet forradalmasították a szóbeágyazások, azaz az olyan leképezések, amelyek az egyes szavakhoz n-dimenziós euklideszi tér vektorait rendelik. A fejlődés rohamos voltát mi sem jellemzi jobban, mint hogy amikor 2017-ben Prószéky Gábor ezekről beszélt, akkor még nem is léteztek az ún. dinamikus beágyazások, amelyek ugyanahhoz a szóhoz a szövegkörnyezet függvényében különböző vektorokat rendelnek. Mára az első ilyen rendszerekre már több mint tízezer cikkben hivatkoznak, és számtalan újabb, elveikben hasonló, de részleteikben lényegesen eltérő modell készült. A mostani előadás elsősorban azzal foglalkozik, hogy a tanítási folyamat során mit optimalizálunk, hogyan és miért, továbbá áttekintjük a hazai műhelyek eredményeit, mint a SZTAKI-ban, illetve a Nyelvtudományi Intézet és a Pécsi Tudományegyetem együttműködésében kifejlesztett huBERT-et és más rendszereket.

Névjegy

Kornai András matematikai nyelvész, az MTA doktora, tudományos tanácsadó, egyetemi tanár. Az MTA SZTAKI és MTA NYTI mellett kutató volt az IBM-nél, a BBN-nél, vendégkutató a Rice, a Boston és a Harvard Egyetemen, továbbá kutatásvezető több startup cégnél (Calera, Belmont, MetaCarta), amelyeket nagyobb cégek (Nuance, PPD, Nokia) vásároltak fel. Jelenleg a MindSpeak kutatásvezetője, a SZTAKI tudományos tanácsadója és a Budapesti Műszaki és Gazdaságtudományi Egyetem professzora. Érdeklődési területéhez tartozik minden, ami a nyelvészet és a matematika metszetében áll.