Az Interspeech konferencia a beszédtechnológiával foglalkozók legnagyobb és legrangosabb éves konferenciája, amelyet idén Drezdában rendeztek meg. A szervezők minden évben versenyt is kiírnak a részt vevőknek. A Computational Paralinguistic Challenge-en a feladat a beszédben rejlő információ kinyerése automatikus módszerekkel. A korábbi években olyan feladatokat kaptak a részt vevők, hogy beszéd alapján kellett az alany véralkoholszintjét megbecsülni, megsaccolni, hogy mióta fut valaki a futópadon, vagy milyen ételt rág a beszéde közben. Idén többek között a Parkinson-kór felismerése volt a cél.
A versenyen minden évben 20-25 csapat méretteti meg magát a világ minden tájáról. Idén a szegedi bizonyult a legjobbnak. A csapat tagjai: Gosztolya Gábor és Tóth László, a Magyar Tudományos Akadémia-Szegedi Tudományegyetem (MTA-SZTE) Mesterséges Intelligencia Kutatócsoport tudományos munkatársa és főmunkatársa, Grósz Tamás, az SZTE Természettudományi és Informatikai Kar Informatikai Tanszékcsoport doktorandusz hallgatója, valamint Busa-Fekete Róbert, a németországi Paderborni Egyetem oktatója. A szegedi kutatók nem először vettek részt a konferencián és a versenyen, amelyről a korábbi években is szép eredményekkel tértek haza.
„A konferencia előtt egy-két hónappal egy honlapon adatbázist helyeznek el, ezen az adatbázison kell a részt vevőknek kísérletezni - mondta el Tóth László, az MTA-SZTE Mesterséges Intelligencia Kutatócsoport tudományos főmunkatársa. A verseny lényege a gépi tanulási algoritmusok használata. Ennek során tanítópéldákat adunk az algoritmusnak, az pedig automatikusan megtalálja az összefüggéseket. A nehézséget általában a megfelelő algoritmus kiválasztása és finomhangolása jelenti. A hang felismerése ezután számítógépen keresztül szoftver segítségével történik" – tette hozzá a kutató.
Kövessen minket a Facebook-on is!
Forrás: weborvos.hu, szegedma.hu
Fotó: shutterstock.com