Студенти и истражувачи на Факултетот за електротехника и информациски технологии (ФЕИТ при УКИМ) ја освоија наградата за најдобар научен труд со наслов ‘Towards Open Foundation Language Model and Corpus for Macedonian: A Low-Resource Language’ на меѓународната конференција Slavic NLP Workshop, одржана во Виена во рамките на 63-тото издание на една од најпрестижните светски конференции за обработка јазик – ACL (Association for Computational Linguistics).

Стефан Крстески, Борјан Саздов и Матеа Ташковска, под менторство на професорите Бранислав Геразов и Христијан Ѓорески, со овој труд направија значаен придонес кон дигитализацијата и технолошкиот развој на македонскиот јазик и Вештачката Интелигенција (ВИ) во Македонија. Во рамките на ова истражување беа развиени четири клучни ресурси:

• голем јазичен ВИ модел (анг. LLM) специјализиран за македонски јазик кој е најдобар во својата категорија – domestic-yak-8B;

• најголемиот јавно достапен текстуален корпус за македонски јазик;

• множество на инструкции на македонски јазик наменето за развој на големи јазични модели;

• систем за евалуација на перформансите на јазичните модели на македонски јазик

Овие ресурси се јавно достапни на веб-страницата www.lvstck.org и претставуваат прва отворена инфраструктура за развој на големи јазични модели и апликации базирани на вештачка интелигенција на македонски. Овие ресурси можат се искористат како основа за понатамошни истражувања, развој на македонски јазични алатки и нивна примена во различни сфери и апликации.

ACL е водечка глобална конференција во областа на обработка на природен јазик, со традиција од 63 години. “Slavic NLP”Workshop, која оваа година го одбележа своето десетто издание, е посветена на истражувања од областа на обработка на сите словенски јазици.

Овој успех не само што претставува меѓународно признание за македонските истражувачи, туку и чекор кон дигитална иднина во која македонскиот јазик добива поддршка и видливост во глобалниот развој на јазични технологии и вештачка интелигенција.

извор: ФЕИТ