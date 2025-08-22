Студентите Стефан Крстески, Матеа Ташковска и Борјан Саздов, заедно со своите ментори, професорите Христијан Ѓорески и Бранислав Геразов од Факултетот за електротехника и информациски технологии (ФЕИТ) изработија модел на вештачка интелигенција на македонски јазик, кој е основа за развој на големи јазични модели, како што се Џи-пи-ти моделите, на македонски јазик, пишува порталот „Иновативност“.

Тие велат дека нивниот предизвик бил да придонесат за дигитална еволуција на македонскиот јазик и да создадат основа за негов развој во ерата на вештачката интелигенција (ВИ). Моделот може да се користи во науката, бизнисот, но и во секојдневието. Тимот нагласува дека сите ресурси што ги развива се јавно достапни бидејќи сакаат да им овозможат и на други истражувачи и институции да ги користат, да надградуваат врз нив, а со тоа и да придонесат кон развој на вештачка интелигенција на македонски јазик.

„Целта на нашето истражување беше да го поттикнеме развојот на Вештачката Интелигенција (ВИ) и големите јазични модели на македонски јазик. Денес вакви модели, како што се моделите што стојат зад „Чет-џи-пи-ти“, се користат сè повеќе во различни области за олеснување на секојдневната работа и за подобрување на продуктивноста. Нашата идеја беше да изградиме модел кој не само што го разбира македонскиот јазик, туку и умее да комуницира на литературен и природен начин. За тоа беше потребна голема количина податоци, па во рамките на трудот го создадовме најголемиот јавно достапен текстуален корпус на македонски јазик. Дополнително, подготвивме и множество културолошки прилагодени инструкции, кои му овозможуваат на моделот подобро да учи како да следи насоки“, велат студентите.

„Паралелно со тоа, го развивме и првиот систем за евалуација на перформансите на големите јазични модели за македонски, за да можеме објективно да ги измериме резултатите. Последен чекор од овој процес беше создавањето на големиот јазичен ВИ модел domestic-yak со осум милијарди параметри, кој според евалуацијата е најдобриот модел за македонски јазик во својата категорија. Сите ресурси се од отворен карактер и јавно достапни: www.lvstck.org. Со ова истражување на некој начин придонесовме за поставување на основите за развој и евалуација на вакви големи јазични ВИ-модели на македонски јазик“, додаваат тие.

Според нив, се работи за голем јазичен модел кој е трениран специјално на македонски податоци и ги препознава особеностите на нашиот јазик. Тоа го прави особено значаен, бидејќи овозможува природна и литературна комуникација.