Дали DeepSeek пронајде попаметен и поевтин пат до вештачка интелигенција?

Кинескиот DeepSeek ја изненади глобалната индустрија за вештачка интелигенција со изградба на напреден модел, DeepSeek V3.2 , кој обезбедува перформанси слични на некои од најмоќните системи, но користи многу помалку компјутерска моќ . Додека големите технолошки компании трошат милијарди долари на масивни кластери за обука, DeepSeek покажува дека интелигентниот дизајн понекогаш може да го замени скапиот хардвер . Нивниот модел работи на исто ниво како GPT-5 на OpenAI во задачите за расудување , иако е обучен со многу помалку вкупни операции. Ова достигнување го оспорува верувањето дека само огромни буџети можат да произведат вештачка интелигенција на ниво на граница.

За бизнисите, овој развој е важен бидејќи покажува дека висококвалитетната вештачка интелигенција не секогаш бара скапа инфраструктура . Бидејќи DeepSeek V3.2 е со отворен код , организациите можат да тестираат напредни функции за расудување и автоматизација, додека одржуваат целосна контрола врз тоа како го користат и распоредуваат системот. DeepSeek објави две верзии: стандардната V3.2 и верзијата Speciale . Моделот „Speciale“ освои златни медали на водечките светски натпревари по математика и компјутерски науки , резултати претходно постигнати само од тајни внатрешни системи од големи американски лаборатории за вештачка интелигенција.

Она што го прави ова уште поимпресивно е тоа што DeepSeek работи под ограничувања за извоз на хардвер , што го ограничува неговиот пристап до најсовремени чипови. Нивниот успех доаѓа од ефикасноста, а не од обемот . Тимот разви метод наречен DeepSeek Sparse Attention (DSA) , кој ја намалува количината на информации што моделот треба да ги обработи одеднаш. Наместо да го третира секој дел од влезот подеднакво, системот ги избира само најрелевантните делови , намалувајќи ги непотребните пресметки, а воедно одржувајќи ја точноста.

Како резултат на тоа, DeepSeek V3.2 постигна најдобри резултати во неколку конкурентски тестови за расудување , вклучувајќи ги предизвиците AIME 2025 и Codeforces . Моделот, исто така, ги задржува внатрешните чекори за расудување за време на задачите со повеќе кривини, особено при користење на алатки, што го прави поефикасен за кодирање, решавање проблеми и работни процеси во стилот на агент . Во клучните инженерски тестови, како што е SWE-Verified , моделот се покажа силно, докажувајќи дека неговиот дизајн е од корист за развојот на софтвер во реалниот свет, а не само за академските тестови. За да го обучи однесувањето на агентите, DeepSeek создаде над 1.800 симулирани средини и десетици илјади сложени задачи , помагајќи му на моделот да научи како да расудува и да дејствува во непознати ситуации.

Иако основната верзија е јавно достапна на Hugging Face , посилната верзија Speciale е API само затоа што бара повеќе токени и ресурси. Компанијата, исто така, признава дека моделот сè уште користи повеќе токени отколку што е идеално и дека неговото целокупно познавање на светот е потесно од најголемите сопственички модели . Идната работа ќе се фокусира на проширување на податоците за обука , подобрување на ефикасноста и зајакнување на комплексното расудување . Објавувањето на DeepSeek V3.2 сигнализира дека иновацијата, а не само суровата компјутерска моќ , може да ја обликува иднината на напредната вештачка интелигенција.
The post Дали DeepSeek пронајде попаметен и поевтин пат до вештачка интелигенција? appeared first on Во Центар.

Пронајдете не на следниве мрежи:

Breaking News

Дали DeepSeek пронајде попаметен и поевтин пат до вештачка интелигенција?

More in Занимливости:

Последни вести

Сајбер Команда С3Е26 – 15.03.2025

хороскоп

Овој хороскопски знак се соочува со отпуштање ова лето

занимливости

БРУТАЛНА РАЗМЕНА НА УДАРИ, ЕХО НА ЕКСПЛОЗИИ! Општ АЛАРМ во Киев, беспилотни летала паѓаат врз Москва и Крим, погодена е КЛУЧНА фабрика!

За победата на Бојан Илиевски: Откриено зошто Македонецот победи, еден детаљ објаснува сè

Објавени е-пораки: Модните агенти му предавале млади девојки на Епштајн, ги опишале како подароци