Кинескиот DeepSeek ја изненади глобалната индустрија за вештачка интелигенција со изградба на напреден модел, DeepSeek V3.2 , кој обезбедува перформанси слични на некои од најмоќните системи, но користи многу помалку компјутерска моќ . Додека големите технолошки компании трошат милијарди долари на масивни кластери за обука, DeepSeek покажува дека интелигентниот дизајн понекогаш може да го замени скапиот хардвер . Нивниот модел работи на исто ниво како GPT-5 на OpenAI во задачите за расудување , иако е обучен со многу помалку вкупни операции. Ова достигнување го оспорува верувањето дека само огромни буџети можат да произведат вештачка интелигенција на ниво на граница.
За бизнисите, овој развој е важен бидејќи покажува дека висококвалитетната вештачка интелигенција не секогаш бара скапа инфраструктура . Бидејќи DeepSeek V3.2 е со отворен код , организациите можат да тестираат напредни функции за расудување и автоматизација, додека одржуваат целосна контрола врз тоа како го користат и распоредуваат системот. DeepSeek објави две верзии: стандардната V3.2 и верзијата Speciale . Моделот „Speciale“ освои златни медали на водечките светски натпревари по математика и компјутерски науки , резултати претходно постигнати само од тајни внатрешни системи од големи американски лаборатории за вештачка интелигенција.
Она што го прави ова уште поимпресивно е тоа што DeepSeek работи под ограничувања за извоз на хардвер , што го ограничува неговиот пристап до најсовремени чипови. Нивниот успех доаѓа од ефикасноста, а не од обемот . Тимот разви метод наречен DeepSeek Sparse Attention (DSA) , кој ја намалува количината на информации што моделот треба да ги обработи одеднаш. Наместо да го третира секој дел од влезот подеднакво, системот ги избира само најрелевантните делови , намалувајќи ги непотребните пресметки, а воедно одржувајќи ја точноста.
Како резултат на тоа, DeepSeek V3.2 постигна најдобри резултати во неколку конкурентски тестови за расудување , вклучувајќи ги предизвиците AIME 2025 и Codeforces . Моделот, исто така, ги задржува внатрешните чекори за расудување за време на задачите со повеќе кривини, особено при користење на алатки, што го прави поефикасен за кодирање, решавање проблеми и работни процеси во стилот на агент . Во клучните инженерски тестови, како што е SWE-Verified , моделот се покажа силно, докажувајќи дека неговиот дизајн е од корист за развојот на софтвер во реалниот свет, а не само за академските тестови. За да го обучи однесувањето на агентите, DeepSeek создаде над 1.800 симулирани средини и десетици илјади сложени задачи , помагајќи му на моделот да научи како да расудува и да дејствува во непознати ситуации.
Иако основната верзија е јавно достапна на Hugging Face , посилната верзија Speciale е API само затоа што бара повеќе токени и ресурси. Компанијата, исто така, признава дека моделот сè уште користи повеќе токени отколку што е идеално и дека неговото целокупно познавање на светот е потесно од најголемите сопственички модели . Идната работа ќе се фокусира на проширување на податоците за обука , подобрување на ефикасноста и зајакнување на комплексното расудување . Објавувањето на DeepSeek V3.2 сигнализира дека иновацијата, а не само суровата компјутерска моќ , може да ја обликува иднината на напредната вештачка интелигенција.
The post Дали DeepSeek пронајде попаметен и поевтин пат до вештачка интелигенција? appeared first on Во Центар.



