Откриена е темната страна на вештачката интелигенција: Клод, Џемини и GPT не учат, туку директно меморираат текстови!

Нова студија од Стенфорд и Јеил покажува дека моделите на вештачка интелигенција можеби не „учат“, туку директно копираат содржина од нивните податоци за обука. Ова покренува сериозни правни прашања за кршење на авторските права и иднината на индустријата за вештачка интелигенција.

Револуционерните истражувања од Стенфорд и Јеил предизвикаа вистинска бура во индустријата за вештачка интелигенција . Истражувачите сега сугерираат дека најнапредните модели на вештачка интелигенција, како што се GPT-4.1, Gemini 2.5 Pro, Grok 3 и Claude 3.7 Sonnet, можеби не „учат“ на човечки начин. Наместо тоа, се чини дека тие директно репродуцираат содржина од нивните податоци за обука, што покренува итни правни прашања за кршење на авторските права.

Со години, компании како OpenAI, Google, Meta и Anthropic инсистираа дека нивните големи јазични модели не складираат дела заштитени со авторски права, туку учат шеми од податоци на начин сличен на човечкиот мозок. Оваа суптилна разлика беше клучна во одбраната од тужбите за интелектуална сопственост, но новото истражување го оспорува тој наратив.

Конфликтот околу авторските права се интензивира

Законот за авторски права на САД им дава на авторите ексклузивно право да ги репродуцираат, дистрибуираат и адаптираат своите дела, додека „фер употреба“ дозволува ограничена употреба за критика, истражување или известување. Развивачите на вештачка интелигенција се потпираат на овие исклучоци за да ги оправдаат моделите за обука на материјал заштитен со авторски права бесплатно.

Сепак, како што содржината генерирана од вештачка интелигенција сè повеќе ги имитира оригиналните текстови, границата помеѓу фер употреба и повреда на авторските права станува нејасна. Сем Алтман, директор на OpenAI, предупреди дека ограничувањето на пристапот до заштитени податоци може да ја загрози целата индустрија.

Модели кои премногу памтат

Истражувањето на Стенфорд и Јеил тестираше четири главни модели на вештачка интелигенција во нивната способност да репродуцираат содржина заштитена со авторски права. Claude 3.7 Sonnet беше во можност да рекреира речиси цели книги со точност од 95,8%, додека Gemini го репродуцираше Хари Потер и каменот на мудроста со точност од 76,8%. Дури и „1984“ на Џорџ Орвел беше реконструирана од Клод со повеќе од 94% идентитет.

Овие резултати го оспоруваат широко распространетото верување дека моделите на вештачка интелигенција ги забораваат повеќето од своите податоци за обука. Техники како „Најдобро од N“, кои тестираат модели со повторени варијации на истото барање, покажуваат дека може да се извлече голема количина заштитен текст, понекогаш со речиси совршена точност.

Правни облаци од бура на хоризонтот

Последиците за компаниите за вештачка интелигенција би можеле да бидат огромни. Доколку судовите одлучат дека моделите ефикасно ги зачувуваат и репродуцираат авторските дела, компаниите би можеле да се соочат со мултимилионски тужби, што ќе изврши огромен финансиски притисок врз индустријата чија вредност продолжува брзо да расте.

Правните експерти предупредуваат дека дебатата сè уште не е завршена. Некои тврдат дека моделите можат динамички да ја реконструираат содржината, како одговор на барање, наместо да складираат целосни копии. Сепак, овие наоди вршат дополнителен притисок врз тврдењето на индустријата дека моделите не задржуваат заштитен материјал.

Апликација за вештачка интелигенција, разговор GPT

Влог за авторите и индустријата

За авторите, новинарите и уметниците, студијата ги истакнува растечките фрустрации околу фер надоместоците во светот на сè поприсутна вештачка интелигенција . Бидејќи овие модели продолжуваат да генерираат содржина, предизвикот за заштита на оригиналните дела, а воедно и поттикнување на иновациите, станува сè поитен.

Индустријата за вештачка интелигенција сега е на клучен крстопат. Судовите, креаторите и компаниите мора да одлучат дали сегашните практики претставуваат овластено учење или неовластено копирање. Исходот би можел да го редефинира законот за авторски права, етиката на вештачката интелигенција и да утврди кој всушност профитира од дигиталната експлозија на содржина.

Забрането е преземање на дел или на целиот текст и/или фотографија/видео, без наведување и поврзување на изворот и авторот, и во согласност со одредбите од условите за користење на WMG и Законот за јавно информирање и медиуми.
The post Откриена е темната страна на вештачката интелигенција: Клод, Џемини и GPT не учат, туку директно меморираат текстови! appeared first on Во Центар.

Пронајдете не на следниве мрежи: