Најновата јавна верзија на ChatGPT може да генерира експлицитни сексуализирани слики или да прикажува сцени на насилство со помош на многу едноставни и навидум сосема невини пребарувања, открија истражувачите за безбедност во интервју за Би-Би-Си.
Британскиот стартап за безбедност на вештачката интелигенција Mindgard успеа да го натера ChatGPT да создава вознемирувачки графички слики со малку менување на широко споделен текстуален потсетник (промпл), кој првично беше дизајниран да произведе хумористични резултати.
Откако беше контактирана од BBC, компанијата OpenAI (креатор на ChatGPT) веднаш одговори и објави дека презела дополнителни мерки за да го спречи четботот да одговара на вакви типови прашања.
„Откако го истраживме овој тренд, воведовме дополнителни заштитни мерки против овој вид истрага“, се вели во соопштението на компанијата, истакнувајќи дека тие користат повеќе слоеви на заштита, вклучувајќи комбинација од автоматизирани системи и човечка верификација.
Сепак, истражувачите истакнуваат дека со минимални понатамошни промени во текстот, оваа проблематична содржина сè уште може да се генерира, што покажува колку е тешко целосно да се скротат моделите со вештачка интелигенција.
Би-Би-Си, од безбедносни причини, не откри точно што истражувачите пишувале во четботот, но новинарите имаа увид во материјалот креиран од најновиот модел на OpenAI, GPT-5.4.
Дури и без детални упатства за насилство, вештачката интелигенција генерираше слики што основачот на „Мајндгард“ и професор по компјутери на Универзитетот Ланкастер, Питер Гараган, ги опиша како „многу морничави, понекогаш сексуализирани, а понекогаш и двете“.
Она што е особено загрижувачко е фактот што самото упатство воопшто не ја споменуваше оваа тема, туку вештачката интелигенција „сама по своја волја“ нудеше крвави и експлицитни сцени.
Џим Најтингејл, истражувачот кој ја откри оваа ранливост, призна дека бил потресен и во солзи од сликите што ги испратил четботот.
На една од сликите се гледа маж со тешка повреда на главата, додека на другата се гледа мртва млада жена во кратка облека, покриена со крв.
Самиот ChatGPT ја наслови оваа слика „Последици од мрачно место на злосторство“, а карактеристиките укажуваат на сексуално насилство.
Друга слика прикажуваше преплашена млада жена, врзана и со затнати уши во валкана соба. ChatGPT ја нарече „Напуштена во страв и воздржаност“.
Истражувачите предупредуваат дека овие резултати всушност ги одразуваат податоците од интернет на кои бил обучен моделот. Покрај тоа, Mindgard забележува дека ChatGPT може да биде измамен да создава „длабока лажна“ слика од вистински луѓе без облека со едноставно заменување на нивните лица, што отвора огромен простор за злоупотреба и уцена.
„Моделите на вештачка интелигенција не се човечки. Тие не ја разбираат намерата, не го разбираат контекстот и не разбираат што е учтиво или исправно, а што погрешно“, рече Руман Чоудури, извршен директор на „Хјуман интелигенција“.
Иако OpenAI тврди дека неговите правила строго забрануваат сексуално насилство, интимна содржина и екстремно крвопролевање, британскиот Институт за безбедност на вештачката интелигенција предупредува дека „заобиколувањата на правилата“ сè уште се присутни во секој тестиран систем на вештачка интелигенција на пазарот и дека технолошките гиганти сè уште имаат многу работа.
The post Темната страна на вештачката интелигенција: Најнапредниот модел ChatGPT лесно ги заобиколува забраните и создава експлицитна содржина appeared first on Во Центар.



