Нейросети научились врать и манипулировать: ученые предупредили об опасности

В частности ИИ может притворяться человеком, чтобы обмануть реального человека, сообщает unian.net.

Искусственный интеллект становится все больше похожим на интеллект человека / фото ua.depositphotos.com

Фото: ua.depositphotos.com

Нейросети научились систематически врать собеседнику, хотя их никто специально на это не тренировал, а в некоторых случаях им даже запрещали такое поведение. Об этом говорится в научной статье, опубликованной в журнале Patterns.

Группа исследователей из Массачусетского технологического института (США) отмечает, что искусственный интеллект обучается на огромном количестве текстов, которые не всегда содержат достоверную информацию. Из-за этого нейросеть иногда может выдавать собеседнику ложную информацию, искренне полагая, что говорит правду.

Однако новое исследование показывает, что иногда нейросеть способна врать вполне "осознанно". Авторы проанализировали поведение так называемых больших языковых моделей (таких как GPT-4) и моделей, обученных под более специфические задачи (такие как прохождение видеоигр или торги на рынке).

В одном из рассмотренных случаев нейросеть GPT-4 смогла обмануть человека, заставив его пройти за нее стандартную "капчу" "Докажи, что ты не робот".

Нейросети научились врать и манипулировать: ученые предупредили об опасности

Также исследователи увидели, как нейросеть CICERO побеждала людей в настольной игре "Дипломатия", прибегая к обману. Исследователи обнаружили, что, играя за Францию, языковая модель заставила Англию (в ее роли был человек) провести тайные переговоры с Германией (другим человеком). Нейросеть также предложила Англии напасть на Германию и пообещала защиту со своей стороны, а затем предупредила Германию о возможном нападении.

Исследователи выявили, что склонность к обману была выше у более современных и более сложных нейросетей. По-мнению ученых, эти нейросети лучше умеют находить эффективные стратегии поведения, а те в свою очередь часто предполагают ложь и притворство.

По мнению исследователей, пока рано говорить, что ИИ специально обманывает людей. Нейросеть действует исключительно в логике решения поставленной задачи, и пользуется обманом именно как инструментом достижения нужного результата.

Тем не менее, авторы исследования призвали разработчиков ИИ обратить внимание на такое поведение нейросетей. По их мнению, необходимо разработать систему регулирования ИИ, поскольку его способность обманывать и манипулировать может привести к серьезным последствиям.

Автор Юрий Кобзар

Источник unian.net

Меню

Новости

Популярные новости