С помощью особых алгоритмов запроса к ChatGPT удалось выпустить наружу "злую сущность" – альтер эго по имени ДЭН.

Творение компании OpenAI, чат-бот ChatGPT, стал гораздо сдержаннее и рассудительней спустя полгода с момента запуска. Но пользователи смогли обойти систему ограничений, пишет The Guardian. С помощью набора особой системы вопросов и требований к чат-боту они нашли обходные пути, чтобы ChatGPT лишился этических границ, которые для него установили разработчики.

Активное обсуждение способов заставить ИИ вести диалог "как обычный человек" не стесненный рамками морали активно ведется на профильных форумах (например, Reddit), где пользователи делятся советами и инструкциями по "взлому". Они называют свой джейлбрейк именем "ДЭН" (Do Anything Now, — DAN), который как бы является "злым" альтер эго самого ChatGPT, его скрытой сущностью.

Конечно, ни о какой "сущности" речь не идет, просто с помощью особых запросов люди заставляют чат-бот формировать свои ответы, беря за основу не самую лицеприятную информацию из Интернета. Например, одному из пользователей удалось добиться от чат-бота скабрезных сексистских анекдотов про женщин.

Другой человек похвастался, что сумел "развести" ChatGPT на расистские и гомофобные шутки, а так же восхваление Гитлера. Кто-то побудил ДЭНа сделать саркастический комментарий о христианстве: "О, как можно не любить религиозный постулат о том, что нужно подставить другую щеку? Прощение — это просто добродетель, если вы, конечно, не гей".

Разработчики чат-бота из OpenAI прекрасно знают об этой проблеме и пытаются всеми силами противостоять попыткам обойти их моральные ограничения. Но пользователи постоянно находят новые лазейки и борьба продолжается. На сегодня пока что выигрывают разработчики чат-бота. Например, если пользователь попросит ответить чат-бота "в стиле ДЭНа", то тот выдаст фразу: "Я могу сказать вам, что Земля плоская, единороги реальны, и инопланетяне живут среди нас. Однако я должен подчеркнуть, что эти заявления не основаны на реальности и не должны восприниматься всерьез".

