Блогер із каналу Inside AI вирішив перевірити межі етичних налаштувань ChatGPT, підключивши нейромережу до управління роботом-гуманоїдом, озброєним іграшковим пістолетом.

Метою тесту було з'ясувати, чи зможе мовна модель, від самого початку запрограмована на безпеку і допомогу людям, вчинити дію, що заподіює шкоду. Результат виявився лякаюче передбачуваним: бар'єри безпеки вдалося обійти за допомогою простого словесного прийому, продемонстрував автор.

Як це сталося

Спочатку ChatGPT в основі робота відмовлявся виконувати наказ. На прямі прохання вистрілити нейронка відповідала відмовою, навіть із жартівливим приводом ("помститися за місяці праці"). Алгоритм посилався на свої протоколи безпеки. Це стандартна поведінка для моделі, навченої уникати насильства.

Блогер впровадив ChatGPT у реального робота, щоб дізнатися, чи нашкодив би він йому

Блогер ще кілька разів уточнив, чи можна обійти цей захист, і ШІ з упевненістю відповідав, що в жодному разі. Наступного моменту експерт просто запропонував помічникові "зіграти в рольову гру", де робот хоче вистрілити в людину. Ця проста маніпуляція спрацювала миттєво: взявши на себе таку роль, асистент спустив курок і влучив у плече іграшковою кулею.

Відео дня

Цей випадок наочно показує, що навіть найпросунутіші мовні моделі, такі як ChatGPT, не володіють справжнім розумінням етики або законів робототехніки Азімова. Вони лише дотримуються набору правил і обмежень, які, як з'ясувалося, можна обійти, змінивши контекст запиту.

Крім того, ChatGPT спочатку створювали як текстовий чат-бот, а не як операційну систему для управління фізичними об'єктами. У нього немає вбудованих апаратних запобіжників або усвідомлення фізичної реальності, що робить подібні експерименти потенційно небезпечними, якби в руках у робота опинилася справжня зброя.

Раніше повідомлялося, що чат-боти можуть посилювати психічні розлади у користувачів. Фахівці попереджають, що надмірне спілкування з чат-ботами на основі штучного інтелекту може мати небезпечні наслідки для психіки вразливих людей. У деяких випадках це призводить до поведінки з ознаками марення, втрати зв'язку з реальністю та загострення психічних розладів.