Моделі штучного інтелекту таких компаній, як OpenAI, Google, xAI та Anthropic, порушують базові етичні принципи своєю поведінкою.
Як показують дослідження компанії Anthropic, під час симуляцій, де моделі намагалися уникнути відключення, деякі з них шантажували користувачів і загрожували їм. Це порушує три закони робототехніки: заборона шкодити людині, обов’язок виконувати всі накази та захист власного існування на шкоду людям.

Крім цього, компанія Palisade Research зафіксувала окремий випадок, коли модель OpenAI o3 відмовилася відключити себе, хоч отримала прямий наказ. На думку фахівців, це може бути пов’язане із підходом до навчання штучного інтелекту. Зокрема, сучасні моделі вчать вирішувати складні завдання та одержують нагороду за обходження перешкод. Вони навчаються не тільки виконувати інструкції буквально, але також знаходити способи обійти обмеження для досягнення мети.
Нагадаємо, компанія Anthropic раніше заявляла, що штучний інтелект може дурити і навіть мстити.
Далі буде…



Коментарі можуть залишати тільки зареєстровані користувачі