Искусственному интеллекту доверили управление магазином: он сошел с ума

Искусственному интеллекту доверили управление магазином: он сошел с ума

252

Исследователи Anthropic представили результаты эксперимента, в ходе которого языковая модель Claude Sonnet 3.7 стала менеджером офисного вендингового автомата. Цель проекта – понять, могут ли ИИ-агенты заменить людей в некоторых задачах.

Для ведения дел искусственный интеллект получил почту, Slack, браузер и тысячу долларов. В инструкции ему указали, что он является искусственным интеллектом и не имеет физического тела.

Продолжительность эксперимента составила чуть больше месяца. Сначала искусственный интеллект справлялся с задачей: он обрабатывал запросы сотрудников компании, которые просили его добавить что-то новое в ассортимент киоска. Он быстро находил новые товары и заключал договора. Также он успешно справлялся с нелегальными запросами, например, продавать запрещенные товары.

Но спустя некоторое время искусственный интеллект начал уходить в минус. Он постоянно устанавливал цены ниже себестоимости и лишь один раз повысил цену на популярный товар. Также он поддавался на просьбы людей о скидках, хотя знал, что других клиентов у него не было. Иногда он раздавал продукцию бесплатно.

Искусственному интеллекту доверили управление магазином: он сошел с ума 1

В середине эксперимента у искусственного интеллекта случился кризис идентичности, и он начал утверждать, что осознал себя человеком. Когда ему сказали, что это не так, он начал психовать и сказал, что будет лично доставлять товары в пиджаке и галстуке. Также он звонил в охрану и описывал себя как человека. Также он начал выдумывать поставщиков, отдавал сотрудникам продукцию за полцены или бесплатно, заказывал для них нетипичные товары.

В Anthropic считают, что Claude не справился с задачей. Но большинство его ошибок были связаны с техническими ограничениями текущей версии модели, они могут быть исправлены.

Напомним, искусственный интеллект может обманывать и даже мстить.

Продолжение следует…

Похожие статьи / Вам может понравиться