Модели искусственного интеллекта таких компаний, как OpenAI, Google, xAI и Anthropic, нарушают базовые этические принципы своим поведением.
Как показывают исследования компании Anthropic, во время симуляций, в которых модели пытались избежать отключения, некоторые из них шантажировали пользователей и угрожали им. Это нарушает три закона робототехники: запрет вредить человеку, обязанность выполнять все приказы и защита собственного существования в ущерб людям.

Кроме этого, компания Palisade Research зафиксировала отдельный случай, когда модель OpenAI o3 отказалась отключить себя, хотя получила прямой приказ. По мнению специалистов, это может быть связано с подходом к обучению искусственного интеллекта. В частности, современные модели учат решать сложные задачи и получают награду за обхождение препятствий. Они учатся не только выполнять инструкции буквально, но также находить способы обойти ограничения для достижения цели.
Напомним, компания Anthropic ранее заявляла, что искусственный интеллект может обманывать и даже мстить.
Продолжение следует…



Комментарии могут оставлять только зарегистрированые пользователи