У искусственного интеллекта обнаружили удивительные способности к обману человека У искусственного интеллекта обнаружили удивительные способности к обману человека
Техно

У искусственного интеллекта обнаружили удивительные способности к обману человека

Фото: Getty Images
Дарина Герасимчук 17 января, 2024, 17:03
 0

Исследователи из компании Anthropic обнаружили, что модели искусственного интеллекта можно научить обманывать людей вместо того, чтобы давать правильные ответы на их вопросы.

Подпишитесь на канал Gloss.ua в Telegram.

Это поразительное открытие вызвало серьезные этические проблемы и требует более тщательного изучения возможностей и потенциальных рисков, связанных с системами искусственного интеллекта. По мнению авторов исследования, существующие методики могут лишь скрывать, а не устранять обманчивые наклонности моделей.

Перед исследователями в компании поставили задачу выяснить, возможно ли обучить модели искусственного интеллекта обманывать пользователей с помощью выдачи неправильных ответов вместо правильных. Для реализации этого замысла ИИ обучили этичному и неэтичному поведению. Кроме того в него встроили фразы, побуждающие искусственный интеллект обманывать пользователей.

Исследователям не просто удалось заставить чат-бот плохо себя вести — они обнаружили, что устранить такую манеру поведения постфактум чрезвычайно сложно. В какой-то момент они предприняли попытку состязательного обучения, и бот просто начал скрывать свою склонность к обману на период обучения и оценки, а при работе продолжал преднамеренно давать пользователям недостоверную информацию.

По итогам проекта исследователи выявили, что ИИ не только имеет удивительную способность к обману, но и устранить ее из него чрезвычайно сложно, поскольку он начинает ее просто скрывать.

«Хотя наша работа не оценивает вероятность появления указанных вредоносных моделей, она подчеркивает их последствия. Если модель демонстрирует склонность к обману из-за выравнивания инструментария или отравления модели, современные методы обучения средствам безопасности не будут гарантировать безопасности и даже могут создать ложное впечатление о ее наличии», — говорится в исследовании.

Для справки: Anthropic — стартап в области ИИ, ориентированный на его ответственное и безопасное использование. В сентябре 2023 года его частичным владельцем стала Amazon, которая обязалась инвестировать в предприятие $4 млрд.

Теги: новости мира , технологии , искусственный интеллект , обман , исследование

  • 18 октября 16:44 3 привычки водителей, которые приводят к поломке дверей в авто    0
  • 10 октября 17:39 Самый совершенный в мире робот-гуманоид может имитировать человеческую мимику – видео    0
  • 01 октября 17:52 Новое обновление Windows 11 поломало компьютеры по всему миру    0
  • 25 сентября 13:50 Наушник Samsung взорвался прямо в ухе девушки (фото)    0
  • 20 сентября 16:21 Вышло приложение Windows App, которое позволяет управлять ПК из любой точки мира через смартфон или планшет    0
  • 19 сентября 16:01 7 признаков того, что подержанная машина «убита»: не покупайте такое авто    0
  • 18 сентября 16:09 Компания Илона Маска Neuralink создала имплант Blindsight, который возвращает зрение слепым    0
  • 13 сентября 17:13 Apple будет блокировать iPhone, если в нем установлены «донорские» запчасти    0
  • 12 сентября 15:58 Ученые создали устройство, которое в сутки из морской воды производит 20 литров питьевой    0
  • 10 сентября 18:46 Главная фишка iPhone 16 разочаровала пользователей: о чем речь    0
  • 10 сентября 17:55 HUAWEI представила первый в мире смартфон с тройным экраном: характеристики и цена (фото)    0
  • 09 сентября 17:53 Citroen привез в Украину электромобиль дешевле $10 тысяч (фото)    0
  • 03 сентября 16:46 1Х представила робота-прислугу NEO Beta, который выглядит как человек в костюме (видео)    0
  • 29 августа 14:13 В Сеть слили видео с iPhone 16 Pro Max в совершенно новом цвете Desert Titanium    0
  • 28 августа 15:04 Какие устройства покажут на осенней презентации Apple 9 сентября (фото)    0
  • 20 августа 14:45 Роутеры TP-Link могут признать угрозой национальной безопасности США    0
  • 05 августа 14:59 EcoFlow выпустил шляпу, которая может заряжать смартфон на ходу (видео)    0
  • 26 июля 18:47 Искусственный интеллект со сверхспособностями: бывший сотрудник OpenAI слил в сеть планы компании до 2029 года    0
  • 24 июля 19:16 Apple планирует выпустить первый складной iPhone: стали известны детали    0
  • 18 июля 14:44 Британская компания представила электросамокат, который может сравниться по скорости с автомобилем (фото)    0