У искусственного интеллекта обнаружили удивительные способности к обману человека У искусственного интеллекта обнаружили удивительные способности к обману человека
Техно

У искусственного интеллекта обнаружили удивительные способности к обману человека

Фото: Getty Images
Дарина Герасимчук 17 января, 2024, 17:03
 0

Исследователи из компании Anthropic обнаружили, что модели искусственного интеллекта можно научить обманывать людей вместо того, чтобы давать правильные ответы на их вопросы.

Подпишитесь на канал Gloss.ua в Telegram.

Это поразительное открытие вызвало серьезные этические проблемы и требует более тщательного изучения возможностей и потенциальных рисков, связанных с системами искусственного интеллекта. По мнению авторов исследования, существующие методики могут лишь скрывать, а не устранять обманчивые наклонности моделей.

Перед исследователями в компании поставили задачу выяснить, возможно ли обучить модели искусственного интеллекта обманывать пользователей с помощью выдачи неправильных ответов вместо правильных. Для реализации этого замысла ИИ обучили этичному и неэтичному поведению. Кроме того в него встроили фразы, побуждающие искусственный интеллект обманывать пользователей.

Исследователям не просто удалось заставить чат-бот плохо себя вести — они обнаружили, что устранить такую манеру поведения постфактум чрезвычайно сложно. В какой-то момент они предприняли попытку состязательного обучения, и бот просто начал скрывать свою склонность к обману на период обучения и оценки, а при работе продолжал преднамеренно давать пользователям недостоверную информацию.

По итогам проекта исследователи выявили, что ИИ не только имеет удивительную способность к обману, но и устранить ее из него чрезвычайно сложно, поскольку он начинает ее просто скрывать.

«Хотя наша работа не оценивает вероятность появления указанных вредоносных моделей, она подчеркивает их последствия. Если модель демонстрирует склонность к обману из-за выравнивания инструментария или отравления модели, современные методы обучения средствам безопасности не будут гарантировать безопасности и даже могут создать ложное впечатление о ее наличии», — говорится в исследовании.

Для справки: Anthropic — стартап в области ИИ, ориентированный на его ответственное и безопасное использование. В сентябре 2023 года его частичным владельцем стала Amazon, которая обязалась инвестировать в предприятие $4 млрд.

Теги: новости мира , технологии , искусственный интеллект , обман , исследование

  • 26 июля 18:47 Искусственный интеллект со сверхспособностями: бывший сотрудник OpenAI слил в сеть планы компании до 2029 года    0
  • 24 июля 19:16 Apple планирует выпустить первый складной iPhone: стали известны детали    0
  • 18 июля 14:44 Британская компания представила электросамокат, который может сравниться по скорости с автомобилем (фото)    0
  • 12 июля 14:52 iPhone 17 Pro Max превзойдет все ожидания в качестве фотосъемки: первые подробности    0
  • 10 июля 20:23 Британские эксперты назвали 10 лучших электромобилей с пробегом    0
  • 03 июля 17:15 Искусственный интеллект предсказал победителя Евро-2024    0
  • 28 июня 18:02 ZTE представила смартфон с дисплеем, который превращает контент в 3D без очков (видео)    0
  • 15:56 Как выбрать подержанный автомобиль: 5 советов от экспертов    0
  • 25 июня 17:45 Вместо Экофлоу: айтишник посоветовал, что купить на случай длительных отключений света    0
  • 20 июня 15:43 Не дожидаясь разрешения США бить по России ракетами ATACAMS, Украина создала собственное оружие    0
  • 18 июня 15:18 Илон Маск собирается в будущем избавить человечество от смартфонов    0
  • 05 июня 15:23 В Украине изменился лидер по продажам среди новых автомобилей    0
  • 04 июня 13:37 Пять мошенников из Китая обманули компанию Apple на 12 миллионов долларов    0
  • 17:03 6 признаков того, что вам пора менять машину    0
  • 24 мая 17:30 Ученые приблизились к бессмертию: китайские исследователи совершили прорыв в крионике    0
  • 16 мая 17:53 Как обеспечить работу интернета при отключениях света – два способа    0
  • 14 мая 15:29 Apple готовится встроить искусственный интеллект ChatGPT в Айфон уже в iOS 18    0
  • 06 мая 16:36 Почему не стоит покупать подержанное авто с механической коробкой передач — причины    0
  • 02 мая 16:07 Представлена первая в мире бесшумная клавиатура: на ее создание ушло пять лет    0
  • 30 апреля 17:33 Лучшие автомобили для женщин: ТОП-10 компактных моделей    0