У искусственного интеллекта обнаружили удивительные способности к обману человека У искусственного интеллекта обнаружили удивительные способности к обману человека
Техно

У искусственного интеллекта обнаружили удивительные способности к обману человека

Фото: Getty Images
Дарина Герасимчук 17 января, 2024, 17:03
 0

Исследователи из компании Anthropic обнаружили, что модели искусственного интеллекта можно научить обманывать людей вместо того, чтобы давать правильные ответы на их вопросы.

Подпишитесь на канал Gloss.ua в Telegram.

Это поразительное открытие вызвало серьезные этические проблемы и требует более тщательного изучения возможностей и потенциальных рисков, связанных с системами искусственного интеллекта. По мнению авторов исследования, существующие методики могут лишь скрывать, а не устранять обманчивые наклонности моделей.

Перед исследователями в компании поставили задачу выяснить, возможно ли обучить модели искусственного интеллекта обманывать пользователей с помощью выдачи неправильных ответов вместо правильных. Для реализации этого замысла ИИ обучили этичному и неэтичному поведению. Кроме того в него встроили фразы, побуждающие искусственный интеллект обманывать пользователей.

Исследователям не просто удалось заставить чат-бот плохо себя вести — они обнаружили, что устранить такую манеру поведения постфактум чрезвычайно сложно. В какой-то момент они предприняли попытку состязательного обучения, и бот просто начал скрывать свою склонность к обману на период обучения и оценки, а при работе продолжал преднамеренно давать пользователям недостоверную информацию.

По итогам проекта исследователи выявили, что ИИ не только имеет удивительную способность к обману, но и устранить ее из него чрезвычайно сложно, поскольку он начинает ее просто скрывать.

«Хотя наша работа не оценивает вероятность появления указанных вредоносных моделей, она подчеркивает их последствия. Если модель демонстрирует склонность к обману из-за выравнивания инструментария или отравления модели, современные методы обучения средствам безопасности не будут гарантировать безопасности и даже могут создать ложное впечатление о ее наличии», — говорится в исследовании.

Для справки: Anthropic — стартап в области ИИ, ориентированный на его ответственное и безопасное использование. В сентябре 2023 года его частичным владельцем стала Amazon, которая обязалась инвестировать в предприятие $4 млрд.

Теги: новости мира , технологии , искусственный интеллект , обман , исследование

  • 11 апреля 17:04 ТЦК сможет «мобилизовать» автомобили украинцев: какие авто будут изымать на нужды ВСУ    0
  • 08 апреля 10:50 AENO HD1: Фен з унікальною технологією для швидкого стайлінгу без шкоди для здоров’я волосся    0
  • 04 апреля 15:46 Apple работает над созданием домашних роботов – Bloomberg    0
  • 02 апреля 15:42 Илон Маск оценил вероятность гибели человечества из-за искусственного интеллекта в 20%    0
  • 28 марта 16:06 Ноутбуки ROG ‒ ідеальний вибір для геймерів та професіоналів    0
  • 28 марта 14:31 YouTube добавит новую функцию на основе искусственного интеллекта, которая сэкономит ваше время    0
  • 25 марта 16:28 Что такое лазерный сварочный аппарат    0
  • 22 марта 17:27 Российские войска жалуются на новый украинский дрон-камикадзе, сделанный из фанеры и пластиковых бутылок (фото)    0
  • 21 марта 15:20 Компания Маска показала, как первый человек с чипом Neuralink в мозге играет в онлайн-шахматы силой мысли – видео    0
  • 19 марта 14:54 Названы 10 профессий, которые заменит искусственный интеллект    0
  • 13 марта 16:46 Самый большой в мире самолет со 117-метровым размахом крыльев выполнил тестовый полет (видео)    0
  • 05 марта 16:44 Apple представила новый MacBook Air с чипом M3: характеристики и цена    0
  • 04 марта 15:48 Еврокомиссия оштрафовала корпорацию Apple на 1,8 миллиарда евро: причина    0
  • 01 марта 11:50 Правила безопасносных сделок купли-продажи автомобилей    0
  • 27 февраля 16:59 Назван самый ценный автомобильный бренд в мире – рейтинг 2024 года от Brand Finance    0
  • 21 февраля 17:54 Топ-20 самых популярных новых автомобилей в Украине по итогам 2023 года    0
  • 20 февраля 16:23 Первый человек с чипом в мозгу смог управлять компьютерной мышкой силой мысли — Илон Маск    0
  • 07 февраля 19:41 Первые пользователи дорвались до Apple Vision Pro и предсказание «Симпсонов» о революционном гаджете тут же сбылось (видео)    0
  • 06 февраля 13:27 Apple в iPhone 16 вернет дизайн двенадцатого айфона: в сеть слили чертежи (фото)    0
  • 05 февраля 15:43 Google представил новый вид ИИ, который превращает текст в изображение: как воспользоваться ImageFX    0