У искусственного интеллекта обнаружили удивительные способности к обману человека У искусственного интеллекта обнаружили удивительные способности к обману человека
Техно

У искусственного интеллекта обнаружили удивительные способности к обману человека

Фото: Getty Images
Дарина Герасимчук 17 января, 2024, 17:03
 0

Исследователи из компании Anthropic обнаружили, что модели искусственного интеллекта можно научить обманывать людей вместо того, чтобы давать правильные ответы на их вопросы.

Подпишитесь на канал Gloss.ua в Telegram.

Это поразительное открытие вызвало серьезные этические проблемы и требует более тщательного изучения возможностей и потенциальных рисков, связанных с системами искусственного интеллекта. По мнению авторов исследования, существующие методики могут лишь скрывать, а не устранять обманчивые наклонности моделей.

Перед исследователями в компании поставили задачу выяснить, возможно ли обучить модели искусственного интеллекта обманывать пользователей с помощью выдачи неправильных ответов вместо правильных. Для реализации этого замысла ИИ обучили этичному и неэтичному поведению. Кроме того в него встроили фразы, побуждающие искусственный интеллект обманывать пользователей.

Исследователям не просто удалось заставить чат-бот плохо себя вести — они обнаружили, что устранить такую манеру поведения постфактум чрезвычайно сложно. В какой-то момент они предприняли попытку состязательного обучения, и бот просто начал скрывать свою склонность к обману на период обучения и оценки, а при работе продолжал преднамеренно давать пользователям недостоверную информацию.

По итогам проекта исследователи выявили, что ИИ не только имеет удивительную способность к обману, но и устранить ее из него чрезвычайно сложно, поскольку он начинает ее просто скрывать.

«Хотя наша работа не оценивает вероятность появления указанных вредоносных моделей, она подчеркивает их последствия. Если модель демонстрирует склонность к обману из-за выравнивания инструментария или отравления модели, современные методы обучения средствам безопасности не будут гарантировать безопасности и даже могут создать ложное впечатление о ее наличии», — говорится в исследовании.

Для справки: Anthropic — стартап в области ИИ, ориентированный на его ответственное и безопасное использование. В сентябре 2023 года его частичным владельцем стала Amazon, которая обязалась инвестировать в предприятие $4 млрд.

Теги: новости мира , технологии , искусственный интеллект , обман , исследование

  • 16:07 Представлена первая в мире бесшумная клавиатура: на ее создание ушло пять лет    0
  • 30 апреля 17:33 Лучшие автомобили для женщин: ТОП-10 компактных моделей    0
  • 24 апреля 17:34 Эксперты назвали 5 недорогих электрических кроссоверов, которые стоят своих денег    0
  • 18 апреля 17:05 Прошел первый "воздушный бой" между пилотируемым самолетом и истребителем, которым управлял ИИ (видео)    0
  • 16 апреля 14:06 Украинские инженеры разрабатывают боевую подводную лодку, которая стреляет торпедами (видео)    0
  • 15 апреля 15:36 Эксперты назвали 5 автомобильных брендов, которые являются самыми дешевыми в обслуживании    0
  • 12 апреля 17:05 Apple раскрыла возможности своего искусственного интеллекта: он превосходит GPT-4    0
  • 11 апреля 17:04 ТЦК сможет «мобилизовать» автомобили украинцев: какие авто будут изымать на нужды ВСУ    0
  • 08 апреля 10:50 AENO HD1: Фен з унікальною технологією для швидкого стайлінгу без шкоди для здоров’я волосся    0
  • 04 апреля 15:46 Apple работает над созданием домашних роботов – Bloomberg    0
  • 15:42 Илон Маск оценил вероятность гибели человечества из-за искусственного интеллекта в 20%    0
  • 28 марта 16:06 Ноутбуки ROG ‒ ідеальний вибір для геймерів та професіоналів    0
  • 28 марта 14:31 YouTube добавит новую функцию на основе искусственного интеллекта, которая сэкономит ваше время    0
  • 25 марта 16:28 Что такое лазерный сварочный аппарат    0
  • 22 марта 17:27 Российские войска жалуются на новый украинский дрон-камикадзе, сделанный из фанеры и пластиковых бутылок (фото)    0
  • 21 марта 15:20 Компания Маска показала, как первый человек с чипом Neuralink в мозге играет в онлайн-шахматы силой мысли – видео    0
  • 19 марта 14:54 Названы 10 профессий, которые заменит искусственный интеллект    0
  • 13 марта 16:46 Самый большой в мире самолет со 117-метровым размахом крыльев выполнил тестовый полет (видео)    0
  • 05 марта 16:44 Apple представила новый MacBook Air с чипом M3: характеристики и цена    0
  • 04 марта 15:48 Еврокомиссия оштрафовала корпорацию Apple на 1,8 миллиарда евро: причина    0