У искусственного интеллекта обнаружили удивительные способности к обману человека

Getty Images

Getty Images

Исследователи из компании Anthropic обнаружили, что модели искусственного интеллекта можно научить обманывать людей вместо того, чтобы давать правильные ответы на их вопросы.

Подпишитесь на канал Gloss.ua в Telegram.

Это поразительное открытие вызвало серьезные этические проблемы и требует более тщательного изучения возможностей и потенциальных рисков, связанных с системами искусственного интеллекта. По мнению авторов исследования, существующие методики могут лишь скрывать, а не устранять обманчивые наклонности моделей.

Перед исследователями в компании поставили задачу выяснить, возможно ли обучить модели искусственного интеллекта обманывать пользователей с помощью выдачи неправильных ответов вместо правильных. Для реализации этого замысла ИИ обучили этичному и неэтичному поведению. Кроме того в него встроили фразы, побуждающие искусственный интеллект обманывать пользователей.

Исследователям не просто удалось заставить чат-бот плохо себя вести — они обнаружили, что устранить такую манеру поведения постфактум чрезвычайно сложно. В какой-то момент они предприняли попытку состязательного обучения, и бот просто начал скрывать свою склонность к обману на период обучения и оценки, а при работе продолжал преднамеренно давать пользователям недостоверную информацию.

По итогам проекта исследователи выявили, что ИИ не только имеет удивительную способность к обману, но и устранить ее из него чрезвычайно сложно, поскольку он начинает ее просто скрывать.

«Хотя наша работа не оценивает вероятность появления указанных вредоносных моделей, она подчеркивает их последствия. Если модель демонстрирует склонность к обману из-за выравнивания инструментария или отравления модели, современные методы обучения средствам безопасности не будут гарантировать безопасности и даже могут создать ложное впечатление о ее наличии», — говорится в исследовании.

Для справки: Anthropic — стартап в области ИИ, ориентированный на его ответственное и безопасное использование. В сентябре 2023 года его частичным владельцем стала Amazon, которая обязалась инвестировать в предприятие $4 млрд.

Читай также

Sony повышает цены на PlayStation 5 из-за экономического давления и торговых пошлин

Сколько теперь стоит консоль 

Украина создаст аналог Starlink на базе шведских технологий: что известно

Лицензионное соглашение подписано

Искусственный интеллект изменит 40% рабочих мест к 2033 году – отчет ООН

 Какие сферы окажутся наиболее уязвимыми

Hyundai представила беспилотный туалет, , который можно вызвать, как такси (видео)

В нужный момент

У ChatGPT спросили, как бы он захватил мир: ответ оказался пугающим (видео)

ИИ составил поэтапный план

Уничтожает цели в море, на земле и в воздухе: у ВСУ появился новый дрон "Катран"

Его разработку держали в секрете 

В наушниках AirPods появится функция мгновенного перевода иностранного языка

Новые возможности для общения с иностранцами 

Apple представила новый MacBook Air на мощном чипе M4: цена снизилась на 100 долларов

Что нового

Дом на колесах будущего: Chery показали фургон для длительных путешествий (фото, видео)

Впечатляющий функционал 

Производитель ракет ПВО NASAMS создает компанию в Украине

Речь идет о массовом производстве