У искусственного интеллекта обнаружили удивительные способности к обману человека

Getty Images

Исследователи из компании Anthropic обнаружили, что модели искусственного интеллекта можно научить обманывать людей вместо того, чтобы давать правильные ответы на их вопросы.

Подпишитесь на канал Gloss.ua в Telegram.

Это поразительное открытие вызвало серьезные этические проблемы и требует более тщательного изучения возможностей и потенциальных рисков, связанных с системами искусственного интеллекта. По мнению авторов исследования, существующие методики могут лишь скрывать, а не устранять обманчивые наклонности моделей.

Перед исследователями в компании поставили задачу выяснить, возможно ли обучить модели искусственного интеллекта обманывать пользователей с помощью выдачи неправильных ответов вместо правильных. Для реализации этого замысла ИИ обучили этичному и неэтичному поведению. Кроме того в него встроили фразы, побуждающие искусственный интеллект обманывать пользователей.

Исследователям не просто удалось заставить чат-бот плохо себя вести — они обнаружили, что устранить такую манеру поведения постфактум чрезвычайно сложно. В какой-то момент они предприняли попытку состязательного обучения, и бот просто начал скрывать свою склонность к обману на период обучения и оценки, а при работе продолжал преднамеренно давать пользователям недостоверную информацию.

По итогам проекта исследователи выявили, что ИИ не только имеет удивительную способность к обману, но и устранить ее из него чрезвычайно сложно, поскольку он начинает ее просто скрывать.

«Хотя наша работа не оценивает вероятность появления указанных вредоносных моделей, она подчеркивает их последствия. Если модель демонстрирует склонность к обману из-за выравнивания инструментария или отравления модели, современные методы обучения средствам безопасности не будут гарантировать безопасности и даже могут создать ложное впечатление о ее наличии», — говорится в исследовании.

Для справки: Anthropic — стартап в области ИИ, ориентированный на его ответственное и безопасное использование. В сентябре 2023 года его частичным владельцем стала Amazon, которая обязалась инвестировать в предприятие $4 млрд.

Читай также

Apple меняет генерального директора впервые за 15 лет: чего ждать от нового CEO Джона Тернуса

Много продаж, мало инноваций

В США запустили видеочат с Иисусом Христом на базе ИИ за $1,99 в минуту (фото)

Духовные советы и поддержка

Meta создает ИИ-клона Марка Цукерберга для общения с сотрудниками компании

3D-модель заменит реального руководителя

Издание The New York Times назвало возможного создателя биткоина

Его личность считается одной из самых важных тайн

Расход топлива до 5 литров на «сотню»: 10 экономных семейных авто в Украине (фото)

Актуально в нынешних условиях

Украина создает свой чат GPT: в Минцифры обнародовали название украинской языковой модели ИИ

Голосование проходило в «Дії»

Италия будет тестировать новый "купол" ПВО Michelangelo в условиях реальной войны в Украине

Как работает система

Apple готовит презентацию как минимум пяти новых продуктов, включая iPhone, на следующей неделе

Ожидается бюджетный MacBook

В Китае показали человекоподобного робота Moya: теплая кожа, зрительный контакт и другие функции

Робот создавался для максимального сходства с людьми

В Украине выставили на продажу двухместный пассажирский дрон: цена и время полета (фото)

По цене авто