У искусственного интеллекта обнаружили удивительные способности к обману человека У искусственного интеллекта обнаружили удивительные способности к обману человека
Техно

У искусственного интеллекта обнаружили удивительные способности к обману человека

Фото: Getty Images
Дарина Герасимчук 17 января, 2024, 17:03
 0
Твитнуть
Поделиться
Отправить
Pintrest

Исследователи из компании Anthropic обнаружили, что модели искусственного интеллекта можно научить обманывать людей вместо того, чтобы давать правильные ответы на их вопросы.

Подпишитесь на канал Gloss.ua в Telegram.

Это поразительное открытие вызвало серьезные этические проблемы и требует более тщательного изучения возможностей и потенциальных рисков, связанных с системами искусственного интеллекта. По мнению авторов исследования, существующие методики могут лишь скрывать, а не устранять обманчивые наклонности моделей.

Перед исследователями в компании поставили задачу выяснить, возможно ли обучить модели искусственного интеллекта обманывать пользователей с помощью выдачи неправильных ответов вместо правильных. Для реализации этого замысла ИИ обучили этичному и неэтичному поведению. Кроме того в него встроили фразы, побуждающие искусственный интеллект обманывать пользователей.

Исследователям не просто удалось заставить чат-бот плохо себя вести — они обнаружили, что устранить такую манеру поведения постфактум чрезвычайно сложно. В какой-то момент они предприняли попытку состязательного обучения, и бот просто начал скрывать свою склонность к обману на период обучения и оценки, а при работе продолжал преднамеренно давать пользователям недостоверную информацию.

По итогам проекта исследователи выявили, что ИИ не только имеет удивительную способность к обману, но и устранить ее из него чрезвычайно сложно, поскольку он начинает ее просто скрывать.

«Хотя наша работа не оценивает вероятность появления указанных вредоносных моделей, она подчеркивает их последствия. Если модель демонстрирует склонность к обману из-за выравнивания инструментария или отравления модели, современные методы обучения средствам безопасности не будут гарантировать безопасности и даже могут создать ложное впечатление о ее наличии», — говорится в исследовании.

Для справки: Anthropic — стартап в области ИИ, ориентированный на его ответственное и безопасное использование. В сентябре 2023 года его частичным владельцем стала Amazon, которая обязалась инвестировать в предприятие $4 млрд.

Теги: новости мира , технологии , искусственный интеллект , обман , исследование

  • 11 апреля 15:59 Украина создаст аналог Starlink на базе шведских технологий: что известно    0
  • 07 апреля 19:41 Искусственный интеллект изменит 40% рабочих мест к 2033 году – отчет ООН    0
  • 01 апреля 17:53 Hyundai представила беспилотный туалет, , который можно вызвать, как такси (видео)    0
  • 28 марта 18:51 У ChatGPT спросили, как бы он захватил мир: ответ оказался пугающим (видео)    0
  • 25 марта 17:00 Уничтожает цели в море, на земле и в воздухе: у ВСУ появился новый дрон "Катран"    0
  • 18 марта 16:54 В наушниках AirPods появится функция мгновенного перевода иностранного языка    0
  • 05 марта 18:57 Apple представила новый MacBook Air на мощном чипе M4: цена снизилась на 100 долларов    0
  • 04 марта 19:32 Дом на колесах будущего: Chery показали фургон для длительных путешествий (фото, видео)    0
  • 28 февраля 19:17 Производитель ракет ПВО NASAMS создает компанию в Украине    0
  • 27 февраля 19:11 Лучшие автомобили года по версии Consumer Reports: топ-10 моделей    0
  • 25 февраля 16:46 Meta создала устройство, которое читает мысли: Brain2Qwerty превращает мысли в текст (фото)    0
  • 24 февраля 15:25 В Украине запустят онлайн-магазин, где военные с помощью "е-баллов" смогут купить БПЛА    0
  • 21 февраля 17:49 Tesla отзывает более 375 тысяч автомобилей, выпущенных в 2023 году: причина    0
  • 20 февраля 18:02 Маск может в любой момент отключить "Старлинк" для ВСУ: чем это грозит фронту    0
  • 19 февраля 20:02 Apple представила iPhone 16E — самый доступный смартфон в линейке компании (видео)    0
  • 16 февраля 13:04 Apple анонсировала презентацию нового iPhone SE 4: дата    0
  • 07 февраля 15:15 Apple готовится представить новый бюджетный iPhone SE уже на следующей неделе    0
  • 03 февраля 17:59 В Украине утвердили список авто, за которые нужно платить "налог на роскошь"    0
  • 29 января 16:24 Теперь iPhone может автоматически подключаться к Starlink    0
  • 28 января 16:59 Китайский дешевый ИИ DeepSeek обошел американский ChatGPT и обвалил акции технокомпаний    0