У штучного інтелекту виявили дивовижні здібності до обману людини

Getty Images

Дослідники з компанії Anthropic виявили, що моделі штучного інтелекту можна навчити дурити людей замість того, щоб давати правильні відповіді на їхні запитання.

Підпишіться на канал Gloss.ua у Telegram.

Це разюче відкриття викликало серйозні етичні проблеми і потребує більш ретельного вивчення можливостей та потенційних ризиків, пов'язаних із системами штучного інтелекту. На думку авторів дослідження, існуючі методики можуть лише приховувати, а не усувати оманливі нахили моделей.

Перед дослідниками у компанії поставили завдання з'ясувати, чи можливо навчити моделі штучного інтелекту обманювати користувачів за допомогою видачі неправильних відповідей замість правильних. Для реалізації цього задуму ШІ навчили етичній та неетичній поведінці. Крім того, в нього вбудували фрази, які спонукають штучний інтелект обманювати користувачів.

Дослідникам не просто вдалося змусити чат-бот погано поводитися - вони виявили, що усунути таку манеру поведінки постфактум надзвичайно складно. У якийсь момент вони спробували змагальне навчання, і бот просто почав приховувати свою схильність до обману на період навчання та оцінки, а при роботі продовжував навмисно давати користувачам недостовірну інформацію.

За підсумками проекту дослідники виявили, що ШІ не тільки має дивовижну здатність до обману, а й усунути брехню з нього надзвичайно складно, оскільки він починає її просто приховувати.

«Хоча наша робота не оцінює ймовірність появи зазначених шкідливих моделей, вона наголошує на їхніх наслідках. Якщо модель демонструє схильність до обману через вирівнювання інструментарію або отруєння моделі, сучасні методи навчання засобам безпеки не гарантуватимуть безпеки і навіть можуть створити хибне враження про її наявність», — йдеться у дослідженні.

Для довідки: Anthropic – стартап в області ШІ, орієнтований на його відповідальне та безпечне використання. У вересні 2023 року його частковим власником стала Amazon, яка зобов'язалася інвестувати у підприємство $4 млрд.

Читай також

Чому не варто купувати вживане авто з механічною коробкою передач — причини

Поради від експертів

Представлено першу у світі безшумну клавіатуру: на її створення пішло п'ять років

Новинка надійде у продаж вже цього літа

Найкращі автомобілі для жінок: ТОП-10 компактних моделей

Дівчата-водії цінують естетику та зручність

Експерти назвали 5 недорогих електричних кросоверів, які варті своїх грошей

Рейтинг від іспанського порталу Periodismodelmotor

Пройшов перший "повітряний бій" між пілотованим літаком та винищувачем, яким керував ШІ (відео)

Як штучний інтелект показав себе у бою

Українські інженери розробляють бойовий підводний човен, який стріляє торпедами (відео)

Підходить для комерційних, рятувальних та бойових операцій

Експерти назвали 5 автомобільних брендів, які є найдешевшими в обслуговуванні

Утримання автомобіля – дороге задоволення

Apple розкрила можливості свого штучного інтелекту: він перевершує GPT-4

Нову систему планують інтегрувати до Siri

ТЦК зможе «мобілізувати» автомобілі українців: які авто будуть вилучати на потреби ЗСУ

Деталі закону та роз'яснення юриста

AENO HD1: Фен з унікальною технологією для швидкого стайлінгу без шкоди для здоров’я волосся

У чому секрет фену, що вирішує найпоширеніші проблеми при укладанні та сушінні волосся?