У штучного інтелекту виявили дивовижні здібності до обману людини У штучного інтелекту виявили дивовижні здібності до обману людини
Техно

У штучного інтелекту виявили дивовижні здібності до обману людини

Фото: Getty Images
Дарина Герасимчук 17 сiчня, 2024, 17:03
 0

Дослідники з компанії Anthropic виявили, що моделі штучного інтелекту можна навчити дурити людей замість того, щоб давати правильні відповіді на їхні запитання.

Підпишіться на канал Gloss.ua у Telegram.

Це разюче відкриття викликало серйозні етичні проблеми і потребує більш ретельного вивчення можливостей та потенційних ризиків, пов'язаних із системами штучного інтелекту. На думку авторів дослідження, існуючі методики можуть лише приховувати, а не усувати оманливі нахили моделей.

Перед дослідниками у компанії поставили завдання з'ясувати, чи можливо навчити моделі штучного інтелекту обманювати користувачів за допомогою видачі неправильних відповідей замість правильних. Для реалізації цього задуму ШІ навчили етичній та неетичній поведінці. Крім того, в нього вбудували фрази, які спонукають штучний інтелект обманювати користувачів.

Дослідникам не просто вдалося змусити чат-бот погано поводитися - вони виявили, що усунути таку манеру поведінки постфактум надзвичайно складно. У якийсь момент вони спробували змагальне навчання, і бот просто почав приховувати свою схильність до обману на період навчання та оцінки, а при роботі продовжував навмисно давати користувачам недостовірну інформацію.

За підсумками проекту дослідники виявили, що ШІ не тільки має дивовижну здатність до обману, а й усунути брехню з нього надзвичайно складно, оскільки він починає її просто приховувати.

«Хоча наша робота не оцінює ймовірність появи зазначених шкідливих моделей, вона наголошує на їхніх наслідках. Якщо модель демонструє схильність до обману через вирівнювання інструментарію або отруєння моделі, сучасні методи навчання засобам безпеки не гарантуватимуть безпеки і навіть можуть створити хибне враження про її наявність», — йдеться у дослідженні.

Для довідки: Anthropic – стартап в області ШІ, орієнтований на його відповідальне та безпечне використання. У вересні 2023 року його частковим власником стала Amazon, яка зобов'язалася інвестувати у підприємство $4 млрд.

Теги: світові новини , технології , штучний інтелект , обман , дослідження

  • 18 грудня 18:14 Вперше в історії: бій Усик – Ф'юрі судитиме штучний інтелект    0
  • 17 грудня 15:26 Apple назвала найпопулярніші додатки та ігри в App Store у 2024 році    0
  • 10 грудня 17:00 OpenAI запустила нейромережу Sora, яка може створювати відео з тексту    0
  • 28 листопада 15:09 Neuralink створить роботизовану руку, якою можна керувати силою думки    0
  • 27 листопада 15:31 Українці збільшили витрати на нові авто: які марки стали найбільш продаваними    0
  • 25 листопада 16:30 З 2025 року ChatGPT стане платником податків в Україні: що зміниться для користувачів    0
  • 19:21 У швейцарській церкві тепер можна сповідатися ШІ-Ісусу Христу    0
  • 19 листопада 16:00 Не робіть так: типові помилки автомобілістів у перші морозні дні    0
  • 19 листопада 13:01 4 причини віддати перевагу інфрачервоному обігрівачу AENO    0
  • 18 листопада 16:22 Резиденцію Дональда Трампа охороняють роботи-собаки: що про них відомо (відео)    0
  • 14 листопада 18:02 Штучний інтелект Google Gemini порадив користувачеві «померти» та назвав його «непотрібним»    0
  • 11 листопада 15:02 Ракета SpaceX відправила в космос науковий проект школярів зі Львівської області    0
  • 29 жовтня 17:19 10 ШІ-стартапів вперше представлять Україну на AI Summit у США    0
  • 29 жовтня 16:34 Apple представила новий Mac mini – свій найменший комп'ютер в історії    0
  • 24 жовтня 16:14 Швидкісний інтернет: в Україні готуються запровадити технологію Wi-Fi 6E    0
  • 18 жовтня 16:44 3 звички водіїв, які призводять до поломки дверей авто    0
  • 10 жовтня 17:39 Найдосконаліший у світі робот-гуманоїд може імітувати людську міміку – відео    0
  • 01 жовтня 17:52 Нове оновлення Windows 11 поламало комп'ютери по всьому світу    0
  • 25 вересня 13:50 Навушник Samsung вибухнув прямо у вусі дівчини (фото)    0
  • 20 вересня 16:21 Вийшов додаток Windows App, який дозволяє керувати ПК з будь-якої точки світу через смартфон або планшет    0