У штучного інтелекту виявили дивовижні здібності до обману людини У штучного інтелекту виявили дивовижні здібності до обману людини
Техно

У штучного інтелекту виявили дивовижні здібності до обману людини

Фото: Getty Images
Дарина Герасимчук 17 сiчня, 2024, 17:03
 0

Дослідники з компанії Anthropic виявили, що моделі штучного інтелекту можна навчити дурити людей замість того, щоб давати правильні відповіді на їхні запитання.

Підпишіться на канал Gloss.ua у Telegram.

Це разюче відкриття викликало серйозні етичні проблеми і потребує більш ретельного вивчення можливостей та потенційних ризиків, пов'язаних із системами штучного інтелекту. На думку авторів дослідження, існуючі методики можуть лише приховувати, а не усувати оманливі нахили моделей.

Перед дослідниками у компанії поставили завдання з'ясувати, чи можливо навчити моделі штучного інтелекту обманювати користувачів за допомогою видачі неправильних відповідей замість правильних. Для реалізації цього задуму ШІ навчили етичній та неетичній поведінці. Крім того, в нього вбудували фрази, які спонукають штучний інтелект обманювати користувачів.

Дослідникам не просто вдалося змусити чат-бот погано поводитися - вони виявили, що усунути таку манеру поведінки постфактум надзвичайно складно. У якийсь момент вони спробували змагальне навчання, і бот просто почав приховувати свою схильність до обману на період навчання та оцінки, а при роботі продовжував навмисно давати користувачам недостовірну інформацію.

За підсумками проекту дослідники виявили, що ШІ не тільки має дивовижну здатність до обману, а й усунути брехню з нього надзвичайно складно, оскільки він починає її просто приховувати.

«Хоча наша робота не оцінює ймовірність появи зазначених шкідливих моделей, вона наголошує на їхніх наслідках. Якщо модель демонструє схильність до обману через вирівнювання інструментарію або отруєння моделі, сучасні методи навчання засобам безпеки не гарантуватимуть безпеки і навіть можуть створити хибне враження про її наявність», — йдеться у дослідженні.

Для довідки: Anthropic – стартап в області ШІ, орієнтований на його відповідальне та безпечне використання. У вересні 2023 року його частковим власником стала Amazon, яка зобов'язалася інвестувати у підприємство $4 млрд.

Теги: світові новини , технології , штучний інтелект , обман , дослідження

  • 24 квiтня 17:34 Експерти назвали 5 недорогих електричних кросоверів, які варті своїх грошей    0
  • 18 квiтня 17:05 Пройшов перший "повітряний бій" між пілотованим літаком та винищувачем, яким керував ШІ (відео)    0
  • 16 квiтня 14:06 Українські інженери розробляють бойовий підводний човен, який стріляє торпедами (відео)    0
  • 15 квiтня 15:36 Експерти назвали 5 автомобільних брендів, які є найдешевшими в обслуговуванні    0
  • 12 квiтня 17:05 Apple розкрила можливості свого штучного інтелекту: він перевершує GPT-4    0
  • 11 квiтня 17:04 ТЦК зможе «мобілізувати» автомобілі українців: які авто будуть вилучати на потреби ЗСУ    0
  • 08 квiтня 10:50 AENO HD1: Фен з унікальною технологією для швидкого стайлінгу без шкоди для здоров’я волосся    0
  • 04 квiтня 15:46 Apple працює над створенням домашніх роботів – Bloomberg    0
  • 02 квiтня 15:42 Ілон Маск оцінив ймовірність загибелі людства через штучний інтелект у 20%    0
  • 28 березня 16:06 Ноутбуки ROG ‒ ідеальний вибір для геймерів та професіоналів    0
  • 28 березня 14:31 YouTube додасть нову функцію на основі штучного інтелекту, яка заощадить ваш час    0
  • 22 березня 17:27 Російські війська скаржаться на новий український дрон-камікадзе, зроблений із фанери та пластикових пляшок (фото)    0
  • 21 березня 15:20 Компанія Маска показала, як перша людина з чіпом Neuralink у мозку грає в онлайн-шахи силою думки – відео    0
  • 19 березня 14:54 Названо 10 професій, які замінить штучний інтелект    0
  • 13 березня 16:46 Найбільший у світі літак із 117-метровим розмахом крил виконав тестовий політ (відео)    0
  • 05 березня 16:44 Apple представила новий MacBook Air з чіпом M3: характеристики та ціна    0
  • 04 березня 15:48 Єврокомісія оштрафувала корпорацію Apple на 1,8 мільярда євро: причина    0
  • 16:59 Названо найцінніший автомобільний бренд у світі – рейтинг 2024 року від Brand Finance    0
  • 21 лютого 17:54 Топ-20 найпопулярніших нових автомобілів в Україні за підсумками 2023 року    0
  • 20 лютого 16:23 Перша людина з чіпом у мозку змогла керувати комп'ютерною мишкою силою думки — Ілон Маск    0