У штучного інтелекту виявили дивовижні здібності до обману людини У штучного інтелекту виявили дивовижні здібності до обману людини
Техно

У штучного інтелекту виявили дивовижні здібності до обману людини

Фото: Getty Images
Дарина Герасимчук 17 сiчня, 2024, 17:03
 0

Дослідники з компанії Anthropic виявили, що моделі штучного інтелекту можна навчити дурити людей замість того, щоб давати правильні відповіді на їхні запитання.

Підпишіться на канал Gloss.ua у Telegram.

Це разюче відкриття викликало серйозні етичні проблеми і потребує більш ретельного вивчення можливостей та потенційних ризиків, пов'язаних із системами штучного інтелекту. На думку авторів дослідження, існуючі методики можуть лише приховувати, а не усувати оманливі нахили моделей.

Перед дослідниками у компанії поставили завдання з'ясувати, чи можливо навчити моделі штучного інтелекту обманювати користувачів за допомогою видачі неправильних відповідей замість правильних. Для реалізації цього задуму ШІ навчили етичній та неетичній поведінці. Крім того, в нього вбудували фрази, які спонукають штучний інтелект обманювати користувачів.

Дослідникам не просто вдалося змусити чат-бот погано поводитися - вони виявили, що усунути таку манеру поведінки постфактум надзвичайно складно. У якийсь момент вони спробували змагальне навчання, і бот просто почав приховувати свою схильність до обману на період навчання та оцінки, а при роботі продовжував навмисно давати користувачам недостовірну інформацію.

За підсумками проекту дослідники виявили, що ШІ не тільки має дивовижну здатність до обману, а й усунути брехню з нього надзвичайно складно, оскільки він починає її просто приховувати.

«Хоча наша робота не оцінює ймовірність появи зазначених шкідливих моделей, вона наголошує на їхніх наслідках. Якщо модель демонструє схильність до обману через вирівнювання інструментарію або отруєння моделі, сучасні методи навчання засобам безпеки не гарантуватимуть безпеки і навіть можуть створити хибне враження про її наявність», — йдеться у дослідженні.

Для довідки: Anthropic – стартап в області ШІ, орієнтований на його відповідальне та безпечне використання. У вересні 2023 року його частковим власником стала Amazon, яка зобов'язалася інвестувати у підприємство $4 млрд.

Теги: світові новини , технології , штучний інтелект , обман , дослідження

  • 20 лютого 16:23 Перша людина з чіпом у мозку змогла керувати комп'ютерною мишкою силою думки — Ілон Маск    0
  • 07 лютого 19:41 Перші користувачі дорвалися до Apple Vision Pro і передбачення «Сімпсонів» про революційний гаджет одразу збулось (відео)    0
  • 06 лютого 13:27 Apple в iPhone 16 поверне дизайн дванадцятого айфона: у мережу злили рендери (фото)    0
  • 05 лютого 15:43 Google представив новий вид ШІ, який перетворює текст на зображення: як скористатися ImageFX    0
  • 02 лютого 17:13 Оголошено фіналістів конкурсу «Всесвітній автомобіль року 2024» (відео)    0
  • 01 лютого 15:46 Китайці винайшли пристрій, який додасть людині одну кінську силу: розумний екзоскелет Hypershell (відео)    0
  • 30 сiчня 14:34 Вперше в історії компанія Ілона Маска Neuralink вживила чіп у мозок людини: навіщо    0
  • 29 сiчня 15:04 Названо найпопулярніший мобільний телефон в історії людства (фото)    0
  • 26 сiчня 16:50 Експерти назвали 7 найнадійніших компактних кросоверів на вторинному ринку    0
  • 19 сiчня 12:12 Що таке чат-бот? Різновиди чат-ботів для бізнесу    0
  • 17 сiчня 17:03 У штучного інтелекту виявили дивовижні здібності до обману людини    0
  • 10 сiчня 17:31 Названо 10 автомобілів, які краще ніколи не купувати    0
  • 08 сiчня 15:48 Microsoft прибере кнопку Windows на всіх клавіатурах: що буде замість неї (відео)    0
  • 03 сiчня 12:48 У 2024 році Apple зробить свої смартфони величезними    0
  • 28 грудня 14:15 Робот на заводі Tesla вийшов з ладу, напав на інженера і завдав йому серйозних травм    0
  • 27 грудня 14:12 Які авто купують люди різних професій в Україні – результати дослідження    0
  • 25 грудня 13:40 Штучний інтелект показав, як виглядали б популярні українські компанії в стилі LEGO (фото)    0
  • 19 грудня 14:31 Apple змушена припинити продаж своїх смарт-годинників на території США: у чому причина    0
  • 13 грудня 14:26 Яким буде дизайн нового iPhone 16: інсайдери показали три варіанти (фото)    0
  • 11 грудня 16:32 Porsche 911 встановив унікальний світовий рекорд, піднявшись на вершину вулкана (відео)    0