Вражаючі та лякаючі можливості нової версії штучного інтелекту ChatGPT-4o
Getty Images
У середині травня компанія OpenAI представила нову версію найпопулярнішої та найпросунутішої нейромережі у світі. Продукт отримав назву ChatGPT-4o, зберігши порядковий номер свого попередника.
Підпишіться на канал Gloss.ua у Telegram.
GPT-4o, де "o" означає "omni" (всебічний), є кульмінацією зусиль OpenAI щодо створення більш інтуїтивно зрозумілого та багатофункціонального ШІ. Під час щорічного заходу OpenAI Spring Update технічний директор Міра Мураті (Mira Murati) повідомила, що нова модель здатна працювати одночасно з аудіо, зображеннями та текстом.
«Ми дивимося на майбутнє взаємодії між нами та машинами, — каже Мураті. — І ми вважаємо, що GPT-4o справді змінює цю парадигму».
Найголовніше оновлення – це розмовні можливості ChatGPT-4o. Новий голосовий помічник здатний відтворювати розмовну мову в режимі реального часу і реагувати на голосові команди лише за 320 мілісекунд, що можна порівняти з реакцією звичайної людини. GPT-4o вміє визначати емоції за виразом обличчя або за голосом співрозмовника. При цьому асистент має різні інтонації, може сміятися, шепотіти, співати, а також фліртувати, жартувати та розпізнавати сарказм.
Чат-бот здатний наживо спілкуватися з користувачем за допомогою відео, використовуючи камеру смартфона. ШІ може відповідати на ваші запити в реальному часі, спостерігати та аналізувати світ навколо вас. Наприклад, незряча людина може знімати відео, а GPT-4o у реальному часі розповість, що бачить.
Крім того, новий мультимовний помічник здатний перекладати різні мови світу на льоту, що стане справжньою знахідкою для мандрівників.
Це оновлення відкриває нові горизонти для використання ШІ в різних областях, включаючи освіту і розваги, що, без сумніву, зміцнить позиції OpenAI як одного з лідерів у галузі штучного інтелекту.
ChatGPT-4o отримав цілу низку нових цікавих функцій
Робота із зображеннями
- Розпізнавання та детальний опис вмісту зображень
- Переклад тексту на зображеннях
- Відповіді на питання, пов'язані з візуальним контентом
- Генерація зображень за текстовим описом
Робота з відео
- Розуміння того, що відбувається на відео без звуку по візуальному ряду
- Розпізнавання окремих предметів на відео
- Вміння генерувати відео, включаючи тривимірні, за текстовим описом
- Здатність коментувати те, що знімає камера, у реальному часі (актуально для незрячих)
- Стиснення відео та переказ
Робота з аудіо
- Розпізнавання та транскрибування мови в реальному часі (затримка близько 0,3 сек)
- Генерація мови з різними емоційними відтінками та інтонаціями
- Визначення емоцій щодо голосу людини
Поєднання модальностей
- Одночасна робота з текстом, зображенням, аудіо в рамках одного запиту
- Наприклад, можна поставити запитання по картинці, а відповідь отримати у вигляді аудіоповідомлення
Контекстне розуміння
- Модель враховує попередній контекст розмови під час обробки нових даних
- Здатна вести послідовний діалог протягом кількох хвилин
Просунута робота з мовами
- GPT-4o може допомогти вам у вивченні понад 50 іноземних мов
- Може працювати як синхронний перекладач у діалозі
- Розуміє жарти різними мовами та визначає контекст розмови з інтонації, наприклад, іронію чи сарказм
Доступність нової версії ChatGPT-4o
У червні 2024 року GPT-4o буде доступний всім користувачам попередньої версії, включаючи тих, хто не користується платною підпискою.
У безкоштовній версії GPT-4o є обмеження кількості повідомлень або розмов, після досягнення яких користувачів автоматично повертають до GPT-3.5. У платній версії ліміти менш суворі.
Інтеграція ChatGPT у роботів
ЗМІ повідомляють, що компанія OpenAI робить сміливий крок уперед. Розробники відновлюють свою раніше зупинену програму з робототехніки.
Поєднання передових моделей ШІ, таких як ChatGPT-4o з фізичними можливостями роботів відкриє безмежні горизонти. Уявіть людиноподібного робота, здатного не лише виконувати складні завдання, а й вести осмислений діалог, розуміти контекст та проявляти творче мислення.
Читай також
Neuralink створить роботизовану руку, якою можна керувати силою думки
Крок до повернення фізичної свободи
Українці збільшили витрати на нові авто: які марки стали найбільш продаваними
На першому місці німецький преміум-клас
З 2025 року ChatGPT стане платником податків в Україні: що зміниться для користувачів
Скільки коштуватиме підписка
У швейцарській церкві тепер можна сповідатися ШІ-Ісусу Христу
Як працює «божественний» штучний інтелект
Резиденцію Дональда Трампа охороняють роботи-собаки: що про них відомо (відео)
ЗСУ використовують схожих роботів