Вражаючі та лякаючі можливості нової версії штучного інтелекту ChatGPT-4o
Getty Images
У середині травня компанія OpenAI представила нову версію найпопулярнішої та найпросунутішої нейромережі у світі. Продукт отримав назву ChatGPT-4o, зберігши порядковий номер свого попередника.
Підпишіться на канал Gloss.ua у Telegram.
GPT-4o, де "o" означає "omni" (всебічний), є кульмінацією зусиль OpenAI щодо створення більш інтуїтивно зрозумілого та багатофункціонального ШІ. Під час щорічного заходу OpenAI Spring Update технічний директор Міра Мураті (Mira Murati) повідомила, що нова модель здатна працювати одночасно з аудіо, зображеннями та текстом.
«Ми дивимося на майбутнє взаємодії між нами та машинами, — каже Мураті. — І ми вважаємо, що GPT-4o справді змінює цю парадигму».
Найголовніше оновлення – це розмовні можливості ChatGPT-4o. Новий голосовий помічник здатний відтворювати розмовну мову в режимі реального часу і реагувати на голосові команди лише за 320 мілісекунд, що можна порівняти з реакцією звичайної людини. GPT-4o вміє визначати емоції за виразом обличчя або за голосом співрозмовника. При цьому асистент має різні інтонації, може сміятися, шепотіти, співати, а також фліртувати, жартувати та розпізнавати сарказм.
Чат-бот здатний наживо спілкуватися з користувачем за допомогою відео, використовуючи камеру смартфона. ШІ може відповідати на ваші запити в реальному часі, спостерігати та аналізувати світ навколо вас. Наприклад, незряча людина може знімати відео, а GPT-4o у реальному часі розповість, що бачить.
Крім того, новий мультимовний помічник здатний перекладати різні мови світу на льоту, що стане справжньою знахідкою для мандрівників.
Це оновлення відкриває нові горизонти для використання ШІ в різних областях, включаючи освіту і розваги, що, без сумніву, зміцнить позиції OpenAI як одного з лідерів у галузі штучного інтелекту.
ChatGPT-4o отримав цілу низку нових цікавих функцій
Робота із зображеннями
- Розпізнавання та детальний опис вмісту зображень
- Переклад тексту на зображеннях
- Відповіді на питання, пов'язані з візуальним контентом
- Генерація зображень за текстовим описом
Робота з відео
- Розуміння того, що відбувається на відео без звуку по візуальному ряду
- Розпізнавання окремих предметів на відео
- Вміння генерувати відео, включаючи тривимірні, за текстовим описом
- Здатність коментувати те, що знімає камера, у реальному часі (актуально для незрячих)
- Стиснення відео та переказ
Робота з аудіо
- Розпізнавання та транскрибування мови в реальному часі (затримка близько 0,3 сек)
- Генерація мови з різними емоційними відтінками та інтонаціями
- Визначення емоцій щодо голосу людини
Поєднання модальностей
- Одночасна робота з текстом, зображенням, аудіо в рамках одного запиту
- Наприклад, можна поставити запитання по картинці, а відповідь отримати у вигляді аудіоповідомлення
Контекстне розуміння
- Модель враховує попередній контекст розмови під час обробки нових даних
- Здатна вести послідовний діалог протягом кількох хвилин
Просунута робота з мовами
- GPT-4o може допомогти вам у вивченні понад 50 іноземних мов
- Може працювати як синхронний перекладач у діалозі
- Розуміє жарти різними мовами та визначає контекст розмови з інтонації, наприклад, іронію чи сарказм
Доступність нової версії ChatGPT-4o
У червні 2024 року GPT-4o буде доступний всім користувачам попередньої версії, включаючи тих, хто не користується платною підпискою.
У безкоштовній версії GPT-4o є обмеження кількості повідомлень або розмов, після досягнення яких користувачів автоматично повертають до GPT-3.5. У платній версії ліміти менш суворі.
Інтеграція ChatGPT у роботів
ЗМІ повідомляють, що компанія OpenAI робить сміливий крок уперед. Розробники відновлюють свою раніше зупинену програму з робототехніки.
Поєднання передових моделей ШІ, таких як ChatGPT-4o з фізичними можливостями роботів відкриє безмежні горизонти. Уявіть людиноподібного робота, здатного не лише виконувати складні завдання, а й вести осмислений діалог, розуміти контекст та проявляти творче мислення.
Читай також
Google випустила нейромережу Nano Banana Pro: згенеровані зображення не відрізняються від фото
Реалістичність вражає
Кінець епохи: Ford Focus зняли з виробництва після 27 років на ринку (фото)
Популярна в Україні модель
Експерти підрахували справжню собівартість iPhone 17 Pro Max, який продають за 1200 доларів
В Україні ціна сягає 100 тисяч гривень
Вміє мити посуд та прибирати: у США стартували продажі домашнього робота NEO (відео)
Помічник по дому з безліччю функцій
Водій згорів живцем в електрокарі Xiaomi: розумна система заблокувала двері (відео)
Акції компанії обвалилися на 8,7%
Meta представила розумні окуляри Ray-Ban Display: ШІ-функції, екран у лінзі і сенсорний браслет (відео)
Вражаючі характеристики
Презентація Apple 2025: які оновлення та характеристики отримали iPhone 17, Apple Watch та AirPods Pro 3 (фото)
Всі головні новинки Apple 2025 та ціни на них
OpenAI почне передавати листування з ChatGPT до поліції, якщо виявить загрозу
Які теми можуть закінчитися дзвінком із поліції
У мережі показали кадри пусків української крилатої ракети "Фламінго": що відомо (відео)
«Це найуспішніша ракета, яка в нас є»