ChatGPT та інші популярні моделі ШІ не впоралися з українським ЗНО: скільки балів набрали нейромережі ChatGPT та інші популярні моделі ШІ не впоралися з українським ЗНО: скільки балів набрали нейромережі
Техно

ChatGPT та інші популярні моделі ШІ не впоралися з українським ЗНО: скільки балів набрали нейромережі

Фото: Getty Images
Дарина Герасимчук 17 липня, 2025, 18:02
 0

Українські вчені розробили ZNOVision – перший багатоформатний тест для штучного інтелекту, який перевіряє знання з 13 предметів ЗНО українською мовою.

Підпишіться на канал Gloss.ua у Telegram.

Результати показали: навіть найпотужніші моделі, такі як GPT4o чи Claude 3.5, не здали б українське ЗНО.

ZNOVision складається з більш ніж 4300 завдань, розділених на 13 категорій: від фізики та математики до історії та літератури. Більше половини містять візуальний компонент — схеми, діаграми, карти, малюнки. Частина запитань потребує логічного висновку, інша — точної інтерпретації інструкцій українською мовою.

До тестування залучили шість основних моделей: GPT4o, Claude 3.5 Sonnet, Gemini 1.5 Pro, Qwen2VL72B, Paligemma3B, а також донавчену версію PaligemmaFT.

Жодна з моделей не набрала 70% правильних відповідей. Найкращий результат - 67,5% - у Gemini Pro. Claude 3.5 - 64,3%, Qwen2VL - 51,2%, GPT4o - 47%. Для порівняння випадковий вибір дав би ≈ 22%.

Помилки найчастіше траплялися у складних візуально-текстових задачах: моделі не розпізнавали українські слова на зображеннях, плутали одиниці виміру, ігнорували частину формулювання. У наборі VQAUA (візуальні питання) моделі дали: Claude – 26,7%, GPT4o – 29%, Qwen2VL – 34,4%. Це значно нижче за англомовні результати (> 60%) і свідчить про відсутність підтримки української мови на рівні мультимодальних уявлень.

Теги: штучний інтелект , технології , освіта , ЗНО , новини України , світові новини

  • 28 листопада 15:02 Google випустила нейромережу Nano Banana Pro: згенеровані зображення не відрізняються від фото    0
  • 18 листопада 17:34 Кінець епохи: Ford Focus зняли з виробництва після 27 років на ринку (фото)    0
  • 12 листопада 17:28 Експерти підрахували справжню собівартість iPhone 17 Pro Max, який продають за 1200 доларів    0
  • 30 жовтня 18:30 Вміє мити посуд та прибирати: у США стартували продажі домашнього робота NEO (відео)    0
  • 28 жовтня 16:16 Понад 1 мільйон користувачів щотижня діляться з ChatGPT думками про суїцид    0
  • 14 жовтня 15:42 Водій згорів живцем в електрокарі Xiaomi: розумна система заблокувала двері (відео)    0
  • 18 вересня 14:43 Meta представила розумні окуляри Ray-Ban Display: ШІ-функції, екран у лінзі і сенсорний браслет (відео)    0
  • 29 серпня 15:05 OpenAI почне передавати листування з ChatGPT до поліції, якщо виявить загрозу    0
  • 22 серпня 14:29 У мережі показали кадри пусків української крилатої ракети "Фламінго": що відомо (відео)    0
  • 18 серпня 17:03 ChatGPT може навчити дітей як вживати алкоголь, наркотики та накласти на себе руки: дослідження    0
  • 14 серпня 17:54 OpenAI змінить «характер» GPT-5 після хвилі критики: що не сподобалося користувачам    0
  • 11 серпня 16:06 OpenAI представила GPT-5: що нового у найпросунутішої моделі ШІ (відео)    0
  • 31 липня 17:11 ШІ як репетитор: OpenAI представила нову функцію ChatGPT – режим навчання (відео)    0
  • 21 липня 14:52 Впивається в палець шипами: у США створили обручку, яка не дасть занадто довго сидіти в соцмережах (відео)    0
  • 17 липня 18:02 ChatGPT та інші популярні моделі ШІ не впоралися з українським ЗНО: скільки балів набрали нейромережі    0
  • 16 липня 15:33 Вперше в історії iPhone: з iOS 26 можна встановити будь-яку пісню в якості рінгтону    0
  • 09 липня 15:42 Штучний інтелект Grok від Ілона Маска тепер викриває російську пропаганду: росіяни лютують (фото)    0
  • 04 липня 18:40 Після запуску ChatGPT кількість вакансій для початківців скоротилася майже на третину: дослідження    0
  • 03 липня 18:11 Офшори для України - Андрій Матюха показує, як міжнародні схеми можуть працювати на добро    0
  • 26 червня 15:52 За два місяці до релізу: у мережу злили фото майбутніх iPhone 17 Pro та iPhone 17 Air    0