рус | укр

ChatGPT та інші популярні моделі ШІ не впоралися з українським ЗНО: скільки балів набрали нейромережі

ChatGPT та інші популярні моделі ШІ не впоралися з українським ЗНО: скільки балів набрали нейромережі

Техно

ChatGPT та інші популярні моделі ШІ не впоралися з українським ЗНО: скільки балів набрали нейромережі

Фото: Getty Images

Дарина Герасимчук 17 липня, 2025, 18:02

0

Українські вчені розробили ZNOVision – перший багатоформатний тест для штучного інтелекту, який перевіряє знання з 13 предметів ЗНО українською мовою.

Підпишіться на канал Gloss.ua у Telegram.

Результати показали: навіть найпотужніші моделі, такі як GPT4o чи Claude 3.5, не здали б українське ЗНО.

ZNOVision складається з більш ніж 4300 завдань, розділених на 13 категорій: від фізики та математики до історії та літератури. Більше половини містять візуальний компонент — схеми, діаграми, карти, малюнки. Частина запитань потребує логічного висновку, інша — точної інтерпретації інструкцій українською мовою.

До тестування залучили шість основних моделей: GPT4o, Claude 3.5 Sonnet, Gemini 1.5 Pro, Qwen2VL72B, Paligemma3B, а також донавчену версію PaligemmaFT.

Жодна з моделей не набрала 70% правильних відповідей. Найкращий результат - 67,5% - у Gemini Pro. Claude 3.5 - 64,3%, Qwen2VL - 51,2%, GPT4o - 47%. Для порівняння випадковий вибір дав би ≈ 22%.

Помилки найчастіше траплялися у складних візуально-текстових задачах: моделі не розпізнавали українські слова на зображеннях, плутали одиниці виміру, ігнорували частину формулювання. У наборі VQAUA (візуальні питання) моделі дали: Claude – 26,7%, GPT4o – 29%, Qwen2VL – 34,4%. Це значно нижче за англомовні результати (> 60%) і свідчить про відсутність підтримки української мови на рівні мультимодальних уявлень.

Теги: штучний інтелект , технології , освіта , ЗНО , новини України , світові новини

Новости

01 червня 16:58 "Це навіть китайці копіювати не будуть": шквал критики обрушився на перший електромобіль від Ferrari 0

18 травня 15:28 Підписка для всіх громадян: ціла країна отримає безкоштовний доступ до ChatGPT Plus 0

30 квiтня 16:58 Помилка, яку не варто робити при покупці телевізора або монітора в 2026 році 0

22 квiтня 17:56 Apple змінює генерального директора вперше за 15 років: чого чекати від нового CEO Джона Тернуса 0

16 квiтня 15:42 У США запустили відеочат з Ісусом Христом на базі ШІ за $1,99 за хвилину (фото) 0

15 квiтня 16:04 Meta створює ШІ-клон Марка Цукерберга для спілкування зі співробітниками компанії 0

10 квiтня 16:12 Видання The New York Times назвало можливого творця біткоїну 0

07 квiтня 16:14 Витрата палива до 5 літрів на сотню: 10 економних сімейних авто в Україні (фото) 0

30 березня 16:04 Україна створює свій чат GPT: у Мінцифри оприлюднили назву української мовної моделі ШІ 0

17 березня 14:39 Італія тестуватиме новий "купол" ППО Michelangelo в умовах реальної війни в Україні 0

23 лютого 18:05 Apple готує презентацію щонайменше п'яти нових продуктів, включаючи iPhone, наступного тижня 0

09 лютого 15:49 У Китаї показали людиноподібного робота Moya: тепла шкіра, зоровий контакт та інші функції 0

21 сiчня 16:54 В Україні виставили на продаж двомісний пасажирський дрон: ціна та час польоту (фото) 0

14 сiчня 17:24 Apple інтегрує штучний інтелект Gemini у персонального помічника Siri за $1 млрд на рік 0

08 сiчня 11:17 130 дюймів, на яких не загубляться деталі: хіт CES 2026 – телевізор Samsung Micro RGB 0

19 грудня 19:23 Російський "Орєшнік" не дістає до Києва з Білорусі, незважаючи на дальність 5500 км 0

16 грудня 15:51 У ChatGPT виявлено депресію, а у Gemini — тривожність і аутизм: дослідження 0

12 грудня 17:41 Apple назвала найпопулярніші застосунки та ігри 2025 року для iPhone та iPad 0

28 листопада 15:02 Google випустила нейромережу Nano Banana Pro: згенеровані зображення не відрізняються від фото 0

18 листопада 17:34 Кінець епохи: Ford Focus зняли з виробництва після 27 років на ринку (фото) 0

Найбільш читані

22 липня 14:37 Стабілізатори напруги Укртехнологія — ефективний захист електрообладнання від перепадів напруги 0

22 липня 14:52 Чи треба в Україні платити податки, якщо виграв в казино 0

24 липня 11:48 Відновлення втрачених зубів: які методи використовують сучасні стоматологи 0

Техно

0

"Це навіть китайці копіювати не будуть": шквал критики обрушився на перший електромобіль від Ferrari

Потвора чи інженерний прорив?

0

Техно

Підписка для всіх громадян: ціла країна отримає безкоштовний доступ до ChatGPT Plus

Після навчального курсу

Помилка, яку не варто робити при покупці телевізора або монітора в 2026 році

Техно

0

Помилка, яку не варто робити при покупці телевізора або монітора в 2026 році

Пояснюють експерти

Apple змінює генерального директора вперше за 15 років: чого чекати від нового CEO Джона Тернуса

Техно

0

Apple змінює генерального директора вперше за 15 років: чого чекати від нового CEO Джона Тернуса

Багато продажів, мало інновацій

У США запустили відеочат з Ісусом Христом на базі ШІ за $1,99 за хвилину (фото)

Техно

0

У США запустили відеочат з Ісусом Христом на базі ШІ за $1,99 за хвилину (фото)

Духовні поради та підтримка

Meta створює ШІ-клон Марка Цукерберга для спілкування зі співробітниками компанії

Техно

0

Meta створює ШІ-клон Марка Цукерберга для спілкування зі співробітниками компанії

3D-модель замінить реального керівника

Видання The New York Times назвало можливого творця біткоїну

Техно

0

Видання The New York Times назвало можливого творця біткоїну

Його особистість вважається однією з найважливіших таємниць