ChatGPT и другие популярные модели ИИ не справились с украинским ЗНО: сколько баллов набрали нейросети

Getty Images

 Украинские ученые разработали ZNOVision – первый многоформатный тест для искусственного интеллекта, проверяющий знания по 13 предметам ВНО на украинском языке.

Подпишитесь на канал Gloss.ua в Telegram.

Результаты показали: даже самые мощные модели, такие как GPT4o или Claude 3.5, не сдали бы украинский ВНО.

ZNOVision состоит из более чем 4300 заданий, разделенных на 13 категорий: от физики и математики до истории и литературы. Более половины из них содержат визуальный компонент — схемы, диаграммы, карты, рисунки. Часть вопросов требует логического вывода, другая — точной интерпретации инструкций на украинском языке.

К тестированию привлекли шесть основных моделей: GPT4o, Claude 3.5 Sonnet, Gemini 1.5 Pro, Qwen2VL72B, Paligemma3B, а также дообученную версию PaligemmaFT. 

Ни одна из моделей не набрала 70% правильных ответов. Лучший результат — 67,5% — у Gemini Pro. Claude 3.5 — 64,3%, Qwen2VL — 51,2%, GPT4o — 47 %. Для сравнения, случайный выбор дал бы ≈ 22%.

Ошибки чаще всего случались в сложных визуально-текстовых задачах: модели не распознавали украинские слова на изображениях, путали единицы измерения, игнорировали часть формулировки. В наборе VQAUA (визуальные вопросы) модели дали: Claude — 26,7%, GPT4o — 29%, Qwen2VL — 34,4%. Это значительно ниже англоязычных результатов (> 60%) и свидетельствует об отсутствии поддержки украинского языка на уровне мультимодальных представлений.

Читай также

Google выпустила нейросеть Nano Banana Pro: сгенерированные изображения не отличаются от фото

Реалистичность поражает

Конец эпохи: Ford Focus сняли с производства после 27 лет на рынке (фото)

Популярная в Украине модель

Эксперты подсчитали настоящую себестоимость iPhone 17 Pro Max, который продают за 1200 долларов

В Украине цена достигает 100 тысяч гривен

Умеет мыть посуду и убирать: в США стартовали продажи домашнего робота NEO (видео)

Помощник по дому с множеством функций 

Более 1 миллиона пользователей еженедельно делятся с ChatGPT мыслями о суициде

Жуткая статистика

Водитель сгорел заживо в электрокаре Xiaomi: умная система заблокировала двери (видео)

Акции компании обрушились на 8,7 %

Meta представила умные очки Ray-Ban Display: ИИ-функции, экран в линзе и сенсорный браслет (видео)

Впечатляющие характеристики 

Презентация Apple 2025: какие обновления и характеристики получили iPhone 17, Apple Watch и AirPods Pro 3 (фото)

Все главные новинки Apple 2025 и цены на них

OpenAI начнет передавать переписки с ChatGPT в полицию, если обнаружит угрозу

Какие темы могут закончиться звонком из полиции

В сети показали кадры пусков украинской крылатой ракеты «Фламинго»: что известно (видео)

«Это самая успешная ракета, которая у нас есть»