Штучний інтелект провалив шкільне завдання

Штучний інтелект провалив шкільне завдання

349

Штучний інтелект, незважаючи на здатність генерувати коди, тексти та зображення, відчуває труднощі з визначенням часу на аналоговому годиннику та читанні календаря.

Зокрема, вчені з Единбурзького університету протестували кілька багатомодальних мовних моделей, які опрацьовують текстову та візуальну інформацію. Вони виявили, що ці системи регулярно помиляються у базових завданнях. Дослідження було представлено на Міжнародній конференції з репрезентацій навчання.

Штучний інтелект провалив шкільне завдання 1

Як розповів провідний автор дослідження Рохіт Саксена, більшість людей навчаються визначати час та користуватися календарями з раннього віку. Результати продемонстрували значну прогалину у здібностях штучного інтелекту до виконання базових навичок.

Для експерименту команда ввела набір годинників та календарів у кілька провідних моделей: GPT-4o (OpenAI), Gemini 2.0 (Google), Claude-3.5 Sonnet (Anthropic) та LLaMA 3.2-Vision (Meta). Результати виявилися невтішними: багато моделей помилялися більш ніж у половині випадків – у визначенні часу по годинах і навіть встановленні дня тижня для заданої дати.

Нагадаємо, у Китаї робот із штучним інтелектом напав на інженерів.

Далі буде…

Схожі статті / Вам може сподобатися