Штучний інтелект, незважаючи на здатність генерувати коди, тексти та зображення, відчуває труднощі з визначенням часу на аналоговому годиннику та читанні календаря.
Зокрема, вчені з Единбурзького університету протестували кілька багатомодальних мовних моделей, які опрацьовують текстову та візуальну інформацію. Вони виявили, що ці системи регулярно помиляються у базових завданнях. Дослідження було представлено на Міжнародній конференції з репрезентацій навчання.

Як розповів провідний автор дослідження Рохіт Саксена, більшість людей навчаються визначати час та користуватися календарями з раннього віку. Результати продемонстрували значну прогалину у здібностях штучного інтелекту до виконання базових навичок.
Для експерименту команда ввела набір годинників та календарів у кілька провідних моделей: GPT-4o (OpenAI), Gemini 2.0 (Google), Claude-3.5 Sonnet (Anthropic) та LLaMA 3.2-Vision (Meta). Результати виявилися невтішними: багато моделей помилялися більш ніж у половині випадків – у визначенні часу по годинах і навіть встановленні дня тижня для заданої дати.
Нагадаємо, у Китаї робот із штучним інтелектом напав на інженерів.
Далі буде…



Коментарі можуть залишати тільки зареєстровані користувачі