Вчені з університету Осаки виявили здатність генеративних моделей штучного інтелекту Vision Transformers (ViT) спонтанно розвивати механізми візуальної обробки інформації, яка подібна до людської.
Згідно з новим дослідженням, правильний метод навчання дозволяє штучному інтелекту самостійно відтворювати механізми візуальної обробки, подібні до людських. Вчені порівняли дані відстеження рухів очей людини та моделі візуальної обробки, які були сформовані ViT. Моделі штучного інтелекту навчалися за допомогою спеціального методу DINO, без застосування фіксованих фільтрів для аналізу зображень.

Після навчання ViT продемонстрував візуальну обробку інформації, наближену до того, як дорослі переглядають відеокліпи. А моделі, які навчалися з використанням фіксованих фільтрів та алгоритмів, показали неприродну візуальну обробку.
Ретельний аналіз підтвердив, що здібності штучного інтелекту, які наблизили візуальну обробку до людської, виникли природно за результатами навчання методом DINO.
Нагадаємо, штучному інтелекту запропонували загрожувати, щоб він краще працював.



Коментарі можуть залишати тільки зареєстровані користувачі