
Японські дослідники з Університету Осаки виявили здатність генеративних моделей штучного інтелекту Vision Transformers (ViT) спонтанно розвивати механізми візуальної обробки інформації, подібні до людських.
У новому дослідженні науковці продемонстрували, що правильний метод навчання дозволяє ШІ самостійно відтворити механізми візуальної обробки, подібні до людських. Дослідники порівняли дані відстеження рухів очей людини і моделі візуальної обробки, сформовані ViT. Моделі ШІ навчались за допомогою спеціального методу DINO без використання фіксованих фільтрів для аналізу зображень.
Навчені за допомогою DINO моделі ViT продемонстрували візуальну обробку інформації, близьку до того, як дорослі люди переглядають відеокліпи. Між тим моделі, що навчались із використанням фіксованих фільтрів та алгоритмів, продемонстрували неприродну візуальну обробку.
«Наші моделі не просто випадково звертали увагу на візуальні сцени, вони спонтанно розвивали спеціалізовані функції. Одна підгрупа моделей послідовно фокусувалася на обличчях, інша фіксувала контури цілих фігур, а третя переважно звертала увагу на фонові риси. Це точно відображає те, як зорові системи людини сегментують та інтерпретують сцени», — пояснює провідний автор дослідження Такуто Ямамото.
Подальший ретельний аналіз підтвердив, що здібності, які наблизили візуальну обробку моделями ШІ до людської, виникли природним чином за результатами навчання методом DINO. Ці моделі візуальної обробки були як якісно схожі із поглядом людини, так і кількісно відповідали встановленим даним відстеження очей, особливо у сценах з участю людей.
«Цей результат чудовий тим, що цим моделям ніколи не говорили, що таке обличчя. Проте вони навчилися розставляти пріоритети щодо осіб, мабуть, тому, що це максимізувало інформацію, що отримується з навколишнього середовища. Це переконлива демонстрація того, що самоконтрольоване навчання може вловити щось фундаментальне в тому, як інтелектуальні системи, включаючи людей, навчаються у світу», — зазначає старший автор дослідження Сігеру Кітадзава.
Результати дослідження були опубліковані у журналі Neural Networks
Джерело: TechXplore
Favbet Tech – це ІТ-компанія зі 100% украінською ДНК, що створює досконалі сервіси для iGaming і Betting з використанням передових технологіи та надає доступ до них. Favbet Tech розробляє інноваційне програмне забезпечення через складну багатокомпонентну платформу, яка здатна витримувати величезні навантаження та створювати унікальний досвід для гравців.
Повідомити про помилку
Текст, який буде надіслано нашим редакторам: