ИИ научился распознавать данные как человек, — исследование

Опубликовал Олександр Федоткін

Китайские исследователи утверждают, что современные модели ИИ уже способны распознавать и сортировать различные категории информации подобно человеку.

По словам ученых из Китайской академии наук и Южно-Китайского технологического университета в Гуанчжоу, некоторые модели ИИ копируют ключевые функции человеческого мозга при выполнении задач по сортировке информации. Ученые стремились выяснить, могут ли большие языковые модели, такие как ChatGPT или Gemini, понимать и обрабатывать информацию о различных объектах подобно людям. 

Для этого ученые дали моделям ИИ ChatGPT-3.5 и Gemini Pro Vision задание, убрать из ряда текстовых и визуальных объектов лишние. Для этого было собрано 4,7 млн ответов относительно 1 тыс. 854 различных объектов, среди которых, собаки, стулья, яблоки, автомобили, и так далее.

По результатам исследования ученые установили, что из созданных ИИ моделей, 66 были созданы на основе того, как это делают люди. Эти модели включали в себя довольно сложные атрибуты, такие как: текстура, эмоциональная значимость и доступность для детей.

Исследователи выяснили, что мультимодальные модели, способные сочетать текст и изображения, еще больше копируют человеческое мышление. Кроме того, команда обнаружила, что данные сканирования мозга выявили совпадение между тем, как ИИ и человеческий мозг реагируют на объекты.

По словам китайских ученых, результаты их исследования свидетельствуют, что ИИ действительно способны к приближенному к человеческому пониманию, а не просто имитации ответов. Будущие модели ИИ могут получить более интуитивные, совместимые с человеческими рассуждения, что необходимо для робототехники, образования и сотрудничества человека и систем на базе искусственного интеллекта.

Однако большие языковые модели, все же, не понимают объекты так же как люди на эмоциональном или эмпирическом уровне. Модели ИИ работают, распознавая шаблоны в тексте или визуальном контенте, однако, в отличие от людей, это базируется не на жизненном опыте и сенсорно-моторном взаимодействии. Большие языковые модели больше похожи на зеркало, отражающее миллионы источников текстовой и визуальной информации для пользователя на основе освоенных шаблонов.

Результаты исследования опубликованы в журнале Nature

Источник: Interesting Engineering