Рубрики НовостиСофт

Google обвинили во лжи относительно их видео об искусственном интеллекте Gemini

Опубликовал
Юрій Орос

Google только анонсировала Gemini, свой самый мощный набор моделей искусственного интеллекта, а компанию уже обвинили во лжи относительно его производительности.

В статье от Bloomberg утверждается, что Google исказил мощность Gemini в недавнем видеоролике. Во время своего анонса Google показала демонстрационное видео и обозреватель Парми Олсон утверждает, что у видео продукт выглядел чрезвычайно мощным — возможно даже слишком.

Шестиминутное видео демонстрирует мультимодальные возможности Gemini (например, разговорные подсказки в сочетании с распознаванием изображений). Кажется, Gemini распознает изображение быстро — даже на картинке, где нужно соединить точки — и реагирует в течение нескольких секунд, а также отслеживает пачку бумаги в чашке и игру с мячом в реальном времени. Конечно, все это может делать человек, но это искусственный интеллект, способный распознавать и предполагать, что произойдет дальше, передает The Verge.

Онлайн-курс "Computer Vision" від robot_dreams.
Застосовуйте Machine Learning / Deep Learning та вчіть нейронні мережі розпізнавати об’єкти на відео. Отримайте необхідні компетенції Computer Vision Engineer.
Дізнатись більше про курс

Но если нажать на описание видео на YouTube, то Google содержит важную оговорку:

Для целей этой демонстрации задержка была уменьшена, а ответы Gemini были сокращены для краткости.

Именно это возмущает Олсон. Согласно ее статье, Google признал, когда его попросили прокомментировать, что видеодемонстрация не происходила в реальном времени с голосовыми подсказками, а использовались неподвижные кадры из необработанного материала, а затем выписывались текстовые подсказки, на которые Gemini реагировал.

Google не соглашается. На вопрос о правдивости демонстрации, компания указала на пост Ориола Виньялса, вице-президента по исследованиям и руководителя направления глубокого обучения в Google DeepMind (также соруководителя Gemini), в котором объясняется, как команда создала видеоролик.

Все подсказки и результаты работы пользователя в видео подлинны, сокращены для краткости. Видео иллюстрирует, как может выглядеть многорежимный опыт, созданный с помощью Gemini. Мы создали его, чтобы вдохновить разработчиков.

Он добавил, что команда предоставила Gemini изображения и тексты и попросила его ответить, предсказав, что будет дальше.

 

Disqus Comments Loading...