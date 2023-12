Google только анонсировала Gemini, свой самый мощный набор моделей искусственного интеллекта, а компанию уже обвинили во лжи относительно его производительности.

В статье от Bloomberg утверждается, что Google исказил мощность Gemini в недавнем видеоролике. Во время своего анонса Google показала демонстрационное видео и обозреватель Парми Олсон утверждает, что у видео продукт выглядел чрезвычайно мощным — возможно даже слишком.

Шестиминутное видео демонстрирует мультимодальные возможности Gemini (например, разговорные подсказки в сочетании с распознаванием изображений). Кажется, Gemini распознает изображение быстро — даже на картинке, где нужно соединить точки — и реагирует в течение нескольких секунд, а также отслеживает пачку бумаги в чашке и игру с мячом в реальном времени. Конечно, все это может делать человек, но это искусственный интеллект, способный распознавать и предполагать, что произойдет дальше, передает The Verge.

Но если нажать на описание видео на YouTube, то Google содержит важную оговорку:

Именно это возмущает Олсон. Согласно ее статье, Google признал, когда его попросили прокомментировать, что видеодемонстрация не происходила в реальном времени с голосовыми подсказками, а использовались неподвижные кадры из необработанного материала, а затем выписывались текстовые подсказки, на которые Gemini реагировал.

Google не соглашается. На вопрос о правдивости демонстрации, компания указала на пост Ориола Виньялса, вице-президента по исследованиям и руководителя направления глубокого обучения в Google DeepMind (также соруководителя Gemini), в котором объясняется, как команда создала видеоролик.

Он добавил, что команда предоставила Gemini изображения и тексты и попросила его ответить, предсказав, что будет дальше.

