Рубрики НовиниСофт

Google звинуватили в брехні щодо їхнього відео про штучний інтелект Gemini

Опубликовал
Юрій Орос

Google щойно анонсувала Gemini, свій найпотужніший набір моделей штучного інтелекту, а компанію вже звинуватили у брехні щодо його продуктивності.

У статті Bloomberg повідомляється, що Google спотворив потужність Gemini у нещодавньому відеоролику. Під час свого анонсу Google показало демонстраційне відео й оглядачка Пармі Олсон стверджує, що у відео продукт виглядав надзвичайно потужним — можливо, навіть занадто.

Шестихвилинне відео демонструє мультимодальні можливості Gemini (наприклад, розмовні підказки в поєднанні з розпізнаванням зображень). Здається, що Gemini розпізнає зображення швидко — навіть на картинці, де треба з’єднати крапки — і реагує протягом декількох секунд, а також відстежує пачку паперу в чашці та гру з м’ячем у реальному часі. Звісно, все це може робити людина, але це штучний інтелект, здатний розпізнавати й передбачати, що станеться далі, передає The Verge.

Онлайн-курс "Тестування API" від robot_dreams.
Навчіться працювати з API на просунутому рівні та проводити навантажувальні тестування, щоб виявляти потенційні проблеми на ранніх етапах розробки.
Програма курсу і реєстрація

Але якщо натиснути на опис відео на YouTube, то Google містить важливе застереження:

Для цілей цієї демонстрації затримка була зменшена, а відповіді Gemini були скорочені для стислості.

Саме це обурює Олсон. Згідно з її статтею, Google визнав, коли його попросили прокоментувати, що відеодемонстрація не відбувалася в реальному часі з голосовими підказками, а натомість використовувалися нерухомі кадри з необробленого матеріалу, а потім виписувалися текстові підказки, на які Gemini реагував.

Google не погоджується. На питання про правдивість демонстрації, компанія вказала на пост Оріола Віньялса, віцепрезидента з досліджень і керівника напрямку глибокого навчання в Google DeepMind (також співкерівника Gemini), в якому пояснюється, як команда створила відеоролик.

Усі підказки та результати роботи користувача у відео є справжніми, скороченими для стислості. Відео ілюструє, як може виглядати багаторежимний користувацький досвід, створений за допомогою Gemini. Ми створили його, щоб надихнути розробників.

Він додав, що команда надала Gemini зображення та тексти й попросила його відповісти, передбачивши, що буде далі.

 

Disqus Comments Loading...