Tesla Optimus так не вміє. Робот Figure AI отримав голос, слух та зір завдяки технологіям OpenAI

Опубликовал
Катерина Даньшина

Здається, в Маска з’явився ще один привід для ненависті до OpenAI.

Стартап Figure AI, який два тижні тому оголосив про співпрацю з OpenAI, вже продемонстрував її перші результати. На новому відео робот Figure 01 вже повноцінно взаємодіє з людиною — сприймає запити зором і на слух, а також надає повноцінні відповіді.

«Я бачу яблуко на тарілці в центрі столу, сушарку з чашками й тарілкою, а ти стоїш поруч із рукою на столі», — так описує Figure 01 те, що йому демонструють.

Далі людина просить у робота щось поїсти й Figure 01 простягає яблуко. Так, на цей час є певні затримки, передбачені для обробки інструкцій, однак в основному робот ідеально виконує команди.

«Я дав тобі яблуко, тому що це єдиний, ем,  їстівний предмет, який я міг дати тобі зі столу», — каже Figure 01 і оце людське «ем», додає ще більшої реалістичності в розмову.

Для останнього трюку в Figure 01 питають, що далі робити з посудом. Робот відповідає, що його треба перенести на сушарку, і на прохання зробити це, перевертає стакан догори дригом і ставить у потрібне місце. Те саме Figure 01 відтворює з тарілкою, дуже чітко встановлюючи її на виступ у сушарці.

Онлайн-курс "Нотації BPMN" від Laba.
Опануйте мову BPMN для візуалізації бізнес-процесів, щоб впорядкувати хаос у них.Після курсу ви точно знатимете, що саме обрати для розв’язання завдань вашого бізнесу.
Дізнатись більше

За зір та мовлення відповідають технології GPT-4Vision та ChatGPT відповідно, тоді як слух забезпечений розробкою WhisperJAX. Figure AI створила каркас робота та моделі, які приводять його у рух.

Здається, такого прогресу вже давно чекали від Tesla з її Optimus. Компанія досить швидко запустила прототипи — і до сьогодні ми бачили одну зібрану модель, яка ледь рухалась, і ще одну, яка стояла на підставці й махала глядачам рукою. Водночас на промо, яке послідувало за презентацією, роботи впевненіше ходили та взаємодіяли з довкіллям.

Щоправда, остання демонстрація, яку Ілон Маск виклав на X, «‎засвітила» інженера, який керував рухами робота.

Figure 01 не використовує жодних хитрощів на відео, каже співзасновник стартапу Бретт Адкок.

«Відео демонструє наскрізні нейронні мережі. Немає телеоперацій», — написав Адкок на X. «Крім того, воно було знято зі швидкістю 1,0x і безперервно».

  • Figure AI — це компанія з Саннівейлу, Каліфорнія, з 50 співробітниками, які розробляють автономних роботів-гуманоїдів загального призначення, що керуються ШІ. За словами компанії, її «‎творіння» призначені для розв’язання проблеми з нестачею робочої сили, виконання небажаних чи небезпечних робіт і підтримки ланцюга поставок у глобальному масштабі.
  • Нещодавно Figure AI зібрала $675 млн в черговому раунді фінансування — зокрема від засновника Amazon Джефф Безос, Nvidia, OpenAI та Microsoft. Нині компанію оцінюють у $2,6 млрд.
  • У серпні стартап оголосив про комерційну угоду, згідно з якою її перший людиноподібний робот Figure 01 працюватиме на єдиному заводі BMW у США.
Disqus Comments Loading...