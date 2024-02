Остання модель OpenAI перетворює текстові підказки на «складні реалістичні сцени з кількома персонажами, певними типами руху та точними деталями об’єкта та фону» — тривалістю до хвилини.

Компанія також зазначає, що Sora може розуміти, як об’єкти «існують у фізичному світі», а також «точно інтерпретувати реквізит і генерувати переконливих персонажів, які виражають яскраві емоції». Модель також може генерувати відео на основі нерухомого зображення та заповнювати відсутні кадри в існуючому відео або розширювати його.

Згенеровані Sora демо-ролики, опубліковані на X, включають зокрема проліт камери засніженою вулицею Токіо — щоправда, якщо уважно придивитись, можна відшукати ознаки роботи штучного інтелекту (як-от роз’єднані зі стовбурами крони дерев).

Кілька років тому саме генератори тексту в зображення, такі як Midjourney, привернули велику увагу до галузі ШІ, однак нині такі компанії, як Runway і Pika взялися удосконалювати технологію для відео. Lumiere від Google наразі можна вважати основним конкурентом OpenAI у цій сфері (хоча тривалість ролика у цієї моделі обмежена до 5 секунд).

