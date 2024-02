Последняя модель OpenAI превращает текстовые подсказки в «сложные реалистичные сцены с несколькими персонажами, определенными типами движения и точными деталями объекта и фона» — продолжительностью до минуты.

Компания также отмечает, что Sora может понимать, как объекты «существуют в физическом мире», а также «точно интерпретировать реквизит и генерировать убедительных персонажей, выражающих яркие эмоции». Модель также может генерировать видео на основе неподвижного изображения и заполнять недостающие кадры в существующем видео или расширять его.

Сгенерированные Sora демо-ролики, опубликованные на X, включают в частности пролет камеры по заснеженной улице Токио — правда, если внимательно присмотреться, можно отыскать признаки работы искусственного интеллекта (например, разъединенные со стволами кроны деревьев).

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Несколько лет назад именно генераторы текста в изображения, такие как Midjourney, привлекли большое внимание к отрасли ИИ, однако сейчас такие компании, как Runway и Pika взялись совершенствовать технологию для видео. Lumiere от Google сейчас можно считать основным конкурентом OpenAI в этой сфере (хотя продолжительность ролика у этой модели ограничена до 5 секунд).

Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq

