Рубрики NoticiasTecnologías

TikTok dueño presenta OmniHuman-1 — generador de vídeo «anima» foto con pista de audio.

Publicado por Andrii Rusanov

El gigante tecnológico chino ByteDance, propietario de TikTok, introdujo Inteligencia artificial OmniHuman-1 para la creación de vídeos. El modelo es muy realista, a pesar de algunos matices.

En los vídeos de demostración, el modelo generó una charla TED ficticia, una conferencia pronunciada por el mismísimo Einstein y el saludo de una anciana con una copa de vino. Las manos humanas no salieron demasiado bien, como suele ocurrir con los modelos generativos, pero en general, parece que OmniHuman-1 se centra en el realismo.

Para crear un vídeo, el modelo sólo necesita una foto y una grabación de audio. Las capacidades de la IA incluyen la edición de vídeo, los cambios en los movimientos corporales y los gestos. OmniHuman-1 se entrenó con 18700 horas de datos de vídeo utilizando el enfoque «todas las condiciones», que permite el aprendizaje simultáneo a partir de múltiples fuentes de entrada: texto, audio, vídeo, etc. Los investigadores de ByteDance afirman que una amplia gama de datos de entrenamiento ayuda a «AI a reducir significativamente la pérdida de datos» en comparación con los modelos más antiguos para crear deepfakes.

Actualmente, las empresas chinas están impulsando el desarrollo de varios modelos de IA, incluidos los lingüísticos y los generativos. El año pasado, otro gigante, Tencent, presentó HunyuanModelo generativo de vídeoque muestra vídeos magníficos pero no parece tan realista. También se informó de otro desarrollo de Tencent, un modelo para crear juegos GameGen-Oque supuestamente se entrenaba en juegos modernos.

Entre los riesgos de utilizar IA china están la seguridad de los datos, la censura y la incertidumbre sobre el cumplimiento de los derechos de autor. Sin embargo, algunas de ellas, como el popular modelo lingüístico de DeepSeek, ofrecen bajo coste y código abierto. El supuesto bajo coste de DeepSeek ya es provocó una caída de las accionespero los analistas dudan en las cifras indicadas.

Fuente: TechSpot