top of page
Buscar

OmniHuman-1: Revolucionando la creación de videos realistas

  • Foto del escritor: juan felipe beltran diaz
    juan felipe beltran diaz
  • 10 feb 2025
  • 2 Min. de lectura

ByteDance, la empresa detrás de TikTok, ha presentado OmniHuman-1, un nuevo marco de inteligencia artificial generativa diseñado para crear videos realistas de humanos a partir de una sola imagen y una señal de movimiento [1, 2].


Características principales de OmniHuman-1:


  • Generación de videos realistas: OmniHuman-1 puede crear videos de personas que hablan, cantan y se mueven de manera natural [1, 6]. Los videos pueden ser de cuerpo completo, medio cuerpo o retratos [1, 2].


  • Entrada flexible: El sistema requiere solo una imagen y señales de movimiento como audio o video para generar animaciones [5].


  • Control de movimiento diverso: Admite el control de movimiento a través de texto, audio y video [5].


  • Alto nivel de detalle: Ofrece un excelente rendimiento en detalles como movimientos de manos y sincronización labial [5].


  • Entrenamiento multimodal mixto: Utiliza una estrategia de entrenamiento que permite al modelo aprovechar mejor los datos y superar la escasez de información de alta calidad [1]. Para entrenar el sistema, los investigadores utilizaron más de 18,000 horas de datos relacionados con el comportamiento humano [1]. Otra fuente señala que se utilizaron 18,700 horas de video [2, 6].


OmniHuman-1 procesa cada tipo de entrada de forma independiente antes de fusionar la información para generar videos. El sistema condensa los detalles del movimiento a partir de descripciones textuales, imágenes de referencia, señales de audio y datos de movimiento [1].


Según ByteDance, OmniHuman-1 supera a las tecnologías actuales en la generación de videos humanos realistas a partir de señales de entrada débiles, especialmente audio [1, 2]. Ejemplos del uso de esta herramienta incluyen la animación de figuras históricas como Albert Einstein [1, 2].


Aunque OmniHuman-1 no está disponible para el público en general debido a su alto costo de entrenamiento y ejecución [2, 5], este desarrollo plantea interrogantes sobre la autenticidad digital y el impacto de la inteligencia artificial en el futuro [2].



Fuentes:


IAs que ayudaron a hacer esto posible:

  • Asistencia para la investigación con Perplexity IA.

  • Asistencia para el contenido media con GPT assistant (fine tuned).

Todo el contenido has sido creado por un humano con la ayuda de inteligencia artificial.

 
 
 

Comentarios


Recibe actualizaciones en tu correo

¡Gracias!

  • Facebook
  • Instagram
  • X

© 2024 Creado por Juan Beltran con Wix.com

bottom of page