Avatar hablante

Crea un video con lip sync a partir de una imagen y un audio

Sube una imagen clara del avatar, añade audio y genera un video hablado fácil de previsualizar y descargar.

Imagen del avatar

JPG, PNG o WEBP de hasta 10 MB.

Audio

Sube un archivo o graba una toma en el navegador. El audio debe durar 15 segundos o menos.

Historial

Tus videos recientes de lip sync aparecen aquí.

Inicia sesión para empezar
Lip sync con IA

Crea videos con avatar parlante a partir de una imagen, un audio y un prompt

Sube una imagen clara del avatar, añade un clip de voz corto y escribe un prompt que describa la actuación que quieres. El prompt debe guiar la expresión, los gestos, la emoción y la sensación de cámara para que el video final encaje con tu mensaje.

Leer más guías

Casos de uso populares

Explicaciones y walkthroughs con estilo presentador

Convierte una voz en off y una sola imagen de avatar en explicaciones cortas para productos, tutoriales, onboarding y formación interna.

Promos sociales y actualizaciones para creadores

Crea clips hablados rápidos para anuncios, lanzamientos, pruebas de anuncios y actualizaciones de comunidad sin grabar una nueva toma.

Mensajes con personajes y portavoces

Usa un personaje de marca, la imagen de un presentador o un retrato para entregar mensajes repetibles en campañas y series de contenido.

Qué incluye el flujo de lip sync

Una subida de imagen de avatar y una subida de audio en un flujo simple
Entrada de prompt para guiar gestos, expresión facial, emoción y estilo al hablar
Historial rápido con vistas previas, seguimiento de estado y descargas directas tras iniciar sesión
Pensado para videos hablados cortos y fáciles de reutilizar de cara al consumidor

Preguntas frecuentes

¿Por qué es importante el prompt en el lip sync?

El prompt ayuda a definir cómo debe actuar el avatar. Úsalo para describir tono, emoción, velocidad al hablar, expresión facial y gestos visibles para acercarte más al resultado que quieres.

¿Qué tipo de imagen de avatar funciona mejor?

Usa una imagen clara en la que el rostro se vea bien. Los retratos frontales, el encuadre limpio y la iluminación estable suelen dar mejores resultados.

¿Qué tipo de audio funciona mejor?

El audio hablado limpio funciona mejor. Mantén el clip corto, evita voces superpuestas y reduce el ruido de fondo siempre que sea posible.