Guía Seedance 2.0: Sistema multimodal de vídeo con IA

Guía Seedance 2.0: Sistema multimodal de vídeo con IA

Qué es Seedance 2.0 y por qué importa

Seedance 2.0, desarrollado por ByteDance, representa un cambio fundamental en la generación de vídeo con IA. A diferencia de modelos anteriores que dependen de un solo prompt de texto o una imagen de referencia, Seedance 2.0 acepta imágenes, vídeos, audio y texto simultáneamente como inputs. Este enfoque multimodal te permite dirigir cada aspecto visual, auditivo y narrativo de tu creación con un nivel de control que antes era imposible en vídeo generativo.

El diferenciador clave es el sistema de referencias. Puedes establecer el estilo visual con una imagen, especificar movimiento y trabajo de cámara con un vídeo, marcar el ritmo con audio y guiar la narrativa con texto. El resultado es una herramienta de nivel profesional que se comporta menos como un generador basado en prompts y más como un plató de cine virtual.

Sin embargo, la misma herramienta usada por diferentes creadores produce resultados muy distintos. ¿La clave? Dominar el movimiento de cámara. La mayoría de usuarios solo describen el contenido de la escena pero ignoran cómo se mueve la cámara. Esta guía de Seedance 2.0 cubre tanto el sistema de referencia multimodal como el vocabulario completo de movimiento de cámara que necesitas para obtener resultados profesionales.

Especificaciones técnicas de Seedance 2.0

Antes de entrar en los flujos de trabajo, estos son los límites que necesitas conocer:

Parámetro Especificación
Inputs de imagenHasta 9 imágenes
Inputs de vídeoHasta 3 vídeos, máx. 15s en total
Inputs de audioHasta 3 archivos MP3, máx. 15s en total
Input de textoPrompts en lenguaje natural
Duración de salida4–15 segundos (seleccionable)
Salida de audioEfectos de sonido y música nativos
Límite total de archivos12 archivos por generación

Consejo práctico: Con un límite de 12 archivos, prioriza los assets que tengan mayor impacto en tu resultado—ya sea un vídeo de referencia para movimiento o una imagen para consistencia de personaje.

El sistema de referencia multimodal

Seedance 2.0 usa un sistema de menciones con @ para especificar cómo cada asset subido contribuye a la generación. Este es el mecanismo que separa el prompting básico de la dirección profesional.

Puntos de entrada

Modo First/Last Frame: Úsalo cuando solo necesites una imagen inicial más un prompt de texto. Simple y efectivo para generación de un solo plano.

Modo Universal Reference: Úsalo para combinaciones multimodales (imágenes + vídeos + audio + texto). Aquí es donde reside el verdadero poder.

La sintaxis @

Después de subir archivos, referencialos en tu prompt usando @ seguido del identificador del archivo:

@Image1 as the first frame, reference @Video1 for camera movement, use @Audio1 for background music

Patrones de referencia

Estos son los patrones de instrucción estándar para indicar a Seedance 2.0 qué extraer de cada archivo:

Caso de uso Patrón de prompt
Establecer primer frame@Image1 as the first frame
Referenciar movimientoReference @Video1 for the fighting choreography
Copiar trabajo de cámaraFollow @Video1's camera movements and transitions
Añadir música/ritmoUse @Audio1 for the background music
Extender un vídeoExtend @Video1 by 5 seconds
Reemplazar personajeReplace the woman in @Video1 with @Image1

Principio clave: Usa lenguaje natural para describir lo que quieres referenciar. Sé explícito sobre qué elemento (movimiento, estilo, cámara, personaje) debe extraerse de qué archivo.

Capacidades principales

1. Calidad base mejorada

Seedance 2.0 ofrece mejoras significativas en la calidad fundamental de generación: precisión física (los objetos caen, colisionan e interactúan según las reglas del mundo real), movimiento fluido con momento y timing adecuados, seguimiento preciso de instrucciones para prompts complejos y estilo visual consistente durante todo el vídeo.

Prompt de ejemplo:

A girl elegantly hanging laundry, finishing one piece and reaching into the basket for another, shaking it out firmly.

El modelo maneja acción continua, física de telas y mecánica corporal natural sin guía explícita.

2. Sistema de referencia multimodal

Esta es la característica definitoria. Puedes referenciar patrones de movimiento de vídeos, efectos visuales y transiciones de plantillas creativas, apariencias de personajes de imágenes, técnicas de cámara de ejemplos cinematográficos y ritmo de audio de pistas musicales. Combínalos en un solo prompt para control directorial completo.

3. Consistencia de personaje y objeto

Los modelos anteriores tenían problemas para mantener la identidad entre frames. Seedance 2.0 resuelve esto con consistencia facial, preservación de detalles de producto (logos, texto, detalles finos), coherencia de escena y bloqueo de estilo que previene la deriva visual durante la generación.

Ejemplo: Referencia de personaje combinada con composición de escena en una sola generación.

Prompt de ejemplo:

Man @Image1 comes home tired from work, walks down the hallway slowing his pace, stops at the front door. Close-up of his face as he takes a deep breath, adjusts his expression from stressed to relaxed. He enters and his daughter and pet dog run to greet him with a hug. The interior is warm and cozy.

4. Replicación de movimiento y cámara

Sube un vídeo de referencia y Seedance 2.0 puede extraer y aplicar coreografía compleja (secuencias de lucha, movimientos de baile), técnicas de cámara (dolly shots, tracking, movimientos de grúa), ritmo de edición (timing de cortes, pacing) y movimientos especiales como zooms Hitchcock, whip pans y planos órbita.

Ejemplo: Replicación de movimiento de un vídeo de referencia aplicada a un personaje generado en una escena de acción.

Prompt de ejemplo:

Reference @Image1 for the man's appearance in @Image2's elevator setting. Fully replicate @Video1's camera movements and the protagonist's facial expressions. Hitchcock zoom when startled, then several orbit shots inside the elevator. Doors open, tracking shot following him out.

5. Replicación de plantillas creativas

Más allá del movimiento, puedes replicar conceptos creativos completos: formatos publicitarios (revelaciones de producto, montajes lifestyle, historias de marca), efectos visuales (sistemas de partículas, morphing, transiciones estilizadas), técnicas cinematográficas (secuencias de apertura, tarjetas de título, revelaciones dramáticas) y estilos de edición (cortes de videoclip, pacing documental, ritmo comercial).

Ejemplo: Plantilla de estilo de animación aplicada para generar nuevos personajes en un formato visual familiar.

Prompt de ejemplo:

Replace the person in @Video1 with the girl in @Image1. Replace the moon goddess CG with an angel referencing @Image2. When the girl crouches, wings grow from her back. Wings sweep past camera for transition. Reference @Video1's camera work and transitions. One continuous shot throughout.

6. Extensión de vídeo

Extiende vídeos existentes manteniendo la coherencia narrativa. Ajusta la duración de generación para que coincida con la longitud de extensión deseada.

Prompt de ejemplo:

Extend @Video1 by 15 seconds. Reference @Image1 and @Image2 for the character. Scene 1: Side shot, character bursts through fence on motorcycle, nearby chickens startled. Scene 2: Spinning stunts on sand, tire close-up then aerial overhead shot. Scene 3: Mountain backdrop, launch off slope, ad copy appears through masking effect.

7. Edición de vídeo

Modifica vídeos existentes sin regenerar desde cero. Las capacidades incluyen reemplazo de personaje (intercambiar una persona por otra manteniendo la acción), adición/eliminación de elementos, transferencia de estilo y cambios narrativos.

Ejemplo: Reemplazo de personaje en un vídeo existente preservando las acciones originales y la escena.

8. Generación sincronizada con audio

Seedance 2.0 genera vídeos con audio nativo y puede sincronizarse con audio de referencia: lip-sync de diálogos en múltiples idiomas, efectos de sonido sincronizados con las acciones en pantalla, música de fondo siguiendo el ritmo visual y actuación de voz con expresión emocional.

Prompt de ejemplo:

Fixed shot. Fisheye lens looking down through circular opening. Reference @Video1's fisheye effect. Make the horse from @Video2 look up at the fisheye lens. Reference @Video1's speaking motion. Background audio references @Video3's sound effects.

9. Edición sincronizada con el beat

Crea contenido estilo videoclip que golpea en los beats. Sube una pista musical como referencia de audio e imágenes o vídeos para sincronizar contra el ritmo.

Prompt de ejemplo:

Images @Image1 through @Image7 cut to the keyframe positions and overall rhythm of @Video1. Characters in frame are more dynamic. Overall style is more dreamlike. Strong visual impact. Add lighting changes between shots.

10. Continuidad en un solo plano

Genera planos largos e ininterrumpidos con movimiento consistente. Esto es crítico para resultados cinematográficos.

Prompt de ejemplo:

Spy thriller style. @Image1 as first frame. Front-facing tracking shot of woman in red coat walking forward. Pedestrians repeatedly block the frame. She reaches a corner, reference @Image2's corner architecture. Fixed shot as woman exits frame. A masked girl lurks at the corner, appearance references @Image3. Camera pans forward. She enters a mansion (@Image4). No cuts. One continuous take.

El sistema de movimiento de cámara

El movimiento de cámara es la variable de mayor impacto en la calidad de vídeo con IA. La misma descripción de escena, combinada con diferentes instrucciones de cámara, produce resultados radicalmente distintos. Dominar este sistema es lo que separa el output amateur de la calidad cinematográfica en Seedance 2.0.

Ejemplo básico: A boy walking through the forest produce un resultado estático y plano. Añadir smooth dolly follow, golden hour lighting transforma la misma escena en un plano cinematográfico.

Nivel 1: Movimientos fundamentales de cámara

Estos son los bloques básicos. Si eres nuevo en video prompting, empieza con Pan, Zoom y Dolly — cubren el 80% de los requisitos básicos.

Movimiento Descripción Caso de uso
PanRotación horizontalMostrar escenas amplias, crear conciencia espacial
TiltRotación verticalRevelar contraste de altura, ir del detalle al todo
ZoomZoom de lente in/outDestacar elementos clave, crear tensión
DollyDesplazamiento en raíl adelante/atrásAcercarse o alejarse del sujeto, intensificar emoción
TruckTraslación lateralSeguir sujeto en movimiento, mantener perspectiva estable
PedestalElevación verticalCambiar altura de visualización
CraneAscenso/descenso dramáticoRevelaciones grandiosas, vistas panorámicas
OrbitMovimiento circularVista 360 grados del sujeto
Arc ShotTrayectoria curvaMovimiento circular parcial alrededor del sujeto
TrackingSeguimiento de objeto en movimientoMantener foco en sujeto en movimiento
StaticPosición fijaEstabilizar encuadre, foco en contenido
PushAvance gradualAcercarse lentamente al sujeto
PullRetroceso gradualRevelar lentamente contexto más amplio

Nivel 2: Modificadores — Añadiendo emoción y estilo

El movimiento de cámara no es solo dirección. Los modificadores añaden velocidad, emoción y restricciones estilísticas que transforman el movimiento mecánico en narrativa.

Modificadores de velocidad

Modificador Efecto Ejemplo
SlowSuspense, nostalgia, sensación líricaSlow pull back from vintage photograph
Fast / RapidTensión, urgencia, ritmo aceleradoFast tracking shot through crowded market
SubtleMovimiento mínimo, mejora inmersiónSubtle tilt up during character monologue
GradualCambio progresivo en el tiempoGradual 10-second crane up over battlefield
SuddenShock, giro, impactoSudden whip pan to reveal the intruder

Modificadores de mood

Modificador Adecuado para Ejemplo
CinematicLook y textura de cine profesionalCinematic arc shot around the hero
AggressiveHorror, acción, secuencias de persecuciónAggressive handheld tracking in chase scene
DreamyFantasía, recuerdos, cuentos de hadasDreamy slow dolly through flower field
IntimateDetalle emocional, relacionesIntimate close-up of intertwined hands
EpicGrandioso, magnífico, imponenteEpic crane up revealing the army
DynamicEnergía, vitalidad, cambioDynamic tracking with rapid zoom bursts

Modificadores de estilo

Modificador Efecto Ejemplo
HandheldSensación documental, autenticidad crudaHandheld tracking shot in war zone
AerialVista aérea, gran escalaAerial shot of city at dawn
Dutch AngleComposición inclinada, inquietudDutch angle tracking in psychological thriller
GimbalSuavidad profesional estabilizadaGimbal follow through narrow alley
POVPerspectiva en primera persona, inmersiónPOV shot running through forest
SteadicamMovimiento de seguimiento suaveSteadicam following dancer backstage

Nivel 3: Movimientos de cámara combinados

Combinar dos o más técnicas de cámara crea efectos visuales complejos. Esta es una habilidad clave para creadores avanzados. Limita las combinaciones a 2–3 movimientos por prompt y conéctalos con "+" o "while."

Combinación Efecto Prompt de ejemplo
Orbit + Zoom InFuerte impacto visual, revelación de sujetoOrbit around the ancient statue while slowly zooming in
Crane Up + PanAtmósfera grandiosa, planos de apertura/cierreCrane up from ground level while panning across the battlefield
Dolly Zoom (Hitchcock)Vértigo, shock psicológicoDolly zoom on the character realizing the truth
Hyperlapse + OrbitCompresión temporal, flujo espacialHyperlapse orbit around the blooming flower over 24 hours
Tracking + Handheld ShakeTensión intensa, secuencias de escapeFast tracking with handheld shake through forest escape

Optimización de prompts: de básico a master

La teoría es útil, pero ver la progresión de prompts básicos a profesionales demuestra el impacto real del dominio del movimiento de cámara.

Caso de estudio: Escena del bosque

Nivel Prompt
BásicoA deer in the forest
PrincipianteA deer in the forest, camera moving forward
IntermedioA majestic deer in misty forest, smooth dolly follow at eye level, soft morning light filtering through trees, cinematic depth of field
MasterA majestic deer slowly turning its head in ancient misty forest, subtle arc shot 90 degrees + gradual zoom in on eyes, ethereal god rays, photorealistic 8K, dreamy atmosphere

Plantilla universal de prompts

Usa esta estructura para cualquier escena. Cada línea corresponde a una capa de control:

[Descripción del sujeto],
[Movimiento de cámara] + [Modificador de velocidad/emoción],
[Descripción de iluminación],
[Keywords de estilo],
[Parámetros técnicos]

Ejemplo completo:

A cyberpunk street vendor selling noodles in the rain,
Slow dolly circle + subtle zoom in,
Neon purple and blue lighting, wet reflections,
Cinematic Blade Runner aesthetic,
8K, photorealistic, shallow depth of field

Aplicaciones creativas

Publicidad y e-commerce

Crea demostraciones de producto con narración sincronizada, planos lifestyle y storytelling de marca. El sistema multimodal te permite referenciar assets de marca existentes mientras generas contenido nuevo. Sube tus imágenes de producto, un vídeo de referencia para el estilo de edición deseado y música de marca para sincronización de audio.

Localización de contenido

Genera adaptaciones de vídeo multi-idioma con lip-sync nativo. Referencia el vídeo original para movimiento mientras generas nuevo diálogo en diferentes idiomas. Esto reduce los costes de localización de presupuestos de re-grabación completos a una sola generación por idioma.

Del storyboard al vídeo

Convierte paneles de storyboard estáticos en secuencias animadas. Sube tus boards como imágenes de referencia y describe el movimiento entre ellos. Cada panel se convierte en un keyframe, y Seedance 2.0 interpola las transiciones.

Creación basada en plantillas

Encuentra un estilo de vídeo que quieras replicar, súbelo como referencia y genera nuevo contenido en ese estilo con tus propios personajes y escenarios. Esto es particularmente efectivo para series de contenido en redes sociales que necesitan consistencia visual entre episodios.

Mejores prácticas

1. Sé explícito con las referencias. Escribe claramente qué archivo es para qué propósito. "Reference @Video1's camera movement" es significativamente más efectivo que simplemente mencionar el vídeo.

2. Prioriza tus uploads. Con un límite de 12 archivos, elige los assets de mayor impacto. Un vídeo de referencia para movimiento típicamente importa más que una cuarta imagen de referencia.

3. Verifica tus menciones @. Con múltiples archivos, verifica que no hayas confundido qué imagen, vídeo o audio corresponde a qué identificador @.

4. Distingue editar vs. referenciar. Deja claro si quieres editar un vídeo existente (modificarlo directamente) o usarlo como referencia (extraer una cualidad para contenido nuevo).

5. Alinea la configuración de duración. Al extender un vídeo por 5 segundos, configura la duración de generación a 5 segundos. Duraciones desalineadas producen resultados inconsistentes.

6. Limita los movimientos combinados a 2–3. Más que eso crea instrucciones conflictivas. Conecta movimientos con "+" o "while" para claridad.

7. Usa terminología precisa de cámara. Evita términos vagos como "move." En su lugar, usa "smooth 3-second dolly forward" con modificadores como "stabilized" o "gimbal shot."

8. Usa lenguaje natural en todo momento. El modelo entiende contexto. Describe lo que quieres como lo harías con un editor humano.

Preguntas frecuentes

¿Por qué mi movimiento de cámara generado con IA no es suave?

Evita palabras vagas como "move." Usa terminología precisa: Smooth 3-second dolly forward. Añade keywords como stabilized o gimbal shot para forzar suavidad.

¿Cómo controlo la velocidad del movimiento de cámara?

Usa descripciones explícitas de tiempo o velocidad: 3-second slow zoom, Rapid 1-second whip pan, Gradual 10-second crane up.

¿Las múltiples instrucciones de cámara entran en conflicto?

Sí. Mantén las combinaciones a 2–3 movimientos máximo, conectados con "+" o "while."

Correcto: Dolly forward + subtle tilt up

Incorrecto: Pan left zoom in track right orbit crane up

¿Seedance 2.0 maneja prompts en inglés y chino?

Sí. Seedance 2.0 funciona bien con prompts en inglés y chino, y los prompts de idioma mixto también pueden producir resultados sólidos.

¿Cuál es la duración máxima de salida?

4–15 segundos por generación. Para contenido más largo, usa la función de extensión de vídeo para encadenar múltiples generaciones.

Referencia rápida de movimiento de cámara

Modificadores de velocidad

Término Efecto Mejor para
SlowMovimiento desaceleradoSuspense, nostalgia, escenas líricas
Fast / RapidMovimiento aceleradoTensión, acción, urgencia
SmoothFluido, movimiento uniformeRomance, elegancia, calma
SubtleMínimo, apenas perceptibleInmersión, matiz emocional
GradualCambio progresivoPaso del tiempo, revelaciones lentas
SuddenCambio abruptoShock, giros, horror

Modificadores de mood

Término Expresión emocional Mejor para
CinematicCalidad de cine profesionalCualquier escena que necesite pulido
AggressiveEnergía violenta, caóticaHorror, acción, persecución
DreamySuave, etéreoFantasía, recuerdos, cuentos de hadas
IntimateCercano, cálido, personalEmoción, relaciones
EpicGrandioso, imponenteBatallas, paisajes, revelaciones
DynamicEnérgico, cambianteDeportes, música, movimiento

Efectos especiales

Término Descripción Mejor para
HyperlapseTime-lapse comprimidoMostrar paso del tiempo rápidamente
Dolly ZoomPush + zoom inversoVértigo, shock psicológico
Whip PanPan ultra-rápidoTransiciones rápidas, energía
Rack FocusCambio de plano focalRedirigir atención del espectador
Time-lapseCompresión temporal extendidaNaturaleza, construcción, cielo

¿Listo para empezar a generar contenido que se posicione?