El primer Sora se lanzó como preview en febrero de 2024 y luego desapareció. Durante dieciocho meses fue el modelo del que todos habían oído hablar y al que casi nadie podía acceder. Sora 2 acabó con eso. Lanzado el 30 de septiembre de 2025, con una app de consumo y la función Cameos que rompió las listas de la App Store, ahora está realmente disponible. Y cambia la conversación sobre para qué sirve un modelo de IA de vídeo.
He pasado las últimas tres semanas pasando a Sora 2 por los prompts que enviamos para trabajo de cliente y por los prompts tontos para los que la app Sora claramente fue construida. El titular: es un modelo notable atrapado dentro de un producto app-first. El modelo es excelente. La forma en que OpenAI lo distribuye te obliga a decidir si estás comprando una herramienta creativa o un competidor de TikTok.
Qué es Sora 2 (y en qué se diferencia de Sora 1)
Sora 2 es el modelo de vídeo de segunda generación de OpenAI. Genera vídeo 1080p con audio sincronizado nativo, soporta escenas multi-shot y está afinado para movimiento con física. Tres deltas concretos frente al preview de 2024: el audio ahora se genera en la misma pasada que el vídeo; las simulaciones físicas (agua, telas, colisiones) son mucho más fiables; y una nueva función, Cameos, te permite insertar una imagen verificada de ti mismo en cualquier escena prompteada.
El modelo se distribuye mediante la app Sora (iOS y web), mediante ChatGPT (en el plan Pro) y mediante la API de OpenAI en un despliegue por niveles. El acceso práctico depende del plan que pagues.
Cómo conseguí acceso
Descargué la app Sora, inicié sesión con mi cuenta OpenAI y obtuve acceso con cuota diaria de inmediato en el nivel gratuito. ChatGPT Plus a 20 $/mes amplió la cuota y desbloqueó clips más largos. Para las pruebas de alto nivel de esta reseña actualicé a ChatGPT Pro a 200 $/mes durante un mes. El acceso API sigue por niveles; mi organización obtuvo API con audio la semana pasada tras verificación de ID.
Los cuatro prompts que usé
Misma metodología que en nuestra reseña de Veo 3, para que puedas comparar directamente. Cada prompt apunta a una fortaleza distinta del modelo.
- Cameo con diálogo. Mi cameo subido pronunciando una frase de 6 palabras en una cafetería, con vapor saliendo de la máquina de espresso.
- Acción con física intensa. Una ola rompiendo contra un espigón rocoso al atardecer, tabla de surf visible en primer plano.
- Narrativa multi-shot. Una secuencia de 3 planos: una persona abriendo una puerta, entrando en una habitación, sentándose en un escritorio. Misma persona en todos los planos.
- Diálogo + acción mezclados. Un personaje corriendo y gritando “espera, no te vayas” por encima del hombro. Movimiento y habla combinados.
Los resultados: 4 ejemplos de salida de Sora 2
Prueba 1. Cameo con diálogo
La función Cameo es realmente inquietante. Tras un vídeo de consentimiento de 20 segundos, Sora 2 produjo clips donde mi cara se movía correctamente con el diálogo, mi pelo se comportaba apropiadamente para el encuadre y la aproximación de mi voz era lo bastante cercana como para que un compañero la reconociera antes de decirle qué era. El vapor de la máquina de espresso se desplazaba de forma realista por el plano.
Lo que me gustó
- El parecido del Cameo fue de calidad producción
- El lip-sync con mi voz coincidió 4 de 5 veces
- El entorno (vapor, luz) reaccionó naturalmente
Lo que no
- El clon de voz era más fino que ElevenLabs
- Los ojos se desviaron en tomas largas
- El flujo de consentimiento Cameo añade un día de espera la primera vez
Prueba 2. Acción con física intensa
Aquí Sora 2 saca ventaja a Veo 3. La ola rompió contra el espigón con patrones de espuma realistas; la espuma se disipó correctamente; la tabla en primer plano respondió al oleaje por debajo. Ninguna de las tomas tenía las pistas típicas de vídeo IA (objetos atravesando otros, espuma apareciendo y desapareciendo en un fotograma). De cinco generaciones, cuatro eran publicables para cliente.
Lo que me gustó
- Mejor simulación de agua y espuma de su clase
- La profundidad primer plano/fondo fue correcta
- Luz y color gradaron coherentemente
Lo que no
- Clips largos (más de 10s) mostraron deriva
- Las rocas se vieron plásticas en 2 de 5 tomas
- Sin control sobre el timing de la ola dentro del clip
Prueba 3. Narrativa multi-shot
El modo storyboard de la app Sora gestionó esto de forma limpia. En tres planos, mi personaje prompteado mantuvo el mismo pelo, el mismo vestuario y una cara reconociblemente la misma persona. Aquí es donde Sora 2 supera a Veo 3 con más claridad: bloqueo de identidad multi-shot. El escritorio del tercer plano fue distinto al que imaginé del prompt, pero el humano se mantuvo consistente.
Prueba 4. Diálogo + acción mezclados
Un personaje corriendo y gritando sobre el hombro es la prueba implacable del audio nativo. Veo 3 a veces pierde la sincronía del audio cuando la cabeza gira. Sora 2 mantuvo la frase alineada con la boca incluso durante el giro sobre el hombro. La calidad de voz era más fina que un VO dedicado, pero el timing fue correcto. Es la prueba que históricamente te forzaba a un paso de post-producción de lip-sync; Sora 2 la convierte en una generación de una sola toma.
La función de la que todo el mundo habla: Cameos
La función Cameos es la razón por la que la app Sora se hizo viral el día del lanzamiento, y merece la atención. El flujo de consentimiento está bien diseñado: subes un vídeo corto, confirmas verbalmente que autorizas su uso y OpenAI lo procesa antes de poder usarlo como cameo. Puedes revocar en cualquier momento, y el cameo es solo tuyo salvo que lo compartas explícitamente.
Los casos de uso prácticos son más amplios que las imágenes meme sugieren. Las caras visibles de marca pueden grabar una vez y aparecer en docenas de variantes de campaña. Los creadores de cursos pueden grabar un segmento y volver a casterse en varias versiones de idioma. Los fundadores pueden generar clips explicativos con su propia cara sin set de estudio.
Las salvedades son las obvias: Cameos vive dentro de la app Sora y el ecosistema OpenAI. No puedes empotrarlo en un producto de terceros ni meterlo en un flujo automatizado sin ingeniería significativa. Para trabajo de pipeline, sigues queriendo una plataforma API-first al lado.
Las partes molestas
200 $/mes por el mejor nivel. ChatGPT Pro es el único camino a los clips más largos, el nivel de calidad más alto y (en algunas regiones) sin marca visible. Para uso ocasional es caro.
API por niveles. El acceso API de Sora 2 se despliega según historial de uso de la organización, verificación de ID y pasos para habilitar audio. Tres semanas tras la aprobación de mi organización, el audio seguía restringido. Planifica el aprovisionamiento alrededor de esto si integras en un producto.
App-first. La mejor experiencia de Sora 2 es la app de consumo. Si quieres salida nivel Sora dentro de un pipeline de producción, gastas más tiempo en código pegamento que en trabajo creativo.
Colisiones de Cameo. Cuando dos cameos aparecen en la misma escena, la deriva de identidad entre ellos es notable. Útil para sketches, problemático para vídeos de marca multi-presentador.
Matemáticas de precio API. La API factura Sora 2 a unos 0,30 $/segundo en el nivel HD y unos 0,50 $/segundo en Sora 2 Pro. Un montaje de cliente de 60 segundos cuesta 18 a 30 $ por intento. Cinco intentos son 90 a 150 $ antes de tener un clip usable.
¿Vale la pena el precio?
Para un creador usando Sora 2 a diario en la app, ChatGPT Plus a 20 $/mes es realmente un chollo. El nivel Pro a 200 $/mes es un gasto de pequeño negocio y la decisión correcta si Sora 2 es tu herramienta creativa principal.
Para una agencia o equipo de producto, las matemáticas son más difíciles. A 0,30 a 0,50 $/segundo, el precio por segundo de la API y los despliegues por niveles hacen la planificación de capacidad impredecible, y el foco app-first significa que las funciones llegan a la app antes que a la API. Un agregador con tarifa plana suele ser el camino de integración más limpio.
Cómo encaja Vuela.ai en un flujo con Sora 2
Sora 2 es el producto de IA de vídeo orientado a consumidor más fuerte del mercado. No es, por diseño, una plataforma de integración. Los trabajos que Vuela.ai gestiona están fuera de la app Sora y fuera de la superficie API actual: clonar un vídeo viral para enviar una versión nueva, traducir vídeo terminado a otros idiomas con lip-sync real y reutilizar un render a través de una docena de relaciones de aspecto.
Vuela.ai junta generación de vídeo de calidad Sora con ese kit más amplio bajo una suscripción plana. Si has llegado aquí porque Sora 2 te ha picado el interés pero quieres un espacio de trabajo que envíe contenido de verdad, Vuela es lo que añades por encima.
El veredicto
Sora 2 es el producto de IA de vídeo más emocionante lanzado en 2025. Como modelo, compite con Veo 3 en calidad y se adelanta en física, duración y vídeo personal (Cameos). Como producto, vive dentro de una app construida por OpenAI que prioriza el uso de consumo sobre la integración en pipelines.
Si quieres jugar, la app Sora es la diversión más fácil que puedes tener con una IA en 2026. Si quieres enviar contenido a volumen, trata a Sora 2 como un modelo dentro de un flujo más amplio, junto a Veo 3 para clips con peso de audio, Kling 3 para secuencias con identidad bloqueada y una plataforma como Vuela.ai para el clonado y traducción que de verdad mueven la aguja.