Odyssey revoluciona video con IA interactiva en tiempo real
Odyssey lanza ‘interactive video’: mundos IA que reaccionan al usuario y se transmiten a 30-fps con 40 ms de latencia. Conoce el futuro del video inmersivo hoy.
Cuando Odyssey presentó su investigación pública de interactive video, muchos pensaron de inmediato en el mítico Holodeck de Star Trek. El propio startup describe su avance como “video que puedes ver e interactuar en tiempo real, imaginado íntegramente por IA”.
Aunque todavía luce como un sueño con glitches – “explorar un sueño entrecortado: crudo, inestable, pero innegablemente nuevo”, admite la compañía -, el potencial es difícil de ignorar. Detrás del proyecto está un equipo respaldado por Edwin Catmull, cofundador de Pixar, cuya presencia le da credibilidad cinematográfica a la propuesta.
Cómo funciona el modelo de mundo en tiempo real
La magia ocurre gracias a un world model: una red auto regresiva condicionada por acciones que predice, cuadro a cuadro, el siguiente estado del mundo. “Dado el estado actual, una acción entrante y el historial de estados y acciones, el modelo intenta predecir el próximo cuadro de video”.
Ese enfoque le permite generar nuevos fotogramas cada 40 milisegundos y mantener un flujo de hasta 30 fps sin depender de un motor de videojuegos tradicional. La sesión de prueba ofrece varios entornos —bosque, centro comercial, estacionamiento— que cambian ligeramente cada vez que el usuario pulsa alguna de las teclas W, A, S o D o mueve el joystick. El resultado por ahora no es como tener una experiencia HD, es algo más bien algo borroso.
Potencia técnica y costos de la demo
Para sostener la transmisión, Odyssey emplea clusters de GPUs Nvidia H100 distribuidos entre EE. UU. y Europa. Cada interacción del usuario viaja al servidor, el modelo genera el cuadro y lo devuelve en ese margen de 40 ms; la compañía calcula un costo actual de 1 a 2 US$ por hora-usuario, cifra que espera reducir rápidamente mediante optimizaciones y la evolución del hardware.
Por ahora la demo limita la exploración a dos minutos y medio por sesión. Los objetos carecen de colisiones consistentes y las texturas todavía muestran ruido, como bien lo comentamos antes.
Implicaciones para la industria creativa
Los world models se han convertido en la nueva fiebre del oro para laboratorios de IA como DeepMind, Microsoft o World Labs. Odyssey afirma que su enfoque podría generar “experiencias únicas en tiempo real, a un costo muy inferior al de la producción tradicional”.
Sin embargo, el avance despierta preocupaciones sobre empleos creativos: un estudio de 2024 estimó que más de 100.000 puestos en animación y cine podrían verse alterados por la automatización. Odyssey intenta calmar los ánimos prometiendo colaborar con artistas y ofrecer herramientas para integrar escenas generadas por IA en motores como Unreal o Blender.
¿Una nueva era del storytelling?
Si la fotografía dio paso al cine y el streaming transformó la televisión, la interacción total podría ser el próximo salto. Odyssey proyecta que “todo lo que hoy es video —entretenimiento, publicidad, educación o viajes— evolucionará hacia video interactivo”.
A corto plazo, la demo es más curiosidad técnica que producto de masas: sus mundos se deforman, los objetos aparecen y desaparecen, y la cámara puede girar sin que el usuario toque un botón. Pero la velocidad con que los modelos generativos han mejorado sugiere que un Holodeck doméstico ya no es pura ciencia ficción. Por ahora, basta con abrir el navegador, reservar unos GPUs libres y pulsar play… o, mejor dicho, WASD.
Entradas Relacionadas: