Filtración de Google Veo 4 apunta a un video multicámara con audio nativo

Filtración de Google Veo 4 apunta a un video multicámara con audio nativo

A pocas horas del inicio de la conferencia Google I/O, una filtración masiva ha sacado a la luz lo que podría ser Veo 4, o posiblemente Gemini Omni, un nuevo sistema de inteligencia artificial para generación de video. Las revelaciones sugieren un salto evolutivo que va más allá de producir clips cortos: la máquina estaría aprendiendo a narrar con lógica de director.

En los días previos, un video hiperrealista de un profesor escribiendo fórmulas en una pizarra se volvió viral, sirviendo como anticipo. Ahora, los indicios apuntan a que la tecnología puede construir escenas completas desde múltiples perspectivas, alternando entre planos con una fluidez que mantiene la coherencia espacial y temporal.

Filtración de Google Veo 4 apunta a un video multicámara con audio nativo

El modelo integraría de forma nativa una capa de audio sincronizado, capaz de manejar diálogos, sonidos ambientales y música contextual generada automáticamente según la situación. Los fragmentos de video alcanzarían hasta 9 segundos de duración con una resolución de 720p.

Filtración de Google Veo 4 apunta a un video multicámara con audio nativo

Aunque ciertos ejemplos filtrados aún muestran problemas de continuidad, la capacidad de sincronizar múltiples ángulos de cámara de forma totalmente armónica es lo que realmente ha sacudido a la comunidad. La filtración, proveniente del analista Pankaj Kumar, sugiere que Google podría generar clips de 15 segundos con relativa facilidad, pero la actual escasez de potencia de cómputo obliga a la compañía a centrarse en la eficiencia.

Filtración de Google Veo 4 apunta a un video multicámara con audio nativo

Habrá que esperar al evento I/O para confirmar si el anuncio oficial corresponde a Veo 4 o a Gemini Omni.

Filtración de Google Veo 4 apunta a un video multicámara con audio nativo

La irrupción del multicámara representa un cambio de paradigma. Hace un año, cuando Sora de OpenAI asombró al mundo, los videos generados eran esencialmente planos secuencia continuos, sin cortes reales. La inteligencia artificial no podía recrear el mismo instante desde diferentes ángulos manteniendo la consistencia de los objetos, los colores y las posiciones. La filtración de Veo 4 indica que este modelo ha interiorizado la lógica de la dirección cinematográfica, permitiendo que el sistema actúe como un narrador con sentido espacial y no como un simple pintor de fotogramas.

Filtración de Google Veo 4 apunta a un video multicámara con audio nativo

El audio completa el rompecabezas. Aunque Veo 3 ya ofrecía generación de audio nativo con pasos y conversaciones, el nuevo modelo promete una calidad sonora más realista y la adición de bandas sonoras que se adaptan al contexto de la imagen.

Filtración de Google Veo 4 apunta a un video multicámara con audio nativo

Los primeros usuarios en Reddit que probaron la versión anterior recibieron con entusiasmo aquel avance, pero el nuevo salto aspira a dejar atrás la sensación de artificialidad en las voces y efectos.

Filtración de Google Veo 4 apunta a un video multicámara con audio nativo

La revelación de Veo 4 ocurre sobre las cenizas de su predecesor simbólico. El 26 de abril, la aplicación Sora de OpenAI cesó sus operaciones, víctima de unos costos de inferencia insostenibles que la industria estimaba entre 1 y 15 millones de dólares diarios, con una base de usuarios en declive y una monetización irrisoria que apenas cubría una fracción de la factura de computación.

Filtración de Google Veo 4 apunta a un video multicámara con audio nativo

La cuenta oficial de Sora se despidió el 24 de marzo, y la API se cerrará por completo el 24 de septiembre.

Filtración de Google Veo 4 apunta a un video multicámara con audio nativo

Google, mientras tanto, no se presenta en I/O solo con video. La misma oleada de filtraciones reveló que la compañía planea lanzar múltiples modelos Gemini, incluyendo Gemini 3 Flash, la serie completa 3.1 y a Lyria 3 Pro, enfocada en audio de alta fidelidad.

Filtración de Google Veo 4 apunta a un video multicámara con audio nativo

El documento interno más revelador indica que el modelo Omni contará con versiones Agent especializadas para todos los productos principales, una señal de que la hoja de ruta busca integrar video, audio y marcos de acción autónoma en una sola plataforma.

Filtración de Google Veo 4 apunta a un video multicámara con audio nativo

Related Posts

Satélite pionero de computación óptica espacial iniciará su desarrollo en Shanghái

El 17 de mayo, en el marco del Foro de Innovación Pujiang celebrado en Shanghái, se llevó a cabo un encuentro sobre tecnologías disruptivas de computación espacial y su integración…

Cientos de satélites Qianfan ya orbitan la Tierra tras el noveno lanzamiento exitoso desde Hainan

En un nuevo avance para la infraestructura espacial china, el conglomerado de satélites Qianfan sumó esta semana una flotilla adicional a su creciente red en órbita baja. El lanzamiento se…

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

You Missed

Satélite pionero de computación óptica espacial iniciará su desarrollo en Shanghái

Satélite pionero de computación óptica espacial iniciará su desarrollo en Shanghái

Cientos de satélites Qianfan ya orbitan la Tierra tras el noveno lanzamiento exitoso desde Hainan

Cientos de satélites Qianfan ya orbitan la Tierra tras el noveno lanzamiento exitoso desde Hainan

iSpace completa con éxito las pruebas de impacto en el aterrizaje del cohete reutilizable Hyperbola-3

iSpace completa con éxito las pruebas de impacto en el aterrizaje del cohete reutilizable Hyperbola-3

OPPO confirma el lanzamiento del Reno16 y Reno16 Pro para el 25 de mayo con baterías gigantes y carga inalámbrica

OPPO confirma el lanzamiento del Reno16 y Reno16 Pro para el 25 de mayo con baterías gigantes y carga inalámbrica

iPhone 17 recorta precios hasta 1000 yuanes y sacude el mercado de Android

iPhone 17 recorta precios hasta 1000 yuanes y sacude el mercado de Android

AppLovin El CEO invisible revela las claves de su imperio publicitario

AppLovin El CEO invisible revela las claves de su imperio publicitario