Las herramientas de generación de video por IA de China superan a sus rivales estadounidenses en calidad y adopción

La generación de video mediante inteligencia artificial se ha consolidado como un campo de batalla clave dentro del sector tecnológico, y en esta carrera las compañías chinas han tomado una delantera significativa frente a sus competidores estadounidenses. Esta tecnología, que se está integrando rápidamente en la publicidad, el comercio electrónico y el entretenimiento, encuentra en empresas como ByteDance y Kuaishou a sus nuevos líderes gracias a una ventaja difícil de replicar: el acceso a inmensas bibliotecas de videos cortos para el entrenamiento de sus modelos.

Este escenario marca un punto de divergencia en la competencia global de IA. Mientras laboratorios como OpenAI, Google y Anthropic mantienen el dominio en modelos de lenguaje extenso y programación, sus herramientas de generación de video están quedando rezagadas en calidad y usabilidad, según reportan desarrolladores y múltiples clasificaciones independientes.

Ben Chiang, fundador de la startup de contenido con IA Director AI, es directo al evaluar el panorama. Explicó que la mayoría de los modelos estadounidenses que probaron no ofrecen buenos resultados en video. La empresa de Chiang, dedicada a producir animaciones y series cortas, utiliza principalmente la herramienta Kling, desarrollada por Kuaishou. En función de la tarea y el costo, también alterna con Seedance 2.0 de ByteDance y la herramienta Hailuo de la startup MiniMax. Chiang enfatizó que la decisión se reduce a la calidad de generación y la capacidad del modelo para entender y ejecutar las instrucciones. Añadió que las recientes mejoras en la sincronización de audio y video, así como en la estabilidad de la voz, han hecho que el flujo de trabajo sea mucho más fluido.

Para los creadores, estos avances están transformando sus procesos creativos. George Won, cineasta y editor independiente de IA en Tiflis, Georgia, describió Seedance 2.0 como una liberación de su creatividad. Detalló que la herramienta maneja ángulos de cámara agresivos y movimientos rápidos sin perder los rasgos faciales de los personajes ni arruinar el contraste de iluminación, un problema común en la mayoría de los modelos de IA, que suelen presentar temblores o distorsiones del sujeto en escenas de alta velocidad.

Kling, Seedance 2.0 y HappyHorse 1.0 de Alibaba han obtenido puntuaciones elevadas en el ranking de mejores modelos de video de la plataforma Arena. Esta clasificación se elabora a partir de los votos de usuarios independientes, un método considerado más fiable que los sistemas de evaluación tradicionales, ya que los grandes laboratorios de IA suelen optimizar sus modelos para superar estos últimos, lo que no siempre refleja su rendimiento en condiciones reales. Aunque el modelo Veo 3 de Google es competitivo, en parte por su acceso al material de YouTube, los expertos señalan que impone más restricciones de seguridad y uso a los desarrolladores.

Las herramientas de generación de video por IA de China superan a sus rivales estadounidenses en calidad y adopción

La raíz de este progreso se encuentra en el control de ingentes cantidades de datos de video propietarios. ByteDance y Kuaishou operan algunas de las plataformas de videos cortos más grandes del mundo, lo que les concede un volumen de material de entrenamiento inigualable. Esta ventaja es crucial, sobre todo porque el contenido de video, a diferencia del texto, no puede rastrearse y copiarse masivamente con la misma facilidad. De hecho, la semana pasada Kuaishou anunció que explora la posibilidad de escindir su negocio Kling para una posible salida a bolsa, con el objetivo de capitalizar la rápida expansión de la demanda de video por IA.

El uso de este material no está exento de escrutinio. ByteDance ya se ha enfrentado a amenazas legales por presunta infracción de derechos de autor, al permitir que los usuarios generaran videos con personajes de franquicias como Marvel o South Park sin la debida autorización. La compañía se ha comprometido a reforzar sus medidas de protección de propiedad intelectual.

Más allá de la calidad, múltiples desarrolladores y creadores de contenido coinciden en que las restricciones de contenido más flexibles hacen que los modelos chinos sean más prácticos en el uso diario. Ben Chiang describió que las herramientas estadounidenses suelen mostrar errores constantemente sin ofrecer una explicación clara del motivo. Para los creadores independientes, las plataformas chinas suelen ser más económicas y flexibles que las alternativas occidentales, ofreciendo modelos de suscripción o pago por uso que facilitan la experimentación rápida. Sin embargo, desde febrero, la abrumadora demanda de Seedance 2.0 ha provocado restricciones de acceso y largas esperas para algunos usuarios.

Para los clientes corporativos, la estrategia es diferente. Fuentes cercanas al asunto revelaron que, en el caso de algunos clientes en Estados Unidos, ByteDance exige grandes pagos por adelantado. Se solicita alrededor de dos millones de dólares para obtener acceso al modelo y una asignación de crédito. ByteDance no respondió a las solicitudes de comentarios al respecto. Algunos usuarios sortean estas barreras a través de plataformas de terceros como BeHooked, que reempaquetan estos modelos y ofrecen diferentes esquemas de precios.

El costo de implementación masiva sigue siendo un desafío, ya que generar video consume exponencialmente más tokens que el texto o el audio. Este mismo año, OpenAI suspendió temporalmente el servicio de su modelo Sora por el elevadísimo costo de la capacidad de cómputo. A pesar de ello, para las empresas que construyen sus negocios sobre esta tecnología, el reciente salto en la calidad de generación está abriendo oportunidades comerciales tangibles.

Vincent Yang, CEO de Fireworks, una empresa de infraestructura de video para sitios de comercio electrónico, afirmó que ahora es difícil distinguir si un video fue generado por IA o grabado con personas reales, algo impensable en el pasado, cuando los resultados eran rígidos y no alcanzaban los estándares de marca. La tecnología ya está redefiniendo el sector publicitario, permitiendo a las marcas generar volúmenes de contenido previamente inalcanzables. Yang puso un ejemplo concreto: un minorista les pidió crear cien mil videos para las páginas de sus productos. Con la IA, cada artículo puede tener su propio video, e incluso múltiples versiones personalizadas para diferentes clientes, un costo que de otro modo sería prohibitivo.

Related Posts

OpenHuman: el asistente de escritorio que construye tu memoria antes del primer mensaje

En los últimos días, la comunidad de código abierto ha encontrado un nuevo protagonista. Se trata de OpenHuman, un asistente de escritorio impulsado por inteligencia artificial que llega desde el…

Apple reutiliza chips con defectos en la MacBook Neo, su portátil más asequible

En un contexto donde la mayoría de los fabricantes de dispositivos lidia con el aumento de costos, Apple ha consolidado un negocio floreciente basado en la venta de equipos más…

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

You Missed

OpenHuman: el asistente de escritorio que construye tu memoria antes del primer mensaje

OpenHuman: el asistente de escritorio que construye tu memoria antes del primer mensaje

Las herramientas de generación de video por IA de China superan a sus rivales estadounidenses en calidad y adopción

Las herramientas de generación de video por IA de China superan a sus rivales estadounidenses en calidad y adopción

Apple reutiliza chips con defectos en la MacBook Neo, su portátil más asequible

Apple reutiliza chips con defectos en la MacBook Neo, su portátil más asequible

Lin Erzhou deja Singapur por Zhejiang y redefine la investigación superconductora

Lin Erzhou deja Singapur por Zhejiang y redefine la investigación superconductora

GAC reivindica la fiabilidad de AION en el transporte compartido

GAC reivindica la fiabilidad de AION en el transporte compartido

La fiabilidad de la bisagra retrasa la producción de prueba del iPhone plegable de Apple

La fiabilidad de la bisagra retrasa la producción de prueba del iPhone plegable de Apple