Era el 7 de mayo de 2025, Metaworld Congress. ¿Sabías que Chema Alonso e Iker Jiménez se marcaron una predicción clavada? Pues sí: el lanzamiento de Veo 3 de Google, dos semanas antes de que saliera. Estábamos allí. Lo que no me esperaba era que esa predicción me dejara rota... Y con el corazón en queue. Hola, soy María.
Figura 1: El día que se me rompió el corazón con el Vídeo GenAI
(y cómo me generé uno nuevo y mejorado)
La predicción
El 21 de mayo de 2025 Google lanzaba Veo 3, un modelo de IA para generar vídeo con todo integrado. Dos semanas clavadas desde que el 7 de mayo en MTW2025 Iker Jiménez dijo: “no dudéis de que en nada, en nada es nada, va a ser con lenguaje” y Chema Alonso añadió: “lo que él está pensando es que el vídeo salga ya hablando en el idioma que él quiere, gesticulando, con banda sonora y con todo, que es una visión que no mucha gente tiene todavía, esa visión de creación”. Y de pronto, Chema Alonso dijo algo que me atravesó desde el hombro hasta el ombligo: “Todavía estamos creando vídeo basado en frames”.
Fue como si me metiera un buffer overflow emocional. ¡Zasca!, justo cuando estaba en mitad de editar un vídeo de Gerard Fuguet sobre IPv6 con mil pistas, efectos, colorines y funkos —el de Marilyn y Manson, sí, ese—... Sin saberlo, mi dr. dr. Maligno me coló un heartbreak.exe.
Puedes ver el momentazo de la charla aquí. Y si te apetece reírte un minuto, también he montado un vídeo corto gomaespumoso con IA recreando ese instante. Por suerte, en ese momento no estaba sola. Tenía conmigo en la butaca de al lado al mismísimo Gerard Fuguet, con su energía amigable y tranquila. Me agarré a su brazo por inercia, como para resistir mejor el impacto.
El timeline del infierno
El vídeo que hice para el artículo de Mr. Fuguet era puro timeline infernal: capas, efectos, sincronización fina, edición quirúrgica... Y me lo estaba pasando pipa montándolo. Pero tras la charla, me vino el bajón. ¿Y si ya no hace falta saber editar así? ¿Y si la IA lo puede hacer mejor y en menos tiempo? ¿Y si lo mío ya más que vintage es... Rancio?
Mientras me comía esos "¿y si?", subí a Spotify una canción que salió de ese runrún mental. Se llama “Espero que la IA”, y nació de una conversación improvisada en el chat público de El lado del mal.
¿De verdad estaba a punto de ceder los controles? ¿Tenía mi timeline del infierno los días contados? ¿En serio se acercaba el momento de despedirme de mi vieja tecnología?
Figura 6: “Espero que la IA”
Aún no tenía respuestas. Solo una certeza. Sabía que si dr. dr. Maligno no hubiera pronunciado aquella frase en La Nave, “Todavía estamos creando vídeo basado en frames”, esta canción jamás habría existido.
El sueño de Fuguet
Desde su lanzamiento en mayo, me he estado resistiendo a usar Veo 3. Sí, lo confieso: lo he aplazado, igual que otros proyectos. Me da miedo. Miedo a ceder los controles. Miedo a que el resultado me “vuele la cabeza” y no sepa identificar déficit en calidad o consistencia. Miedo a conformarme, a que salga mal, a que salga bien. Miedo a salir del cascarón. Y entonces llegó el pie perfecto para probar Veo 3. Una noche, Gerard soñó con robots. Esa misma mañana, Chema Alonso anunciaba en el blog que su charla de Vigo iba a ir justo de eso: sueños de robots.
Figura 7: El sueño de Fuguet, contado por él mismo
Escribí el guión en ChatGPT, optimicé los prompts, generé los clips con Veo 3 a través de la app de Gemini y Google Flow, grabé mi voz, adapté música de MK2 y edité todo en Premiere. ¿El resultado? Aquí lo tienes, fíjate bien en los defectos:
Figura 8: Vídeo del sueño de Fuguet
En cosas de IA, en cuanto te enfrentas a algo nuevo y empezas a tirar del hilo, te das cuenta de todo lo que hay y puede ser un tanto apabullante.
Si buscas resultado inmediato, ya hay agentes de diseño como Lovart, que echa mano de herramientas del mercado asociadas (Flux, Veo 3, Runway...) para coordinarlas y generar tu producto completo (vídeos, campañas, websites, imagen de marca...). Este tipo de agentes son muy cómodos, pero son de pago y tu tipo de suscripción limita el número de operaciones que puedes hacer con cada herramienta. Es como comprar una ensalada preparada: tienes justo lo que necesitas, pero en proporción pagas más que si compraras cada ingrediente por separado.
Si no usas un agente, los límites de cada herramienta serán más amplios, pero tendrás que pagar suscripción para cada herramienta. Equivale a comprar una lechuga entera, un kilo de tomates, una lata de aceitunas, medio kilo de espárragos... Más barato en proporción, pero hay que currar. Eso sí: sin agente, la responsabilidad de elegir la herramienta correcta para cada operación recae sobre ti. ¿No pretenderás colgar un cuadro con un estropajo, no? Pues eso. Ante la duda, pregúntale a Perplexity ^_^
Figura 9: Si no usas un agente, la resposabilidad de elegir la herramienta correcta
recae sobre ti. Para generar vídeo con Veo 3 he usado Google Flow.
Hoy por hoy (esto cambia rápido), puedes generar clips de vídeo con Google Veo 3 desde varias plataformas, tanto internas como externas. Entre otras:
- app de Gemini: Para un resultado rápido y correcto.
- Flow: También de Google, para mayor calidad y control: está diseñada específicamente para optimizar tus prompts dentro del entorno de Gemini.
¿Oyes eso? Es mi corazón nuevo y mejorado
Han pasado casi tres meses desde que mi dr. dr. Maligno me rompió el corazón en La Nave con su frase como una katana: “Todavía estamos creando vídeo basado en frames”. ¿Y ahora? Supongo que te preguntarás dónde está mi corazón nuevo y mejorado... ¿Crees que me refiero a que con IA puedo hacer vídeos como churros, solo chasqueando los dedos?
Pues no. Como ves, no he conseguido generar un vídeo perfecto del sueño de Fuguet. Y el material que tengo me ha llevado trabajo, no lo he generado en un par de clics. Para nada. De hecho, tengo más preguntas que respuestas. Y eso es lo bonito. Es el alivio a todos mis miedos, a todos mis “¿y si?”
Mi corazón nuevo y mejorado no tiene que ver con que ahora con IA pueda hacer vídeos mejor, ni más rápido, ni con menos esfuerzo. No. No tengo vídeos perfectos, ni soluciones definitivas. Lo que tengo es la certeza de que estoy en beta. Que vuelvo a no tener ni idea. Y eso me emociona. Mi nuevo corazón es que estoy perdida. Y sonrío... Porque vuelvo a tener 14 años. Vuelvo a ser la niña del ratón roto con todo por aprender.
Ya sabes dónde encontrarnos a todos, en mi buzón público y en el chat público de El lado del mal en MyPublicInbox... Y —si te animas— ¡edita algo tú también! Aunque sea con un ratón de bola sobre el muslo =^_^=
¡Extra bonus! ¿Qué pasó con el audio en el sueño de Fuguet? Te lo cuento en 3 minutos, https://drive.google.com/file/d/1idJ4eW_vU8MxbsNeM1KKi28tSLD035mC
ResponderEliminar