Generar canciones con Inteligencia Artificial (usando tu voz): Humano contra Suno
En la esquina izquierda, con calzón blanco y features afiladas como shurikens, ¡Suno, la máquina que no parpadea! Y en la esquina derecha, con calzón negro y ganas de repartir leña, ¡María, la humana con alma de GAN defectuosa! Humano vs. Máquina... ¿Quién ganará hoy? ¡Hagan sus apuestas!
Hace tiempo venía pensando en esta idea “Humano vs. Máquina”, para poner a prueba alguna herramienta de IA y medirme con ella, a ver quién puede más hoy por hoy. Y quizá repetir el mismo experimento dentro de unos meses, para medir la evolución. Confieso que me ha costado elegir por dónde empezar. Mi primer pensamiento fue para Google NotebookLM y su nueva herramienta para generar vídeos. Pero cuando vi en qué consistía, no me convenció en absoluto y simplemente me eché atrás. Hola, soy María.
Figura 1: Generar canciones con Inteligencia Artificial
usando tu voz: Humano contra Suno
Hace tiempo venía pensando en esta idea “Humano vs. Máquina”, para poner a prueba alguna herramienta de IA y medirme con ella, a ver quién puede más hoy por hoy. Y quizá repetir el mismo experimento dentro de unos meses, para medir la evolución. Confieso que me ha costado elegir por dónde empezar. Mi primer pensamiento fue para Google NotebookLM y su nueva herramienta para generar vídeos. Pero cuando vi en qué consistía, no me convenció en absoluto y simplemente me eché atrás. Hola, soy María.
Música: Humano vs. Máquina
Mi amigo el gran Gerard Fuguet, que como ya sabéis está vendiendo como un poseso su par de libros Hacking Home Devices I y II “que se le va de las manos” como dice el Chacho Migué de Cálico Electrónico, pues me dijo Fuguet que la imagen de boxeo y la idea “humano vs. máquina” le gustaban demasiado como para abandonarlas sin más. Ultimamente estoy generando bastante música, así que... ¿Por qué no? Y aquí me tenéis, dispuesta a medirme el lomo con Suno en combate singular.
Round 1 – Primer asalto – La idea
Cuando escribo una canción, nunca sale de la nada. Si es 100% original, viene de una vivencia curiosa o de una sacudida emocional potente. Por lo demás, la idea para mis canciones suele surgir de un estímulo más terrenal, generalmente vienen de otra canción.
Hoy tendremos un poco de las dos cosas. Lo genuino es que pronto empezarán las vacaciones de verano, lo cual me preocupa porque va a afectar a mis horarios y autonomía para desplazarme a mi estudio en el centro. Y la canción que nos va a dar pie es “Yo no soy esa” de Mari Trini, una balada pop española de 1971, que (aunque tiene “sesgo de antigüedad” ¿verdad Maligno?), retrata bien cómo me siento.
Cuando escribo una canción, nunca sale de la nada. Si es 100% original, viene de una vivencia curiosa o de una sacudida emocional potente. Por lo demás, la idea para mis canciones suele surgir de un estímulo más terrenal, generalmente vienen de otra canción.
Hoy tendremos un poco de las dos cosas. Lo genuino es que pronto empezarán las vacaciones de verano, lo cual me preocupa porque va a afectar a mis horarios y autonomía para desplazarme a mi estudio en el centro. Y la canción que nos va a dar pie es “Yo no soy esa” de Mari Trini, una balada pop española de 1971, que (aunque tiene “sesgo de antigüedad” ¿verdad Maligno?), retrata bien cómo me siento.
Figura 2: “Yo no soy esa” de Mari Trini.
Y el primer asalto (la idea) lo gana... Fácil: yo, el humano. Porque Suno en este momento no puede generar un Prompt por sí mismo, necesita un Prompt escrito por un humano para arrancar. O escrito por ChatGPT pero que se lo haya pedido un humano, ¿no?
Round 2 – Segundo asalto – La letra
Cuando empecé a usar Suno, no se podía escribir la letra: te la escribía como parte del proceso generativo. Si tu prompt tenía el suficiente calado emocional, las letras resultaban francamente decentes... Pero no podías elegir las palabras. Nunca he sido de contemplar juguetes que juegan solos. Como digo en otra de mis canciones: “necesito pilotarlo yo” (hola Cai ;) Si no hubiera podido escribir mis propias letras, casi seguro no habría seguido usando Suno.
Mi letra presenta numerosos defectos, desde que emulo directamente la canción de Mari Trini sin ninguna consideración, hasta que incluyo términos políticamente no correctos (proletaria, cerveza, Primark) e incluso malsonantes (ciberlerda, culo).
Figura 3: Mi borrador para la letra de esta canción, “Chica de Downtown”
Voy a promptear a Suno en modo simple, para que la letra me la genere él. Pero si escribo yo el prompt, podría “barrer para mi casa”, ser imprecisa a propósito para ganarle el asalto.
Así que usaré un par de manos inocentes para generar el prompt, resumiendo mi letra y mi prompt de estilo originales en el máximo 200 caracteres que nos permite Suno.
Perplexity dice:
“Chica urbana, independiente, sarcástica y culta. No encaja en clichés. Vida downtown, humor ácido, swing vintage, descaro, tristeza elegante, ritmo jazzy, ironía, ambiente underground”.
Y ChatGPT:
“Gypsy-jazzy swing con humor ácido y aire vintage; chica urbana, culta y rebelde, rechaza clichés y vive con descaro el downtown. Sad, whispered, shameless, retro, energetic, mono”.
Figura 5: Prompts para Suno en modo simple, generados por Perplexity y ChatGPT
He usado Suno lo suficiente para saber que el prompt de ChatGPT es más entendible para Suno, así que no usaré el de Perplexity. Lo pego en la caja de texto de Suno, añado un criterio más: “en español”, elijo el motor más nuevo: 4.5, y pulso “Create”.
Figura 6: La canción con letra generada por Suno
Puede que te encante y está muy bien. Hay una canción de Miley Cyrus de 2017, Malibú, que dice “I never would've believed you/If three years ago you told me/I'd be here writing this song”. Y yo no te habría creído si hace tres años me hubieras dicho que Suno me estaría escribiendo esta canción ahora, en cuestión de segundos.
Figura 7: Descaro en Downtown
Personalmente la letra me resulta muy obvia. Empieza bastante bien, con algunas imágenes gráficas tangibles (adoquines, saxofón, seda, se cose, hilos, me visto). Pero desde el principio está plagada de términos abstractos que diluyen la energía necesaria para la canción (intención, ficción, devoción, dudas, descaro, rebelión...) Lo que menos me gusta es ese “me pierdo”: significa lo contrario de lo que pretendía.
Si has elegido la letra generada por Suno, es probable que también te guste la música que la acompaña: tenlo en cuenta para tu voto final. Pero ahora trabajaremos con mi letra. Vamos a convertirla en dos pistas de audio, una con música humana y la otra con música generada por Suno. Y las comparamos, ¿vale?
1. Mi voz humana: La pista de audio que he generado yo es vergonzante de todo punto, ya verás. Escúchala que vas a salir corriendo tan lejos que te va a costar volver. Podría haber disimulado acompañándome con el ukelele... Pero tengo mis motivos para ir en audio limpio, a capella y sin filtros. Ahora te lo cuento.
Figura 9: Mi voz natural, subida a Suno como sample
El motivo de grabar esta pista con mi voz natural, más hablada que cantada y sin instrumentación, es porque voy a usarla como sample para ver si tengo suerte y Suno imita mi voz después, en la canción que vamos a generar por IA. Como puedes oír en la pista, he silabeado la canción siguiendo mínimamente la canción original de Mari Trini, mezclándola parcialmente con la melodía de “Bang Bang” de Nancy Sinatra.
La clonación de tu voz en Suno “medio casi” funciona en Suno 3.5 y 4, aunque tiene limitaciones para su almacenaje y reutilización... Pero sobre todo, no siempre imita bien la voz que le das y no siempre queda bien. Depende de que tu voz se adapte al estilo musical que estás prompteando, pero también tiene un alto componente de azar al “tirar los dados”.
2. La canción FINAL de Suno: Para generar esta canción, he añadido el audio de mi voz como sample y he usado el mismo prompt de estilo que les había pedido resumir antes a Perplexity y ChatGPT (¿te acuerdas?) Es un estilo que ya me había funcionado anteriormente para clonar mi voz en otras canciones: una mezcla de elementos swing jazzy vintage, que por suerte en esta ocasión ha vuelto a funcionar.
La clonación de tu voz en Suno “medio casi” funciona en Suno 3.5 y 4, aunque tiene limitaciones para su almacenaje y reutilización... Pero sobre todo, no siempre imita bien la voz que le das y no siempre queda bien. Depende de que tu voz se adapte al estilo musical que estás prompteando, pero también tiene un alto componente de azar al “tirar los dados”.
2. La canción FINAL de Suno: Para generar esta canción, he añadido el audio de mi voz como sample y he usado el mismo prompt de estilo que les había pedido resumir antes a Perplexity y ChatGPT (¿te acuerdas?) Es un estilo que ya me había funcionado anteriormente para clonar mi voz en otras canciones: una mezcla de elementos swing jazzy vintage, que por suerte en esta ocasión ha vuelto a funcionar.
Figura 11: La canción FINAL de Suno, con mi voz clonada
La canción empieza titubeante, con un clon más que perfecto de mi voz natural (digo “más” porque desafina incluso más que yo, es genial). Pero en cuando empieza la instrumentación, mi voz clonada se sitúa como una octava por encima y ¡chan! Magia. De repente canto bien. Escucha porque no tiene desperdicio.
¡Pero hey, espera un momento! No creas que la canción ha salido así a la primera. En absoluto: tengo 42 canciones generadas en este “workspace” (la carpeta de este proyecto en Suno). En las 42 piezas cuento todo: canciones enteras generadas, bloques de reemplazo, finales alternativos, cortes sobrantes, etcétera. Y ya ves que, aún y todo, hay glitches que no he podido solucionar de forma orgánica dentro de Suno. En vez de cerveza dice “cerbrezo”, en vez de ciberlerda dice “ciberlenda”... Tengo reemplazos viables, pero para que quede bien, estos últimos detalles tengo que ajustarlos aquí en local con mi software habitual.
Si escuchas la canción hasta el final, verás que en uno de los extends he vuelto a recibir aplausos virtuales. ¡Qué ilusión! =^_^=. Y el tercer asalto (la música) lo gana... ¿Estáis todos de acuerdo conmigo, verdad? ¡En mi caso es muy evidente! Frente a mis nulas habilidades como cantante humana, y quedando patentes estas capacidades de Suno (capacidades que Miley Cyrus no habría creído hace tres años), la victoria del asalto final es para... ¡¡¡SUNO!!! ¡Gana el robot, yeah! ¡Ya podéis besar su brillante culo metálico!
Figura 12: El vencedor final del combate de hoy es Suno, por KO
Los amigos músicos de mi dr. dr. Maligno me van a matar. La verdad es que este experimento está muy sesgado por la limitación de mis “habilidades musicales” (qué vergüenza diosmío). Pero... ¿Qué pasaría si este mismo experimento, u otro similar, lo llevara a cabo alguien que sí sabe de música? Ui-ui chan chan chan charán chaaaannn (música de Ironside, ¡qué intriga!) Y... ¿Qué pasaría si lo probaras TÚ? Venga va, ¡si te apetece anímate! ¿Qué es lo peor que podría pasar? ¿Que llueva? Oh-oh... Creo que eso ha sido culpa mía =^_^=. Muchas gracias por leerme y escucharme.
¡Saludos buenignos!
Autor: María Gómez Prieto
1 comentario:
¿Extra bonus? Son dos minutos y 38 segundos =^_^= https://drive.google.com/file/d/1UZMs7YE-eEtdgDn4t2CD7O2sk6VR4Z16
Publicar un comentario