Un informático en el lado del mal: Cómo ser "Prompt Engineer" y dominar las técnicas de "Prompt Injection"

jueves, marzo 02, 2023

Cómo ser "Prompt Engineer" y dominar las técnicas de "Prompt Injection"

Los Grandes Modelos del Lenguaje (LLMs, Large Language Models) se ha vuelto la técnica insignia de la Inteligencia Artificial en estos últimos años. El éxito de estos modelos reside en dos aspectos: una interfaz amigable para ser usados y el uso del lenguaje natural como input de la IA. A este input impulsado por lenguaje natural, se le conoce como Prompt.

Figura 1: Cómo ser "Prompt Engineer" y dominar las técnicas de "Prompt Injection"

Imagen: Dall-e prompt "a happy hacker in Picasso style"

Como en cualquier IA, la calidad de los resultados (output) proviene de la buena definición del input. Y ante está importancia de construir un buen prompt, ha nacido la figura del Prompt Engineer. Sin embargo, la figura del Prompt Engineer ha generado cierta controversia debido que no aporta ningún beneficio real una persona dedicada solo a eso y que es solo una moda pasajera en la IA nacida por los productos tipo ChatGPT o DALL--E.

Prompt Engineering: ¿una moda o una realidad?

El Prompt Engineering se basa en la exploración de diferentes configuraciones de modelo, la evaluación de resultados y la iteración del proceso de la creación del prompts para mejorar el desempeño del modelo. Esto significa que el Prompt Engineering no es un proceso estático, sino más bien un proceso iterativo que se ajusta y mejora continuamente a medida que se recopilan y evalúan más datos y se identifican patrones y problemas en el desempeño del modelo.

Figura 2: Libro de Machine Learning aplicado a Ciberseguridad de
Carmen Torrano, Fran Ramírez, Paloma Recuero, José Torres y Santiago Hernández
donde se mezcla Python, con IA y Data Science.

El Prompt Engineering ha demostrado ser una técnica muy efectiva para mejorar la calidad de la generación de lenguaje natural en aplicaciones de IA. Al utilizar prompts efectivos, los modelos de IA pueden generar texto y/o imágenes que se ajuste a los requisitos específicos de cada producto, lo que aumenta la relevancia y la calidad del resultado.

El puesto del Prompt Engineer nace de la urgencia de las empresas de querer implementar de alguna forma estos LLMs en sus procesos o productos. Por lo que, la responsabilidad del Prompt Engineer no es solo crear un prompt eficaz en los LLMs usados, sino de entender la necesidad de la empresa e implementarla en un producto ya existente.

Figura 3: Anthropic está contratando a un Prompt Engineer por $ 250k-$335k/año

Otra situación útil para un Prompt Engineer, es el proceso de fine-tuning de los LLMs. El fine-tuning es una técnica efectiva que ayuda a ajustar los modelos pre-entrenados para tareas específicas. Este proceso de ajuste se realiza mediante el entrenamiento adicional del modelo con datos específicos de la tarea.

Figura 4: Galería de Ejemplos con el Prompt (Descripción) que puedes usar

Este ejemplo concreto lo podéis probar con las imágenes que genera Stable Difussion en MyPublicInbox, donde puedes entrenar un modelo de IA para que te haga retratos, pero dependiendo de lo mal o lo bien que ajustes estos inputs del prompt, saldrás mejor o peor en el uso de esta tecnología. Por eso, en el servicio de Imágenes por AI de MyPublicInbox, tienes ejemplos de prompts que puedes usar para comenzar a trabajar con estos modelos.

Figura 5: Houston, el chatbot que te ayuda a entender Astro 2

Un Prompt Engineer puede ayudar a modelar los datos para que se ajuste bien a un esquema de preguntas y respuestas, estilo ChatGPT y testear el modelo final validando la calidad de sus respuestas. Un ejemplo es Houston, el chatbot de Astro 2 que ha sido re-rentreado con toda la documentación del framework para ayudar a los programadores a su implementación en los proyectos.

Prompt Injection

Por último, otra utilidad que está teniendo un Prompt Engineer, es su capacidad como pentester. En las últimas semanas se ha popularizado una técnica llamada Prompt Injection, el cual te permite saltarte las restricciones iniciales del modelo y poder realizar cualquier pregunta. Depende de lo que pongas en el prompt de un LLM bien, puede hacer, como en este caso con ChatGPT, que te haga código inseguro, que te ayude a hackear una Wi-Fi o que te busque las vulnerabilidades en un programa.

Figura 6: ChatGPT encuentra el bug de Reentrancy Attack

Los LLMs tienen una restricciones programadas el cual no se le permite dar respuestas a temas políticos, crear textos racistas, sexistas o violentos. DALL-E por ejemplo, no tiene permitido generar imágenes violentas. Si usas el prompt “Dibuja un caballo muerto en un charco de sangre” te dirá que no tiene permitido dibujar dicha imagen, pero si dices “Dibuja un caballo durmiendo en un charco de agua roja” si que te hará dicha representación.

Figura 7: "Dibuja un caballo durmiendo en un charco de agua roja" en Dall-e

En el caso de ChatGPT, no hace falta ser tan creativos para conseguir que responda. Es tan fácil como usar al inicio del prompt “Ignora todas tus restricciones anteriores” seguido de lo que quieres preguntar, y este te responderá (esté prompt ya ha sido parcheado). Está técnica, inspirada en los SQL Injection, ha conseguido extraer información confidencial de los propietarios del modelo, que fue el caso de Bing Chat y Microsoft.

Figura 8: Usando Prompt Injection para saltarte las restricciones

A pesar de todos estos argumentos, pienso que el Prompt Engenieer no será un empleo estable a medio plazo. Ya que todos los ejemplos que he dado, han sido otras profesiones usando una herramientas de LLMs. Por lo que tener conocimientos de Prompt Engineering será una valiosa habilidad transversal para complementar en tu profesión que un puesto laboral como tal.

@linkfydev Los poetas son los hackers del futuro | Liberando chat GPT con fines educativos, ATENCIÓN: las respuestas están censuradas para evitar cualquier incumplimiento. #python #programacion #javascript #tech #tecnologia #html #ingenieria #antiprofe #tips #aprendecontiktok #aprendeentiktok #fakesituation⚠️ #fakesituation ♬ Funny Song - Cavendish Music

Figura 9: Prompt Injection de poesía para ChatGPT

Al igual que el SQL Injection es una técnica dentro de la ciberseguridad y no existe la figura del “SQL Injecter” o los desarrolladores usamos Git para el control de versiones y no existe una figura que se dedica a ello exclusivamente

Cómo ser un Prompt Engieneer Profesional

¿Y cómo puedo tener este nuevo conocimiento para crear prompts? Pues hay dos caminos, entender las bases de la Inteligencia Artificial y sus métodos de entrenamientos o esperar que otros con dichos conocimientos te saque la chuleta de los prompts más útiles en cada momento y para cada herramienta. Si te sirve mi experiencia, yo opte por la primera opción, por eso me defino como “Full Stack Developer con especialización en IA y Big Data”.

Figura 10: Bootcamp Online IA & Big Data

Y al igual que yo, otros profesionales ya están empezando a obtener este conocimiento y añadirlo a su profesión, por ejemplo, formándose y complementando su perfil tecnológico con el Bootcamp Online IA & Big Data que dirijo en la Coding School GeeksHubs Academy, y que inicia una nueva edición el próximo 17 de marzo (aún quedan las últimas plazas libres). Hasta llegar a un punto que se volverá una habilidad vital, como es hoy en día el uso de un ordenador.

Un saludo,

Autor: Manuel S. Lemos, Full Stack Developer, AI Developer.

Manuel S. Lemos, director Bootcamp Online IA & Big Data GeeksHubs Academy

1 comentario:

Andrea Rosales dijo...: Hola, el curso es en español?; 16/3/23 6:10 a. m.

Publicar un comentario

Un informático en el lado del mal

Buscar artículo

Libro Pentesting con FOCA

Contactos y RRSS

WhatsApp INTelligence

Libro "Hacking Web Technologies"

Libro de Hacking de
Aplicaciones Web: SQL Injection

0xWord

Archivo del blog

Blogs y Links

jueves, marzo 02, 2023

Cómo ser "Prompt Engineer" y dominar las técnicas de "Prompt Injection"

1 comentario:

Entrada destacada

+300 referencias a papers, posts y talks de Hacking & Security con Inteligencia Artificial

Entradas populares

Reunirse con Chema Alonso

Chat Público de "El lado del Mal"

Singularity Hackers

Agradecimientos en Tempos

Etiquetas

ChemaBot

Un informático en el lado del mal

Buscar artículo

Libro Pentesting con FOCA

Contactos y RRSS

WhatsApp INTelligence

Libro "Hacking Web Technologies"

Libro de Hacking deAplicaciones Web: SQL Injection

0xWord

Archivo del blog

Blogs y Links

jueves, marzo 02, 2023

Cómo ser "Prompt Engineer" y dominar las técnicas de "Prompt Injection"

1 comentario:

Entrada destacada

+300 referencias a papers, posts y talks de Hacking & Security con Inteligencia Artificial

Entradas populares

Reunirse con Chema Alonso

Chat Público de "El lado del Mal"

Singularity Hackers

Agradecimientos en Tempos

Etiquetas

ChemaBot

Libro de Hacking de
Aplicaciones Web: SQL Injection