ChatGPT por fin aprendió a crear imágenes que valen la pena
Una mirada al generador de imágenes que está dejando a todos con la boca abierta (y me incluyo)
Si no has escuchado hablar de las imágenes que se pueden crear con ChatGPT estos días, es que has estado de retiro espiritual o escondido bajo una piedra. Literalmente mis feeds de redes sociales están llenos de esas imágenes. Veamos de qué se trata todo esto!
Hablando de emociones, ¿alguna vez has tenido que tragarte tus palabras? Bueno, yo estoy haciendo eso justo ahora, y con una sonrisa en la cara.
Hace tiempo que vengo usando Midjourney para generar imágenes y siempre dije que era la mejor herramienta (aunque no es fácil de usar). Cada vez que alguien me preguntaba por el generador de imágenes de ChatGPT, DALL-E 3, les decía que era tan malo… perdón, inferior, que no valía la pena usarlo. De hecho, ni siquiera pensé en escribir sobre él. Para qué perder el tiempo, ¿verdad?
Y entonces, la semana pasada, OpenAI lanzó la generación de imágenes con ChatGPT 4o y... ¡boom! Me encontré creando imágenes que son tan buenas o mejores que las que he hecho con Midjourney, y con una gran diferencia: todo sucede dentro de la misma conversación.
No estoy hablando de una pequeña mejora. Esto es como pasar de un Nokia con linterna a un iPhone de última generación. El salto en calidad es tan grande que me ha hecho comerme mis palabras y recomendarlo! Bien jugado OpenAI, bien jugado…
Lo que hace especial a esta actualización no es solo la calidad de las imágenes, sino cómo entiende lo que quieres. Le pides texto en la imagen, y lo hace. Le pides mantener el mismo escenario pero con diferentes personajes, y lo hace. Es como tener un diseñador gráfico a tu lado.
BTW, esa imagen de arriba… Sí, la del Nokia con linterna y el iPhone, la acabo de generar en ChatGPT.
¿Super cool, no? Veamos qué podemos hacer con este modelo y por qué deberías empezar a usarlo.
Lo que realmente cambió en ChatGPT
¿Qué hace que este nuevo generador de imágenes sea tan especial? Básicamente, por fin entiende lo que realmente quieres.
Adiós a los jeroglíficos, hola texto legible
¿Alguna vez intentaste crear una imagen con texto usando DALL-E o Midjourney? Estoy seguro que el resultado fue algo como "Wxtbz Ltmnp" en lugar del texto que pediste.
ChatGPT-4o por fin resuelve este problema. Ahora puedes pedirle carteles, letreros, pizarras con planes malvados y el texto será perfectamente legible.
Crea una imagen de un supervillano de caricatura (con capa y pose dramática) parado junto a una pizarra blanca. La pizarra debe mostrar claramente "PLAN MALVADO PARA DOMINAR EL MUNDO:" con tres pasos numerados: "1. Generar imágenes increíbles con ChatGPT", "2. Construir seguidores en redes sociales", "3. Dominación mundial".
La conversación importa
Imagina que acabas de crear la imagen perfecta de un supervillano explicando su plan malvado, pero piensas "estaría mejor con un volcán de fondo". Antes hubieras tenido que escribir TODO el prompt de nuevo, y estoy seguro que obtendrías un villano completamente diferente.
A ChatGPT, simplemente le dices "añade un volcán en erupción al fondo" y ¡voilà! Mismo villano, misma pizarra, mismo plan malvado... solo que ahora con un volcán dramático que refuerza su villanía.
Toma la misma imagen sin hacer cambios en el personaje o la pizarra y pon de fondo un volcán en erupción.
Entiende estilos
Si le pido a a ChatGPT una imagen en el estilo de Roy Lichtenstein, no tengo que explicarle que necesito esos característicos puntos de cómic, colores primarios brillantes y lineas negras gruesas. Ya lo sabe.
Ahora convierte esa imagen en Pop Art al estilo Roy Lichtenstein
Esta comprensión hace que la creación sea mucho más intuitiva y sencilla. Puedes decir cosas como:
"Una escena al estilo de Studio Ghibli"
"Un póster vintage de autos"
Y tendrás justo lo que imaginas, sin tener que describir cada detalle específico del estilo.
Tal vez hayas pensado: “Espera, Germán… cómo que Roy Lichtenstein o Studio Ghibli… qué hay del copyright!”. Prometo que voy a hablar del tema, pero antes…
Jugando con ChatGPT
Lo más divertido de un juguete nuevo es usarlo inmediatamente, ¿no? He tenido poco tiempo, pero aquí les dejo algunos experimentos.
Nota: Esta sección tiene imágenes generadas con IA imitando estilos conocidos.
Crea una imagen a Napoleón Bonaparte como influencer de Instagram en 2025. Usa lentes amarillo neón.
Crea una imagen de los Beatles cruzando la Avenida Emancipación del centro de Lima, en hora punta, como si fuera Abbey Road.
Ahora, qué pasaría ahora si le doy una imagen y le pido que la transforme?
La imágen
Le pasé este selfie que me tomé mientras cocinaba hace algunos años (sí, usé bigote y prometo que ese look regresará algún día).
Aquí los prompts que le di y el resultado:
Convierte esta imagen al estilo de Studio Ghibli.
Ahora con el estilo de Los Simpson
Ahora con el estilo de Pixar
Ahora con el estilo de Scooby Doo original
Creo que el estilo Pixar me subió unos kilos. Dicen que la cámara engorda pero no esperaba esto…
…Studio Ghibli, Los Simpson, Pixar, Scooby Doo. Parece que tenemos un tema de derechos de autor que mencionar.
¿Es legal lo que acabo de hacer? (espero que sí)
¿Puedo realmente pedirle a una IA que imite estos estilos?
La respuesta corta es: depende.
Disclaimer: No soy abogado -tampoco ChatGPT- si tienes alguna duda consulta a uno.
Inspiración vs. copia
Cuando le pides a ChatGPT una imagen "al estilo Los Simpson", no está copiando y pegando escenas de la serie. Lo que hace es imitar la forma de dibujar para crear algo nuevo con ese estilo (en este caso, mi maravillosa foto con bigote).
Es como si le pidieras a un amigo que te dibuje "como si fueras un personaje de Los Simpson". No estaría haciendo nada ilegal si solo está usando la forma de dibujar y los colores típicos. Imitar un estilo, por sí solo, normalmente no se considera un problema legal.
La diferencia está en que mientras un artista aprendió estos estilos viendo la serie y practicando durante años, ChatGPT-4o fue entrenado directamente con varios miles de imágenes de Los Simpson y otros estilos. Y ahí es donde la cosa se ponen un poco borrosa.
¿Qué dice la ley?
La verdad es que las leyes actuales no fueron pensadas para un mundo donde las IAs pueden aprender y copiar estilos artísticos. Es territorio desconocido. (en realidad las leyes siempre van detrás de la tecnología, intentando adaptarse).
Aquí es donde más o menos hay consenso:
Los personajes específicos están protegidos (no puedes generar a Homero Simpson o a Totoro)
Las obras específicas están protegidas (no puedes copiar exactamente una escena de Toy Story)
Los estilos generales normalmente no tienen protección legal (el "estilo manga" o el "estilo cubista")
Donde se vuelve confuso es cuando genera imágenes con estilos muy específicos y reconocibles de estudios particulares (alguien dijo Ghibli?).
Cómo lo veo yo
Para probar y divertirme: Uso cualquier estilo cuando estoy experimentando o aprendiendo (como con mi foto con bigote en diferentes versiones).
En redes sociales: Dejo claro que estas imágenes las hizo una IA imitando ciertos estilos.
Por simple respeto: Reconozco que detrás de estos estilos hay artistas reales que se han pasado años trabajando para crearlos.
La realidad es que las leyes (y nosotros) todavía estamos tratando de entender qué hacer con todo esto. En unos años probablemente tengamos más claro qué se puede y qué no se puede hacer con imágenes generadas por IA. Y ademas qué implica entrenar a estos modelos con esas imágenes.
Mientras tanto, mi sugerencia es que te diviertas experimentando, pero trata de entender dónde están los límites, especialmente si quieres usar estas imágenes fuera de tu computadora.
Antes de terminar, quiero mencionar que la tecnología todavía tiene algunos problemitas.
Algunas limitaciones
Se come los bordes: A veces recorta imágenes largas (como pósters), especialmente en la parte inferior.
Sigue alucinando: A veces se inventa detalles que no le pediste.
Se marea con muchos elementos: Cuando le pides que genere imágenes con más de 10-20 conceptos distintos, empieza a confundirse y mezclar las cosas.
Igual, comparado con lo que teníamos antes, son sólo detalles. Y seguro que OpenAI ya está trabajando en arreglarlos.
Nos vemos!
G
Agradecimiento especial: Tomo unos segundos para contarles que AprendiendoIA pasó los 1000 suscriptores! Empecé este espacio para organizar mis ideas y compartirlas de forma sencilla, y ver que conecta con todos ustedes me deja sin palabras. Gracias, gracias, gracias… por leerme y soportar mi estilo de escritura. 😅
Muy buen blog y me gustó ver tus ejemplos!
Gracias Germán, muy divertido...y con aplicaciones interesantes!