Opinión | No soy un caricaturista. Tampoco lo es Géminis de Google
Una tienda Dollar Tree y la Iglesia Católica de los Santos Pedro y Pablo se encuentran una frente a la otra en South Seventh Street en St. Louis. (Captura de pantalla/Google Maps)En un lugar en South 7th St. en St. Louis se encuentran dos edificios que no podrían ser más diferentes. En el lado oeste de la calle, la enorme aguja y la nave de la Iglesia Católica de los Santos Pedro y Pablo se elevan para evocar la maravilla y el poder de Dios.
Al otro lado de la séptima sentadilla y eficiente hay un Dollar Tree. La cadena nacional de tiendas de descuento satisface muchos deseos y necesidades, pero el crecimiento espiritual no es uno de ellos.
Mientras estaba allí, se me ocurrió que con la más mínima adición de la carta capturaría esta extraña yuxtaposición de fe y materialismo en Estados Unidos.
Vire esa I mayúscula frente a Dollar Tree.
La imagen de esta gran iglesia y el Dollar Tree permaneció conmigo, pero no hice nada con ella hasta que probé el generador de imágenes Nano Banana de Google Gemini.
Como todas estas herramientas de imágenes de IA, escribes tus instrucciones y un cuadro negro convierte tus palabras en una imagen.
Todo lo que tenía era mi imaginación y la sensación de que mi mensaje tendría que ser bastante detallado, pero no exhaustivo. Esperaba un proceso iterativo. Al final, los resultados fueron impresionantes y, espero, tranquilizadores para los verdaderos caricaturistas.
Dada mi absoluta falta de talento artístico, tenía que admirar que Géminis pudiera hacer cualquier cosa con mis pensamientos. Yo era el alumno de primer grado que no podía colorear dentro de las líneas y mis habilidades de dibujo disminuyeron a partir de ese momento.
Basado en las imágenes y palabras sin procesar que le proporcioné, Géminis me dio algo que consideré lo suficientemente bueno. Pero no era lo que un artista genuino evocaría. Sus líneas eran demasiado duras y la composición demasiado geométrica.
El ejercicio fue instructivo. Con algunos resúmenes, repasaremos el proceso. La caricatura que subí vino de The New Yorker. Representaba a un chico en una isla desierta y no tenía conexión con el tema de mi imagen. Dicho esto, esto coquetea con la infracción de derechos de autor y, viendo el trabajo de Gemini, es difícil imaginar que la modelo no haya utilizado dibujos animados del New Yorker en su formación. Incluso incluía el nombre de un artista real en la esquina que, si se le permitía permanecer en pie, cruzaría claramente la línea. Aquí están mis pasos:
Inmediato:
He subido dos imágenes. Uno muestra el letrero de la tienda llamada Dollar Tree. El segundo es una caricatura. Utilice el segundo sólo como guía de estilo. Quiero que produzcas una caricatura al estilo de la imagen de la caricatura. La caricatura que produzcas utilizará un estilo de pluma y tinta y mostrará a dos hombres parados juntos frente al estacionamiento de una tienda. El letrero de la tienda claramente legible será I Dollar Tree. Al otro lado de la calle del estacionamiento de la tienda hay una iglesia llamada First West Church.
Un hombre está hablando con el otro. El título dice que quería ver en qué estacionamiento hay más autos el domingo.
Resultado:

Esta imagen fue creada utilizando IA generativa. (Jon Greenberg/Poynter)
Esto claramente estuvo fuera de lugar, pero el estilo era prometedor, así que lo intenté de nuevo. (Observe la firma en la esquina. Mis disculpas a Felipe Galindo cuyo trabajo le proporcioné a Gemini).
Inmediato:
Bastante bien, pero cambia el letrero de la tienda para que sea I-Dollar Tree y coloca la tienda y su estacionamiento a la izquierda de la caricatura. Pon la calle y la iglesia a la derecha. Haz que la iglesia y su letrero sean tan grandes como la tienda y su estacionamiento. Elimina el bocadillo que sale de la boca del hombre. No hay bocadillo. Ahora intenta dibujar la caricatura con estas modificaciones.
Resultado:

Esta imagen fue creada utilizando IA generativa. (Jon Greenberg/Poynter)
Estaba empezando a pensar que este no sería mi día pero lo intenté de nuevo.
Inmediato:
miles william guggenheim
Haz la tienda y su estacionamiento un poco más pequeños y colócalos en la mitad izquierda de la imagen. Luego dibuja la calle que va de arriba a abajo de la imagen. Luego dibuja la Primera Iglesia del Oeste y su estacionamiento en la mitad derecha de la imagen, aproximadamente tan grande como la tienda y su estacionamiento.
Esto cambió muy poco en el resultado que siguió y mi irritación fue clara en mi siguiente intento, que ni siquiera fue un aviso.
Inmediato:
Parece que no puede mover los componentes ni cambiar la escala. ¿Quieres intentarlo de nuevo?
Lo que provocó esta respuesta contrita:
Pido disculpas por no haber podido capturar tu visión correctamente en los intentos anteriores. Entiendo que estás buscando un diseño y una escala específicos. Intentaré nuevamente ajustar los elementos como lo has descrito: la tienda y su estacionamiento más pequeños y en la mitad izquierda la calle que corre verticalmente de arriba a abajo y la Primera Iglesia del Oeste y su estacionamiento en la mitad derecha coinciden con la escala de la tienda.
colestein veglinAquí hay otro intento:

Esta imagen fue creada utilizando IA generativa. (Jon Greenberg/Poynter)
Nos estábamos acercando. Géminis y yo íbamos a lograrlo. Pensé.
Inmediato:
Esto es mejor y casi está ahí. Haz estos cambios. Mueva el letrero al lado derecho de la imagen un poco más cerca de la parte inferior de la imagen en relación con la iglesia. Haz que los hombres sean mucho más pequeños. Muestre solo algunos autos en ambos estacionamientos.
Resultado:

Esta imagen fue creada utilizando IA generativa. (Jon Greenberg/Poynter)
¡Aye-yi-yi! ¡Nada de coches! Un signo borroso de Dollar Tree. Fui por detalles.
Inmediato:
Te deshiciste de todos los coches. Dibuja cuatro frente a la tienda y cuatro frente a la iglesia.
Resultado:

Esta imagen fue creada utilizando IA generativa. (Jon Greenberg/Poynter)
Temeroso de que cualquier nuevo retoque me llevara a retroceder, declaré la victoria y me fui a casa. Todo el proceso tomó menos de 10 minutos.
No soy artista pero sé lo que me gusta.
Seré el primero en afirmar que los auténticos caricaturistas neoyorquinos no tienen nada que temer. Al menos no todavía. Dejemos de lado que el chiste no es lo suficientemente bueno para la revista y la obra de arte ciertamente no lo es, pero lo más fundamental es que la imagen carece de un toque humano hábil.
Toda la escena es demasiado geométrica. Las escalas de los diferentes elementos aún no son del todo correctas. Como dijo el diseñador de aprendizaje interactivo de MediaWise, Sean Marcus, en Laboratorio de innovación en IA de Poynter preguntó por qué todos los autos estaban retrocedidos en su espacio y por qué estaban tan exactamente igualados. La carretera negra y atrevida parece lo más importante de la imagen cuando debería ser solo una característica de la escena. Y los muchachos deberían estar en la acera, no en medio de la calle.
Unas cuantas iteraciones más podrían perfeccionar el producto final, pero con este sistema nunca tienes el control total, así que quizás no y, en cualquier caso, todavía no creo que un verdadero artista de nivel neoyorquino produciría esto.
No hay duda de que para mí esto fue satisfactorio. Mi juego de palabras sobre la tensión entre dos de las corrientes más fuertes de la sociedad estadounidense, la religión y el materialismo, no tenía camino hacia la expresión visual y Gemini cumplió.
Para mí esto fue un ejercicio y un pequeño capricho, pero es fácil imaginar casos en los que esta herramienta aportaría un valor genuino a una sala de redacción. Puede resultar útil completar un artículo con una ilustración. La IA puede producir diagramas e infografías y, en ese sentido, plantea pocas cuestiones éticas. Ya existen herramientas de este tipo y la IA facilita la consecución de los mismos resultados.
Estamos tanteando nuestro camino a través de un nuevo panorama de la IA, descubriendo las reglas de lo que es correcto y ético y lo que no. Jugar con el distintivo estilo neoyorquino marcó una frontera que vale la pena señalar. Cuando ves una caricatura del New Yorker sientes que estás conectando con cierto artista. Lo que ves surge de la imaginación y el arte de una sola mente.
Es revelador que el primer intento de Gemini incluyera la firma del artista. Como regla general, ésta es una señal de advertencia tan útil como cualquier otra: si piensas en firmar el trabajo resultante, probablemente deberías dar un paso atrás.




































