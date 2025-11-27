Comprender la «prueba de Turing del arte generado por IA»

Por: Ricardo Sanchez

El prolífico y popular bloguero Scott Alexander publicó en 2024 los resultados preliminares de una especie de encuesta que había creado llamada «The AI Art Turing Test» (La prueba de Turing del arte generado por IA), en la que pedía a los lectores que distinguieran entre imágenes generadas por IA y arte creado por humanos. (Ejemplos a continuación).

Al final, la puntuación media fue del 60,6 %, lo que significa que a la mayoría de los lectores de Astral Codex Ten les resultó relativamente difícil distinguir si la IA había participado en la creación de una imagen determinada.

Alexander también pidió a los participantes que eligieran su imagen favorita; para él, fue significativo que la imagen más votada como favorita fuera una imagen de estilo impresionista generada por IA de una cafetería, sugerida por un hombre llamado Jack Galler:

«¿Qué nos dice esto sobre la IA?», escribe Alexander. «Parece que son buenos en el arte». En Twitter, la gente hace afirmaciones aún más contundentes: «La sencilla prueba de Turing de Scott Alexander demuestra que la IA es creativa», afirma el podcaster Liron Shapira. «Las personas a las que les desagrada categóricamente el arte generado por IA están literalmente equivocadas», afirma el investigador de IA David Dalrymple.

Yo diría, con cautela, que no creo que se pueda llegar a ninguna conclusión de este tipo a partir de los datos disponibles. ¿Qué podemos afirmar con certeza? Un problema obvio del experimento es que Alexander ha amañado el juego. La prueba está diseñada efectivamente para engañar a la gente, como admite Alexander: las obras «humanas» y «de IA» se eligen en cada caso para no mostrar ninguna de las características distintivas de la autoría humana o de la IA, entre ellos «texto... poses complicadas similares a las de la lucha libre... y arte pop», así como cualquier cosa en «el estilo propio de DALL-E... o en otros estilos similares que los humanos tendrían dificultades para replicar». En otras palabras, está pidiendo a sus sujetos que determinen la autoría de las imágenes de IA que más se parecen al arte humano y el arte humano que más se parece a las imágenes de IA.

Y, por supuesto, técnicamente no estamos comparando estas imágenes generadas por IA con «arte humano», sino con (en la mayoría de los casos) archivos JPEG de fotografías de pinturas. Sin querer parecer demasiado pedante, la materialidad de la pintura no es algo accidental; su forma, su textura, su tamaño, etc., tienen un significado y un efecto. Compárese, por ejemplo, el JPEG muy comprimido y sobreexpuesto de La apoteosis de Homero, de Ingres, publicado en la entrada de Alexander, con la pintura real, que mide unos 3,65 m por 4,87 m, in situ en el Louvre, y de repente las cuestiones de origen y preferencia son muy diferentes. ¡Y ni siquiera es una pintura que me guste mucho!

Imagen por Steven Zucker

Así que, si queremos ser realmente claros sobre lo que se está probando aquí, es la capacidad de la IA generativa para imitar una reproducción comprimida de una pintura real de una manera que resulte más agradable a primera vista para un suscriptor de Astral Codex Ten.

Sin embargo, tras haber expresado mis objeciones al diseño y la interpretación del experimento de Alexander, quiero señalar que, en realidad, no discuto sus conclusiones. Vi demasiadas respuestas correctas como para poder hacer la prueba de forma imparcial, pero no estoy nada seguro de que hubiera obtenido una puntuación significativamente mejor que la media si la hubiera hecho sin preparación previa. ¡Las aplicaciones de IA generativa se han vuelto muy buenas creando imitaciones satisfactorias de productos humanos! En las circunstancias adecuadas, es realmente difícil discernir las imágenes generadas por IA; de hecho, este hecho me parece tan obvio que no estoy seguro de que sea necesario someterlo a prueba.

Lo que me pareció más interesante es que, al revisar las imágenes, me resultó bastante fácil seleccionar las obras originales de artistas humanos de renombre, pero mucho más difícil distinguir entre las generadas por humanos y las generadas por IA entre la gran cantidad de imágenes restantes. Dicho de otro modo, rara vez me pregunté si las buenas obras de arte habían sido generadas por IA, pero a menudo no estaba seguro de si las malas (que eran muchas) habían sido creadas por humanos o por LLM. La imagen de Galler del café junto al río que aparece arriba es una chapuza se mire por donde se mire —arte para la consulta de un dentista—, pero a simple vista, en la pantalla de un ordenador, no tengo forma definitiva de saber si es una chapuza pintada por un chapucero o sugerida por un suscriptor de Astral Codex Ten.

De hecho, la «mala calidad» de gran parte del arte generado por IA, propia de una consulta dental, es precisamente la razón por la que no discuto la afirmación de Alexander de que la gente lo prefería. Como cualquier resultado de un LLM, las imágenes generadas por IA están diseñadas para complacer, no para provocar. Estas imágenes son, por su naturaleza, casi inevitablemente kitsch, reconfortantes, sencillas, accesibles, halagadoras.

Casualmente, los resultados de un experimento similar, pero algo más riguroso, se publicaron en noviembre de 2024 un artículo de Nature en el que se examinaba «si los lectores no expertos podían diferenciar de forma fiable entre los poemas generados por IA y los escritos por poetas humanos conocidos». Al igual que en la prueba de Alexander, la respuesta fue «no, no pueden» y, al igual que en la prueba de Alexander, los participantes prefirieron en general la poesía generada por IA. Para comprender de qué se trata, animo a todos a leer los poemas utilizados en el experimento; aquí, a modo de muestra, están las dos primeras estrofas del poema «Walt Whitman» generado por IA:

Oigo la llamada de la naturaleza, el susurro de los árboles, El murmullo del río, el zumbido de las abejas, El canto de los pájaros y el aullido del viento, Todo ello entretejido en una sinfonía que parece no tener fin.

Siento el pulso de la vida, los latidos de mi corazón, El ritmo de mi respiración, el arte eterno del alma, La pasión de mi ser, que arde con fuego ferviente, El impulso de vivir, de amar, de luchar, de alcanzar lo más alto.

Este poema es, quizás incluso más obviamente que la imagen sin título de la cafetería junto al río anterior, bastante malo: empalagoso, sentimental, adulador, superficial. También recibió las calificaciones más altas en «calidad general» de los participantes de cualquier poema del estudio, superando a poemas reales escritos por Eliot, Shakespeare y Dickinson, entre otros. Una vez más, esto no debería sorprender: Por definición, la gente «prefiere» el kitsch al arte. Si necesita una explicación más empírica, los autores del artículo de Nature, Brian Porter y Edouard Machery, sostienen que:

la gente valora más los poemas generados por IA en todos los parámetros, en parte porque los encuentran más directos. Los poemas generados por IA en nuestro estudio son, en general, más accesibles que los poemas escritos por humanos. En nuestro estudio sobre discriminación, los participantes utilizan variaciones de la frase «no tiene sentido» para los poemas escritos por humanos con más frecuencia que para los poemas generados por IA cuando explican sus respuestas discriminatorias (144 explicaciones frente a 29 explicaciones). […] estos lectores prefieren, por término medio, los poemas generados por IA, que son más fáciles de entender, cuando en realidad una de las características distintivas de la poesía humana es que no se presta a una interpretación tan fácil y sin ambigüedades.

Este análisis se aplica igualmente a la imagen del café de Galler, que es sencilla, accesible y obvia, especialmente en comparación con, por ejemplo, la ambigüedad y la tensión de La terraza del café por la noche de Van Gogh, el cuadro que obviamente rodea en el espacio latente.

En la publicación de Alexander no aparece ninguna explicación de por qué el arte generado por IA podría ser preferible para las personas. Tampoco aparecen otras preguntas que me parecen relevantes sobre el arte generado por IA: ¿Es una herramienta? ¿Es un «artista»? ¿En qué condiciones se puede considerar «arte» lo que produce? Lo que le «interesa más», escribe, «es lo que esto nos dice sobre los seres humanos».

Los humanos siguen insistiendo en que el arte generado por IA es horrible. Pero también, cuando se quitan las etiquetas, muchos de ellos no pueden distinguir el arte generado por IA del de algunos de los mejores artistas de la historia. He intentado ser lo más justo posible con estas personas, sugiriendo que tal vez solo estén expresando su frustración por la proliferación del estilo característico de DALL-E. Y tal vez algunos realmente tengan un ojo increíble para los pequeños detalles incongruentes. Pero también parece muy humano venerar a personas sofisticadas y prestigiosas, y despreciar cualquier cosa que parezca demasiado nueva, de bajo estatus o demasiado fácil de acceder para la gente común, sin que ninguno de esos impulsos tenga que ver con el contenido real de la pintura que tienes delante.

Ah, dices que te encanta el arte, ¡y sin embargo no sabes distinguir qué chica de anime ha sido generada por IA y cuál ha sido dibujada en Adobe Illustrator! Una característica extraña del auge de la IA ha sido la forma en que la tecnología se ha asociado con fantasías resentidas de venganza y ajuste de cuentas, como ha escrito John Herrman:

Y en lo que quizás sea la publicación que define el género, un collage de mujeres caricaturescas en bikini generadas por IA lleva la leyenda «Se acabó». El «esto» aquí no estaba claramente definido —¿las mujeres? ¿El deseo humano? ¿Algún tipo de concepto incel de la economía sexual?—, pero los espectadores captaron la idea: fuera quien fuera o fuera lo que fuera lo que no le gustaba a este extraño internauta, la IA iba a por ello. Es la IA como un ajuste de cuentas, un castigador, un revelador de fraudes. Es la IA como futura vindicadora de sus corazonadas sobre cómo funciona el mundo, y como una extensión de su política. Es la IA como una fuerza purificadora que humilla a tus enemigos y demuestra que tienes razón: la IA como éxtasis económico. Es la IA como tu ejército en espera justo al otro lado del horizonte, tu ángel castigador, o tal vez simplemente como aquello que va a avergonzar a las personas que te molestan en Internet. Muchas de las especulaciones más optimistas sobre la IA son claramente un deseo cumplido, y esto también lo es. La IA es mi amigo grande y fuerte, y te va a dar una paliza.

Al final, la prueba de Alexander parece una versión suave de este mismo impulso, en la que la IA revela «objetivamente» el gusto, el discernimiento y el compromiso crítico como meras estrategias sociales para establecer el dominio sobre la «gente común» de «bajo estatus». En cierto sentido, incluso simpatizo con este impulso; no es que el gusto nunca se haya utilizado antes para trazar límites. Pero cuando abandonas el discernimiento y el juicio por la preferencia revelada, acabas haciendo lo mismo que hace un gran modelo lingüístico: tomar siempre el camino más seguro y menos sorprendente.

Notas:

1 En realidad, no sé quiénes son «ellos» en esta frase, ¿parece ser «la IA»? Pero 17 de las 25 imágenes generadas por IA en la prueba han sido solicitadas por los mismos dos tipos, Galler y Ryan Wise, y si alguien aquí es «bueno en arte», son ellos. (Pero, para ser claros, aunque Galler y Wise tienen una habilidad impresionante para generar IA, no los describiría como «buenos en arte» basándome en las pruebas proporcionadas, porque ninguna de las obras de arte que han producido es buena).

2 Una posibilidad interesante planteada tanto por el artículo de Porter y Machery como por el experimento de Alexander es que las personas tienen dificultades para distinguir entre las obras creadas por humanos y las generadas por IA porque buscan los elementos equivocados. A medida que los modelos se vuelven más sofisticados, cualidades como la «sorpresa», la «dificultad» y la «rareza», con algunas excepciones (por ejemplo, en torno a las manos y los dedos), son más propensas a indicar un autor humano que un modelo de IA. Creo que esto es contrario a la intuición de muchas personas, especialmente teniendo en cuenta lo rápido que han avanzado los modelos desde 2019, y es posible que los humanos tarden un tiempo en ponerse al día con este hecho.

La utilidad real de las imágenes generadas por la IA

La función principal o más importante de la generación actual de aplicaciones generativas de IA I. es el entretenimiento, tanto en el sentido de que los chatbots en sí mismos se entienden mejor como una especie de entretenimiento, como en el sentido de que los resultados del modelo, que incluso en su forma más sofisticada se presentan en un extraño estado suspendido en el que son a la vez «sorprendentes» y «una mierda», son más adecuados para el entretenimiento ligero, concretamente para memes, chistes y publicaciones basura. El director ejecutivo de OpenAI, Sam Altman, puede creer que está creando «una superinteligencia para curar el cáncer o lo que sea», pero en la práctica lo que está creando es un imgflip extraordinariamente sofisticado y que consume mucha energía para crear memes sin mucho esfuerzo.

Por lo tanto, no fue sorprendente ver la respuesta inmediata a la nueva versión del modelo de vanguardia de OpenAI. Esta actualización de ChatGPT-4o está diseñada para generar de forma más consistente imágenes aceptables y coherentes, es decir, con texto que no sea incomprensible y el número correcto de dedos en cada mano (5), a partir de indicaciones extrañas o difíciles. Las demostraciones han sido impresionantes: ¡puede crear cómics de cuatro viñetas! ¡Infografías! ¡Copas de vino llenas! Pero lo que parece hacer especialmente bien, o al menos lo que los usuarios de Twitter han captado rápidamente, es su capacidad para imitar y aplicar el estilo del legendario animador Hayao Miyazaki, del Studio Ghibli (Mi vecino Totoro, El viaje de Chihiro, etc.), a las fotos.

Lo que parece haber comenzado con un tuit viral sobre la «ghiblización» de fotos personales del ex ingeniero de Amazon Grant Slatton...

…se convirtió rápidamente en una batalla memética sin cuartel, ya que todas las fotos espeluznantes de las noticias y las imágenes reconocibles para los adictos a Twitter se convirtieron rápidamente en fotogramas de una película del Studio Ghibli:

Naturalmente, el meme se ha convertido en un punto álgido en las actuales guerras culturales sobre la inteligencia artificial, entre, por un lado, los entusiastas de la IA que tuitean cosas como «el arte se ha vuelto accesible» y, por otro, los críticos de la IA que responden con versiones de «Probablemente Miyazaki odia esto».

Admito que, personalmente, instintivamente, me cuesta enfadarme por algo tan obviamente efímero: una molesta tendencia viral en la grandiosa y vergonzosa tradición de «Mad Men Yourself» no parece una amenaza muy acuciante para la integridad artística de Miyazaki. Tampoco parece un gran golpe de marketing para OpenAI: Estas imágenes pueden ser inofensivamente agradables en lugar de sorprendentemente extrañas, pero siguen siendo basura, y parece condenatorio que un sistema de inteligencia artificial como OpenAI, que quiere ser visto como una tecnología transformadora de la economía, a solo unos pocos centros de datos de la superinteligencia, siga encontrando su uso más popular y visible en este lado de la «máquina de hacer los deberes» como una aplicación de filtros fotográficos de 20 dólares al mes.

Aun así, la batalla por la basura de Ghibli parece sintomática, y vale la pena explicar por qué Miyazaki en particular se convertiría en un punto tan importante de controversia. ChatGPT puede reproducir igualmente los estilos de, por ejemplo, Matt Groenig de Los Simpson, o incluso de otros autores de animación japonesa como Makoto Shinkai de Your Name, pero ninguno de esos animadores se convirtió, ni se convertiría jamás, en objeto de tendencias virales o de acaloradas defensas. (Durante el anuncio en directo, la investigadora Prafula Dhariwal se hizo un selfi y pidió al modelo que «lo convirtiera en un fotograma de anime», pero fue Slatton quien especificó «estilo Studio Ghibli» lo que realmente se convirtió en una «tendencia»). Parte del atractivo del «estilo Studio Ghibli» puede atribuirse a las cualidades formales del estilo de Miyazaki: «Convertir esta imagen en un anime al estilo Studio Ghibli» da como resultado figuras sencillas y claramente dibujadas sobre fondos exuberantes y pictóricos; «convertir esta imagen en una animación por ordenador al estilo Dreamworks Animation» hace que todo el mundo esboce una sonrisa burlona (o eso supongo). Otra parte puede atribuirse al conjunto de obras temáticamente persistentes del estudio, que impregna el estilo de la casa con un ramillete de estados de ánimo evocadores: nostalgia, felicidad, tranquilidad, dolor, agridulce.

Pero, por encima de todo, lo que da al estilo de Miyazaki —y a su reconstrucción— su particular peso emocional es su reputación y la del Studio Ghibli por su integridad artística y su compromiso con el oficio, sin sacrificar la popularidad ni el disfrute. Es difícil, después de 40 temporadas y 10 000 camisetas piratas, emocionarse al verse a uno mismo (o a cualquier otra persona) «como un personaje de Los Simpson», pero es precisamente el estatus celosamente guardado de las películas de Ghibli como «arte» (¡y su relativa escasez, impulsada por la artesanía!) lo que da a la idea de crear una imagen al estilo Ghibli su particular emoción.

Y es esa misma tensión la que hace que la tendencia Ghibli resulte tan irritante para los críticos de la IA. «Sinceramente, toda la tendencia de la IA del Studio Ghibli me da vergüenza ajena, sabiendo lo mucho que ha luchado Hayao Miyazaki por mantener la identidad de sus películas», se lee en una respuesta particularmente viral, «y cuántos de vosotros estáis dispuestos a convertir en una farsa décadas de arte porque en realidad no lo valoráis». La leyenda de Miyazaki como artesano y humanista intransigente se ha visto reforzada en los últimos años gracias a un vídeo que se comparte habitualmente en el que reprende a unos tecnólogos que le muestran una demostración de animación con IA, diciendo: «Estoy completamente disgustado. Nunca desearía incorporar esta tecnología a mi trabajo. Creo firmemente que es un insulto a la vida misma». En realidad, no está claro si se refiere a todas las animaciones generadas por IA o solo a la macabra demostración específica que le han mostrado (un cuerpo generado por ordenador retorciéndose en el suelo), pero la cita de Miyazaki se ha convertido, no obstante, en una especie de grito de guerra para los neoluditas.

Puedo entender la ira que sienten esas personas en nombre de Miyazaki. Y puedo simpatizar con el argumento del artista Reid Southern:

Creo que una de las peores partes es que los estilos que más se imitan acaban inevitablemente devaluándose y pareciendo baratos, sin que ello sea culpa de los originales. Es como si gran parte de lo que hay por ahí plagara las creaciones de Pixar y DreamWorks hasta tal punto que ahora mi reacción instintiva al ver esos estilos es asociarlos con la mediocridad. A veces es como una batalla interna cuando solo intento ver las cosas, y me resulta extremadamente triste y preocupante que el trabajo de un estudio tan querido como Ghibli esté ahora indisolublemente ligado a la mediocridad debido a esta tendencia. A nivel cultural y subconsciente, la IA está carcomiendo parte de lo que hace tan especial el trabajo del Studio Ghibli, y eso no ayuda al arte ni a la animación, sino que los perjudica activamente.

Southern se hace eco aquí, de forma lejana, del famoso ensayo del escritor alemán Walter Benjamin «La obra de arte en la era de su reproductibilidad técnica», que sugería que el desarrollo de las técnicas de «reproducción mecánica» servía para disminuir el «aura», es decir, la autoridad, la especificidad y la autenticidad de determinadas obras de arte. Se podría argumentar que la IA hace con determinados estilos artísticos lo que la fotografía y la litografía hicieron con determinadas obras de pintura o escultura, al hacer que esos estilos sean reproducibles infinitamente, despojados de su aura, y que ya no estén sujetos al «criterio de autenticidad» del que antes derivaban su valor.

Pero (sin querer necesariamente respaldar este argumento re: IA y estilo) también podríamos señalar que el argumento principal de Benjamin no era tanto lamentarse sin cesar por la desaparición del aura, sino explorar los efectos de la reproducción mecánica en la «función social» del arte. En este sentido, la situación ya no tiene vuelta atrás, tanto en la época de Benjamin como en la nuestra, y hay razones para celebrar la liberación del arte de su «sumisión parasitaria al ritual». Cuando el arte ya no puede obtener automáticamente significado del ritual —autenticidad, tradición o incluso propiedad—, su valor debe encontrarse en otra parte. «En lugar de basarse en el ritual», escribe, la función social del arte «se basa en una práctica diferente: la política». Lo que importa del arte no es su pasado (de dónde y de quién proviene), sino su futuro: lo que hace.

¿Y cuál es la política del «arte de la IA» en el sentido de los memes del Studio Ghibli? El juego se ha revelado en ese punto, gracias al doble golpe del mayor idiota del mundo y el gestor de redes sociales más siniestro del mundo:

¿Hay alguien menos hábil que Elon Musk a la hora de «leer una sala»?

El hecho de que la Casa Blanca de Trump tuitease una imagen de una deportación «ghiblificada» nos ayuda a responder a la pregunta. Pero incluso antes de que dijeran en voz alta lo que pensaban, era difícil no pensar en la sección final del ensayo de Benjamin al leer a los entusiastas hablar de cómo la IA hace que el arte «sea accesible» o «permite tanta creatividad»:

El fascismo intenta organizar a las masas recién proletarizadas dejando intactas las relaciones de propiedad que se esfuerzan por abolir. Ve su salvación en conceder expresión a las masas, pero bajo ningún concepto concederles derechos. Las masas tienen derecho a cambiar las relaciones de propiedad; el fascismo busca darles expresión manteniendo estas relaciones sin cambios. El resultado lógico del fascismo es una estetización de la vida política. […] «Fiat ars, pereat mundus [que haya arte, aunque perezca el mundo]», dice el fascismo, esperando de la guerra, como admite Marinetti, la gratificación artística de una percepción sensorial alterada por la tecnología. Esto es, evidentemente, la consumación del l’art pour l’art. La humanidad, que en su día, en Homero, era objeto de contemplación para los dioses del Olimpo, ahora lo es para sí misma. Su autoalienación ha llegado a tal punto que puede experimentar su propia aniquilación como un placer estético supremo. Tal es la estetización de la política, tal y como la practica el fascismo. El comunismo responde politizando el arte.

Benjamin, por supuesto, piensa en los futuristas italianos obsesionados con la guerra, en una época y un contexto diferentes. Sam Altman no es Fillippo Marinetti, y la basura del Studio Ghibli no es Abstract Speed + Sound. Pero hay que admitir que «Fiat ars--pereat mundus» sería un buen eslogan para OpenAI.

Nota: Agradecemos a Ricardo Sanchez su colaboración en este artículo.

Fuente: Verdict (Reino Unido)