IA y Filosofía
La IA está poniendo en valor un nuevo conjunto de habilidades. Pero esta vez, las habilidades se adquieren mejor en un taller de escritura o en un seminario de filosofía.
IA y Filosofía
La inteligencia artificial (IA) tiene vínculos científicos más estrechos con la filosofía que otras ciencias, porque la IA comparte muchos conceptos con la filosofía, como la acción, la conciencia, la epistemología (lo que es razonable decir sobre el mundo) e incluso el libre albedrío. Este artículo trata de la filosofía de la IA, pero también analiza algunos conceptos comunes a la filosofía y la IA desde el punto de vista de la IA.
En la filosofía de X, donde X es una ciencia, los filósofos analizan los conceptos de X y a veces comentan qué conceptos son probablemente coherentes o no. La inteligencia artificial (IA) tiene vínculos científicos más estrechos con la filosofía que otras ciencias, porque la IA comparte muchos conceptos con la filosofía, como la acción, la conciencia, la epistemología (lo que es razonable decir sobre el mundo) e incluso el libre albedrío. Este artículo trata sobre la filosofía de la IA, pero también analiza algunos conceptos comunes a la filosofía y la IA desde el punto de vista de la IA. La filosofía de X a menudo implica aconsejar a los profesionales de X lo que pueden y no pueden hacer.
Invertimos en parte el curso habitual y ofrecemos asesoramiento a los filósofos, especialmente a los filósofos de la mente. El punto de vista de la IA es que las teorías filosóficas solo son útiles para la IA si no excluyen los sistemas artificiales de nivel humano y proporcionan una base para diseñar sistemas con creencias, razonamiento y planificación. La investigación en IA ha puesto especial énfasis en formalizar las acciones disponibles en una situación y las consecuencias de tomar cada una de varias acciones. Para ello, la IA se ha ocupado principalmente de aproximaciones simples a los fenómenos.
Un problema clave tanto para la IA como para la filosofía es la comprensión de los conocimientos y habilidades del sentido común. Nos ocupamos de la noción de la situación informática del sentido común, la situación en la que se encuentra una persona o un programa informático cuando el conocimiento disponible es parcial, tanto en términos de observación como de teoría, y hay que utilizar conceptos mal definidos. Los conceptos que generalmente están mal definidos pueden ser precisos en contextos especializados.
La venganza de las humanidades
Por: Steven Johnson
Como cualquier revolución tecnológica, la IA está poniendo en valor un nuevo conjunto de habilidades, pero esta vez hay algo distinto.
Estamos en medio de un éxodo masivo de estudiantes de inglés o historia, a veces atribuido a los excesos de la teoría cultural, a veces al hecho de que todo el dinero está ahora mismo en informática e ingeniería. Y, sin duda, el éxodo es real. Pero hay que decir que los estudiantes universitarios y de posgrado están sobrevalorando las matemáticas y la programación, justo cuando la tecnología está empezando a exigir un conjunto de habilidades diferente.
El simple hecho es que interactuar con la tecnología más significativa de nuestro tiempo (modelos de lenguaje como GPT-4 y Gemini) está mucho más cerca de interactuar con un humano, en comparación con cómo hemos interactuado históricamente con las máquinas. Si quieres que el modelo haga algo, solo tienes que decirle lo que quieres que haga, en prosa clara y persuasiva. Las personas que dominan la prosa clara y persuasiva tienen una ventaja competitiva en este momento en el sector tecnológico, o realmente en cualquier sector que esté comenzando a adoptar la IA. Las habilidades de comunicación siempre han sido una ventaja, por supuesto, pero gracias a los modelos de lenguaje ahora son una ventaja técnica, como saber C++ o entender cómo mantener un rack de servidores.
Esto es, por supuesto, una variación de la broma de Andrej Karpathy de hace más de un año: «El nuevo lenguaje de programación más popular es el inglés». Pero creo que es más que eso. Las habilidades básicas no se limitan a la ingeniería de comandos directos; no se limitan a encontrar la redacción más eficiente para que el modelo haga lo que quieres. También se basan en preguntas más profundas y matizadas. ¿Cuál es el comportamiento más responsable que se debe cultivar en el modelo y cuál es la mejor manera de implementar esta tecnología en el mundo real para maximizar su impacto positivo? ¿Qué nuevas formas de inteligencia o creatividad podemos detectar en estas extrañas entidades? ¿Cómo dotarlas de una brújula moral o alejarlas de los prejuicios y los estereotipos inexactos? ¿Puede el lenguaje por sí solo generar una teoría sólida de cómo funciona el mundo, o se necesitan reglas más explícitas o información sensorial adicional?
Todas estas preguntas han sido absolutamente centrales en la discusión sobre la IA durante los últimos dos años, pero si lo piensas bien, todas eran preguntas que pertenecían a las humanidades hasta que aparecieron los modelos de lenguaje: ética, filosofía del lenguaje, teoría política, historia de la innovación, etc.
No quiero llevar este argumento demasiado lejos. Parte de mi formación como escritor me ha sido útil en la creación de NotebookLM, a través del diseño de nuestras indicaciones básicas y la «voz» general del producto. Pero Notebook en sí no existiría sin el excepcional talento de ingeniería de nuestro amplio equipo, desde nuestros programadores front-end y back-end hasta las personas que construyeron la enormemente compleja infraestructura de los propios modelos. Quizás algún día sea posible que una persona sin conocimientos de programación como yo pueda crear una aplicación completa con solo describir el conjunto de funciones a un modelo de lenguaje, pero aún no hemos llegado a ese punto. Y, por supuesto, la creación de los modelos en sí seguirá requiriendo, casi con toda seguridad, habilidades que se perfeccionan mejor en programas de ingeniería e informática, no en seminarios de escritura.
Pero creo que es innegable que el auge de la IA ha llevado las habilidades basadas en las humanidades al centro mismo del mundo tecnológico en este momento. En su última presentación de producto antes de su muerte, Steve Jobs habló de Apple como una empresa que reside en la intersección de las artes liberales y la tecnología; literalmente mostró una imagen de señales de tráfico que marcaban ese cruce. Pero la verdad es que en aquel entonces la mayoría de los viajeros en la avenida de las artes liberales eran diseñadores. No había tanta necesidad de filósofos, especialistas en ética o incluso escritores para construir la tecnología de consumo avanzada de esa época. Pero ahora esas habilidades tienen una nueva relevancia.
Hay un ejemplo maravilloso de los tipos de habilidades que ahora son muy apreciadas en la conversación que tuve hace unos días con Dan Shipper para su podcast AI & I (se ve mejor en vídeo para que puedas ver lo que ocurre en la pantalla). Dan me invitó al programa, antes llamado How Do You Use ChatGPT? —para repasar algunas de las nuevas funciones que acabamos de lanzar ayer, además de nuestro despliegue internacional, y para tener una idea general de cómo he integrado NotebookLM en mi flujo de trabajo creativo. Le gusta usar cada episodio para intentar crear algo espontáneamente con el invitado; es muy en directo y sin guion, lo que siempre es un poco estresante cuando trabajas con nuevas funciones (por no hablar de los modelos de lenguaje estocástico). Pero en este caso resultó una colaboración preciosa.
El caso de uso de muestra que llevé al programa era un cuaderno que había llenado en gran parte con transcripciones de entrevistas del proyecto de historia oral de la NASA. El cuaderno tiene unas 300 000 palabras de entrevistas con astronautas, directores de vuelo y otras personas de los programas Apolo y Géminis. (Puede parecer mucho, pero ahora puedes tener hasta 25 millones de palabras de fuentes en un solo cuaderno). También tenía unas cuantas presentaciones de diapositivas con imágenes, ya que NotebookLM ahora admite diapositivas y también tiene una verdadera comprensión de imágenes/gráficos/diagramas. También acabamos sumergiéndonos en mi colección de citas de lectura, que mantengo en un cuaderno aparte. Dan y yo decidimos que intentaríamos utilizar este cuaderno para recopilar ideas para un posible proyecto documental sobre el incendio del Apolo 1 que mató trágicamente a tres astronautas a principios de 1967. Recomiendo ver el vídeo a partir de la marca de los treinta minutos, donde realmente nos sumergimos en el ejercicio. Creo que es probablemente el mejor ejemplo hasta la fecha del tipo de trabajo creativo y conceptual de alto nivel que NotebookLM hace posible, donde el software realmente te ayuda a hacer nuevas conexiones y sintetizar información mucho más fácilmente de lo que hubiera sido posible antes.
Pero lo que también quiero que tengas en cuenta es lo mucho que Dan está impulsando el proceso, sugiriendo una serie de indicaciones que, en última instancia, obtienen resultados sorprendentes, incluso para mí, de NotebookLM.
Yo me estaba metiendo en esto más o menos con la idea de mostrar la capacidad de NotebookLM para extraer y organizar una compleja cadena de hechos a partir de una colección desorganizada de material de origen, como crear una línea de tiempo de todos los acontecimientos asociados con el incendio, o sugerir pasajes clave que pudiera leer para comprender el impacto del incendio. (Todo ello con nuestras nuevas citas en línea, que son bastante sorprendentes por sí mismas). Pero en cierto momento, Dan realmente toma el timón y dice, efectivamente: «Este es un proyecto de Steven Johnson, por lo que tiene que tener alguna conexión científica o tecnológica sorprendente que el lector/espectador no esperaría; pidámosle a NotebookLM que nos ayude a encontrar ese ángulo». Y luego nos lanzamos a correr, de nuevo, en gran medida impulsados por las indicaciones de Dan, lo que nos lleva a lugares bastante sorprendentes, e incluso genera las primeras líneas de un guion al final.
Lo que puedes ver en esta secuencia son dos cosas:
un modelo de lenguaje extraordinariamente capaz que hace cosas con un gran corpus de material de origen que habría sido impensable hace apenas un año, pero igual de importante;
un ser humano muy inteligente que sabe cómo sondear la información de origen y desbloquear las habilidades del modelo de lenguaje para generar los resultados más útiles e interesantes.
La habilidad que Dan muestra aquí consiste básicamente en ser capaz de pensar en este problema: Dado este conjunto de conocimientos, dadas las capacidades y limitaciones de la IA, y dados mis objetivos, ¿cuál es la pregunta o instrucción más eficaz que puedo proponer ahora mismo? No sé si es mejor tener una formación en humanidades o en ingeniería para desarrollar ese talento, pero creo que se ha convertido en un talento enormemente valioso.
La otra cosa que vale la pena señalar en el intercambio, y doy un paso atrás para reflexionar sobre ello en medio del ejercicio, es la gama de inteligencias involucradas en el proyecto. Por un lado, tienes la inteligencia de todos los astronautas y directores de vuelo contenida en las transcripciones de las entrevistas; tienes la inteligencia de todos los autores cuyas citas he recopilado durante las últimas dos décadas de investigación y lectura; tienes la inteligencia de dos humanos que hacen preguntas y dirigen la atención del modelo a la atención hacia diferentes colecciones de fuentes, elaborando indicaciones para generar las ideas más convincentes; y luego tienes el modelo en sí, con su propia inteligencia alienígena capaz de alguna manera de tomar nuestras instrucciones y extraer la información correcta (y explicar su razonamiento) de millones de palabras de texto. Solía describir mis primeras colaboraciones con software semántico como un dúo entre humano y máquina. Pero este tipo de aventuras intelectuales se sienten como un coro.
Esta idea del modelo no como sustituto de la inteligencia humana, sino como herramienta para sintetizar o conectar la inteligencia humana parece estar ganando fuerza en este momento, lo cual es bueno. La artista Holly Herndon presentó un argumento convincente para llamar a la inteligencia artificial «inteligencia colectiva» en una conversación reciente con Ezra Klein. Mi amiga Alison Gopnik lleva mucho tiempo hablando de la IA como una «tecnología cultural», lo que da más peso a la predicción de que las habilidades humanas tendrán cada vez más relevancia en un mundo moldeado por tales tecnologías. En una conversación reciente con Melanie Mitchell en LA Review of Books, Alison argumentó:
Un error muy común es tratar a los LLM como si fueran agentes inteligentes que salen al mundo y hacen cosas. Eso es solo un error de categoría. Una forma mucho mejor de pensar en ellos es como una tecnología que permite a los humanos acceder a la información de muchos otros humanos y utilizar esa información para tomar decisiones. Hemos estado haciendo esto desde que somos humanos. El lenguaje en sí mismo podría considerarse un medio que permite esto. También lo son la escritura e Internet. Todas estas son formas en las que obtenemos información de otras personas. Del mismo modo, los LLM nos brindan una forma muy efectiva de acceder a la información de otros humanos. En lugar de salir, explorar el mundo y sacar conclusiones, como hacen los humanos, los LLM resumen estadísticamente la información que los humanos ponen en la web.
Es importante señalar que estas tecnologías culturales han moldeado y cambiado el funcionamiento de nuestra sociedad. No se trata de un desmentido del tipo «la IA no importa realmente». En muchos sentidos, tener una nueva tecnología cultural como la imprenta ha tenido un impacto mucho mayor que tener un nuevo agente, como una nueva persona, en el mundo.
Otra forma de decirlo —que probablemente adaptaré a un artículo más extenso uno de estos días— es que los modelos de lenguaje no son inteligentes en la forma en que lo son incluso los niños pequeños, pero ya son sobrehumanos en tareas como el resumen, la traducción (tanto lingüística como conceptual) y la asociación. Y cuando aplicas esas habilidades a material de origen cuidadosamente seleccionado y escrito por humanos igualmente, pero de manera diferente, dotados, puede ocurrir la magia.
Nota: Agradecemos a Steven Johnson su colaboración en este artículo.
Gran tema de reflexión. Algunos poyan sin reservas la perspectiva de que la IA es mejor cuando nos centramos en perfeccionar cómo la usamos, y que las habilidades necesarias para esta tarea impresionante se encuentran fuera de STEM. No hay mejor momento para abrazar las artes liberales, entonces. Como se dice en este artículo:
"Gracias a la revolución de la IA, estamos entrando en un período en el que será un gran momento para ser un estudiante de humanidades con interés en la tecnología."
Tienes mucha razón, La IA tiene vínculos científicos más estrechos con la filosofía que otras ciencias, porque la IA comparte muchos conceptos con la filosofía