Las ciencias del comportamiento humano, desde la antropología hasta la psicología, tienen una limitante. El registro sistemático de datos, conductas, creencias y demás es una práctica que tiene solo unos pocos siglos (o décadas, para algunas disciplinas). Sin embargo, la civilización más antigua de la historia surgió al menos hace 6,000 años. Los científicos solo pueden suponer, basándose en la documentación encontrada, cómo se comportaron y cómo pensaban las culturas que los precedieron. Ahora, sin embargo, proponen usar la inteligencia artificial (IA) para ayudar con este problema. Un equipo de científicos piensa que es posible utilizar grandes modelos de lenguaje (LLM), como los que hay detrás de agentes como ChatGPT o Gemini AI, para simular las respuestas de una persona que vivió hace miles de años, siempre que cuente con la información correcta para entrenarse.
Los LLM generan agentes conversacionales gracias a técnicas sofisticadas de procesamiento de lenguaje natural y son entrenados previamente con muchísimo texto. Este texto es extraído de bases de datos digitales que incluyen libros, artículos y hasta conversaciones de redes sociales. Ese mismo principio puede aplicarse al pasado. En teoría, un LLM puede aprender de todos los textos disponibles de una civilización para crear el “gemelo digital” de un habitante promedio de hace miles de años.
Un individuo ficticio creado a partir de una IA que aprendió de textos históricos puede reflejar la psicología de las sociedades pasadas, señala un reciente artículo de la revista científica PNAS firmado por Michael E. W. Varnum, Nicolas Baumard, Mohammad Atari y Kurt Gray. La tecnología, con sus claras limitaciones, puede llevar a una comprensión más robusta e interdisciplinaria de la naturaleza humana.
“Los LLM Históricos (HLLM) deberían contener un rastro, por así decirlo, de la mentalidad colectiva de las personas históricas cuyos escritos se utilizaron para construirlos. A partir de fuentes de datos como ficción, obras de teatro, diarios, cartas y textos académicos, se pueden obtener nuevos conocimientos sobre el pensamiento de las poblaciones que ya no viven”, explican los autores Michael E. W. Varnum, Nicolas Baumard, Mohammad Atari y Kurt Gray.
Una tecnología prometedora con grandes retos
Hay antecedentes importantes sobre la IA aplicada a entender el comportamiento humano del pasado. MonadGPT es un LLM que fue entrenado con 11,000 textos históricos en inglés, francés y latín, y habla según las expresiones de esas épocas. Los científicos creen que es posible usar las respuestas de MonadGPT para estudiar formas antiguas del lenguaje y creencias del pasado. Por ejemplo, su concepción de la salud está basada en lo más avanzado del siglo XVII, y su cosmovisión, en lo que se pensaba de la astronomía hace 500 años. Otro LLM similar es XunziALLM, que fue entrenado con textos de la antigua China para generar poesía popular con características de varios siglos atrás.
Los desafíos de la tecnología son casi tan grandes como sus promesas. Los autores del artículo afirman que es imperativo adquirir datos de calidad y, al mismo tiempo, en abundancia, para que la IA pueda ofrecer respuestas relevantes. Los corpus no deben contemplar bases de datos modernas, sino acudir a las fuentes directas para evitar sesgos en la investigación. Además, deberán emplearse otros criterios psicológicos al momento de cuantificar las respuestas. Por otro lado, nunca deberá olvidarse que los textos que se han preservado en el tiempo no reflejan los pensamientos de la población en general, sino de las élites educadas.
“Reconocemos que nuestra propuesta está orientada hacia el futuro y que la creación de HLLM conllevará desafíos sustanciales. Pero creemos que, en última instancia, estos modelos no solo complementarán los enfoques actuales para inferir la mentalidad de las poblaciones pasadas, sino que también pueden proporcionar herramientas de investigación novedosas y flexibles que arrojen conocimientos importantes más allá de lo que es posible con los métodos empíricos tradicionales de las ciencias sociales o los enfoques cualitativos en historia y filología”, concluye el documento.