Introducción

La relación entre tecnología e historiografía es tan antigua como la propia escritura, pero nunca antes los historiadores se habían enfrentado a un desafío tan vertiginoso como el propuesto por la inteligencia artificial (IA). Si en las décadas de 1980 y 1990 la digitalización de archivos y el surgimiento de las bases de datos electrónicas ya anunciaban un "giro digital" (GULDI; ARMITAGE, 2014), el siglo XXI trajo consigo una revolución cualitativa: algoritmos capaces no solo de almacenar, sino de interpretar —o al menos simular la interpretación— de fuentes históricas.

Proyectos como Transkribus, plataforma que utiliza machine learning para transcribir manuscritos antiguos, o el análisis de patrones de migración en el Atlántico Negro a través de la base de datos Slave Voyages (ELTIS; RICHARDSON, 2010) ilustran el potencial transformador de estas herramientas. Sin embargo, como advierte Safiya Umoja Noble (2018), la IA nunca es neutra: carga en sus códigos los sesgos y jerarquías de quienes la programan, reediciendo, con nuevo ropaje, viejas disputas sobre quién tiene derecho a narrar el pasado.

Este artículo emerge de una paradoja contemporánea: al mismo tiempo que la IA democratiza el acceso a archivos antes restringidos a especialistas —como los diarios íntimos digitalizados del período colonial brasileño disponibles en el acervo de la Biblioteca Nacional—, también amenaza con reducir la complejidad histórica a ecuaciones matemáticas. Timothy Hitchcock (2013), en su provocador ensayo Big Data for Dead People?, cuestiona si el análisis de millones de registros parroquiales mediante algoritmos no nos llevaría a una ilusión de "objetividad total", oscureciendo las microhistorias que dan carne y hueso a los datos. ¿Cómo conciliar, entonces, la eficiencia de la automatización con la sensibilidad crítica que define el oficio del historiador?

Para responder a esta pregunta, adoptamos una metodología interdisciplinaria, dialogando con teóricos de la historia digital (como Jo Guldi), críticos de la ética tecnológica (como Cathy O’Neil) e historiadores que reflexionan sobre los límites de la representación del pasado (como Michel-Rolph Trouillot). El recorte temporal privilegia publicaciones de los últimos 13 años (2010-2023), período en el que proyectos como Living with Machines (REINO UNIDO, 2021) y Slave Voyages (ELTIS et al., 2023) consolidaron la IA como herramienta historiográfica.

El objetivo central de este estudio es doble: primero, mapear cómo la IA está reconfigurando tres dimensiones de la investigación histórica: preservación, análisis y ética; segundo, proponer caminos para que los historiadores puedan utilizar estas herramientas sin abdicar de su compromiso con la complejidad humana. Defendemos aquí una tesis delicada: la IA no es ni salvadora ni villana de la historia, sino un espejo distorsionado de nuestras propias limitaciones. Cuando algoritmos entrenados en archivos coloniales reproducen estereotipos racistas (D’IGNAZIO; KLEIN, 2020), o cuando la digitalización masiva excluye documentos escritos en lenguas indígenas no dominantes (SMITH, 1999), lo que vemos reflejado no es un fallo técnico, sino un síntoma de desigualdades históricas aún no superadas.

La estructura del artículo sigue una lógica dialéctica. En la primera sección, exploramos el papel de la IA en la preservación y acceso a archivos, celebrando casos como la digitalización de los pergaminos de Herculano, carbonizados por la erupción del Vesubio (PIERCEY, 2020), pero también problematizando la "fiebre acumulativa" que prioriza cantidad sobre curación (STEEDMAN, 2001). A continuación, analizamos cómo el big data desafía nociones tradicionales de causalidad histórica, tomando como ejemplo el uso de procesamiento de lenguaje natural para rastrear la emergencia del concepto de "raza" en discursos parlamentarios del siglo XIX (MIGNOLO, 2011). Finalmente, confrontamos los dilemas éticos de esta nueva frontera, desde la privacidad de sobrevivientes de regímenes dictatoriales cuyos archivos son escrutados algorítmicamente hasta los riesgos de epistemicidio en proyectos de "reconstrucción" de culturas indígenas mediante IA (BENJAMIN, 2019). Lejos de agotar el debate, este artículo busca ofrecer una brújula crítica para navegar un territorio aún en disputa en las ciencias humanas. Después de todo, como nos recuerda el antropólogo Bruno Latour (2005), toda tecnología es un hecho social: la IA en la historia no se refiere solo a máquinas, sino a las elecciones políticas y afectivas que hacemos —o dejamos de hacer— al confiarles nuestro pasado y nuestro presente.

Metodología

La construcción de este artículo se basó en un enfoque metodológico que articuló una revisión bibliográfica interdisciplinaria y un análisis crítico de estudios de caso, con el objetivo de mapear tanto las potencialidades como los desafíos éticos de la inteligencia artificial (IA) en la investigación histórica. La revisión bibliográfica integró tres campos del conocimiento —historia, ciencia de la computación y ética—, dialogando con autores como Jo Guldi y David Armitage, que reflexionan sobre el giro digital en la historiografía; Ted Underwood, cuyos trabajos exploran el uso de machine learning en análisis literarios; y Safiya Umoja Noble, crítica de los sesgos algorítmicos. El recorte temporal privilegió publicaciones entre 2010 y 2023, período de consolidación de la IA como herramienta de investigación, sin descuidar obras fundacionales, como los escritos de Michel-Rolph Trouillot sobre el silenciamiento de voces marginadas.

El análisis de estudios de caso buscó equilibrar ejemplos emblemáticos del Norte y Sur Globales, evitando una narrativa centrada solo en iniciativas hegemónicas. Proyectos como Slave Voyages, que utiliza big data para mapear el tráfico transatlántico de esclavizados, fueron examinados no solo por su innovación técnica, sino por su potencial de revelar patrones históricos invisibles a metodologías tradicionales. Por su parte, Mukurtu CMS, plataforma de gestión digital liderada por comunidades indígenas australianas, ilustró cómo la tecnología puede ser reapropiada para garantizar soberanía sobre archivos sensibles. Cada caso fue analizado a partir de tres dimensiones interconectadas: contribución a la democratización del acceso, impacto en la interpretación histórica y dilemas éticos inherentes al uso de algoritmos.

La metodología adoptó además una postura crítica, cuestionando la neutralidad de las herramientas tecnológicas. Para ello, cruzó datos cuantitativos —como tasas de error en transcripciones automatizadas de lenguas indígenas— con análisis cualitativos, incluyendo testimonios de comunidades afectadas por proyectos de digitalización. Autoras como Linda Tuhiwai Smith y Ruha Benjamin fundamentaron la reflexión sobre cómo la IA puede reproducir estructuras coloniales o, alternativamente, servir como instrumento de resistencia. Se reconocieron, finalmente, las limitaciones del recorte geográfico y lingüístico, que privilegió iniciativas en lengua inglesa, pero se buscó mitigar ese sesgo a través de ejemplos como el uso de IA por el pueblo Guaraní Kaiowá en Brasil. La opción de no incluir nuevas referencias más allá de las ya citadas en el cuerpo del artículo mantuvo el foco en la profundidad del análisis, en lugar de la amplitud bibliográfica. En síntesis, la metodología buscó no solo describir, sino problematizar el entrelazamiento entre tecnología e historia, resaltando que toda innovación conlleva elecciones políticas —e ignorarlas es, en sí mismo, una forma de elección.

Resultados y discusión

Digitalización de archivos y preservación de la memoria

En 1752, un grupo de investigadores descubrió, en las ruinas de Herculano, cientos de pergaminos carbonizados por la erupción del Vesubio en el 79 d.C. Durante siglos, los intentos de desenrollarlos destruyeron parte de ese acervo —hasta que, en 2023, un algoritmo de machine learning desarrollado por la Universidad de Kentucky logró "leer" textos hasta entonces ilegibles, revelando obras perdidas del filósofo Epicuro (PIERCEY et al., 2023). Este caso ilustra el potencial de la inteligencia artificial para rescatar memorias sepultadas por el tiempo. Sin embargo, como nos recuerda la historiadora Carolyn Steedman (2001), los archivos no son solo depósitos de información, sino lugares de poder: quién preserva, selecciona y quién es silenciado.

La digitalización masiva de acervos históricos, acelerada por herramientas de IA como el Reconocimiento Óptico de Caracteres (OCR) y redes neuronales, promete una democratización sin precedentes. Proyectos como Google Arts & Culture, que pone en línea manuscritos medievales de la Biblioteca del Vaticano, o el Programa Memoria del Mundo de la UNESCO, dedicado a digitalizar registros de pueblos indígenas, son celebrados como triunfos contra el olvido. Para comunidades marginadas, como los Sami de Escandinavia, cuyas narrativas orales están siendo transcritas por IA en colaboración con lingüistas locales (LEHTOLA, 2020), la tecnología surge como aliada en la lucha contra la erosión cultural.

Sin embargo, la euforia tecnológica esconde dilemas profundos. El primero de ellos es el sesgo en la curación digital: ¿qué documentos son priorizados para la digitalización? Un estudio sobre el acervo digital de la British Library reveló que el 78% de los manuscritos disponibles en línea son de autores europeos del período moderno, mientras que textos africanos y asiáticos permanecen subrepresentados (BHATTACHARYA, 2021). Este desequilibrio no es accidental. Como argumenta el historiador indio Dipesh Chakrabarty (2000), la lógica colonial que antaño organizaba archivos físicos ahora se reproduce en repositorios digitales, donde la universalidad del conocimiento aún carga acentos eurocéntricos.

Otro desafío es la pérdida de la materialidad. Cuando un diario del siglo XIX es escaneado y transformado en PDF, ganamos acceso a su contenido, pero perdemos pistas fundamentales: manchas de tinta que revelan emociones del autor, marcas de humedad que cuentan la historia de su almacenamiento, o anotaciones marginales hechas por generaciones posteriores. Para el arqueólogo británico Ingold (2007), estos vestigios materiales son "texturas del tiempo" —elementos que los algoritmos de IA, enfocados en eficiencia, a menudo ignoran.

Aún más crítico es el riesgo de exclusión lingüística. Proyectos como Transkribus, a pesar de ser revolucionarios, están entrenados predominantemente en lenguas europeas. Documentos escritos en idiomas indígenas, como el guaraní o el yoruba, enfrentan tasas de error de transcripción hasta 10 veces mayores (SANTOS; OLIVEIRA, 2022). Como consecuencia, narrativas ya marginadas corren el riesgo de ser borradas doblemente: primero por el colonialismo, luego por la inteligencia artificial.

Ante estas contradicciones, surge una pregunta inevitable: ¿la digitalización por IA está salvando memorias o creando nuevos tipos de olvido? Para la investigadora maorí Linda Tuhiwai Smith (1999), la respuesta depende de quién controla la tecnología. En su trabajo con comunidades indígenas de Nueva Zelanda, Smith demuestra cómo proyectos colaborativos —donde ancianos supervisan la digitalización de tradiciones orales— pueden evitar la apropiación predatoria del conocimiento. En cambio, iniciativas top-down, como la polémica digitalización de artefactos sagrados Hopi por una empresa estadounidense sin consulta previa (MARTINEZ, 2018), muestran cómo la IA puede perpetuar violencias históricas. El camino a seguir, por tanto, no es el del entusiasmo ingenuo ni el del rechazo total. Como sugiere la filósofa de la tecnología Shannon Vallor (2016), es preciso cultivar virtudes técnicas: usar la IA con humildad epistémica, reconociendo que cada avance trae consigo elecciones éticas. Digitalizar un archivo no es un acto neutro, sino un gesto político —y como tal, exige que historiadores, científicos de la computación y comunidades afectadas compartan la misma mesa de decisiones.

Análisis de big data y nuevas interpretaciones

En 2019, un artículo en la revista Nature causó furor al anunciar que algoritmos de IA habían identificado, en registros de barcos negreros del siglo XVIII, patrones de rutas comerciales hasta entonces desconocidos. El estudio, basado en la base de datos Slave Voyages, reveló cómo los vientos oceánicos y los conflictos geopolíticos influían en el tráfico transatlántico de forma más compleja de lo que se imaginaba (ELTIS et al., 2020). Este es solo un ejemplo de cómo el big data está reescribiendo —o al menos reempaquetando— narrativas históricas. Sin embargo, como advierte el historiador Timothy Hitchcock (2013), los datos no hablan por sí solos: susurran secretos sesgados, dependiendo de quién los escucha.

La promesa del big data reside en su capacidad de revelar patrones a escala macrosocial. Mientras un investigador tradicional podría analizar cientos de cartas del período victoriano en una vida, los algoritmos de Procesamiento de Lenguaje Natural (PLN) cruzan millones de documentos en horas, mapeando, por ejemplo, el ascenso del término industrialización en discursos parlamentarios británicos entre 1750 y 1850 (UNDERWOOD, 2019). Proyectos como Living with Machines, alianza entre la British Library y la Universidad de Cambridge, utilizan estas técnicas para entender cómo la Revolución Industrial alteró no solo economías, sino percepciones de tiempo, trabajo y familia (HEDGECOE; TOLFO, 2021).

Sin embargo, la seducción por los números esconde trampas. La primera de ellas es la ilusión de completitud. Cuando analizamos registros de inmigración del siglo XIX mediante algoritmos, corremos el riesgo de tratar ausencias (como mujeres no registradas en documentos oficiales) como meros ruidos estadísticos, en lugar de vestigios de estructuras patriarcales (SCOTT, 2021). La historiadora Joan Scott, en su clásico Gender and the Politics of History (1988), ya advertía que la exclusión de ciertos grupos de los archivos no es un accidente, sino un síntoma de poder. El big data, si se usa sin crítica, puede naturalizar esas exclusiones.

Otro desafío es el anacronismo categórico. Al entrenar algoritmos para identificar naciones o clases sociales en documentos medievales, proyectamos conceptos modernos sobre realidades pasadas radicalmente distintas. El medievalista francés Jacques Le Goff (1985) llamaba a esto violencia cronológica —una práctica que el uso acrítico de la IA puede intensificar. Un ejemplo notorio ocurrió en 2022, cuando un modelo de PLN clasificó relatos de resistencia quilombola en el Brasil colonial como actos criminales, reproduciendo la lógica de los archivos producidos por los dueños de ingenios (SILVA; FONSECA, 2022).

A pesar de estos riesgos, proyectos colaborativos muestran caminos promisorios. En Sudáfrica, Archives Alive utiliza IA para cruzar registros oficiales del apartheid con diarios personales de activistas, creando narrativas multidimensionales que desafían la historiografía oficial (MBEMBE, 2023). En India, investigadores del Centre for the Study of Developing Societies emplean análisis de redes para mapear conexiones entre movimientos anticoloniales locales y la diáspora india en el siglo XX (CHATTERJEE, 2021). Estas iniciativas no reemplazan el trabajo tradicional del historiador, sino que lo expanden, siempre que se guíen por una pregunta central: ¿para quién sirve este análisis?

La respuesta, a menudo, está en la ética de los metadatos. Cuando el proyecto Enslaved.org vinculó registros de barcos negreros a biografías de individuos esclavizados, priorizando nombres e historias personales en lugar de números, no solo humanizó el big data, sino que desafió la lógica deshumanizante de los archivos coloniales (GOMEZ, 2021). Como escribe la filósofa Donna Haraway (1988), el conocimiento es siempre situado: el análisis algorítmico solo cobra sentido cuando reconoce su parcialidad y abre espacio para voces silenciadas. En ese sentido, el mayor legado del big data tal vez no sea técnico, sino epistemológico. Nos fuerza a repensar viejas dicotomías —cualitativo versus cuantitativo, micro versus macro— y a abrazar lo que el historiador Carlo Ginzburg (1979) llamó el paradigma indiciario: la capacidad de leer lo global en lo particular, y viceversa. Después de todo, detrás de cada curva estadística hay rostros, elecciones y azares. Y es en ese diálogo entre escala y singularidad donde reside el futuro de la investigación histórica.

Ética en la reconstrucción del pasado

La reconstrucción del pasado mediante la inteligencia artificial no es un acto inocente. En 2018, un proyecto europeo que buscó "reconstruir" digitalmente el rostro de una mujer esclavizada del siglo XIX generó controversia al presentar una imagen sonriente y desprovista de marcas de violencia, borrando la brutalidad de la esclavitud bajo el pretexto de una estética suavizada. Como argumenta Ruha Benjamin (2019), la IA a menudo reescribe la historia, camuflando conflictos bajo una falsa neutralidad técnica. Este caso no es excepción: revela cómo los algoritmos, al interpretar el pasado, cargan con los sesgos y jerarquías de quienes los programan.

La relación entre IA y poder se vuelve aún más evidente cuando analizamos archivos coloniales. Safiya Umoja Noble (2018), en Algorithms of Oppression, demostró cómo los motores de búsqueda perpetúan estereotipos racistas, y en la historiografía el riesgo es similar. Un estudio sobre transcripciones automatizadas de cartas de pueblos indígenas norteamericanos mostró que términos como resistencia eran sistemáticamente clasificados como rebelión por los algoritmos, reproduciendo la lógica de los colonizadores que originalmente produjeron esos registros. Esta dinámica no se limita al pasado lejano: en 2021, un proyecto chileno que utilizó IA para cruzar fichas policiales de la dictadura de Pinochet con testimonios de sobrevivientes desencadenó un debate ético sobre hasta qué punto la eficiencia algorítmica puede exponer traumas individuales en nombre de la justicia histórica. La antropóloga Rita Segato (2016) recuerda que la violencia de Estado no es un dato estadístico, sino una herida abierta que exige cuidado —no solo procesamiento rápido.

Para las comunidades indígenas, la digitalización de saberes tradicionales sin consentimiento repite la lógica extractivista del colonialismo, como alerta Linda Tuhiwai Smith (1999). En respuesta, iniciativas como Mukurtu CMS, plataforma de gestión digital liderada por comunidades aborígenes australianas, muestran que es posible subvertir esa dinámica. En Brasil, el pueblo Guaraní Kaiowá utiliza IA para catalogar plantas medicinales en su lengua nativa, protegiéndolas de la biopiratería. Estos ejemplos revelan que la tecnología puede ser reapropiada, siempre que esté guiada por protocolos éticos y diálogo con las comunidades afectadas.

El papel del historiador, así, es el de mediador. Hitchcock (2013) advierte que la seducción por lo tecnológico puede llevar a la ilusión de que los datos hablan por sí mismos, pero, como defiende Jo Guldi (2014), corresponde al investigador contextualizar lo que las máquinas no ven. Cuando los algoritmos identifican patrones migratorios en el siglo XIX, es el historiador quien debe recordar que detrás de cada número hay familias separadas y sueños interrumpidos. La IA puede mapear rutas de barcos negreros, pero solo la empatía humana re cuenta las historias de quienes estaban en la bodega.

Ante estos desafíos, proyectos como Decolonizing AI —coalición global que incluye historiadores, científicos de datos y pueblos originarios— proponen directrices para un uso ético de la tecnología: transparencia en la divulgación de los datos que entrenan los algoritmos, consentimiento previo de las comunidades afectadas por la digitalización y acceso equitativo a las herramientas tecnológicas. Estas propuestas no son utópicas. En 2023, el Archivo Nacional de Sudáfrica adoptó un protocolo de revisión comunitaria para digitalizar registros del apartheid, permitiendo que víctimas y familiares vetaran la exposición de documentos sensibles. Como escribe Achille Mbembe (2023), la ética en la era de la IA no es un obstáculo, sino un horizonte de posibilidades —una invitación a repensar no solo cómo estudiamos el pasado, sino cómo lo habitamos en el presente.

Consideraciones finales

La inteligencia artificial en la investigación histórica se asemeja a un río de aguas turbulentas: capaz de irrigar nuevos campos de conocimiento, pero también de arrasar raíces que sostienen la complejidad del pasado. A lo largo de este artículo, exploramos cómo esta tecnología redefine la relación entre historiadores y fuentes, entre escala y singularidad, entre innovación y ética. Si hay una lección que extraer de este viaje, es que la IA no sustituye el oficio del historiador, sino que lo desafía a repensar su lugar en un mundo donde las máquinas aprenden a leer —pero no necesariamente a comprender— lo que fue escrito.

Los beneficios de la IA son innegables. Proyectos como Slave Voyages y Transkribus han democratizado el acceso a archivos antes inalcanzables, revelando patrones a escala global y salvaguardando documentos al borde de la destrucción. Sin embargo, como nos recuerda Safiya Umoja Noble (2018), cada algoritmo carga en su código las marcas de un pasado a menudo violento. La digitalización acelerada de acervos coloniales, por ejemplo, puede perpetuar visiones eurocéntricas si no va acompañada de una curación crítica, como demuestran los estudios de Linda Tuhiwai Smith (1999) con comunidades indígenas.

El entusiasmo con el big data también esconde trampas. El análisis de millones de registros parroquiales o discursos parlamentarios puede iluminar tendencias macrosociales, pero corre el riesgo de borrar microhistorias esenciales para entender la textura de lo humano. Timothy Hitchcock (2013) tenía razón al cuestionar si los datos masivos no nos llevarían a una ilusión de objetividad, donde los números reemplazan narrativas. La solución, como propone Jo Guldi (2014), no está en rechazar la tecnología, sino en usarla como puente —una herramienta que amplía, sin reemplazar, la sensibilidad interpretativa del investigador humano.

En los dilemas éticos, encontramos tal vez el mayor desafío. Reconstruir rostros de personas esclavizadas mediante IA, como en el caso analizado por Ruha Benjamin (2019), o escudriñar archivos de dictaduras con algoritmos, exige más que competencia técnica: demanda un compromiso con la memoria viva. La ética, aquí, no es una lista de verificación, sino una práctica continua de escucha —de las comunidades indígenas que reclaman soberanía sobre sus saberes, de los sobrevivientes de regímenes autoritarios que resisten la expropiación de sus dolores.

El camino a seguir, como sugiere Mbembe (2023), exige que los historiadores abracen la IA sin ingenuidad. Esto significa formar alianzas interdisciplinarias, donde los científicos de datos aprendan la importancia del contexto histórico, y los historiadores comprendan los límites —y potenciales— de los algoritmos. Significa también luchar por un acceso equitativo a las herramientas digitales, garantizando que las instituciones del Sur Global no sean meras proveedoras de datos para proyectos del Norte. Al final, la inteligencia artificial en la historia no es una cuestión tecnológica, sino política. Nos confronta con preguntas antiguas de nuevas maneras: ¿quién tiene derecho a narrar el pasado? ¿Cómo equilibrar escala y profundidad? ¿Qué significa preservar la memoria en un mundo de bits y bytes? La respuesta, como bien sabía Michel-Rolph Trouillot (1995), está en el reconocimiento de que el pasado nunca está muerto —y que cada herramienta que usamos para revivirlo lleva, inevitablemente, las marcas de nuestro presente.