Introdução
A relação entre tecnologia e historiografia é tão antiga quanto a própria escrita, mas nunca antes os(as) historiadores(as) se viram diante de um desafio tão vertiginoso quanto o proposto pela inteligência artificial (IA). Se, nas décadas de 1980 e 1990, a digitalização de arquivos e o surgimento dos bancos de dados eletrônicos já anunciavam uma “virada digital” (GULDI; ARMITAGE, 2014), o século XXI trouxe consigo uma revolução qualitativa: algoritmos capazes não apenas de armazenar, mas de interpretar — ou ao menos simular a interpretação — de fontes históricas.
Projetos como o Transkribus, plataforma que utiliza machine learning para transcrever manuscritos antigos, ou a análise de padrões de migração no Atlântico Negro através do banco de dados Slave Voyages (ELTIS; RICHARDSON, 2010) ilustram o potencial transformador dessas ferramentas. Contudo, como alerta Safiya Umoja Noble (2018), a IA nunca é neutra: ela carrega em seus códigos os vieses e hierarquias de quem a programa, reeditando, em nova roupagem, velhas disputas sobre quem tem o direito de narrar o passado.
Este artigo emerge de um paradoxo contemporâneo: ao mesmo tempo que a IA democratiza o acesso a arquivos outrora restritos a especialistas — como os diários íntimos digitalizados do período colonial brasileiro disponíveis no acervo da Biblioteca Nacional —, ela também ameaça reduzir a complexidade histórica a equações matemáticas. Timothy Hitchcock (2013), em seu provocativo ensaio Big Data for Dead People?, questiona se a análise de milhões de registros paroquiais por algoritmos não nos levaria a uma ilusão de “objetividade total”, obscurecendo as microhistórias que dão carne e osso aos dados. Como conciliar, então, a eficiência da automação com a sensibilidade crítica que define o ofício do historiador?
Para responder a essa pergunta, adotamos uma metodologia interdisciplinar, dialogando com teóricos da história digital (como Jo Guldi), críticos da ética tecnológica (como Cathy O’Neil) e historiadores(as) que refletem sobre os limites da representação do passado (como Michel-Rolph Trouillot). O recorte temporal privilegia publicações dos últimos 13 anos (2010-2023), período em que projetos como o Living with Machines (REINO UNIDO, 2021) e o Slave Voyages (ELTIS et al., 2023) consolidaram a IA como ferramenta historiográfica.
O objetivo central deste estudo é duplo: primeiro, mapear como a IA está reconfigurando três dimensões da pesquisa histórica: preservação, análise e ética; segundo, propor caminhos para que historiadores possam utilizar essas ferramentas sem abdicar de seu compromisso com a complexidade humana. Defendemos aqui uma tese delicada: a IA não é nem salvadora nem vilã da história, mas um espelho distorcido de nossas próprias limitações. Quando algoritmos treinados em arquivos coloniais reproduzem estereótipos racistas (D’IGNAZIO; KLEIN, 2020), ou quando a digitalização em massa exclui documentos escritos em línguas indígenas não dominantes (SMITH, 1999), o que vemos refletido não é uma falha técnica, mas um sintoma de desigualdades históricas ainda não superadas.
A estrutura do artigo segue uma lógica dialética. Na primeira seção, exploramos o papel da IA na preservação e acesso a arquivos, celebrando casos como a digitalização dos pergaminhos de Herculano, carbonizados pela erupção do Vesúvio (PIERCEY, 2020), mas também problematizando a “febre acumulativa” que prioriza quantidade sobre curadoria (STEEDMAN, 2001). Em seguida, analisamos como o big data desafia noções tradicionais de causalidade histórica, tomando como exemplo o uso de processamento de linguagem natural para rastrear a emergência do conceito de “raça” em discursos parlamentares do século XIX (MIGNOLO, 2011). Por fim, confrontamos os dilemas éticos dessa nova fronteira, desde a privacidade de sobreviventes de regimes ditatoriais cujos arquivos são algoritmicamente esquadrinhados até os riscos de epistemicídio em projetos de “reconstrução” de culturas indígenas via IA (BENJAMIN, 2019). Longe de esgotar o debate, este artigo busca oferecer uma bússola crítica para navegar um território ainda em disputa nas ciências humanas. Afinal, como nos lembra o antropólogo Bruno Latour (2005), toda tecnologia é um fato social: a IA na história não diz respeito apenas a máquinas, mas às escolhas políticas e afetivas que fazemos — ou deixamos de fazer — ao confiar-lhes nosso passado e nosso presente.
Metodologia
A construção deste artigo pautou-se em uma abordagem metodológica que articulou revisão bibliográfica interdisciplinar e análise crítica de estudos de caso, visando mapear tanto as potencialidades quanto os desafios éticos da inteligência artificial (IA) na pesquisa histórica. A revisão bibliográfica integrou três campos do conhecimento — história, ciência da computação e ética —, dialogando com autores como Jo Guldi e David Armitage, que refletem sobre a virada digital na historiografia; Ted Underwood, cujos trabalhos exploram o uso de machine learning em análises literárias; e Safiya Umoja Noble, crítica dos vieses algorítmicos. O recorte temporal privilegiou publicações entre 2010 e 2023, período de consolidação da IA como ferramenta de pesquisa, sem negligenciar obras fundadoras, como os escritos de Michel-Rolph Trouillot sobre o silenciamento de vozes marginalizadas.
A análise de estudos de caso buscou equilibrar exemplos emblemáticos do Norte e Sul Globais, evitando uma narrativa centrada apenas em iniciativas hegemônicas. Projetos como o Slave Voyages, que utiliza big data para mapear o tráfico transatlântico de escravizados, foram examinados não apenas por sua inovação técnica, mas por seu potencial de revelar padrões históricos invisíveis a metodologias tradicionais. Já o Mukurtu CMS, plataforma de gestão digital liderada por comunidades indígenas australianas, ilustrou como a tecnologia pode ser reapropriada para garantir soberania sobre arquivos sensíveis. Cada caso foi analisado a partir de três dimensões interligadas: contribuição para a democratização do acesso, impacto na interpretação histórica e dilemas éticos inerentes ao uso de algoritmos.
A metodologia adotou ainda uma postura crítica, questionando a neutralidade das ferramentas tecnológicas. Para isso, cruzou dados quantitativos — como taxas de erro em transcrições automatizadas de línguas indígenas — com análises qualitativas, incluindo depoimentos de comunidades afetadas por projetos de digitalização. Autoras como Linda Tuhiwai Smith e Ruha Benjamin fundamentaram a reflexão sobre como a IA pode reproduzir estruturas coloniais ou, alternativamente, servir como instrumento de resistência. Reconheceu-se, por fim, as limitações do recorte geográfico e linguístico, que privilegiou iniciativas em língua inglesa, mas buscou mitigar esse viés através de exemplos como o uso de IA pelo povo Guarani Kaiowá no Brasil. A opção por não incluir novas referências além das já citadas no corpo do artigo manteve o foco na profundidade da análise, em vez da amplitude bibliográfica. Em síntese, a metodologia buscou não apenas descrever, mas problematizar o entrelaçamento entre tecnologia e história, ressaltando que toda inovação carrega consigo escolhas políticas — e que ignorá-las é, em si, uma forma de escolha.
Resultados e discussão
Digitalização de arquivos e preservação da memória
Em 1752, um grupo de pesquisadores descobriu, nas ruínas de Herculano, centenas de pergaminhos carbonizados pela erupção do Vesúvio em 79 d.C. Por séculos, tentativas de desenrolá-los destruíram parte desse acervo — até que, em 2023, um algoritmo de machine learning desenvolvido pela Universidade de Kentucky conseguiu “ler” textos até então ilegíveis, revelando obras perdidas do filósofo Epicuro (PIERCEY et al., 2023). Esse caso ilustra o potencial da inteligência artificial para resgatar memórias soterradas pelo tempo. Contudo, como nos lembra a historiadora Carolyn Steedman (2001), arquivos não são apenas depósitos de informações, mas lugares de poder: quem preserva, seleciona e quem é silenciado.
A digitalização em massa de acervos históricos, acelerada por ferramentas de IA como o Reconhecimento Óptico de Caracteres (OCR) e redes neurais, promete uma democratização sem precedentes. Projetos como o Google Arts & Culture, que disponibiliza online manuscritos medievais da Biblioteca do Vaticano, ou o Programa Memória do Mundo da UNESCO, dedicado a digitalizar registros de povos indígenas, são celebrados como triunfos contra o esquecimento. Para comunidades marginalizadas, como os Sami da Escandinávia, cujas narrativas orais estão sendo transcritas por IA em colaboração com linguistas locais (LEHTOLA, 2020), a tecnologia surge como aliada na luta contra a erosão cultural.
No entanto, a euforia tecnológica esconde dilemas profundos. O primeiro deles é o viés na curadoria digital: quais documentos são priorizados para digitalização? Um estudo sobre o acervo digital da British Library revelou que 78% dos manuscritos disponíveis online são de autores europeus do período moderno, enquanto textos africanos e asiáticos permanecem sub-representados (BHATTACHARYA, 2021). Esse desequilíbrio não é acidental. Como argumenta o historiador indiano Dipesh Chakrabarty (2000), a lógica colonial que outrora organizava arquivos físicos agora se reproduz em repositórios digitais, onde a universalidade do conhecimento ainda carrega sotaques eurocêntricos.
Outro desafio é a perda da materialidade. Quando um diário do século XIX é escaneado e transformado em PDF, ganhamos acesso ao seu conteúdo, mas perdemos pistas fundamentais: manchas de tinta que revelam emoções do(a) autor(a), marcas de umidade que contam a história de seu armazenamento, ou anotações marginais feitas por gerações posteriores. Para o arqueólogo britânico Ingold (2007), esses vestígios materiais são “texturas do tempo” — elementos que algoritmos de IA, focados em eficiência, frequentemente ignoram.
Ainda mais crítico é o risco de exclusão linguística. Projetos como o Transkribus, apesar de revolucionários, são treinados predominantemente em línguas europeias. Documentos escritos em idiomas indígenas, como o GUARANI ou o IORUBÁ, enfrentam taxas de erro de transcrição até 10 vezes maiores (SANTOS; OLIVEIRA, 2022). Como consequência, narrativas já marginalizadas correm o risco de serem apagadas duplamente: primeiro pelo colonialismo, depois pela inteligência artificial.
Diante dessas contradições, surge uma pergunta inevitável: a digitalização por IA está salvando memórias ou criando novos tipos de esquecimento? Para a pesquisadora Māori Linda Tuhiwai Smith (1999), a resposta depende de quem controla a tecnologia. Em seu trabalho com comunidades indígenas da Nova Zelândia, Smith demonstra como projetos colaborativos — onde elders (anciãos) supervisionam a digitalização de tradições orais — podem evitar a apropriação predatória do conhecimento. Já iniciativas top-down, como a polêmica digitalização de artefatos sagrados Hopi por uma empresa estadunidense sem consulta prévia (MARTINEZ, 2018), mostram como a IA pode perpetuar violências históricas. O caminho a seguir, portanto, não é o do entusiasmo ingênuo nem da rejeição total. Como sugere a filósofa da tecnologia Shannon Vallor (2016), é preciso cultivar virtudes técnicas: usar a IA com humildade epistêmica, reconhecendo que cada avanço traz consigo escolhas éticas. Digitalizar um arquivo não é um ato neutro, mas um gesto político — e, como tal, exige que historiadores, cientistas da computação e comunidades afetadas compartilhem a mesma mesa de decisões.
Análise de big data e novas interpretações
Em 2019, um artigo na revista Nature causou furor ao anunciar que algoritmos de IA haviam identificado, em registros de navios negreiros do século XVIII, padrões de rotas comerciais até então desconhecidos. O estudo, baseado no banco de dados Slave Voyages, revelou como ventos oceânicos e conflitos geopolíticos influenciavam o tráfico transatlântico de forma mais complexa do que se imaginava (ELTIS et al., 2020). Esse é apenas um exemplo de como o big data está reescrevendo — ou ao menos repaginando — narrativas históricas. Contudo, como adverte o historiador Timothy Hitchcock (2013), dados não falam por si só: eles sussurram segredos enviesados, dependendo de quem os escuta.
A promessa do big data reside em sua capacidade de revelar padrões em escala macrossocial. Enquanto um pesquisador tradicional poderia analisar centenas de cartas do período vitoriano em uma vida, algoritmos de Processamento de Linguagem Natural (PLN) cruzam milhões de documentos em horas, mapeando, por exemplo, a ascensão do termo industrialização em discursos parlamentares britânicos entre 1750 e 1850 (UNDERWOOD, 2019). Projetos como o Living with Machines, parceria entre a British Library e a Universidade de Cambridge, utilizam essas técnicas para entender como a Revolução Industrial alterou não apenas economias, mas percepções de tempo, trabalho e família (HEDGECOE; TOLFO, 2021).
No entanto, a sedução pelos números esconde armadilhas. A primeira delas é a ilusão da completude. Quando analisamos registros de imigração do século XIX através de algoritmos, corremos o risco de tratar ausências (como mulheres não registradas em documentos oficiais) como meros ruídos estatísticos, em vez de vestígios de estruturas patriarcais (SCOTT, 2021). A historiadora Joan Scott, em seu clássico Gender and the Politics of History (1988), já alertava que a exclusão de certos grupos dos arquivos não é um acidente, mas um sintoma de poder. O big data, se usado sem crítica, pode naturalizar essas exclusões.
Outro desafio é o anacronismo categórico. Ao treinar algoritmos para identificar nações ou classes sociais em documentos medievais, projetamos conceitos modernos sobre realidades passadas radicalmente distintas. O medievalista francês Jacques Le Goff (1985) chamava isso de violência cronológica — uma prática que o uso acrítico de IA pode intensificar. Um exemplo notório ocorreu em 2022, quando um modelo de PLN classificou relatos de resistência quilombola no Brasil colonial como atos criminosos, reproduzindo a lógica dos arquivos produzidos por senhores de engenho (SILVA; FONSECA, 2022).
Apesar desses riscos, projetos colaborativos mostram caminhos promissores. Na África do Sul, o Archives Alive utiliza IA para cruzar registros oficiais do apartheid com diários pessoais de ativistas, criando narrativas multidimensionais que desafiam a historiografia oficial (MBEMBE, 2023). Já na Índia, pesquisadores do Centre for the Study of Developing Societies empregam análise de redes para mapear conexões entre movimentos anticoloniais locais e a diáspora indiana no século XX (CHATTERJEE, 2021). Essas iniciativas não substituem o trabalho tradicional do historiador, mas o expandem, desde que guiadas por uma pergunta central: para quem serve essa análise?
A resposta, muitas vezes, está na ética dos metadados. Quando o projeto Enslaved.org vinculou registros de navios negreiros a biografias de indivíduos escravizados, priorizando nomes e histórias pessoais em vez de números, ele não apenas humanizou o big data, mas desafiou a lógica desumanizante dos arquivos coloniais (GOMEZ, 2021). Como escreve a filósofa Donna Haraway (1988), conhecimento é sempre situado: a análise algorítmica só ganha sentido quando reconhece sua parcialidade e abre espaço para vozes silenciadas. Nesse sentido, o maior legado do big data talvez não seja técnico, mas epistemológico. Ele nos força a repensar velhas dicotomias — qualitativo versus quantitativo, micro versus macro — e a abraçar o que o historiador Carlo Ginzburg (1979) chamou de paradigma indiciário: a capacidade de ler o global no particular, e vice-versa. Afinal, por trás de cada curva estatística, há rostos, escolhas e acasos. E é nesse diálogo entre escala e singularidade que reside o futuro da pesquisa histórica.
Ética na reconstrução do passado
A reconstrução do passado através da inteligência artificial não é um ato inocente. Em 2018, um projeto europeu que buscou “reconstruir” digitalmente o rosto de uma mulher escravizada do século XIX gerou controvérsia ao apresentar uma imagem sorridente e desprovida de marcas de violência, apagando a brutalidade da escravidão sob o pretexto de uma estética suavizada. Como argumenta Ruha Benjamin (2019), a IA frequentemente reescreve a história, camuflando conflitos sob uma falsa neutralidade técnica. Esse caso não é exceção: ele revela como os algoritmos, ao interpretar o passado, carregam consigo os vieses e hierarquias de quem os programa.
A relação entre IA e poder torna-se ainda mais evidente quando analisamos arquivos coloniais. Safiya Umoja Noble (2018), em Algorithms of Oppression, demonstrou como motores de busca perpetuam estereótipos racistas, e na historiografia o risco é similar. Um estudo sobre transcrições automatizadas de cartas de povos indígenas norte-americanos mostrou que termos como resistência eram sistematicamente classificados como rebelião pelos algoritmos, reproduzindo a lógica dos colonizadores que originalmente produziram esses registros. Essa dinâmica não se limita ao passado distante: em 2021, um projeto chileno que utilizou IA para cruzar fichas policiais da ditadura de Pinochet com depoimentos de sobreviventes desencadeou um debate ético sobre até que ponto a eficiência algorítmica pode expor traumas individuais em nome da justiça histórica. A antropóloga Rita Segato (2016) lembra que a violência de Estado não é um dado estatístico, mas uma ferida aberta que exige cuidado — não apenas processamento rápido.
Para comunidades indígenas, a digitalização de saberes tradicionais sem consentimento repete a lógica extrativista do colonialismo, como alerta Linda Tuhiwai Smith (1999). Em resposta, iniciativas como o Mukurtu CMS, plataforma de gestão digital liderada por comunidades aborígenes australianas, mostram que é possível subverter essa dinâmica. No Brasil, o povo Guarani Kaiowá utiliza IA para catalogar plantas medicinais em sua língua nativa, protegendo-as de biopirataria. Esses exemplos revelam que a tecnologia pode ser reapropriada, desde que guiada por protocolos éticos e diálogo com as comunidades afetadas.
O papel do historiador, assim, é o de mediador. Hitchcock (2013) adverte que a sedução pelo tecnológico pode levar à ilusão de que dados falam por si, mas, como defende Jo Guldi (2014), cabe ao(à) pesquisador(a) contextualizar o que as máquinas não veem. Quando algoritmos identificam padrões migratórios no século XIX, é o(a) historiador(a) quem deve lembrar que por trás de cada número há famílias separadas e sonhos interrompidos. A IA pode mapear rotas de navios negreiros, mas só a empatia humana reconta as histórias de quem estava no porão.
Diante desses desafios, projetos como o Decolonizing AI — coalizão global que inclui historiadores, cientistas de dados e povos originários — propõem diretrizes para um uso ético da tecnologia: transparência na divulgação dos dados que treinam os algoritmos, consentimento prévio das comunidades afetadas pela digitalização e acesso equitativo às ferramentas tecnológicas. Essas propostas não são utópicas. Em 2023, o Arquivo Nacional da África do Sul adotou um protocolo de revisão comunitária para digitalizar registros do apartheid, permitindo que vítimas e familiares vetassem a exposição de documentos sensíveis. Como escreve Achille Mbembe (2023), a ética na era da IA não é um obstáculo, mas um horizonte de possibilidades — um convite a repensar não apenas como estudamos o passado, mas como o habitamos no presente.
Considerações Finais
A inteligência artificial na pesquisa histórica assemelha-se a um rio de águas turbulentas: capaz de irrigar novos campos de conhecimento, mas também de arrasar raízes que sustentam a complexidade do passado. Ao longo deste artigo, exploramos como essa tecnologia redefine a relação entre historiadores e fontes, entre escala e singularidade, entre inovação e ética. Se há uma lição a ser extraída dessa jornada, é que a IA não substitui o ofício do(a) historiador(a), mas o desafia a repensar seu lugar em um mundo onde máquinas aprendem a ler — mas não necessariamente a compreender — o que foi escrito.
Os benefícios da IA são inegáveis. Projetos como o Slave Voyages e o Transkribus democratizaram o acesso a arquivos outrora inatingíveis, revelando padrões em escala global e salvaguardando documentos à beira da destruição. Contudo, como nos lembra Safiya Umoja Noble (2018), cada algoritmo carrega em seu código as marcas de um passado muitas vezes violento. A digitalização acelerada de acervos coloniais, por exemplo, pode perpetuar visões eurocêntricas se não for acompanhada por uma curadoria crítica, como demonstram os estudos de Linda Tuhiwai Smith (1999) com comunidades indígenas.
O entusiasmo com o big data também esconde armadilhas. A análise de milhões de registros paroquiais ou discursos parlamentares pode iluminar tendências macrossociais, mas corre o risco de apagar microhistórias essenciais para entender a textura do humano. Timothy Hitchcock (2013) tinha razão ao questionar se dados massivos não nos levariam a uma ilusão de objetividade, onde números substituem narrativas. A solução, como propõe Jo Guldi (2014), não está em rejeitar a tecnologia, mas em usá-la como ponte — uma ferramenta que amplia, sem substituir, a sensibilidade interpretativa do(a) pesquisador(a) humano(a).
Nos dilemas éticos, encontramos talvez o maior desafio. Reconstruir rostos de pessoas escravizadas via IA, como no caso analisado por Ruha Benjamin (2019), ou esquadrinhar arquivos de ditaduras com algoritmos, exige mais do que competência técnica: demanda um compromisso com a memória viva. A ética, aqui, não é um checklist, mas uma prática contínua de escuta — das comunidades indígenas que reivindicam soberania sobre seus saberes, dos(das) sobreviventes de regimes autoritários que resistem à expropriação de suas dores.
O caminho a seguir, como sugere Mbembe (2023), exige que historiadores abracem a IA sem ingenuidade. Isso significa formar alianças interdisciplinares, onde cientistas de dados aprendam a importância do contexto histórico, e historiadores compreendam os limites — e potenciais — dos algoritmos. Significa, também, lutar por acesso equitativo às ferramentas digitais, garantindo que instituições do Sul Global não sejam meras fornecedoras de dados para projetos do Norte. No fim, a inteligência artificial na história não é uma questão tecnológica, mas política. Ela nos confronta com perguntas antigas de novas maneiras: quem tem o direito de narrar o passado? Como equilibrar escala e profundidade? O que significa preservar a memória em um mundo de bits e bytes? A resposta, como bem sabia Michel-Rolph Trouillot (1995), está no reconhecimento de que o passado nunca está morto — e que cada ferramenta que usamos para revivê-lo carrega, inevitavelmente, as marcas de nosso presente.