Farinha, IA e o acesso aos acervos

Software livre para difusão e mediação algorítmica de acervos

Ricardo Sodré Andrade

Escritório Regional Nordeste do Arquivo Nacional/MGI

Laboratório de Humanidades Digitais da UFBA (LABHDUFBA)

Raul Hacker Club

29 de maio de 2026

Quem sou eu?

Quem sou eu?

  • Chefe do Escritório Regional Nordeste do Arquivo Nacional (2025–)
  • Arquivista da UFBA (2010–2025*)
  • Arquivista e responsável pelo setor de TI do Arquivo Público da Bahia (2007–2009)
  • Membro do LABHDUFBA – Laboratório de Humanidades Digitais da UFBA (2024–)
  • Coordenador do projeto de desenvolvimento do Farinha (2024–)
  • Criador do projeto Arquivos da UFBA, Archives World Map e outros
  • Membro do Raul Hacker Club (2016–)
  • Mestre em Ciência da Informação pela UFBA (2010)

O problema: acervos que não chegam ao público

Acervos na gaveta digital

Muitos arquivos no Brasil já digitalizaram acervos, mas não têm plataforma de acesso.

  • Acervos digitalizados “na gaveta”
  • Buscas limitadas ou inexistentes
  • Pesquisadores que não encontram o que precisam
  • Instituições que não disponibilizam seus acervos online

O acesso adequado é a etapa que falta em muitos arquivos.

Onde o Farinha se encaixa

Um acervo passa por várias etapas — e o Farinha atua no acesso:

  1. Produção — os documentos são produzidos e acumulados
  2. Tratamento técnico — organização, descrição, indexação, digitalização etc.
  3. Acesso — estabelecimento de plataforma, disponibilização de metadados, objetos digitais, mediação por IA

Farinha é plataforma de acesso: o momento em que o acervo encontra o público por meio digital.

A história do Farinha

Como chegamos ao Farinha

  • 2007: Trabalho no Arquivo Público da Bahia — primeiro contato com o ICA-AtoM
  • 2008: Tradução do ICA-AtoM; encontro com Peter Van Garderen (Goiânia)
  • 2023: Tentativa de reunir bases dispersas da UFBA — centelha do projeto
  • Um protótipo nasceu e foi batizado de Farinha
    • “Todo mundo já usa Dendê… vamos chamar de outra coisa, Beatriz!”

2008: Maria Teresa (Arquivo Público da Bahia), Ricardo e Peter Van Garderen (ICA-AtoM)

A equipe

Pablo

Pablo Soares Programador sênior, Raul Hacker Club

Beatriz

Beatriz Alves Analista de TI, Dataprev

Cristian

Cristian Privat Arquiteto de infraestrutura e cloud

Ricardo

Ricardo Sodré Coordenador do projeto

~20 meses de trabalho voluntário, reuniões nas terças às 20h

Apoio: PNAB Bahia 2025 (bolsa)

O que o Farinha já faz

  • Cadastro de instituições, setores e acervos (Fundos e Coleções)
  • Busca textual nos registros cadastrados
  • Importação em lote de acervos
  • Campos personalizados nas Coleções
  • Objetos digitais — inserção e visualização
  • Portal inicial para consulta pública

Versão 0.2.x é a primeira versão pública!

Coleções com campos personalizados

Fundos e Coleções: com norma ou não

  • Nem todo acervo segue a NOBRADE — e está tudo bem
  • Fundos seguem a norma; Coleções são flexíveis
  • O Farinha permite campos personalizados nas Coleções
  • Fotografia, arte, cultura, memória — cada acervo tem sua linguagem

A rigidez normativa não pode ser barreira para o acesso.

Objetos digitais no Farinha

IA e mediação algorítmica

“Ricardo, cadê a IA?”

Uma nova geração de Inteligência Artificial chegou “ontem”: as LLM (Modelos de Linguagem de Grande Escala).

  • Causaram impactos em diversas áreas do conhecimento
  • Os Arquivos não “escaparam”
  • Temos agora uma oportunidade de expandir as nossas ferramentas

RAG: o “funcionário antigo” do Arquivo

RAG (Retrieval-Augmented Generation) = busca semântica + geração de respostas

Imagine um funcionário antigo do Arquivo: leu tudo, tem memória mediana, mas às vezes alucina.

Um RAG básico se chama RAG Ingênuo (ou naive).

  • Busca informações relevantes no acervo (embeddings)
  • Gera uma resposta baseada nessas informações
  • Modelo open-source, rodando em servidor local
  • Nada de caixas pretas — software livre ou aberto

RAG Ingênuo: o básico funciona?

  • ~12.750 fólios com recortes de jornais (décadas de 1980 e 1990)
  • Modelo LLM: open-source e que pode funcionar localmente
  • Sem engenharia avançada — é o teste mais básico possível
  • O LABHDUFBA desenvolve tecnologias de RAG com técnicas de ponta

Demonstração ao vivo: RAG Ingênuo

Coleção: Recortes de Jornais da Reitoria da UFBA

Façam suas perguntas! Perguntem como se estivesse enviando uma pergunta a um funcionário do Arquivo.

🔗 recortes.farinha.info

O que o Farinha pode fazer por você

Para arquivistas e gestores de acervo

  • Descreva acervos com NOBRADE ou com campos personalizados
  • Importação em lote — traga seus dados para o Farinha
  • Objetos digitais — documentos, fotografias, recortes
  • Uma plataforma para instituições de qualquer porte
  • Software livre AGPL-3.0 — sem custos de licença

Para pesquisadores e público

  • Descubra acervos — navegue por instituições, fundos e coleções
  • Busca textual — encontre documentos relevantes
  • Explore via IA — faça perguntas ao acervo com RAG

Para instituições culturais

  • Desenvolvido no Brasil, por arquivistas e para arquivistas
  • Software livre AGPL-3.0 — portanto, sem custo de licença — desenvolvido de forma voluntária
  • Instale na sua instituição ou use em nuvem
  • Como participar: contribua com código, documentação, teste ou feedback. Escrevam projetos contemplando o suporte da equipe à sua instalação.
  • O Farinha terá módulo nativo de RAG — mediação algorítmica integrada ao acervo

Cadastro de fundos no Farinha

Perspectivas

O que vem por aí

  • Versão 0.3 — portal e área admin aprimorados
  • Versão 0.4 — módulo nativo de RAG
  • Parceria com o LABHDUFBA para técnicas avançadas de RAG
  • Esperamos poder criar uma camada leve de compatibilidade com o Archivematica (modelo OAIS) para participar de infraestruturas de preservação digital (projeto enviado à NLnet)

Em breve: RAG bem feito, com verificabilidade de fontes e precisão aprimorada.

Obrigado!

Farinha
farinha.info

Arquivo Nacional
[email protected]

LABHDUFBA
labhdufba.github.io

Raul Hacker Club
raulhc.cc
[email protected]

Feudo.org
feudo.org
[email protected]