transcriptie website handschriftherkenning

Zeeuws Archief doet mee aan project automatische handschriftherkenning

Het Zeeuws Archief beheert net als alle andere archiefinstellingen in het land vele handgeschreven archieven in oud schrift. Maar wie kan die nog lezen? En zou je niet makkelijker willen zoeken in de scans van deze archieven?

Kunstmatige intelligentie

Dit kan met artificial intelligence (AI). Zo wordt software getraind om handschriften automatisch te transcriberen, oftewel om te zetten naar tekst die de computer kan lezen. Hiervoor moet de software wel eerst met een bulk aan handgemaakte transcripties worden gevoed om deze te trainen. Een voorbeeld van een programma waarmee dit kan is Transkribus. Het Nationaal Archief is hiervoor het automatische handschriftherkenningsproject ‘De ijsberg zichtbaar maken‘ gestart.

project automatisch handschriftenherkenning De ijsberg zichtbaar maken
Het topje van de ijsberg, dat zijn de beschrijvingen die we hebben van archieven. Maar het grootste deel van de ijsberg is de informatie die in al die documenten zelf staat. Deze informatie is vaak wel gedigitaliseerd maar is niet machine leesbaar. Die informatie willen we boven waterhalen met handschriftherkenning.

Zeeuwse notariële archieven

Binnen dit project worden, behalve archieven van de VOC uit de 17e en 18e eeuw, ook archieven van notarissen uit de 19e eeuw (automatisch) getranscribeerd. Het Zeeuws Archief heeft hiervoor Zeeuwse notariële archieven aangeleverd. De scans die wij hebben aangeleverd zijn afkomstig uit enkele notarisarchieven die zijn opgenomen in het verzamelbestand ‘Notariële Archieven Zeeland 1842-1895’ (toegang 13.2).
De computer leest nog niet foutloos, maar de resultaten zijn indrukwekkend.

Zoeken in de transcripties

Op 15 april 2021 zijn 0,6 miljoen transcripties van de Regionaal Historische Centra (RHC’s) gepubliceerd op de website Zenodo, waaronder ook die van het Zeeuws Archief. Je kunt daar transcripties downloaden en doorzoeken. Dat gaat nog wel een beetje omslachtig. Daarom wordt een projectwebsite gemaakt waarop dat makkelijker kan. Op 17 mei zal tijdens een symposium over dit onderwerp van het Nationaal Archief, een tussentijds resultaat van de projectwebsite worden gepresenteerd.

Voor grasduiners en diepgravers

Inmiddels zijn de transcripties op openarch.nl al wat makkelijker te doorzoeken. Kijk op openarch.nl/htr en vul een zoekterm in de zoekbalk in. Op dit moment worden ook de scans gekoppeld, bij een zoekactie op Middelburg komen er bijvoorbeeld al een aantal tevoorschijn. Openarch.nl is een website van Bob Coret.

Als je de transcripties via Zenodo wil downloaden en doorzoeken, bekijk dan eerst de volgende video van Jan Kruidhof van het Noord Hollands Archief. In deze video wordt uitgelegd hoe je met Astrogrep in deze transcipties kan zoeken.

voorbeeld transcriptie met scan
voorbeeld van transcriptie met scan uit 13.2 Notariële Archieven Zeeland 1842-1895, inventarisnummer 1266

Verhalen

Tijdens het genoemde symposium worden, behalve de projectwebsite, ook de belangrijkste projectresultaten gedeeld en verschillende verhalen die in de transcripties gevonden zijn. Wij gaan alvast op zoek naar de Zeeuwse verhalen. Doe je mee?

Het online symposium De IJsberg zichtbaar maken is voor iedereen toegankelijk, meer informatie vind je op de website van het Nationaal Archief.