De kwaliteit van digitalisering van historische boeken, tijdschriften, kranten en archieven in Nederland laat te wensen over. Hierdoor zijn de bronnen onvindbaar en slecht doorzoekbaar. Dit meldde het NRC dit weekend in een uitgebreid artikel.
In Nederland zijn er veel digitaliseringsprojecten gedaan, verschillende instellingen zoals universiteiten, bibliotheken en wetenschappelijke instituten hebben miljoenen pagina’s gescand voor minimaal 50 miljoen euro. DBNL (Digitale Bibliotheek voor de Nederlandse Letteren) en de Koninklijke Bibliotheek zijn de belangrijkste aanbieders van gedigitaliseerd Nederlands erfgoed.
Het probleem van de Nederlandse digitaliseringsprojecten is echter dat veel gedigitaliseerde documenten moeilijk of niet te vinden zijn op de website. Bovendien zijn de documenten slecht of niet doorzoekbaar en geven de websites vaak onbetrouwbare zoekresultaten. De tekenherkenning is onder de maat waardoor er veel fouten in de teksten staan. Daarnaast is de metadata van de documenten niet in orde. “Vroeger haalden wetenschappers met het bladeren in boeken en tijdschriften eigenlijk emmers water uit een put. Tegenwoordig is er door de digitalisering een waterleidingnet. Maar dat net is zo vervuild, dat elke onderzoeker alsnog zelf het water moet zuiveren in een emmertje”, legt Van Stipriaan uit.
Van Stipriaan en Wijnand Mijnhardt, hoogleraar geschiedenis aan de Universiteit van Utrecht vinden dat veel digitaliseringsprojecten gebrekkig zijn uitgevoerd. Bijvoorbeeld geen enkel document van het Geheugen van Nederland is doorzoekbaar en de documenten zelf zijn moeilijk vindbaar. Sterker nog, zelfs partijen die hebben bijgedragen aan het project kunnen hun eigen werken niet terug vinden. Daarom wordt dit project het Geheugenverlies van Nederland genoemd.
De redenen voor de nalatigheid van erfgoedinstellingen kan deels worden verklaard door geldgebrek. Het goed digitaliseren kost maar liefst 1 euro per pagina. Een ander probleem van digitalisering is dat de verschillende instellingen niet met elkaar communiceren. Daarom wordt er geen standaard gehanteerd en worden sommige boeken door verschillende partijen gedigitaliseerd. Dit komt omdat er tot op heden geen centraal register is waar wordt bijgehouden wat gedigitaliseerd wordt.
“Door niet één plan te maken om al het gezamenlijke erfgoed volgens een standaardnorm te digitaliseren hebben de instellingen het speelveld open gelaten”, aldus Van Stipriaan. Hij vertelt dat daardoor Google Books het speelveld heeft betreden.
(Via: NRC)