Google heeft 1 miljoen ebooks online

0

Google heeft sinds 26 augustus 2009 ruim 1 miljoen gratis ebooks in ePub formaat online. Dat is een echte mijlpaal voor het Google Books Project. De webreus biedt hiermee effectief toegang tot het collectief literaire geheugen van de mensheid. Maar.

Maar is dit wel zo’n grote prestatie? Oorspronkelijk was het scannen alleen bedoeld om de boeken online beschikbaar te maken. Google heeft ze nu ook beschikbaar gemaakt als ePub. Het is mogelijk om ze te downloaden en op je ereader te lezen, als deze ePub ondersteund.

Als we kijken naar Treasure Island van Robert Louis Stevenson, dan valt het op dat de ePub versie niet gelijk is aan de gescande versie van het Google Books Project.

Het openingsgedicht in de gescande versie staat netjes gecentreerd onder elkaar met ingesprongen marges. Bekijken we het ePub document, dan staat het gedicht aan de twijfelende koper schots en scheef over de hele pagina:

Links de scan, rechts de ePub versie.

En dat is niet het enige: zo is de inhoudsopgave in de gescande versie klikbaar, waardoor je makkelijk naar een hoofdstuk kunt komen. De ePub versie doet dit niet. Ook neemt de ePub versie de small caps (hoofdletters op kleine letter niveau) niet mee uit de scan.

Ook in een klassieker als Gulliver’s Travels zijn hele stukken tekst onleesbaar. Wat te denken van de titelpagina tekst in het ePub bestand: “First a Surgeon, and then a Caplaia of several Shijn” [sic] terwijl daar hoort te staan: “First a Surgeon, and then a Captain of several Ships”. Verder worden paragrafen afgebroken en gaan verder op de volgende pagina, staan er andere tekens zoals sterretjes, slashes en vishaken waar die niet horen te staan en blijken er enorm veel spelfouten in de tekst te zitten van het ePub document, zodat de tekst onleesbaar wordt. Enkele voorbeelden:

“When lhis adveiUure was at an end, I came back out of my house , having occeasion for fresh air.”

“I did not think myself bound in honour to discover, and I apprehended they might be lost or spoiled if I ventured them out of my possession. ……. ,
11-L.u./ – ,! “-.! i il< i .- j ,; -..
The yythor diverts the emperor and his no- bilify of both sexes in a very uncommon manner.”

Is dit ook het geval met Nederlandstalige ebooks? Worden deze ook verminkt in de ePub versie van de scans? Volmondig is dit nog niet met “ja” te beantwoorden. Veel van de Nederlandstalige ebooks zijn enkel in PDF beschikbaar en de enkeling die in ePub beschikbaar is, vertoont dezelfde gebreken als de twee andere genoemde ebooks. Hendrik Tollens Gedichten vertoont gelijke mankementen.

Heeft Google op deze manier 1 miljoen redenen online gezet om tegen het Google Book Settlement te stemmen? Voorlopig kun je beter je gratis ebooks downloaden van Project Gutenberg. Google dient de ebooks eerst maar eens na te kijken voordat ze ze online zetten.

(Via: Computershopper.)

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in