zaterdag 14 februari 2009

Google en het scannen van boeken

Eén van mijn interessantste ontdekkingen op de TOC Conferentie in New York betreft de boekscanner van Kirtas. Ik had werkelijk geen idee dat dergelijke scanner daadwerkelijk bestaat. De scanner bladert zelf door boeken en fotografeert de twee pagina’s die bloot liggen onmiddellijk. Op die manier worden 40 pagina’s per minuut gescand, gefotografeerd en uiteindelijk door middel van een tekstherkenningsprogramma ook doorzoekbaar gemaakt.

Is hiermee het raadsel Google Book Search opgelost? Helaas nog steeds niet. Google is bezig enorme hoeveelheden boeken doorzoekbaar te maken. Dat doen ze onder meer met de boeken van Universiteitsbibliotheek van de Rijksuniversiteit Gent. Google, het bedrijf dat zegt alle informatie van de wereld openbaar te willen maken, doet bijzonder geheimzinnig over het project in Gent. Op de eenvoudige vraag hoe Google de boeken scant heeft nog niet één journalist antwoord gekregen.

De vraag is iets specifieker. De vraag is of Google de boeken handmatig scant – huren zij daar studenten voor in die de bladen stuk voor stuk omdraaien? Of gebruikt Google machines, zoals de Kirtas? De vertegenwoordiger van Kirtas die ik in New York sprak beweert dat Google in elk geval nooit één van zijn boekscanners gekocht heeft of gehuurd. Wel beweert hij dat hij enkele concurrenten heeft die vergelijkbare machines produceren. Waardoor andermaal niet uit te sluiten valt dat Google daar gebruik van maakt. Maar waarom Google daarover geen informatie prijs geeft, blijft één van de grote raadsels van Google. Alle informatie van de wereld willen openbaar maken, als het maar niet over Google zelf gaat.

Geen opmerkingen:

Een reactie posten