Publicaties
De lange staart van de Boekentoren
3 Reacties
© Geert Roels
© Geert Roels © Geert Roels
maatschappij

De lange staart van de Boekentoren

Over de deal tussen Google Books en de Gentse universiteitsbibliotheek

Op 23 mei 2007 ondertekenden Google en de Universiteit Gent een overeenkomst. De Boekentoren werd daarmee wereldwijd de vijftiende instelling die instapte in de ambitie van het Amerikaanse bedrijf om het papieren werelderfgoed te digitaliseren. Samen met de Koninklijke Bibliotheek in Den Haag (14 juli 2010) is de Gentse universiteitsbibliotheek nog altijd de enige bibliotheek uit de Lage Landen waarvan de collectie is opgenomen in Google Books. Het eerste shipment vertrok op 11 oktober 2007, de laatste vracht oude drukken verscheen in 2018 online. Tijd voor een balans.

Google werd opgericht in 1998 met als doel “alle informatie ter wereld te organiseren en universeel toegankelijk en bruikbaar te maken”. Aan het begin van de jaren 2000 had Google ongeveer het hele web geïndexeerd en ontsloten via het PageRank-algoritme, dat Larry Page en Sergey Brin ontwikkeld hadden in de garage van Susan Wojcicki, die vandaag CEO van YouTube is. Nieuwe informatiebronnen kwamen in beeld. In 2004 ontwikkelde het dan al beursgenoteerde bedrijf Google Scholar, een bibliografische databank die wetenschappelijke tijdschriften doorzoekbaar maakte, en lanceerde het Google Books. Op 14 december kondigde het bedrijf aan dat “it would digitize the ‘world’s knowledge’”. Met vijf grote onderzoeksbibliotheken, waaronder die van Harvard en Stanford, had het een samenwerkingsakkoord gesloten om vijftien miljoen boeken uit hun collectie in te scannen. Andere akkoorden volgden snel.

Na de kennis ontsloten te hebben die digital born was, wilde het bedrijf door massascan de informatie die nog gevangen was in een papieren behuizing converteren en onder controle brengen, in het bereik van de algoritmes van zijn zoekrobot. Het plan was in feite een logisch gevolg van de doelstelling om alle informatie universeel toegankelijk te maken (en van het businessmodel dat erachter school). Het toevoegen van data uit analoge formaten zou Google nog beter maken. De investeringen in Google Books waren dan ook strategisch.

Modern Alexandrië of Napster voor boeken?

De reacties op de aankondiging waren verdeeld. Google Books beloofde (en belooft nog altijd) op termijn een vrije toegang tot het wereldpatrimonium. Een universele bibliotheek, die kosteloos en altijd toegankelijk is: het lijkt het Alexandrië van de moderne tijd. Toch waren er van meet af aan ook belangrijke bezwaren. Mag het verzamelde patrimonium wel in handen gelegd worden van een private multinational, vroegen de critici zich af? Wat gebeurt er als Google ooit failliet gaat? En is universele toegankelijkheid voldoende om alle juridische bezwaren rond privacy en intellectuele eigendom van de tafel te vegen?

Tegenstanders wezen op “de totalitaire ambities van Google” en beschreven een scenario waarin de samenleving zich vrijwillig uitleverde aan een big brother. “Non à la privatisation du savoir”, liet Patrick Lefèvre, directeur-generaal van de Koninklijke Bibliotheek in Brussel, in 2008 optekenen. Aan auteurszijde werd gevreesd voor een “Napster for Books”. De Amerikaanse Authors Guild spande een copyrightzaak aan tegen het scanprogramma van Google Books, die na een lange beroepsprocedure door het bedrijf gewonnen werd. In Europa trok vooral Frankrijk ten strijde. In april 2005 reageerde het hoofd van de Bibliothèque Nationale, Jean-Noël Jeanneney, in Le Monde met een bijdrage die hij zou uitwerken tot Google and the Myth of Universal Knowledge: A View from Europe (2007). Aan de juridische claim rond copyright en de maatschappelijke vraag of het werelderfgoed beheerd mocht worden door een beursgenoteerd bedrijf, voegde Jeanneney een derde argument toe: de universele bibliotheek van Google dreigde in de praktijk op een Angelsaksisch cultureel imperialisme uit te draaien.

Tegenstanders wezen op “de totalitaire ambities van Google”

De campagne van Jeanneney zou twee gevolgen hebben. De Europese Unie lanceerde een eigen platform voor het digitaliseren van het cultureel erfgoed uit de Europese archieven, musea en bibliotheken: www.europeana.eu, terwijl Google op zoek ging naar bibliotheekpartners die zijn programma konden aanvullen met niet-Engelstalige fondsen. Dat was de strategische reden waarom Google in 2007 de universiteitsbibliotheek van Gent vroeg om haar collectie te laten digitaliseren in Google Books.

Een ontmoeting in Silicon Valley

De toevallige reden was een ontmoeting van hoofdbibliothecaris Sylvia Van Peteghem in Silicon Valley. Zij was uitgenodigd op een missie van de toenmalige Vlaamse minister van Wetenschapsbeleid Fientje Moerman in de Verenigde Staten. Een bezoek aan de Rem Koolhaasbibliotheek stond op het programma en er was een netwerkevent in Stanford. Daar ontmoette Van Peteghem Wim De Waele van het Belgische Instituut voor Breedbandtechnologie, die contact had met een Indiase topman van Google. De eerste interesse werd gewekt. Terug in Europa, op 2 februari 2007, bezocht de Parijse Google-vertegenwoordiger Philippe Colombet de Boekentoren. De interesse werd bevestigd, en een week later kwam een zestal Google men ingevlogen van wie de naam niet werd bekendgemaakt. Ze droegen allemaal zwarte rugzakken met in kleurrijke, geborduurde letters het opschrift Google. Van Peteghem leidde hen rond in de toren, toonde de collecties en liet Gentse digitaliseringsprojecten zoals Recollecting Landscapes voorstellen. Ook de link tussen Google en de negentiende-eeuwse bibliografische ondernemingen van Paul Otlet (het Mundaneum) en van Gents hoofdbibliothecaris Ferdinand vander Haeghen werd gelegd. Aan het einde van de middag was er een kort intermezzo, waarna een van de Google men opstond en zei: “From our side, it’s a deal. We love your building, your collection and your team.”

Op 10 mei 2007 keurde de raad van bestuur van de universiteit de overeenkomst met Google goed en op 23 mei volgde er een gemeenschappelijke persvoorstelling. De uitstraling die de universiteit verwierf met het akkoord was onbetaalbaar, en gaf een stevige duw aan de plannen voor de restauratie van de Boekentoren die op dat ogenblik in opmaak waren.

De bibliotheek heeft bedongen dat er altijd een gratis exemplaar van haar scans aangeboden moet worden

Als gevolg van de overeenkomst kwamen alle gedrukte boeken (bijzondere formaten uitgezonderd) ouder dan 1870 in aanmerking voor digitalisering; dat waren er ongeveer 250.000. Google scande kosteloos. De Boekentoren stond in voor de selectie en voorbereiding van de shipments. Er werd een Google-team samengesteld dat aan de hand van picklists de collectie filterde. Op 6 september 2007 vertrok een testlading van vijf drukken. Op 11 oktober 2007 verliet de eerste volwaardige partij de Boekentoren, die bestond uit ongeveer vijfduizend volumes. In 2007, 2008, 2009 en 2010 werd dit ritme van vijfduizend maandelijkse volumes aangehouden. Vanaf 2011 gingen de ladingen tweemaandelijks. In april 2015 vertrok de laatste reguliere zending naar Google.

De gescande volumes werden door Google onmiddellijk zichtbaar gemaakt in Google Books. De Boekentoren ontving gratis een digitale kopie en had onderhandeld dat op elk gedigitaliseerd exemplaar het watermerk van de UGent kwam te staan. Om de criticasters die vonden dat de bibliotheek zich liet uitkleden door een commerciële speler voor te zijn, had de bibliotheek ook bedongen dat er altijd een gratis exemplaar van de Gentse scans aangeboden moest worden.

Klikken uit China

Van bij het begin was het Gentse programma van Google Books succesvol. Elke maand kregen duizenden volumes een nieuw leven online. Elke dag openden duizenden internetgebruikers de gedigitaliseerde collectie. In december 2011 waren er al 113.000 Gentse titels (en 181.000 volumes) opgeladen in Google Books, waarvan de pagina’s dagelijks ongeveer 400.000 maal geopend werden. Op topdagen, zoals 23 oktober 2012, haalde Google Books 1,7 miljoen hits (uitgedrukt in aantal aangeklikte pagina’s). Tussen de Gentse treffers bevonden zich fraaie, geïllustreerde botanische titels zoals de British entomology, being illustrations and descriptions of the genera of insects found in Great Britain and Ireland, die tussen 1824 en 1839 in zestien volumes bij Richard Taylor in Londen verscheen; reisverslagen, zoals de tweedelige Travels through Sweden, Finland and Lapland to the North Cape, in the years 1798 and 1799 (1802) van de avonturier Giuseppe Acerbi, waarvan de Gentse exemplaren in 1908 verworven waren uit de nalatenschap van Virginio Armellini; en antropologische studies, zoals Die Völker des Erdballs nach ihrer Abstammung und Verwandtschaft (1847), waarvan Google ook de negentiende-eeuwse, handgeschreven opdracht gescand had: “à la bibliothèque de l’Université de Gand, hommage.” Deze titels werden niet alleen wereldwijd zichtbaar, maar ook integraal doorzoekbaar.

Sinds het aantreden van Van Peteghem was het zichtbaar maken van de collectie een prioriteit. Dankzij Google Books maakte die prioriteit een kwantumsprong. In 2013 – het laatste jaar voor ze dichtging voor restauratie – telde de Boekentoren gespreid over heel het jaar ongeveer 230.000 inkomende fysieke bezoeken. Dat was een aantal dat Google Books nu om de paar dagen benaderde. In 2011, het laatste jaar waarin Google de geografische herkomst meedeelde, klikte 22.3 procent van de digitale bezoekers uit China, 19.8 procent uit de Verenigde Staten, 16.5 procent uit Frankrijk, 4.6 procent uit Duitsland, 4.2 procent uit België, 3.5 procent uit Nederland en de rest uit figuurlijk kleinere landen.

Google landde in Gent om niet-Engelstalige fondsen toe te voegen aan zijn programma. Dat is gelukt

Aan de officiële shipments is sinds 2015 een einde gekomen. Maar als de gelegenheid zich voordoet, wordt er nog bijkomend gedigitaliseerd. De bibliotheekcollectie van de Koninklijke Academie voor Nederlandse Taal en Letteren, die onlangs overgedragen werd aan de Boekentoren, bevatte bijvoorbeeld een collectie oude drukken die geschikt was voor Google Books. 1.700 volumes werden gedigitaliseerd opengesteld.

Op dit ogenblik loopt er een proefproject met het opladen van de collectie veilingcatalogi, die een grote waarde hebben in het internationale kunsthistorische onderzoek. De Boekentoren bezit er meer dan elfduizend, waarvan de oudste teruggaan tot het begin van de zeventiende eeuw. Vaak gaat het om geannoteerde exemplaren. In augustus 2019 vertrekt het eerste shipment.

Uit de laatste cijfers van 2018 blijkt dat er elke dag gemiddeld vijftigduizend Gentse boeken bekeken worden, met telkens één of meerdere pageviews.

Obscure titels

Google was in Gent geland om niet-Engelstalige fondsen toe te voegen aan zijn programma. Dat was gelukt: ongeveer een derde van de gescande boeken was Franstalig, een kwart Nederlandstalig en net geen 20 procent was opgesteld in het Latijn. Slechts 2 procent was Engelstalig. Bijna de helft van de Gentse titels die Google had opgeladen, stamde uit de negentiende eeuw, en telkens een kwart was gepubliceerd in de achttiende en zeventiende eeuw. Slechts enkele duizenden titels waren zestiende-eeuws.

Het opmerkelijke van Google Books is dat het niet de fraaie, negentiende-eeuwse botanische titels zijn die het vaakst geconsulteerd worden, of de prachtige reisverhalen. De populairste titel van het jaar is het traktaat Christian and Politick Reasons wherefore England and the Low-Countries may not have Warres with each other. Het drukje uit 1652 werd op 28 november 1869 verworven door hoofdbibliothecaris Vander Haeghen uit de verkoop van de pamflettencollectie van de Amsterdamse suikerbaron Isaac Meulman. Inhoudelijk moet het boekje – het telt acht pagina’s – gesitueerd worden in de oorlogen tussen Engeland en de Republiek in het midden van de zeventiende eeuw. In 2018 werd het wereldwijd meer dan tweeëntwintigduizend maal geconsulteerd. Het werd op de hielen gevolgd door Θεοδωρίτου ἐπισκόπου Κύρου και εὐαγρίου σχολαστικού ἐκκλησιαστική ἱστορία, een Grieks-Latijnse geschiedenis van de vroege kerk, in 1673 gepubliceerd in Parijs, die bijna twintigduizend maal geopend werd in Google Books.

Beide titels zijn vrij zeldzaam, maar geen unica’s. Er lijkt geen onmiddellijke verklaring voor hun succes, en wat hen vooral bindt, is hun obscuriteit. Dat geldt ook voor de volgende titels uit de top tien. Nummer drie is het Essai philosophique sur les probabilités (1829) van Pierre-Simon Laplace. Nummer vier is een bronnenuitgave, de Calendars of the Proceedings in Chancery, in the Reign of Queen Elizabeth (1829), waar ongeveer dertienduizend mensen naar surften. Nummer vijf is wel werelderfgoed: Hamlet van Shakespeaere, in een editie van de Charles Knight & Company uit 1843. Het werd elfduizend keer bekeken in 2018, half zoveel als het drukje uit 1652. De top tien van de populairste Gentse titels uit 2018 wordt roemloos afgesloten met het derde volume van de Calendars of the Proceedings in Chancery uit 1832. 7.642 maal werd het aangeklikt in Google Books.

Werelderfgoed?

Het is moeilijk om een verklaring te vinden waarom net deze titels het vaakst geconsulteerd werden. Het is mogelijk dat er ergens een onderzoeksprogramma loopt waardoor de gepubliceerde rechtspraak uit het zestiende-eeuwse Engeland erg in trek is, maar voor het overige is de lijst erg random. Nummer zeven is bijvoorbeeld de staatskalender van het Saksische hof uit 1735. Nummer acht is de Contextio gemmarum sive annales, een zeventiende-eeuwse becommentarieerde editie van een van de kerkvaders, die zowel de Hebreeuwse als de Latijnse versie bevat. Dergelijke nachttafellectuur werd meer dan achtduizend maal bovengehaald.

Wat wel duidelijk wordt uit meer dan tien jaar Google Books in Vlaanderen is dat wereldwijd het Latijn en Grieks nog altijd bekendere, of in ieder geval meer gezochte talen zijn dan het Nederlands. Geen enkel Nederlandstalig boek haalde de top tien van 2018. Maar er waren wel twee klassieke titels, net als twee Duitse, één Franse en vijf Engelse. Zeker in de wetenschap dat slechts 2 procent van de gescande boeken Engelstalig was (tegenover 24 procent Nederlandstalig), blijft die taal zeer dominant. De zorg van de Franse hoofdbibliothecaris Jeanneney was dus niet onterecht.

De long tail bestaat echt, ook in de wereld van oude drukken

De tweede conclusie is paradoxaler. De schaal van Google Books laat toe om te illustreren hoe zeldzame en obscure titels op mondiaal vlak toch een groot publiek kunnen trekken. Als je alle onderzoekers van de relaties tussen Engeland en de Republiek in de zeventiende eeuw kunt samenbrengen, zoals Google doet, vul je blijkbaar ook een aardige festivalweide. De long tail bestaat dus echt, ook in de wereld van oude drukken.

Misschien moeten we dus niet verbaasd zijn over de resultaten van Google Books. Misschien is het juist normaal – klaarblijkelijk – dat er op deze aardbol twintigduizend mensen wonen die kerkgeschiedenis vanuit het oorspronkelijke Grieks willen bestuderen. Het blijft ook een verheffende gedachte dat bijvoorbeeld ergens in India een theoloog zich kan buigen over een tekstfragment van Theodoretus Cyrensis dat geborgen is in een zeventiende-eeuwse druk die zich duizenden kilometers verderop bevindt in de Gentse Boekentoren. Of dat een man of vrouw uit China kan uitpluizen wat er nu precies in 1735 aan dat Saksische hof heeft plaatsgevonden. Met Google Books wordt er geen Vlaams erfgoed verspreid, maar wel het werelderfgoed dat zich in Vlaanderen bevindt. Dat is ook schoon.

De gegevens uit deze bijdrage zijn afkomstig uit het archief van de Boekentoren en een interview met hoofdbibliothecaris Sylvia Van Peteghem op 17 januari 2019. De cijfers over Google werden aangeleverd door Patrick Hochstenbach, digitaal expert van de Boekentoren. Alle vermelde titels zijn raadpleegbaar via lib.ugent.be of via Google Books.

Pieter Coupe

Beste Jef Van Staeyen,

Dank voor je reactie.
We zullen je vragen voorleggen aan de auteur.
De correctie de je suggereert, is uitgevoerd.

Vriendelijke groet

JefVanStaeyen

beste,
Enkele, diverse reacties,
1) Een boeiende en leerrijke bijdrage, die jammer genoeg stopt waar het pas echt begint.
2) Mag ik veronderstellen dat de naar Google gezonden boeken nadien ook zijn teruggekomen?
(Ik vermoed dat de boeken, ondanks het gewicht, het vliegtuig hebben genomen, maar ik hou ervan te denken dat ze per schip over de oceaan en de St-Laurent zijn gevaren, daar een tijdlang in het ijs hebben vastgezeten, en per trein over de Great Plains en de Rotsbergen in Mountain View zijn geraakt. De mannen en vrouwen die de zending begeleidden vonden het jammer toen de reis na zes weken ten einde kwam. Ze hadden graag nog langer gelezen.)
3) Waar Fientje Moerman noch de Universiteit Gent in geslaagd is, is het opzetten van een scanfabriek voor Europese boeken in Gent.
4) Als ik (bij toeval) op google books verzeil, krijg ik altijd onvolledige exemplaren. Hoe valt dat te rijmen met wat ik in het artikel lees?
5) In onderstaande zin suggereer ik de taalfout te corrigeren: "werd gelegd" ipv "werden gelegd". Het onderwerp "de link" is immers enkelvoud.
Ook de link tussen Google en de negentiende-eeuwse bibliografische ondernemingen van Paul Otlet (het Mundaneum) en van Gents hoofdbibliothecaris Ferdinand vander Haeghen werden gelegd.

met vriendelijke groet

ruben

Beste Jef,
Bedankt voor je reactie.
Wat betreft 2), is het in het echt wat minder avontuurlijk: de boeken worden hier in West-Europa gescand, het transport gebeurt op een veilige manier en de boeken komen ook ongehavend terug. Over 4) de onvolledige exemplaren (de zogenaamde 'snippets'): in Google books zit meer dan gescande boeken uit bibliotheken, er zijn er ook heel wat die wel nog onder copyright vallen, zie de hulppagina’s van Google (https://tinyurl.com/yxf59lup). Voor de gebruiker is dat natuurlijk zeer vervelend. Maar het gros van de UGent boeken is volledig beschikbaar.
Groet, Ruben

Aanmelden

Registreer je of meld je aan om een artikel te lezen of te kopen.

Belangrijk om weten


Bij aankoop van een abonnement geef je toestemming voor een automatische betaling. Je kunt dit op elk moment stopzetten door contact op te nemen met philippe.vanwalleghem@onserfdeel.be