Società e Costume
Sabato 07 Agosto 2010
Google conta i libri del mondo
Sono "solo" 130 milioni
Il motore di ricerca Google, con con la sua branca Google Books vuole digitalizzare tutti i libri del mondo, ha avviato una sorta di censimento che però deve fare i conti con le diverse forme di catalogazione. Alla fine però è arrivato a definire un numero preciso
I tecnici della divisione libri di Google hanno preso come punto di partenza la definizione di "tomo". Ogni singolo tomo infatti può esistere in una o due copie, come per gli antichi manoscritti, oppure in milioni come potrebbe essere per un bestseller. Un problema sorge però nel trattare l'edizione economica e quella rilegata che, pur essendo il medesimo libro, vengono conteggiati come tomi diversi.
Altra definizione su cui Google si appoggia è quella dell'International Standard Book Number, ma anche questa è incompleta: l'Isbn è relativamente nuovo (esiste dalla metà degli anni Sessanta), soltanto alcuni paesi occidentali lo hanno adottato e talora assegna lo stesso numero a diversi libri, o addirittura ad oggetti diversi dai libri come Cd e magliette.
Altri identificatori sono il Library of Congress Control Number e il World Cat Accession Number, che però si riferiscono a "entità bibliografiche". Per esempio le "Lecture Notes in Mathematics" sono una serie monografica composta da migliaia di volumi a cui è però assegnato un singolo numero Oclc.
Google Books, per essere il più possibile precisa, raccoglie dati aggregati sui libri da diversi provider (circa 150). Successivamente analizza le informazioni provenienti da fonti diverse nel tentativo di ridurre le ripetizioni. Da oltre un miliardo di segnalazioni, questo processo ha ridotto il numero di "potenziali libri" a poco meno di 600 milioni.
Altra fase del processo di scrematura per arrivare ad identificare un libro mira ad evitare le duplicazioni di dati provenienti da uno stesso provider. Questa restringe ulteriormente il numero di libri, e da 600 milioni si è arrivati a 210 milioni. Al numero definitivo si arriva escludendo i registri che non corrispondono a libri ma a registrazioni audio, video, mappe e alle circa milla magliette con numeri Isbn. Tenendo in considerazione solo oggetti che sono stampati e rilegati si giunge a una cifra vicino ai 146 milioni. Se da questa si sottraggono i numeri seriali che, per ammissione dei suoi stessi tecnici, Google Books ancora non tratta con la doverosa attenzione, il numero finale si riduce ulteriormente, portando il totale a 129.864.880.
© RIPRODUZIONE RISERVATA