• Google: Quase 130 Milhões de Livros Impressos no Mundo

    Você tem idéia de quantos livros existem no mundo? Não em quantidade impressa, mas assim como existem pessoas e elas são únicas, quantos títulos impressos existem no mundo? O Google tem essa resposta. Afinal, uma das missões hercúleas dessa Gigante da Internet é digitalizar toda e qualquer obra literária existente em meio físico. Atualmente temos quase 130 milhões de livros impressos no mundo ( para ser exato, a última contagem chegou ao valor de 129.864.880 livros). E lembre-se que a cada dia que passa, centenas de títulos impressos surgem, e esse número encontrado é uma aproximação razoável de uma quantidade dinâmica crescente de livros no mundo. Sim! Não importa em que estágio tecnológico estamos. Ainda não conseguimos "matar" os livros impressos, e eles continuam surgindo a todo momento.

    E não pense que a resposta veio fácil. Da pergunta inicial "Quantos livros tem lá fora?" os responsáveis pelo projeto de digitalização de obras impressas se depararam com uma questão mais fundamental ainda: "O que exatamente é um livro?". Pode parecer brincadeira, mas a resposta não é tão simples quanto aparenta ser.

    De início o Google já indicou que "obras científicas" e "criações intelectuais e artísticas" não entram na contagem. Outra falta de sentido seria considerar todas as edições de "Hamlet" existentes no mundo. Outro ponto a se isolar seriam os livros cujos títulos possuam diferentes prefácios e comentários. E depois de muita pesquisa e análises de casos "alienígenas" encontrados, uma das definições (sim, um livro parece possuir mais de uma definição) razoável era a de "tomo", ou "volume". Essa identificação é facilmente encontrada na estrutura organizacional de enciclopédias, e menos notadas (mas não raro)m em obras que abrangem mais de um volume impresso.

    Mas essa definição também tem seus problemas. Como exemplo, existem várias edições da obra "Anjos e Demônios" de Dan Brown, ou apenas algumas cópias obscuras de uma tese de lingüistica esquecida no fundo de uma biblioteca universitária. A definição é conveniente mas ainda trás muita dor de cabeça para a equipe do projeto de digitalização. Outro problema é a contagem de edições de capa dura e normal, que acabam sendo contadas duas vezes.

    De acordo com o projeto, a identificação de obra única é muito semelhante ao que o ISBN se destina: uma "impressão digital" de cada livro. O ISBN poderia ser comparado, em uma analogia, ao nosso CPF. Cada indivíduo possui um número único. E os livros seguem a mesma "filosofia". Mas então porque não utilizar o sistema de numeração ISBN (e seu precursor, o SBN) para catalogar os livros? Por um "pequeno" motivo: o sistema de numeração somente começou a ser implantado em meados da década de 1960, mas só foi realmente adotado em todo o mundo por volta da década de 1970. Antes desse período não havia padrão ou consenso para "cadastrar" ou "rotular" uma obra (i. é, dar a ela uma identificação única).

    Tudo bem que seja senso comum, e ponto pacífico, que no século 20 e atual 21, tivemos um boom de publicações de livros impressos. Se juntarmos todas as atuais publicações da última década, teremos milhões de livros publicados. Talvez a comparação seja de 10:1. Mas mesmo assim, aqueles 10 por cento pré-ISBN ainda são uma verdadeira dor de cabeça para serem identificados, rotulados, e catalogados (para então, serem digitalizados).

    E não pense que os livros da Era pós-ISBN não dão dor de cabeça. O projeto já encontrou várias obras fora dos padrões de identificação via ISBN, com obras de diferentes títulos e autores "compartilhando" o mesmo ISBN (a estimativa é de 2 a 1.500 livros existentes que tenham problema de identificação via ISBN por repetição numérica).

    outra dor-de-cabeça pós ISBN é que muitas "coisas" estão sendo rotuladas com essa identificação; de CDs a camisetas. Parece loucura, mas é a pura (e ingrata) realidade. A brincadeira não para por aí, e recomendo a leitura do post original do projeto de digitalização de livros do Google. Vale a leitura para conhecer mais sobre o projeto e os desafios da equipe em alcançar seus objetivos.


    Links de Interesse:

    - Books of the world, stand up and be counted! All 129,864,880 of you

    Sobre o Autor: saryshagan


Visite: BR-Linux ·  VivaOLinux ·  Dicas-L