O Google anunciou o lançamento do seu Refine 2.0, uma ferramenta de software de código aberto para trabalhar com conjuntos de dados desorganizados, anteriormente conhecido como Freebase GridWorks. Utilizando o Refine 2.0, os usuários podem limpar conjuntos de dados inconsistentes, convertê-los de um formato para outro e estendê-los utilizando os novos dados de serviços externos da Web ou outras bases de dados.
A versão 2.0 da ferramenta web de filtragem de dados apresenta uma arquitetura de novas extensões e de um reconciliation framework para a ligação de registros para outros bancos de dados, tais como Freebase. Outras mudanças incluem um novo importador JavaScript Object Notation (JSON), várias correções de bugs e adição de um número de comandos de transformação e expressões novas. Em julho deste ano, o Google adquiriu o Metaweb que originalmente criou o projeto open source Freebase GridWorks Até o presente momento, Freebase GridWorks 1.0 tem sido utilizado, por exemplo, pelo Chicago Tribune, ProPublica e data.gov.uk.
Mais informações sobre este release, incluindo três vídeos de introdução, pode ser encontrados em uma postagem no blog Open Source at Google [2] e no seu registro de alterações. Google Refine 2.0 está disponível para download a partir do Google Code e é distribuído sob uma licença New BSD.
Saiba Mais:
[1] Google Refine: http://code.google.com/p/google-refi.../ChangesFor2p0
[2] Open Source at Google: http://google-opensource.blogspot.co...ower-tool.html