Plataforma Semântica OD4D

Plataforma Semântica OD4D

A Nova plataforma OD4D é uma suíte de softwares feitos para criar uma rede pessoas e instituições dedicados ao tema: dados abertos para o desenvolvimento completamente linkada e semântica!

experimento

experimento

  • Tecnologias
  • Autores
  • Github

Autores:

Contextualização

O projeto OD4D é uma iniciativa do escritório do W3C no Brasil em parceria com a Comissão Econômica para a América Latina e o Caribe (CEPAL) e financiado pelo IDRC. Tem como um de seus propósitos promover uma comunidade de gestores de políticas públicas, oficiais de governo e pesquisadores na região da América Latina e Caribe, conscientizando-a sobre o potencial dos dados abertos e sobre estratégias adequadas para implementações de sucesso.

O projeto Dados Abertos para o Desenvolvimento (OD4D) tem como objetivo contribuir para o desenvolvimento de estratégias em dados abertos que levem à transparência governamental, serviços inovadores e à efetividade de políticas públicas em setores importantes da indústria, fomentando uma economia de conhecimento mais inclusiva na região da América Latina e países em desenvolvimento. Para alcançar essa meta, a idéia é investigar as potencialidades dos dados abertos nas políticas públicas em três eixos: transparência, novos serviços e desenvolvimento equitativo.

Está em início uma nova etapa do projeto que prevê iniciativas como uma reformulação do portal OD4D, desenvolvida por parceiros da Thoughtworks. O novo portal tem como proposta transformar o projeto OD4D em uma referência em plataforma de dados abertos que possibilite o aprendizado da tecnologia, a troca de informações pela comunidade e a produção de conteúdo semântico.

Assim, a plataforma servirá de hub para investidores, governos, instituições e indivíduos que tenham intenção de trabalhar juntos na criação colaborativa de uma rede ao redor do tema Dados Abertos na América Latina, África, Ásia e Caribe.

O desenvolvimento do portal foi finalizado em outubro de 2014, e a ideia é que a própria plataforma seja um case por si só de dados abertos. Para tal, a plataforma oferece um ambiente no qual as pessoas podem publicar informações e também se informar a respeito de dados abertos e temas correlatos. O sistema consiste em três módulos principais: o publicador, o parser e o armazenador. O módulo publicador facilita a inserção de novas informações alimentando a plataforma. O parser processa canais RSS de parceiros e extrai triplas semânticas sobre esse conteúdo. Finalmente, o armazenador guarda as triplas RDF encontradas utilizando a sintaxe Turtle com a ajuda da suíte Jena.

Também é oferecido um end-point de consulta semântica para que os usuários possam acessar essas informações provenientes do repositório de triplas coletadas. Por fim, toda essa plataforma está disponível no Github para qualquer pessoa que queira construir um site ou plataforma semânticos sobre algum outro domínio.

Em sua primeira fase de implementação, de 2011 a 2013, foram produzidas várias ações e produtos, como: o Tool Kit de Curso de Dados Abertos, licenciado em Creative Commons; o mapeamento das principais iniciativas para a divulgação de dados econômicos, sociais e ambientais estruturadas na América Latina e no Caribe; a produção de cinco artigos inovadores sobre Dados Abertos; o concurso de softwares com uso de dados abertos (De Olho nas Emendas; Adote um pedido; Retrato da Violência; Multas Sociais; Proprietários do Brasil; Reputação S/A; Samambaia DF; Polidatos Uruguai); o site Mapa da Cultura; a Conferência Regional para América Latina e o Caribe e dois vídeos: Datos Abiertos Gubernamentales y el Proyecto OD4D e Dados Abertos para Um Dia a Dia Melhor.

Desafios Envolvidos

Para Tassia Spinelli, especialista em experience design da Thoughtworks, as principais dificuldades técnicas enfrentadas no desenvolvimento da nova plataforma OD4D têm sido aprender sobre Linked Data e Web Semântica, principalmente descobrir as suas aplicações práticas. Os próximos desafios para a finalização do projeto são: fazer a importação dos dados do site antigo para a nova plataforma, relacionando esses dados de forma semântica e integrada com a nova arquitetura de informação e experiência de uso; criar a mecânica de envolvimento dos parceiros e colaboradores na produção de conteúdo e em seguida divulgar e criar parcerias com organizações que queiram se conectar com a plataforma.

Já para líder do projeto no W3C Brasil, Yasodara Córdova, o principal desafio é encontrar uma maneira de transformar o uso das principais recomendações relacionadas à Web Semântica, como o RDF, em benefícios que o usuário possa perceber através do uso da plataforma. “O usuário não enxerga se você está usando o modelo RDF para representar os metadados ou se está listando em um csv. Quando o uso de tecnologias baseadas no modelo RDF saltar aos olhos dos usuários comuns vai ser a hora em que a Web Semântica vai pegar pra valer”.

Linguagens e tecnologias utilizadas

O sistema foi construído com recursos de Web Semântica e Linked Data. Para auxiliar na criação da aplicação web, foi utilizado o framework Ruby on Rails. O CMS é baseado em ruby tambem, seu nome é CaseIN. Já o tratamento de triplas RDF em sintaxe Turtle e o seu interfaceamento com um servidor HTTP foram implementados utilizando as tecnologias Jena e Fuseki.

Já no frontend, foram utilizados HTML, CSS e JavaScript.

Share:

Veja também