Este post também foi publicado no blog do seminário acedêmico que antecedeu a OpeDataCon, que aconteceu em Ottawa em maio e contou com a presença do Centro Web/W3C Brazil como participantes da atividade sobre a padronização de dados abertos. Para ler em inglês, acesse aqui.
Os ativistas das comunidades de Dados Abertos e os governos que estão envolvidos com iniciativas como a Open Government Partnership às vezes parecem dançar músicas diferentes. Talvez isso se dê porque ainda não conseguimos alcançar o ponto do ecossistema de dados abertos onde esperamos encontrar dados abertos dando origem à avanços na transparência dos Governos em uma cadeia de negócios e inovações com crescimento econômico.
Pesquisadores com foco no estímulo dos ecossistemas de dados abertos continuam a procurar métodos e processos que vão levar publicadores de dados a prover recursos que satisfaçam as necessidades dos stakeholders, tanto desenvolvedores quanto empresas e até instituições sem fins lucrativos ou indivíduos, cada um com demandas específicas de dados.
Por outro lado, vários esforços em torno da abertura de dados tiveram sucesso nos ultimos anos. Governos abriram dados ainda que sem a adoção de padrões internacionais ou mesmo de guidelines para a publilcação desses dados, provando que existe uma força por trás da abertura de dados e que isso também impulsionou a transparência. Mas, agora que há mais dados abertos, talvez seja tempo de começar a usar padrões para seguir em frente e passar da publicação esporádica e simples á abertura sistemática e constante de dados.
Embora não exista uma resposta conclusiva à pergunta que dá nome à esse post, existem uma série de hipóteses claras que cercam o mundo do reúso de dados abertos. No Brasil, por exemplo, o método de utilizar hackatons como “aperitivos” foi largamente utilizado em uma tentativa de mostrar aos gestores os possíveis benefícios do uso dos dados abertos, sua capacidade de trazer transparência aos governos e também de aumentar a disponibilidade de aplicativos para cidadãos utilizarem os dados.
No último ano houveram mais de 10 hackatons e desafios envolvendo Dados Abertos no Brasil, muitos como o Open Data Day Brazil – que aconteceu no Calango Hacker Club na capital do Brasil, trouxeram resultados impressionantes. Mas, mais que aplicativos, o trabalho dos hackers cívicos trouxe também à tona a discussão sobre melhores práticas para a publicação de dados Abertos. Por exemplo: no concurso promovido pelo W3C em parceria com o Ministério da Justiça, um dos resultados mais importantes foi uma discussão que aconteceu no GitHub, nas issues, sobre a qualidade dos dados abertos e como poderiam ser estruturados para o uso em apps. Através dessa conversa os desenvolvedores limparam a base e puderam utilizar a mesma como uma base comum entre os competidores.
Estes exemplos, entre outros, apontam a importância de oferecer dados utilizando padrões internacionais para aumentar o reuso dos dados, e não apenas cumprir a abertura de dados em si, mas usar os dados para cumprir metas de transparência e acontabilidade. As comunidades de Dados Abertos precisam focar no desenvolvimento de padrões e melhores práticas para a abertura de dados em âmbito internacional para agilizar os processos e otimizar a cadeia produtiva.
Baseado nessas premissas, o W3C inaugurou em 2013 o Working Group de melhores práticas para Dados na Web, que tem baseado seu trabalho na listagem de desafios encontrados em sua lista de use cases.
Os casos de uso coletados foram um importante ferramenta para identificar os desafios prioritários para a publicação efetiva de dados na Web. Estes desafios estão descritos na figura abaixo e estão conectados com aspectos técnicos em particular. Em resposta à cada desafio o WG estabeleceu Best Practices que ainda estão em desenvolvimento e abertas para a discussão e contribuição da sociedade.
O primeiro rascunho do documento de Best Practices tem uma tradução em pt-br e pode ser acessado aqui. O trabalho do WG de CSV na Web também está relacionado com a publicação e uso de dados na web e vale a pena ser conferido.
A fronteira entre dados Públicos e dados abertos: como lidar?
Apesar das recomendações do DWBP estarem focadas em aspectos técnicos dos dados abertos, é importante notar que alguns gargalos políticos estão sempre presentes e intimamente conectados com algumas best practices. Discussões sobre licenciamento de dados, privacidade, segurança, por exemplo, tem um papel importante na mesa das dicussões e não podem ser jogados fora ou deixados de lado como aspectos técnicos quando se fala em fóruns como a OGP.
Logo, para desenvolvermos melhore práticas, precisamos formular mais perguntas:
- Quais são os limites entre as esferas técnica e política nas práticas de dados abertos?
- Podemos estabelecer guidelines em leis e regulamentações?
- O quão longe estão as melhores práticas para dados na web das práticas de mineiração de dados públicos, principalmente em cenários como os de busca de dados para pesquisa em cenários problemáticos de grandes cidades?
Padronizar tecnologias e métodos para distribuir e compartilhar dados tem um papel vital no engatilhamento do cicle dos dados abertos porque tem como consequencia a interoperabilidade e aumento no reuso dos dados. Datasets que podem ser lidos por máquinas estão prontos para ser utilizados por desenvolvedores e consumidos por serviços e aplicações de uma maneira eficiente e mais rápida. Além disso, métodos adotados por instituições que trabalham com dados públicos e também os métodos utilizados para abrir estes dados podem ser adicionados como aspectos a serem observados. Tais podem vir a ser um passo importante para o desbloqueio do poder dos dados abertos como ferramenta para transparência e acontabilidade de governos e empresas.
A grande questão, afinal, é como podemos continuar a desenvolver estar melhores práticas e como podemos colocar grupos técnicos e políticos envolvidos em um debate compartilhado.