Skip to content

JaTvoiRabotnik/queriDO

 
 

Repository files navigation

"Projeto Nosso Querido Diario Oficial", abreviadamente queriDO.

A comunidade mantenedora deste projeto é formada por dois grupos:

  • curadorias: definem os "alvos", estabelcem para quais assuntos e diários oficiais desejam voltar seus olhares, fazer suas explorações, e mais tarde entregar seus relatórios e pareceres.
    PS: não há restrição à participação em mais de uma curadoria.

  • experts: entusiastas de dados abertos e data scraping, ajudando a curadoria a achar a "agulha no palheiro", e preparar milhares de separatas de diários oficiais para constituir um corpus textual de análise: bem estruturado e suficientemente completo para cada alvo definido pelas curadoriais.
    PS: um expert pode também ser membro de uma curadoria; existe um subconjunto dos experts que contribui também no desenvolvimento do software do projeto.

Clique aqui para testar as separatas elencadas pela Curadoria da ciclovia Tim Maia.

Maiores detalhes ver um breve histórico do projeto.


Dinâmica de um ciclo de registros

Dinâmica da formação de alvos e conteúdos neste projeto:

Passo-1. Manifestação de interesse. Um grupo de pessoas (curadores) entra em contato com o projeto e se registra nesta planilha (editável neste GDoc), estabelecendo informalmente uma denominação e um alvo.

Passo-2. Formalização da curadoria e seu alvo. Acolhidos por pelo menos um membro da OKBr, que auxilia o grupo expor mais detalhes sobre motivações e metas, num Relatório de Apresentaço como este (report/curadoria001-apresent.md). Havendo necessidade os dados da planilha são modificados para refletir melhor o expresso pelo relatório.

Passo-3. Testes, prospecção e avaliação da viabilidade. Com apoio do grupo de experts, a nova curadoria faz testes de prospecção (usando outras ferramentas como o Diário Livre, os diversos diários oficiais, etc.) e define com mais precisão seu alvo, reformulando-os se necessário. Com os testes também refina o seu relatório e "bate martelo" sobre qual Diário Oficial e quais anos prospectar.

Passo-4. Resgate dos origiais. A equipe de experts recupera os conteúdos oficiais (separatas de Diários Oficiais) de forma o mais fiel possível, armazenando no git do presente projeto todos os conteúdos originais.

Passo-5. Filtragen. A equipe de experts avalia a melhor forma de "limpar" os originais e armazená-los como conteúdos filtrados. Com este conteúdo disponibilizado em ferramentas de busca e visualização, torna-se possível decidir quais elementos precisam ser marcados. Nesta etapa a curadoria também já pode se manifestar sobre a fidelidade e completeza do material obtido.

Passo-6. Marcação. A equipe de experts avalia a melhor forma de "marcar" os conteúdos filtrados para destacar e organizar com precisão todas as informações a serem extraídas e relacionadas entre si.

Passo-7. Revisão do levantamento e da marcação. A curadoria avalia o material marcado e seu uso, eventualmente solicitando mais conteúdos, por exemplo matérias citadas (adendos que citam contratos, leis que citam outras leis, etc.)

Passo-8. Relatório da curadoria. Em posse de toda a informação a curadoria emite um parecer e um ou mais relatórios onde faz uso das informações para as finalidades desejadas.

Todos os conteúdos, originais e marcados, são preservados no git por tempo indeterminado (horizonte de anos). O ciclo pode se repetir para aprofundamentos ou ampliação das pesquisas.

Avaliando conteúdos

Testes básicos de visualização podem ser realizados em https://okfn-brasil.github.io/queriDO/ (ilustração abaixo).

Os passos 4, 5 e 6 descritos acima são indicados nas visualizações como "resultantes" 1, 2 e 3 respectivamente.

Os termos coloridos são justamente os elementos marcados: definem em contexto adequado a valores, citações, códigos ou nomes relevates para a análise e cruzamento de dados no diário oficial. Softwares adicionais podem compor planilhas de dados extraídos de dezenas ou milhares desses registros.


Licensas livres

Esta iniciativa é mantida pela Plataforma de Projetos da OKBr.

Todos os softwares e conteúdos deste projeto são livres, em conformidade com a OpenDefinition:

Releases

No releases published

Packages

No packages published

Languages

  • HTML 100.0%
  • Python 0.0%
  • PHP 0.0%
  • Jupyter Notebook 0.0%
  • Go 0.0%
  • SQLPL 0.0%