modelagem e representação semântica de dados governamentais
Transcrição
modelagem e representação semântica de dados governamentais
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA INFORMAÇÃO MESTRADO EM CIÊNCIA DA INFORMAÇÃO UNIVERSIDADE FEDERAL FLUMINENSE INSTITUTO DE ARTE E COMUNICAÇÃO SOCIAL DURVAL VIEIRA PEREIRA MODELAGEM E REPRESENTAÇÃO SEMÂNTICA DE DADOS GOVERNAMENTAIS ABERTOS DA PREVIDÊNCIA SOCIAL BRASILEIRA Niterói 2014 DURVAL VIEIRA PEREIRA MODELAGEM E REPRESENTAÇÃO SEMÂNTICA DE DADOS GOVERNAMENTAIS ABERTOS DA PREVIDÊNCIA SOCIAL BRASILEIRA Dissertação de Mestrado apresentada como requisito parcial para obtenção do título de Mestre em Ciência da Informação do Programa de Pós-Graduação em Ciência da Informação da Universidade Federal Fluminense. Orientador: Profº. Drº. Carlos Henrique Marcondes NITERÓI 2014 P436 Pereira, Durval Vieira Modelagem e representação semântica de dados governamentais abertos da Previdência Social brasileira / Durval Vieira Pereira. – 2014. 168 f. : il. Orientador: Carlos Henrique Marcondes. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal Fluminense, Departamento de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2014. 1. Modelagem conceitual. 2. Dados governamentais abertos. 3. Web Semântica. 4. Acidente do trabalho. 5. Previdência Social. I. Marcondes, Carlos Henrique. II. Universidade Federal Fluminense. Departamento de Ciência da Informação. Programa de Pós-Graduação em Ciência da Informação. III. Título. CDD 025.48 DURVAL VIEIRA PEREIRA MODELAGEM E REPRESENTAÇÃO SEMÂNTICA DE DADOS GOVERNAMENTAIS ABERTOS DA PREVIDÊNCIA SOCIAL BRASILEIRA Dissertação de Mestrado apresentada como requisito parcial para obtenção do título de Mestre em Ciência da Informação do Programa de Pós-Graduação em Ciência da Informação da Universidade Federal Fluminense. Aprovada em:________________________________________. Banca examinadora: ________________________________________ Prof.º Dr. Carlos Henrique Marcondes – Orientador Universidade Federal Fluminense – UFF ________________________________________ Prof.º Dr. Cláudio José Silva Ribeiro – Membro Titular Universidade Federal do Estado do Rio de Janeiro - UNIRIO ________________________________________ Prof.ª Drª Maria Luiza de Almeida Campos – Membro Titular Universidade Federal Fluminense - UFF ________________________________________ Prof.ª Drª Regina de Barros Cianconi – Membro Titular Universidade Federal Fluminense - UFF ________________________________________ Prof.ª Drª Sandra Lúcia Rebel Gomes – Suplente Universidade Federal Fluminense – UFF ________________________________________ Prof.º Dr. Marcos Luiz Cavalcanti de Miranda – Suplente Universidade Federal do Estado do Rio de Janeiro - UNIRIO Niterói 2014 Dedico este trabalho a todos que estiveram comigo durante esta jornada e que com paciência me ajudaram a continuar. DEDICATÓRIA Ao meu orientador Marcondes, pela acolhida, pelos ensinamentos, pelo exemplo de profissional e por me mostrar um caminho de estudo. Aos meus pais por terem criado um ambiente favorável à minha formação. Aos membros da banca pela disponibilidade e importantes contribuições teóricometodológicas. Ao professor Cláudio J. S. Ribeiro pelas parcerias e discussões que tanto contribuíram para o resultado aqui alcançado. À Suzana Huguenin por me levar sempre a progredir na vida acadêmica. À Daniele Achilles e Fabiana Vilar pelo incentivo, pelas risadas e pelas ajudas em momentos cruciais. Ao Fabiano Cataldo pelo companheirismo e palavras de sabedoria. Aos funcionários do PPGCI/UFF, principalmente da secretaria Vitor e Luciana, pelo apoio sempre eficiente. À Dataprev pelo incentivo dado no início da pesquisa; “Information is a relationship” (BARLOW, 1994) RESUMO Objetiva propor um modelo conceitual dos dados sobre acidentes do trabalho para publicação dos dados governamentais mantidos pela Previdência Social. Busca na literatura modelos conceituais ou vocabulários sobre acidentes do trabalho, analisa o Vocabulário Controlado do Governo Eletrônico (VCGE), o modelo de publicações de dados sobre acidentes do trabalho publicado pela Dataprev e o tesauro e a taxonomia da Organização Internacional do Trabalho (OIT). Identifica a ausência de um modelo conceitual dos dados da Previdência Social para publicação em formato aberto e utiliza as tecnologias de Web Semântica, de forma a torná-las compartilháveis, acessíveis e reutilizáveis. Seleciona e analisa definições de acidente do trabalho e identifica conceitos e relacionamentos. Classifica os conceitos encontrados de acordo com as ontologias UFO-B e DUL. Utiliza o modelo Entidade-Relacionamento para auxiliar na elaboração de um modelo que consiga representar o domínio sobre acidente do trabalho. Constata a necessidade da elaboração de um vocabulário específico para descrever os conceitos sobre acidentes do trabalho como forma de enriquecer a representação dos dados analisados. Representa uma amostra dos dados em RDF, utilizando o modelo conceitual e o vocabulário proposto. Conclui que a elaboração do modelo conceitual e a descrição em RDF pareceram adequadas para organizar e fornecer um nível mínimo de semântica aos dados sobre acidente do trabalho da Previdência Social brasileira. Palavras-chave: Modelagem conceitual. Dados governamentais abertos. Web Semântica. Acidente do trabalho. Previdência social. ABSTRACT This project studies the conceptualization model about occupational accidents at Social Security for open government data. It conducts research literature to identify conceptual models or vocabulary about workplace accidents from the analysis of E-Government Controlled Vocabulary (VCGE from the Portuguese language), the occupational accident model published by Dataprev and also the taxonomy and thesaurus of International Labour Organization (ILO). It identifies the absence of a conceptual model for Social Security data for publication in an open format using Web Semantics technologies, to make this data sharable, affordable and reusable. It selects and discusses the definitions of occupational accidents by identifying concepts and relationships. It classifies the concepts found in accordance with ontologies UFO-B and DUL. It uses the Entity-Relationship model to assist in developing a model that can represent the domain of occupational accident. It notes the need to develop a specific vocabulary to describe the concepts of occupational accidents as a way to enhance the representation of the data analyzed. It represents part of the data in RDF using the proposed conceptual model and vocabulary. It concludes that the development of the conceptual model and description in RDF seemed appropriate to organize and provide a minimum level of semantic data on occupational accident at Brazilian Social Security. Keywords: Conceptual modeling. Open Government Data. Semantic Web. Occupational accident. Social Security. LISTA DE FIGURAS Figura 1 Modelo de construção do conceito.................................................................. 33 Figura 2 Triângulo do conceito...................................................................................... 34 Figura 3 Exemplo de Diagrama ER............................................................................... Figura 4 Evolução da Web............................................................................................. 49 Figura 5 Arquitetura da Web Semântica........................................................................ 49 Figura 6 URI na representação de um recurso............................................................... 51 Figura 7 Dados em XML sobre acidente do trabalho.................................................... 52 Figura 8 Grafo de triplas (sujeito, predicado e objeto).................................................. 55 Figura 9 Expressividade semântica de instrumentos de representação do 44 conhecimento................................................................................................... 60 Figura 10 Taxonomia das categorias básicas da DOLCE................................................ 62 Figura 11 Visão parcial da Ontologia DUL..................................................................... Figura 12 Fragmento da UFO-B: Objetos e Eventos....................................................... 64 Figura 13 Evolução da Web Semântica com os Dados Abertos Interligados................. 71 Figura 14 Classificação de dados publicados.................................................................. 72 Figura 15 Esquema para classificar bases de dados publicados na WEB....................... 72 Figura 16 Estrutura de LOD das bases de dados do Governo Brasileiro........................ 73 Figura 17 Diagrama da nuvem de LOD........................................................................... 73 Figura 18 Página eletrônica do Ligado nos Políticos...................................................... 74 Figura 19 Arquitetura para plataforma tecnológica de governo eletrônico..................... 81 Figura 20 Portal da Transparência do Governo Federal do Brasil.................................. 87 Figura 21 Aplicativo utilizando dados do Data.gov........................................................ 98 Figura 22 Aplicativo utilizando dados do Data.gov.uk................................................... 99 Figura 23 Aplicativo utilizando dados do Data.gov.br.................................................... 102 Figura 24 Previdência social no VCGE........................................................................... 106 Figura 25 Descrição temática dos dados de acidente do trabalho publicados no Portal Dados.gov.br................................................................................................... 63 109 Figura 26 Modelo de domínio sobre acidentes do trabalho, publicado pela Dataprev.... 111 Figura 27 Termos “Previdência Social” e “Acidente do trabalho” no tesauro da OIT.... 113 Figura 28 Termos “Previdência Social” e “Acidente do trabalho” na taxonomia da OIT................................................................................................................... 114 Figura 29 Proposta de diagrama ER da definição 1 sobre acidente do trabalho.............. 117 11 Figura 30 Proposta de diagrama ER da definição 2 sobre acidente do trabalho.............. 118 Figura 31 Proposta de diagrama ER da definição 3 sobre acidente do trabalho.............. 120 Figura 32 Proposta de diagrama ER da definição 4 sobre acidente do trabalho.............. 122 Figura 33 Proposta de diagrama ER da definição 5 sobre acidente do trabalho.............. 124 Figura 34 Proposta de diagrama ER sobre acidente do trabalho aliados aos dados da Previdência Social........................................................................................... 129 Figura 35 Proposta de diagrama ER dos dados publicados pela Dataprev...................... 134 Figura 36 XML de acidentes do trabalho ocorridos na cidade do Rio de Janeiro........... Figura 37 Representação dos dados selecionados em RDF............................................. 143 134 LISTA DE QUADROS Quadro 1 Análise da definição 1 sobre acidente do trabalho.......................................... 117 Quadro 2 Análise da definição 2 sobre acidente do trabalho.......................................... 118 Quadro 3 Análise da definição 3 sobre acidente do trabalho.......................................... 119 Quadro 4 Análise da definição 4 sobre acidente do trabalho.......................................... 120 Quadro 5 Análise da definição 5 sobre acidente do trabalho.......................................... 123 Quadro 6 Relações utilizadas nas representações........................................................... 125 Quadro 7 Termos sobre acidente do trabalho aliados aos dados da Previdência Social............................................................................................................... 127 Quadro 8 Classe do objeto............................................................................................... 136 Quadro 9 Propriedades do objeto.................................................................................... 137 Quadro 10 Atributos.......................................................................................................... 138 Quadro 11 Triplas de RDF propostas com base no diagrama ER..................................... 142 Quadro 12 Triplas de RDF propostas utilizando URIs..................................................... 142 LISTA DE SIGLAS AEAT - Anuário estatístico de acidentes do trabalho AEPS - Anuário Estatístico da Previdência Social ARPANET - Advanced Research Project Agency Network BDTD - Biblioteca Digital de Teses e Dissertações BFO - Basic Formal Ontology BRAPCI - Base de Dados Referencial de Artigos de Periódicos em Ciência da Informação CAT - Comunicação de Acidente do Trabalho CBO - Classificação Brasileira de Ocupações CEGE - Comitê Executivo do Governo Eletrônico CERN - European Organization for Nuclear Research CGU - Controladoria-Geral da União CID - Classificação Internacional de Doenças CNAE - Classificação Nacional de Atividades Econômicas CSV - Comma-Separeted Values DATAPREV - Empresa de Tecnologias e Informação da Previdência Social DGA - Dados Governamentais Abertos DnS - Descriptions and Situations DOLCE - Descriptive Ontology for Linguistics and Cognitive Engineering DTD - Document Type Definition DUL - DOLCE+DnS Ultralite EDM - Europeana Data Model EIA - Energy Information Administration e-PING - Padrões de Interoperabilidade de Governo Eletrônico HTML - HyperText Markup Language INDRA - Infraestrutura Nacional de Dados Abertos INSS - Instituto Nacional de Seguro Social LAG - Lista de Assuntos do Governo LAI - Lei de Acesso a Informação LOD - Linked Open Data LOV - Linked Open Vocabularies LPO - Lógica de Primeira Ordem NE - Notas de Escopo NPR - National Performance Review OCDE - Organização para Cooperação e Desenvolvimento Econômico OIT - Organização Internacional do Trabalho ONG - Organizações Não Governamentais OWL - Web Ontology Language PDF - Portable Document Format PNAD - Pesquisa Nacional por Amostra de Domicílios RDF - Resource Description Framework RDFS - Resource Description Framework Schema SGML - Standard Generalized Markup Language SISP - Sistema de Administração dos Recursos de Informação e Informática SKOS - Simple Knowledge Organisation Systems SLTI - Secretaria de Logística em Tecnologia de Informação SRI - Sistemas de Recuperação da Informação TIC - Tecnologias de Informação e Comunicação TSE - Tribunal Superior Eleitoral UF - Unidades Federativas UFO - Unified Foundational Ontology UML - Unified Modeling Language URI - Uniform Resource Identifier VCGE - Vocabulário Controlado do Governo Eletrônico WWW - World Wide Web XML - eXtensible Markup Language SUMÁRIO 1 INTRODUÇÃO............................................................................................... 14 1.1 MOTIVAÇÃO DA PESQUISA........................................................................ 15 1.2 RECORTE ESCOLHIDO................................................................................. 1.3 QUESTÕES A SEREM RESPONDIDAS........................................................ 21 1.4 ORGANIZAÇÃO DA PESQUISA................................................................... 22 2 OBJETIVOS.................................................................................................... 23 2.1 OBJETIVO GERAL.......................................................................................... 23 2.2 OBJETIVOS ESPECÍFICOS............................................................................ 23 3 ESCOPO E PROCEDIMENTOS METODOLÓGICOS............................ 24 3.1 ESCOPO............................................................................................................ 24 3.2 METODOLOGIA.............................................................................................. 24 4 MARCO TEÓRICO........................................................................................ 29 4. 1 REPRESENTAÇÃO DO CONHECIMENTO.................................................. 29 4.1.1 Uma visão acerca do conceito......................................................................... 30 4.1.2 Teoria do conceito............................................................................................ 32 4.1.3 Modelagem conceitual..................................................................................... 38 4.1.4 Modelo Entidade-Relacionamento................................................................. 42 4.2 WEB SEMANTICA E SUAS TECNOLOGIAS.............................................. 47 4.2.1 Identificando recursos com URI.................................................................... 51 4.2.2 XML e a descrição de dados........................................................................... 52 4.2.3 RDF como linguagem de representação de dados........................................ 54 4.2.4 Ontologia e acidente do trabalho como evento............................................. 56 4.2.5 OWL como ontologia para Web Semântica.................................................. 67 4.2.6 Dados Abertos Interligados............................................................................ 4.3 ASPECTOS LEGAIS SOBRE ACESSO À INFORMAÇÃO PLÚBICA........ 74 4.4 UM OLHAR SOBRE O GOVERNO ELETRÔNICO..................................... 78 4.4.1 Accountability................................................................................................... 84 4.4.2 Transparência em ações públicas................................................................... 86 4.5 DADOS GOVERNAMENTAIS ABERTOS.................................................... 89 4.5.1 Iniciativas estrangeiras de dados governamentais abertos.......................... 96 4.5.2 Iniciativas nacionais de dados governamentais abertos............................... 99 19 70 16 5 INSTRUMENTOS DE REPRESENTAÇÃO DA INFORMAÇÃO SOBRE ACIDENTES DO TRABALHO...................................................... 104 5.1 ACIDENTE DO TRABALHO NO VCGE....................................................... 104 5.2 ACIDENTE DO TRABALHO NO MODELO DE PUBLICAÇÕES DE DADOS PUBLICADOS PELA DATAPREV.................................................. 5.3 ACIDENTES DO TRABALHO NO TESAURO E NA TAXONOMIA DA OIT.................................................................................................................... 6 110 112 EM BUSCA DE UM MODELO A PARTIR DAS DEFINIÇÕES SOBRE ACIDENTE DO TRABALHO......................................................... 116 6.1 ANÁLISE DAS DEFINIÇÕES ACERCA DE ACIDENTES DO TRABALHO..................................................................................................... 6.2 MODELO CONCEITUAL SOBRE ACIDENTE DO 116 TRABALHO ASSOCIADO AOS DADOS DA PREVIDÊNCIA SOCIAL........................... 126 7 ELABORAÇÃO E REUSO DE VOCABULÁRIOS: A QUESTÃO SOBRE ACIDENTE DO TRABALHO........................................................ 132 7.1 SELEÇÃO DOS DADOS PUBLICADOS PELA DATAPREV...................... 132 7.2 ELABORAÇÃO DO VOCABULÁRIO SOBRE ACIDENTE DO TRABALHO..................................................................................................... 8 135 DESCRIÇÃO DOS DADOS SOBRE ACIDENTE DO TRABALHO EM RDF................................................................................................................... 140 9 CONSIDERAÇÕES FINAIS E EXPECTATIVAS...................................... 144 REFERÊNCIAS.............................................................................................. 147 14 1 INTRODUÇÃO No cenário atual, os governos têm se preocupado em adotar medidas que servem de elo entre os serviços por eles oferecidos e os cidadãos. São investidos diversos recursos na criação e no aprimoramento de práticas de gestão pública com o objetivo de melhorar a qualidade do atendimento, tornando os serviços e as informações disponíveis on-line para o cidadão. Essas iniciativas aliadas às Tecnologias de Informação e Comunicação (TIC) propiciaram a implantação de um novo modelo de gestão pública chamada governo eletrônico1. A Organização para Cooperação e Desenvolvimento Econômico (OCDE) define, de forma geral, o governo eletrônico como sendo o uso de tecnologias de informação e comunicação, em particular a Internet, enquanto ferramenta para levar a um melhor governo. (OCDE, 2003 apud ALONSO; FERNEDA; BRAGA; 2011). No Brasil, as iniciativas voltadas para o governo eletrônico intensificaram-se nos anos 90, em consequência do esgotamento do modelo de gestão burocrática. Diniz et al. (2009) afirma que a ideia de governo eletrônico, em alguns casos, está vinculada à modernização da administração pública e na melhoria da eficiência dos processos operacionais e administrativos e, em outros casos, é associada a prestação de serviços públicos eletrônicos. Entretanto, a visão de que a população é apenas consumidora passiva de serviços e informações disponibilizadas pelo Governo já não atende a realidade da sociedade em geral. Os cidadãos assumiram uma preocupação com a transparência, controle social e participação efetiva nas decisões relacionadas às ações governamentais. (AGUNE, GREGORIO FILHO, BOLLIGER, 2010; DINIZ, 2010; DINIZ et al., 2009). Diante do exposto, pode-se dizer que o governo eletrônico possui três vertentes: a primeira é modernizar os processos operacionais da gestão pública, a segunda é fornecer serviços públicos aos cidadãos e a terceira é oferecer infraestrutura para habilitar a população a recuperar e reutilizar dados fornecidos pelo Governo. (BREITMAN et al., 2009). É sobre essa terceira vertente do governo eletrônico que recai um dos aspectos do objeto de estudo: os dados governamentais abertos. 1 Governo eletrônico também é conhecido como: e-gov, e-governo, governo digital, governo virtual, Estado virtual, governança eletrônica. (DINIZ et al., 2009, p. 25) 15 O W3C (2009, p. 39) define dados governamentais abertos (DGA) como sendo a publicação de informações do setor público “em formato bruto aberto, de maneira a torná-los acessíveis a todos e permitir sua reutilização, como a criação de mashups2 de dados”. Os dados governamentais abertos buscam a publicação na Web de informações do setor público em formato bruto e aberto, legíveis não somente por pessoas, mas também inteligíveis por máquinas, de modo a permitir sua reutilização em novas aplicações digitais desenvolvidas pela sociedade. 1.1 MOTIVAÇÃO DA PESQUISA A Ciência da Informação e a Tecnologia da Informação possuem uma relação de proximidade entre si. Desde o seu objeto de estudo, passando pelo motivo de seu surgimento, até o resultado final de seu objetivo, a Ciência da Informação, como também a Tecnologia da Informação, tem um caminho científico pautado na otimização de fluxos de comunicação e na organização, recuperação e disseminação da informação. Com base no tema aqui proposto, buscou-se na literatura da área o momento da inserção do Estado (interferência política e análise de informações governamentais) e da tecnologia (estudo e utilização) na Ciência da Informação. Nos textos de Burke (2007), Capurro (2003), Costa (1999), Fernandes (2006), Freire (2006), Freitas (2003), González de Gómez (2002), Hjørland (1998), Marteleto (2009), Saracevic (1996) e Wersig (1993) o Estado e a tecnologia aparecem, de forma explícita ou subtendida, ligados ao surgimento da Ciência da Informação. Surgida principalmente com cunho bélico, a relação entre o Estado e as tecnologias não parece incluída na Ciência da Informação, porém se destaca como parte de sua formação. Contribuindo, ainda nos dias presentes, para o desenvolvimento deste campo do conhecimento, principalmente, no que tange a organização e recuperação da informação. É lícito dizer que na visão de muitos teóricos da área, dentre eles Hjørland (1998), o objetivo primordial da Ciência da Informação é a organização e recuperação da informação. Em outras palavras, ela foi criada com este propósito e continua tendo-o como principal fim almejado. Por essa razão, tantas pesquisas na Ciência da Informação ligadas à área tecnológica. 2 Mashup é definido pelo W3C (2009, p. 39) como sendo “a mistura de dados de dois ou mais aplicativos ou fontes de dados diferentes, produzindo pontos de vista comparativos das informações combinadas”. 16 A iniciativa dos dados governamentais abertos pode colaborar para o desenvolvimento tecnológico, buscando, por exemplo, formas eficazes de publicação de dados na Web. E pode contribuir também para o aspecto social da Ciência da Informação. Organizar os dados governamentais e facilitar sua recuperação e sua utilização é um dos objetivos da abertura dos dados governamentais, que vai ao encontro de uma das visões sobre o objeto da Ciência da Informação que “é ajudar as pessoas (ou mais amplamente: atores) que estão confusas com a situação do uso do conhecimento (e que ficarão mais confusas por causa do modelo de sociedade pós-moderna).” (WERSIG, 1993, p. 230, tradução nossa). Birdsall (2005) chama a atenção para a participação crítica que o profissional da informação, em especial o bibliotecário, deve ter perante seu papel político na defesa ao acesso cidadão ao conhecimento, frente ao ambiente de telecomunicações. A confluência entre a pesquisa e a prática em uma economia política da Biblioteconomia pode fortalecer a profissão bibliotecária para a defesa crítica e para o papel político que deve desempenhar na criação de um novo ambiente de telecomunicações que garanta o acesso da cidadania ao conhecimento. (BIRDSALL, 2005, p. 9). São escassos os estudos elaborados por profissionais da informação referentes à publicação de dados governamentais abertos, talvez por eles não se identificarem com esse processo de publicação. Deveria ser observada por esses profissionais a questão da seleção e organização desses dados e para quem e com qual objetivo estariam sendo publicados. Isso é uma peça da participação crítica frente aos aspectos políticos, levantados por Birdsall (2005) e, ao mesmo tempo, poderia contribuir para que o processo de publicação dos dados ampliasse seu caráter social, afinal esse é o propósito da iniciativa dos dados governamentais abertos. O Estado, por sua vez, não deve somente disponibilizar os dados governamentais, fazse necessário também proporcionar que esses dados cheguem aos cidadãos e sejam compreendidos. (VAZ; RIBEIRO; MATHEUS, 2010). Democratizar a informação envolve mais que somente programas para facilitar e aumentar o acesso à informação. “É necessário que o indivíduo tenha condições de elaborar este insumo recebido, transformando-o em conhecimento esclarecedor e libertador, em benefício próprio e da sociedade onde vive”. (BARRETO, 1994, p. 5). Acredita-se que a publicação dos dados governamentais abertos pode beneficiar as organizações do setor público ou não (por exemplo: empresas privadas, estatísticos, Organizações Não Governamentais - ONGs - e Hackers). Uma vez que utilizam as 17 tecnologias da Web Semântica para a interligação dos dados de outros órgãos para prover valor agregado a seus próprios dados, melhorando, desta forma, a usabilidade, visibilidade e valor desses dados. Trabalhar com dados governamentais abertos possibilita tornar os cidadãos mais informados, criar eleitores conscientes de seu poder, permitindo-os supervisionar o Governo através da transparência pública. Além de promover o uso e reutilização das informações do Governo, criando serviços mais eficientes e amigáveis à população. Como é afirmado no Manual... (2011, p. 11) Dados abertos, especialmente os governamentais, são um ótimo recurso ainda muito pouco explorado. Muitos indivíduos e organizações coletam uma ampla gama de diferentes tipos de dados para executar suas tarefas. O governo é particularmente importante nesse contexto, tanto por causa da quantidade e da centralidade dos dados que coleta quanto pelo fato de que tais dados são públicos. Outro aspecto importante é que a maioria das informações disponibilizadas hoje pelo Governo está publicada em formatos proprietários ou com tecnologia que restringe seu acesso. A mera publicação na Web de dados governamentais não os torna acessíveis e/ou abertos. Isso acarreta, por exemplo, incompatibilidade de equipamentos para uma pessoa que usa um equipamento móvel ou um computador antigo, ou a falta de informações para alguém que usa um computador sem o software proprietário necessário, e barreira de acessibilidade para pessoas com deficiência. (W3C, 2009). Chen (1990, p. 1) afirma que “conforme nos movemos para uma sociedade cada vez mais orientada para a informação, a determinação de como organizar os dados para maximizar sua utilidade torna-se um problema muito importante”. Por essa razão, é necessário possibilitar o reuso, ou seja, desagregar, reprocessar e reaplicar esses dados, permitindo novas interpretações e aplicações. Pensando nessa necessidade, o Governo Brasileiro desenvolveu o Portal Brasileiro de Dados Abertos3 para fomentar a publicação de dados governamentais e, ao mesmo tempo, possibilitar a recuperação e reutilização desses dados por cidadãos interessados. Todavia, percebe-se a dificuldade em se publicar os dados seguindo os princípios dos dados governamentais abertos. Em 4 de março de 2014, o portal apresentava apenas 112 (cento e doze) conjuntos de dados publicados, um número pequeno para a quantidade de órgãos públicos e as informações que geram. Ademais, os conjuntos de dados abertos estavam 3 Disponível em: <http://dados.gov.br/>. Acesso em: 19 abr. 2013. 18 publicados nos seguintes formatos: xls; pdf; xml; csv; zip+cvs; HTML; zip+txt; zip+sas; zip+xls e json. Dentre estes, os formatos pdf. e zip, por exemplo, não são considerados formatos adequados para publicação de dados abertos. Não apresentando nenhum conjunto de dados em formato Resource Description Framework (RDF), formato recomendado pela proposta de dados abertos interligados. (BENNETT; HARVEY, 2009; BERNERS-LEE, 2009). Contudo, sabe-se que o Ministério do Planejamento4 e o Tribunal de Contas do Estado de São Paulo5, publicaram conjuntos de dados em formato RDF. Porém, esses dados não são mostrados junto com os outros formatos existentes e nem facilmente recuperados no portal dados.gov.br. Segundo Berners-Lee (2009), o padrão RDF conecta melhor que qualquer outro modelo, pois utiliza URIs e assim permite ligação de coisas e conceitos; possibilita que os sistemas independentes possam ser interligados; ocasiona a interoperabilidade; e admite a representação dos dados utilizando diferentes vocabulários. O RDF é fundamental para o estabelecimento do primeiro nível de “semântica” inteligível por programas, pois embora a eXtensible Markup Language (XML) permita aos usuários adicionar estrutura arbitrária aos seus documentos, não diz nada sobre o que as estruturas significam. Significados são expressos pelo RDF, que codifica em conjuntos de triplas, sendo cada tripla composta por um sujeito, verbo e objeto de uma frase elementar. (BERNERS-LEE; HENDLER; LASSILA, 2001). Desta maneira, a publicação de dados governamentais abertos deve-se basear na Web Semântica, pois assim os dados receberão significados definidos, com metadados em formato padronizado, possibilitando a compreensão por pessoas e por computadores. A Web Semântica, idealizada por Tim Berners-Lee, visa melhorar a interação entre as páginas (autodescritivas) na Web com os programas. Souza e Alvarenga (2004, p. 134) afirmam ainda que O projeto da Web Semântica, em sua essência, é a criação e implantação de padrões (Standards) tecnológicos para permitir este panorama, que não somente facilite as trocas de informações entre agentes pessoais, mas principalmente estabeleça uma língua franca para o compartilhamento mais significativo de dados entre dispositivos e sistemas de informação de uma maneira geral. As tecnologias da Web Semântica proporcionam o compartilhamento e reutilização de dados de diferentes aplicações, oferecendo tecnologias que descrevam, modelem e permitam 4 5 Disponível em: <http://www.siop.planejamento.gov.br>. Acesso em: 5 mar. 2014. Disponível em: <http://portaldocidadao.tce.sp.gov.br>. Acesso em: 5 mar. 2014. 19 consultas a esses dados. Entretanto, faz necessária a curadoria desses dados para fins de recuperação e reuso e, neste caso, são os modelos que dão estrutura e significado aos dados. Esses fatores evidenciam a necessidade de modelos conceituais e consequentemente da modelagem das relações conceituais. (SALES; SAYÃO; MOTTA, 2012). Corroborando esse pensamento, Maia e Alvarenga (2013, p. 2) afirmam que com a Web Semântica “surge a necessidade da modelagem conceitual, onde se busca ferramentas para os processos de classificação e relacionamento entre os documentos visando a uma maior eficiência na representação e recuperação do conhecimento”. Méndez e Greenberg (2012, p. 237) também concordam que são os vocabulários a base da semântica dos dados ligados. Para as autoras, os vocabulários baseados em linguagens de domínio, disciplina ou comunidade, ajudam a resolver problemas relacionados à sobrecarga de informações digitais, bem como auxilia em sua recuperação. A capacidade de vincular vocabulários diferentes para representação de registros de dados fornece uma infra-estrutura que permite uma recuperação de informação mais eficaz, além de facilitar o seu reuso. Diante disso, a modelagem conceitual pode ser utilizada como forma de se obter resultados baseados em estruturas conceituais coerentes, elaboradas a partir de definições específicas de um dado domínio. Le Moigne (1977, p. 34) afirma que “modelar é conceber, para um objeto, um modelo que permita conhecê-lo, compreendê-lo, interpretá-lo e auxilie na antecipação do comportamento dele”. Logo, precisa-se, na publicação de dados governamentais abertos, de vocabulários e representações semânticas dos domínios contemplados pelo Estado. E para isso se faz uso de modelos que possibilitarão a organização e representação dos conceitos e das relações existentes entre eles, que serão utilizados em ontologias para atribuição de semântica a esses dados publicados. 1.2 RECORTE ESCOLHIDO Acompanhando o processo de desenvolvimento tecnológico, político e social internacional, o Brasil já começou a apresentar suas iniciativas em publicação de dados governamentais em formato aberto. Um dos setores públicos interessados nesta temática é a Previdência Social, que visa coletar dados sobre a vida profissional dos cidadãos, buscando conhecer o perfil do trabalhador. A Previdência Social brasileira pode ser considerada “um patrimônio do trabalhador e sua família. Transformou-se, ao longo das últimas oito décadas, 20 em um complexo e abrangente sistema de proteção social, com significativa cobertura de riscos sociais”. (BRASIL, 2009, p. 7). A Previdência Social é um dos setores do Governo que mais coleta e organiza dados sociais. (RIBEIRO, C., 2008). A disseminação dessas informações tratadas também precisa de uma atenção especial. Assim, é necessário buscar alternativas para que estes dados, cada vez mais, sejam estudados e reutilizados pela sociedade. Atualmente, a Previdência Social possui mais de 1.400 agências, pagando mensalmente 30 milhões de benefícios, atendendo presencialmente a um público de mais de 4 milhões de pessoas/mês, envolvendo cerca de 40 mil servidores. (DATAPREV, 2013). Esses números geram uma grande quantidade de dados, que estão armazenados em ambientes tecnológicos heterogêneos e que, com frequência, são utilizados na divulgação de informações, proporcionando um ambiente favorável para o desenvolvimento de trabalhos que pesquisem o tratamento e a disseminação destas informações. (RIBEIRO, C., 2008). Além disso, após um ano da implantação da Lei de Acesso a Informação, a Controladoria-Geral da União (CGU) informou que a Previdência Social é o segundo órgão com maior número de demandas de solicitação de informações, ficando atrás apenas da Superintendência de Seguros Privados. (BATIMARCHI, 2013). Comprovando, dessa maneira, o interesse do cidadão pelas informações previdenciárias. A delimitação do tema tem como campo empírico da pesquisa o domínio de dados da Previdência Social brasileira, tendo em vista o grande volume, a complexidade e o impacto que estas informações podem exercer em toda a sociedade. Como afirma Ribeiro (2001, p. 3) “o grande volume e a imensa diversidade de informações na Previdência Social Brasileira emolduram o cenário fértil para o estudo do comportamento destas informações”. No caso deste trabalho, o recorte da pesquisa recairá sobre dados estatísticos sobre acidentes do trabalho, do Ministério da Previdência Social, geridos pela Empresa de Tecnologias e Informação da Previdência Social (Dataprev). Acidente do trabalho é acidente que “ocorre pelo exercício do trabalho a serviço da empresa ou pelo exercício do trabalho aos segurados empregados, trabalhadores avulsos e segurados especiais”. (HORVATH JÚNIOR, 2009, p. 6) Essa escolha se deve em função desses dados fazerem parte da primeira experiência com a publicação de dados abertos realizada pela Dataprev, guardiã e gestora dos dados da Previdência Social brasileira. (DATAPREV, 2012). A Dataprev deu início à publicação dos dados governamentais abertos de acidentes do trabalho a partir dos dados estatísticos disponíveis no Anuário Estatístico de Acidente do 21 Trabalho (2010). A publicação de dados governamentais abertos envolvendo dados estatísticos é importante, pois a reutilização desses dados no desenvolvimento de aplicativos ou outros serviços facilita a compreensão desses dados pelo usuário. Pois, como afirma Senra (1999), o importante nos dados estatísticos é a informação que eles representam e não o dado em si. A estatística revela e mostra pouco a pouco que a população tem suas regularidades próprias: seu número de mortos, seu número de doenças, suas regularidades de acidentes. A estatística mostra igualmente que a população apresenta características próprias em seu conjunto e que esses fenômenos são irredutíveis aos da família: as grandes epidemias, as expansões endêmicas, a espiral do trabalho e da riqueza. A estatística mostra igualmente que, por seus deslocamentos, por suas maneiras de fazer, por sua atividade, a população tem seus efeitos econômicos específicos. A estatística, permitindo quantificar os fenômenos próprios à população, revela uma especificidade irredutível ao pequeno quadro da família. (FOUCAULT, 2003). Assim, dados estatísticos estão repletos de poderes. Poder de quem o criou (quais as informações que foram selecionadas a serem quantificadas?), poder da metodologia escolhida para coleta e representação dos dados e poder de quem trabalhou essa informação (estatística é a representação quantificável de determinadas informações). 1.3 QUESTÕES A SEREM RESPONDIDAS Nessa perspectiva, cabe-nos investigar as seguintes questões: Como elaborar um modelo conceitual de acidente do trabalho no domínio da Previdência Social brasileira? Como instrumentos de representação da informação, que contemplam a temática sobre acidente do trabalho, representam este domínio? Como representar a proposta do modelo conceitual de acidente do trabalho utilizando tecnologias da Web Semântica para a publicação dos dados governamentais abertos da Previdência Social? 22 1.4 ORGANIZAÇÃO DA PESQUISA Além desta introdução, o trabalho apresenta a seguinte organização, dividida em seções. A seção 2 apresenta os objetivos gerais e os específicos da pesquisa. A seção 3 é mostra o escopo e a metodologia empregada para responder as questões da pesquisa e, consequentemente, alcançar os objetivos. A seção 4 faz referência ao marco teórico da pesquisa, no qual se investigará: a) a questão do conceito na representação da informação, aprofundando-se na Teoria do Conceito de Dalhberg (1978, 1981, 1983), na modelagem conceitual (LE MOIGNE, 1977) e no modelo Entidade-Relacionamento de Chen (1976); b) a Web Semântica e suas tecnologias: URI, XML, RDF, Ontologia, OWL e dados abertos interligados; c) os aspectos legais sobre acesso à informação pública; d) o governo eletrônico no Brasil, privilegiando aspectos sobre accountability e transparência pública; e) e, por fim, dados governamentais abertos, ilustrados com algumas iniciativas estrangeiras e nacionais. A seção 5 apresenta modelos ou instrumentos de representação da informação que contemplem o universo sobre acidente do trabalho. São apresentados o Vocabulário Controlado do Governo Eletrônico (VCGE), o modelo de publicações de dados sobre acidentes do trabalho elaborado pela Dataprev e o tesauro e a taxonomia da Organização Internacional do trabalho (OIT). Já a seção 6 faz o relato da elaboração, por meio de definições sobre acidentes do trabalho, de uma proposta de modelo conceitual na área de acidente do trabalho da Previdência Social brasileira. A seguir, a seção 7 mostra como o modelo conceitual pode se constituir num vocabulário específico para descrever acidentes do trabalho. A seção 8 revela o processo de conversão do diagrama ER em triplas de RDF, integrando o vocabulário proposto na seção 7, e sua aplicação em uma faixa de dados selecionada dentro do conjunto de dados publicados pela Dataprev; As considerações finais indicadam algumas reflexões sobre os trabalhos, contribuições e possíveis extensões ao presente trabalho. 23 2 OBJETIVOS 2.1 OBJETIVO GERAL Propor um modelo conceitual dos dados sobre acidentes do trabalho para publicação dos dados governamentais mantidos pela Previdência Social. 2.2 OBJETIVOS ESPECÍFICOS Representar o conhecimento sobre acidente do trabalho, no âmbito da Previdência Social brasileira, identificando as entidades presentes e os relacionamentos existentes; Propor um vocabulário sobre acidentes do trabalho, utilizando o modelo conceitual elaborado; Codificar em RDF uma amostra dos dados publicados pela Previdência Social sobre acidente do trabalho. 24 3 ESCOPO E PROCEDIMENTOS METODOLÓGICOS Metodologia significa, “na origem do termo, estudo dos caminhos, dos instrumentos usados para se fazer ciência”. (DEMO, 1995, p. 11). Desta forma, mostra-se, agora, as escolhas feitas para a construção da pesquisa. 3.1 ESCOPO O campo empírico para aplicação do modelo conceitual proposto é dos dados estatísticos mantidos pelo Ministério da Previdência Social. A temática será limitada aos dados sobre acidente do trabalho e a abrangência cobrirá o período entre 2002 a 2009. A temática e a abrangência foram definidas com base nos dados, atualmente, trabalhados pela Dataprev para publicação dos dados governamentais abertos, utilizando como fonte principal o Anuário Estatístico de Acidente do Trabalho, auxiliado pelo Anuário Estatístico da Previdência Social, ambos publicados pelo Ministério da Previdência Social. 3.2 METODOLOGIA De acordo com Gil (2002) e Marconi e Lakatos (1992; 2003), a pesquisa pode ser classificada de acordo com diferentes aspectos, como: de acordo com a natureza da pesquisa, a forma de abordagem do problema e os objetivos almejados. Observando esta pesquisa do ponto de vista de sua natureza, pode-se classificá-la como pesquisa aplicada, pois tem como objetivo reunir e elaborar informações para “contribuir para fins práticos, visando à solução mais ou menos imediata do problema encontrado na realidade.” (BARROS; LEHFELD, 2000, p. 78). Sob a ótica da forma de abordagem do problema, ela é classificada como qualitativa, pois “trabalha com o universo dos significados, dos motivos, das aspirações, das crenças, dos valores e das atitudes”. (MINAYO, 2002, p. 21). Em outras palavras, a pesquisa qualitativa trata e interpreta conjuntos de materiais disponíveis utilizando “processos hermenêuticos a partir do que busca extrair dos discursos a expressão da subjetividade do sujeito informante ou a percepção obtida pela participação do pesquisador em processos de coleta com envolvimento direto ou com observação”. (SOUZA, 2003, p. 29). Esta pesquisa pode ser classificada segundo seus objetivos como pesquisa exploratória, pois busca proporcionar maior familiaridade com o problema, com vistas a 25 torná-lo mais explícito ou a constituir hipóteses. Utilizando-se, na maioria dos casos, de levantamento bibliográfico e análise de exemplos que estimulem a compreensão do objeto estudado. (GIL, 2002). Os procedimentos metodológicos foram divididos da seguinte forma: Pesquisa bibliográfica Para fundamentação do marco-teórico, apresentado na seção quatro, buscou-se levantar os autores de Ciência da Informação e áreas afins a esta pesquisa, com análises de citação e de conteúdo para identificação e escolha dos conceitos a serem utilizados. Foram pesquisados os termos: “conceito”, “modelagem conceitual”, “modelo entidade-relacionamento”, “Web Semântica”, “governo eletrônico” e “dados governamentais abertos”6. A pesquisa foi realizada nas seguintes bases de dados: Portal Capes7, Biblioteca Digital de Teses e Dissertações (BDTD)8, Base de Dados Referencial de Artigos de Periódicos em Ciência da Informação (BRAPCI)9, CitesserX10, Google Acadêmico11. As bases de dados foram selecionadas por disponibilizarem relevante produção científica em Ciência da Informação e demais áreas envolvidas neste estudo. Identificação de modelos ou vocabulários sobre acidentes do trabalho Pesquisou-se por modelos ou vocabulários existentes que pudessem representar ou serem utilizados na elaboração de um modelo conceitual sobre acidente do trabalho no domínio da Previdência Social. Observou-se o Vocabulário Controlado do Governo Eletrônico (VCGE)12, o modelo de publicações de dados sobre acidentes do trabalho publicado pela Dataprev13 e o tesauro e a taxonomia da Organização Internacional do Trabalho (OIT)14. 6 Os termos foram pesquisados também com suas variações linguísticas (sinônimos) e abreviações e também em outros idiomas (inglês, espanhol e francês). 7 Disponível em: <http://www.periodicos.capes.gov.br/>. Acesso em: 6 abr. 2013. 8 Disponível em: <http://bdtd.ibict.br/>. Acesso em: 6 abr. 2013. 9 Disponível em: <http://www.brapci.ufpr.br/>. Acesso em: 6 abr. 2013. 10 Disponível em: <http://citeseerx.ist.psu.edu/index;jsessionid=19C845A95BBA6034A1D095B5D465E7D9>. Acesso em: 6 abr. 2013. 11 Disponível em: < http://scholar.google.com.br/>. Acesso em: 6 abr. 2013. 12 Disponível em: <http://vocab.e.gov.br/2011/03/vcge>. Acesso em: 6 abr. 2013. 13 Disponível em: <http://api.dataprev.gov.br/doc/dadosDisp.htm>. Acesso em: 6 abr. 2013. 14 Disponível em: <http://www.ilo.org/thesaurus/defaultes.asp>. Acesso em: 6 abr. 2013. 26 Para essa atividade, foi necessário observar cada instrumento de representação levando-se em consideração a estrutura e as informações dos dados publicados pela Dataprev, a relação entre acidente do trabalho e os benefícios previdenciários brasileiros e outras questões particulares a cada instrumento estudado. Esta metodologia, utilizada na seção cinco, busca conhecimentos para responder uma questão proposta neste trabalho: “Como instrumentos de representação da informação que contemplam a temática sobre acidente do trabalho representam este domínio?” Elaboração de um modelo conceitual sobre acidente do trabalho A seção seis buscará, por meio de definições sobre acidentes do trabalho, identificar conceitos e suas relações de modo a se propor um modelo conceitual sobre este tipo de acidente. Para que tal resultado seja conquistado, seguiram-se os seguintes passos metodológicos: a. Na coleta e seleção das definições buscou-se por autores representativos e/ou por fontes de referência legais que definissem acidente do trabalho. Deste modo, foram identificadas quatro fontes: i. Brasil (1991) que regulamenta a Lei n. 8.213, publicada em 24 de julho de 1991, que dispõe sobre os planos de benefícios da Previdência Social. No artigo décimo nono da referida Lei é definido o acidente do trabalho. ii. Anuário Estatístico da Previdência Social (2012) que é uma publicação oficial da Previdência Social que reúne dados estatísticos referentes às atividades desenvolvidas no ano 2011. Nesta publicação, o quarto capítulo é dedicado exclusivamente aos acidentes do trabalho, apresentando sua definição. iii. Organización Internacional del Trabajo (2011) que em seu tesauro define e classifica acidente do trabalho. iv. Horvath Júnior (2009), que publicou o “Dicionário analítico de Previdência Social”, único dicionário especializado localizado que define acidente do trabalho. b. Classificação das definições e identificação dos termos com base na Teoria do Conceito, desenvolvida por Dahlberg (1978a, 1981, 1983). De acordo com Dahlberg (1983) as definições serão classificadas em: definição genérica, definição partitiva e definição funcional. Esta classificação mostra as características de uma definição. 27 Ademais, esta classificação auxiliou no estabelecimento das relações existentes entre os termos encontrados; c. Classificação dos termos identificados de acordo com as categorias das ontologias Unified Foundational Ontology for perdurants (UFO-B) e da DOLCE15+DnS16 Ultralite (DUL), verificando semelhanças e diferenças, contribuindo para a identificação dos elementos (objeto ou relação) do modelo a ser construído; d. Classificação dos termos de acordo com o modelo de Entidade-Relacionamento, desenvolvido por Chen (1976)17. Esta classificação possibilitará obter uma visão de como os elementos estão interligados, possibilitando também uma representação gráfica; e. Elaboração de um diagrama de Entidade-Relacionamento para cada definição analisada; e f. Apresentação, ao final, de um modelo consolidado, abrangendo a área de acidente do trabalho no domínio da Previdência Social. Esta metodologia busca responder a pergunta: “como elaborar um modelo conceitual de acidente do trabalho no domínio da Previdência Social brasileira?”. Procurando atingir o objetivo geral deste estudo. Elaboração de um vocabulário sobre acidente do trabalho Esta parte do trabalho, presente na seção 7, apresenta o vocabulário proposto, que seguiu os passos abaixo: a. Escolha dos conceitos do modelo conceitual a serem utilizados na elaboração do vocabulário. Não serão contemplados todos os conceitos neste momento, apenas aqueles relacionados diretamente aos dados já publicados pela Previdência Social; b. Busca por vocabulários já existentes que possam contemplar essas entidades, relacionamentos e atributos; c. Criação de URIs fictícios para os conceitos a serem criados; 15 Descriptive Ontology for Linguistic and Cognitive Engineering. Descriptions and situations. 17 A escolha do Modelo Entidade-Relacionamento é justificada pela sua proximidade com o RDF, padrão indicado para descrição de dados na Web Semântica. Chen (2002) ao falar dos possíveis usos e relações do modelo Entidade-Relacionamento o associa ao RDF, afirmando que existem algumas semelhanças e diferenças entre RDF e do modelo ER. Entretanto, o RDF, já é considerado um membro da família da modelagem Entidade-Relacionamento, em que os dados estruturados como gráficos rotulados podem ser trocados através de documentos XML. (W3C, 1999). 16 28 d. Definição de um nome (namespace) para o vocabulário; e. Descrição dos conceitos que farão parte do vocabulário proposto; f. Divisão do vocabulário em classes (entidades), propriedade (relacionamentos) e elementos (atributos). Codificação em RDF de uma amostra dos dados publicados pela Previdência Social sobre acidente do trabalho Esta é a parte prática da pesquisa a ser mostrada na seção 8 da dissertação, na qual será realizada a conversão das entidades e relacionamentos do modelo proposto em triplas de RDF, tecnologia recomendada pela W3C para descrição de dados na Web Semântica. Será escolhida uma parte dos dados já publicados pela Dataprev sobre acidente do trabalho para implementação do RDF. Seguiram-se os seguintes passos: a) Definição das triplas RDF com base no modelo conceitual proposto. b) Representação das triplas RDF em quadros, baseados na criação de tabelas para descrição de banco de dados lógicos (XU; LEE; KIM, 2010) para descrever as entidades e relações e convertê-las para triplas RDF; c) Substituição dos elementos do quadro por suas respectivas URI, de acordo com o vocabulário proposto; d) Implementação das triplas RDF nos dados selecionados em um modelo gráfico RDF/XML. Pretende-se, com isso, responder a última questão apresentada neste trabalho: “como representar a proposta do modelo conceitual de acidente do trabalho utilizando tecnologias da Web Semântica para a publicação dos dados governamentais abertos da Previdência Social?”. E atender ao objetivo específico de propor um esquema, em RDF, para publicação dos dados sobre acidente do trabalho. 29 4 MARCO TEÓRICO Para melhor entendimento do trabalho que se pretende desenvolver e para facilitar o agrupamento da bibliografia recolhida através da pesquisa bibliográfica, decidiu-se elaborar o referencial teórico, que busca fornecer um panorama sobre alguns conteúdos, julgados imprescindíveis para a compreensão da pesquisa. Desde modo, foram estudados os seguintes assuntos: conceito (teoria e modelos), Web Semântica e dados governamentais abertos e seus, respectivos, assuntos correlatos. 4.1 REPRESENTAÇÃO DO CONHECIMENTO A Ciência da Informação é um campo de estudo cujos esforços estão direcionados ao entendimento sobre as vertentes que envolvem a produção, circulação e uso da informação. Pesquisas, nesta área, buscam fornecer teorias e instrumentos que auxiliam no armazenamento, recuperação e disseminação da informação. Alvarenga (2001) afirma que a criação, a disponibilização e o aperfeiçoamento das tecnologias da informação interferiram diretamente nos sistemas de representação e recuperação de informações documentais. Estes sistemas tradicionais foram obrigados a expandir sua forma de representação, indo além dos catálogos referenciais em fichas, alcançando as bases de dados online. De acordo ainda com esta autora, essas mudanças nos sistemas de representação acarretaram o interesse de diferentes áreas no estudo deste campo, destacando a Linguística e a Ciência da Computação, com seus estudos sobre bases de dados. Davis, Shrobe e Szolovits (1993) estabelecem o conceito de representação do conhecimento a partir de cinco definições concebidas com base em sua utilização: (1) a representação do conhecimento é fundamentalmente um substituto para aquilo que representa; (2) é uma aproximação imperfeita da realidade, selecionando o que e como observar o ser ou objeto representado; (3) é uma teoria fragmentária de raciocínio inteligente expresso em termos de três componentes: (a) concepção fundamental da representação do raciocínio inteligente, (b) o conjunto de inferências que as sanções de representação, e (c) o conjunto de inferências que ele recomenda; (4) é um meio para a computação pragmaticamente eficiente, isto é, o ambiente em que o pensamento computacional é realizado, contribuindo para organizar as informações de forma a facilitar a tomada das inferências recomendadas; e (5) é um meio de expressão humana, isto é, uma linguagem em que se diz algo sobre o mundo. 30 Neste estudo, nota-se um entrosamento entre a Ciência da Informação e a Ciência da Computação na representação de dados. Maia e Alvarenga (2013, p. 2) comentam que existe uma preocupação recíproca entre ambas as áreas citadas, no que se refere “ao aspecto da representação, organização intelectual, busca e recuperação da informação em sistemas específicos”. As autoras acrescentam ainda que os “sistemas de recuperação da informação (SRI) são estudos realizados na base estrutural da CI e, ao mesmo tempo, também participam de um contexto de estudo da CC [Ciência da Computação]”. (Maia, Alvarenga, 2013, p. 2) Campos (2004) analisa os mecanismos de representação do conhecimento sob a ótica de diferentes áreas, No âmbito da Ciência da Computação, eles servem para auxiliar a implementação de estruturas computáveis. No âmbito da ciência da informação, possibilitam a elaboração de linguagens documentárias verbais e notacionais, visando à recuperação de informação e à organização dos conteúdos informacionais de documentos. No âmbito da terminologia, esses mesmos mecanismos permitem a sistematização dos conceitos e, conseqüentemente, a elaboração de definições consistentes. (CAMPOS, 2004, p. 23). Desta forma, percebe-se que a representação da informação pode ser estudada com focos diversos, de acordo com o contexto e com os objetivos propostos. Logo, “pode-se dizer que a representação dos objetos pelos indivíduos está diretamente ligada ao modo como cada um percebe o mundo e interage com ele”. (LEITE, BORNIA, 2006, p. 2). Na visão da Ciência da Informação, Novellino (1996, p. 38) considera que “a principal característica do processo de representação da informação é a substituição de uma entidade lingüística longa e complexa - o texto do documento - por sua descrição abreviada”. Em outras palavras, a autora está se referindo diretamente ao processo de representação temática de um documento. Este processo que envolve dois processos: “análise conceitual e tradução” (LANCASTER, 1993, p. 8). Neste momento, chega-se ao Conceito, elemento tão importante na representação do conhecimento, que será visto com mais detalhes na subseção a seguir. 4.1.1 Uma visão acerca do conceito Há diversas abordagens de diferentes áreas do conhecimento que se debruçam sobre o estudo do conceito. Estes estudos podem variar ainda dentro da mesma área de acordo com a corrente teórico-epistemológica adotada. (FRANCELIN; KOBASHI, 2011, p. 208). 31 Na Ciência da Informação, são recorrentes os estudos que discutem a relação entre a linguagem (representação) e as coisas (mundo real). Compreender as ligações entre o mundo real, os conceitos e sua representação gráfica é necessário no processo de representação. Na época de Aristóteles existia a preocupação de se unir o domínio das palavras ao domínio das coisas. Ao estudar as obras de Aristóteles, Figueiredo (2000, p. 11) considera que os conceitos têm uma realidade mental, em outras palavras, é o modo como os homens organizam mentalmente as coisas existentes, agrupando-as de acordo com conceitos estabelecidos e nomeando-as com uma palavra, em um determinado contexto. Um conceito é uma rede de padrões de inferências, associações e relacionamentos que são predicados ou ditos de outra forma trazidos em cena através do ato da categorização [...] a cristalização ou formalização do pensamento inferencial, nascida da percepção sensorial, condicionada pela operação do cérebro humano e delineada pela experiência humana. Ela repousa na fundamentação de todo pensamento, mas ela é pragmática e instrumental. É permanente e efêmera. Permanente porque sem ela, a cognição é impossível; efêmera porque ela pode ser rejeitada quando sua utilidade é esgotada. (SHERA, 1957 apud ALVARENGA, 2001, p. 33). Alvarenga (2001, p. 33) complementa a ideia de Shera (1957) afirmando que os conceitos “ou padrões se constituem na matéria do qual as classificações são feitas. Os conceitos podem se referir às coisas concretas e abstratas. Os conceitos e a formação de conceitos são o material para a construção das classificações bibliográficas”. Eugen Wüester, ao elaborar a Teoria Geral da Terminologia, definiu conceito como “a unidade de pensamento, constituído de características que refletem as propriedades significativas atribuídas a um objeto, ou a uma classe de objetos”. (CAMPOS, 2001, p. 71). Todavia, outra definição clássica de conceito é a estabelecida por Dahlberg (1978c), que define conceito como sendo “a unidade de conhecimento que surge da síntese dos predicados necessários relacionados com determinado objeto e que, por meio de sinais lingüísticos, pode ser comunicado”. (Dahlberg, 1978c, p. 12). A Teoria do Conceito será vista com mais detalhes na próxima seção sobre a Teoria do Conceito. A “compilação de enunciados verdadeiros” (DAHLBERG, 1978a, p. 102), já estava presente no pensamento de Aristóteles, que se valia dos conceitos para verificar a validade das proposições. As relações entre as palavras, dispostas da seguinte maneira sujeito-verbopredicado são chamadas de proposições. (FIGUEIREDO, 2000, p. 12). Sendo que o sujeito e o predicado são os objetos concretos ou abstratos e o verbo é a relação existe entre eles. Está 32 lógica foi também apropriada pela área da Ciência da Computação, quando elaboraram a tripla de RDF, melhor explicado na seção 4.2.3. Para se verificar a veracidade de uma proposição se recorre a dois tipos de processos: verificação empírica e análise conceitual. Na verificação empírica, os objetos são vistos diretamente para se confrontar a afirmativa. Já na análise conceitual, analisa-se o conceito do sujeito e verifica-se se é compatível com o conceito do predicado. Assim, a verificação empírica precisa do sujeito individual, pois é necessária a observação direta, já a análise conceitual “é um processo que nos permite declarar se uma proposição é verdadeira ou falsa, independentemente dos sujeitos individuais a que se aplica o seu predicado”. (FIGUEIREDO, 2000, p. 13). Os conceitos são importantes para identificar, classificar e organizar os objetos. Reunir por conceitos, de acordo com características comuns, facilitar a organização semântica dos objetos. Desta forma, pode-se dizer que “a organização conceitual é necessária a qualquer sistema adequado que objetive a recuperação da informação”. (FROHMANN, 1983 apud MOTTA, 1987, p. 30). A seguir será mostrado a Teoria do Conceito de Dahlberg, a modelagem conceitual de Le Moigne e o modelo Entidade-Relacionamento de Chen. A expectativa é proporcionar uma visão de como o conceito se constitui e contribui para a representação do conhecimento, de acordo com essas teorias. 4.1.2 Teoria do conceito A Teoria do Conceito foi elaborada por Ingetraut Dahlberg nos anos 70. Desde então tem sido referência para diversos estudos na área de representação do conhecimento, principalmente, com vistas à recuperação. Baseado nos princípios da Teoria do Conceito é possível estabelecer relações e determinar, no plano verbal, o que se denomina termo. (CAMPOS, 2001, p. 87). Exatamente por estes benefícios trazidos à área de representação do conhecimento, que a Teoria do Conceito é muito utilizada para a elaboração de tesauros. De acordo com Alvarenga (2001) a Teoria do Conceito teve grande influência do pensamento de Aristóteles. Esta autora referencia o ato da cognição humana e a fatoração do conceito em categorias, como exemplos de contribuições para a evolução do pensamento filosófico e científico. Ela adiciona ainda que para Aristóteles, 33 [...] saber seria ter muitos conceitos e conhecer significava três coisas”: 1. formar conceitos, ou seja, constituir em nossa mente um conjunto de notas características para cada uma das essências que se realizam na substância individual.; 2. aplicar esses conceitos que formamos a cada coisa individual, colocar cada coisa individual sob um conceito. Chegar à natureza; contemplar a substância; olha-la e voltar para dentro de nós mesmos para procurar no arsenal de conceitos aquele que se ajustasse a uma singular substância; e formular um juízo; 3. embaralhar entre si esses diversos juízos, em forma de raciocínios que nos permitissem chegar à conclusão acerca de substâncias que não temos presentes. (ALVARENGA, 2001, p. 7-8) Como visto na seção anterior, em sua Teoria do Conceito, Dahlberg (1978) define conceito como sendo uma unidade de conhecimento. O processo para formação de um conceito é formado por três etapas constituída por três elementos (ver figura 1): A) o item de referência ou referente (objeto real ou abstrato se pretende conceituar,); B) as características (declarações ou proposições verdadeiras acerca do referente); e C) a forma verbal (expressão/termo utilizada para representar o referente). FIGURA 1 - Modelo de construção do conceito. Fonte: DAHLBERG (1978b) Ao observar estas etapas, percebe-se que o conceito é constituído de três elementos: o referente, as características e a forma verbal. Formando o Triângulo do Conceito (figura 2), desenvolvido por Dahlberg (1978b). 34 FIGURA 2 - Triângulo do conceito Fonte: Dahlberg (1978b) Deve-se ficar claro que o processo de formação do conceito se inicia com a escolha do referente, que possui suas características relevantes analisadas de acordo com um determinado domínio. Termos graficamente iguais poderão ter diferentes conceitos se observados em áreas do saber diferentes, uma vez que as características relevantes se alteram de campo para campo do conhecimento. (DAHLBERG, 1978a). Dahlberg (1978a) chama de análise do conceito a identificação das características dos conceitos, obtidas a partir da formulação de enunciados verdadeiros sobre os objetos (referentes). Identificar as características dos conceitos se faz importante, pois elas exercem as funções de: “ordenação classificatória dos conceitos e respectivos índices; definição dos conceitos; formação dos nomes dos conceitos”. (DAHLBERG, 1978a, p. 104). Na Teoria do Conceito as características são divididas em duas espécies: as “características essenciais”, que são as necessárias para se definir conceitos gerais; e as “características acidentais”, que são as adicionais ou possíveis de estarem presentes nos conceitos. A identificação das características é importante para “determinar a ordem dos conceitos”. (DAHLBERG, 1978a, p. 104). Ademais, as características são importantes na identificação dos relacionamentos, pois “sempre que diferentes conceitos possuem características idênticas deve-se admitir que entre eles existam relações”. (DAHLBERG, 1978a, p. 104). Os conceitos se relacionam entre si formando um “sistema de conceito terminológico, pois são representações mentais das relações que ocorrem entre os objetos na realidade empírica”. (CAMPOS, 2001b, p. 77). Para Wuester (1981) as relações, tratadas em um nível conceitual, podem ser classificadas em relações lógicas e ontológicas. A experiência mostra como é difícil para um grande número de pessoas distinguir as duas espécies de relação (lógica e ontológica). Contudo, um abismo intransponível separa muito bem estas duas categorias de relações 35 conceituais. [...] As relações ontológicas nascem do fato de elevarem-se a um nível de abstração as relações que existem na realidade entre os indivíduos (relações ônticas) fazendo-se destas relações individuais (por assim dizer destes indivíduos de relações) conceitos de relação (por exemplo, acima, abaixo). (WUESTER, 1981, p. 97 apud CAMPOS, 2001b, p. 78). Dahlberg (1978a) utiliza as relações lógicas para estabelecer possíveis comparações entre os conceitos, de modo a conseguir organizá-los. Esta autora apresenta ainda outros relacionamentos, a saber: Relações hierárquicas ou de gênero e espécie – ocorrem quando dois conceitos diferentes possuem características idênticas e um deles possui uma característica a mais que o outro; Relações partitivas – ocorrem quando existe um todo e suas partes; Relações de oposição – ocorrem quando um conceito se opõe a outro, por contradição ou contrariedade; e Relações funcionais – ocorrem com conceitos que expressam processo, mostrando as funções do objeto. A Teoria do Conceito ainda trabalha com o sentido da intensão e extensão do conceito. Dahlberg (1978a, p. 105) explica que a intensão do conceito é a soma total das suas características, além da “soma total dos respectivos conceitos genéricos das diferenças específicas”. Já a extensão do conceito seria a soma total dos conceitos mais específicos que o conceito possui, bem como a soma dos conceitos para os quais a intensão verdadeira, ou seja, características em comum que também se encontram na intensão do mesmo conceito. Nas definições estão as características do conceito, delimitando estas características (intensão), é possível determinar os conceitos que possam ser relacionados ao conceito em análise por possuírem características semelhantes, determinando sua totalidade ou o número de conceitos que este conceito abarca (extensão). (FELBER, 1984 apud CAMPOS, 2001b, p. 76). A necessidade de estudos sobre as definições se faz cada vez maior. A pergunta “o que é...?” desperta o interesse das pessoas desde a infância. A curiosidade ou a necessidade de se saber o que é determinado objeto (concreto ou abstrato) persegue o homem ao longo da vida e em todos os períodos históricos. Desta forma, definir algo é uma tarefa difícil que envolve 36 diversos elementos como: o assunto, o público-alvo, o profissional ou o estudioso responsável pela definição, finalidade da definição dentre outros. No meio acadêmico as definições sempre se mostraram fundamentais, por serem “pressupostos indispensáveis na argumentação e nas comunicações verbais e que constituem elementos necessários na construção de sistemas científicos”. (DAHLBERG, 1978a, p. 106). Ainda neste pensamento, Viegas (2007, p. 73) afirma que “a ciência também tem seus instrumentos – como a definição e a classificação – e exigências rituais – como a argumentação”. Logo, pode-se inferir que na definição encontram-se elementos capazes de contribuir para estudos relacionados à Organização do Conhecimento. Nas palavras de Japiassú e Marcondes (2001, p. 49) definir, do ponto de vista lógico, “significa determinar a ‘compreensão’ que caracteriza um conceito”. De acordo com estes autores, para Aristóteles, a definição é a fórmula que exprime a essência de uma coisa, composta do gênero (próximo) e das diferenças (específicas). Definição “é uma locução que exprime o que uma coisa é ou qual o significado de um termo” (VIEGAS, 2007, p. 75). Já para Dahlberg (1978a, p. 106) a definição é como uma “delimitação ou fixação do conteúdo de um conceito (conteúdo do conceito = intensão, ou conjunto de características ou atributos)”. Isto posto, percebe-se a importância da definição não somente como instrumento de argumentação científica, mas também como forma de delimitação de campos de estudos. Nos quais as características, presentes nas definições dos conceitos, especificam as fronteiras semânticas de determinadas áreas do conhecimento. Sob essa vertente, na literatura sobre critérios para elaboração de ontologias e estruturas taxonômicas aparecem estudos de Welty e Guarino (2001), Smith e Kumar (2004) e Guizzardi (2005). Todavia, Marcondes (2014) ao estudar diversas metodologias para desenvolvimento de ontologias, constatou que, apesar desses estudos mencionarem a necessidade de se criar um primeiro glossário com termos potencialmente relevantes, para se chegar a uma refinada lista de termos e seus sentidos (FERNANDEZ; GÓMEZ-PÉREZ; JURISTO, 1997, p. 37), o processo de coleta e identificação dos termos para composição do glossário não é explicado. Acredita-se que nas definições possam estar os elementos necessários para a coleta e identificação dos termos. A Teoria do Conceito de Dahlberg (1978a) e, em especial seus estudos acerca de definições conceituais (DAHLBERG, 1983) podem oferecer a base teórica necessária para a identificação e organização dos termos. 37 Por essa razão, as definições são imprescindíveis na fase de conceituação de ontologias, pois são elas que irão “determinar ou fixar os limites de um conceito ou idéia” (DAHLBERG, 1978a, p. 106). São esses limites que demarcarão os conceitos, identificandoos. Há diferentes maneiras de classificar as definições. Pelo prisma filosófico, há a definição nominal, que explica o sentido de uma palavra pelo recurso a outras palavras ou à etimologia. E também existe a definição real que é aquela que indica a natureza do objeto ou da coisa a ser definida. Já do ponto de vista científico, as definições são operatórias ou empíricas, na qual os conceitos que elas descrevem são definidos por experimentações repetíveis; não são absolutas, pois estão ligadas ao conjunto do pano de fundo teórico da experimentação. (JAPIASSÚ; MARCONDES, 2001, p. 49). Dahlberg (1978a, p. 106) tenta esclarecer a diferença entre definição nominal e real dizendo que “a definição nominal procura fixar o uso de determinada palavra enquanto que a definição real tem por finalidade apresentar o conhecimento contido em determinado conceito”. Assim sendo, a definição nominal fixa o sentido de uma palavra, e a definição real busca distinguir o conceito de outros com características idênticas. Entretanto, é valido lembrar que nem sempre é fácil “saber se estamos fazendo uma definição real ou uma definição nominal. Noutros casos efetuamos as duas ao mesmo tempo”. (DAHLBERG, 1978a, p. 106). Alguns anos depois de seus primeiros estudos, Dahlberg (1983) amplia sua visão sobre as definições incluindo a definição ostensiva aos outros tipos de definições já estudados por ela: nominal e real, este último também chamado agora de definição conceitual. A definição ostensiva seria quando o definiens (expressão verbal utilizada para definir algo) é elaborado com base no referente nomeado pelo definiendum (termo definido). Neste presente trabalho, as definições nominais e reais ou conceituais são as que terão maior relevância, pois essas permitem a compatibilização no plano linguístico e no plano semântico, respectivamente. (CAMPOS, 2010, p. 231). Dahlberg (1983) se utiliza da Teoria do Conceito para afirmar que o que compõem a definição de um conceito são suas características relevantes. São, justamente, as características presentes na definição que possibilitarão a classificação destas definições em: definição genérica, definição partitiva e definição funcional. Campos (2010) explica que a definição genérica permite identificar a categoria do conceito, a partitiva, os componentes do conceito definido, e a funcional insere o conceito como 38 elemento integrador no contexto analisado, ou seja, ela permite que se identifique, na definição, a função/finalidade fornecida a base para se estabelecer os sistemas terminológicos. (CAMPOS, 2010, p. 231) Em analogia, pode-se observar que Le Moigne (1990, p. 79) já apontava que para se compreender um fenômeno é necessário observar três dimensões: “A definição de um objeto faz-se por triangulação: pondera um definição funcional (o que o objeto faz), uma definição ontológica (o que o objeto é) e uma definição genética (o que o objeto devém)”. Tanto Dahlberg, quanto Le Moigne trabalham com princípios parecidos para classificar as definições. Campos (2010) buscou desenvolver uma proposta de definição adequada para a construção de ontologias de domínio consistente. Assim, a autora parte da hipótese que é necessário estabelecer padrões para enunciados definitórios que atendam as especificidades de cada domínio. Desta forma, propõe elementos que deveriam compor a descrição de um determinado objeto (conceito), dentre eles são citados a presença de características que “indicam o gênero próximo e a diferença específica do conceito em análise, seus componentes (caso o conceito seja objeto concreto ou abstrato) ou suas etapas (caso seja um processo ou atividade) e, por fim, a finalidade de aplicação no contexto no qual será aplicado”. (CAMPOS, 2010, p. 222). Principalmente pela necessidade de definições bem fundamentadas para a elaboração de ontologias, o interesse pelos estudos sobre definição tem aumentado. Entretanto, há a necessidade de maior aprofundamento nesta temática para que se consigam realmente padrões definitórios capazes de contribuir para a elucidação de um conceito. Acredita-se que as categorias de definição apresentadas por Dahlberg (1983), poderão contribuir para análise das definições acerca de acidentes do trabalho. A identificação dos termos e das características/atributos, presentes nos enunciados analisados, auxiliarão a modelização do domínio a ser desenvolvida. 4.1.3 Modelagem conceitual Diante de um mundo cada vez mais complexo, no qual “qualquer conhecimento opera por seleção de dados significativos e rejeição de dados não significativos” (MORIN, 2006, p. 10), os modelos podem ser utilizados para representarem, de forma simplificada, a realidade que se pretende compreender. 39 Dito de outra forma, modelo é uma aproximação de uma determinada realidade, “que, de acordo com a sua função utilitária e por meio do seu modo de expressão, sua estrutura e suas igualdades e desigualdades em relação ao seu original, tenta comunicar algo sobre o real”. (SAYÃO, 2001, p. 82). Funcionam, desta forma, como analogias que reformulam o conhecimento sobre certos aspectos do mundo real, “que podem ser reaplicados a novos conjuntos de observações e, nesse sentido, são necessários por constituírem uma ponte entre níveis da observação e do teórico”. (DODEBEI, 2002, p. 20). Capra (1986 apud SAYÃO, 2001, p. 82-83) afirma que todas as teorias e modelos científicos são aproximações da verdadeira natureza das coisas e é isto que constitui o método científico. E acrescenta que a compreensão aproximada da natureza pode ajudar a descrever grupos selecionados de fenômenos, negligenciando outros que se mostrem menos relevantes, em dado momento. Desta forma, os modelos podem ser considerados como “aproximações seletivas que, pela eliminação de detalhes acidentais, permitem o aparecimento de alguns aspectos fundamentais relevantes ou interessantes do mundo real sob alguma forma generalizada”. (SAYÃO, 2001, p. 83). Le Moigne (1977, p. 34) afirma que “modelar é conceber, para um objeto, um modelo que permita conhecê-lo, compreendê-lo, interpretá-lo e auxilie na antecipação do comportamento dele”. Em outras palavras, “o objetivo da modelagem de conhecimento é elaborar uma conceituação da porção do mundo em estudo”. (CAMPOS, 2010, p. 223). Stachowiak (1972 apud Sayão 2001, p. 84) apresenta três características básicas dos modelos: a) característica de mapeamento – modelos sempre modelam alguma coisa, ou seja, são representações de “originais” (ou “protótipos”), naturais ou artificiais, que, por sua vez, também podem ser modelados. b) característica de redução – modelos geralmente não mapeiam todos os atributos do original que eles representam, mas unicamente aqueles que são relevantes para quem modela. c) característica de pragmatismo – modelos não são em si pertencentes à mesma classe que seus originais. Eles sempre cumprem suas funções de substituição orientados unicamente para objetivos dependentes de operações mentais ou factuais, dentro de uma faixa limitada de tempo. Ao estabelecer a Teoria do Sistema Geral, conhecida também como Teoria da Modelização, Le Moigne (1977, p. 23) afirma que “conhecer é modelizar, ou seja, o processo de conhecer equivale à construção de modelos do mundo/domínio a ser construído que permitem descrever e fornecer explicações sobre os fenômenos que observamos”. Mylopoulos (1992, p. 3, tradução nossa) define modelagem conceitual como 40 a atividade de descrever formalmente alguns aspectos do mundo físico e social que nos rodeia, para fins de compreensão e comunicação. [...] Modelagem conceitual tem uma vantagem sobre a linguagem natural ou notações diagramáticas na medida em que se baseia em uma notação formal que permite "capturar a semântica da aplicação." [...] Modelagem conceitual suporta estruturação e instalações de inferências que são psicologicamente fundamentadas. [...] A adequação de uma notação de modelagem conceitual repousa sobre a sua contribuição para a construção de modelos da realidade que promovem um entendimento comum da realidade que envolve seus usuários humanos. Apesar do aumento do interesse pela modelagem conceitual nas últimas décadas, principalmente em função do advento da Web Semântica, esta área de estudo é resultado de pesquisas produzidas na década de 50, quando ocorreram as primeiras iniciativas para especificação de modelos de dados. (ALMEIDA; OLIVERRA; COELHO, 2010). De acordo com estes autores, a modelagem conceitual teve sua origem nos modelos de dados semânticos para banco de dados. Na visão de Sayão (2001) um modelo pode servir para diversos propósitos, mas serve fundamentalmente para comunicar algo sobre o objeto da modelagem, com o objetivo de gerar um entendimento mais completo sobre a realidade. Para que tal objetivo seja conquistado, é preciso que o modelador possua uma visão clara e sem ambiguidades do ser ou objeto modelado, além de exigir uma correta seleção dos elementos do universo do discurso que comporão a visão a ser representada. Ao estudar diversas pesquisas, Sayão (2001) compila como as principais funções dos modelos: a) Função aquisitiva, na qual a informação pode ser definida, coletada e ordenada; b) Função organizacional, que permite a otimização da extração de informações a partir do modelo; c) Função lógica, que explica como ocorre um fenômeno; d) Função normativa, a qual permite comparar fenômenos a outros similares; e) Função sistemática, através da qual a realidade é descrita como conjunto de sistemas interligados; f) Função construtiva, na qual teorias e leis são construídas; e g) Função de parentesco, que promovem a comunicação das idéias cientificas. A modelagem conceitual se constitui em uma etapa importante nos processos ligados a tecnologias de informação que envolvem a construção de modelos de representação. (CAMPOS; SOUZA; CAMPOS, 2003, p. 15). Faz-se necessário utilizar ferramentas semânticas, como, por exemplo, as ontologias, para a elaboração de “modelos conceituais consistentes e também para a formação de ‘classificacionistas’, como denominava 41 Ranganathan, ou dito de outra forma, de modelizadores, que são aqueles que elaboram classificações e não somente as usam”. (CAMPOS; CAMPOS, 2012, p. 4). As ontologias de referência ou de alto nível são utilizadas para modelagem conceitual por conterem conceitos genéricos, passíveis de utilização em diversos domínios (ALMEIDA; OLIVERRA; COELHO, 2010). São exemplos de ontologias de referência: Basic Formal Ontology (BFO) (GRENON; SMITH; GOLDBERG, 2004, p. 41); Descriptive Ontology for Linguistics and Cognitive Engineering (DOLCE) (MASOLO et al. 2003); Unified Foundational Ontology (UFO) (GUIZZARDI; WAGNER, 2004), dentre outras. Talvez por essa razão, em estudos ontologia e modelagem conceitual apareçam como sinônimos: Em modelagem conceitual e áreas afins (ex. Modelagem organizacional), o termo [ontologia] é usado de acordo com sua definição original em filosofia, a saber, como uma referência a um sistema formal e filosoficamente bemfundamentado de categorias que pode ser usado para articular conceituações e modelos em domínios específicos do conhecimento. Em contraste, nas outras áreas supracitadas, o termo ontologia tem sido usado como: (i) artefato concreto de engenharia, projetado com um propósito específico e sem prestar nenhuma ou quase nenhuma atenção aspectos teóricos de fundamentação; (ii) modelo de um domínio específico do conhecimento (ex., biologia molecular, finanças, logística, doenças infecciosas ) expresso em uma linguagem de representação do conhecimento (ex., RDF, OWL, FLog ic) ou modelagem conceitual (ex., UML, EER, ORM)”. (GUIZZARDI et al., 2009, p. 1, grifo nosso) Entretanto, são instrumentos distintos de representação, “(i) modelos conceituais são artefatos produzidos com o objetivo de representar uma determinada porção da realidade segundo uma determinada conceituação; (ii) Ontologias de Fundamentação descrevem as categorias que são usadas para a construção dessas conceituações”. (GUIZZARDI et al., 2009, p. 1). Ainda de acordo esse autor, uma linguagem adequada de modelagem conceitual deveria possuir princípios de modelagem que refletissem as categorias conceituais definidas em uma ontologia de fundamentação, permitindo testar e validar um modelo conceitual. Desta forma, “a partir da noção de cada tipo de elemento, que a estruturação do domínio seja construída de forma a evitar proposições errôneas, aferindo qualidade à modelagem conceitual realizada e respectiva a representação do conhecimento”. (CAMPOS; CAMPOS; MEDEIROS, 2011, p. 142). Percebe-se assim a modelagem conceitual diretamente ligada ao conceito de representação do conhecimento. Modelos conceituais são representações que descrevem a 42 organização e, portanto, são mais simples de compreender por usuários leigos em Informática, pois não envolvem detalhes de implementação de base de dados. (HEUSSER, 1998, p. 8). A elaboração de um instrumento de representação do conhecimento baseado na modelagem conceitual possui sua estrutura constituída por relacionamentos entre os seres ou objetos de um determinado contexto. Os grupos de relações são mostrados por Campos (2004): Relação categorial (reúne os objetos por sua natureza, ou seja, entidades, processos, entre outros); Relação hierárquica (verifica a ordem de precedência de objetos de mesma natureza); Relação partitiva (analisa como o objeto é constituído, ou seja, quais são suas partes e elementos); Relações entre categorias (verificar como objetos de natureza diferente se relacionam, representado de forma mais consistente); e Relação de equivalência (verificar, no âmbito da Língua, a forma de expressar os conceitos). Portanto, ao utilizar a modelagem conceitual para propor uma melhoria na semântica de dados abertos publicados pelo Ministério da Previdência Social, pode-se estar também contribuindo para que outros estudos busquem modelos para seus respectivos domínios dentro do Governo Brasileiro. 4.1.4 Modelo Entidade-Relacionamento O modelo Entidade-Relacionamento ou modelo E-R foi desenvolvido por Peter Chen (1976) e se propunha a ser um modelo unificado para os dados, possibilitando a especificação da estrutura lógica geral do banco de dados. O modelo Entidade-Relacionamento possui princípios diretamente ligados aos denominados modelos de dados para construção de sistemas de informação. Potter (1998, p. 53 apud CAMPOS, 2001b, p. 99) explica que, no final da década de 50, os estudos sobre processamento de dados automatizados constataram que faltava formalismo que expressassem a estrutura lógica dos dados do sistema. Este formalismo foi definido como modelo de dados. Desta forma, “os modelos de dados podem ser caracterizados como modelos que representam objetos (entidades) e relações em um dado domínio”. (CAMPOS, 2001b, p. 100). Heuser (1998, p. 5) explica que há vários níveis de abstração para modelização (descrição) de um banco de dados. Por um lado, um modelo de dados com o objetivo de explicar a um usuário qual é a organização de um banco de dados, em geral, não apresenta detalhes sobre a representação em meio físico das informações. Por outro lado, um modelo de dados utilizado por um técnico para otimizar a performance de acesso ao banco de dados 43 conterá mais detalhes de como as informações estão organizadas internamente e, assim, será menos abstrato. Na modelagem de dados uma das técnicas mais difundidas e utilizadas é a abordagem entidade-relacionamento. (Heusser, 1998, p. 11). No início dos anos 70, já havia surgido o Modelo Relacional, criado por Edgar Frank Codd, que foi o primeiro modelo de dados descrito teoricamente. (CONNOLY; BEGG, 1999). Já no meado da mesma década, quando Chen (1976) apresentou o modelo Entidade-Relacionamento, muitos autores da época não reconheceram a importância do novo modelo, porém com o passar do tempo ficaram claras as contribuições e as inovações que a proposta de Chen havia trazido para a Ciência da Computação (CHEN, 2002), tornando seu artigo de 1976 um dos mais importantes da área até os dias atuais. (LAPLANTE, 1996). Chen (2002, p. 2) analisa o momento histórico da elaboração do modelo Entidaderelacionamento e conclui que ele foi o resultado de duas forças – força proveniente da indústria e do mundo acadêmico – que demandavam uma evolução nos modelos de dados existentes. No modelo Entidade-Relacionamento os principais elementos são a entidade, o relacionamento e o atributo. Chen (1976, p. 10) esclarece que uma entidade é ‘algo’ que pode ser claramente identificado. Uma pessoa específica, uma empresa ou um evento são exemplos de uma entidade. Um relacionamento é uma associação entre entidades. Já o atributo é o dado associado a cada ocorrência e entidade ou de um relacionamento. Assim, os atributos são as propriedades das entidades. Dahlberg (1978a, p. 102) ao explicar análise do conceito, realizada utilizando enunciados verdadeiros, afirma que um “atributo predicável do objeto que, no nível de conceito, se chama característica”. Assim como Chen (1976), Dahlberg (1978a) utiliza os atributos para explicitar as características do objeto, que na Teoria do Conceito formará o conceito e no modelo E-R, caracterizará as entidades. Para Heuser (1998, p. 12) uma entidade é o “conjunto de objetos da realidade modelada sobre os quais deseja-se manter informações no banco de dados”. Entretanto, grupos diferentes de pessoas podem determinar entidades e relacionamentos diferentes. A solução dada por Chen (1976) para este impasse é considerar o contexto analisado e decidir os resultados entre os participantes da modelização. A cardinalidade presente em um modelo Entidade-Relacionamento é o “número (mínimo, máximo) de ocorrências de entidades associadas a uma ocorrência da entidade em questão através do relacionamento”. (HEUSER, 1998, p. 15). 44 Heuser (1998, p. 15) ainda explica que a cardinalidade é importante para fins de projeto de banco de dados, pois determina quantas “ocorrências de uma entidade podem estar associadas a uma determinada ocorrência através do relacionamento”. Desta forma, a cardinalidade máxima indica a quantidade máxima de ocorrências de entidades que podem estar associadas a uma ocorrência da outra entidade (1 ou n). Por sua vez, a cardinalidade mínima especifica se a participação de todas as ocorrências das entidades no relacionamento é obrigatória (1) ou opcional (0). As informações cardinalidade de relacionamento também se expressam, por exemplo, o "1" ou "N" nas linhas entre os tipos de entidade e tipos de relacionamento indicando o limite superior das entidades desse tipo entidade participante em que os relacionamentos. (CHEN, 1976). Estes elementos são arranjados de forma a deixar claro o que representam e seu papel em um determinado modelo. Desta forma, o modelo Entidade-relacionamento é representado graficamente como um diagrama Entidade-Relacionamento ou, simplesmente, diagrama ER. O diagrama Entidade-Relacionamento é uma das principais técnicas na modelagem Entidade-Relacionamento, pois padroniza a entidade e o relacionamento em formas gráficas convencionalizadas. A figura 3 mostra um exemplo de diagrama Entidade-Relacionamento típico. A entidade é representada como retângulo, o relacionamento, em forma de losango, ligado por linhas aos retângulos (entidades). Os atributos são representados como pequenos círculos. FIGURA 3 - Exemplo de Diagrama ER. Fonte: O autor. Na Figura 3 acima, nota-se os seguintes elementos: “Acidente do trabalho” e “Lesão corporal” como entidades, representadas por um retângulo; O verbo “causa” como relacionamento entre as entidades, representado por um losango; 45 “Local” e “Data” são atributos da entidade “Acidente do trabalho”, representados por um pequeno círculo ligado diretamente à entidade a que se corresponde. Ainda é apresentada na figura 3 a cardinalidade. Para se chegar a cardinalidade devese observar o relacionamento (Causa) entre as entidades (Acidente do trabalho e Lesão corporal). Para tal pode se considerar as seguintes questões: Um acidente do trabalho pode não causar lesão corporal? Uma lesão corporal pode ser causada por mais de um acidente do trabalho? Determinado acidente do trabalho pode causar mais de uma lesão corporal? Pode existe, no âmbito da Previdência Social, alguma lesão corporal não causada por acidente do trabalho? No exemplo aqui mostrado, a cardinalidade (1,n) faz referência a “Acidente do trabalho”, já a cardinalidade (1,1) faz referência a “Lesão corporal”. Assim, pode-se dizer que: uma ocorrência de “acidente do trabalho” pode causar uma ou muitas ocorrências de “lesões corporais”. Por esse motivo, a cardinalidade de “Acidente do trabalho” é (1,n); uma ocorrência de “Lesão corporal” está associada a apenas uma ocorrência de “Acidente do trabalho” (cada lesão corporal é conseqüência de apenas um acidente do trabalho). Por essa razão, a cardinalidade de “Lesão corporal é (1,1). A necessidade de se estudar o modelo Entidade-Relacionamento e seu diagrama surgiu a partir da necessidade de representar graficamente os conceitos identificados para a elaboração do modelo a ser proposto. Como representar, em forma gráfica, os conceitos de forma a serem facilmente compreensíveis pelo leitor e que possibilite uma futura representação em RDF? Esta foi a pergunta que direcionou os estudos ao modelo EntidadeRelacionamento. Campos (2004), ao analisar algumas teorias e metodologias, verificou que a área da Ciência da Informação não possui modelos para a elaboração de representações gráficas, apesar de ser a área responsável por desenvolver teorias consagradas sobre o conceito e suas relações. 46 Tanto na teoria da classificação facetada quanto na teoria do conceito, não é apresentado nenhum modelo para expressar graficamente as relações conceituais. Acreditamos que isso se deva ao fato de que essas teorias têm por objetivo a elaboração de linguagens documentárias que, apesar de possuírem uma parte sistemática, não têm os conceitos representados em forma gráfica, mas em forma de uma lista endentada de termos, com uma notação que, de certa forma, deixa evidentes os grupos de termos afins. (CAMPOS, 2004, p. 31) Por esta razão, buscou-se na Ciência da Computação o modelo ER como conhecimento a ser aplicado na representação dos conceitos. Essa escolha se deve ao fato do modelo ER ser um dos modelos com maior capacidade semântica, por apresentar aspectos semânticos que se referem à tentativa de representar o significado dos dados e por possuir uma relativa simplicidade e clareza gráfica. (SILBERSCHATZ; KORTH; SUDARSHAN, 1999, p. 21-34). Ratificando estas idéias, Campos (2001b, p. 100-101) afirma que a “popularidade da modelagem entidade-relacionamento para projetar base de dados mais complexas é dada por sua simplicidade de conceitos e a crença muito difundida em entidades e relacionamentos como conceitos naturais de modelagem”. Desta maneira, com apoio das ontologias de fundamentação, que ainda serão vistas, foram identificados nas definições sobre acidentes do trabalho as entidades, os relacionamentos e os atributos, representando-os graficamente em diagrama ER. Outro ponto que levou a escolha do modelo ER, foi sua proximidade com o RDF, padrão indicado para descrição de dados na Web Semântica. Chen (2002) ao falar dos possíveis usos e relações do modelo Entidade-Relacionamento, associa-o ao RDF, afirmando que existem algumas semelhanças e diferenças entre RDF e do modelo ER. Entretanto, o RDF, já é considerado um membro da família da modelagem Entidade-Relacionamento, em que os dados estruturados como gráficos rotulados podem ser trocados através de documentos XML. (W3C, 1999). Decidiu-se trabalhar no diagrama ER apenas com relacionamento binário, ou seja, quando o relacionamento “conecta apenas duas entidades” (LIMA, 2008, p. 76). Esta escolha se justifica pela dificuldade de se converter relações ternárias em RDF e da identificação da cardinalidade presente no relacionamento. Acredita-se que o modelo ER seja capaz de representar os conceitos existentes no campo de acidentes do trabalho da Previdência Social brasileira. Diante desta representação 47 realizada, pode-se verificar a organização do campo, como também utilizar esta organização para outras representações, como, por exemplo, em RDF. 4.2 WEB SEMANTICA E SUAS TECNOLOGIAS A Web surgiu no laboratório do European Organization for Nuclear Research, mais conhecido como CERN. Berners-Lee (1989) escreveu um artigo que antevia a Web, no qual tratava sobre gerenciamento de informações, que apresentava uma ideia de conjuntos de documentos de hipertexto interligados e acessíveis pela Internet. Existe uma confusão entre Internet e Worl Wide Web (WWW). Pode-se considerar que a Internet surgiu em 1969, quando o pesquisador Leonard Kleinrock estabeleceu a primeira comunicação entre dois computadores conectados a então denominada Advanced Research Project Agency Network (ARPANET), enviando uma mensagem de um computador localizado na Universidade da Califórnia para outro localizado no Instituto de Pesquisa de Stanford. (RAMALHO; OUCHI, 2011). Por sua vez, a WWW é um de seus serviços. A Internet adquire sua face atual com o surgimento do hipertexto e da Web, a “teia global”, criados por Tim Berners-Lee no CERN, em 1989. A Web transforma a Internet num gigantesco sistema de informações em escala mundial. (GREENBERG, 2003; MARCONDES et al., 2008). Em 30 de abril de 2013, em comemoração aos 20 anos do surgimento da Web, Cailliau (2013), que atuou para viabilizar o projeto da Web, disse na página do CERN que a grande escolha, na época, era entre fazer WWW disponível, livre de royalties, e mantê-lo como propriedade intelectual do CERN. Foi quando decidiram pela disponibilização do WWW para se tornar a grande rede de comunicação e informação que se conhece atualmente. A Web tradicional é denominada por Breitman (2005) de Web Sintática, na qual os computadores fazem apenas a apresentação da informação, enquanto o processo de interpretação fica a cargo dos seres humanos, já que isso exige um grande esforço para avaliar, classificar e selecionar informações e conhecimentos de interesse. (PICKLER, 2007). Em contra partida a Web Sintática, surge a Web Semântica, que busca mecanismos que possibilite às máquinas “compreenderem” o significado das páginas eletrônicas, criando um ambiente no qual os computadores possam processar e relacionar conteúdos provenientes de várias fontes. Para que isso se torne possível, é necessário estruturar os dados contidos nessas páginas de forma que o próprio sistema identifique seu assunto e conteúdo e para isso seria preciso embutir semântica na estrutura dos dados. (BREITMAN, 2005). 48 Miller e Swick (2003) previam que a Web Semântica iria permitir que as pessoas pudessem escrever (ou gerar) arquivos que explicassem - a uma máquina - a relação entre diferentes conjuntos de dados. Entretanto, atribuir semântica aos dados é uma tarefa complexa, na qual diversos pesquisadores têm se dedicado ao estudo. A semântica das informações precisa ser convencionada com antecedência, de modo que todas as partes envolvidas tenham um entendimento comum do significado dos dados trocados. No nível internacional, isso pode ser uma questão complexa, visto que alguns conceitos legais podem diferir de um país para outro. O objetivo final é ser capaz de interpretar os dados de maneira uniforme entre as diferentes organizações e plataformas envolvidas na troca de dados. Para isso, seria útil publicar na Web os nomes e definições dos elementos usados no momento em formato partilhável e referenciável, independentemente do grau de apoio que se obteve. (W3C, 2008, p. 58) A Web Semântica pode ser entendida como sendo uma extensão da Web atual (BERNERS-LEE; HENDLER; LASSILA, 2011), na qual a informação ganha sentidos bem definidos, permitindo uma melhor cooperação entre pessoas e computadores na realização de suas tarefas. Isso é baseado na ideia de se ter, na Web, dados definidos e ligados de modo que consigam ser usados em buscas, gerando respostas mais eficazes, na automação, na integração e no reuso com várias aplicações. (MILLER; SWICK, 2003). Pickler (2007) complementa a definição de Web Semântica ao afirmar que ela foi uma tentativa de se melhorar (ou mesmo otimizar) as pesquisas realizadas na Web. Servindo como uma nova ferramenta inteligente de busca de informações no ciberespaço, acrescentando semântica ao atual formato de representação de dados, trabalhando com associação e dedução. Sob essa perspectiva, a tarefa de verificar o assunto do documento ficaria a cargo das máquinas, poupando tempo e trabalho a quem realizasse uma busca. Na figura 4, é mostrada uma representação da evolução da Web. semântica das conexões das informações (eixo vertical do gráfico). A linha pontilhada mostra conceitos e aplicações Web, que foram criados a partir da evolução da semântica das conexões das informações. Dentre as tecnologias utilizadas na infraestrutura dessa evolução se encontram as da Web Semântica. Deve-se ficar atento para o fato que, a Web Semântica, chamada por alguns autores de Web 3.0, trata sobre a colocação de itens de dados na Web, não servindo apenas como uma Web de documentos, mas também de dados. “A tecnologia de dados da Web Semântica terá muitas aplicações, todas interconectadas. Pela primeira vez haverá um formato comum de 49 dados para todos os aplicativos, permitindo que os bancos de dados e as páginas da Web troquem arquivos”. (BERNERS-LEE, 2007, p. 3). FIGURA 4 - Evolução da Web. Fonte: Spivack (2007) A Web Semântica, no contexto dos dados ligados, oferece uma infra-estrutura (figura 5) que permite páginas Web, bancos de dados, serviços, programas, dispositivos pessoais e até mesmo eletrodomésticos tanto consumir, como produzir dados a serem disponibilizados. Agentes de software podem usar essas informações para procurar, filtrar e preparar informações em novos formatos de forma a ajudar os usuários da Web. (MILLER; SWICK, 2003). FIGURA 5 - Arquitetura da Web Semântica. Fonte: Greenberg; Sutton; Campbell (2003). 50 Abaixo segue a descrição da figura 5 de acordo com Greenberg, Sutton, Campbell (2003, p. 16): • URIs e Unicode. URIs (identificadores de recursos uniforme) são identificadores únicos para os recursos de todos os tipos de esquemas para pessoas. Um componente importante da camada de base, URIs são metadados e funcionam como o ISBN. • XML + NS + XMLschema. Extensible Markup Language (XML) e, mais recentemente, os XML esquema facilitam a criação, o uso e a interoperabilidade sintática de vocabulários de metadados. NS (namespaces), que são identificados por meio de URIs, garantem a interoperabilidade semântica entre vocabulários de metadados. • RDF e RDFschema. A família RDF suporta ainda a interoperabilidade a nível semântico. Desenvolvimentos RDF compreendem a base da linguagem Web, para que os agentes possam fazer inferências lógicas, baseadas em metadados, para executar tarefas. • Ontology vocabulary. A camada de ontologia representa artéria central de metadados da Web Semântica, onde descrições simples de esquemas classificatórios complexos devem ser criados e registrados para que os agentes inteligentes possam interpretar dados, fazer inferências, e executar tarefas. • Logic. Um agente pode tirar uma conclusão lógica (ou razão) no processo de completar uma tarefa com base no que são, essencialmente, "fatos" prestados a partir de metadados semanticamente codificada. Outros tipos de lógica também pode ser aplicável na Web Semântica. • Proof and Trust. As duas últimas camadas horizontais construídas fora da camada de lógica, sendo uma prova de validação da "evidência" decorrente da atividade lógica inferencial e confiança relacionadas com a integridade da prova, que pode ser rastreada através das outras camadas do diagrama de Berners-Lee. A funcionalidade destas duas camadas é altamente dependente da criação de metadados precisos e confiáveis. • Digital Signature. As assinaturas digitais correm verticalmente desde a família RDF até a camada de prova e apoia a noção de confiança. Pesquisas na área de assinaturas digitais podem ajudar a validar a integridade dos metadados que um agente vai usar para o raciocínio e conclusão da tarefa. Neste trabalho se dará ênfase à linguagem XML, ao RDF e às ontologias, por serem as tecnologias escolhidas para serem aplicadas na pesquisa em questão. Porém, não se poderia deixar de fazer uma breve explanação sobre URI, justamente por estar na base da Web Semântica. 51 4.2.1 Identificando recursos com URI Uniform Resource Identifier ou simplesmente URIs são utilizados para identificar recursos, sendo fundamentais para a implementação da Web Semântica. Usando uma convenção de nomenclatura global, impulsionam os benefícios da Web. URIs têm escopo global e são interpretadas de forma consistente em contextos específicos. Associando uma URI com um recurso significa que qualquer pessoa pode se associar a ele, referindo-se a ele ou recuperar uma representação sobre ele. (SHADBOLT; HALL; BERNERS-LEE, 2006, p. 97). Ainda de acordo com esses autores, as URIs sustentam a Web Semântica, pois permitem que as máquinas processem os dados diretamente. Desta forma, a Web Semântica muda a ênfase passando dos documentos para os dados. De acordo com Thompson (2010), no final da década de 1990, o conceito de recurso sofreu uma generalização, passando a ser utilizado a algo identificado, ou seja, pessoas, livros, documentos eletrônicos ou até mesmo relações abstratas, por exemplo, podem ser considerados recursos. Este fato foi muito importante para a Web Semântica, pois já não havia limites para se considerar um recurso. FIGURA 6 - URI na representação de um recurso. Fonte: Thompson (2010) Na figura 6, pode-se perceber uma URI identificando um recurso (cidade), descrito por outro recurso (documento com informações sobe Oaxaca), que, por sua vez, é representado 52 por metadados. Logo, a URI ganha destaque no universo da Web Semântica, pois permite a interação com representações do recurso através da Web. 4.2.2 XML e a descrição de dados De acordo com Leocadio (2011, p. 53), a Web Semântica também é conhecida como Web dos dados e nesse sentido duas tecnologias se apresentam como catalisadoras: eXtensible Markup Language (XML) e Resource Description Framework (RDF). Resumidamente, a XML trata da sintaxe enquanto o RDF trata da semântica dos dados. Davis (2004 apud FURGERI, 2006, p. 226) define linguagem de marcação como “uma forma de descrever a estrutura lógica ou semântica de um documento e fornecer instruções a computadores sobre como apresentar o conteúdo de um arquivo”. Percebe-se, por esta definição, que a linguagem de marcação é caracterizada por delimitar um dado, classificando-o dentro do contexto representado. Contribuindo, dessa forma, para “tornar a comunicação livre de formatos proprietários, uma vez que elas representam padrões abertos e podem ser usadas livremente”. (FURGERI, 2006, p. 227) Dziekaniak e Kirinus (2004, p. 30) definem XML como a representação textual do dado. Explicam ainda que, a XML é formada por um composto básico chamado “element, isto é, o texto limitado entre delimitadores (tags) < >...</> (incluindo os próprios delimitadores) tal como pessoa, nome, idade e e-mail. É possível associar atributos a elementos. Um atributo é definido como um par (nome, valor)”. Na figura 7, pode-se observar uma representação de dados sobre acidentes do trabalho em XML. FIGURA 7 - Dados em XML sobre acidente do trabalho <?xml version="1.0"?> <acidentes_de_trabalho> <registro> <municipio uf="AP" cod_ibge="160027">LARANJAL DO JARI</municipio> <quantidade> <sem_cat>42</sem_cat> <com_cat> <tipicos>4</tipicos> <trajeto>3</trajeto> <doenca>0</doenca> </com_cat> <obitos>0</obitos> </quantidade> </registro> </acidentes_de_trabalho> Fonte: Dataprev (2013) Ao analisar especificamente a linguagem XML, Dziekaniak e Kirinus (2004, p. 30) afirmam que essa linguagem de marcação deve respeitar duas restrições: “tags devem estar 53 corretamente aninhadas e atributos devem ser únicos”. Assim, de acordo com esses autores, se um documento atende a essas restrições, o documento estará bem formado, sendo possível organizá-lo segundo uma estrutura de árvore e representá-lo via XML na Web. A XML é um formato amplamente utilizado para troca de dados, pois “possibilita que se mantenha a estrutura dos dados em operações diferentes. O modo como os arquivos XML são construídos permite aos desenvolvedores escrever parte da documentação dentro dos dados, sem interferir na sua leitura”. (MANUAL..., 2011, p. 36). A linguagem XML foi desenvolvida na Sun, fornecedora de softwares e equipamentos na área de Tecnologia da Informação. Furgeri (2006, p. 229) explica que Assim como o HTML, o XML foi definido como um padrão de marcação para ser utilizado na Internet, constituindo-se uma versão simplificada da Standard Generalized Markup Language (SGML), cujo objetivo principal foi fornecer aos desenvolvedores da Web uma maneira de definir e criar seus próprios marcadores e atributos em vez de estarem restritos ao esquema de marcação da HTML. O próprio significado da XML sugere essa característica, pois é uma linguagem de marcação extensível. A XML Schema é uma evolução do Document Type Definition (DTD) e são exemplos de padrões de marcação surgidos a partir da XML, que permite a criação de tags específicas para determinada área. Entretanto, para que o documento seja compreendido em diferentes contextos é necessário que se obedeça algumas regras, que serão definidas pela XML Schema. É este último que definirá os padrões deveram ser seguidos para que o documento seja considerado válido. (FURGERI, 2006, p. 230). Ao mencionar sobre as aplicações da XML em Ciência da Informação, Furgeri (2006, p. 234) afirma que a linguagem XML pode ser usada na melhoria da recuperação da informação no ambiente Web, uma vez que a HTML, que não fornece um modo adequado para descrever os conteúdos do texto, o significado fica perdido e os resultados de busca nem sempre satisfatórios. O mesmo autor afirma ainda que, a linguagem XML pode ser usada na criação de ontologias entre comunidades. Pois, um documento poderá expressar o sentido de seu conteúdo se o autor e o leitor estiverem de acordo com o significado dos termos utilizados, isto é, devem ser elaborados a partir do mesmo Schema. Miller e Swick (2003, p. 9) consideram que o XML fornece uma base sintática interoperável sobre a qual as línguas para representar as relações e os significados são construídos. Já o RDF fornece um meio poderoso de expressar e representar essas relações e significados. 54 4.2.3 RDF como linguagem de representação de dados Em 1997, o W3C definiu a primeira especificação Resource Description Framework (RDF). RDF fornece uma linguagem de representação baseada em triplas simples, mas poderosas para interligar URIs. Em função disso, tornou-se uma recomendação da W3C em 1999, preocupada, naquele momento, com a conscientização da necessidade de especificar os recursos e promover a sua implantação generalizada para melhorar a funcionalidade da Web e interoperabilidade. “A Web original tomou hipertexto e fez funcionar em escala global, a visão para RDF era fornecer uma representação do conhecimento minimalista para a Web”. (SHADBOLT; HALL; BERNERS-LEE, 2006, p. 96). Senso e Hípola (2007, p. 3) relatam que o RDF foi criado como “um formato que iria conseguir a compatibilidade entre os diferentes sistemas de metadados, proporcionando assim uma arquitetura genérica para a meta-informação. Para isso, decidiu usar XML como um sistema de comunicação”. De acordo com Hjelm (2001 apud SENSO; HÍPOLA, 2007, p. 3), RDF é um formato que tem a sua origem em dois ramos recentes da Documentação. Por um lado são metadados, como um sistema que, além de servir como um modelo de metadados é capaz de conectar sistemas em conjunto e, por outro lado, a representação do conhecimento, agora incorporada no conceito de Web Semântica. A capacidade que tem o RDF para representar metadados, em formato legível por máquina, facilita a interoperabilidade entre diversas aplicações, proporcionando um mecanismo perfeito para o intercâmbio de informação através da Web. É usado em projeto dados abertos interligados (LOD, sigla em inglês de Linked Open Data), da União Européia, oferecendo oportunidade para a interoperabilidade e o processamento automático de dados governamentais. (MANUAL..., 2013, p. 37). Interoperabilidade pode ser entendida como a “capacidade de bases de dados trocarem e compartilharem documentos, consultas e serviços, usando diferentes plataformas de hardware, estrutura de dados e interfaces”. (ALVES; SOUZA, 2007, p. 23). Na visão de Brickey e Guha (2000 apud SENSO; HÍPOLA, 2007, p. 4), o RDF pode ser aplicado em diferentes áreas: como a recuperação de informação (proporcionando melhores serviços aos motores de busca); a catalogação em bibliotecas digitais (especificando também relações de conteúdos disponíveis em um determinado site da Web); os agentes inteligentes (facilitando o intercâmbio de conhecimento). 55 RDF é utilizado como uma representação de informações na Web. Elaborada a partir da XML, tem como objetivo principal prover intercâmbio de informações entre aplicações mantendo seu significado. O RDF permite criar declarações sobre esses objetos por meio de propriedades que representam um relacionamento entre recursos. Furgeri (2006, p. 237) apresenta aos benefícios trazidos pela utilização do RDF: RDF resolve o problema da diversidade na representação da informação que ocorre em XML, criando ligações únicas entre recursos e estabelecendo vocabulários por meio de namespaces18. A RDF elimina o problema da limitação do tamanho da estrutura enfrentada pela XML, criando ponteiros que unem documentos com estruturas menores. RDF é mais indicada para a criação de metadados, pois um recurso é referenciado a um objeto por meio de um predicado com significado próprio. A ordem com que as declarações são realizadas não importa, diferente do que ocorre na XML. RDF elimina o problema da representação da informação em forma de árvore, criando uma estrutura mais flexível em forma de grafos, possibilitando a formação de uma cadeia de informações e estabelecendo uma rede de conhecimento. O RDF é considerado por autores como Berners-Lee, Hendler e Lassila (2001) como a possibilidade de se criar um primeiro nível de semântica nos dados publicados na Web. Criando-se um vocabulário controlado para descrever um domínio do conhecimento, fato que torna possível a qualquer organização publicar informações de maneira semântica. Com isso, agentes de software podem agir de maneira automática e inteligente sobre recursos Web, inferindo sobre o significado dos elementos. (Furgeri, 2006, p. 237-238). A descrição de um recurso é representada como uma série de triplas com “sujeitopredicado-objeto” (ARAÚJO, SOUZA, 2011) ou, com outra nomenclatura, “recursopropriedade-valor” (FURGERI, 2006). Klyne e Carroll (2004 apud ARAÚJO, SOUZA, 2011) explicam que o sujeito é o URI que serve para identificação do recurso descrito. Já o objeto é o valor literal, como uma string, número ou data, ou ainda o URI de outro recurso que está relacionado ao sujeito. Por sua vez, o predicado é um algum vocabulário, que indica o tipo de relação que existe ente o sujeito e o objeto. FIGURA 8 - Grafo de triplas (sujeito, predicado e objeto) Predicado Sujeito Acidente do trabalho Objeto Lesão corporal Causa Fonte: O Autor. 18 Namespace pode ser entendido como um mecanismo para identificar os elementos da XML. Trata-se de um prefixo associado à marcação que permite torná-la exclusiva. (MARCHAL, 2000 apud FURGERI, 2006). 56 Furgeri (2006) e Baptista e Machado (2001) afirmam que com o RDF Schema (RDFS) é possível definir os termos (as triplas) que serão usados nas declarações dos documentos RDF, uma maneira de criar um vocabulário controlado, permitindo estabelecer relações e restrições entre os recursos. Essas relações são utilizadas para interligar termos por meio de namespaces, estabelecendo significado entre eles por meio de associações. O Simple Knowledge Organisation Systems (SKOS) é um exemplo de vocabulário baseado em RDF para representação de tesauros e outros tipos similares de sistemas de organização de conhecimento. (MILES, 2005 apud FURGERI, 2006, p. 237-238). 4.2.4 Ontologia e acidente do trabalho como evento Berners-Lee (1989) já previa a evolução de uma Web que consistia na passagem de uma Web com grande parte de documentos compreensíveis apenas por pessoas para uma extensão dessa Web, que permitiria a manipulação de dados e informações compreensíveis por computadores. A Web Semântica é uma rede de informações derivada de dados, que por meio de uma semântica, permite que máquinas “interpretem” esses dados. (SHADBOLT; HALL; BERNERS-LEE, 2006, p. 96). Um dos grandes desafios na época de surgimento da Web Semântica era como atribuir sentido aos dados de forma a serem compreensíveis por máquinas. Entretanto, esse obstáculo tem sido transposto pela adoção de concepções comuns referidas como ontologias. (SHADBOLT; HALL; BERNERS-LEE, 2006, p. 96). De acordo com esses autores, desde 2001, o argumento em favor do uso de ontologias vem gerando numerosas iniciativas em prol do desenvolvimento de ontologias para utilização em diversas áreas do conhecimento, sendo realizadas pesquisas em diversos grupos. Essas comunidades desenvolvem padrões de linguagem que podem ser implantados na Web. Para Gruber (2009) o termo "Ontologia" vem do campo da Filosofia que se preocupa com o estudo do Ser ou existência. Na Filosofia, pode-se falar de uma Ontologia como uma teoria sobre a natureza da existência. Entretanto, para esse autor, a ontologia, na Ciência da Computação e na Ciência da Informação, é um termo técnico que indica um artefato que é projetado para uma finalidade, que é permitir a modelagem de conhecimento sobre algum domínio, real ou imaginária. O termo ontologia foi cunhado no século 17 pelos filósofos Rudolf Göckel, em sua obra Lexicon philosophicum e por Jacob Lorhard, em sua obra Ogdoas Scholastica. O termo Ontologia, entretanto, foi popularizado no círculo filosófico somente no século 18 pela 57 publicação, em 1730, da Philosophia prima sive Ontologia de Christian Wolff. (GUIZZARDI, 2005). De acordo com Smith (2004 apud GUIZZARDI, 2005), o termo “ontologia” na Ciência da Computação e na Ciência da Informação apareceu pela primeira vez em 1967, em um trabalho de fundamentos de modelagem de dados escrito por S. H. Mealy, na passagem que distingue três reinos diferentes na área de processamento de dados, a saber: a) o próprio mundo real; b) idéias sobre o que existe nas mentes dos homens; c) símbolos sobre papel ou outro meio de armazenamento. Gruber (1995) define uma ontologia como sendo uma especificação de uma conceituação19. Já Guarino (1998) acrescenta dizendo que a ontologia é uma especificação parcial e explícita que tenta uma aproximação com a estrutura de mundo definida na conceituação. Guizzardi (2000) baseado nas idéias de Guarino (1998) resume que a ontologia é um artefato computacional composto de um vocabulário de conceitos, suas definições e suas possíveis propriedades, um modelo gráfico mostrando todas as possíveis relações entre os conceitos e relações, representando de maneira clara e não ambígua o conhecimento do domínio. (GUIZZARDI, 2000, p. 39). Guizzardi (2005, p. 70-71) explica que ao surgir a Web Semântica, as ontologias foram chamadas a desempenhar um papel fundamental no entrelaçamento de símbolos compreensíveis pelos humanos e processáveis por máquina. A ideia é que, em primeiro lugar, as ontologias representando conceituações compartilhadas da realidade são construídas e especificadas em uma linguagem compreensível por máquina. Em seguida, as especificações formais, que podem ser utilizadas como domínios semânticos, através da definição de semântica formal e do mundo real, fornecendo sentido aos símbolos sintáticos apresentados em recursos da Web. Diante da necessidade de se utilizar ontologias na organização de dados na Web, percebe-se, cada vez mais, o interesse de diferentes áreas do conhecimento sobre esse assunto. Por essa razão, Almeida e Bax (2003) levantam uma grande quantidade de tipologias de ontologias, isso se deve ao fato das ontologias não apresentarem uma única estrutura. 19 Alguns autores preferem traduzir o termo “conceptualization” para “conceitualização”, porém essa palavra não existe na língua portuguesa. De acordo com Higuchi (2012) o termo mais próximo em português seria “conceituação”, que não corresponde ao sentido utilizado na área de representação do conhecimento. Já “conceitualização” é amplamente adotado para se referir a uma visão abstrata e simplificada do mundo que se deseja representar, considerando as entidades e relacionamentos. 58 Entretanto, pode-se identificar características e componentes básicos, que podem ser classificados em tipos bem definidos. Uschold e Gruninger (1996) classificaram as ontologias pelo grau de formalismo: altamente informal, semi-informal, semi-formal e rigorosamente formal. Já Guarino (1997; 1998) faz uma classificação das ontologias com base em seu conteúdo. Guizzardi (2000; 2005) explica estas classificações da seguinte maneira: ontologias genéricas: descrevem conceitos bastante gerais, tais como, espaço, tempo, matéria, objeto, evento, ação, etc., que são independentes de um problema ou domínio particular; ontologias de domínio: expressam conceituações de domínios particulares, descrevendo o vocabulário relacionado a um domínio genérico, tal como Medicina e Direito. ontologias de tarefas: expressam conceituações sobre a resolução de problemas, independentemente do domínio em que ocorram, isto é, descrevem o vocabulário relacionado a uma atividade ou tarefa genérica, tal como, diagnose ou vendas; ontologias de aplicação: descrevem conceitos dependentes do domínio e da tarefa particulares. Estes conceitos freqüentemente correspondem a papéis desempenhados por entidades do domínio quando da realização de uma certa atividade; ontologias de representação: explicam as conceituações que fundamentam os formalismos de representação de conhecimento. Assim sendo, Guizzardi (2000, p. 39-40) sintetiza que as ontologias de domínio, o tipo mais desenvolvido, são construídas para serem utilizadas em um micro-mundo. As ontologias genéricas procuram construir teorias básicas do mundo, de caráter bastante abstrato, aplicáveis a qualquer domínio (conhecimento de senso comum). Já as ontologias de representação procuram tornar claros os compromissos ontológicos de representação embutidos em formalismos de representação de conhecimento. E por sua vez, as ontologias de tarefa procuram facilitar a integração dos conhecimentos de tarefa e domínio em uma abordagem mais uniforme e consistente, tendo como base o uso de ontologias. McGuinness (2003) cita algumas possíveis utilizações para ontologias. Uma delas seria sua utilização para os tipos simples de verificação de consistência. Se ontologias contêm informações sobre as propriedades e restrições de valor sobre as propriedades, pode se fazer a verificação em sua aplicação em determinado domínio. As ontologias podem ser ainda capazes de fornecer suporte de interoperabilidade, pois diferentes usuários/aplicações estão usando o mesmo conjunto de termos. Utilizando uma taxonomia se reconhece quando um aplicativo está usando um termo que é mais geral ou mais específico que outro. Já com ontologias, que são mais expressivas que taxonomias, é possível ter uma definição 59 operacional completa de como um termo refere-se a outros e, assim, usar axiomas de igualdade ou mapeamentos para expressar um termo precisamente igual a outro, possibilitando uma interoperabilidade mais "inteligente". Essa linguagem também pode contribuir para o estabelecimento dos domínios e ranges, conceitos herdados do RDF. Esta representação em RDF “é reconhecida pela linguagem XML, o que possibilita que a ontologia seja implementada em ambiente Web”. (Dziekaniak, 2010, p. 181) Guizzardi (2000, p. 41) divide os benefícios provenientes da utilização da ontologia em três áreas: Comunicação: ontologias são ferramentas úteis para ajudar as pessoas a se comunicarem, sob várias formas, acerca de um determinado conhecimento. Em primeiro lugar, elas podem ajudar as pessoas a raciocinar e a entender o domínio do conhecimento e, portanto, atuam como uma referência para a obtenção do consenso numa comunidade profissional sobre o vocabulário técnico a ser usado nas suas interações. Além disso, ontologias constituem um excelente guia no processo de elicitação de conhecimento das diversas fontes. Formalização: devido à natureza formal da notação usada, a especificação do domínio elimina contradições e inconsistências envolvendo as restrições, resultando, portanto, em uma especificação não ambígua. Um outro ponto a ser destacado é que, já que uma notação formal é usada, a especificação formalizada pode ser automaticamente verificada e validada, se um provador automático de teoremas existe para aquela notação. Com um mecanismo de inferência, é também possível derivar novos conhecimentos de forma automática, a partir da base de conhecimento já presente na ontologia. Por fim, esta característica torna possível a obtenção de um processo de geração de infraestruturas computacionais de maneira sistemática e idealmente automática. Representação do conhecimento e reuso: A ontologia forma um vocabulário de consenso e representa o conhecimento do domínio de forma explícita no seu mais alto nível de abstração, possuindo um potencial enorme de reuso. O conhecimento formalizado na camada de domínio pode ser especializado em diferentes aplicações, servindo diferentes propósitos, por diferentes equipes de desenvolvimento, em diferentes pontos do tempo. As ontologias também apresentam problemas. Guizzardi (2000) se baseou em O’Leary (1997) e Falbo (1998) para mostrar os obstáculos que existem para se aproveitar plenamente das vantagens apresentadas anteriormente. Diante disto, para esses autores: (i) a escolha de uma ontologia é um processo político, já que nenhuma ontologia pode ser totalmente adequada a todos os indivíduos ou grupos. (ii) Ontologias não são necessariamente estacionárias, i.e., necessitam evoluir. Poucos trabalhos têm enfocado a evolução de ontologias. (iii) Estender 60 ontologias não é um processo direto. Ontologias são, geralmente, estruturadas de maneira precisa e, como resultado, são particularmente vulneráveis a questões de extensão, dado o forte relacionamento entre complexidade e precisão das definições. (iv) A noção de bibliotecas de ontologias sugere uma relativa independência entre diferentes ontologias. A interface entre elas constitui, portanto, um impedimento, especialmente porque cada uma delas é desenvolvida no contexto de um processo político. Ontologias desenvolvidas independentemente podem não se integrar efetivamente com outras por vários motivos, desde similaridade de vocabulário até visões conflitantes do mundo. (GUIZZARDI, 2000, p. 4142) Vários estudos têm buscado soluções para esses problemas. Uma dessas abordagens trata sobre a semântica axiomática, que é uma abordagem bastante específica e definida no âmbito das linguagens e padrões da Web Semântica, em particular o RDFS. Segundo Fikes e McGuinness (2001 apud ALMEIDA; SOUZA, 2011, p. 36), o objetivo da semântica axiomática é proporcionar a tradução de descrições RDFS para lógica, ou seja, estabelecer regras para mapear RDFS em Lógica de Primeira Ordem (LPO), com o objetivo de proporcionar capacidade de inferências automáticas à linguagem de representação considerada. Embora alguns autores considerem taxonomias e ontologias nomes novos para antigos sistemas de classificação, elas guardam muitas semelhanças e mantêm na classificação sua base comum, mas talvez não sejam exatamente a mesma coisa. (GOMES, 2009, p. 76). Vickery (1997) também apresenta algumas similaridades entre os tesauros e as taxonomias com as ontologias. Entretanto, no contexto da Web Semântica, os tesauros parecem não ser adequados para representação dos dados devido à ausência de flexibilidade (PICKLER, 2007, p. 77), característica esta presente nas ontologias. A expressividade semântica de instrumentos de representação do conhecimento pode ser observada na figura 9. FIGURA 9 - Expressividade semântica de instrumentos de representação do conhecimento. Fonte: Almeida; Souza, (2011, p. 45) 61 Logo, as similaridades levantadas por Vickery (1997) estão presentes na forma de elaboração da estrutura desses instrumentos, que demanda a organização de conceitos em processos que incluem categorização e classificação de conceitos, definição das relações entre esses conceitos e tratamento da terminologia empregada nos conceitos e relações da estrutura. (SILVA; SOUZA; ALMEIDA, 2008, p. 61). Portanto, como lembra Campos (2006; 2010) não se deve reduzir o conceito de ontologia a somente como um vocabulário controlado. Pois uma ontologia possui afirmação “terminológica, possui um conjunto básico de conceitos e relações, e assertivas aplicadas aos conceitos e relações, que constituem um conjunto de axiomas, diferentemente de instrumentos de controle terminológico como os tesauros”. (CAMPOS, 2006, p. 2). Ontologias de Fundamentação utilizadas na representação de eventos As ontologias de fundamentação são sistemas de categorias filosoficamente bem fundamentadas e independentes de domínio, que têm sido utilizadas com sucesso para melhorar a qualidade de linguagens de modelagem e modelos conceituais (GUIZZARDI et al., 2009). Em outras palavras, são ontologias genéricas que permitem modelar ontologias de domínio, simplificando sua modelagem, aumentando sua elegibilidade e seu reuso. (SILVA, 2011, p. 1) Almeida, Oliverra e Coelho (2010, p. 33) afirmam que “uma alternativa para verificar possíveis deficiências de uma modelagem é comparar a linguagem utilizada na modelagem a um padrão, a uma ontologia bem fundamentada, que são baseadas em ontologias filosóficas e ontologias de alto nível”. Deste modo, as ontologias de fundamentação permitem que a construção de uma teoria sobre o domínio possibilite testar e validar um modelo conceitual. Assim, ao diferenciar os tipos de elementos que compõem um domínio e permitir sua representação, a ontologia de fundamentação explicita conceitos a partir de sua tipologia, estabelecendo sua posição em uma cadeia de elementos. Isto permite, a partir da noção de cada tipo de elemento, que a estruturação do domínio seja construída de forma a evitar proposições errôneas, aferindo qualidade à modelagem conceitual realizada e respectiva a representação do conhecimento em um domínio. (CAMPOS; CAMPOS; MEDEIROS, 2011, p. 142) Para este trabalho, será observado nas ontologias de fundamentação Descriptive Ontology for Linguistic and Cognitive Engineering (DOLCE) e Unified Foundational Ontology (UFO), como a categoria de eventos é representada. A escolha destas ontologias se 62 legitima em função da importância que elas possuem tanto no uso de modelagens de ontologias de domínio, quanto pelo interesse de estudiosos sobre elas. A DOLCE é uma ontologia de fundamentação desenvolvida por um grupo de pesquisa liderado por Nicola Guarino. A pesquisa que deu origem a DOLCE fez parte do projeto WonderWeb, no qual o primeiro módulo criado foi o da Foundational Ontologies Libary. (GUIZZARDI et al., 2009). Esta ontologia é classificada por pesquisadores em ontologia de particulares. A distinção fundamental entre universais e particulares se faz em relação de instanciação, na qual particulares são entidades que não possuem instâncias e universais são entidades que as possuem. (GANGEMI et al., 2002; MASOLO et al., 2003). Em outras palavras, particulares são indivíduos que existem no tempo e no espaço. Baseada no comportamento do objeto ao longo do tempo, a DOLCE trabalha as categorias de endurantes (endurant) e perdurantes (perdurant). No primeiro, o objeto e suas partes estão presentes em todo o tempo, já no segundo acumulam partes temporais, ou seja, estão parcialmente presentes (GANGEMI et al., 2002, p. 225). Logo, os eventos seriam os perdurantes. Na figura 10, pode ser observada a estrutura da DOLCE, na qual a divisão entre endurantes e perdurantes se mostra bem clara. FIGURA 10 - Taxonomia das categorias básicas da DOLCE. Fonte: Gangemi et al. (2002, p. 226) 63 A DOLCE foi utilizada como uma espécie de matriz para a elaboração da Ontologia DUL Ontology, que é uma combinação da DOLCE e DOLCE DnS (Descriptions and Situations), apresentada de forma mais intuitiva e simples. Para fins desta pesquisa, buscou-se compreender a ontologia DUL, pois ela trata de questões intrínsecas aos eventos, como: identificação dos participantes do evento, levantamento das entidades e das situações envolvidas. Percebe-se a seguir, na figura 11, a presença de seis classes principais, subordinadas a Entity, são elas: Agent, Object, Event, informatioEntity, Abstract e Quality. FIGURA 11 - Visão parcial da Ontologia DUL. Fonte: Higuchi (2012, p. 102) Event é definido na ontologia DUL como qualquer processo físico, social ou mental, evento ou estado. Na visão dos desenvolvedores da DUL os eventos estão relacionados a situações observáveis, podendo ter diferentes pontos de vista em um mesmo período de tempo. Isto acarreta a classificação de entidades de um mesmo evento de formas diferentes, pois será baseada nos critérios do modelador. Para a W3C (2005) isto gera uma discussão, porque os realistas irão continuar defendendo a ideia de que os acontecimentos na realidade não são alterados pela forma como são representados, enquanto os construtivistas irão defender a ideia de que, qualquer que seja "verdadeira realidade", não pode ser modelado sem a carga teórica de como observar e descrever. Por esta razão, na ontologia DUL são permitidos os dois eventos, em conjunto com a descrição, de modo a codificar a modelagem precisa, independentemente da posição (se houver) escolhido pelo modelador. Outra ontologia de fundamentação aqui observada é a UFO, que “tem sido aplicada com sucesso para avaliar, (re)projetar e integrar os modelos de linguagens de modelagem conceitual, bem como para prover semântica de mundo real (real-world semantics) para seus elementos de modelagem”. (GUIZZARDI; FALBO; GUIZZARDI, 2008, p. 244). A UFO é desenvolvida na tese de doutorado de Guizzardi (2005) utilizando teorias provenientes de ontologias formais, lógica filosófica, filosofia da linguagem, linguística e 64 psicologia cognitiva. (GUIZZARDI; FALBO; GUIZZARDI, 2008, p. 244). Ela busca diminuir algumas limitações encontradas em outras ontologias de fundamentação, como a própria DOLCE, vista anteriormente. A UFO é dividida em: UFO-A (Ontology of Endurants), destinada a modelização de objetos (endurantes); UFO-B (Ontology of Perdurants), que busca sistematizar conceitos como estados, processos, eventos, relações temporais; e UFO-C (Ontology of Social and Intentional Entities), fundamentada na UFO-A e UFO-B para sistematizar conceitos sociais, como plano, ação, objetivo, agente, intencionalidade, comprometimento e compromisso. Para fins de estudo desta pesquisa, será dada ênfase a UFO-B que trata especificamente de eventos. A UFO-B define eventos como “indivíduos compostos de partes temporais. Eles acontecem no tempo no sentido de se estenderem no tempo acumulando partes temporais”. (GUIZZARDI; FALBO; GUIZZARDI, 2008, p. 246). Cada participação de um evento é um evento que pode ser atômico (sem sub-partes) ou complexos (composto de outros eventos), mas que existe em função de outro evento. Isto pode ser observado na figura 12, a seguir. FIGURA 12 - Fragmento da UFO-B: Objetos e Eventos. Fonte: Guizzardi; Falbo; Guizzardi (2008, p. 246). Conforme mostrado também na figura 12, a UFO-B ainda diferencia “Eventos” de “Objetos” considerando suas relações com o tempo. Objetos estão presentes em qualquer instante do tempo que estiverem presentes. Já os Eventos (ou ocorrências) são indivíduos compostos de partes temporais, ou seja, estendem-se no tempo acumulando partes temporais. (GUIZZARDI; FALBO; GUIZZARDI, 2008, p. 246). Percebe-se que a modelagem de eventos é uma tarefa difícil e desafiadora, uma vez que envolve relações entre outros eventos e interpretações do mesmo evento por diferentes seres humanos (profissionais preocupados com a representação e organização do conhecimento). 65 Tanto a DOLCE, com a DUL, quanto a UFO, com a UFO-B, dedicam-se ao desenvolvimento de partes da ontologia exclusivas a eventos. Tanto na UFO-B, quanto na DUL, o agente ou participante parecem relacionados ao objeto. No entanto, na UFO-B, o “Participante concreto” (termo utilizado por Guizzardi) também se relaciona direto com o evento. Já na Dul, o “Agent” é uma subclasse de “Object” e não se relaciona diretamente com o evento. No caso do acidente do trabalho, o “participante concreto” ou “agent”, que, especificamente neste trabalho é “paciente”, pois é ele quem sofre o acidente, sendo parte fundamental do evento. De forma análoga, pode se afirmar que muitas semelhanças existem nessas representações acerca de eventos. Categorias como agentes, local e tempo são exemplos de similaridades. Scherp et al. (2009, p. 3-4) utilizam como base a ontologia DUL, para elaborarem uma ontologia chamada Event-Model-F, que visa apresentar um modelo formal de eventos. Para a elaboração da Event-Model-F, esses autores identificaram, previamente, requisitos funcionais presentes em qualquer evento independente do domínio. Desta forma, eles sintetizaram estes requisitos funcionais em seis aspectos: Participação em eventos de objetos: representa participação de agentes, ou seja, objetos vivos e não-vivos, como pessoas, animais e outros objetos materiais em eventos e os papéis que desempenham em eventos. Duração temporal de eventos: Como os eventos se desenrolam ao longo do tempo, a sua duração temporal precisa de ser modelada. Isto pode ser realizado usando representações absolutas ou relativas dos pontos em determinado tempo. Extensão espacial dos objetos: Objetos se desenrolam ao longo do espaço. Assim, sua extensão espacial precisa ser também modelada usando posicionamento absoluto ou relativo. Relações estruturais entre eventos: são considerados três tipos, a saber: o Relação mereológica deve ser apoiada em como os eventos são constituídos (eventos simples ou compostos). o Relação causal requer a modelagem de causas e efeitos e deve apoiar a integração e uso de diferentes teorias causais. o Relação de correlação refere-se a dois eventos que têm uma causa comum. 66 Documentos de apoio para o evento e objetos: esta exigência compreende a anotação de eventos e seus objetos participantes com informações arbitrárias, tais como dados de sensores e dados de mídia. Ele fornece suporte documental que um determinado evento aconteceu ou objeto existe. Interpretações de eventos: relações entre eventos, tais como causalidade e correlação pode ser questão de subjetividade e interpretação. O modelo de evento deve apoiar tais interpretações diferentes do evento, isto é, oferecer diferentes pontos de vista contextuais para as mesmas ocorrências no mundo real. Assim como Scherp et al (2009), após analisar diversas ontologias que envolviam a representação de eventos, Higuchi (2012, p. 108) notou que aspectos pareciam ser inerentes a todo evento. A saber: Aspecto constitutivo – o quê ou quem participa; Aspecto temporal – data, período, duração; Aspecto espacial – área geográfica, região, lugar relativo, localização; Aspecto estrutural – mereologia, causalidade, correlação; e Aspecto evidencial – documentação produzida. Apesar das semelhanças estruturais entre as ontologias, “não existe uma ontologia genericamente aceita para modelagem. Conceitos e relações em ontologias distintas podem levar a resultados diferentes na avaliação de um mesmo modelo conceitual.” (ALMEIDA; OLIVERRA; COELHO, 2010, p. 44). A UFO-B e DUL usam modelos de classes, que é um dos diagramas que constam da metodologia Unified Modeling Language (UML), para elaboração de sua representação. Na modelagem conceitual aqui proposta, será utilizado o Modelo Entidade-Relacionamento convencional, que é um modelo de diagrama de classes tradicional no campo da Ciência da Computação. Espera-se, a partir dele, chegar à elaboração de um RDF capaz de descrever os dados sobre acidente do trabalho. Acidente do trabalho como evento De acordo com o dicionário elaborado pelo Instituto Antônio Houaiss (2009), acidente é “(1) acontecimento casual, fortuito, inesperado; ocorrência; (2) qualquer acontecimento, 67 desagradável ou infeliz, que envolva dano, perda, sofrimento ou morte”. Com base nestas definições, pode-se afirmar que qualquer acidente é um evento, ou seja, fato, ação, processo, que em geral, acomete algum agente e/ou paciente, em determinado espaço e tempo. Todos os acidentes do trabalho acontecem em datas e espaços delimitados, mas sua principal característica é a participação do trabalhador como personagem/ator/indivíduo que sofre determinado mal. Logo, partindo-se do pensamento que “eventos são entidades ontologicamente dependentes no sentido de, para existirem, dependem existencialmente de seus participantes” (GUIZZARDI; FALBO; GUIZZARDI, 2008, p. 246), pode-se afirmar que acidente do trabalho é um evento. No âmbito das ontologias, muitos estudiosos preferem organizar, separando os objetos estáticos dos eventos. Isto ocorre muito em função das características peculiares existentes tanto nos objetos estáticos, quanto nos eventos. Eventos são entidades classificadas em uma ontologia formal, que são difíceis de tratar em sistemas de base de dados. Para descrever as ocorrências de ações e mudanças no mundo real, modeladores de representação de conhecimento têm que considerar que os objetos e as propriedades são estáticos, mas os eventos são dinâmicos (KANEIWA; IWAZUME; FUKUDA, 20, p. 1). Assim sendo, estudar acidente do trabalho a partir de ontologias de fundamentação, que buscam representar eventos, pode ser a chave para se conseguir identificar características comuns a qualquer evento, que contribuiriam para a elaboração de um modelo acerca do acidente do trabalho. 4.2.5 OWL como linguagem para representar ontologias para Web Semântica De forma resumida, a Web Ontology Language (OWL) é uma ontologia recomendada pela W3C para representar explicitamente o significado dos termos e seus relacionamentos em vocabulários a serem utilizados na Web. A OWL destina-se a ser usada quando a informação contida nos documentos necessita de ser processada por aplicações de máquinas e não somente compreensíveis por seres humanos. No guia sobre OWL escrito por Smith, Welty, e McGuinness (2004), a OWL é definida como uma linguagem para definir e instanciar ontologias da Web. Uma ontologia OWL pode incluir descrições de classes, propriedades e suas instâncias. Dada tal ontologia, a semântica formal OWL especifica como derivar suas consequências lógicas, ou seja, fatos que não estão presentes na ontologia, mas que são vinculados pela semântica. Esses vínculos 68 podem ser baseados em um único documento ou vários documentos distribuídos que foram combinados usando os mecanismos definidos pela OWL. A OWL é uma revisão da DAML+OIL Web Ontology Language incorporando lições aprendidas de design e aplicação da DAML + OIL. (MCGUINNESS; HARMELEN, 2004). A OWL tem mais facilidades para expressar significado, pois tem mais construções que incorporam pressupostos semântico-ontológicos que RDF e RDFS. Ou seja, consegue especificar com mais precisão o significado pretendido. Apesar do RDF Schema também ser considerado um vocabulário capaz de fornecer semântica aos dados, ele apresenta algumas diferenças da linguagem OWL. De acordo com McGuinness e Harmelen (2004) o RDF Schema é um vocabulário para descrever propriedades e classes de recursos RDF, com uma semântica de generalização, ou seja, hierarquias de tais propriedades e classes. Enquanto que, a OWL adiciona mais vocabulário para descrever propriedades e classes. Dentre algumas diferenças, podem ser citadas: relações entre classes, cardinalidade, descrição mais rica de propriedades, características das propriedades e classes enumeradas. Logo, a OWL atende melhor os anseios da Web Semântica, que é aprimorar a Web, de tal forma que seja dado um significado explícito à informação, tornando mais fácil para máquinas processar e integrar, automaticamente, informações disponíveis na Web. (MCGUINNESS; HARMELEN, 2004). Pode-se dizer que a Web Semântica tem a necessidade de um grupo de instrumentos e linguagens de descrição e de organização (estrutural e semântica) dos dados. Ela se apóia na capacidade da XML para definir esquemas de marcação personalizados, na descrição do RDF para representar dados com um primeiro nível de semântica. Entretanto, a Web Semântica necessita de um nível maior de semântica dos dados descritos, por esta razão uma linguagem de ontologia se torna indispensável para descrever formalmente o significado da terminologia utilizada em documentos da Web. Neste argumento que a W3C se sustenta para justificar a utilização da OWL. (MCGUINNESS; HARMELEN, 2004). De acordo com a McGuinness e Harmelen (2004) a OWL fornece três sublinguagens, em escala de expressividade, projetadas para uso por comunidades específicas de implementadores e usuários. OWL Lite auxilia aos usuários que necessitam principalmente de uma hierarquia de classificação e restrições simples. Apresenta valores de cardinalidade de 0 ou 1. Oferece um caminho de migração rápida para tesauros e outras taxonomias. 69 OWL DL ajuda aos usuários que querem a expressividade máxima, mantendo a integralidade (todas as conclusões são garantidas serem computáveis) e decidibilidade (todas as computações terminarão em um tempo finito) computacional. Ela é o somatório de todas as construções da linguagem OWL, mas estas construções somente podem ser sob certas restrições. OWL DL é assim chamado devido à sua correspondência com as lógicas de descrição, um campo de pesquisa que estuda as lógicas que formam a base formal da OWL. OWL Full é destinada a usuários que desejam máxima expressividade e a liberdade sintática do RDF sem garantias computacionais. Permite uma ontologia para aumentar o significado do vocabulário pré-definido (RDF ou OWL). Cabe aos usuários que utilizarão a OWL considerar qual o tipo de sublinguagem da OWL se adapta melhor às suas necessidades em determinado momento. McGuinness e Harmelen (2004) esclarecem, por exemplo, que a escolha entre OWL Lite e OWL DL depende da medida em que os usuários precisam de construções mais expressivas, neste caso fornecidas pela OWL DL. Alguns cuidados devem ser tomados quando um usuário deseja migrar um documento RDF para OWL. Quando a expressividade da OWL DL ou OWL Lite for considerada apropriada, algumas precauções devem ser tomadas para garantir que o documento original RDF está em conformidade com as restrições adicionais impostas por OWL DL e OWL Lite. Entre outros, cada URI que é usado como um nome de classe deve ser explicitamente declarado como sendo do tipo owl: Class (e da mesma forma para as propriedades), cada indivíduo deve ser afirmado pertencer a pelo menos uma classe (mesmo que apenas owl: Thing), o URI é usado para classes, propriedades e indivíduos devem ser separados mutuamente. (MCGUINNESS; HARMELEN, 2004). Por ser capaz de organizar, semanticamente, informações na Web, a linguagem OWL pode ser utilizada por ferramentas automatizadas da Web para aperfeiçoar os serviços de recuperação de informações, além de contribuir para o gerenciamento do conhecimento. Ademais, a OWL reduz esforços na elaboração de novas linguagens, pois permite reuso de outras ontologias já desenvolvidas. Desta forma, a OWL consegue uma unificação do conhecimento e a formação de consensos sobre certos conceitos, que “tem levado à uma integração maior de usuários dentro domínios específicos do conhecimento”. (LIMA; CARVALHO, 2005, p. 21). 70 Diante da recomendação da W3C para seu uso nas tecnologias geradas no contexto da Web Semântica, a OWL tem conseguido um papel de destaque na elaboração de linguagens semânticas para a Web, com vista a otimizar a recuperação das informações. 4.2.6 Dados Abertos Interligados O conceito e a aplicação de Linked Open Data (LOD) ou Dados Abertos Interligados tem despertado interesse em organizações de pesquisa em saúde, governo e educação. (MÉNDEZ, GREENBERG, 2012). No final da década de 80, Berners-Lee (1989) já se preocupava com a interligação dos dados, afirmando que se deveria trabalhar em direção a um sistema universal de informação ligada, no qual generalidade e portabilidade sejam mais importantes que técnicas gráficas extravagantes e instalações super complexas. Entretanto, o termo “Dados Abertos Interligados” só foi cunhado no século XXI, por Berners-Lee (2006) e se refere a um estilo para se publicar e interligar dados estruturados na Web. Ideia essa defendida por Berners-Lee (2006) ao afirmar que com os Dados Abertos Interligados o valor e a utilidade dos dados aumentarão, uma vez que estarão ligados a outros dados provenientes de diferentes fontes. A Web Semântica permite que as máquinas extraiam significados de dados estruturados, que podem ser transformados quando publicados utilizando os Dados Abertos Interligados. Este último é um passo fundamental para a implementação da Web Semântica. (MÉNDEZ; GREENBERG, 2012). Bizer, Cyganiak e Heath (2007) apontam como sendo os princípios básicos dos Dados Abertos Interligados: (1) utilizar o modelo de dados RDF para publicar dados estruturados na Web; (2) utilizar links RDF para interligar dados a partir de fontes de dados diferentes. Aplicando esses princípios é possível se chegar à criação de um espaço comum de dados na Web, um espaço onde as pessoas e as organizações podem publicar e consumir dados de acordo com seus interesses. Se na Web Sintática o que une os documentos são os links de hipertexto entre as páginas HTML, na Web Semântica o que une os dados são as ligações em RDF. Uma ligação utilizando o RDF afirma que uma parte do dado tem algum tipo de relação com uma parte de outro dado. Essas relações podem ser de diferentes tipos. Por exemplo, uma ligação RDF que conecte dados sobre um autor e suas obras que estão dispersas em bibliotecas, arquivos e museus. (SANTOS NETO et al., 2013). 71 A Web Semântica é mais que somente disponibilizar dados na Web, é sobre fazer ligações (links), para que pessoas e máquinas possam explorar esse conjunto de dados. Com os Dados Abertos Interligados, quando se tem essas ligações, pode-se encontrar outros dados relacionados. (Berners-Lee, 2006). Neste contexto, os Dados Abertos Interligados, podem ser utilizados para descreverem um conjunto de práticas para publicar, compartilhar e conectar dados estruturados na Web de forma a aumentar o seu valor e uso. (ARAÚJO, SOUZA, 2011; BIZER; HEATH; BERNERS-LEE, 2009) Nesse processo de se realizar interligações semânticas entre os dados, os vocabulários em suas várias formas (tesauro, taxonomia, ontologia e outros) têm papel de destaque, fornecendo sentido aos dados. Esses vocabulários podem ainda ter seu aproveitamento melhorado e ganhar mais força se aplicados em RDF/SKOS. (MÉNDEZ, GREENBERG, 2012) e o formato básico para Dados Abertos Interligados é RDF/XML (Berners-Lee, 2006). Na figura 13 é mostrada a evolução da Web com a utilização dos Dados Abertos Interligados. FIGURA 13 - Evolução da Web Semântica com os Dados Abertos Interligados. Fonte: MÉNDEZ, GREENBERG, 2012. Quando os dados disponíveis na Web são vinculados é possível, a partir de um determinado dado, encontrar outro. Diferentemente da Web de hipertextos com referências a documentos escritos em HTML tem-se referência a documentos escritos em RDF. Em um artigo sobre Dados Abertos Interligados escrito por Tim Berners-Lee, em 2006, ele propôs um ranking que serve de guia para classificar dados que estão publicados na Web: 72 Figura 14 - Classificação de dados publicados. Dado publicado, em qualquer formato, com licenciamento livre Dado publicado em uma estrutura que permita a leitura por máquinas (por exemplo, uma planilha eletrônica ao invés de uma imagem digitalizada) Igual ao item anterior (duas estrelas) adicionado o formato não proprietário (por exemplo, CSV ao invés de Excel) Todos os acima, porém usando os padrões W3C (RDF e SPARQL) Todos os acima adicionando a vinculação de seus dados aos dados de outras fontes para identificação de contexto (linked data). Fonte: Leocádio (2011, p. 56) Na figura 15, pode se compreender melhor como a classificação em cinco estrelas feita por Berners-Lee é associada às tecnologias. FIGURA 15 - Esquema para classificar bases de dados publicados na WEB. Fonte: 5 Stars Open Data20. Na revisão de seu texto em 2010, Berners-Lee (2006) comenta que foi solicitado a utilizar os Dados Abertos Interligados para dados governamentais, devendo existir metadados sobre os dados publicados pelo Governo e disponibilizados em grandes catálogos. De acordo com Berners-Lee (2006) qualquer conjunto de Dados Abertos (ou mesmo conjunto de dados que não são, mas que deveriam ser abertos) podem ser registrados no ckan.net21. Esse autor afirma que os conjuntos de dados do governo do Reino Unido e dos EUA são registrados, respectivamente, no data.gov.uk e data.gov. E que outros países devem seguir o mesmo caminho. No Brasil, existe uma iniciativa da Secretaria de Logística em tecnologia de Informação (SLTI) do Ministério do Planejamento, que se propõe a integrar, utilizando a 20 Legenda: OL: Open Licence (livre de licenças); RE: machine-REadable (tratável por computador); OF: Open Format (formato não proprietário); URI: identificado por URI; LD: Linked Data (dados interligados). Disponível em: http://5stardata.info/. Acesso em: 4 mar. 2014. 21 CKAN é uma ferramenta (software) para sistema de gerenciamento de conteúdo que torna os dados acessíveis, visando simplificar a publicação, o compartilhamento, a recuperação e o uso de dados. CKAN é destinado a editores de dados (governos, empresas e organizações nacionais e regionais) que querem fazer os seus dados abertos e disponíveis. (CKAN, 2011) 73 infraestrutura dos Dados Abertos Interligados, as bases de dados do Governo Federal. A figura 16 mostra a iniciativa modelada. FIGURA 16 - Estrutura de LOD das bases de dados do Governo Brasileiro. Fonte: Chaves (2011) Conseguindo desenvolver uma estrutura de dados interligados, o Governo brasileiro poderá ampliar sua participação na estrutura de dados mundiais (figura 17). Desta forma, possibilitará conexões entre dados e informações em escala internacional, permitindo reutilizações, correlações e aplicações ainda não vislumbradas pelos gestores dos dados. FIGURA 17 – Diagrama da nuvem de LOD Fonte: Cyganiak; Anja Jentzsch (2011) Apesar do ritmo lento do uso dos Dados Abertos Interligados na publicação de dados governamentais abertos, é possível identificar alguns exemplos de uso. Como, por exemplo, a página “Ligado nos Políticos” (figura 18), que tem como objetivo fornecer dados de políticos brasileiros usando os conceitos de Dados Ligados e Dados Governamentais Abertos. 74 Coletando dados públicos de fontes, como: órgãos públicos (Tribunal Superior Eleitoral (TSE), Câmara dos Deputados e Senado Federal do Brasil) e Organizações Não Governamentais (ONGs) e iniciativas populares (Políticos Brasileiros, Ficha Limpa e Excelências). FIGURA 18 - Página eletrônica do Ligado nos Políticos. Fonte: LIGADO... (2010) 4.3 ASPECTOS LEGAIS SOBRE ACESSO À INFORMAÇÃO PÚBICA Existem Leis brasileiras que garantem o acesso à informação pública. Nesta pesquisa, parte-se do pressuposto que o acesso às informações governamentais é “uma prerrogativa de todo cidadão, e as possibilidades de reutilizá-la, recombiná-la e dar a ela novos significados é uma ampliação necessária deste direito”. (MAZONI, 2011, p. 7) A seguir serão elencados aspectos legais que influenciaram para a abertura dos dados públicos. A carta magna do Brasil, a Constituição da República federativa do Brasil, publicada em 1988, previa o acesso às informações. Segundo o inciso XXXIII do artigo 5 da Constituição Federal do Brasil de 1998: XXXIII - todos têm direito a receber dos órgãos públicos informações de seu interesse particular, ou de interesse coletivo ou geral, que serão prestados no prazo da lei, sob pena de responsabilidade, ressalvas aquelas cujo sigilo seja imprescindível à segurança da sociedade e do Estado. (BRASIL, 1988) 75 A Lei Complementar n. 101, conhecida como Lei de responsabilidade Fiscal, sancionada em 4 de maio de 2000, estabelece normas de finanças públicas voltadas para a responsabilidade na gestão fiscal e dá outras providências que envolvem a accountability e a transparência de informações fiscal públicas. Foi acrescentada pela Lei Complementar n. 131, de 27 de maio de 2009, E no capítulo IX, intitulado como “Da Transparência, Controle e Fiscalização”, são apresentadas obrigações que possibilitam à sociedade controlar as ações do Governo. Art. 48. São instrumentos de transparência da gestão fiscal, aos quais será dada ampla divulgação, inclusive em meios eletrônicos de acesso público: os planos, orçamentos e leis de diretrizes orçamentárias; as prestações de contas e o respectivo parecer prévio; o Relatório Resumido da Execução Orçamentária e o Relatório de Gestão Fiscal; e as versões simplificadas desses documentos. [...] Parágrafo único. A transparência será assegurada também mediante: [...] II – liberação ao pleno conhecimento e acompanhamento da sociedade, em tempo real, de informações pormenorizadas sobre a execução orçamentária e financeira, em meios eletrônicos de acesso público; [...] (BRASIL, 2009a) Considerado por Batista et al. (2011, p. 1) e Ribeiro e Almeida (2011, p. 2568) o marco brasileiro para o início da iniciativa de dados governamentais abertos foi a publicação do Decreto n. 6.932, de 11 de agosto de 2009, que “dispõe sobre a simplificação do atendimento público prestado ao cidadão, ratifica a dispensa do reconhecimento de firma em documentos produzidos no Brasil, institui a “Carta de Serviços ao Cidadão” e dá outras providências”. Menciona também a questão do uso de tecnologias para simplificar o atendimento ao cidadão, além de criar condições propícias ao compartilhamento de informações. Art. 1o Os órgãos e entidades do Poder Executivo Federal observarão as seguintes diretrizes nas relações entre si e com o cidadão: [...] II - compartilhamento de informações, nos termos da lei; [...] VI - aplicação de soluções tecnológicas que visem a simplificar processos e procedimentos de atendimento ao cidadão e a propiciar melhores condições para o compartilhamento das informações; [...] Art. 4o No âmbito da administração pública federal, os órgãos e entidades gestores de base de dados oficial colocarão à disposição dos órgãos e entidades públicos interessados as orientações para acesso às 76 informações constantes dessas bases de dados, observadas as disposições legais aplicáveis e as diretrizes, orientações e procedimentos estabelecidos pelo Comitê Executivo do Governo Eletrônico, criado pelo Decreto de 18 de outubro de 2000. [...] (BRASIL, 2009b) A Lei de n. 12.527, denominada Lei de Acesso a Informação (LAI), sancionada em novembro de 2011. Entretanto, como lembra Jardim (2012), a Lei “entrou em vigor no dia 16 de maio de 2012, quando foi regulamentada pelo Poder Executivo Federal. Desde então tem sido objeto de regulamentação em outros Poderes da União, bem como nos estados e municípios”. Cabe destacar parte do capítulo 8 da Lei de Acesso à Informação, pois trata do dever de promover acesso à informação, inclusive em meio digital e disponibilizando serviços ma Internet: Art. 8o É dever dos órgãos e entidades públicas promover, independentemente de requerimentos, a divulgação em local de fácil acesso, no âmbito de suas competências, de informações de interesse coletivo ou geral por eles produzidas ou custodiadas. [...] § 2o Para cumprimento do disposto no caput, os órgãos e entidades públicas deverão utilizar todos os meios e instrumentos legítimos de que dispuserem, sendo obrigatória a divulgação em sítios oficiais da rede mundial de computadores (internet). § 3o Os sítios de que trata o § 2o deverão, na forma de regulamento, atender, entre outros, aos seguintes requisitos: I - conter ferramenta de pesquisa de conteúdo que permita o acesso à informação de forma objetiva, transparente, clara e em linguagem de fácil compreensão; II - possibilitar a gravação de relatórios em diversos formatos eletrônicos, inclusive abertos e não proprietários, tais como planilhas e texto, de modo a facilitar a análise das informações; III - possibilitar o acesso automatizado por sistemas externos em formatos abertos, estruturados e legíveis por máquina; IV - divulgar em detalhes os formatos utilizados para estruturação da informação; V - garantir a autenticidade e a integridade das informações disponíveis para acesso; VI - manter atualizadas as informações disponíveis para acesso; VII - indicar local e instruções que permitam ao interessado comunicar-se, por via eletrônica ou telefônica, com o órgão ou entidade detentora do sítio; [...] (BRASIL, 2011a) Um ponto importante trazido a tona por essa Lei foi a diferenciação entre Transparência Ativa, referente à “divulgação espontânea, proativa, de informações, pelo Estado, pelos meios disponíveis” (VIEIRA, 2012 apud JARDIM, 2012, p. 19), e 77 Transparência Passiva, que é o “sistema para receber uma informação ou solicitação de informação e providenciar uma resposta” (BATIMARCHI, 2013, p. 3). Entretanto, a aplicação desses conceitos ainda enfrenta desafios para sua consolidação. Jardim (2012) enfatiza que diante da complexidade existente no Brasil é possível estimar os obstáculos à implantação da Lei de Acesso à Informação em todos os Poderes Executivo, Legislativo e Judiciário. Pois para este autor, a questão dessa Lei vai além do âmbito jurídico, tratando-se de um processo associado “a uma cultura política que vem sendo dinamizada, nas últimas décadas, em meio às contradições que envolvem tradições autoritárias e uma agenda democratizante nas relações Estado e Sociedade”. (JARDIM, 2012, p. 19). Angélico (2012, p. 14) ao analisar a Lei de Acesso à Informação aponta outro desafio a ser enfrentado pelo Governo com a liberação de suas informações. Segundo o autor a utilização das informações governamentais pelo setor privado, que buscam nestas informações vantagens competitivas no mercado, sem disponibilizarem seus resultados e conclusões para um grupo mais amplo da sociedade. Isso poderia aumentar ainda mais a desigualdade no acesso e tratamento das informações governamentais. Em 15 de setembro de 2011, foi instituído o Plano de Ação Nacional sobre Governo aberto. O artigo 1 diz que este Plano é destinado a promover ações e medidas que visem ao incremento da transparência e do acesso à informação pública, à melhoria na prestação de serviços públicos e ao fortalecimento da integridade pública. Para que seu objetivo seja alcançado ele estabelece critérios: I - aumento da disponibilidade de informações acerca de atividades governamentais, incluindo dados sobre gastos e desempenho das ações e programas; II - fomento à participação social nos processos decisórios; III - estímulo ao uso de novas tecnologias na gestão e prestação de serviços públicos, que devem fomentar a inovação, fortalecer a governança pública e aumentar a transparência e a participação social; e IV - incremento dos processos de transparência e de acesso a informações públicas, e da utilização de tecnologias que apoiem esses processos. (BRASIL, 2011b) Pode-se concluir que o acesso à informação está presente nas discussões do Estado. Associar a legislação, que oficializa o direito do cidadão de acesso à informação, à publicação de dados governamentais abertos, aplicação de obrigações legislativas, podem contribuir para que no futuro se crie uma democracia participativa, na qual a população se sinta parte da nação, interagindo com o Estado em suas decisões. 78 4.4 UM OLHAR SOBRE O GOVERNO ELETRÔNICO A utilização das tecnologias de informação e comunicação (TIC) pelo Estado no provendo de produtos e serviços aos cidadãos geraram profundas mudanças na relação entre o Estado e a população (FREY, 2007; 2000) e a formação de uma rede composta por atores sociais (CASTELLS, 1999), que “envolvidos na gestão da coisa pública”. (FREY, 2007). Segundo Garcia et al. (2003), “esta nova arquitetura dos espaços governamentais, descentralizada e flexível, possibilita a elaboração de redes horizontais entre os atores, permitindo que o e-gov se contraponha à cultura do governo centralizador e opressor”. Os Estados Unidos é um dos países pioneiros na área de governo eletrônico. De acordo com Matheus (2009, p. 3), em 1993, o presidente Bill Clinton promoveu uma reformada administração pública. Esse programa teve o nome de National Performance Review (NPR) e foi inspirado na obra de Osborne e Gaebler22. Os resultados com esse programa superaram as expectativas do Governo americano, conseguindo alcançar grande parte de seus objetivos. Gontijo (2002, p. 183) e Ribeiro (2011, p. 164) apontam como iniciativas precursoras de implantação do governo eletrônico no Brasil, o Programa Sociedade da Informação, com o objetivo de “viabilizar a nova geração da Internet e suas aplicações em benefício da sociedade brasileira” (BRASIL, 1999), o Programa Brasil Transparente, que visa “a promoção da transparência e do acesso à informação” (CONTROLADORIA-GERAL DA UNIÃO, 2013a) e o projeto do governo [email protected], o qual almejava a universalização do acesso à Internet, dos serviços e das normas e padrões para prestação de serviços. (CHAHIN, 2004, p. 35). Prado et al. (2011) estabelece uma evolução do governo eletrônico no Brasil diferente da apresentada anteriormente. Apoiado em outros estudos, ele traça classificações diferentes: a primeira classificação é dividida em três estágios: o primeiro (1970-1992) focou a gestão interna, o segundo (1993-1998) teve como objetivo a prestação de serviços e informações ao cidadão, e o terceiro (a partir de 1999) focou a prestação de serviços via Internet. (DINIZ, 2005 apud PRADO et al., 2011, p. 8). Já a segunda classificação divide a evolução do governo eletrônico em quatro estágios: início (1950-1960), centralização (1960-1980), terceirização (1980-1990) e governo eletrônico, propriamente dito, a partir de 1990. (REINHARD; DIAS, 2005 apud PRADO et al., 2011, p. 8). 22 Para maiores informações consultar: OSBORNE, D.; GAEBLER, T. Reinventando o governo: como o espírito empreendedor esta transformando o setor público. 7. ed. Brasília, DF: MH Comunicação, 1995. 79 O Observatório do Governo Eletrônico fornece como marco inicial do governo eletrônico no Brasil a instituição do Sistema de Administração dos Recursos de Informação e Informática (SISP) do Governo Federal, em 21 de janeiro de 1994. Com o objetivo de orientar e administrar o processo de planejamento coordenação e normalização relativa aos recursos de informação e informática da Administração Pública Federal. (GOVERNO..., 2007). Logo no ano seguinte, maio de 1999, foi elaborado o projeto do Portal Rede Governo, apesar das agências governamentais já possuírem páginas eletrônicas desde 1993. O Portal só entrou em operação em 2000, sob a responsabilidade da Câmara Técnica da Rede Governo. Com a criação do e-gov em outubro de 2000, a responsabilidade administrativa e operacionais foram transferidas para a secretaria-executiva do Comitê Executivo do Governo Eletrônico (CEGE). (CHAHIN et al., 2004, p. 34; SIMÃO; RODRIGUES, 2005, p. 81). De acordo com Marcondes e Jardim (2003), Pacheco, Kern e Steil (2007) e Santos (2012), e o governo eletrônico representa um construto, cuja definição unívoca não existe. A seguir são apresentadas algumas definições de governo eletrônico: O termo governo eletrônico tem foco no uso das novas tecnologias de informação e comunicação [TIC] aplicadas a um amplo arco das funções de governo e, em especial, deste para com a sociedade. (RUEDIGER, 2002, p. 1, sic.) Podemos chamar de governo eletrônico o conjunto de serviços e acesso a informações que o governo oferece aos diferentes atores da sociedade civil por meios eletrônicos. (FERRER, 2003, p. 1) Governo Eletrônico ou Administração Pública Eletrônica nada mais é do que o uso das Tecnologias da Informação e Comunicações (TIC) por parte da Administração Pública tanto em seu funcionamento externo quanto na troca e prestação de informações e serviços com empresas, outros governos e a população. Trata-se, em suma, de informatizar a Administração Pública” (GOVERNO..., 2007, p. 1). Governo Eletrônico tem como princípio a utilização das modernas tecnologias de informação e comunicação (TICs) para democratizar o acesso à informação, ampliar discussões e dinamizar a prestação de serviços públicos com foco na eficiência e efetividade das funções governamentais. (BRASIL, 2013c, p. 1). Se no passado, o conceito de governo eletrônico era associado à modernização da infraestrutura tecnológica dos órgãos do Estado. Percebe-se que agora os conceitos de cidadania e democratização da informação pública aparecem com recorrência nas definições de governo eletrônico apresentadas anteriormente. 80 Chahin et al. (2004, p. 12) afirma que a implantação do governo eletrônico visa uma reforma administrativa, com o objetivo de contribuir para Melhoria da qualidade e inovação nos serviços prestados ao cidadão; Transparência e acesso à informação pela sociedade; Reestruturação organizacional, com o realinhamento de estruturas e processos; Ampliação da autonomia das instituições e dos gerentes, acompanhada da flexibilidade de procedimentos e de normas, aplicada à gestão; Planejamento, avaliação e controle da ação governamental, com base nos resultados esperados, na elaboração de indicadores de desempenho e na identificação da clientela-alvo; Fortalecimento da capacidade de formulação e controle sobre as políticas públicas; Redução de custos; Qualificação e mudança de perfil do servidor público. Para Jardim (2000, p. 4) o governo eletrônico pode ampliar a efetividade dos governos em quatro aspectos, a saber: Será mais fácil para a sociedade ter suas perspectivas consideradas pelos governos na (re)definição de políticas públicas; A sociedade poderá obter melhores serviços das organizações governamentais, por exemplo, através de atividades desenvolvidas on-line; A sociedade contará com serviços mais integrados porque as diferentes organizações serão capazes de se comunicar mais efetivamente entre si; A sociedade será melhor informada porque poderá obter informação atualizada e compreensível sobre o governo, leis, regulamentos, políticas e serviços. Da implantação até hoje, muitas pesquisas sobre governo eletrônico contribuíram para o desenvolvimento de metodologias, técnicas e equipamentos necessários para a modernização da administração pública e a melhoria da eficiência dos processos operacionais e administrativos, associados a prestação de serviços públicos eletrônicos. O Relatório do Desenvolvimento Humano (2013) com o tema: “A ascensão do Sul: progresso humano num mundo diversificado” debruça-se sobre a evolução da geopolítica dos tempos atuais, analisando as questões e tendências emergentes, bem como os novos atores que moldam o panorama do desenvolvimento. De acordo com esse relatório, o governo eletrônico possui papel fundamental no desenvolvimento das nações, pois “legitimidade da governação internacional, no futuro, dependerá da capacidade das instituições para interagir com as redes e comunidades de cidadãos”. (NAÇÕES UNIDAS, 2013, p. 13, sic) Diante dos resultados observados, pode-se dizer que os recursos do governo eletrônico conseguiram, ao longo dos anos, permitir que cidadãos acessassem informações e serviços oferecidos pelo Governo. Buscando ampliar a abertura de dados e a promoção da 81 transparência aos cidadãos, permitindo ainda melhorar as operações internas e entre governos. (W3C, 2009). O desenvolvimento da tecnologia e, consequentemente, da Web ofereceu ao Governo melhores oportunidades de atingir suas metas no fornecimento de informações e serviços e ao mesmo tempo atender às demandas por cada vez mais contribuições e interações. (W3C, 2009, p. 13). Pacheco (2003 apud PACHECO; KERN, 2003) ao estudar os projetos de Governo Eletrônico como fonte de informações para sistemas de informação governamental, apresentam uma representação piramidal (19) referente à uma plataforma tecnológica para a gestão da informação para Ciência, Tecnologia e Inovação. FIGURA 19 - Arquitetura para plataforma tecnológica de governo eletrônico. Fonte: Pacheco (2003 apud PACHECO, KERN, 2003) Esses autores explicam que: Unidades de informação, base da pirâmide: são as classes, tipos ou sub-domínios fundamentais da informação pertinente ao domínio da plataforma. Fontes e sistemas de informação, segunda camada: inclui os repositórios de cada unidade de informação e os respectivos sistemas de informação para captura, tratamento e armazenagem. Portais e serviços web, terceira camada: constitui-se dos instrumentos de apresentação de informações na web. Assenta-se sobre os sistemas de informações e as unidades de informação definidas nas camadas inferiores. Sistemas de conhecimento, topo da pirâmide: são instrumentos projetados para gerar novos conhecimentos a partir das unidades de informação, sistemas de informação e portais Web. Incluem técnicas de descoberta de conhecimento como mineração de dados, estatística e reconhecimento de padrões. (PACHECO, 2003 apud PACHECO; KERN, 2003, p. 4) 82 Todavia, existem desafios que os Governos, e especificamente o Brasil, precisam superar para que todas as potencialidades do governo eletrônico sejam alcançadas. De acordo com o relatório United Nations E-Government Survey 2012 (UNITED NATIONS, 2012), que apresenta uma avaliação da situação mundial do setor de governo eletrônico, o Brasil ocupa a posição de número 59, melhorando sua colocação em relação a 2010, no qual ocupava a colocação de número 61. Sua melhora se deve, dentre outros fatores, a maior participação dos cidadãos em discussões políticas, como na época do Rio + 20, em que foram disponibilizados questionários eletrônicos para a interação da população. Porém, a falta de ampliação de serviços eletrônicos e a deficiência de infraestrutura de telecomunicações, que compromete o atendimento a parte da população, contribuiu para que o Brasil não tivesse um resultado melhor na avaliação das Nações Unidas. O relatório (UNITED NATIONS, 2012) destaca também a iniciativas de dados abertos que contribuem para a cooperação entre Estado e sociedade civil na elaboração de novos produtos e serviços. Assim, ele faz algumas recomendações para o governo eletrônico envolvendo a iniciativa dos dados governamentais abertos: 1. Certificar que as estratégias para a publicação de dados governamentais abertos estão alinhadas com outras políticas relevantes, especialmente, com a atual estratégia de governo eletrônico e estratégias para o desenvolvimento nacional; 2. Reconhecer que as iniciativas de dados governamentais abertos são processos que requerem compromisso contínuo e participação de diversos colaboradores; 3. Considerar uma abordagem de parceria entre o Governo às iniciativas de dados governamentais abertos, ou seja: a) fortalecimento da comunicação, coordenação e cooperação dentro de diferentes setores e níveis de governo e, b) a centralização do ponto de prestação de serviços de entrada para um único portal onde os cidadãos e outros atores sociais possam acessar todas as informações e serviços oferecidos pelo Governo, independentemente, de qual autoridade do Governo lhes fornece. (UNITED NATIONS, 2012). Divulgado em 2012, a Pesquisa Nacional por Amostra de Domicílios (PNAD) (IBGE, 2012), investiga dados sobre a população, migração, educação, emprego, família, domicílios e rendimento. Segundo essa pesquisa, em 2011, 46,5% da população de 10 anos ou mais de idade declararam ter usado a Internet nos últimos três meses da época da pesquisa. Houve um aumento de 14,7% em relação a 2009. Porém, o Brasil não conseguiu disponibilizar o serviço de Internet a maioria da população. Esse fator compromete a efetividade do governo eletrônico e seu desenvolvimento. 83 Mesmo com avanços, o Brasil ainda tem o desafio no que tange a democratização do acesso a informação. Para isso, o Estado tem desenvolvido ações para o avanço no acesso a informação. São exemplos a Lei de Acesso a Informação (BRASIL, 2011) e o Plano Nacional de Banda Larga, que visa reduzir o preço para utilização dos serviços e aumento da cobertura e da velocidade (BRASIL, 2010). Entretanto, existem outras barreiras relacionadas ao governo eletrônico que o Estado precisa enfrentar. Habermas (2002, p. 144) chama atenção para outro obstáculo relacionado com a participação cidadã na relação do Estado com a sociedade civil. Para esse autor, “os grupos de opinião pública criados na Internet continuam segmentados, separados uns dos outros como comunidade aldeãs globais”. Outro desafio vem do governo e seu papel e contribuição para a sociedade. De modo geral, os governos têm procurado, usado e aplicado tecnologias bem depois dessas tecnologias e os processos correspondentes terem sido testados e provados no setor privado. Os governos, que são os grandes inovadores e às vezes são a fonte financeira para o setor privado, “não conseguem se adaptar rapidamente ao papel de inovador, o que os coloca muito atrás do que é considerado como norma e ambiente tecnológico corrente.” (W3C, 2009, p. 14). Um último entrave é a necessidade de se quebrar os “silos” corporativos dos vários órgãos e agências dos governos para melhorar atender às necessidades dos cidadãos. (CHAHIN et al., 2004, p. xvi). Nesse caso, os dados governamentais abertos podem contribuir para a abertura desses “silos” e a interligação entre eles. Chahin et al. (2004) antevê a questão dos dados governamentais abertos ao associar os benefícios do governo eletrônico à transparência pública. Desta forma, coloca-se a perspectiva de generalização da diretriz de transparência por meio da criação de canais integrados de acesso do cidadão e de entidades da sociedade civil a informações, a procedimentos administrativos, ao processo decisório e aos bancos de dados governamentais. Por outro lado, a oferta de informações ao cidadão com a qualidade, atualização e abrangência pressupõe a produção contínua de conteúdo e sua formatação e modulação para público amplo e diversificado, o que requer a revisão dos mecanismos convencionais de comunicação da administração pública. (CHAHIN et al., 2004, p. 104, grifo nosso). Os dados governamentais abertos podem contribuir para facilitar o desenvolvimento de produtos e serviços que colaboram para integração entre os cidadãos e os dados salvaguardados nos bancos de dados governamentais. 84 4.4.1 Accountability Ao longo de 2010, foram publicados pela WikiLeaks23 diversos documentos do governo dos Estados Unidos, ditos confidenciais, com forte repercussão mundial. O impacto da liberação desses documentos foi tão grande que um dos membros do parlamento norueguês indicou o WikiLeaks para o Nobel da Paz, porque a organização teria ajudado a ‘redesenhar o mapa da liberdade de informação’. (ROBERTS, 2011 apud ANGÉLICO, 2012, p. 45). A democratização do Estado tem sido amplamente discutida (GONZÁLEZ DE GÓMEZ; LIMA, 2010). Isso se deve a necessidade de se “enfrentar as contradições estruturais que se expressam pela corrupção, pela baixa densidade dos processos eleitorais na vida cotidiana, pela escalada da violência e pela extensão da pobreza, mesmo em países do centro capitalismo”. (FILGUEIRAS, 2011a, p. 87) Como declara Sant’ana (2009, p. 38) exercer plenamente a cidadania requer comprometimento do cidadão no acompanhamento crítico dos rumos definidos pelo poder público e com a forma com que os recursos públicos são utilizados. Neste contexto, surge a noção de accountability como forma de controle dos cidadãos sobre as ações governamentais. O conceito de accountability, enquanto ideia normativa informada, surgiu em meio às propostas de reformas liberais das décadas de 1980 e 1990. (FOWDLE, 2006 apud FILGUEIRAS, 2011b, p. 6). Filgueiras (2011a; 2011b) analisa accountability sobre duas vertentes, uma voltada para prestação de contas; e a outra direcionada ao caráter normativo, que é o Estado fazer o que deve ser feito. Accountability é um conceito fortemente relacionado ao universo político administrativo anglo-saxão. (JARDIM, 2000). Campos (1990) tentou buscar uma tradução ou versão desse termo para o português, porém ela chegou a conclusão que isso não seria possível. “Ao longo dos anos fui entendendo que faltava aos brasileiros não precisamente a palavra, ausente tanto na linguagem comum como nos dicionários. Na verdade, o que nos falta é o próprio conceito, razão pela qual não dispomos da palavra em nosso vocabulário”. (CAMPOS, 1990, p. 34). Pinho e Sacramento (2009) escrevem um texto retomando a busca pela tradução do termo descrito no texto clássico de Campos (1990). Eles concluíram que se 23 WikiLeaks é uma organização de mídia sem fins lucrativos, criada em 2007. O objetivo é relatar e publicar informações importantes, além de também desenvolver e adaptar tecnologias para apoiar essas atividades. Fornecem formas seguras, garantindo o anonimato das fontes que fornecem o vazamento de informações para jornalistas e demais interessados. (WIKILEAKS, 2013, tradução nossa). 85 esta mais perto da resposta do que quando Campos se defrontou com o problema, mas ainda muito longe de construir uma verdadeira cultura de accountability. (PINHO; SACRAMENTO, 2009, p. 1344). A accountability é um modo de disponibilização de informações das contas públicas para o cidadão, que pode analisar e criticar o andamento das políticas públicas e o emprego do erário. A accountability remete à obrigação do Estado de veicular links sobre as contas públicas nos sites. (BANDEIRA, 2005, p. 12) Já para Matheus (2009, p. 6), accountability é um meio de promoção para que o Brasil tenha a participação cidadã necessária para o controle social. Passando a questionar os gestores públicos sobre seus atos, por meio da prestação de contas e definições dos objetos de ações. O conceito de accountability envolve duas partes: a primeira delega responsabilidade para que a segunda proceda à gestão dos recursos; ao mesmo tempo, gera a obrigação daquele que administra os recursos de prestar contas de sua gestão, demonstrando o bom uso desses recursos. (AKUTSU, PINHO, 2002, p. 371). Tradicionalmente, existe uma “ausência de accountability na relação entre os governantes e a sociedade”. (AKUTSU, PINHO, 2002, p. 371). Percebe-se que, em muitos casos, há um distanciamento entre os atores envolvidos no processo de accountability, faltam informações divulgadas e faltam também cobranças para a divulgação dessas informações. A efetividade dos mecanismos de accountability dependeria do grau de acesso do cidadão à informação governamental. [...] Cabe, portanto, ao Estado, produzir meios que estimulem os governantes a, publicarem, justificarem o curso de suas ações, relacionando as políticas adotadas com os efeitos que produzem ou esperam produzir. (JARDIM, 1999, p. 57). Pois, quando maior a possibilidade dos cidadãos poderem discernir se os governantes estão agindo em função do interesse da coletividade e sancioná-los apropriadamente, mais accountable é o governo. (JARDIM, 2000, p. 5). As demandas por accountability reforçaram a criação de outro princípio para a democratização do Estado: o princípio da transparência. (FILGUEIRAS, 2011a; 2011b). Alguns autores trabalham com transparência e accountability como sinônimos, porém Vaz, Ribeiro e Matheus (2010) esclarecem que o conceito de accountability vai além da prestação de contas e da publicidade das ações governamentais, referindo-se também a uma atuação de controle sobre a Administração Pública que possa gerar incentivos ou sanções que ocorram caso o agente público cumpra ou descumpra determinada obrigação. 86 Ou seja, a accountability, em uma concepção normativamente informada pelas reformas liberais, é aprimorada com a ampliação da transparência, tendo em vista uma questão de retorno do investimento realizado pelos cidadãos na ação pública dos agentes. A transparência maximiza a accountability por permitir a redução da assimetria de informação entre principal e agent, garantindo um sistema de responsabilização derivado da abertura dos segredos de Estado. A transparência, para a teoria da agência, reforça a accountability nos contornos da economia da informação, sendo o cidadão visto como um consumidor de bens públicos, no mesmo patamar das relações de mercado. (FILGUEIRAS, 2011b, p. 8). 4.4.2 Transparência em ações pública Um dos grandes resultados alcançados com o governo eletrônico foi sua contribuição para a transparência pública. O governo eletrônico é uma poderosa ferramenta de reforma administrativa do Estado, uma vez que facilita a transparência, a eficiência na entrega de serviços públicos, a luta contra a corrupção e a individualização do atendimento aos cidadãos. (CHAHIN et al., 2004, p. xvi). Todavia, os dados publicados são publicados “de forma parcial e por caminhos extremamente burocratizados e pouco transparentes”. (AGUNE; GREGORIO FILHO; BOLLIGER; 2010, p. 3). González de Gómez (2002, p. 36) afirma que a “transparência”, no domínio das relações Estado-sociedade, dependerá de outras condições, tais como a convergência dos sistemas e serviços de comunicação e informação pública. Essa convergência dos sistemas e serviços governamentais poderia ser otimizada se os dados estivem sido publicados em formato bruto e aberto. No âmbito dos governos democráticos, a transparência pode ser útil para muitos fins. Transparência é central para a boa governança e pré-requisito essencial para a accountability entre os estados e cidadão. Basicamente, governança transparente significa uma abertura do sistema de governança através e processos e procedimentos claros e fácil acesso á informação pública por parte dos cidadãos, estimulando a consciência ética, no serviço público através do compartilhamento de informações, o que em última instância assegura accountability para o desempenho dos indivíduos e organizações que são responsáveis por recursos públicos ou ocupam cargos públicos. (SUK KIM et al., 2005 apud ANGÉLICO, 2012, p. 25). O conceito de transparência pública pode ser entendido como meio de fornecer informações à sociedade, que de acordo com sua capacidade crítica, pode inferir e participar mais efetivamente do campo político. (GONZÁLEZ DE GOMEZ, 2002). 87 No Brasil, o principal resultado referente à transparência pública foi o desenvolvimento do Portal da Transparência do Governo Federal. Essa iniciativa da Controladoria-Geral da União (CGU) foi lançada em novembro de 2004, para assegurar a boa e correta aplicação dos recursos públicos. O objetivo é aumentar a transparência da gestão pública, permitindo que o cidadão acompanhe como o dinheiro público está sendo utilizado e ajude a fiscalizar. (CONTROLADORIA-GERAL DA UNIÃO, 2013b). FIGURA 20 - Portal da Transparência do Governo Federal do Brasil. Fonte: Portal da Transparência do Governo Federal (2013) Busca-se a transparência não como um atributo dos conteúdos de valor informacional oferecidos pelo Estado. Todavia, como resultante das condições de geração, tratamento e uso das informações adequadas para permitir a passagem do nível caótico, para o nível de informação organizada, que produza sentido para um cidadão ou grupo social. (GONZÁLEZ DE GOMEZ, 2002, p. 36). Entretanto, concorda-se com Jardim (1999) que, no decorrer do texto, afirma que sempre teremos a relação transparência/opacidade, pois a ação de tornar pública determinadas informações é um processo repleto de valores, no qual julgamos o que deve ser público ou não (seleção). Também é esclarecido por Jardim (1999, p. 72-73) que a opacidade informacional do Estado pode ser entendida como a ausência (total ou quase total) de interação informacional entre o Estado e a sociedade, na qual a massa de excluídos supera em muito a de cidadãosincluídos. Constitui um território estratégico na produção de hegemonia e de exclusão de classes sociais não dominantes. Logo, constituindo-se em uma estratégia de poder. Já Zugman (2006, p. 10) comenta que essa “opacidade leva a uma relação entre os cidadãos e seu governo marcada pela enorme assimetria de informações e poderes”. 88 Quer isto dizer que o campo político exerce de facto um efeito de censura ao limitar o universo daquilo que é pensável politicamente, ao espaço finito dos discursos suceptíveis de serem produzidos ou reproduzidos nos limites da problemática política como espaço das tomadas de posição efectivamente realizadas no campo, quer dizer, sociologicamente possíveis dadas as leis que regem a entrada no campo. (BOURDIEU, 1989, p. 165, sic) Assim a transparência pode, por um lado, ser uma alternativa para que os cidadãos tenham um conhecimento sobre assuntos e ações políticas do Estado, promovendo uma maior participação social. Já por outro lado, a transparência, em virtude de sua publicidade, pode ser utilizada para legitimar, oficializar algo como verdade. “A passagem do implícito ao explícito, da impressão subjetiva à expressão objectiva, à manifestação pública num discurso ou num acto público constitui por si um acto de instituição e representa por isso uma forma de oficialização, de legitimação”. (BOURDIEU, 1989, p. 165). Silva (2001) ao discutir a ideia de esfera pública proposta por Habermas, afirma que este autor também associa o conceito de transparência ao de publicidade. Silva (2001) defende ainda, que na visão de Habermas, o Estado é influenciado pela esfera pública, deixando de ser um produtor de opacidade e passando a ser um potencial produtor de transparência. Como conseqüência da definição constitucional da esfera pública e das suas funções, a publicidade tornou-se o princípio organizacional dos procedimentos dos próprios órgãos do Estado; neste sentido, fala-se na sua “publicidade” [por outro lado, a relação entre esta noção de publicidade (transparência) e a prática parlamentar e judicial é enfatizada.] O carácter público das deliberações parlamentares garantia à opinião pública a sua influência; assegurava a relação entre representantes e eleitores como partes do mesmo público. E, por volta da mesma altura, também os procedimentos legais nos tribunais começam a ser tornados públicos (HABERMAS, 1962 apud SILVA, 2001, p. 127) Ribeiro, M. (2008) e Matheus (2009) apresentam o conceito de transparência sob dois aspectos. O primeiro associa o conceito de transparência como sinônimo de publicidade, já o segundo, a transparência vai além dos dados disponibilizados, pensando na transparência relacionada com o acesso aos dados, inclusão digital e disponibilidade dos dados, especialmente em relação à freqüência e atualização das informações contidas em portais e sites governamentais. O segundo aspecto vai ao encontro dos objetivos dos dados governamentais abertos. Apesar de ainda não se falar na publicação de dados governamentais abertos, Matheus (2009, p. 16) afirma que o verdadeiro significado de transparência é a 89 abertura do fornecimento de informações, de acesso livre e universal, de constante atualização, postadas em um único canal de comunicação e interação com o cidadão e com ferramenta de busca para ajudar a encontrar a temática que queira rapidamente. Cabe lembrar, que dados governamentais abertos não devem ser postos como sinônimo de transparência, porém pode contribuir para a ampliação da transparência governamental, em outras palavras, “uma política de dados abertos teria o poder de potencializar as possibilidades de transparência através da Internet”. (DINIZ, 2010 apud VAZ, RIBEIRO, MATHEUS, 2010, p. 53). Assim, os dados governamentais abertos podem ser considerados como recurso de transparência, promovendo o acesso à dados públicos sem restrições tecnológicas, podendo ser reutilizados e tendo uma estrutura que facilite sua recuperação e utilização. 4.5 DADOS GOVERNAMENTAIS ABERTOS Percebe-se que a Web é, muitas vezes, o primeiro local de busca por informações, que vão desde notícias, até pesquisas sobre doenças. Além disso, muitos relacionamentos humanos – amorosos, amizades, profissionais – são criados e mantidos na Web, via redes sociais. Essas são tendências importantes que estão abrindo novas oportunidades para que governos e cidadãos interajam. Cada vez mais, o meio-padrão usado pelo governo para transmitir sua mensagem e oferecer serviços públicos é a Web. (W3C, 2009, p. 25). Talvez um dos grandes motivos para o sucesso da Web seja o caráter participativo dos usuários em inovar, que proporciona a possibilidade de criar e disseminar informação de maneira ágil. A Web é transformadora porque permite que qualquer pessoa seja um editor. Isso muda profundamente as relações de poder na esfera pública. (W3C, 2009, p. 26). Habermas (1992, p. 435-436 apud LUBENOW, 2010, p. 236) afirma que a esfera pública “constitui uma estrutura normativa capaz de diferenciar entre competências e papéis. [...] pode ser descrita como uma rede adequada para a comunicação de conteúdos tomadas de posição e opiniões”. Complementando essa conceituação Lima e Gonçalves (2011) afirmam que A esfera pública é o termo utilizado para designar espaços de cooperação entre agentes e atores que, a partir de canais específicos de comunicação, integram habilidades, conhecimentos e técnicas, resultando no fortalecimento de competências e maximização de resultados. Com isso há o compartilhamento e a discussão de opiniões e a criação de entendimento mútuo. Essa idéia de espaço ou ambiente de discussão para os agentes 90 participantes torna-se importante pelo fato de que os próprios agentes possuem a oportunidade. (LIMA; GONÇALVES, 2011, p. 1645) Atualmente, percebe-se que os ambientes de discussão estão abrigados, principalmente, na Web, basta verificar a influência que as redes sociais possuem na repercussão de determinados assuntos. Twiter24, Crowdsourcing25 e Crowdfunding26 são exemplos de novas maneiras dos cidadãos se manifestarem e interagirem com o Governo. Deixam de ser passivos e apenas receptadores de informações, passando a ter uma postura ativa, mas participativa, buscando uma interação colaborativa entre os usuários da Web em prol de um objetivo determinado. Como lembra Habermas (2003, p. 33) “a formação democrática da opinião e da vontade depende de opiniões públicas informais que idealmente se formam em estruturas de uma esfera pública política não desvirtuada pelo poder”. Vale destacar que é utilizado o conceito de Governo se referindo “não apenas ao conjunto de pessoas que exerce o poder político e determina a orientação política de uma determinada sociedade. Diz respeito, também, ao complexo de órgãos que institucionalmente têm o exercício do poder”. (LEVI, 1993 apud JARDIM, 1995, p. 65). A Open Definition (2013) aborda sobre o conhecimento aberto, no qual engloba, dentre outros aspectos, os dados, sejam eles científicos, históricos, geográficos ou outros quaisquer, além de informações governamentais e administrativas. Assim, “dado aberto é um dado que pode ser livremente utilizado, reutilizado e redistribuído por qualquer um”. (MANUAL..., 2011, p. 13). Pode-se dizer que um dos benefícios – ou consequência – de se associar dados abertos às informações públicas é a interoperabilidade, proporcionada pelos padrões provenientes dos princípios dos dados abertos. Miranda (2011, p. 65) chama a atenção para a importância da interoperabilidade semântica, que pode ser entendida como a “habilidade de dois sistemas se comunicarem, 24 O Twitter apresenta-se como uma proposta para troca de informações e divulgação de notícias em poucas palavras. É um forte aliado para a disseminação da informação no ambiente online, ou seja, na internet. Utilizando estes serviços os usuários podem publicar notícias ou compartilhar informações através de vários equipamentos que possibilitem uma conexão, entre estes o celular, e assim não precisando necessariamente do computador. (PAUXIS, SILVA, 2011) 25 Crowdsourcing é um modelo de produção que utiliza a inteligência e os conhecimentos coletivos e voluntários espalhados pela Internet para resolver problemas, criar conteúdo e soluções ou desenvolver novas tecnologias como também para gerar fluxo de informação. (WIKIPEDIA, 2013b). 26 Crowdfunding, traduzido para o português como Financiamento coletivo ou Financiamento colaborativo, é a obtenção de capital para iniciativas de interesse coletivo através da agregação de múltiplas fontes de financiamento, em geral pessoas físicas interessadas na iniciativa. O termo é muitas vezes usado para descrever especificamente ações na Internet com o objetivo de arrecadar dinheiro para artistas, jornalismo cidadão, pequenos negócios e start-ups, campanhas políticas, iniciativas de software livre, filantropia e ajuda a regiões atingidas por desastres, entre outros. (WIKIPEDIA, 2013a). 91 tendo entre eles a mesma interpretação e, portanto, as mesmas implicações lógicas sobre as informações trocadas”. Para este mesmo autor, o movimento criado pela publicação de dados governamentais abertos pretende utilizar padrões de arquivo ou comunicação que promovam interoperabilidade semântica entre sistemas, permitindo interpretações automatizadas por máquina e agregação de valor às informações apresentadas a sociedade. Com relação a questão da interoperabilidade, o Governo Brasileiro publicou a Portaria n. 5, em 14 de julho de 2005, que institucionaliza os Padrões de Interoperabilidade de Governo Eletrônico (e-PING), no âmbito do Sistema de Administração dos Recursos de Informação e Informática (SISP), cria sua Coordenação, definindo a competência de seus integrantes e a forma de atualização das versões do Documento. O e-PING visa integrar as operações entre equipamentos, programas e sistemas de informática, visando o pleno aproveitamento dos potenciais de intercâmbio de dados e informações no âmbito da Administração Pública Federal direta, autárquica e fundacional, o avanço na constituição da infra-estrutura para o desenvolvimento do Governo Eletrônico e a racionalização de custos. (BRASIL, 2005, p. 1) Utilizando o pensamento de Pastori (1993 apud JARDIM, 1995, p. 62), administração pública pode ser definida como “conjunto de atividades diretamente destinadas à execução concreta das tarefas ou consideradas de interesse público ou comum numa coletividade ou numa organização estatal”. Jardim (1995; 1999) complementa a ideia de administração pública afirmando que sua atividade corresponde tanto às ações governamentais relacionadas com os poderes de decisão e comando e aquelas de auxílio imediato ao exercício do Governo, quanto aos empreendimentos voltados para a consecução de objetivos públicos, definidos por Lei e atos do Governo. Miranda (2011), Ribeiro e Almeida (2011) e Batista et al. (2012) apontam a publicação do Memorandum on Transparency and Open Government, pelo presidente dos EUA, Barack Obama (2009) como ação motivadora para a ampliação de esforços para a publicação de dados governamentais abertos. Esse documento estabelece as diretrizes do Governo Norte-Americano, abrangendo desde as questões sobre gestão interna da informação, indo até a publicação dos dados do Governo para a sociedade civil. (OBAMA, 2009). A partir de então a abertura de dados governamentais passou a ser uma prática que, cada vez mais, é adotada por diversos países. O Manual... (2011, p. 4) define dados governamentais abertos como 92 dados produzidos pelo governo e colocados à disposição das pessoas de forma a tornar possível não apenas sua leitura e acompanhamento, mas também sua reutilização em novos projetos, sítios e aplicativos; seu cruzamento com outros dados de diferentes fontes; e sua disposição em visualizações interessantes e esclarecedoras. Para o W3C (2010 apud VAZ; RIBEIRO; MATHEUS, 2010, p. 49) os Dados governamentais abertos podem ser definidos como “a publicação e disseminação das informações do setor público na Web, compartilhados em formato bruto e aberto, compreensíveis logicamente, de modo a permitir sua reutilização em aplicações digitais desenvolvidas pela sociedade”. Já Batista et al. (2012, p. 2) afirma que Dados Governamentais Abertos são “entendidos como o esforço para a publicação e disseminação das informações do setor público na Web, permitindo a reutilização e a integração destes dados”. Diante das definições apresentadas acima, pode-se que a questão chave dos dados governamentais abertos é a abertura dos dados para sua reutilização pelos cidadãos. Pois, apenas a troca de documentos entre organismos do setor público no âmbito das suas atividades de serviço público não constitui reutilização. (VALENTIN RUIZ; BUENESTADO DEL PESO, 2012). Diversos estudos apontam os benefícios provenientes da adoção dos dados governamentais abertos (BERNERS-LEE, 2009; DINIZ, 2009; MANUAL..., 2011). O W3C (2009, p. 41-43) aponta como as principais vantagens dos dados governamentais abertos, os seguintes pontos: • • • Reutilização: quando as informações são coletadas à disposição na Web com uso dos padrões abertos apropriados, elas podem ser usadas várias vezes de maneiras novas, imprevistas e imaginativas, capazes de aumentar muito o valor dos dados por seu reuso e combinação, com maior automação e interoperabilidade melhor. Buscas melhoradas na Web: muitos sistemas ainda impedem a busca de informações necessárias, pois mesmo disponíveis, não estão indexadas de maneira adequada para sua recuperação. A utilização das tecnologias da Web Semântica contribuirá para a estruturação e recuperação dessas informações públicas; Integração dos dados: possibilidade de interligar, melhorar e compartilhar esses dados, o que produz uma grande melhoria na integração de dados entre sistemas díspares e o florescimento de novos serviços. Com base nos conceitos elaborados pelo grupo defensor dos princípios para dados governamentais abertos, o W3C (2009) amplia os benefícios já listados, acrescentando que os 93 dados governamentais abertos promovem o aumento do discurso civil, a melhoria do bemestar público e o uso mais eficiente dos recursos públicos. E alerta para que a publicação seja eficaz é necessário identificar os dados que alguém controla, representar esses dados de uma maneira que as pessoas possam utilizá-los e expor os dados para o mundo amplo. DAVIES (2010, p. 3) e Eaves (2010 apud PEREIRA, 2012, p. 22) descrevem cinco maneiras para utilização dos dados abertos. Sendo: 1. 2. Data to fact – relacionada à busca, pesquisa e apresentação dos dados; Data to information – forma na qual os dados foram analisados e interpretados, comumente utilizada em trabalhos acadêmicos para construção de análise e relatórios; Data to interface – dados em formato mais interativo como gráficos, mapas, tabelas, entre outros; Data to data – dados são mais complexos por estarem agregados uns aos outros; Data to service – é a utilização dos dados para provimento de serviços, como prestação de atendimento e serviço público ao cidadão de maneira on-line pela gestão pública. 3. 4. 5. Já os efeitos dos dados governamentais abertos sobre as políticas públicas são apontadas pelo W3C (2009, p. 40) como sendo os seguintes: • • • Inclusão: fornecer dados em formatos padronizados abertos e acessíveis permite que qualquer pessoa use numerosas ferramentas de software para adaptá-los às suas necessidades; Transparência: informações do setor público abertos e livremente acessíveis melhoram a transparência, pois partes interessadas podem usar essas informações da maneira mais adequada ao seu propósito, obtendo uma ideia melhor do trabalho do governo e adaptando-os às suas necessidades específicas; Responsabilidade: os conjuntos apropriados de dados abertos, devidamente ligados, podem oferecer vários pontos de vista sobre o desempenho do governo ao tentar atingir suas metas públicas. Um grupo de especialistas, o OpenGovData (2007), desenvolveu os oito princípios dos dados governamentais abertos, que nortearam diversos trabalhos posteriores sobre este tema, como Agune, Gregório Filho, Bolliger (2010); Diniz (2010); Manual... (2011); Vaz, Ribeiro, Matheus (2010). Estes princípios são: 1. Completos. Todos os dados públicos estão disponíveis. Dado público é o dado que não está sujeito a limitações válidas de privacidade, segurança ou controle de acesso. 2. Primários. Os dados são apresentados tais como os coletados na fonte, com o maior nível de granularidade e sem agregação ou modificação. 94 3. Atuais. Os dados são disponibilizados tão rapidamente quanto necessário à preservação do seu valor. 4. Acessíveis. Os dados são disponibilizados para maior alcance possível de usuários e para o maior conjunto possível de finalidades. 5. Compreensíveis por máquinas. Os dados são razoavelmente estruturados de modo a possibilitar processamento automatizado. 6. Não discriminatórios. Os dados são disponíveis para todos, sem exigência de requerimento ou cadastro. 7. Não proprietários. Os dados são disponíveis em formato sobre o qual nenhuma entidade detenha controle exclusivo. 8. Livres de licença. Os dados não estão sujeitos a nenhuma restrição de direito autoral, patente, propriedade intelectual ou segredo industrial. Restrições sensatas relacionadas à privacidade, segurança e privilégios de acesso são permitidas. (VAZ, RIBEIRO, MATHEUS, 2010, p. 47) Ainda existem três leis dos dados governamentais abertos estabelecidas por Eaves (2009, p. 1, tradução nossa), que determinam que Se o dado não for encontrado e indexado na Web, ele não existe; Se não estiver aberto e disponível em formato compreensível por máquina, ele não pode ser aproveitado; Se algum dispositivo legal não permitir sua replicação, ele é inútil. Tanto nos princípios estabelecidos pelo grupo OpenGovData, quanto nas leis de Eaves, a Web Semântica apresenta soluções para acessibilidade, compreensão por máquinas, busca precisa e rápida. Ao fornecer significados às páginas na Web, de modo que a linguagem seja compreendida por máquina, capturando, processando e relacionando dados de diferentes fontes, a Web Semântica viabiliza que a publicação dos dados governamentais abertos seja encontrada por quem a reutilize, dando outra utilidade àqueles dados. Deve-se especificar que os dados governamentais a serem publicados em formato aberto são aqueles que não contêm informações sobre indivíduos específicos ou restrições de segurança nacional. Logo, os dados em questão se referem aos dados públicos, que estão ou que deveriam estar liberados para a sociedade, tendo potencial para se tornarem abertos, garantindo sua reutilização. (MANUAL... 2011, p. 16). Ainda sobre essa questão, Thaney (2010) e Ribeiro e Almeida (2011) utilizam as idéias de Auer et al. (2007), Gray et al. (2009) e Davies (2010) para chamar a atenção sobre os aspectos ligados às questões de licença e autorização para acesso aos dados e aos conteúdos oriundos do âmbito governamental. Pois se deve observar a diferença legal existente entre os conteúdos individuais de uma base de dados (privacidade no conteúdo de cada um dos campos de dados) e a coleção de conteúdos da base (privacidade global da base de dados). 95 Berners-Lee (2009) conclui que os dados governamentais devem ser publicados de forma aberta por três motivos: “aumentar a consciência cidadã das funções do governo para permitir maior responsabilidade; contribuir com informações valiosas sobre o mundo; e permitir que o governo, o país e o mundo funcionem com mais eficiência”. Todavia, Gurstein (2011 apud RODRIGUES, 2012) acredita que a publicação de dados governamentais abertos não será um objetivo fácil a ser conquistado. Esse autor levanta obstáculos que os dados governamentais abertos deverão enfrentar até sua efetiva implementação. Os principais pontos sinalizados são: a infraestrutura básica para acesso à Internet pelo cidadão; ferramentas que são a disponibilidade dos dados em meios específicos e não universalmente; dados que precisam de software específico para sua utilização; conteúdo dos dados ser de difícil compreensão pelos usuários, principalmente aqueles com deficiência ou baixa escolaridade e interpretação dos dados que necessitam de especialistas na área para serem utilizados e compreendidos. (PEREIRA, 2012, p. 24). Diante dos desafios apresentados, Dodds (2010, p. 13) recomenda que se deve continuar permitindo o acesso abertos aos dados e incentivar que outras pessoas os reutilizem, para alcançar, fora do espaço dos órgãos públicos, projetos, aplicações e organizações criativas e inovadoras. Porém, não pode haver dúvidas que a intenção básica primeira dos dados governamentais abertos é a reutilização. Frente aos obstáculos para implementação das iniciativas para publicação de dados abertos, algumas países se uniram, no espírito de colaboração multi-colaboradores, formando um comitê de governos e organizações da sociedade civil, para supervisionar o andamento da publicação de dados governamentais abertos. A parceria para Governo Aberto oficialmente foi criada em 20 de setembro de 2011, quando os oito governos fundadores (Brasil, Indonésia, México, Noruega, Filipinas, África do Sul, Reino Unido, Estados Unidos) aprovaram uma Declaração de Governo Aberto, e anunciou seus planos de ação nacionais. Atualmente, são 47 governos membros da Open Government Partnership, que é uma iniciativa multilateral que visa assegurar compromissos concretos dos governos para promover a transparência, capacitar os cidadãos, combater a corrupção e aproveitar novas tecnologias para fortalecer a governança. (OPEN GOVERNMENT PARTNERSHIP, 2012). As primeiras iniciativas de dados governamentais abertos conhecidas por parte do setor público são os portais de dados abertos do governo dos Estados Unidos27 e do Reino Unido28. Nestes portais são indexadas milhares de séries de dados em formato bruto para 27 28 Disponível em: <http://www.data.gov/>. Acesso em: 1 maio 2013. Disponível em: <http://data.gov.uk/>. Acesso em: 1 maio 2013. 96 serem utilizadas pela sociedade, lançados em maio de 2009 e setembro de 2009, respectivamente. Em seguida, Canadá29, Austrália30 e Nova Zelândia31 começaram a publicar dados segundo as diretrizes dos dados governamentais abertos, seguindo os passos dos Estados Unidos e Reino Unido. (MIRANDA, 2011, p. 67-68). Embora milhares de datasets tenham sido publicados nesses portais, houve pouca participação da sociedade na utilização dos dados publicados. Em função disso, os Governos dos Estados Unidos e do Canadá, começaram a promover campeonatos de elaboração de aplicações, com prêmios para os mais úteis, estimulando o uso desses dados. (MIRANDA, 2011, p. 68). Percebe-se assim que, além de publicar é necessário motivar a utilização dos dados, criando, no futuro, um hábito parceria entre Estado e Governo na elaboração de ferramentas e serviços. Serão apontadas a seguir algumas iniciativas estrangeiras e nacionais de dados governamentais abertos. 4.5.1 Iniciativas estrangeiras de dados governamentais abertos Foram analisados os portais das primeiras iniciativas de dados governamentais abertos. Desta forma, analisou-se portal norte-americano e do Reino Unido. DATA.GOV Criado em 2009, o portal Data.gov é uma ação efetiva do memorando sobre transparência e governo aberto escrito por Obama (2009). Seu propósito é aumentar o acesso do público aos dados gerados pelo Poder Executivo do Governo Federal, fornecendo descrições dos conjuntos de dados governamentais, informações sobre como acessar as bases de dados e ferramentas que alavancam conjuntos de dados do Governo. O portal do Data.gov (UNITED STATES, 2013) apresenta como seu objetivo melhorar o acesso aos dados federais e expandir o uso criativo desses dados para além das paredes de Governo, incentivando ideias inovadoras (por exemplo, as aplicações Web). Além de tornar o governo mais transparente. 29 Disponível em: <http://www.open.gc.ca/index-eng.asp>. Acesso em: 1 maio 2013. Disponível em: <http://data.gov.au/>. Acesso em: 1 maio 2013. 31 Disponível em: <https://data.govt.nz/>. Acesso em: 1 maio 2013. 30 97 Data.gov utiliza-se de feedback, comentários e recomendações por parte do público e, portanto, incentiva as pessoas a sugerirem conjuntos de dados que eles gostariam que fossem publicados. Ademais, os conjuntos de dados já publicados podem ser avaliados e comentados, sugerindo outras formas de melhorar sua disponibilização. Em 1 de maio de 2013, o portal do Data.gov possuía 373.029 conjuntos de dados brutos e geoespaciais, 1.209 ferramentas de dados, 349 aplicativos, 137 aplicativos móveis e 172 agências e subagências. E os dados são organizados em comunidades: agricultura, negócios (EUA), cidades, consumidores, países, desenvolvedores, educação, energia, ética, saúde, lei, industria, oceano, pesquisa, restauração do Golfo do México, Segurança, Estados e cadeia de fornecimento sustentável. O portal apresenta uma parte exclusiva para a Web Semântica, o Governo dos EUA está na vanguarda das tecnologias da Web Semântica associada ao dados governamentais. Para este fim, Data.gov está hospedando um conjunto de RDF, contendo triplas criadas pela conversão de uma série de conjuntos de dados Data.gov para este formato, fazendo mais de 6,4 bilhões tripas de dados governamentais abertos disponíveis para a comunidade. (UNITED STATES, 2013). De acordo com o portal, o esquema de URI escolhido é muito simples e projetado para permitir aos cidadãos explorarem e ampliarem os usos desses dados. Os líderes da comunidade Data.gov, trabalham para uma nova codificação de conjuntos de dados convertidos de Comma-Separated Values – CSV (e outros formatos) para RDF. Buscando determinar o melhor esquema para se criar URI persistente e diferenciado, para junto com comunidades internacionais e com W3C promover padrões internacionais de publicações de dados do governo de forma persistentes (metadados) na Web. (UNITET STATES, 2013). Como exemplo de utilização dos dados disponíveis no Data.gov, pode-se citar o “Data.gov Mashathon 2010: na energy mashup”32. Ele combinou os dados da Energy Information Administration (EIA), publicados no Data.gov, com dados de OpenEI.org, o Censo dos EUA e SmartGrid.gov. O resultado deste mashup é comparar a variação no uso residencial de energia de 7 cidades com população em torno de meio milhão de pessoas. Foi possível analisar as diferentes tarifas de energia elétrica, os níveis de renda média, os incentivos relacionados com a energia e os tipos de programas que estão sendo 32 Disponível em: <http://en.openei.org/apps/mashathon2010/>. Acesso em: 1 maio 2013. 98 implementadas pelo Smart Grid33. Com isso, cidades de todo o país estão fazendo a transição para um novo mercado de energia de forma unificada. FIGURA 21 - Aplicativo utilizando dados do Data.gov Fonte: OpenEi34. DATA.GOV.UK O Governo do Reino Unido disponibilizou em 2009 o portal que disponibiliza os dados públicos para ajudar os cidadãos a entenderem como o governo funciona e como as políticas são feitas. Alguns desses dados já estavam disponíveis, mas o portal Data.gov.uk reúne esses dados de forma unificada, possibilitando que sejam pesquisáveis em um website. (DATA.GOV.UK, 2013). Ramos Simón et al. (2012) afirma que o portal de dados abertos do Reino Unido funciona também como um catalisador para outras instituições publicarem seus dados, aumentando, desta forma, o número de dados disponível. Os dados então englobam o Governo Central, Governos Regionais e autoridades locais, servindo como um elemento fundamental na política de transparência do Governo. Este autor chama a atenção que não é informação pública destinada ao público em geral, mas é destinado a um público capaz de analisá-la e criar aplicativos que oferecem uma utilidade para o cidadão. Em 1 maio de 2013 existiam 9.399 conjuntos de dados disponíveis, de todos os departamentos do Governo central e uma série de outros organismos do setor público e das autoridades locais. 33 Smart Grid é uma rede elétrica que utiliza tecnologia de informação e comunicação para reunir e agir de acordo com informações, tais como informações sobre o comportamento de fornecedores e consumidores, de forma automatizada para melhorar a eficiência, confiabilidade, economia e sustentabilidade da produção e distribuição de energia elétrica. (WIKIPÉDIA, 2013c). 34 Disponível em: <Disponível em: http://en.openei.org/apps/mashathon2010/>. Acesso em 1 maio 2013. 99 O Data.gov.uk disponibiliza seus dados em 49 formatos diferentes, dos quais podem ser destacados o CSV e RDF. Porém também disponibiliza 632 conjuntos de dados em Portable Document Format (PDF), formato não indicado para publicação de dados abertos, pois inviabiliza a reutilização dos dados contidos no documento. A organização dos dados para sua recuperação é realizada por meio de tags. Estas somam 50 assuntos utilizados para descreverem os dados. E assim, como o Data.gov, o Data.gov.uk também utiliza ferramentas da Web 2.0 para promover a participação dos cidadãos, podendo postar comentários sobre os dados publicados, solicitar outros dados e sugerir melhorias. FIGURA 22 - Aplicativo utilizando dados do Data.gov.uk Fonte: Travel’s checklist35. Ramos Simon et al.(2012) realizou uma pesquisa comparativa em portais de dados abertos dos Governos Europeus. Pesquisou os portais do Governo da Alemanha, Áustria, Bélgica, Dinamarca, Espanha, França, Grécia, Itália, Portugal e reino Unido. E concluiu que apenas o Reino Unido trabalhava com as tecnologias de dados abertos interligados, tendo como colaborados o Tim Berners-Lee, além de outros parceiros técnicos envolvidos no projeto até o momento. 4.5.2 Iniciativas nacionais de dados governamentais abertos Diante das iniciativas estrangeiras sobre publicação dos dados governamentais abertos, o Brasil é o pioneiro nas discussões sobre dados abertos na América Latina (Mazoni, 2011, p. 9), abrindo espaço para discussões sobre dados abertos e reutilização. 35 Disponível em: <http://www.travelschecklist.com/>. Acesso em 1 maio 2013. 100 A principal iniciativa de dados governamentais abertos do Brasil é o Portal Brasileiro de Dados Abertos ou dados.gov.br, como é citado em diversas pesquisas, é a ferramenta disponibilizada pelo Governo Brasileiro para que os cidadãos possam encontrar e utilizar os dados públicos. O portal também tem o objetivo de promover a interlocução entre atores da sociedade e com o Governo para pensar a melhor utilização dos dados em prol de uma sociedade melhor. (DADOS.GOV.BR, 2013). O projeto dados.gov (como era chamado), iniciado em 2009 tem o objetivo principal de criar um catálogo aberto de informações, cujo objetivo é aprimorar a gestão pública e facilitar o acompanhamento pela sociedade das ações governamentais em suas comunidades. (FRANZOSI et al., 2011, p. 27). Franzosi et al. (2011, p. 27) afirma que o dados.gov.br é um catálogo de dados organizado em árvores temáticas. Segundo este autor, ao acessar os portais de dados abertos norte americano, do Reino Unido, da Alemanha e do Canadá não se tem a possibilidade de acesso aos dados por diferentes árvores temáticas, tão pouco uma abordagem top-down, de grandes assuntos até os itens primários de acesso aos dados. Esta organização em árvores utiliza como base o Vocabulário Controlado do Governo Eletrônico (VCGE). Franzosi et al. (2011, p. 39, grifo nosso) declara que “a busca semântica é realizada sobre o repositório de metadados usando uma ontologia de domínio de Serviços Públicos de Administração Federal que foi construída a partir do Vocabulário Controlado do Governo Aberto Eletrônico (VCGE)”. Este ponto de vista será questionado na próxima seção desta pesquisa. Além do portal dados.gov.br, que serve como compilador dos dados abertos publicados. Este portal indica nove outras iniciativas nacionais: Portal da Câmara Municipal de São Paulo36 – que disponibiliza dados sobre atividade legislativa, acervo de processos digitalizados da atividade legislativa, recursos humanos e orçamento. Apesar de ter alguns dados disponibilizados em XML, muitos estão em formato proprietário, contrariando os princípios de dados abertos. Governo Aberto SP37 – iniciativa do Governo do Estado de São Paulo, busca estimular a criação de novos serviços eletrônicos, a promoção da transparência e a melhoria de qualidade das informações de interesse da sociedade. Verificou- se 36 Disponível em: <http://www.camara.sp.gov.br/index.php?option=com_wrapper&view=wrapper&Item id=219>. Acesso em 1 maio 2013. 37 Disponível em: <http://www.governoaberto.sp.gov.br/view/index.php>. Acesso em: 1 maio 2013. 101 que apesar de informar que possui 358 bases de dados cadastradas, muitas apresentam seu conteúdo em formatos fechados. Algumas inclusive, solicitando senha para acesso aos dados. Logo, precisa ser reformulada para que os dados sejam realmente publicados seguindo os princípios de dados governamentais abertos. Um diferencial positivo do portal foi a possibilidade de postar comentários sobre as bases de dados. Portal de dados abertos do Tribunal de Contas dos Municípios do Estado do Ceará38 – além de fornecer uma espécie de tutorial sobre como utilizar os dados, ainda oferece os dados disponibilizados em formatos XML, JSON, CSV e HTML. Dados abertos do Governo de Pernambuco39 – Organiza os dados por assuntos, classificados em: cultura, Economia, educação, Habitação, lazer, meio ambiente, saúde, segurança, sociedade, trabalho, transporte e turismo. E os formatos disponíveis são CSV e XML. Apresenta busca simples e detalhada para pesquisa. Alagoas em Dados e Informações40 – classifica os dados em grupos: saúde; educação, cultura e esporte, indicadores; trabalho; infraestrutura; demografia. E utiliza a pesquisa por palavras-chave: IBGE; DATASUS; saúde; agropecuária; INEP; indicadores; Educação-básica; agricultura; trabalho; MTE; emprego-formal; infraestrutura; demografia; vacinas; comércio-exterior; MDIC; habitação, demográficos; finanças-públicas e educação-especial. Nota-se que a escolha por palavras chaves não segue um critério que padronize a utilização, facilitando assim a recuperação dos dados. Fornece os dados em formato XLS, CSV e XML. Dados abertos da Assembleia de Minas41 – apresenta algumas limitações especificadas no próprio portal: (a) nem todos objetos são expostos como recursos e por isso não é possível acessá-los diretamente; (b) as representações dos recursos não são interconectadas, não é possível navegar por uma lista de objetos até chegar a um objeto da lista diretamente. Muitas vezes, apenas as chaves são listadas; (c) muitos objetos são acessados através de URLs de pesquisa, identificadas por verbos como "consulta". Os dados são disponibilizados em formato txt, CML e JSON. 38 Disponível em: <http://api.tcm.ce.gov.br/>. Acesso em: 1 maio 2013. Disponível em: <http://www.dadosabertos.pe.gov.br/PortalDadosAbertos/public/pages/telaInicial. jsf.>. Acesso em: 1 maio 2013. 40 Disponível em: <http://catalogo.seplande.al.gov.br/>. Acesso em: 1 maio 2013. 41 Disponível em:< http://dadosabertos.almg.gov.br/ws/ajuda/sobre>. Acesso em: 1 maio 2013. 39 102 Rio Datamine42 – Página indisponível durante o período de pesquisado de 12 fev. 2013 a 17 jun. 2013. Rio ideias43 – Página promocional de concurso de aplicações utilizando dados do governo da cidade do Rio de Janeiro. Portal de Dados Abertos da Secretaria de Segurança Pública do Estado do Rio Grande do Sul44 – apresenta dados sobre violência contra a mulher e indicadores abertos por município, entre os anos de 2002 a 2012. Os dados podem ser acessados em formato CSV e XML. Porém, não é possível realizar pesquisas e nem possui uma classificação temática dos dados. Miranda (2011, p. 67) sinaliza para o pioneirismo da Dataprev na publicação de dados governamentais abertos. De acordo com este autor, a Dataprev trabalhou em um projeto piloto para a publicação de dados abertos da Previdência, estimando a publicação de no mínimo um Dataset até o final de 2010. A Dataprev disponibilizou dados sobre acidentes do trabalho publicados no Anuário Estatístico de Acidentes do Trabalho, publicado entre os anos de 2002 a 2009. E a partir desses dados foi criado pela Dataprev um aplicativo que uniu os dados publicados e o Google Maps, identificando os números ou o tipo acidente por cidade mostrada no mapa. FIGURA 23 - Aplicativo utilizando dados do Data.gov.br Fonte: Dataprev45. Nota-se que há uma falta de padronização dos formatos de publicação nas iniciativas estrangeiras e brasileiras. Percebe-se que em alguns casos nem utilizam os formatos indicados pela W3C para serem classificados como dados governamentais abertos. Precisa-se incentivar 42 Disponível em: <http://riodatamine.com.br/>. Acesso em: 1 maio 2013. Disponível em: <http://ideias.rioapps.com.br/landing>. Acesso em: 1 maio 2013. 44 Disponível em: <http://www.ssp.rs.gov.br/?model=conteudo&menu=196&pg=1>. Acesso em: 1 maio 2013. 45 Disponível em: <http://api.dataprev.gov.br/doc/visualizacao-mapa.html>. Acesso em: 1 maio 2013. 43 103 a utilização de padrões de formatos e critérios para publicação dos dados, levando-se em consideração os princípios de dados governamentais abertos. 104 5 INSTRUMENTOS DE REPRESENTAÇÃO DA INFORMAÇÃO SOBRE ACIDENTES DO TRABALHO Como visto anteriormente no referencial teórico, precisa-se incorporar a prática de reutilização sistemática dos dados governamentais, de forma a facilitar a comunicação e a recuperação de informação pela sociedade. No caso aqui apresentado, buscou-se vocabulários ou representações da informação que descrevessem a temática sobre acidente do trabalho no domínio da Previdência Social brasileira, com o propósito de reutilizar suas estruturas e conceitos para publicação dos dados do Ministério da Previdência Social, salvaguardados e geridos pela Dataprev. Assim, foram localizados os seguintes instrumentos: Vocabulário Controlado do Governo Eletrônico (VCGE): elaborado pelo Governo Brasileiro para ser o formato Padrão de Metadados do Governo Eletrônico (e-PMG). Foi escolhido para análise por ser o vocabulário indicado pelo plano de ação para Infraestrutura Nacional de Dados Abertos (INDA) para descrição semântica dos dados do Governo publicados no portal dados.gov.br, sobre dados governamentais abertos. Modelo de publicações de dados sobre acidentes do trabalho: publicado pela Dataprev, que foi escolhido por ser o modelo preliminar que norteou a publicação de dados abertos sobre acidentes do trabalho realizada pela Dataprev e também o modelo que despertou o interesse pela pesquisa aqui submetida; Tesauro e a taxonomia da Organização Internacional do Trabalho (OIT): elaborados pela agência das Nações Unidas, que tem por missão promover oportunidades para que homens e mulheres possam ter acesso a um trabalho decente e produtivo, em condições de liberdade, equidade, segurança e dignidade. Foram selecionados para análise por serem instrumentos de representação do conhecimento do principal órgão internacional sobre o domínio do trabalho. 5.1 ACIDENTE DO TRABALHO NO VCGE O VCGE é uma evolução da Lista de Assuntos do Governo (LAG) em março de 2004. É um esquema para ser utilizado no elemento assunto.categoria (subject.category) do Padrão de Metadados do Governo Eletrônico (e-PMG). Para os gerentes de sítios e portais 105 governamentais, os termos retirados do VCGE tornarão mais direta a apresentação dos serviços disponibilizados em uma estrutura de diretório baseada em seus indexadores. (VOCABULÁRIO..., 2011). O vocabulário estudado apresenta as relações genéricas e específicas entre os termos, caracterizando uma taxonomia. De acordo com Moreiro González (2011, p. 51) a taxonomia “serve para ordenar informação em uma hierarquia [...] em forma de árvore que estabelece relação entre os objetos de generalização-especialização”. Apesar do Vocabulário (2011) afirmar que no seu processo de construção utilizaram os princípios de um tesauro, o VCGE se aproxima mais de uma taxonomia do que de um tesauro, pois este último abrange uma quantidade maior de relações (GOMES, 1990), como, por exemplo, a partitiva e associativa, não utilizada no VCGE. De acordo com o Vocabulário... (2011) o público-alvo do VCGE é o cidadão. O esquema tem por objetivo ser intuitivo para os cidadãos que buscam, nas páginas governamentais on-line, assuntos do seu interesse. Por essa razão, descrevem a metodologia do VCGE da seguinte forma: prefere a linguagem do leigo ao jargão do serviço público ou termos técnicos; não supõe que o cidadão tenha conhecimento prévio das responsabilidades de cada nível ou órgão governamental. Procura ser independente da estrutura governamental, devendo sobreviver às mudanças de estruturas e organogramas; o uso comum é mais importante do que a precisão acadêmica, quando se está escolhendo nomes ou posições relativas aos cabeçalhos. (VOCABULÁRIO..., 2011) Conforme observado no primeiro item listado anteriormente, pode-se inferir que o VCGE utilizou a “linguagem do leigo”, ou seja, linguagem livre e preocupada com o uso comum mais que com a “precisão acadêmica”. (VOCABULÁRIO..., 2011). No entanto, surgiu aqui uma primeira inquietação: a precisão de vocabulários controlados estudada em estudos acadêmicos não vem justamente para fornecer teorias e métodos para uma maior precisão na descrição dos termos e, consequentemente, melhorar a recuperação da informação? Vislumbra-se que a utilização do vocabulário pode ir além de um mapa para navegação em páginas eletrônicas do setor público brasileiro. Seu uso pode ser estendido a outros propósitos, como por exemplo: ser utilizado pelo Estado para representação do domínio – mapa conceitual – de cada setor público, mostrando sua trajetória ao longo do tempo, ou pode ser usada pelos cidadãos para descrição, recuperação e reutilização de 106 informações governamentais, atendendo assim a organização necessária para a publicação dos dados abertos. Ao analisar a classe referente à Previdência Social esquematizada no VCGE (Figura 24), percebe-se que a representação feita da respectiva área não corresponde a sua abrangência temática. Termos importantes para entendimento da Previdência Social não estavam contemplados no vocabulário. FIGURA 24 - Previdência social no VCGE46 Fonte: VOCABULÁRIO... (2011) Um exemplo, da falta de cobertura constatada anteriormente, é que se um cidadão necessitar buscar por uma espécie de pensão ao qual se beneficia, não encontrará representada esta pensão a qual procura, pois o termo “Pensão” não é classificado pelo VCGE. Estão ausentes da classe do VGCE sobre Previdência Social as pensões mantidas, atualmente, pelo Ministério da Previdência Social (ANUÁRIO..., 2012). Pensões estas, a saber: Pensão especial à pessoas atingidas pela hanseníase Pensão especial aos dependentes de vítimas fatais por contaminação na hemodiálise - Caruaru-PE Pensão especial mensal vitalícia Pensão especial vitalícia Pensão mensal vitalícia do dependente do seringueiro 46 Disponível em: <http://vocab.e.gov.br/2011/03/vcge#previdencia-social>. Acesso em: 5 mar. 2014. 107 Pensão mensal vitalícia do seringueiro Pensão mensal vitalícia por síndrome de talidomida Pensão por morte (EX-SASSE) Pensão por morte de ex-combatente Pensão por morte por acidente de trabalho Pensão por morte previdenciária Outro ponto relevante é que a Previdência Social está subordinada a classe de “Pessoas, família e sociedade”. Entretanto, outras áreas como “Saúde”, “Trabalho” e “Educação” apesar de estarem conceitualmente ligadas aos direitos e benefícios da pessoa e da sociedade, encontram-se em classes independentes. De acordo com Campos e Gomes (2008, p. 5) a “categorização é um processo que requer pensar o domínio de forma dedutiva, ou seja, determinar as classes de maior abrangência dentro da temática escolhida”. Desta maneira, não ficaram claros os princípios utilizados para a realização da categorização da classe de assunto da Previdência Social dentro do domínio do Governo Eletrônico. A estrutura organizacional do Governo Eletrônico classifica, no mesmo nível hierárquico, a Previdência Social, Saúde, Trabalho e Educação dentro de Ministérios (BRASIL, 2013b). Assim, poderia ser revista a categorização aplicada no VCGE, de forma a “analisar o domínio a partir de recortes conceituais que permitem determinar a identidade dos conceitos (categorias) que fazem parte deste domínio”. (CAMPOS; GOMES, 2008, p. 5). Ainda sobre este ponto, foi explicitado que o foco na elaboração do vocabulário foi facilitar seu uso pelos cidadãos (VOCABULÁRIO..., 2011), acredita-se que quando mais evidentes os termos, mas fácil será sua localização e utilização. Dar destaque a algumas áreas em detrimento a outras com o mesmo nível hierárquico faz o vocabulário perder a consistência entre as relações. Ademais, foram encontradas inconsistências conceituais, referentes ao postulado da monorreferencialidade, no qual, a denominação de uma unidade de conhecimento – conceito (DAHLBERG, 1978), “é um termo o qual guarda com ele uma relação unívoca, isto é, para cada conceito existe apenas uma denominação e cada denominação vale apenas para um conceito”. (GOMES, 1990, p. 19). Nesta direção, foi possível observar os termos “Previdência do regime estatutário” e “Previdência do servidor” como termos diferentes, porém possuindo uma relação de equivalência. Previdência do regime estatutário possui como finalidade “garantir os direitos e 108 benefícios previdenciários dos servidores” (MARANHÃO, 2012, p. 4) e Previdência do servidor é a previdência “obrigatória aos servidores públicos federais, estaduais, municipais e do Distrito Federal” (BRASIL, 2013a, p. 1). Observou-se ainda que o termo “Previdência do regime estatutário” não é facilmente encontrado em seu domínio da Previdência Social, sendo mais recorrente o termo “Previdência do servidor”. A relação de equivalência não está expressa pelo vocabulário analisado, apesar de estar descrito na metodologia de elaboração do VCGE. Logo, conforme observado, no parágrafo anterior, há dois termos diferentes para representar um único conceito e perde-se assim o controle linguístico dos termos que é um dos princípios básicos de qualquer vocabulário controlado. Embora na linguagem natural não existam sinônimos perfeitos, devese buscar na linguagem especializada o controle de sinônimos ou quase-sinônimos. (GOMES, 1990, p. 47) Conforme mencionado por Moreiro González (2011, p. 53) uma das características das taxonomias é não incluírem definições para os termos, somente as relações hierárquicas. O VCGE não possui definições para os termos, embora na aba de sugestões seja solicitada a colaboração dos usuários do vocabulário para ajudarem a comporem as notas de escopo (NE) com definições dos termos. Além disso, as definições constam na metodologia como uma das etapas de elaboração do vocabulário em questão. Nota-se, então, o desejo de tornar o VCGE ainda mais específico e com relações mais bem definidas. Como afirma Gomes (1990, p. 25) a definição “fornece as características do conceito que vão permitir seu agrupamento e indicar as relações. É ela que vai dar segurança ao organizador do tesauro para estabelecer as relações”. Cabe destacar que o termo “Acidente de trabalho” não é encontrado no VCGE. Os dados atualmente publicados no portal dados.gov.br pela Dataprev, está indexada com o termo “Segurança do trabalho”. Este termo dentro do VCGE é subordinado ao termo “Legislações trabalhistas”, que por sua vez é termo específico do termo “Trabalho”. Entretanto, os dados ali publicados tratam sobre assuntos ligados a temáticas diferentes das de legislações, sem mencionar que Previdência Social não foi relacionada aos dados (vide figura 25). 109 FIGURA 25 - Descrição temática dos dados de acidente do trabalho publicados no Portal dados.gov.br. Fonte: Portal dados.gov.br47 Ao se deparar com o VCGE, percebeu-se pontos que o tornaram um vocabulário inconsistente, principalmente para o uso ao qual se pretendia utilizá-lo, ou seja, na ligação semântica entre os dados publicados pela Dataprev. O Plano de ação para Infraestrutura Nacional de Dados Abertos (INDA) prevê a prospecção de ontologias e vocabulários existentes a serem reutilizados para publicação de dados governamentais abertos. O portal dados.gov.br funciona como um catálogo coletivo, recolhendo dados dos mais diversos órgãos públicos. Desta forma, os “dados do catálogo serão classificados e agrupados conforme os temas (assuntos) constantes no Vocabulário Controlado de Governo Eletrônico (VCGE)” (BRASIL, 2012). Em 2012 começou um esforço do Governo para reavaliar o VCGE e aumentar sua utilização por parte dos Órgãos Públicos. Em dezembro de 2013, foi disponibilizado, apenas em formato .pdf, uma nova versão (2.0.2) do VGCE. Em outubro de 2013, o Governo abriu a nova versão à consulta pública e as considerações acima elencadas foram enviadas para análise. A versão 2.0.2 do VCGE pretende ser um vocabulário especializado, “sendo os vocabulários especializados maiores que o VCGE, esperamos que cada termo dos vocabulários especializados de alto nível encontre um termo no VCGE, mesmo que agrupado”. (BRASIL, 2013d, p. 8). Desta forma, a classe da Previdência Social foi reduzida para: 47 Disponível em: <http://dados.gov.br/dataset/anuario-estatistico-de-acidentes-de-trabalho>. Acesso em: 2 jun. 2013. 110 Previdência Social ◦ Previdência Básica ◦ Previdência Complementar ◦ Outros em Previdência. (BRASIL, 2013d, p. 15). A classe sobre Previdência Social foi arranjada no mesmo nível hierárquico que as outras classes, como: Trabalho, Educação e Meio Ambiente. Entretanto, ele se tornou ainda mais geral. Criando uma dependência de vocabulários especializados para que os dados produzidos pelo Governo consigam uma eficaz indexação nas bases de dados. Em outras palavras, o VCGE parece ter se tornado um vocabulário para interligar pequenos vocabulários elaborados pelos Órgãos Governamentais. Diante do observado, apesar de existir expectativa e determinação do INDA para se utilizar o VCGE para organização semântica dos dados publicados, percebe-se que o cumprimento desta tarefa será árdua, sem o auxílio de outros vocabulários específicos. 5.2 ACIDENTE DO TRABALHO NO MODELO DE PUBLICAÇÕES DE DADOS PUBLICADOS PELA DATAPREV A Dataprev, decidida a cooperar com o movimento de publicação de dados governamentais abertos no Brasil, definiu que sua primeira iniciativa seria sobre a publicação dos dados apresentados no Anuário Estatístico de Acidente do Trabalho. Batista et al. (2011) e Ribeiro e Almeida (2011) explicam que apesar destes dados já serem disponibilizados na Base de dados históricos da Previdência Social48, com tecnologia que permite a extração de consultas pela Internet, este padrão de publicação foge aos princípios de dados governamentais abertos, principalmente, no que se refere à reutilização dos dados. De acordo com Anuário Estatístico de Acidente do Trabalho (2010), ele contém dados referentes aos acidentes do trabalho, registrados ou caracterizados administrativamente como tal pelo INSS no processo de concessão de benefício. Constituindo-se, dessa forma, em um importante conjunto de dados para tomadas de decisões e para diagnóstico sobre determinadas condições de trabalho impostas aos empregados. Ademais, a Dataprev lida, em sua maioria, com dados particulares, ou seja, dados privados, que identificariam os indivíduos, violando assim o princípio de confidencialidade 48 Disponível em: <http://www3.dataprev.gov.br/infologo/>. Acesso em: 2 jun. 2013. 111 dos dados. Por se tratar de um passo inicial da Dataprev na publicação de dados governamentais abertos, os dados sobre acidentes do trabalho serviriam para consolidar o processo de publicação, além de servirem para o reuso dos cidadãos, algo não possível até então. Nesta primeira fase, foram selecionados dados disponibilizadas na Seção I, subseção D do Anuário (2010), conteúdo que trata de Comunicação de Acidente de Trabalho (CAT), suas consequências, por localização geográfica das ocorrências (município) e seus respectivos quantitativos. Estas informações são originadas nos registros dos benefícios de natureza acidentária concedidos pelo Instituto Nacional de Segurança Social – INSS. (DATAPREV, 2013). A figura 26 mostra o modelo proposto pela Dataprev para representação da publicação dos dados. FIGURA 26 - Modelo de domínio sobre acidentes do trabalho, publicado pela Dataprev. Fonte: Dataprev (2013) Percebe-se, que se trata de um protótipo, pois não contempla todo o universo de dados a ser coberto pela publicação dos dados. Sendo útil para um uso imediato de representação de uma ação realizada, mas não podendo ser utilizada para planejamento e organização semântica dos dados a serem ainda publicados. Entretanto, esse modelo possui grande importância para esta pesquisa, pois foi por meio dele que se conseguiu enxergar a necessidade de se propor um modelo que contemplasse outras relações. O Anuário Estatístico de Acidentes do Trabalho (2010) possui uma relação direta com o Anuário Estatístico da Previdência Social (2011), principalmente no que tange a concessão de benefícios em função de acidentes do trabalho. Portanto, falta ao modelo representar esses benefícios, bem como os códigos de classificação utilizados para identificar ou agregar outras informações aos acidentes, como: Classificação Brasileira de Ocupações (CBO), 112 Classificação Nacional de Atividades Econômicas (CNAE) e Classificação Internacional de Doenças (CID). Por fim, o modelo proposto pela Dataprev precisa ser aprimorado, para que as futuras publicações consigam abranger uma maior gama de dados organizados com o máximo de semântica possível. 5.3 ACIDENTES DO TRABALHO NO TESAURO E NA TAXONOMIA DA OIT A OIT surgiu 1919, como parte do Tratado de Versalhes, que pôs fim à Primeira Guerra Mundial. Sua importância para o estudo sobre acidentes do trabalho se refere ao fato da OIT ser a responsável pela formulação e aplicação das normas internacionais do trabalho (convenções e recomendações). O Brasil está entre os membros fundadores da OIT e participa da Conferência Internacional do Trabalho desde sua primeira reunião. Entretanto, somente na década de 1950 que a OIT passou a ter uma representação no Brasil, promovendo as Normas Internacionais do Trabalho, do emprego, da melhoria das condições do trabalho e da ampliação da proteção social. (ORGANIZAÇÃO INTERNACIONAL DO TRABALHO, 2013). O tesauro da OIT está na 6ª edição, datada de 2008, e reúne mais de 4.000 termos relacionados com a área do trabalho. Cada termo possui seu equivalente nas línguas inglesa, francesa e espanhol. Os termos do tesauro são estruturados em 19 categorias principais, a saber: (1) Relações internacionais; (2) Política social, proteção social e segurança social; (3) Desenvolvimento econômico; (4) Direito, direitos humanos, governo e política; (5) Ciências sociais, cultura, humanidades e arte; (6) Educação e formação; (7) Desenvolvimento rural, agricultura, silvicultura e pesca; (8) Atividades econômicas; (9) Comércio; (10) Transportes; (11) Finanças; (12) Administração; (13) Trabalho e emprego; (14) População, relações raciais e de migração; (15) Saúde e seguridade; (16) Ciências ambientais; (17) Ciências da Terra; (18) Pesquisa e Ciência; e (19) Informação e Ciência da Informação. (ORGANIZACIÓN INTERNACIONAL DEL TRABAJO, 2011). 113 FIGURA 27 - Termos “Previdência Social” e “Acidente do trabalho” no tesauro da OIT. Fonte: Organización Internacional del Trabajo (2011) Percebe-se na figura 27, que o termo “acidente do trabalho” é subordinado ao termo “Acidente”, que é termo específico de “Segurança”. Já o termo “Previdência social” é subordinado ao termo “Proteção social”. Na versão 2.0.2 do VCGE (BRASIL, 2003), “Previdência social” e “Proteção social” não são subordinados, sendo organizados no mesmo renque, ou seja, no mesmo nível hierárquico. Observa-se ainda que, ambos os termos possuem o termo “benefício por acidente do trabalho”49 em suas relações. Sendo termo relacionado à “Acidente do trabalho” e termo específico do termo “Previdência Social”. Logo, a interligação entre previdência social e acidentes do trabalho é dada pelo benefício, do mesmo modo que o modelo aqui proposto sobre acidente do trabalho pretende trabalhar. Por sua vez, a taxonomia da OIT foi projetada pela Biblioteca da OIT como uma ferramenta para recuperação de informação no site da OIT. Assim, sua estrutura espelha o programa de trabalho da OIT e é usado por departamentos e escritórios de campo para descrever o conteúdo de suas páginas Web e fazer pesquisas no site da OIT. Os 400 termos cobertos pela taxonomia são agrupados em 25 grupos temáticos: (a) Trabalho; (b) Condições de trabalho; (c) Relações trabalhistas; (d) Direito do trabalho; (e) Proteção social; (f) Educação; (g) Desenvolvimento econômico e social; (h) Economia; (i) Finanças; (j) Setores econômicos; (k) Comércio internacional; (l) Direitos humanos; (m) Cooperação internacional; 49 Tradução livre de: “prestaciones por accidentes de trabajo”. 114 (n) Governo e administração pública; (o) Sociedade; (p) População; (q) Saúde; (r) Meio ambiente; (s) Tecnologia; (t) administração; (u) Estatísticas; (w) Recursos de informação; (x) Países e zonas; e (z) OIT. (ORGANIZACIÓN INTERNACIONAL DEL TRABAJO, 2013). A diferença entre a Taxonomia e o tesauro desenvolvidos pela OIT é a sua finalidade. Enquanto a taxonomia busca facilitar a recuperação da informação a partir da página eletrônica da OIT, o tesauro cobre uma gama maior de temas, não se limitando ao trabalho da OIT. FIGURA 28 - Termos “Previdência Social” e “Acidente do trabalho” no taxonomia da OIT. Fonte: Organización Internacional del Trabajo (2013) Nota-se na figura 28, que na taxonomia o termo “Previdência Social” continua subordinado ao termo “Proteção social”, assim como no tesauro. Entretanto, o termo “Acidente de trabalho” é subordinado ao termo “Saúde e segurança no trabalho”, que é termo específico de “Assistência Médica”, diferentemente da representação no tesauro, quando “Acidente do trabalho” estava subordinado a “Acidente”. Por ser uma taxonomia, que trabalha com hierarquias, os termos não encontram um termo em comum que faça relação entre Previdência Social e Acidente do trabalho. 115 Analisar os instrumentos de representação do conhecimento elaborados pela OIT contribuiu para notar que a relação entre Previdência Social e Acidente do Trabalho se dá através dos benefícios concedidos. Relações não encontradas no modelo preliminar proposto pela Dataprev e nem no VCGE. Entretanto, vislumbrado pelo modelo proposto nessa pesquisa. No decorrer desta seção, verificou-se que os modelos existentes não representam a estrutura e as informações contidas nos dados sobre acidentes do trabalho, de forma a lhe proporcionar uma semântica para recuperação e reutilização dos dados publicados. 116 6 EM BUSCA DE UM MODELO A PARTIR DAS DEFINIÇÕES SOBRE ACIDENTE DO TRABALHO Nesta seção, foi proposto um modelo conceitual sobre acidentes do trabalho, por meio de definições sobre acidentes do trabalho, identificar conceitos, aí existentes, e suas relações. A Teoria do Conceito elaborada por Dahlberg e seus trabalhos sobre definições já utilizavam as definições como fonte de estudo na área de representação do conhecimento. Para cumprir tal tarefa, buscou-se observar nas ontologias de fundamentação DOLCE e UFO como os eventos eram tratados. No caso da DOLCE, privilegiou-se a DUL, que é uma ontologia baseada na DOLCE, adaptada para descrição de eventos. O objetivo com isto é identificar elementos comuns sobre a descrição de eventos em ontologias de alto nível. Os elementos encontrados serviram para auxiliar na categorização dos conceitos. Acredita-se também que, o modelo E-R, de Chen, pode auxiliar na elaboração de um modelo que consiga representar o domínio sobre acidente do trabalho, podendo ser utilizado para representar os dados da Previdência Social. 6.1 ANÁLISE DAS DEFINIÇÕES ACERCA DE ACIDENTES DO TRABALHO Pretendeu-se aqui utilizar teorias e critérios já apresentados neste trabalho, para observar definições acerca de acidentes do trabalho. Desta maneira, almejou-se determinar a que categorias e quais relações existem entre as categorias contidas nas definições, buscando localizar elementos capazes de representar o domínio estudado. Acredita-se que utilizando os termos e as relações identificados nas definições, podese elaborar um modelo que represente graficamente o domínio em questão. Nas definições analisadas a seguir foi utilizada a Teoria do Conceito de DAHLBERG (1978) para classificação das definições e identificação dos termos, sendo estes palavra ou expressão que tenha sempre um único referente na realidade; os termos identificados desta maneira nas definições estão marcados com “<” e “>”. Também classificou-se os termos identificados de acordo com as categorias das ontologias Unified Foundational Ontology for perdurants (UFO-B) e da DOLCE+DnS Ultralite (DUL). E a partir disso, classificou-se os termos de acordo com o modelo de Entidade-Relacionamento, desenvolvido por Chen (1976), a fim de elaborar um diagrama Entidade-Relacionamento para o domínio estudado. A seguir, são apresentados quadros com as definições selecionadas e análises realizadas das definições de acidentes do trabalho. 117 QUADRO 1 - Análise da definição 1 sobre acidente do trabalho. Definição 1 <Acidente do trabalho>: Os <acidentes> <ocorridos> <no curso do trabalho> ou <com relação ao trabalho> que <causem> <lesões> <mortais ou não mortais>. (OIT, 2011) Classificação da definição (Dahlberg) Conceitos retirados da definição Acidente do trabalho acidentes Definição genérica no curso do trabalho com relação ao trabalho lesões ocorre causem Categoria da UFO-B Categoria da DUL Categoria Observação E-R Evento Evento E Evento Evento E Situação Situação E Categoria superior a acidente do trabalho Relaciona o participante ao evento Situação Situação E Relaciona o participante ao evento Evento Evento E Relação entre eventos. “Lesões” possui subcategorias: “Lesões mortais” e “lesões não-mortais” Relação associativa Relação causal R R Fonte: O Autor. FIGURA 29 - Proposta de diagrama ER da definição 1 sobre acidente do trabalho50. Fonte: O autor. A definição encontrada na OIT (2011) utiliza de forma clara o acidente do trabalho como tipo de acidente relacionado ao trabalho. Já os seus efeitos foram reduzidas a duas espécies, os acidentes que causem lesões mortais ou não mortais. 50 Neste momento, por se tratar de um diagrama ER para identificação das entidades, relações e atributos presentes nas definições sobre acidentes do trabalho, não houve preocupação com a cardinalidade presente no diagrama. 118 QUADRO 2 - Análise da definição 2 sobre acidente do trabalho. Definição 2 Classificação da definição (Dahlberg) Conceitos retirados da definição Acidente do trabalho pelo exercício do trabalho a serviço da empresa segurado especial lesão corporal perturbação funcional ocorre provocando <Acidente do trabalho> é o que <ocorre> <pelo exercício do trabalho> <a serviço da empresa>, ou <pelo exercício do trabalho> do <segurado especial>, <provocando> <lesão corporal> (evento) ou <perturbação funcional> (evento), de caráter <temporário> (atributo) ou <permanente> (atributo). (BRASIL, 1991) Definição genérica Categoria da UFO-B Categoria da DUL Categoria E-R Evento Evento E Situação Situação E Relaciona o participante ao evento Situação Situação E Relaciona o participante ao evento Objeto Objeto / Agente Evento Evento E O objeto é quem sofre o acidente do trabalho Relação entre eventos Relação entre eventos. “Perturbação funcional” possui subcategorias: “Perturbação funcional permanente” e “Perturbação funcional temporário” Relação associativa Relação causal Evento Evento E E R R Observação Fonte: O Autor. FIGURA 30 - Proposta de diagrama ER da definição 2 sobre acidente do trabalho. Fonte: O Autor. Acidente do trabalho definido no art. 19 da Lei n. 8.213/91 (BRASIL, 1991) apresenta uma definição genérica do que é considerado acidente do trabalho para fins de assistência e previdência social brasileira. Ao se aplicar os critérios escolhidos para a análise da definição, pôde-se perceber que aparece o trabalhador (segurado especial), o contexto para que seja caracterizado como acidente do trabalho (exercício do trabalho a serviço da empresa, ou pelo exercício do trabalho), além de seus efeitos (lesão corporal ou perturbação funcional). 119 A relação entre os eventos foi marcada, principalmente, pela relação de causa. Que reflete os efeitos provocados pelo acidente do trabalho. Em comparação com a definição 1, percebe-se uma correlação de similaridade entre as entidades “pelo exercício do trabalho” e “no curso do trabalho”, além de “a serviço da empresa” e “com relação ao trabalho”. A definição 2 amplia os efeitos do acidente do trabalho, apresentando a questão da perturbação funcional, não mencionado na definição 1. Desenvolvendo melhor isto, acredita-se que as entidades apresentadas na definição 1 “lesões mortais” e “lesões não-mortais”, correspondam, respectivamente, na definição 2, à “morte” e “perturbações funcionais”. QUADRO 3 - Análise da definição 3 sobre acidente do trabalho. Definição 3 Classificação da definição (Dahlberg) Conceitos retirados da definição Acidente do trabalho pelo exercício do trabalho a serviço da empresa a serviço da empresa segurado especial lesão corporal perturbação funcional <Acidente do trabalho> é o que <ocorre> <pelo exercício do trabalho> <a serviço da empresa> ou <pelo exercício do trabalho> dos <segurados especiais>, <provocando> <lesão corporal> ou <perturbação funcional>, <permanente> ou <temporária>, que <cause> a <morte>, a <perda ou a redução da capacidade para o trabalho>. (Anuário Estatístico da Previdência Social, 2012, p. 507) Definição genérica Categoria da UFO-B Categoria da DUL Categoria E-R Evento Evento E Situação Situação E Relaciona o participante ao evento Situação Situação E Relaciona o participante ao evento Objeto E Evento Objeto / Agente Evento O objeto é quem sofre o acidente do trabalho Relação entre eventos Evento Evento E morte Evento Evento E redução da capacidade para o Evento Evento E E Observação Relação entre eventos. “Perturbação funcional” possui subcategorias: “Perturbação funcional permanente” e “Perturbação funcional temporário” Relação causal entre eventos, “lesão corporal” e “morte” Relação causal entre eventos, “Perturbação funcional” e “redução da capacidade para o trabalho” 120 trabalho perda da capacidade para o trabalho ocorre provocando cause Evento Evento E Relação causal entre eventos, “Perturbação funcional” e “perda da capacidade para o trabalho” R R R Relação associativa Relação causal Relação causal Fonte: O Autor. FIGURA 31 - Proposta de diagrama ER da definição 3 sobre acidente do trabalho. Fonte: O Autor. A definição encontrada no Anuário Estatístico da Previdência Social (2012, p. 507) não difere muito da encontrada na Lei n. 8.213/91 (BRASIL, 1991). A principal diferença é o acréscimo dos efeitos do acidente do trabalho (a perda ou a redução da capacidade para o trabalho). Na figura 31, foi representado como os termos foram apresentados na terceira definição analisada. No entanto, adiante será verificada a relação entre as entidades “Perturbação funcional permanente” e “Perda da capacidade para o trabalho” e também “Perturbação funcional temporária” e “Redução da capacidade para o trabalho”. QUADRO 4 - Análise da definição 4 sobre acidente do trabalho. Definição 4 Classificação <Acidente do trabalho>: Seu conceito legal é encontrado no <art. 19 da Lei n. 8.213/91>. É o que <ocorre> <pelo exercício do trabalho> <a serviço da empresa> ou <pelo exercício do trabalho> aos <segurados empregados>, <trabalhadores avulsos> e <segurados especiais>. <É o> <acidente> que <acarreta> <lesão corporal> ou <perturbação funcional> capaz de <gerar> <morte>, a <perda ou a redução>, <permanente ou temporária>, da <capacidade laborativa>. O <acidente do trabalho> <é classificado> em <acidente típico>, <de trajeto> ou <atípico>, <doença profissional (ergopatia)> ou <doença do trabalho (mesopatia)>. Os elementos para a existência do acidente do trabalho são: nexo causal (comprovado ou presumido) e lesividade (ou dano/atingimento à capacidade laborativa)”. (HORVATH JÚNIOR, 2009, p. 6) Definição genérica 121 da definição (Dahlberg) Conceitos retirados da definição Acidente do trabalho art. 19 da Lei n. 8.213/91 Categoria da UFO-B Categoria da DUL Categoria E-R Observação Evento Evento E Objeto E Documento regulamenta o acidente do trabalho E Relaciona o participante ao evento pelo exercício do trabalho a serviço da empresa segurados empregados trabalhadores avulsos segurados especiais acidente Situação Objeto / Objeto social Situação Situação Situação E Relaciona o participante ao evento Objeto E Evento Objeto / Agente Objeto / Agente Objeto / Agente Evento lesão corporal perturbação funcional Evento Evento E O objeto é quem sofre o acidente do trabalho O objeto é quem sofre o acidente do trabalho O objeto é quem sofre o acidente do trabalho Categoria superior a acidente do trabalho Relação entre eventos Evento Evento E capacidade laborativa acidente típico acidente atípico Acidente de trajeto doença profissional doença do trabalho ocorre provocando Éo Acarreta Gerar É classificado Fonte: O autor. Objeto Objeto E E E A Relação entre eventos. “Perturbação funcional” possui subcategorias: “Perturbação funcional permanente” e “Perturbação funcional temporário” Atributo do trabalhador Evento Evento E Tipos de acidentes do trabalho Evento Evento E Tipos de acidentes do trabalho Evento Evento E Tipos de acidentes do trabalho Evento Evento E Sinônimo: ergopatia Evento Evento E Sinônimo: mesopatia R R R R R R Relação associativa Relação causal Relação gênero/espécie Relação causal Relação causal Relação gênero/espécie 122 FIGURA 32 - Proposta de diagrama ER da definição 4 sobre acidente do trabalho. Fonte: O Autor. A única obra de referência especializada em Previdência Social, que foi localizada, foi a que apresentou a definição mais complexa sobre acidente do trabalho, pois apresenta o documento que o regulamenta, seu paciente, ou seja, o trabalhador, especificando-os em: segurados empregados, trabalhadores avulsos e segurados especiais. Essa definição mostrou ainda o contexto para que se caracterize como acidente do trabalho, seus efeitos, além de sua classificação em: acidente do trabalho típico, acidente do trabalho atípico e acidente do trabalho de trajeto. Ademais, foi definição que se localizou um atributo de forma clara. O atributo dos trabalhadores, “capacidade laborativa”, foi apresentado na definição como característica do trabalhador atingida pela perturbação funcional. Outro atributo aparece na entidade “Legislação”, especificada pelo atributo “Art. 19 da Lei n. 8.213/91”. Na parte final da definição aparecem os termos “nexo causal” e “lesividade”. Estes não foram incluídos no quadro de análise, por serem considerados repetitivos. “Nexo causal” corresponde à relação de causa do acidente do trabalho e “lesividade” às lesões. A classificação da tipologia de Dahlberg auxiliou na identificação das definições. Ao se trabalhar com definições gerais, acredita-se que as ontologias de fundamentação tenham sido uma escolha apropriada. Apesar do acidente do trabalho ser um evento, não se trabalhou com eventos específicos e sim com uma visão geral. Diante do apresentado até aqui e utilizando a proposta de Campos (2010), na qual a autora sugere um padrão para enunciados definitórios que atendam as especificidades de cada domínio, propõe-se, para fins de estudo nesta pesquisa, uma definição para acidente do trabalho: 123 Acidente do trabalho: acidente sofrido pelos segurados empregados, trabalhadores avulsos e segurados especiais no exercício do trabalho a serviço da empresa, que cause lesão corporal ou perturbação funcional, capaz de gerar morte, a perda ou a redução, permanente ou temporária, da capacidade laborativa, regulamentado por art. 19 da Lei n. 8.213/91. Classificados em acidente típico, acidente de trajeto e acidente atípico, que cause doença profissional ou doença do trabalho. Com base nesta definição, pôde-se elaborar um modelo unificado com as características encontradas nas outras definições estudadas sobre acidente do trabalho. QUADRO 5 - Análise da definição 5 sobre acidente do trabalho. Definição 5 Classificação da definição (Dahlberg) Conceitos retirados da definição Acidente do trabalho acidente segurados empregados trabalhadores avulsos segurados especiais pelo exercício do trabalho a serviço da empresa lesão corporal perturbação funcional morte <Acidente do trabalho>: <acidente> <sofrido> pelos <segurados empregados>, <trabalhadores avulsos> e <segurados especiais> <no exercício do trabalho> <a serviço da empresa>, que <cause> <lesão corporal> ou <perturbação funcional>, capaz de <gerar> <morte>, <perda> ou a <redução>, <permanente> ou <temporária>, da <capacidade laborativa>, <regulamentado> por <art. 19 da Lei n. 8.213/91>. <Classificados> em <acidente típico>, <acidente de trajeto> e <acidente atípico>, que <cause> <doença profissional> ou <doença do trabalho>. (O Autor) Definição genérica Categoria da UFO-B Categoria da DUL Categoria E-R Evento Evento E Evento Evento E Objeto E Situação Objeto / Agente Objeto / Agente Objeto / Agente Situação E Categoria superior a acidente do trabalho O objeto é quem sofre o acidente do trabalho O objeto é quem sofre o acidente do trabalho O objeto é quem sofre o acidente do trabalho Relaciona o participante ao evento Situação Situação E Relaciona o participante ao evento Evento Evento Evento Evento E E Relação entre eventos Relação entre eventos Evento Evento E Relação causal entre eventos: “lesão Objeto Objeto E E Observação 124 redução da capacidade para o trabalho perda da capacidade para o trabalho Evento Evento E Evento Evento E art. 19 da Lei n. 8.213/91 Objeto Objeto / Objeto social E capacidade laborativa acidente típico acidente atípico acidente de trajeto doença profissional doença do trabalho sofrido Cause gerar regulamentado classificados corporal” e “morte” Relação causal entre eventos: “Perturbação funcional” e “redução da capacidade para o trabalho” Relação causal entre eventos: “Perturbação funcional” e “perda da capacidade para o trabalho”. Que possui subcategorias: “Incapacidade permanente da capacidade para o trabalho” ou “Incapacidade temporária da capacidade para o trabalho” Documento regulamenta o acidente do trabalho A Atributo do trabalhador Evento Evento Evento Evento E E Tipos de acidentes do trabalho Tipos de acidentes do trabalho Evento Evento E Tipos de acidentes do trabalho Evento Evento E Sinônimo: ergopatia Evento Evento E Sinônimo: mesopatia R R R R R Relação associativa Relação causal Relação causal Relação associativa Relação gênero/espécie Fonte: O autor. FIGURA 33 - Proposta de diagrama ER da definição 5 sobre acidente do trabalho. Fonte: O Autor. 125 Percebem-se algumas mudanças em relação aos outros modelos apresentados anteriormente nesta seção. Realizou-se um ajuste terminológico nos termos “Redução da capacidade para o trabalho”, “Perda da capacidade para o trabalho”, “Incapacidade temporária da capacidade para o trabalho” e “Incapacidade permanente da capacidade para o trabalho”. Nesses termos a expressão “para o trabalho”, foi substituída por “laborativa”. A alteração foi para que a relação entre esta entidade e o atributo “Capacidade laborativa” dos trabalhadores ficasse clara. Já na definição 1 foi utilizado o termo “lesões mortais”, porém nas definições 3 e 4 foi empregado o termo “morte”. Ambas, se referem às lesões que levaram a óbito. Seguindo a mesma lógica do parágrafo anterior, optou-se pelo termo “morte”, por ser a mais encontrada nas definições. Nas figuras 30, 31 e 32, as características “temporário” e permanente”, eram atribuídas à “Perturbação funcional”, formando as subcategorias “Perturbação funcional temporária” e “Perturbação funcional permanente”. No entanto, esta questão de temporalidade, está ligada a “Perda da capacidade laborativa”, efeito da “Perturbação funcional”. Em outras palavras, o que é temporário é a “Perda da capacidade laborativa”, que leva ao empregado a interromper suas atividades profissionais. De acordo com o Anuário Estatístico de acidente do Trabalho (2012), a incapacidade temporária da capacidade laborativa é “a interrupção do exercício laboral durante o período de tratamento psicofísico-social por ocasião do acidente do trabalho” (ANUÁRIO..., 2013). E a incapacidade permanente da capacidade laborativa referese aos trabalhadores “que ficaram permanentemente incapacitados para o exercício laboral” (ANUÁRIO..., 2013). Assim sendo, “Incapacidade permanente da capacidade laborativa” e “Incapacidade temporária da capacidade laborativa” foram atribuídas à “Perda da capacidade laborativa”, e não à “Perturbação funcional”. Cabe esclarecer que desde o primeiro modelo aqui apresentado, os verbos utilizados para representar as relações foram alterados por outros com maior simplicidade ou com o objetivo de uniformizar os tipos de relações. QUADRO 6 - Relações utilizadas nas representações. Relações utilizadas nas representações Regulamentado_por; Sofre; Ocorrem_no_contexto Causa; Relação associativa É_um; Do_tipo Relação gênero/espécie Fonte: O autor. Tipo de relação Relação causal Relações encontradas nas definições e substituídas Regulamentado; Sofrido; Ocorrem Causem; Provocando; Cause; Acarreta; Gera. É; Classificados 126 Mesmo com um modelo conceitual sobre acidente do trabalho proposto, sentiu-se falta da inclusão de outros elementos, não apresentados nas definições estudadas. No âmbito na Previdência Social, o acidente do trabalho é utilizado para provimento de benefícios aos trabalhadores acidentados. Esta relação ficou clara, quando se observou outros modelos de representação sobre acidentes do trabalho na seção 5 desta pesquisa. A relação entre acidente do trabalho e Previdência ficou clara tanto no tesauro, quanto na taxonomia da OIT. Por esta razão, buscou-se as entidades complementares para a elaboração do modelo proposto. 6.2 MODELO CONCEITUAL SOBRE ACIDENTE DO TRABALHO ASSOCIADO AOS DADOS DA PREVIDÊNCIA SOCIAL Conforme observado, o modelo elaborado cobre a área de acidente do trabalho. Entretanto, o acidente do trabalho e seus efeitos para o trabalhador e a documentação produzida com o evento implicam diretamente no fazer da Previdência Social, principalmente no que tange a questão da assistência social. Alguns benefícios e atividades concedidos pela Previdência Social provêm justamente da ocorrência de acidentes do trabalho. A importância do acidente do trabalho para a Previdência Social é comprovada pelas publicações exclusivas que são produzidas por este Ministério governamental: o Anuário Estatístico de Acidentes do Trabalho (AEAT) e um capítulo dedicado ao acidente do trabalho no Anuário Estatístico da Previdência Social (AEPS). Cabe interligar o modelo proposto sobre acidente do trabalho, mostrado anteriormente, aos dados da Previdência Social já publicados e outros que se pretende publicar. Ao analisar os dados publicados se percebe que, o Ministério da Previdência Social ao mesmo tempo em que se preocupa em tornar esses dados públicos, também não se esquece de preservar aspectos legais envolvendo privacidade e confidencialidade de determinadas informações. Por esta razão, os dados são os mais gerais possíveis para a não identificação individual dos envolvidos nos eventos. Por exemplo, para os trabalhadores que sofreram os acidentes são classificados por sexo e não por algum número de cadastro que o identifique. Percebe-se que os dados publicados no portal dados.gov.br, coletados do Anuário estatístico sobre acidente do trabalho, e também na edição impressa do Anuário estatístico da Previdência Social, são organizados de forma a possibilitar quantificação dos acidentes do trabalho ocorridos no Brasil, contabilizados anualmente e associados a códigos que agregam valores a estes dados publicados, como: Classificação Internacional de Doenças (CID); 127 Classificação Brasileira de Ocupações (CBO) e Classificação Nacional de atividades Econômicas (CNAE). Também são mensurados os benefícios concedidos, separados por tipo, como data e localização identificadas. Desta forma, coletaram-se os termos do Anuário estatístico de acidente do trabalho (2012) e Anuário estatístico da Previdência Social (2011), os termos que associassem os dados publicados ao acidente do trabalho. Os tempos selecionados estão descritos no quadro abaixo: QUADRO 7 - Termos sobre acidente do trabalho aliados aos dados da Previdência Social. Fontes Conceitos Acidente do trabalho com Cat Acidente do trabalho sem CAT Ano Aposentadoria por invalidez Assistência médica Auxílio doença por acidente do trabalho Auxílioacidente por acidente do trabalho CBO Anuário estatístico de acidente do trabalho (2013) Anuário estatístico da Previdência Social (2011) Categoria Categoria Categoria Observação da UFO-B da DUL E-R Objeto Objeto / E Acidente registrado (documento) Objeto social Objeto Objeto / E Acidente não registrado Objeto social Intervalo A Atributo da entidade “Acidente do temporal trabalho”. Ano que ocorreu o acidente do trabalho Objeto Objeto / E Benefício concedido ao trabalhador Objeto em caso de comprovação de perda social permanente da capacidade laborativa Objeto Objeto / E Benefício concedido ao trabalhador Objeto em caso de lesão corporal social Objeto Objeto / E Benefício concedido ao trabalhador Objeto em caso de interrupção por mais de social 15 dias das atividades do trabalho em função da perda da capacidade laborativa Objeto Objeto / E Benefício concedido ao trabalhador Objeto em caso de redução da capacidade do social trabalho A CID A CNAE A Incapacidade permanente parcial Evento Evento E Atributo que identifica a ocupação do trabalhador Atributo dos acidentes, que identifica a doença/lesão causada Atributo que identifica a atividade econômica do empregador Sequela definitiva que implique em redução da capacidade laboral do trabalhador 128 Incapacidade permanente total Incapacidade temporária por mais de 15 dias Incapacidade temporária por menos de 15 dias Mês Evento Evento E Evento Evento E Evento Evento E Interrupção por até 15 dias das atividades do trabalho em função da perda da capacidade laborativa A Atributo da entidade “Acidente do trabalho”. Mês que ocorreu o acidente do trabalho Atributo da entidade “Acidente do trabalho”. Cidade em que ocorreu o acidente do trabalho Atributo dos acidentes, que identifica a parte do corpo do trabalhador lesionado em função do acidente Benefício concedido ao dependente do trabalhador em caso de sua morte Intervalo temporal Município Lugar Parte do corpo atingida Pensão por morte Região geográfica A A Objeto Objeto / Objeto social Lugar Sexo E A A UF Lugar A Incapacidade permanente e total para o exercício de qualquer atividade laborativa Interrupção por mais de 15 dias das atividades do trabalho em função da perda da capacidade laborativa Atributo da entidade “Acidente do trabalho”. Região geográfica brasileira na qual ocorreu o acidente do trabalho Atributo que identifica o sexo do trabalhador Atributo da entidade “Acidente do trabalho”. Estado brasileiro no qual ocorreu o acidente do trabalho Fonte: O autor. Na figura 34, pode ser observado o mesmo modelo realizado na subseção anterior, acrescido de atributos e de outras entidades e relações presentes nos dados da Previdência Social, publicados pela Dataprev, e também presentes na seção IV do Anuário estatístico da Previdência Social, sobre acidente do trabalho. 129 FIGURA 34 - Proposta de diagrama ER sobre acidente do trabalho aliados aos dados da Previdência Social Fonte: O Autor. Tanto no Anuário estatístico de acidente do trabalho, quanto no Anuário estatístico da Previdência Social, os dados, em sua maioria, são classificados principalmente por duas características, tempo e local. O tempo é subdividido em mês e ano, já o espaço em município, Unidades Federativas do Brasil (UF) e regiões geográficas do Brasil. Assim, a entidade “Acidente do trabalho” recebeu os atributos de mês, ano, município, UF e região geográfica. Para a Previdência Social é de imensa importância a Comunicação de Acidentes do Trabalho (CAT) ao Instituto Nacional de Seguro Social (INSS). De acordo com o art. 22 da Lei n. 8.213/91, é obrigação legal da empresa comunicar ao INSS a ocorrência de acidente do trabalho. No entanto alguns acidentes não são cadastrados no INSS, gerando o indicador Acidentes do trabalho sem CAT. Por esta razão foi acrescida à entidade “Acidente do trabalho” a relação de “registrado”, associada às entidades “Acidente do trabalho com CAT” e “Acidente do trabalho sem CAT”. As entidades “a serviço da empresa” e “no exercício do trabalho” tratam sobre o contexto em que o trabalhador este envolvido para que se caracterize um acidente do trabalho. 130 É neste contexto que o empregador (empresa) aparece. Conhecer o ramo econômico em que a empresa se classifica, facilita conhecer quais áreas são mais sujeitas a acidentes do trabalho. Assim, a “CNAE” aparece como atributo das entidades em questão. Nas entidades dos tipos de trabalhadores que sofreram algum tipo de acidente, a saber: “Segurado especial”; “Segurado empregado”; e “Trabalhador avulso” foram incluídos os atributos “sexo” e “CBO”. A Previdência Social distingue os trabalhadores apenas por sexo, para que não acha possibilidade de sua identificação. A CBO identifica as ocupações dos trabalhadores e é utilizada para agrupar e/ou mostrar as ocupações mais perigosas, que necessitam de um cuidado específico. Os atributos “CID” e “parte do corpo atingida” são aplicados aos tipos de acidentes do trabalho: “acidente do trabalho típico”, “Acidente do trabalho de trajeto” e “Acidente do trabalho atípico”, neste último, foram atribuídos aos seus efeitos, que são as doenças: “Doença profissional” e “Doença do trabalho”. O “CID” e “parte do corpo atingida” são utilizados para qualificar o acidente ou seu efeito, no caso do acidente atípico. São estes atributos que possibilitarão associar o acidente a alguma doença ou sequela psicofísico-social. Cabe esclarecer que “Doença do trabalho” se refere diretamente ao ambiente laboral, ou seja, aos riscos ambientais que o trabalhador é exposto e o nexo causal não é presumido. Já a “Doença profissional” é resultante da execução das tarefas ou atividades profissionais, os trabalhadores que exercem atividades rotineiras e repetitivas são candidatos a desenvolverem algum tipo de lesão. Neste caso, o nexo causal é presumido. (HORVATH JÚNIOR, 2009, p. 73). A entidade “Morte” foi ligada ao benefício “Pensão por morte”, como seu efeito. E a entidade “Redução da capacidade laborativa” recebeu a ligação com a entidade “Auxílioacidente do trabalho”, que é outro benefício decorrente de tal consequência da lesão. A “Redução da capacidade laborativa” é a diminuição da capacidade laborativa decorrente das sequelas irreversíveis, mesmo estando a vítima capacitada para exercer alguma atividade laboral. A entidade “Perda da capacidade laborativa” foi a que apresentou maior quantidade de entidades relacionadas à Previdência Social. A entidade “Perda da capacidade do trabalho” pode ser classificada em “Incapacidade temporária da capacidade laborativa” e “Incapacidade permanente da capacidade laborativa”. A entidade “Incapacidade temporária da capacidade laborativa” pode ser dividida em “Incapacidade temporária por menos de 15 dias” ou “Incapacidade temporária por mais de 15 dias”, que é relacionado ao “Auxílio doença por acidente do trabalho”. Após um período de tratamento, se o trabalhador for diagnosticado com 131 alguma doença ou seqüela que implique na perda total e permanente de sua capacidade laborativa, este trabalhador é aposentado por invalidez. Já a entidade “Incapacidade permanente da capacidade laborativa” pode ser classificada em “Incapacidade permanente parcial” e “Incapacidade permanente total”, esta última tem como efeito o benefício da “Aposentadoria por invalidez”. Por fim, apresenta-se um modelo E-R sobre acidente do trabalho associado aos dados publicados pela Previdência Social. Espera-se que este modelo possa ser utilizado para atribuir semântica aos dados publicados, de forma a contribuir para sua recuperação e, principalmente, seu reuso. 132 7 ELABORAÇÃO E REUSO DE VOCABULÁRIOS: A QUESTÃO SOBRE ACIDENTE DO TRABALHO Ao selecionar os dados a serem representados em RDF, verificou-se que, a partir do modelo proposto, seria necessária a elaboração de um vocabulário específico para descrever os conceitos sobre acidentes do trabalho como forma de enriquecer a representação dos dados da Previdência em RDF. Fato este justificado na seção 5, na qual foram analisados instrumentos de representação da informação que abordassem a área de acidente do trabalho, não encontrando nenhum instrumento que pudesse ser reutilizado. Desta forma, baseados no modelo conceitual proposto na seção anterior e apresentado com base no Europeana Data Model (EDM), será proposto um vocabulário sobre acidente do trabalho, buscando sempre que possível a reutilização de outros vocabulários para descrição dos dados. Dentre muitos vocabulários existentes, o EDM vem sendo utilizado tanto para descrição de dados na Web, quanto como referência para elaboração de novos vocabulários. A Europeana oferece acesso a conteúdos digitais provenientes de bibliotecas, museus, arquivos e coleções áudio-visuais de toda a Europa. (FREIRE; CHARLES; CHAMBERS, 2012, p. 1). De acordo com esses autores, o Europeana Data Model consiste numa infraestrutura aberta para representação de dados, que se baseia na web semântica, e que permite representar as necessidades de informação dos vários domínios das organizações. No documento Definition of the Europeana Data Model elements (2012) é definido que a EDM é a especificação formal das classes e propriedades que poderiam ser utilizados na Europeana. 7.1 SELEÇÃO DOS DADOS PUBLICADOS PELA DATAPREV Conforme mostrado na introdução deste trabalho, a Dataprev publicou uma primeira parte dos dados sobre acidentes do trabalho. Foram selecionados dados estatísticos provenientes do Anuário Estatístico de Acidentes do Trabalho. Esta publicação ficou restrita aos dados da Seção I subseção D do referido Anuário, conteúdo que trata de Comunicação de Acidente de Trabalho (CAT), suas consequências, por localização geográfica das ocorrências (município) e seus respectivos quantitativos. Assim, foram descritos os seguintes dados: 133 1. Ano de ocorrência do acidente do trabalho; 2. Dados sobre o município, onde o acidente do trabalho ocorreu. Estes dados incluem as seguintes informações: I. Código da cidade, fornecido pelo IBGE; II. Nome do Município; III. Unidade da Federação, a qual pertence o município. 3. Quantidades de acidentes. Divididos por tipo, causas e registro: I. Acidente do Trabalho do tipo Típico; II. Acidente do Trabalho do tipo Trajeto; III. Acidente do Trabalho causou Doença do Trabalho; IV. Acidente do Trabalho causou Morte; V. Acidente do Trabalho registrado sem CAT. As informações sobre os acidentes do trabalho típico, de trajeto, que causaram doença do trabalho ou morte foram o conjunto de dados sobre acidentes do trabalho com Comunicação de Acidente do Trabalho (CAT). Estes dados são importantes para a Previdência Social brasileira, pois são neles que surge a origem dos benefícios de natureza acidentária concedidos pelo INSS. Buscaram-se os dados acima descritos no diagrama ER proposto na figura 34. Todavia, como o modelo proposto pretende atender a um conjunto de dados maiores, ele apresenta classes e subclasses, além de relações não necessárias, neste momento, para descrição dos dados propostos a serem descritos em RDF. Diante deste fato, decidiu-se por recortar o modelo da figura 34, sintetizando sua representação. Abaixo, na figura 35, pode-se observar como ficou o diagrama ER apenas dos dados já publicados pela Dataprev. 134 FIGURA 35 - Proposta de diagrama ER dos dados publicados pela Dataprev51. Fonte: O Autor. Os dados são disponibilizados nos formatos XML, JSON ou CSV. Decidiu-se trabalhar com o formato XML, por ser o recomendado pela W3C para ser utilizado junto ao RDF no aperfeiçoamento de tecnologias da Web Semântica. FIGURA 36 - XML de acidentes do trabalho ocorridos na cidade do Rio de Janeiro. <acidentes_de_trabalho> <registro> <municipio cod_ibge="330000" uf="RJ">RIO DE JANEIRO</municipio> <quantidade> <sem_cat>9</sem_cat> <com_cat> <tipicos>17</tipicos> <trajeto>17</trajeto> <doenca>0</doenca> </com_cat> <obitos>0</obitos> </quantidade> </registro> </acidentes_de_trabalho> Fonte: Dataprev (2012) Conforme observado na figura 36, foram selecionados os dados referentes a acidente do trabalho ocorridas no ano de 2009, último ano disponibilizado. Dentre os dados estatísticos de todas as cidades, optou-se pelos dados de apenas uma cidade, já que o processo seria o mesmo para todas. A cidade escolhida foi o Rio de Janeiro. 51 Para fim de aplicação do modelo, foi inserido a cardinalidade apenas no diagrama da figura 35. 135 7.2 ELABORAÇÃO DO VOCABULÁRIO SOBRE ACIDENTE DO TRABALHO Seguindo o diagrama ER (figura 35), foram criados esquemas para que os dados preservem e demonstrem a semântica original das informações contidas. Buscou-se construir um vocabulário a ser usado para dar significado às triplas RFD para publicação de dados governamentais abertos, utilizando os moldes dos vocabulários encontrados no portal do no Linked Open Vocabularies (LOV)52. A partir das classes definidas, realizou-se uma pesquisa no LOV, com o objetivo de verificar se haveria alguma classe, já existente em ontologias (vocabulários), que representassem as classes sobre acidente do trabalho. Tal ação visava fazer o reuso de alguns vocabulários, já existentes e consolidados, para a interligação dos dados, atendendo um dos princípios do Linked Data. Além de fornecer um formalismo semântico maior a proposta aqui apresentada. Entretanto, o resultado foi negativo, não encontrando nenhuma classe capaz de atender aos significados no domínio aqui estudado. Utilizando o modelo do EDM foi criado um quadro com as informações para elaboração de um vocabulário a ser utilizado neste trabalho. Antevendo, como todo vocabulário precisa possuir um URI para suas classes, além da necessidade de descrição destas classes em RDF, foi criado um URI fictício, utilizado apenas para exemplificação neste trabalho. Para sua elaboração foi gerado um recurso eletrônico (“http://example.org/”) e após a barra deste endereço a classe a ser descrita. Foi dado o prefixo “acitra” para representar o namespace do Vocabulário de Acidente do Trabalho, também em caráter de experimentação. Cabe lembrar, que se trata de um recorte do modelo principal proposto. Por essa razão, apenas alguns elementos serão descritos no vocabulário neste momento. Para uma organização que facilite o entendimento, o vocabulário será dividido em classes; propriedades e atributos. 52 Disponível em: <http://lov.okfn.org/dataset/lov/>. Acesso em: 6 jul. 2014. LOV foi criado para ser um compilador de ontologias (vocabulários). Seu objetivo é fornecer acesso a diversos vocabulários, tornando explícitas as representações entre as entidades (objetos). Fornecendo, ainda, métricas sobre como os vocabulários são usados na nuvem de Linked data, ajudando a melhorar a sua compreensão, visibilidade e reusabilidade. (VANDENBUSSCHE, [2014?]). 136 QUADRO 8 - Classe do objeto. Classe acitra:acidenteTrabalho53 Namespace Acitra URI http://example.org/acidenteTrabalho Label acidenteTrabalho Definição Acidente que ocorre pelo exercício do trabalho a serviço da empresa ou pelo exercício do trabalho dos segurados especiais, provocando lesão corporal ou perturbação Classe acitra:acidenteTrabalhoTípico Namespace Acitra URI http://example.org/acidenteTrabalhoTípico Label acidenteTrabalhoTípico Definição Acidente decorrente da característica da atividade profissional de risco desempenhada pelo acidentado Classe acitra:acidenteTrabalhoTrajeto Namespace Acitra URI http://example.org/acidenteTrabalhoTrajeto Label acidenteTrabalhoTrajeto Definição Acidente que cause a morte ou produza lesões corporais e ocorra no percurso direto entre o lugar de trabalho e a residência, o lugar no que o trabalhador geralmente almoça ou recebe sua remuneração Classe acitra:doençaTrabalho Namespace Acitra URI http://example.org/doençaTrabalho Label doençaTrabalho Definição Doença relacionada diretamente ao ambiente laboral, ou seja, aos riscos ambientais ao que o trabalhador é exposto Classe acitra:morte Namespace Acitra URI http://example.org/morte Label Morte 53 Para construção nos nomes das classes foram retiradas as preposições entre os substantivos. Permaneceram apenas as que acarretassem alteração de sentido entre as classes, como no exemplo: “acidenteTrabalhoComCAT” e “acidenteTrabalhoSemCAT”. 137 Definição Corresponde a quantidade de segurados que faleceram em função do acidente do trabalho. Classe acitra:acidenteTrabalhoSemCAT Namespace Acitra URI http://example.org/acidenteTrabalhoSemCAT Label acidenteTrabalhoSemCAT Definição Acidente cuja Comunicação de Acidentes do Trabalho (CAT) não foi cadastrada no INSS. Classe acitra:acidenteTrabalhoComCAT Namespace Acitra URI http://example.org/acidenteTrabalhoComCAT Label acidenteTrabalhoComCAT Definição Acidente cuja Comunicação de Acidentes do Trabalho (CAT) foi cadastrada no INSS. Fonte: O Autor. Um segundo passo, foi buscar, também no LOV, ontologias ou vocabulários capazes de representar as relações mostradas no diagrama ER (figura 35). Pesquisou-se por propriedades do objeto (owl:ObjectProperty) com significados iguais ao que se propunha no modelo ER. Foram encontrados resultados satisfatórios, que evitou a criação ou utilização de propriedades do objeto ficcionais. Assim, os termos utilizados para representarem as relações foram substituídos por termos de vocabulários já existentes. O termo “Do_Tipo” foi substituído pelo termo “Type”, do vocabulário Dublin Core. Já o termo “Causa” foi substituído pelo termo “Cause”, Schema.Org. E, o termo “hasDocumentation”, do vocabulário Poder Vocabulary substituiu o termo “Registrado”. Desta forma, abaixo são descritas as propriedades do objeto. QUADRO 9 - Propriedades do objeto. Propriedade dc:type Namespace dc/elements URI http://purl.org/dc/elements/1.1/type Label Type 138 Definição Termos que descrevem categorias gerais, funções, gêneros ou níveis de agregação de conteúdo54. Propriedade dc:cause Namespace schema.org URI http://schema.org/cause Label Cause Definição Uma causa subjacente. Mais especificamente, um dos agente(s) é responsável pelo processo fisiopatológico que, eventualmente, resulta na ocorrência55. Propriedade poder:hasDocumentation Namespace Poder URI http://dev.poderopedia.com/vocb/hasDocumentation Label hasDocumentation Definição Associa um agente com a documentação relacionada56. Fonte: O Autor Os últimos elementos do diagrama ER (figura 35) a serem descrito no vocabulário são os atributos. No caso apresentado, a única classe a apresentar atributos é a classe “Acidente do trabalho”. Assim como ocorreu com as propriedades do objeto, sendo pesquisado no LOV os “Objectdata”, que correspondessem aos atributos selecionados nesta pesquisa. Assim, também foram encontrados vocabulários possíveis de serem reutilizados, não sendo necessária a sua criação. O atributo “ano” foi substituído pelo atributo “Date”, do vocabulário Dublin Core. O “Município” foi substituído por “City”, do vocabulário Place, e deste mesmo vocabulário, “State” substituiu “UF”. A seguir, pode se verificar estes atributos e sua descrição. QUADRO 10 - Atributos. Elemento dc:date Namespace dc/elements URI http://purl.org/dc/elements/1.1/date 54 Pertence ao vocabulário DC – Dublin Core Metadata Set. Seus elementos são amplos e genéricos, utilizáveis para descrever uma ampla gama de recursos. (DUBLIN CORE METADATA INITIATIVE, 2012) 55 Proveniente do vocabulário Schema.org, utilizado nos motores de busca do alguns motores de busca na Web: Bing, Google, Yahoo! e Yandex, que dependem de marcação schema.org para melhorar a exibição de resultados de pesquisa. (SCHEMA.ORG, [2014?]). 56 Retirado do Poder Vocabulary, que é um vocabulário utilizado para expressar informações acerca de pessoas e suas relações com organizações e empresas. (PODER, [2014?]). 139 Label Date Definição Representa o ano em que ocorreu o acidente do trabalho. Domínio acitra:acidenteTrabalho Range xsd57:datetime Elemento places:City Namespace Places URI http://purl.org/ontology/places#City Label City Definição Domínio Representa o município (cidade brasileira) na qual ocorreu o acidente do trabalho. acitra:acidenteTrabalho Range name:nome58. Elemento places:State Namespace Places URI http://purl.org/ontology/places#State Label State Definição Domínio Representa a Unidade Federativa (Estado brasileiro) na qual ocorreu o acidente do trabalho. acitra:acidenteTrabalho Range name:uf Fonte: O Autor Assim sendo, consegue-se mostrar, com os exemplos acima, que é possível se chegar a um vocabulário partindo de um modelo conceitual. Espera-se, no futuro, transformar todo o modelo conceitual proposto em um vocabulário consistente e formalizado de forma a conseguir sua publicação, visando sua reutilização. 8 DESCRIÇÃO DOS DADOS SOBRE ACIDENTE DO TRABALHO EM RDF 57 XSD (XML Schema Definition) é um arquivo que contém definições na linguagem XML Schema e é utilizado para descreve a estrutura de um documento XML. As declarações de atributos podem ser de variadas formas, as principais são: “name”: especifica o nome do atributo; “type”: especifica o tipo de dados do atributo; e “use”: especifica a utilização do atributo (requerido, opcional ou proibido). (SPERBERG-MCQUEEN; THOMPSON, 2010). 58 Retirado de Places Ontology, vocabulário para descrever os locais de interesse geográfico. (PLACES..., [2014?]. 140 O objetivo desta seção é conseguir utilizar o diagrama E-R proposto para descrição dos dados sobre acidentes do trabalho, no âmbito da Previdência Social brasileira, publicados pela Dataprev. Para tal tarefa, foram selecionados os dados já publicados em XML, visto na seção 7.1, e o vocabulário elaborado a partir do modelo conceitual proposto, exposto na seção 7.2. Com a definição das classes, das relações (propriedades do objeto) e dos atributos (propriedade de dados), buscou-se a partir do diagrama ER (figura 35) estabelecer statements, que são “uma espécie de declaração de um recurso contendo um nome, uma propriedade e um valor agregado a ela” (NOLETO; BRITO, 2003, p. 114), formando a tripla RDF (sujeito, predicado e objeto), conseguindo representar a interligação entre o recurso, suas propriedades e seus valores. Apesar de se perceber algumas semelhanças entre o modelo ER e o RDF, a relação entre eles não é fácil, quando se pretende migrar de um modelo para o outro. Chen (2002) e Berners-Lee (1998) apontam semelhanças e diferenças, porém não apresentam uma metodologia para que os dois modelos possam trabalhar de forma cooperativa. Berners-Lee (1998) se perguntou se o modelo RDF seria um modelo de entidaderelacionamento. Este autor responde que sim e que não. A resposta é sim, pois o RDF serve como base para a modelagem ER, mas, a resposta também é não, porque o RDF é usado para outras finalidades, tornando-se mais geral que o modelo ER. O RDF é um modelo de entidades e relações (nós). Berners-Lee (1998) explica que o modelo RDF é basicamente uma abertura do modelo ER para se trabalhar na Web. Para este autor, o modelo ER envolve entidades, e para cada entidade, há um conjunto de relações e o modelo RDF é o mesmo pensamento. A exceção fica a cargo dos relacionamentos que são identificados, no RDF, por um URI. Para o autor citado, muitos conceitos envolvidos na modelagem ER estão diretamente direcionados ao modelo de Web Semântica. Buscou-se na literatura da área da Ciência da Computação experiências na associação do modelo ER e RDF para descrição de dados. Foram encontrados trabalhos, como dos autores Teorey, Yang e Fry (1986) e Borgida, Casanova e Laender (2009), que trabalham com tabelas para representar o modelo ER, com o objetivo de preservar a capacidade de capturar e distinguir todos os estados válidos do diagrama conceitual. Para estes autores, as tabelas funcionariam como pequenos bancos de dados lógicos, capazes de transformar ou mapear um diagrama (ou esquema) conceitual do domínio da aplicação em um esquema de modelo de dados lógicos. Diante do exposto, “o uso de um esquema conceitual, em particular os 141 diagramas de Entidade Relacionamento, como um passo preliminar para projeto de banco de dados lógico”. (BORGIDA, CASANOVA E LAENDER, 2009, p. 1646). Essa metodologia de representar o diagrama conceitual em tabelas, para se obter um esquema lógico de dados, poderia ser empregada para descrição de elementos RDF? Os pesquisadores Xu, Lee e Kim (2010) utilizam o diagrama ER para armazenar dados RDF em tabelas relacionais distintas. Os autores acreditam que com essa abordagem facilitaria a pesquisa e a atualização de quaisquer recursos em bases relacionais. Nesse mesmo artigo, Xu, Lee e Kim (2010) buscam descrever RDFS em um diagrama ER. Segundo os autores, o esquema de RDFS pode ser descrito por um diagrama ER, pois o diagrama apresenta relações de dados RDF usando dados de próprio esquema. Para alcançar este objetivo, os referidos autores converteram todas as classes de entidades e as propriedades das relações entre duas entidades para RDF/RDFS. Isto foi possível, pois criaram tabelas para os esquemas: uma tabela para armazenar as entidades (tabela de Classes) e os relacionamentos (tabela de propriedades do objeto). Rambayon (2012) ao avaliar os resultados de Xu, Lee e Kim (2010), afirma que o conhecimento trazido, pela experiência dos autores, prova o poder da modelagem ER e sua eficácia em modelagem bancos de dados. E que a correlação entidade-relacionamento e RDF aumenta a eficiência para a recuperação de informações. E conclui que, um diagrama ER, como o exibido por Xu, Lee e Kim (2010), não precisa ser utilizado apenas para o projeto conceitual, mas também para transformar elementos existentes de um banco de dados. Neste estudo, acredita-se que a mesma metodologia utilizada por Xu, Lee e Kim (2010), pode ser aplicada para ter resultados inversos, ou seja, a partir de um diagrama ER se chegar a descrições em RDF. Vale lembrar que, “o objetivo da modelagem conceitual é obter uma descrição abstrata, independente de implementação em computador, dos dados que serão armazenados no banco de dados”. (HEUSSER,1998, p. 11). Desta maneira, deve-se deixar claro que este trabalho está na fase de abstração, ou seja, certos detalhes são deliberadamente omitidos do modelo. E a escolha dos detalhes/características para omitir é feita considerando-se tanto a aplicação pretendida da abstração e também seus usuários (SMITH; SMITH, 1977, p. 105). No caso específico deste estudo, a abstração também se deve ao fato da representação dos dados sobre acidentes do trabalho ser uma experiência, na qual se verificará uma possibilidade de modelagem e aplicação do modelo nos dados. Buscou-se nas entidades e relacionamentos estudados no decorrer do trabalho, para a criação das sentenças ou triplas RDF, conforme quadro 20. 142 QUADRO 11 - Triplas de RDF propostas com base no diagrama ER Sujeito Acidente do trabalho Acidente do trabalho Acidente do trabalho Acidente do trabalho Acidente do trabalho Acidente do trabalho Predicado Do_tipo Do_tipo Causa Causa Registrado Registrado Objeto Acidente do trabalho típico Acidente do trabalho de trajeto Doença do trabalho Morte Acidente do trabalho sem CAT Acidente do trabalho com CAT Fonte: O Autor. A Web Semântica se diferencia da web tradicional por se preocupar mais com seus endereços, ou seja, tornando seus endereços permanentes, utilizando para tal tarefa os URIs. Como lembra Noleto e Brito (2003, p. 114) “todos os recursos devem estar nomeados e identificados por um URI”, isto permite a identificação dos recursos. Por esta razão, será repetida a quadro 20, mostrado acima, substituindo os termos por seus respectivos URIs (vide vocabulário proposto na seção anterior). QUADRO 12 - Triplas de RDF propostas utilizando URIs. Sujeito Predicado Objeto http://example.org/acidenteTrabalho http://purl.org/dc/elements/1.1/type http://example.org/acidenteTrabalhoTípico http://example.org/acidenteTrabalho http://example.org/acidenteTrabalho http://example.org/acidenteTrabalho http://example.org/acidenteTrabalho http://example.org/acidenteTrabalho http://purl.org/dc/elements/1.1/type http://schema.org/cause http://schema.org/cause http://dev.poderopedia.com/vocb/hasDocumentation http://dev.poderopedia.com/vocb/hasDocumentation http://example.org/acidenteTrabalhoTrajeto http://example.org/doençaTrabalho http://example.org/morte http://example.org/acidenteTrabalhoSem CAT http://example.org/acidenteTrabalhoComCAT Fonte: O Autor. Apesar da tabela 12 mostrar como ficariam as sentenças (statements) RDF, para se construir e disponibilizar os dados sobre acidentes do trabalho em RDF, faz-se necessário que estes estejam em forma textual. Seguindo as recomendações do W3C (2009), o RDF será expresso textualmente na linguagem RDF/XML, que possibilita a descrição do RDF em formato XML. 143 FIGURA 37 - Representação dos dados selecionados em RDF59 <?xml version="1.0"?> < rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns" xmlns:acid=“http://example.org/“ xmlns:dc="http://purl.org/dc/elements/1.1“ xmlns:vocb="http://dev.poderopedia.com/vocab/schema" xmlns:schema=" schema.org" xmlns:place=" http://purl.org/ontology/places#"> <RDF:DescriptionRdf:about="http://example.org/acidenteTrabalho"> <dc:date>2009</dc:date> <place:city>330000 “Rio de Janeiro”</place:city> <place:state>RJ</place:state> <acid:acidenteTrabalhoSemCAT>9</acid:/acidenteTrabalhoSemCAT> <acid:acidenteTrabalhoComCAT>34</acid:/acidenteTrabalhoComCAT> <acid:acidenteTrabalhoTípico>17</acid:acidenteTrabalhoTípico> <acid:acidenteTrabalhoTrajeto>17</acid:acidenteTrabalhoTrajeto> <acid:doençaTrabalho>0</acid:doençaTrabalho> <acid:morte>0</acid:morte> </rdf:Description> </rdf:RDF> <?Xml Version=“1.0 ”?> Fonte: O autor. Conseguindo-se aplicar as triplas RDF geradas à faixa dos dados sobre acidentes do trabalho, publicados pela Dataprev, torna-se mais fácil a representação de todo o conjunto de dados também em RDF. Basta se desenvolver uma tabela das triplas e armazená-las no banco de dados relacional, onde os dados sobre acidente do trabalho estão disponibilizados. Conclui-se que, se os dados são ofertados nos formatos XML, JSON ou CSV, eles também poderão ser disponibilizados em RDF, obtendo um nível semântico não permitido pelos outros formatos atualmente utilizados. 59 RDF validado pelo W3C RDF validation service. Disponível em: <http://www.w3.org/RDF/Validator/>. Acesso em: 28 abr. 2014. 144 9 CONSIDERAÇÕES FINAIS E EXPECTATIVAS Recentemente, no dia 23 de abril de 2014, o Senado Federal brasileiro aprovou a Lei n. 12.965, sancionada pela presidente Dilma Rousseff. Essa Lei, popularmente conhecida com Marco Civil da Internet, é a lei que regula o uso da Internet no Brasil. A Lei que entrará em vigor no final do mês de junho de 2014, trata de temas como neutralidade, privacidade, retenção de dados, impondo direitos e obrigações de responsabilidade civil aos usuários e provedores. Nota-se então, a preocupação e interferência direta do Governo na gestão dos dados, serviços e ações ocorridas no ambiente virtual. Almejando, na proposta da Lei n. 12.965, desenvolver mecanismos de governança multiparticipativa, transparente, colaborativa, buscando a participação de setores sociais: empresas, sociedade civil e comunidade acadêmica. Diante do mencionado, estudos sobre publicação de dados governamentais abertos, como o apresentado nesta dissertação, podem contribuir para que os serviços oferecidos pelo Governo sejam aproveitados de forma integrada, visando agilizar processos e estabelecer uma comunicação eficaz entre os diversos setores da sociedade. O presente estudo se propôs a oferecer uma pequena contribuição para que o Governo Eletrônico, em destaque o portal dados.gov.br, tenha uma alternativa para publicação de dados governamentais abertos, neste caso dados da Previdência Social. Com vista, a colaborar para a publicidade e disseminação de dados e informações públicos, de forma aberta e estruturada. Para que no futuro, a sociedade possa reutilizar esses dados, utilizando tecnologias, padrões e formatos abertos e livres, promovendo a inovação e a difusão de aplicativos para Internet. Este trabalho teve como objetivo propor um modelo conceitual dos dados sobre acidentes do trabalho para publicação dos dados governamentais abertos, mantidos pela Previdência Social. O resultado da seção seis conseguiu atender a este objetivo. Entretanto, cabe ressaltar que o modelo aqui proposto é uma visão dentre várias possibilidades de modelos. Com os resultados do capítulo sete, utilizando a descrição em RDF, proveniente do modelo conceitual proposto, para descrever parte dos dados sobre acidentes do trabalho já disponibilizados pela Dataprev, é atendido o último objetivo específico. Todavia, mais 145 importante que o cumprimento deste objetivo é poder contribuir com possibilidades viáveis para que uma parte dos dados públicos seja mais bem utilizada. Espera-se que este trabalho possa contribuir com idéias ou práticas para que a publicação desses e de outros dados seja realizada, utilizando princípios dos dados governamentais abertos. De tal forma a possibilitar a criação, pela própria sociedade, de novos serviços e informações que contribuirão para a construção de uma cidadania, na qual os cidadãos terão maior acesso às informações e, consequentemente, a construção de uma sociedade mais justa, participativa e com maiores oportunidades. O estudo da literatura mostrou que apesar do Brasil apresentar algumas experiências com a utilização dos dados públicos para aplicativos a partir de ligações entre dados governamentais, é pequena a participação da sociedade neste processo. A discussão sobre as teorias e práticas necessárias para a publicação, de forma aberta, dos dados, não conseguiu impulsionar os resultados. O que se nota ainda é a existência de leis que garantem o acesso às informações públicas, mas estas informações são disseminadas de forma dispersa e com baixa utilização pela sociedade. Elas ainda são recursos pouco explorados, devido à dificuldade de busca, processamento e reutilização. A população que é produtora de dados, também é consumidora. Por esta razão, o Estado, e, aqui em especial, a Previdência Social, precisa aprimorar os serviços já existentes e ao mesmo tempo elaborar outros novos, que contribuam para uma relação de simbiose entre ela e a sociedade. A publicação destes dados de forma aberta possibilitará a criação, por parte da própria sociedade, de novos serviços e informações que contribuirão para a construção de uma cidadania, no qual os cidadãos terão maior acesso às informações e, consequentemente, a construção de uma sociedade mais participativa e consciente. Todavia, muitos desafios ainda precisam ser vencidos, como: ausência de vocabulários controlados e de modelos conceituais, inexpressiva cooperação entre as áreas públicas para compartilhamento de experiências, falta de semântica entre os dados e ineficaz divulgação dos dados já publicados. Contra esse panorama, a Dataprev tem o papel de apoiar a evolução dos assuntos pertinentes à Previdência Social, por meio do uso de tecnologias e informações. Tanto a metodologia apresentada, quanto os resultados podem instrumentalizar e apoiar os projetos em curso na Dataprev, especialmente nas ações ligadas ao trabalho de publicação de dados governamentais abertos (projeto INDA). 146 Durante a análise do VCGE, ele acabou sofrendo uma revisão, na qual se pode participar enviando para análise os apontamentos aqui levantados sobre o vocabulário. O resultado de poder contribuir com sugestões para a melhoria do vocabulário (projeto ePING) indicado pelo Governo (projeto INDA) para indexação de dados públicos, colabora para a efetividade desta pesquisa. Espera-se em trabalhos futuros conseguir expandir a utilização do modelo conceitual, de forma a testá-lo na publicação de todos os dados sobre Previdência Social, coletando dados tanto do Anuário Estatístico de Acidentes do Trabalho, quanto do Anuário estatístico da Previdência Social. Com isto, será possível reavaliá-lo e adequá-lo as mudanças necessárias para que se consiga representar de forma consistente os dados descritos. Por fim, no contexto apresentado neste trabalho, a elaboração do modelo conceitual e a descrição em RDF pareceu adequado para organizar e fornecer um nível mínimo de semântica aos dados sobre acidente do trabalho da Previdência Social brasileira, com vista a promover a organização e facilitar a recuperação e reuso desses dados. 147 REFERÊNCIAS AGUNE, R. M.; GREGORIO FILHO, Á. S.; BOLLIGER, S. P. Governo aberto SP: disponibilização de bases de dados e informações em formato aberto. In: CONGRESSO CONSADE DE GESTÃO PÚBLICA, 3., 2010, Brasília. Anais... Brasília: [s.n.], 2010. Disponível em: <http://www.escoladegoverno.pr.gov.br/arquivos/File/Material_%20 CONSAD/paineis_III_congresso_consad/painel_13/governo_aberto_sp_disponibilizacao_de_ bases_de_dados_e_informacoes_em_formato_aberto.pdf>. Acesso em: 28 jun. 2011. ALMEIDA, M. B.; BAX, M. P. Uma visão geral sobre ontologias: pesquisa sobre definições, tipos, aplicações, métodos de avaliação e de construção. Ci. Inf., Brasília, v. 32, n. 3, p. 7-30, set. dez. 2003. Disponível em: <http://www.scielo.br/ pdf/ci/v32n3/19019>. Acesso em: 13 maio 2012. ALMEIDA, M. B.; OLIVERRA, V. N. P.; COELHO, K. C. Estudos exploratório sobre ontologias aplicadas a modelos de sistemas de informação: perspectivas de pesquisa em Ciência da Informação. Enc. Bibli. R. Eletr. Bibliotecon. Ci. Inf., Florianópolis, v. 15, n. 30, p. 32-56, 2010. Disponível em: <https://periodicos.ufsc.br/index.php/eb/article/view/10987>. Acesso em: 11 jun. 2013. ALONSO, L. B. N.; FERNEDA, E.; BRAGA, L. V. Governo eletrônico e políticas públicas: análise sobre o uso da certificação digital no Brasil. Inf. & Soc.: Est., João Pessoa, v. 21, n. 2, p. 13-24, maio/ago. 2011. ALVARENGA, L. A Teoria do Conceito revisitada em conexão com ontologias e metadados no contexto das bibliotecas tradicionais e digitais. DataGramaZero, v. 2, n. 6, dez. 2001. Disponível em: <http://www.dgz.org.br/dez01/Art_05.htm>. Acesso em: 5 ago. 2013. ALVES, M. D. R.; SOUZA, M. I. F. Estudo de correspondência de elementos metadados: Dublin Core e MARC 21. Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, v. 4, n. 2, p. 20-38, jan./jun. 2007. Disponível em: <http://www.brapci.ufpr.br/documento.php?dd0=0000007463&dd1=46dea>. Acesso em: 13 maio de 2012. ANGÉLICO, F. Lei de acesso à informação pública e seus possíveis desdobramentos à accountability democrática no Brasil. 2012. Dissertação (Mestrado em Administração Pública e Governo) - Escola de Administração de Empresas de São Paulo da Fundação Getúlio Vargas, São Paulo, 2012. ANUÁRIO estatístico da previdência social: AEPS 2011. Brasília, v. 19, 2012. ANUÁRIO estatístico da previdência social: AEPS 2012. Brasília, v. 20, 2013. Disponível em: <http://www.previdencia.gov.br/estatisticas/aeps-2012-anuario-estatistico-daprevidencia-social-2012/>. Acesso em: 5 mar. 2014. ANUÁRIO estatístico de acidentes do trabalho: AEAT 2010. Brasília, v. 1, 2011. ARAÚJO, L. R.; SOUZA, J. F. Aumentando a transparência do governo por meio da transformação de dados governamentais abertos em dados ligados. Revista Eletrônica de 148 Sistemas de Informação, v. 10, n. 1, p. 1-15, 2011. Disponível em: <http://revistas.facecla.com.br/index.php/reinfo/article/view/880>. Acesso em: 5 mar. 2012. AUER, S. et. al. DBpedia: a nucleus for a Web of open data. The Semantic Web, Lecture Notes in Computer Science, v. 4825, p. 722-735, 2007. Disponível em: <http://www.cis.upenn.edu/~zives/research/dbpedia.pdf>. Acesso em: 24 abr. 2013. BARLOW, J. P. A taxonomy of information. Bulletin of the American Society for Information Science, v. 20, n. 5, p. 13-17, 1994. BANDEIRA, A. A. Informação e exercício da accountability. In: CINFORM - ENCONTRO BRASILEIRO DE CIÊNCIA DA INFORMAÇÃO, 6., 2005, Salvador. Anais... Salvador: UFBA, 2005. BAPTISTA, A. A.; MACHADO, A. B. Um gato preto num quarto escuro – falando sobre metadados. Revista de Biblioteconomia de Brasília, v. 25, n. 1, p. 77-90, 2001. Disponível em: <http://www.brapci.ufpr.br/documento.php?dd0=000000851 4&dd1=707be>. Acesso em: 15 jun. 2012. BARRETO, A. de A. A questão da informação. São Paulo em Perspectiva, v. 8, n. 4, p. 3-8, 1994. Disponível em: <http://aldoibct.bighost.com.br/quest/quest2. pdf>. Acesso em: 2 jun. 2012. BARROS, A. J. S.; LEHFELD, N. A. S. Fundamentos de metodologia: um guia para a iniciação científica. 2. ed. São Paulo: Makron Books, 2000. BATIMARCHI, S. Um ano da Lei de Acesso à Informação. Information Management, a. 7, n. 35, abr. 2013. BATISTA, A. I. et al. Ações de Governo Eletrônico: o projeto de publicação de dados abertos da Previdência Social pela Dataprev. In: CONFERÊNCIA WEB W3C BRASIL, 3., 2011, Rio de Janeiro. Anais... Rio de Janeiro: W3C, 2011. BENNETT, D.; HARVEY, A. Publishing open government data. 2009. Disponivel em: <http://www.w3.org/TR/2009/WD-gov-data-20090908/>. Acesso em: 15 jun. 2011. BERNERS-LEE, T. Information management: a proposal. 1989. Disponível em: <http://www.w3.org/History/1989/proposal.html>. Acesso em: 15 jun. 2011. BERNERS-LEE, T. Linked Data. 2006. Disponível em: <http://www.w3.org/DesignIssues/LinkedData.html>. Acesso em: 22 abr. 2012. BERNERS-LEE, T. Putting government data online. 2009. Disponivel em: <http://www.w3.org/DesignIssues/GovData.html>. Acesso em: 11 jul. 2012. BERNERS-LEE, T. Qual o futuro da Web, segundo Tim Berners-Lee. Entrevistador: Peter Moon. 2011. Disponível em: <http://peter-moon.blogspot.com.br/ 2011/04/qual-e-o-futuroda-web-segundo-tim.html>. Acesso em: 5 abr. 2013. 149 BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The Semantic Web: a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. 2001. Disponível em: <http://www-sop.inria.fr/acacia/cours/essi2006/ Scientific %20American_%20Feature%20Article_%20The%20Semantic%20 Web_%20May%202001.pdf>. Acesso em: 13 mar. 2012. BERNERS-LEE. T. Relational databases on the Semantic Web. 1998. Disponível em: <http://www.w3.org/DesignIssues/RDB-RDF.html>. Acesso em: 2 mar. 2014. BIRDSALL, W. F. Uma economia política da biblioteconomia? Perspectivas em Ciência da Informação, Belo Horizonte, v. 10, n. 1, n. 1, jan./jun. 2005. BIZER, C.; CYGANIAK, R.; HEATH, T. How to publish Linked data on the Web. 2007. Disponível em: <http://wifo5-03.informatik.unimannheim.de/bizer/pub/LinkedDataTutorial/>. Acesso em: 22 abr. 2012. BIZER, C.; HEATH, T.; BERNES-LEE, T. Linked data – the story so far. Preprint to special issue on linked data. Internacional Journal on Semantic Web and Information Siystems (IJSWIS). 2009. Disponível em: <http://www.dagstuhl.de/ Materials/Files/09/09271/09271.BizerChristian.Slides.pdf>. Acesso em: 13 maio 2012. BORGIDA. A.; CASANOVA, M. A.; LAENDER, A. H. F. Logical database design: from conceptual to logical schema. In: LIU, L.; Özsu, T. (Ed.). Encycopedia of database systems. New York: Springer, 2009. p. 1645-1649. BRASIL. Constituição (1988). Constituição da República Federativa do Brasil. Brasília: Senado Federal, 1988. Disponível em: <http://www.senado.gov.br/ legislacao/const/con1988/CON1988_05.10.1988/CON1988.pdf>. Acesso em: 15 fev. 2013. BRASIL. Decreto de 15 de setembro de 2011. Institui o Plano de Ação Nacional sobre Governo Aberto e dá outras providências. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 16 set. 2011b. Disponível em: <http://www.planalto.gov.br/ccivil_03/_ato2011-2014/2011/dsn/dsn13117.htm>. Acesso em: 1 maio 2013. BRASIL. Decreto nº 3.294, de 15.12.1999. Institui o Programa Sociedade da Informação e dá outras providências. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 16 dez. 1999. Disponível em: <http://egov.wikidot.com/ decsocinfoa>. Acesso em: 21 abr. 2013. BRASIL. Decreto nº 6.932, de 11 agosto de 2009. Dispõe sobre a simplificação do atendimento público prestado ao cidadão, ratifica a dispensa do reconhecimento de firma em documentos produzidos no Brasil, institui a “Carta de Serviços ao Cidadão” e dá outras providências. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 12 ago. 2009b. Disponível em: http://www.planalto.gov.br/ccivil_03/_ato20072010/2009/decreto/d6932.htm. Acesso em: 1 maio 2013. BRASIL. Decreto nº 7.175, de 12 de maio de 2010. Institui o Programa Nacional de Banda Larga - PNBL. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 15 maio 2010. Disponível em: <https://www.planalto.gov.br/ccivil_03/ _ato20072010/2010/decreto/d7175.htm>. Acesso em: 4 fev. 2013. 150 BRASIL. Lei Complementar nº 101, de 4 de maio de 2000. Estabelece normas de finanças públicas voltadas para a responsabilidade na gestão fiscal e dá outras providências. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 5 maio 2000. Disponível em: <http://www.planalto.gov.br/ccivil_03/leis/lcp/lcp101. htm>. Acesso em: 1 maio 2013. BRASIL. Lei Complementar nº 131, de 27 de maio de 2009. Acrescenta dispositivos à Lei Complementar no 101, de 4 de maio de 2000, que estabelece normas de finanças públicas voltadas para a responsabilidade na gestão fiscal e dá outras providências, a fim de determinar a disponibilização, em tempo real, de informações pormenorizadas sobre a execução orçamentária e financeira da União, dos Estados, do Distrito Federal e dos Municípios. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 28 maio 2009a. Disponível em: <http://www.planalto.gov.br/ccivil_03/leis/lcp/lcp131.htm>. Acesso em: 1 maio 2013. BRASIL. Lei nº 12.527, de 18 de novembro de 2011. Regula o acesso a informações previsto no inciso XXXIII do art. 5o, no inciso II do § 3o do art. 37 e no § 2o do art. 216 da Constituição Federal; altera a Lei no 8.112, de 11 de dezembro de 1990; revoga a Lei no 11.111, de 5 de maio de 2005, e dispositivos da Lei no8.159, de 8 de janeiro de 1991; e dá outras providências. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 18 nov. 2011a. Disponível em: <http://www.planalto.gov.br/ccivil_03/_ato20112014/2011/lei/l12527.htm>. Acesso em: 1 maio 2013. BRASIL. Lei nº 8.213, de 24 de julho de 1991. Dispõe sobre os Planos de Benefícios da Previdência Social e dá outras providências. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 24 jul. 1991. Disponível em: <http://www.planalto.gov.br/ ccivil_03/leis/L8213cons.htm>. Acesso em: 14 out. 2012. BRASIL. Ministério do Planejamento, Orçamento e Gestão. Gov.br. 2013c. Portal do governo eletrônico. Disponível em: <http://www.governoeletronico.gov.br/o-gov.br>. Acesso em: 23 abr. 2013. BRASIL. Ministério do Planejamento, Orçamento e Gestão. Secretaria de Logística e Tecnologia da Informação. VCGE Voabulário de Governo Eletrônico. Brasília: MP, SLTI, 2013d. BRASIL. Brasil.gov.br: serviços. 2013a. Disponível em: <http://www.brasil.gov.br/para/ servicos/aposentadoria/previdencia-do-servidor>. Acesso em: 22 jul. 2013. BRASIL. Controladoria-Geral da União. Estrutura organizacional do Governo Federal. 2013b. Disponível em: <http://www.cgu.gov.br/publicacoes/prestacaocontaspresidente/2010/ Arquivos/1.01.pdf>. Acesso em: 22 jul. 2013. BRASIL. Portaria n. 5, de 14 de julho de 2005. 2005. Disponível em: <http://www.governoeletronico.gov.br/o-gov.br/legislacao/portaria-no-05-de-14-de-julho-de2005>. Acesso em: 24 abr. 2013. BREITMAN, K. et al. Dados Governamentais Abertos. In: ______. Publicação de dados governamentais em padrão Linked Data. 2009. Disponível em: <http://www.w3c.br/cursos/dados-abertos/curso/Parte-1-Modulo-2Open%20Government%20Data.pdf>. Acesso em: 13 maio 2011. 151 BREITMAN, K. Web Semântica: a Internet do futuro. Rio de Janeiro: LTC, 2005. BURKE, C. História da Ciência da Informação. Annual Review of Information Science and Technology, University of Maryland, Baltimore Countly, v. 41, p. 3-53, 2007. Tradução livre de: Cavalcanti, H. C.; Gouveia Junior, M.; Queiroz, M. O. de. CAMPOS, A. M. Accountability: quando poderemos traduzi-la para o português? Revista de Administração Pública, Rio de Janeiro, v. 24, n. 2, p. 30-50, fev./abr. 1990. Disponível em: <http://ebape.fgv.br/sites/ebape.fgv.br/files/ rap8_0.pdf>. Acesso em: 22 fev. 2013. CAMPOS, M. L. A. A organização de unidades do conhecimento em hiperdocumentos: o modelo conceitual como um espaço comunicacional para a realização da autoria. 2001b. Tese (Doutorado em Ciência da Informação) – Instituto Brasileiro de Informação em Ciência e Tecnologia. Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2001. CAMPOS, M. L. A. Integração de ontologias: o domínio da Bioinformática e a problemática da compatibilização terminológica. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 7., 2006, Marília). Anais... Marília: ANCIB, 2006. Disponível em: <http://portalppgci.marilia.unesp.br/index.php>. Acesso em: 24 set. 2012. CAMPOS, M. L. A. Linguagem documentária: teorias que fundamentam sua elaboração. Niterói: EdUFF, 2001a. CAMPOS, M. L. A. Modelização de domínios de conhecimento: uma investigação de princípios fundamentais. Ci. Inf., Brasília, v. 33, n. 1, p. 22-32, jan./abr. 2004. Disponível em: <http://revista.ibict.br/ciinf/index.php/ciinf/article/view/56>. Acesso em: 11 jun. 2013. CAMPOS, M. L. A.; CAMPOS, L. M. A Organização do Conhecimento e suas teorias de representação: a ontologia de fundamentação como um modelo teórico para a representação de domínios. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 12., 2011, Brasília). Anais... Brasília: ANCIB, 2011. CAMPOS, M. L. A.; CAMPOS, L. M.; MEDEIROS, J. S. A representação de domínios de conhecimento e uma teoria de representação: a ontologia de fundamentação. Inf. Inf., Londrina, v. 16, n. esp., p. 140-164, jan./jun. 2011. CAMPOS, M. L. A.; GOMES, H. E. Taxonomia e Classificação: o príncipio de Categorização. DataGramaZero: revista de Ciência da Informação, v. 9, n. 4, ago. 2008. Disponível em: <http://www.dgz.org.br/ago08/ F_I_art.htm>. Acesso em: 13 jan. 2013. CAMPOS, M. L. A.; SOUZA, R. F.; CAMPOS, M. L. M. Organização de unidades de conhecimento em hiperdocumentos: o modelo conceitual como espaço comunicacional para a realização da autoria. Ci. Inf., Brasília, v. 32, n. 2, p. 7-16, maio/ago. 2003. Disponível em: <http://www.scielo.br/scielo.php?pid=S0100-19652003000200002&script=sci_arttext>. Acesso em: 13 maio 2013. CAPURRO, Rafael. Epistemologia e Ciência da Informação. 2003. Disponível em: <http://www.capurro.de/enancib_p.htm>. Acesso em: 12 mar. 2012. 152 CASTELLS, M. A sociedade em rede. São Paulo: Paz e Terra, 1999. CHAHIN, A. et al. E-Gov.br: a próxima revolução brasileira: eficiência, qualidade e democracia: o governo eletrônico no Brasil e no mundo.. São Paulo: Prentice-hall, 2004. CHAVES, M. B. F. Apresentação sobre ações de Governo para Dados Abertos. 2011. Apresentado originalmente no IV Congresso Internacional Software Livre e Comércio Eletrônico, realizado em 2011, na cidade de Brasília. Disponível em: <http://www.w3c.br/conferenciaegov/06_COI-PR_Mirian.pdf>. Acesso em: 4 maio 2013. CHEN, P. Modelagem de dados. New York: Mcgraw Hill / Makron Books,1990. CHEN, P. P. Entity-Relationship modeling: historical events, future trends, and lessons learned. In: SOFTWARE pioneers: contributions to software engineering. 2002. Disponível em: <http://www.csc.lsu.edu/~chen/pdf/Chen_Pioneers.pdf>. Acesso em: 28 out. 2013. CHEN, P. P. The Entity-Relationship Model - toward a unified view of data. ACM Transactions on Database Systems, v. 1, n. 1. Mar. 1976. CKAN. 2013. Disponível em: <http://ckan.org/>. Acesso em: 26 maio 2013. CONNOLY. T.; BEGG, C. Database systems: a pratical approach to design, implementation, and management. New York: Addison-Wesley, 1999. CONTROLADORIA-GERAL DA UNIÃO. Programa Brasil Transparente. 2013a. Disponível em: <http://www.cgu.gov.br/PrevencaodaCorrupcao/BrasilTransparen te/OPrograma/index.asp>. Acesso em: 21 abr. 2013. CONTROLADORIA-GERAL DA UNIÃO. Programa Brasil Transparente. 2013b. Disponível em: <http://www.portaltransparencia.gov.br/>. Acesso em: 21 abr. 2013. COSTA, I. T. M. Informação, trabalho e tempo livre: políticas de informação para o século XXI. Ci. Inf. , Brasília, v. 28, n. 2, p. 136-138, maio/ago 1999. Disponível em: <http://www.scielo.br/scielo.php?pid=S0100-19651999000200005&script= sci_arttext>. Acesso em: 14 maio 2012. CYGANIAK, R.; JENTZSCH, A. The Linking Open Data cloud diagram. 2011. Disponível em: <http://lod-cloud.net/>. Acesso em: 24 abr. 2014. DADOS.GOV.BR. 2013. Disponível em: <http://dados.gov.br/>. Acesso em: 1 maio 2013. DAHLBERG, I. A referent-oriented analytical concept theory os inter concept. International classification, Frankfurt, v. 5, n. 3, p. 142-150, 1978b. DAHLBERG, I. Conceptual definitions for interconcept. International Classification, v. 8, n. 1, p. 16-22, 1981. DAHLBERG, I. Fundamentos teóricos-conceituais da classificação. R. Bibliotecon., Brasília, DF, v. 6, n. 1, jan./jun. 1978c. 153 DAHLBERG, I. Teoria do conceito. Ci. Inf., Rio de Janeiro, v. 7, n. 2, p. 101-107, 1978a. Disponível em: <http://revista.ibict.br/ciinf/index.php/ciinf/article/viewFile/1680/1286>. Acesso em: 11 ago. 2013. DAHLBERG, I. Terminological definitions: characteristics and demands. In: PROBLÈMES de la définition et de la synonymie en terminologie. Québec: GIRSTERM, 1983. p. 13-51. DATA.GOV.UK. 2013. Disponível em: <http://data.gov.uk/>. Acesso em: 1 maio 2013. DATAPREV. A virada da previdência social: como acabaram as filas nas portas das agências. Brasília: Dataprev, 2013. DATAPREV. Dados abertos. 2012. Disponível em: <http://api.dataprev.gov.br/ revidencia/ anuario/2003/acidentes-do-trabalho.xml>. Acesso em: 15 jan. 2013. DATAPREV. Dados abertos. 2013. Disponível em: <http://api.dataprev.gov.br/doc/index.html>. Acesso em: 7 abr. 2013. DAVIES, T. Open data, democracy and public sector reform. A look at open government data use from data.gov.uk. 2010. Disponível em: <http://practicalparticipation.co.uk/odi/report/ wp-content/uploads/2010/08/How-is-opengovernment-data-being-used-in-practice.pdf>. Acesso em: 20 abr. 2013. DAVIS, R.; SHROBE, H.; SZOLOVITS, P. What is knowledge representation? AI Magazine, v. 14, n. 1, p. 17-33, Spring 1993. Disponível em: <http://www.aaai.org/ojs/index.php/aimagazine/article/view/1029/947>. Aceso em: 22 jan. 2013. DEMO, P. Metodologia científica em Ciências Sociais. 3. ed. rev e ampl. São Paulo: Atlas, 1995. DINIZ, E. H. et al. O governo eletrônico no Brasil: perspectiva histórica a partir de um modelo estruturado de análise. Revista de administração pública, Rio de Janeiro, v. 43, n. 1, p. 23-48, jan./fev. 2009. Disponível em: <http://www.scielo.br/ pdf/rap/v43n1/ a03v43n1.pdf>. Acesso em: 28 jun. 2011. DINIZ, V. A crise do governo eletrônico ou a prevalência dos monólogos simultâneos. Informática pública, a. 11, n. 1, p. 15-22, 2009. Disponível em: <http://www.ip.pbh.gov.br/ ANO11_N1_PDF/a_crise_do_governo_eletronico. pdf>. Acesso em: 28 jun. 2011. DINIZ, V. Como conseguir dados governamentais abertos. In: CONGRESSO CONSADE DE GESTÃO PÚBLICA, 3., 2010, Brasília. Anais... Brasília: [s.n.], 2010. Disponível em: <http://www.escoladegoverno.pr.gov.br/arquivos/File/ Material_%20CONSAD/paineis_III_congresso_consad/painel_13/como_conseguir_dados_go vernamentais_abertos.pdf>. Acesso em: 19 abr. 2012. DODDS, L. Rights statements on the Web of Data. Nodalities: the magazine of the Semantic Web, v. 9, p. 13-14, 2010. 154 DODEBEI, V. L. D. Tesauro: linguagem de representação da memória documentária. Niterói: Intertexto; Rio de Janeiro: Interciência, 2002. DUBLIN CORE METADATA INITIATIVE. DCMI metadata terms. 2012. Disponível em: <http://dublincore.org/documents/2012/06/14/dcmi-terms/?v=elements#>. Acesso em: 2 mar. 2014. DZIEKANIAK, G. V. Desenvolvimento de uma ontologia sobre componentes de ontologias. Perspectivas em Ciência da Informação, v. 15, n. 1, p. 173-184, jan./abr. 2010. Disponível em: <http://www.scielo.br/scielo.php?pid=S1413-99362010000100010&script=sci_arttext>. acesso em: 13 maio 2012. DZIEKANIAK, G. V.; KIRINUS, J. B. Web Semântica. Enc. Bibli.: E. Eletr. Bibliotecon. Ci. Inf., Florianópolis, n. 18, p. 20-39, jul./dez. 2004. Disponível em: <http://www.periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2004v9n18p20>. Acesso em: 13 maio 2012. EUROPEANA. Definition of the Europeana Data Model elements: version 5.2.3. 2012. Disponível em: <http://pro.europeana.eu/documents/900548/bb6b51df-ad11-4a78-8d8a44cc41810f22>. Acesso em: 10 mar 2013 FALBO, R. A. Integração de conhecimento em um ambiente de Engenharia de Software. 1998. Tese (Doutorado em Informática) - Engenharia de Sistemas e Computação, COPPE, Universidade Federal do Rio de Janeiro. FEIGENBAUM, L. et al. The Semantic Web in action: corporate applications are well under way, and consumer uses are emerging. Scientific American, Dec. 2007. Disponível em: <http://thefigtrees.net/lee/sw/sciam/semantic-web-in-action>. Acesso em: 15 jun. 2011. FERNANDES, A. G.; AFONSO, J. R. R. e-Governo no Brasil: experiências e perspectivas. Revista do BNDES, Rio de Janeiro, v. 8, n. 5, p. 21-64, 2001. FERNANDES, G. C. Quatro visões no campo da Ciência da Informação. 2006. Trabalho apresentado à banca avaliadora do concurso para Professor Adjunto 1 DE, do Departamento de Ciência da Informação da Universidade Federal da Universidade Federal de Santa Catarina, como requisito parcial para aprovação. FERNANDEZ, M.; GÓMEZ-PÉREZ, A.; JURISTO, N. Methontology: from ontological art towards ontological engineering. AAAI Technical Report SS-97-06, 1997. FERRER, F. A importância do governo eletrônico no Brasil. 2003. Disponível em: <http://www.florenciaferrer.com.br/detalhes.php?artg=105>. Acesso em: 20 abr. 2013. FHOHMANN, B. A documentação rediviva: prolegômenos a uma (outra) filosofia da informação. Morpheus: Revista Eletrônica em Ciências Humanas, Rio de Janeiro, v. 9, n. 14, p. 227-249, 2012. Disponível em: <http://www.unirio.br/ orpheusonline/numero142012/artigos/ frohmannn _pt.pdf>. Acesso em: 14 out. 2012. 155 FILGUEIRAS, F. Além da transparência, accountability e política da publicidade. Lua Nova, São Paulo, n. 84, p. 84-94, 2011a. Disponível em: <http://www.scielo.br/pdf/ln/n84/a04n84.pdf>. Acesso em: 22 jul. 2012. FILGUEIRAS, F. Transparência, publicidade e accountability. In: TEXTO para discussão n. 1. Belo Horizonte: Centro de Referência do Interesse Público, 2011b. Disponívem em: <http://democraciaejustica.org/cienciapolitica3/sites/ default/files/transparencia_publicidade_e_accountability.pdf>. Acesso em: 22 jul. 2012. FOUCAULT, M. A governamentabilidade. In: ______. Ditos e escritos. Rio de Janeiro: Forense Universitária, 2003. v. 4. FRANCELIN, M. M.; KOBASHI, N. Y. Concepções sobre o conceito na organização da informação e do conhecimento. Ci. Inf., Brasília, DF, v. 40, n. 2, p. 207-228, maio/ago., 2011. FRANZOSI, E. M. et al. Rede de informações pública e aberta DadosGov – um modelo aberto para troca de informações. In: CONGRESSO INTERNACIONAL SOFTWARE LIVRE E COMÉRCIO ELETRÔNICO, 4., 2011, Brasília. Dados abertos para a democracia na era digital. Brasília: Fundação Alexandre de Gusmão, 2011. p. 21-51. FREIRE, G. H. Ciência da Informação: temática, histórias e fundamentos. Perspec. Ci. Inf., Belo Horizonte, v. 11, n. 1, p. 6-19, jan./abr. 2006. FREITAS, L. S. Sentidos da história e história dos sentidos da Ciência da Informação: um esboço arqueológico. Morpheus, Rio de Janeiro, a. 2, n. 2, 2003. FREIRE, N.; CHARLES, V.; CHAMBERS, S. Análise do Europeana Data Model no contexto das bibliotecas e de conteúdos de texto integral. In: CONGRESSO NACIONAL DE BIBLIOTECÁRIOS, ARQUIVISTAS E DOCUMENTALISTAS, 11, 2012, Lisboa. Actas… Lisboa: Fundação Calouste Gulbenkian, 2012. FREY, K. Governança eletrônica: uma experiência de cidades européias e algumas lições para países em desenvolvimento. Informática pública, Belo Horizonte, v. 2, p. 31-48, maio 2000. Disponível em: <http://www.egov.ufsc.br/ portal/ sites/default/files/anexos/19407-19408-1PB.pdf>. Acesso em: 4 jan. 2013. FREY, K. Governança urbana e participação pública. RAC-Eletrônica, v. 1, n. 1, p. 136-150, jan./abr. 2007. Disponível em: <http://www.anpad.org.br/periodicos/ arq_pdf/a_629.pdf>. Acesso em: 3 jan. 2013. FURGERI, S. O papel das linguagens de marcação para a Ciência da Informação. Transinformação, Campinas, v. 18, n. 3, p. 225-239, set./dez. 2006. Disponível em: <http://www.brapci.ufpr.br/documento.php?dd0=0000000445&dd1 =d1f32>. Acesso em: 13 maio 2012. GAILLIAU, R. Twenty years of a free and open WWW. 2013. Disponível em: <http://home.web.cern.ch/cern-people/opinion/2013/04/twenty-years-free-and-open-www>. Acesso em: 30 abr. 2013. 156 GANGEMI, A. et al. Sweetening Ontologies with DOLCE. In: KNOWLEDGE engineering and knowledge management: ontologies and the semantic web, v. 2473, p. 223-233, 2002. Disponível em: <http://www.loa.istc.cnr.it/Papers/DOLCE-EKAW.pdf>. Acesso em: 24 out. 2013. GARCIA. T. et al. A democracia na era do governo eletrônico. In. Simpósio Internacional de propriedade intelectual, informação e ética, 2003, Florianópolis. Anais... Florianópolis: UFSC, 2003. Disponível em: <http://egov.ufsc.br/portal/ sites/ default/files/anexos/2955229568-1-PB.pdf>. Acesso em: 17 abr. 2013. GOMES, H.E.(Coord.). Manual de elaboração de tesauros monolíngües. Brasília: Programa Nacional de Bibliotecas das Instituições de Ensino Superior, 1990. GOMES, H. E. Tendências da pesquisa em organização do conhecimento. Pesq. Bras. Ci. Inf., Brasília, v. 2, n. 1, p. 60-88, jan./dez. 2009. GONTIJO, M. Analise da proposta brasileira de e-governo como expressão de uma política de informação a partir do conceito de regime de informação. Perspect. Cien. Inf., Belo Horizonte, v. 7, n. 2, p. 179-188, jul./dez. 2002. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/ download/406/217>. Acesso em: 2 dez. 2012. GONZÁLEZ DE GOMEZ, M. N. Novos cenários políticos para a informação. Ci. Inf. Brasília, v. 31, n. 1, p. 27-40, jan./abr. 2002. GONZÁLEZ DE GÓMEZ, M. N.; LIMA, C. R. M. de (org.). Informação e democracia: a reflexão contemporânea da ética e da política. Brasília: IBICT, 2010. GOVERNO eletrônico: observatório do Governo eletrônico. 2007. Disponível em: <http://egov.wikidot.com/start>. Acesso em: 19 abr. 2013. GRAY, J. et. al. Unlocking the Potential of Aid Information. 2009. Disponível em http://www. unlockingaid.info/wp-content/uploads/2010/02/UnlockingAid Information.pdf. Acessado em: 13 de junho de 2011. GREENBERG, J. The Web Semantic: more than a vision. Bulletin of the American Society for Information Science and Technology, v. 29, n. 4, p. 6-7, Apr./May 2003. Disponível em: <http://www.asis.org/Bulletin/Apr-03/BulletinAprMay03.pdf>. Acesso em: 16 set. 2012. GREENBERG, J.; SUTTON, S.; CAMPBELL, G. Metadata: a fundamental component of the Semantic Web. Bulletin of the American Society for Information Science and Technology, v. 29, n. 4, p. 16-18, Apr./May 2003. Disponível em: <http://www.asis.org/Bulletin/Apr-03/BulletinAprMay03.pdf>. Acesso em: 16 set. 2012. GRENON, P.; SMITH, B.; GOLDBERG, L. Biodynamic ontology; applying BFO in the biomedical domain. 2004. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.64.5717>. Avesso em: 22 abr. 2013. 157 GRUBER, T. R. Ontology. In: Ling Liu; Özsu, M. T. (ed.). Encyclopedia of Database Systems. New York: Springer-Verlag, 2009. Disponível em: <http://tomgruber.org/writing/ontology-definition-2007.htm>. Acesso em: 1 maio 2013. GRUBER, T. R. Toward Principles for the Design of Ontologies Used for Knowledge Sharing. International Journal Human-Computer Studies, v. 43, n. 5-6, p. 907-928, 1995. Disponível em: <http://tomgruber.org/writing/onto-design.pdf>. Acesso em: 4 maio 2013. GUARINO, N. Formal ontology and information systems. In: FIRST INTERNATIONAL CONFERENCE (FOIS), 1., 1998, Trento, Italy. Proceedings… Amsterdam: IOS Press, 1998. p. 3-15. Disponível em: <http://www.loa.istc.cnr.it/ Papers/FOIS98.pdf>. Acesso em: 5 abr. 2013. GUARINO, N. Understanding, building and using ontologies. Journal Humancomputer Studies, v. 45, n. 2-3, fev.mar. 1997. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.29.2610>. Acesso em: 27 maio 2012. GUIZZARDI, G. et al. Ontologias de fundamentação e modelagem conceitual. Disponível em: <http://nemo.inf.ufes.br/files/ontologias_de_ fundamentacao_e_modelagem_conceitual_ 2009. pdf>. Acesso em: 5 abr. 2013. GUIZZARDI, G. Uma abordagem metodológica de desenvolvimento para e com reuso, baseada em ontologias formais de domínio. 2000. Dissertação de Mestrado, Universidade Federal do Espirito Santo, Departamento de Informática, LabES (Laboratorio de Engenharia de Software)/LPRM (Laboratorio de Pesquisas em Redes e Multimidia). Disponível em: <http://www.loa.istc.cnr.it/ Guizzardi/MSc.htm>. Acesso em: 4 maio 2013. GUIZZARDI, G.; FALBO, R. A.; GUIZZARDI, R. S. S. A importância de ontologias de fundamentação para a engenharia de ontologias de domínio: o caso do domínio de processos de software. IEEE Latin America Transactions, v. 6, n. 3, July 2008. Disponível em: <http://www.ewh.ieee.org/reg/9/etrans/ieee/issues/vol06/vol6issue3July2008/6TLA3_03Guiz zardi.pdf>. Acesso em: 22 out. 2013. GUIZZARDI, G.; WAGNER, G. A Unified Foundations Ontology and some applications of it in Business modeling. 2004. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.142.9372>. Acesso em: 22 abr. 2013. HABERMAS, J. A inclusão do outro: estudos de teoria e política. São Paulo: Loyola, 2002. HABERMAS, J. Direito e democracia: entre faticidade e validade. 2. Ed. Rio de Janeiro: Tempo Brasileiro, 2003. v. 2. HEUSSER, C. A. Projeto de banco de dados. Porto Alegre: Sagra, 1998. HJØRLAND, B. Fundamentals of Knowledge Organization. In: FRÍAS, José Antonio; TRAVIESO, Críspulo (Ed.). Trends in Knowledge Organization Research. Salamanca: Ediciones Universidad de Salamanca, 2003. p.83-116. 158 HJØRLAND, B. Theory and metatheory of Informacion Science: a new interpretation. Journal of documentation, v. 54, n. 5, p. 606-621, dez. 1998. HORVATH JÚNIOR, M. Dicionário analítico da Previdência Social. São Paulo: Atlas, 2009. IBGE. Síntese e indicadores sociais. Rio de Janeiro: IBGE, 2012. 293 p. (Estudos e pesquisas. Informação demográfica e socioeconômica; 29). Disponível em: <ftp://ftp.ibge.gov.br/Indicadores_Sociais/Sintese_de_ Indicadores_Sociais_2012/SIS_2012.pdf>. Acesso em: 24 abr. 2013. INSTITUTO ANTÔNIO HOUAISS. Dicionário eletrônico de Língua Portuguesa. 3. Ed. Rio de Janeiro: Objetiva, 2009. JACOB, E. K. Ontologies and the Semantic Web. Bulletin of the American Society for Information Science and Technology, v. 29, n. 4, p. 16-18, Apr./May 2003. Disponível em: <http://www.asis.org/Bulletin/Apr-03/BulletinAprMay03.pdf>. Acesso em: 16 set. 2012. JAPIASSÚ, H.; MARCONDES, D. Dicionário básico de Filosofia. 3. ed. rev. ampl. Rio de Janeiro: Zahar, 2001. JARDIM, J. M. A Lei de Acesso à Informação Pública: dimensões político-informacionais. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 13., 2012, Rio de Janeiro). Anais... Rio de Janeiro: ANCIB, 2012. Disponível em: <http://obgi.files.wordpress.com/2012/10/jardim-xiii-enancib.pdf>. Acesso em: 1 maio 2013. JARDIM, J. M. Capacidade governativa, informação e governo eletrônico. DataGramaZero, Rio de Janeiro, v. 1, n. 5, out. 2000. Disponível em: <http://www.dgz.org.br/out00/Art_01.htm>. Acesso em 6 jan. 2010. JARDIM, J. M. Sistemas e políticas públicas de arquivos no Brasil. Niterói: EdUFF, 1995. JARDIM, J. M. Transparência e opacidade do Estado no Brasil: usos e desusos da informação governamental. Niterói: EdUFF, 1999. KANEIWA, K.; IWAZUME, M.; FUKUDA, K. An upper ontology for event classifications and relations. IN: AI'07 Proceedings of the 20th Australian joint conference on Advances in artificial intelligence. Berlin: Springer-Verlag, 2007. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.108.9174>. Acesso em: 12 set. 2013. LAENDER, A. H. F.; FLYNN, D. J., A semantic comparison of modelling capabilities of the ER and NIAM models. In: ELMASRI, R.; KOURAMAJIAN, V.; THALHEIM, B., (Eds.). Entity-Relationship Approach - ER'93, Springer-Verlag, p. 242-256, 1994. LANCASTER, F. W. Indexação e resumos: teoria e prática. Brasília: Briquet de Lemos, 1993. LAPLANTE, P. Great papers in Computer Science. New York: West Publishing, 1996. 159 LE MOIGNE, J. A teoria do sistema geral: teoria da modelizacao.Trado: Jorge Pinheiro. Instituto Piaget, Lisboa, 1977. LEITE, M. S. A.; BORNIA, A. C. Modelagem: abordagens que consideram a complexidade do sistema. In: Encontro Nacional de Engenharia de Produção, 26., 2006, Fortaleza. Anais... Fortaleza: ABEPRO, 2006. Disponível em: <http://www.abepro.org.br/biblioteca/ENEGEP2006_TR460314_7155.pdf>. acesso em: 11 dez. 2013. LEOCADIO, J, M. Segurança eletrônica na Web Semântica. In: CONGRESSO INTERNACIONAL SOFTWARE LIVRE E COMÉRCIO ELETRÔNICO, 4., 2011, Brasília. Dados abertos para a democracia na era digital. Brasília: Fundação Alexandre de Gusmão, 2011. p. 7-9. LIGADO nos políticos. 2010. Disponível em: <http://ligadonospoliticos.com.br/? pag=home>. Acesso em: 26 maio 2013. LIMA, C. R. M. de; GONÇALVES, M. A reinvenção da esfera pública: os discursos em rede, reconhecimento e política deliberativa. In. ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 12., 2011, Brasília). Anais... Brasília: ANCIB, 2011. p. 1643-1656. LIMA, J. A. O. Modelo genérico de relacionamentos na organização da informação legislativa e jurídica. 2008. Tese (Doutorado em Ciência da Informação) – Universidade de Brasília, Brasília, 2008. LIMA, J. C.; CARVALHO, C. L. Ontologias - OWL (Web Ontology Language). Technical Report - RT-INF_004-05 - Relatório Técnico. 2005. Disponível em: <http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_004-05.pdf>. Acesso em: 3 mar. 2014. LUBENOW, J. A. Esfera pública e democracia deliberativa em Habermas: modelo teórico e discursos críticos. Kriterion, Belo Horizonte, n. 121, p. 227-258, jun. 2010. Disponível em: <http://www.scielo.br/scielo.php?pid=S0100-512X2010000100012&script=sci_arttext>. Acesso em: 25 maio 2012. MAIA, R. M. C. S.; ALVARENGA, L. Interconexões entre a teoria da classificação facetada (TCF) de Ranganathan e o Modelo Entidade-Relacionamento (MER) de Peter Chen. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 14., 2013, Florianópolis. Anais... Brasília: ANCIB, 2013. Disponível em: < http://enancib.sites.ufsc.br/index.php/enancib2013/XIVenancib/paper/viewFile/441/135>. Acesso em: 10 dez. 2013. MANUAL dos dados abertos: governo. 2011. Disponível em: <http://www.w3c.br/pub/ Materiais/ PublicacoesW3C/Manual_Dados_Abertos_ WEB.pdf>. Acesso em: 24 ago. 2011. MARANHÃO. Ministério Público. Procuradoria Geral de Justiça. Coordenadoria de Orçamento e Finanças. [Plano plurianual 2012-2015]. 2012. Disponível em: <http://www.mp.ma.gov.br/arquivos/arquivos_site_antigo/Noticia6885A6285.pdf>. Acesso em: 22 jul. 2013. 160 MARCONDES, C. H. Definições conceituais como subsídio à modelagem de domínios e organização do conhecimento. 2014. Projeto de pesquisa submetido ao Programa Institucional de Bolsas de Iniciação Científica PIBIC – UFF 2014. MARCONDES, C. H. Documento: suas relações com informação e conhecimento. In: I Congresso ISKO Espanha e Portugal, 2013, Porto, Portugal. I Congresso ISKO Espanha e Portugal, XI Conreso ISKO España, Informação e/ou Conhecimento: as duas faces de Jano. Porto: Faculdade de Letras da Univ. do Porto, CETAC.MEDIA, ISKO, 2013. v. I. p. 800-816. MARCONDES, C. H. et al. Ontologias como novas bases de conhecimento. Perspectivas em Ciência da Informação, v. 13, n. 3, p. 20-39, set./dez. 2008. MARCONDES, C. H.; CAMPOS, M. L. A. Ontologia e Web Semântica: o espaço da pesquisa em Ciência da Informação. Pontode Acesso, Salvador, v. 2, n. 1, p. 107-136, jun./jul. 2008. Disponível em: <http://www.portalseer.ufba.br/index.php/ revistaici/article/viewArticle/2669>. Acesso em: 13 maio 2012. MARCONDES, C. H.; JARDIM, J. M. Políticas de informação governamental: a construção de governo eletrônico na administração federal do Brasil. DataGramaZero – Revista de Ciência da Informação, v. 4, n. 2, abr. 2003. Disponível em: <http://www.dgz.org.br/abr03/Art_04.htm>. Acesso em: 9 mar. 2012. MARCONI, M. A.; LOKATOS, E. M. Fundamentos da metodologia do trabalho científico. 5. ed. São Paulo: Atlas, 2003. MARCONI, M. A.; LOKATOS, E. M. Metodologia do trabalho científico. 2. ed. São Paulo: Atlas, 1992. MARKUS, M. L. Toward a theory of knowledge reuse: types of knowledge reuse situations and factors in reuse success. Journal of Management Information Systems, 18, 1 (Summer): 57-93, 2001. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.85.7939>. Acesso em 12 abr. 2013. MARTELETO, R. M. A pesquisa em Ciência da Informação no Brasil: marcos institucionais, cenários e perspectivas. Perspectivas em Ciência da Informação. V. 14, n. especial, p. 1940, 2009. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/view/ 915/605>. Acesso em: 29 jun. 2012. MASOLO, C. et al. Ontology library. Laboratory for applied ontology – ISTC – CNR. Trento, 2003. Disponível em: <http://wonderweb.semanticweb.gorg/deliverables/documents/D18.pdf>. Acesso em: 11 nov. 2011. MASOLO, C. et al. WonderWeb library of foundational ontologies; preliminary report. 2003. Disponível em: <http://www.loa.istc.cnr.it/Papers/ WonderWebD17V2.0.pdf>. Acesso em: 22 abr. 2013. 161 MATHEUS, R. Consultas públicas online e open government. 2009. Disponível em: <http://www.gpopai.usp.br/cursos/index.php/Usu%C3%A1rio_ Discuss%C3%A3o:Ricardomatheus>. Acesso em: 27 dez. 2012. MAZONI, M. V. F. O papel dos dados abertos para seguir construindo um novo Brasil. In: CONGRESSO INTERNACIONAL SOFTWARE LIVRE E COMÉRCIO ELETRÔNICO, 4., 2011, Brasília. Dados abertos para a democracia na era digital. Brasília: Fundação Alexandre de Gusmão, 2011. p. 7-9. MCGUINNESS, D. L. Ontologies come of age. In: FENSEL, D. et al. (ed.). Spinning the Semantic Web: bringing the World Wide Web to its full potential. Massachusetts: MIT Press, 2003. Disponível em: <http://www-ksl.stanford.edu/people/dlm/papers/ontologiescome-of-age-mit-press-(with-citation).htm>. Acesso em: 11 set. 2012. MCGUINNESS; D. L.; HARMELEN, F. (Ed.). OWL: Web Ontology Language overview. 2004. Disponível em: <http://www.w3.org/TR/owl-features/>. Acesso em: 2 fev. 2014. MÉNDEZ, E.; GREENBERG, J. Linked Data for Open vocabularies and HIVE’s Global Framework. El Profesional de la Información, v. 21, n.3, p. 236-244, 2012. Disponível em: <http://dx.doi.org/10.3145/epi.2012.may.03>. Acesso em: 21 abr.2013. MILLER, E.; SWICK, R. An overview of W3C Semantic Web activity. Bulletin of the American Society for Information Science and Technology, v. 29, n. 4, p. 8-11, Apr./May 2003. Disponível em: <http://www.asis.org/Bulletin/Apr-03/BulletinAprMay03.pdf>. Acesso em: 16 set. 2012. MINAYO, M. C. de S. (org.). Pesquisa social: teoria, método e criatividade. 20. Ed. Petrópolis: Vozes, 2002. MIRANDA, C. M. C. A disseminação de dados governamentais abertos como serviço público – os dados abertos governamentais e a experiência brasileira. In: CONGRESSO INTERNACIONAL SOFTWARE LIVRE E COMÉRCIO ELETRÔNICO, 4., 2011, Brasília. Dados abertos para a democracia na era digital. Brasília: Fundação Alexandre de Gusmão, 2011. p. 63-73. MOREIRA, M. A. Mapas conceituais e aprendizagem significativa. 1997. Disponível em: <http://www.if.ufrgs.br/~moreira/mapasport.pdf>. Acesso em: 5 set. 2013. MOREIRO GONZÁLEZ, J. A. Linguagens documentárias e vocabulários semânticos para Web: elementos conceituais. Salvador: EdUFBA, 2011. MORIN, E. Introdução ao pensamento complexo. Porto Alegre: Sulina, 2006. MOTTA, D. F. Método relacional como nova abordagem para construção de tesauros. Rio de Janeiro: [s.n.], 1987. Disponível em: <http://www.conexaorio.com/biti/dilza/index.htm>. Acesso em: 02 jan 2014. MYLOPOULOS, J. Conceptual modeling and Telos. In: LOUCOPOULOS, P.; ZICARI, R. (Ed.). Conceptual modeling, databases, and CASE. [S.l.]: Wiley, 1992. Disponível em: 162 <http://citeseerx.ist.psu.edu/viewdoc/summary? doi=10.1.1.83.3647>. Acesso em: 5 jan. 2013. NAÇÕES UNIDAS. Programa das Nações Unidas para o Desenvolvimento. Relatório de desenvolvimento Humano 2013: A Ascensão do Sul: progresso humano num mundo diversificado. New York: Programa Das Nações Unidas para o desenvolvimento, 2013. Disponível em: <http://hdr.undp.org/en/media/ HDR13%20Summary%20PT%20WEB.pdf>. Acesso em: 23/04/2013. NOLETO, D. A.; BRITO, P. F. RDF e RDF Schema na representação de páginas do portal CEULP/ULBRA. In: ENCONTRO DE ESTUDANTES DE INFORMÁTICA DO TOCANTINS, 5, 2003, Palmas. Anais... [Palmas: s.n.], 2003. p. 113-122. NOVELLINO, M. S. F. Instrumentos e metodologias de representação da informação. Inf. Inf., Londrina, v. 1, n. 2, p. 37-45, jul./dez. 1996. Disponível em: <http://www.uel.br/revistas/uel/index.php/informacao/article/viewFile/1603/1358>. Acesso em: 24 fev. 2014. O’LEARY, D. E. Impediments in the use of explicit ontologies for KBS development. Int. J. Human-Computer Studies, v. 46, n. 2/3, 1997. Disponível em: <https://msbfile03.usc.edu/digitalmeasures/doleary/intellcont/ impediments%20to%20ontologies-1.pdf>. Acesso em: 4 maio 2013. OBAMA, B. Memorandum on Transparency and Open Government. 2009. Disponível em: <http://www.whitehouse.gov/the_press_office/ TransparencyandOpenGovernment>. Acesso: 11 nov. 2011. OPEN DEFINITION. 2013. Disponível em: <http://opendefinition.org/okd/ portuguesbrasileiro/>. Acesso em: 24 abr. 2013. OPEN GOVERNMENT PARTNERSHIP. About. 2012. Disponível em: <http://www.opengovpartnership.org/about>. Acesso em: 1 maio 2013. OPENGOVDATA. 8 principles of open government data. 2007. Disponível em: <http://www.opengovdata.org/ home/8principles>. Acesso em: 15 jun. 2011. ORGANIZAÇÃO INTERNACIONAL DO TRABALHO. Escritório no Brasil. Organização Internacional do trabalho: promovendo o trabalho decente. 2013. Disponível em: <http://www.oit.org.br/>. Acesso em: 2 jun. 2013. ORGANIZACIÓN INTERNACIONAL DEL TRABAJO. La taxonomia OIT. 2013. Disponível em: <http://www.ilo.org/public/spanish/support/lib/tools/ taxonomy.htm>. Acesso em: 2 jun. 2013. ORGANIZACIÓN INTERNACIONAL DEL TRABAJO. Tesauro OIT. 2011. Disponível em: <http://www.ilo.org/public/spanish/support/lib/tools/ aboutthes.htm>. Acesso em: 2 jun. 2013. PACHECO, R. C. S.; KERN, V. M. Arquitetura conceitual e resultados da integração de sistemas de informação e gestão da ciência e tecnologia. DataGramaZero – Revista de 163 Ciência da Informação, v. 4, n. 2, abr. 2003. Disponível em: <http://www.dgz.org.br/abr03/Art_03.htm>. Acesso em: 13 maio 2012. PACHECO, R. C. S.; KERN, V. M.; STEIL, A. V. Aplicações de arquitetura conceitual em plataformas E-Gov: da gestão da informação pública à construção da sociedade do conhecimento. PondodeAcesso, Salvador, v. 1, n. 1, p. 71-87, jun. 2007. Disponível em: <http://periodicos.ufpb.br/ojs/index.php/pbcib/article/ view/6994>. Acesso em: 25 jun. 2012. PAUXIS, D.; SILVA, W. O Twitter como disseminador de informação. DataGramaZero, v. 12, n. 6, dez. 2011. Disponível em: <http://www.dgz.org.br/dez11/ Ind_com.htm>. Acesso em: 24 abr. 2013. PEREIRA, C. R. Elementos para construção de um modelo de análise de iniciativas de publicação de dados governamentais abertos. São Paulo, 2012. Trabalho de Conclusão de Curso (Graduação em Gestão de Políticas Públicas) – Universidade de São Paulo, 2012. PICKLER, M. E. V. Web Semântica: ontologias como ferramentas de representação do conhecimento. Perspectivas em Ciência da Informação, v. 12, n. 1, p. 65-83, jan./abr. 2007. Disponível em: <http://www.scielo.br/pdf/pci/v12n1/ 05.pdf>. acesso em: 5 abr. 2013. PINHO, J. A. G.; SACRAMENTO, A. R. S. Accountability: já podemos traduzi-la para o português. RAP, Rio de Janeiro, v. 43, n. 6, p. 1343-1368, nov./dez. 2009. Disponível em: <http://www.scielo.br/pdf/rap/v43n6/06.pdf>. Acesso em: 22 fev. 2013. PLACES ontology. [2014?]. Disponível em: <http://purl.org/ontology/places#>. Acesso em: 3 mar. 2014. PODER Vocabulary. [2014?]. Disponível em: <http://dev.poderopedia.com/vocab/schema>. Acesso em: 2 mar. 2014. PRADO, E. P. V. et al. Iniciativas de governo eletrônico: análise das relações entre nível de governo e características dos projetos em casos de sucesso. Revista Eletrônica de Sistemas de Informação, v. 10, n. 1, 2011. Disponível em: <http://revistas.facecla.com.br/index.php/reinfo/article/view/793>. Acesso em: 30 nov. 2012. RAMALHO, R. A. S.; OUCHI, M. T. Tecnologias semânticas: novas perspectivas para representação de recursos informacionais. Inf. Inf., Londrina, v. 16, n. 3, p. 60-75, jan./jun. 2011. RAMBAYON, A. Storing RDF data efficiently with E-R modeling. 2012. Disponível em: <http://misclassblog.com/database-design-and-development/storing-rdf-data-efficiently-withe-r-modeling/>. Acesso em: 2 mar. 2014. RAMOS SIMÓN, L. F. et al. De La reutilización de información del sector público a los portales de datos abiertos en Europa. BID: textos universittaris de biblioteconomia i documentación, Barcelona, n. 29, p. 1-36, dic. 2012. Disponível em: <http://www.ub.edu/bid/29/ramos2.htm>. Acesso em: 4 mar. 2013. RIBEIRO, C. J. S. Diretrizes para o projeto de portais de informação: uma proposta interdisciplinar baseada na Análise de Domínio e Arquitetura da Informação. 2008. 283 f. 164 Tese (Doutorado em Ciência da Informação) – Universidade Federal Fluminense, Niterói, 2008. RIBEIRO, C. J. S. Em busca da organização do conhecimento: a gestão da informação nas bases de dados da Previdência Social brasileira com o uso da abordagem de análise de domínio. 2001. 162 f. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal do Rio de Janeiro, Rio de janeiro, 2001. RIBEIRO, C. J. S.; ALMEIDA, R. F. Dados Abertos Governamentais (Open Government Data): instrumento para exercício de cidadania pela sociedade. In. ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 12., 2011, Brasília). Anais... Brasília: ANCIB, 2011. p. 2568-2580. RIBEIRO, C. P. P. et al. Difusão da informação na administração pública. TransInformação, Campinas, v. 23, n. 2, p. 159-171, maio/ago 2011. Disponível em: <http://periodicos.puccampinas.edu.br/seer/index.php/transinfo/article/ view/474/454>. Acesso em: 12 jan. 2013. RIBEIRO, M. M. O uso das tecnologias de informação e comunicação como ferramentas de combate à corrupção: Comprasnet e o Portal da Transparência. 2008. 3. Concurso de monografias da GCU – Controladoria-Geral da União. Disponível em: <http://www.esaf.fazenda.gov.br/esafsite/premios/CGU/ Monografias_2008/Manuella_Maia_Ribeiro_-_2_Lugar_-_U.pdf>. Acesso em: 12 fev. 2013. RODRIGUES, G. Dados governamentais abertos no Brasil: surgimento, expansão e perspectivas. São Paulo, 2012. Trabalho de Conclusão de Curso (Graduação em Gestão de Políticas Públicas) - Escola de Artes, Ciências e Humanidades da Universidade de São Paulo, 2012. RUEDIGER, M. A. Governo eletrônico ou governança eletrônica: conceitos alternativos no uso das tecnologias de informação para o provimento de acesso cívico aos mecanismos de governo e reforma do Estado. XVI Concurso de ensayos y monografias Del CLAD sobre reforma Del estado y modernización de la administración pública “gobierno electrónico”. Caracas, 2002. Disponível em: <http://www.egov.ufsc.br/portal/sites/default/files/anexos/29564-29580-1-PB.pdf>. Acesso em: 24 abr. 2012. SALES,L. F.; SAYÃO, L. F.; MOTTA, D. F. Modelagem de relações conceituais para a área nuclear. In. SEMINÁRIO DE PESQUISA EM ONTOLOGIAS DO BRASIL, 5, 2012, Recife). Anais... Recife: UFPE, 2012. SANT’ANA, R. C. G. Tecnologia e gestão pública municipal: mensuração da interação com a sociedade. São Paulo: Cultura Acadêmica, 2009. SANTOS NETO, A. et al. Tecnologias de dados abertos para interligar bibliotecas, arquivos e museus: um caso machadiano. Transinformação, Campinas, v. 25, n. 1, 2013. Disponível em: <https://www.puc-campinas.edu.br/periodicocientifico>. Acesso em: 26 maio 2013. SANTOS, P. M. Teoria e prática de governo aberto: lei de acesso à informação nos executivos municipais da região sul. Florianópolis: Fundação Boiteux, 2012. 165 SARACEVIC, T. Ciência da Informação: origem, evolução e relações. Perspec. Ci. Inf., Belo Horizonte, v. 1, n. 1, p. 41-62, jan./jun. 1996. SAYÃO, L. F. Modelos teóricos em Ciência da Informação – abstração e método científico. Ci. Inf., Brasília, v. 30, n. 1, p. 82-91, jan./abr. 2001. Disponível em: <http://revista.ibict.br/ciinf/index.php/ciinf/article/view/228/203>. Acesso em: 22 maio 2013. SCHEMA.ORG. [2014?]. Disponível em: <http://schema.org/>. Acesso em: 2 mar. 2014. SCHERP, A. et al. F-A modelo f events based on the foundational ontology DOLCE+DnS Ultralite. 2009. Disponível em: <http://west.unikoblenz.de/Research/ontologies/events/event-model-f-kcap.pdf>. Acesso em: 2 dez. 2013. SENRA, N. C. Informação estatística: política, regulação, coordenação. Ci. Inf., Brasília, v. 28, n. 2, maio/ago. 1999. Disponível em: <http://www.scielo.br/ cielo.php? script=sci_arttext&pid=S0100-19651999000200004>. Acesso em: 17 jan. 2013. SENSO, J. A.; HÍPOLA, P. Creación de directorios de recursos Web con LDAP y RDF. 2007. Disponível em: <http://eprints.rclis.org/17347/1/senso-hipola-v1.0.pdf>. Acesso em: 18 abr. 2012. SHADBOLT, N.; HALL, W.; BERNERS-LEE, T. The Semantic Web revisited. IEEE Intelligent Systems, p. 96-101, May/Jun. 2006. Disponível em: <http://eprints.soton.ac.uk/262614/1/Semantic_Web_Revisted.pdf>. Acesso em: 01 abr. 2012. SILBERSCHATZ, A. ; KORTH, H. ; SUDARSHAN, S. Sistemas de bancos de dados. 3.ed. São Paulo: Makron Books, 1999. SILVA, D. L. da; SOUZA, R. R.; ALMEIDA, M. B. Comparação de metodologias para construção de ontologias e vocabulários controlados. Ci. Inf., Brasília, v. 37, n. 3, p. 60-75, set./dez, 2008. Disponível em: <http://www.scielo.br/pdf/ci/v37n3/ v37n3a05. pdf>. Acesso em: 5 abr. 2013. SILVA, F. C. Habermas e a esfera pública: reconstruindo a história de uma idéia. Sociologia, problemas e práticas, n. 35, p. 117-138, 2001. Disponível em: <http://www.scielo.gpeari.mctes.pt/scielo.php?pid=S087365292001000100006&script=sci_arttext>. Acesso em: 21 jan. 2013. SILVA, T. L. DOLCE X UFO: comparativo entre ontologias de fundamentação. 2011. Disponível em: <http://greco.ppgi.ufrj.br/academico/moodledata/81/moddata/assignment/264/96/TrabalhoFin al_v1.3.pdf>. Acesso em: 22 out. 2013. SIMÃO, J. B., RODRIGUES, G. Acessibilidade às informações públicas: uma avaliação do portal de serviços de serviço e informações do governo federal. Ci. Inf., Brasília, v. 34, n. 2, p. 81-92, maio/ago. 2005. Disponível em: <http://www.scielo.br/pdf/ci/v34n2/28558.pdf>. Acesso em: 25 mar. 2013. 166 SMITH, B.; KUMAR, A. Revisiting UMLS Semantic Network. In: FIESCHI, M. et al. (Eds.). MEDINFO 2014, Amsterdam: IOS Press, 2004. Disponivel em: <http://ontology.buffalo.edu/medo/UMLS_SN.pdf>. Acesso em: 20 mar. 2014. SMITH, J. M.; SMITH, D. C. P. Database abstractions: aggregation and generalization. ACM Transactions on database systems, v. 2, n. 2, p. 105-133, Jun. 1977. SMITH, M. K.; WELTY, C.; MCGUINNESS, D. L. OWL: Web Ontology Language Guide. 2004. Disponível em: <http://www.w3.org/TR/2004/REC-owl-guide-20040210/>. Acesso em: 2 fev. 2014. SOBRAL, F. C. F.; CAMPOS, M. L. A. Modelaem conceitual como instrumento de comunicação no processo de submissão de artigos de periódico eletrônico. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 14., 2013, Florianópolis. Anais... Brasília: ANCIB, 2013. Disponível em: <http://enancib.sites.ufsc.br/index.php/enancib2013/XIVenancib/paper/viewFile/348/322>. Acesso em: 10 dez. 2013. SOUZA, F. C. S. As possibilidades pedagógicas no ensino de metodologia da pesquisa científica em Ciência da Informação e os objetos deste campo científico: aproximações durkheimianas. Enc. Bibli.: Eletr. Bibliotecon. Ci. Inf., Florianópplis, n. 16, jul./dez., 2003. Disponível em: <http://eprints.rclis.org/8591/>. Acesso em: 24 mar. 2012. SOUZA, R. R.; ALVARENGA, L. A Web Semântica e suas contribuições para a Ciência da Informação. Ci. Inf. Brasília, v. 33, n. 1, p. 132-141, jan./abr. 2004. SPERBERG-MCQUEEN, C. M.; THOMPSON, H. XML Schema. 2010. Disponível em: <http://www.w3.org/XML/Schema>. Acesso em: 2 mar. 2014. TAUILE. J. R. Uma introdução à economia política da informação. Ensaios FEE, Porto Alegre, v. 2, n. 2, p. 89-108, 1981. Disponível em: <http://revistas.fee.tche.br/ndex.php/ensaios/article/viewArticle/135>. Acesso em: 02 set. 2012. TEOREY, T. J.; YANG, D.; FRY, J. A logical design methodology for relational databases using the extended Entity-Relationship Model. Computing surveys, v. 18, n. 2, p. 197-222. Jun. 1986. THANEY, K. Sharing data on the Web. Nodalities: the magazine of the Semantic Web, v. 9, p. 7-8, 2010. THOMPSON, H. S. What’s a URI and why does it matter?. 2010. Disponível em: <http://www.ltg.ed.ac.uk/~ht/WhatAreURIs/>. Acesso em: 5 mar. 2014. UNITED NATIONS. Department of Economic and Social Affairs. United Nations EGovernment 2012: E-Government for the people. Ney York: United Nations, 2012. Disponível em: <http://unpan1.un.org/intradoc/groups/public/documents/ un/unpan048065.pdf>.Acesso em: 21 abr. 2013. 167 UNITED STATES. Data.gov. 2013. Disponível em: <http://www.data.gov/about>. Acesso em: 1 maio 2013. USCHOLD, M.; GRÜNINGER, M. Ontologies: principles, methods, and applications. Knownledge Enginnering Review, v. 1, p. 96-137, 1996. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/summary? doi=10.1.1.111.5903>. Aceso em: 14 jan. 2012. VALENTÍN RUIZ, F. J.; BUENESTADO DEL PESO, R. Aproximación al panorama actual de la reutilización de la información del sector público. BID: textos universittaris de biblioteconomia i documentación, Barcelona, n. 29, p. 1-36, dic. 2012. Disponível em: < http://www.ub.edu/bid/29/valentin2.htm>. Acesso em: 4 mar. 2013. VANDENBUSSCHE, P.-Y. Linked Open Vocabularies (LOV). [2014?]. Disponível em: <http://lov.okfn.org/dataset/lov/index.html>. Acesso em: 2 mar. 2014. VAZ, J. C.; RIBEIRO, M. M.; MATHEUS, R. Dados governamentais abertos e seus impactos sobre os conceitos e práticas de transparência no Brasil. Cadernos PPG-AU/UFBA, v. 9, ed. esp., p. 45-62, 2010. Disponível em: <http://www.portalseer. ufba.br/index.php/ppgau/article/view/5111>. Acesso em: 28 jun. 2011. VIEGAS, W. Fundamentos lógicos da metodologia científica. Brasília: UNB, 2007. W3C. Escritório Brasil. Melhorando o acesso ao governo com melhor uso da Web. São Paulo: W3C, 2009. Disponível em: <http://www.w3c.br/divulgacao/pdf/ gov-web.pdf>. Acesso em: 28 jun. 2011. W3C. Event. In: DUL ssn. 2005. Disponível em: <http://www.w3.org/2005/Incubator/ssn/wiki/DUL_ssn#Event>. Acesso em: 15 dez. 2013. W3C. SKOS Simple Knowledge Organization System: reference. 2009. Disponível em: <http://www.w3.org/TR/2009/REC-skos-reference-20090818/>. Acesso em: 2 jun. 2013. W3C. The Cambridge comunique: w3c note 7 October 1999. 1999. Disponível em: <http://www.w3.org/TR/schema-arch>. Acesso em: 2 fev. 2014. WELTY, C.; GUARINO, N. Supporting ontological analysis of taxonomic relationships. Data & Knowledge Engineering, v. 39, p. 51-74, 2001. WERSIG, G. Information Science: the study of postmodern knowledge usage. Information Processing & Management, v. 29, n. 2, p. 229-239, 1993. WIKILEAKS. What is WikiLeaks?. 2013. Disponível em: <http://wikileaks.org/About.html>. Acesso em: 01 maio 2013. WIKIPÉDIA. Crowdfunding. 2013a. Disponível em: <http://pt.wikipedia.org/wiki/ Financiamento_coletivo>. Acesso em: 24 abr. 2013. WIKIPÉDIA. Crowdsourcing. 2013b. Disponível em: <http://pt.wikipedia.org/wiki/ Crowdsourcing>. Acesso em: 24 abr. 2013. 168 WIKIPÉDIA. Smart Grid. 2013c. Disponível em: <http://en.wikipedia.org/wiki/ Smart_grid>. Acesso em: 1 maio 2013. XU, L.; LEE, S. W.; KIM, S. E-R Model based RDF data storage in RDB. In: IEEE International Conference on Computer Science and Information Technology (ICCSIT) (3rd., 2010, Chengdu). Proceedings… 2010. v. 9. Disponível em: <http://ieeexplore.ieee.org/xpl/mostRecentIssue.jsp?punumber=5550976>. Acesso em: 2 mar. 2014. ZILLER, J.; MANTOVANI, C. M. C. A.; SOUZA, R. R. Apontamentos para o futuro dos sistemas de recuperação de informação. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 8, 2007, Salvador. Anais... Salvador: ANCIB, 2012. ZUGMAN, F. Governo eletrônico. São Paulo: Livro Pronto, 2006.