modelagem e representação semântica de dados governamentais

Transcrição

modelagem e representação semântica de dados governamentais
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA INFORMAÇÃO
MESTRADO EM CIÊNCIA DA INFORMAÇÃO
UNIVERSIDADE FEDERAL FLUMINENSE
INSTITUTO DE ARTE E COMUNICAÇÃO SOCIAL
DURVAL VIEIRA PEREIRA
MODELAGEM E REPRESENTAÇÃO SEMÂNTICA DE DADOS
GOVERNAMENTAIS ABERTOS DA PREVIDÊNCIA SOCIAL BRASILEIRA
Niterói
2014
DURVAL VIEIRA PEREIRA
MODELAGEM E REPRESENTAÇÃO SEMÂNTICA DE DADOS
GOVERNAMENTAIS ABERTOS DA PREVIDÊNCIA SOCIAL BRASILEIRA
Dissertação de Mestrado apresentada como requisito
parcial para obtenção do título de Mestre em Ciência da
Informação do Programa de Pós-Graduação em Ciência
da Informação da Universidade Federal Fluminense.
Orientador: Profº. Drº. Carlos Henrique Marcondes
NITERÓI
2014
P436
Pereira, Durval Vieira
Modelagem e representação semântica de dados governamentais
abertos da Previdência Social brasileira / Durval Vieira Pereira. –
2014.
168 f. : il.
Orientador: Carlos Henrique Marcondes.
Dissertação (Mestrado em Ciência da Informação) – Universidade
Federal Fluminense, Departamento de Ciência da Informação,
Programa de Pós-Graduação em Ciência da Informação, 2014.
1. Modelagem conceitual. 2. Dados governamentais abertos. 3. Web
Semântica. 4. Acidente do trabalho. 5. Previdência Social.
I. Marcondes, Carlos Henrique. II. Universidade Federal Fluminense.
Departamento de Ciência da Informação. Programa de Pós-Graduação
em Ciência da Informação. III. Título.
CDD 025.48
DURVAL VIEIRA PEREIRA
MODELAGEM E REPRESENTAÇÃO SEMÂNTICA DE DADOS
GOVERNAMENTAIS ABERTOS DA PREVIDÊNCIA SOCIAL BRASILEIRA
Dissertação de Mestrado apresentada como requisito
parcial para obtenção do título de Mestre em Ciência da
Informação do Programa de Pós-Graduação em Ciência
da Informação da Universidade Federal Fluminense.
Aprovada em:________________________________________.
Banca examinadora:
________________________________________
Prof.º Dr. Carlos Henrique Marcondes – Orientador
Universidade Federal Fluminense – UFF
________________________________________
Prof.º Dr. Cláudio José Silva Ribeiro – Membro Titular
Universidade Federal do Estado do Rio de Janeiro - UNIRIO
________________________________________
Prof.ª Drª Maria Luiza de Almeida Campos – Membro Titular
Universidade Federal Fluminense - UFF
________________________________________
Prof.ª Drª Regina de Barros Cianconi – Membro Titular
Universidade Federal Fluminense - UFF
________________________________________
Prof.ª Drª Sandra Lúcia Rebel Gomes – Suplente
Universidade Federal Fluminense – UFF
________________________________________
Prof.º Dr. Marcos Luiz Cavalcanti de Miranda – Suplente
Universidade Federal do Estado do Rio de Janeiro - UNIRIO
Niterói
2014
Dedico este trabalho a todos que estiveram comigo
durante esta jornada e que com paciência me
ajudaram a continuar.
DEDICATÓRIA
Ao meu orientador Marcondes, pela acolhida, pelos ensinamentos, pelo exemplo de
profissional e por me mostrar um caminho de estudo.
Aos meus pais por terem criado um ambiente favorável à minha formação.
Aos membros da banca pela disponibilidade e importantes contribuições teóricometodológicas.
Ao professor Cláudio J. S. Ribeiro pelas parcerias e discussões que tanto contribuíram para o
resultado aqui alcançado.
À Suzana Huguenin por me levar sempre a progredir na vida acadêmica. À Daniele Achilles e
Fabiana Vilar pelo incentivo, pelas risadas e pelas ajudas em momentos cruciais. Ao Fabiano
Cataldo pelo companheirismo e palavras de sabedoria.
Aos funcionários do PPGCI/UFF, principalmente da secretaria Vitor e Luciana, pelo apoio
sempre eficiente.
À Dataprev pelo incentivo dado no início da pesquisa;
“Information is a relationship”
(BARLOW, 1994)
RESUMO
Objetiva propor um modelo conceitual dos dados sobre acidentes do trabalho para publicação
dos dados governamentais mantidos pela Previdência Social. Busca na literatura modelos
conceituais ou vocabulários sobre acidentes do trabalho, analisa o Vocabulário Controlado do
Governo Eletrônico (VCGE), o modelo de publicações de dados sobre acidentes do trabalho
publicado pela Dataprev e o tesauro e a taxonomia da Organização Internacional do Trabalho
(OIT). Identifica a ausência de um modelo conceitual dos dados da Previdência Social para
publicação em formato aberto e utiliza as tecnologias de Web Semântica, de forma a torná-las
compartilháveis, acessíveis e reutilizáveis. Seleciona e analisa definições de acidente do
trabalho e identifica conceitos e relacionamentos. Classifica os conceitos encontrados de
acordo com as ontologias UFO-B e DUL. Utiliza o modelo Entidade-Relacionamento para
auxiliar na elaboração de um modelo que consiga representar o domínio sobre acidente do
trabalho. Constata a necessidade da elaboração de um vocabulário específico para descrever
os conceitos sobre acidentes do trabalho como forma de enriquecer a representação dos dados
analisados. Representa uma amostra dos dados em RDF, utilizando o modelo conceitual e o
vocabulário proposto. Conclui que a elaboração do modelo conceitual e a descrição em RDF
pareceram adequadas para organizar e fornecer um nível mínimo de semântica aos dados
sobre acidente do trabalho da Previdência Social brasileira.
Palavras-chave: Modelagem conceitual. Dados governamentais abertos. Web Semântica.
Acidente do trabalho. Previdência social.
ABSTRACT
This project studies the conceptualization model about occupational accidents at Social
Security for open government data. It conducts research literature to identify conceptual
models or vocabulary about workplace accidents from the analysis of E-Government
Controlled Vocabulary (VCGE from the Portuguese language), the occupational accident
model published by Dataprev and also the taxonomy and thesaurus of International Labour
Organization (ILO). It identifies the absence of a conceptual model for Social Security data
for publication in an open format using Web Semantics technologies, to make this data
sharable, affordable and reusable. It selects and discusses the definitions of occupational
accidents by identifying concepts and relationships. It classifies the concepts found in
accordance with ontologies UFO-B and DUL. It uses the Entity-Relationship model to assist
in developing a model that can represent the domain of occupational accident. It notes the
need to develop a specific vocabulary to describe the concepts of occupational accidents as a
way to enhance the representation of the data analyzed. It represents part of the data in RDF
using the proposed conceptual model and vocabulary. It concludes that the development of
the conceptual model and description in RDF seemed appropriate to organize and provide a
minimum level of semantic data on occupational accident at Brazilian Social Security.
Keywords: Conceptual modeling. Open Government Data. Semantic Web. Occupational
accident. Social Security.
LISTA DE FIGURAS
Figura 1
Modelo de construção do conceito..................................................................
33
Figura 2
Triângulo do conceito...................................................................................... 34
Figura 3
Exemplo de Diagrama ER...............................................................................
Figura 4
Evolução da Web............................................................................................. 49
Figura 5
Arquitetura da Web Semântica........................................................................ 49
Figura 6
URI na representação de um recurso............................................................... 51
Figura 7
Dados em XML sobre acidente do trabalho....................................................
52
Figura 8
Grafo de triplas (sujeito, predicado e objeto)..................................................
55
Figura 9
Expressividade semântica de instrumentos de representação do
44
conhecimento................................................................................................... 60
Figura 10
Taxonomia das categorias básicas da DOLCE................................................ 62
Figura 11
Visão parcial da Ontologia DUL.....................................................................
Figura 12
Fragmento da UFO-B: Objetos e Eventos....................................................... 64
Figura 13
Evolução da Web Semântica com os Dados Abertos Interligados.................
71
Figura 14
Classificação de dados publicados..................................................................
72
Figura 15
Esquema para classificar bases de dados publicados na WEB.......................
72
Figura 16
Estrutura de LOD das bases de dados do Governo Brasileiro........................
73
Figura 17
Diagrama da nuvem de LOD........................................................................... 73
Figura 18
Página eletrônica do Ligado nos Políticos......................................................
74
Figura 19
Arquitetura para plataforma tecnológica de governo eletrônico.....................
81
Figura 20
Portal da Transparência do Governo Federal do Brasil..................................
87
Figura 21
Aplicativo utilizando dados do Data.gov........................................................
98
Figura 22
Aplicativo utilizando dados do Data.gov.uk...................................................
99
Figura 23
Aplicativo utilizando dados do Data.gov.br....................................................
102
Figura 24
Previdência social no VCGE...........................................................................
106
Figura 25
Descrição temática dos dados de acidente do trabalho publicados no Portal
Dados.gov.br...................................................................................................
63
109
Figura 26
Modelo de domínio sobre acidentes do trabalho, publicado pela Dataprev.... 111
Figura 27
Termos “Previdência Social” e “Acidente do trabalho” no tesauro da OIT.... 113
Figura 28
Termos “Previdência Social” e “Acidente do trabalho” na taxonomia da
OIT................................................................................................................... 114
Figura 29
Proposta de diagrama ER da definição 1 sobre acidente do trabalho.............. 117
11
Figura 30
Proposta de diagrama ER da definição 2 sobre acidente do trabalho.............. 118
Figura 31
Proposta de diagrama ER da definição 3 sobre acidente do trabalho.............. 120
Figura 32
Proposta de diagrama ER da definição 4 sobre acidente do trabalho.............. 122
Figura 33
Proposta de diagrama ER da definição 5 sobre acidente do trabalho.............. 124
Figura 34
Proposta de diagrama ER sobre acidente do trabalho aliados aos dados da
Previdência Social...........................................................................................
129
Figura 35
Proposta de diagrama ER dos dados publicados pela Dataprev...................... 134
Figura 36
XML de acidentes do trabalho ocorridos na cidade do Rio de Janeiro...........
Figura 37
Representação dos dados selecionados em RDF............................................. 143
134
LISTA DE QUADROS
Quadro 1
Análise da definição 1 sobre acidente do trabalho..........................................
117
Quadro 2
Análise da definição 2 sobre acidente do trabalho..........................................
118
Quadro 3
Análise da definição 3 sobre acidente do trabalho..........................................
119
Quadro 4
Análise da definição 4 sobre acidente do trabalho..........................................
120
Quadro 5
Análise da definição 5 sobre acidente do trabalho..........................................
123
Quadro 6
Relações utilizadas nas representações...........................................................
125
Quadro 7
Termos sobre acidente do trabalho aliados aos dados da Previdência
Social...............................................................................................................
127
Quadro 8
Classe do objeto............................................................................................... 136
Quadro 9
Propriedades do objeto....................................................................................
137
Quadro 10 Atributos..........................................................................................................
138
Quadro 11 Triplas de RDF propostas com base no diagrama ER..................................... 142
Quadro 12 Triplas de RDF propostas utilizando URIs.....................................................
142
LISTA DE SIGLAS
AEAT - Anuário estatístico de acidentes do trabalho
AEPS - Anuário Estatístico da Previdência Social
ARPANET - Advanced Research Project Agency Network
BDTD - Biblioteca Digital de Teses e Dissertações
BFO - Basic Formal Ontology
BRAPCI - Base de Dados Referencial de Artigos de Periódicos em Ciência da Informação
CAT - Comunicação de Acidente do Trabalho
CBO - Classificação Brasileira de Ocupações
CEGE - Comitê Executivo do Governo Eletrônico
CERN - European Organization for Nuclear Research
CGU - Controladoria-Geral da União
CID - Classificação Internacional de Doenças
CNAE - Classificação Nacional de Atividades Econômicas
CSV - Comma-Separeted Values
DATAPREV - Empresa de Tecnologias e Informação da Previdência Social
DGA - Dados Governamentais Abertos
DnS - Descriptions and Situations
DOLCE - Descriptive Ontology for Linguistics and Cognitive Engineering
DTD - Document Type Definition
DUL - DOLCE+DnS Ultralite
EDM - Europeana Data Model
EIA - Energy Information Administration
e-PING - Padrões de Interoperabilidade de Governo Eletrônico
HTML - HyperText Markup Language
INDRA - Infraestrutura Nacional de Dados Abertos
INSS - Instituto Nacional de Seguro Social
LAG - Lista de Assuntos do Governo
LAI - Lei de Acesso a Informação
LOD - Linked Open Data
LOV - Linked Open Vocabularies
LPO - Lógica de Primeira Ordem
NE - Notas de Escopo
NPR - National Performance Review
OCDE - Organização para Cooperação e Desenvolvimento Econômico
OIT - Organização Internacional do Trabalho
ONG - Organizações Não Governamentais
OWL - Web Ontology Language
PDF - Portable Document Format
PNAD - Pesquisa Nacional por Amostra de Domicílios
RDF - Resource Description Framework
RDFS - Resource Description Framework Schema
SGML - Standard Generalized Markup Language
SISP - Sistema de Administração dos Recursos de Informação e Informática
SKOS - Simple Knowledge Organisation Systems
SLTI - Secretaria de Logística em Tecnologia de Informação
SRI - Sistemas de Recuperação da Informação
TIC - Tecnologias de Informação e Comunicação
TSE - Tribunal Superior Eleitoral
UF - Unidades Federativas
UFO - Unified Foundational Ontology
UML - Unified Modeling Language
URI - Uniform Resource Identifier
VCGE - Vocabulário Controlado do Governo Eletrônico
WWW - World Wide Web
XML - eXtensible Markup Language
SUMÁRIO
1
INTRODUÇÃO...............................................................................................
14
1.1
MOTIVAÇÃO DA PESQUISA........................................................................ 15
1.2
RECORTE ESCOLHIDO.................................................................................
1.3
QUESTÕES A SEREM RESPONDIDAS........................................................ 21
1.4
ORGANIZAÇÃO DA PESQUISA...................................................................
22
2
OBJETIVOS....................................................................................................
23
2.1
OBJETIVO GERAL.......................................................................................... 23
2.2
OBJETIVOS ESPECÍFICOS............................................................................
23
3
ESCOPO E PROCEDIMENTOS METODOLÓGICOS............................
24
3.1
ESCOPO............................................................................................................ 24
3.2
METODOLOGIA.............................................................................................. 24
4
MARCO TEÓRICO........................................................................................ 29
4. 1
REPRESENTAÇÃO DO CONHECIMENTO.................................................. 29
4.1.1
Uma visão acerca do conceito......................................................................... 30
4.1.2
Teoria do conceito............................................................................................ 32
4.1.3
Modelagem conceitual..................................................................................... 38
4.1.4
Modelo Entidade-Relacionamento................................................................. 42
4.2
WEB SEMANTICA E SUAS TECNOLOGIAS..............................................
47
4.2.1
Identificando recursos com URI....................................................................
51
4.2.2
XML e a descrição de dados...........................................................................
52
4.2.3
RDF como linguagem de representação de dados........................................
54
4.2.4
Ontologia e acidente do trabalho como evento.............................................
56
4.2.5
OWL como ontologia para Web Semântica.................................................. 67
4.2.6
Dados Abertos Interligados............................................................................
4.3
ASPECTOS LEGAIS SOBRE ACESSO À INFORMAÇÃO PLÚBICA........ 74
4.4
UM OLHAR SOBRE O GOVERNO ELETRÔNICO.....................................
78
4.4.1
Accountability...................................................................................................
84
4.4.2
Transparência em ações públicas................................................................... 86
4.5
DADOS GOVERNAMENTAIS ABERTOS.................................................... 89
4.5.1
Iniciativas estrangeiras de dados governamentais abertos.......................... 96
4.5.2
Iniciativas nacionais de dados governamentais abertos............................... 99
19
70
16
5
INSTRUMENTOS DE REPRESENTAÇÃO DA INFORMAÇÃO
SOBRE ACIDENTES DO TRABALHO......................................................
104
5.1
ACIDENTE DO TRABALHO NO VCGE.......................................................
104
5.2
ACIDENTE DO TRABALHO NO MODELO DE PUBLICAÇÕES DE
DADOS PUBLICADOS PELA DATAPREV..................................................
5.3
ACIDENTES DO TRABALHO NO TESAURO E NA TAXONOMIA DA
OIT....................................................................................................................
6
110
112
EM BUSCA DE UM MODELO A PARTIR DAS DEFINIÇÕES
SOBRE ACIDENTE DO TRABALHO......................................................... 116
6.1
ANÁLISE
DAS
DEFINIÇÕES
ACERCA
DE
ACIDENTES
DO
TRABALHO.....................................................................................................
6.2
MODELO
CONCEITUAL
SOBRE
ACIDENTE
DO
116
TRABALHO
ASSOCIADO AOS DADOS DA PREVIDÊNCIA SOCIAL........................... 126
7
ELABORAÇÃO E REUSO DE VOCABULÁRIOS: A QUESTÃO
SOBRE ACIDENTE DO TRABALHO........................................................
132
7.1
SELEÇÃO DOS DADOS PUBLICADOS PELA DATAPREV...................... 132
7.2
ELABORAÇÃO
DO
VOCABULÁRIO
SOBRE
ACIDENTE
DO
TRABALHO.....................................................................................................
8
135
DESCRIÇÃO DOS DADOS SOBRE ACIDENTE DO TRABALHO EM
RDF................................................................................................................... 140
9
CONSIDERAÇÕES FINAIS E EXPECTATIVAS...................................... 144
REFERÊNCIAS..............................................................................................
147
14
1 INTRODUÇÃO
No cenário atual, os governos têm se preocupado em adotar medidas que servem de
elo entre os serviços por eles oferecidos e os cidadãos. São investidos diversos recursos na
criação e no aprimoramento de práticas de gestão pública com o objetivo de melhorar a
qualidade do atendimento, tornando os serviços e as informações disponíveis on-line para o
cidadão. Essas iniciativas aliadas às Tecnologias de Informação e Comunicação (TIC)
propiciaram a implantação de um novo modelo de gestão pública chamada governo
eletrônico1.
A Organização para Cooperação e Desenvolvimento Econômico (OCDE) define, de
forma geral, o governo eletrônico como sendo o uso de tecnologias de informação e
comunicação, em particular a Internet, enquanto ferramenta para levar a um melhor governo.
(OCDE, 2003 apud ALONSO; FERNEDA; BRAGA; 2011).
No Brasil, as iniciativas voltadas para o governo eletrônico intensificaram-se nos anos
90, em consequência do esgotamento do modelo de gestão burocrática. Diniz et al. (2009)
afirma que a ideia de governo eletrônico, em alguns casos, está vinculada à modernização da
administração pública e na melhoria da eficiência dos processos operacionais e
administrativos e, em outros casos, é associada a prestação de serviços públicos eletrônicos.
Entretanto, a visão de que a população é apenas consumidora passiva de serviços e
informações disponibilizadas pelo Governo já não atende a realidade da sociedade em geral.
Os cidadãos assumiram uma preocupação com a transparência, controle social e participação
efetiva nas decisões relacionadas às ações governamentais. (AGUNE, GREGORIO FILHO,
BOLLIGER, 2010; DINIZ, 2010; DINIZ et al., 2009).
Diante do exposto, pode-se dizer que o governo eletrônico possui três vertentes: a
primeira é modernizar os processos operacionais da gestão pública, a segunda é fornecer
serviços públicos aos cidadãos e a terceira é oferecer infraestrutura para habilitar a população
a recuperar e reutilizar dados fornecidos pelo Governo. (BREITMAN et al., 2009).
É sobre essa terceira vertente do governo eletrônico que recai um dos aspectos do
objeto de estudo: os dados governamentais abertos.
1
Governo eletrônico também é conhecido como: e-gov, e-governo, governo digital, governo virtual, Estado
virtual, governança eletrônica. (DINIZ et al., 2009, p. 25)
15
O W3C (2009, p. 39) define dados governamentais abertos (DGA) como sendo a
publicação de informações do setor público “em formato bruto aberto, de maneira a torná-los
acessíveis a todos e permitir sua reutilização, como a criação de mashups2 de dados”.
Os dados governamentais abertos buscam a publicação na Web de informações do
setor público em formato bruto e aberto, legíveis não somente por pessoas, mas também
inteligíveis por máquinas, de modo a permitir sua reutilização em novas aplicações digitais
desenvolvidas pela sociedade.
1.1 MOTIVAÇÃO DA PESQUISA
A Ciência da Informação e a Tecnologia da Informação possuem uma relação de
proximidade entre si. Desde o seu objeto de estudo, passando pelo motivo de seu surgimento,
até o resultado final de seu objetivo, a Ciência da Informação, como também a Tecnologia da
Informação, tem um caminho científico pautado na otimização de fluxos de comunicação e na
organização, recuperação e disseminação da informação.
Com base no tema aqui proposto, buscou-se na literatura da área o momento da
inserção do Estado (interferência política e análise de informações governamentais) e da
tecnologia (estudo e utilização) na Ciência da Informação. Nos textos de Burke (2007),
Capurro (2003), Costa (1999), Fernandes (2006), Freire (2006), Freitas (2003), González de
Gómez (2002), Hjørland (1998), Marteleto (2009), Saracevic (1996) e Wersig (1993) o
Estado e a tecnologia aparecem, de forma explícita ou subtendida, ligados ao surgimento da
Ciência da Informação.
Surgida principalmente com cunho bélico, a relação entre o Estado e as tecnologias
não parece incluída na Ciência da Informação, porém se destaca como parte de sua formação.
Contribuindo, ainda nos dias presentes, para o desenvolvimento deste campo do
conhecimento, principalmente, no que tange a organização e recuperação da informação.
É lícito dizer que na visão de muitos teóricos da área, dentre eles Hjørland (1998), o
objetivo primordial da Ciência da Informação é a organização e recuperação da informação.
Em outras palavras, ela foi criada com este propósito e continua tendo-o como principal fim
almejado. Por essa razão, tantas pesquisas na Ciência da Informação ligadas à área
tecnológica.
2
Mashup é definido pelo W3C (2009, p. 39) como sendo “a mistura de dados de dois ou mais aplicativos ou
fontes de dados diferentes, produzindo pontos de vista comparativos das informações combinadas”.
16
A iniciativa dos dados governamentais abertos pode colaborar para o desenvolvimento
tecnológico, buscando, por exemplo, formas eficazes de publicação de dados na Web. E pode
contribuir também para o aspecto social da Ciência da Informação. Organizar os dados
governamentais e facilitar sua recuperação e sua utilização é um dos objetivos da abertura dos
dados governamentais, que vai ao encontro de uma das visões sobre o objeto da Ciência da
Informação que “é ajudar as pessoas (ou mais amplamente: atores) que estão confusas com a
situação do uso do conhecimento (e que ficarão mais confusas por causa do modelo de
sociedade pós-moderna).” (WERSIG, 1993, p. 230, tradução nossa).
Birdsall (2005) chama a atenção para a participação crítica que o profissional da
informação, em especial o bibliotecário, deve ter perante seu papel político na defesa ao
acesso cidadão ao conhecimento, frente ao ambiente de telecomunicações.
A confluência entre a pesquisa e a prática em uma economia política da
Biblioteconomia pode fortalecer a profissão bibliotecária para a defesa
crítica e para o papel político que deve desempenhar na criação de um novo
ambiente de telecomunicações que garanta o acesso da cidadania ao
conhecimento. (BIRDSALL, 2005, p. 9).
São escassos os estudos elaborados por profissionais da informação referentes à
publicação de dados governamentais abertos, talvez por eles não se identificarem com esse
processo de publicação. Deveria ser observada por esses profissionais a questão da seleção e
organização desses dados e para quem e com qual objetivo estariam sendo publicados. Isso é
uma peça da participação crítica frente aos aspectos políticos, levantados por Birdsall (2005)
e, ao mesmo tempo, poderia contribuir para que o processo de publicação dos dados
ampliasse seu caráter social, afinal esse é o propósito da iniciativa dos dados governamentais
abertos.
O Estado, por sua vez, não deve somente disponibilizar os dados governamentais, fazse necessário também proporcionar que esses dados cheguem aos cidadãos e sejam
compreendidos. (VAZ; RIBEIRO; MATHEUS, 2010). Democratizar a informação envolve
mais que somente programas para facilitar e aumentar o acesso à informação. “É necessário
que o indivíduo tenha condições de elaborar este insumo recebido, transformando-o em
conhecimento esclarecedor e libertador, em benefício próprio e da sociedade onde vive”.
(BARRETO, 1994, p. 5).
Acredita-se que a publicação dos dados governamentais abertos pode beneficiar as
organizações do setor público ou não (por exemplo: empresas privadas, estatísticos,
Organizações Não Governamentais - ONGs - e Hackers). Uma vez que utilizam as
17
tecnologias da Web Semântica para a interligação dos dados de outros órgãos para prover
valor agregado a seus próprios dados, melhorando, desta forma, a usabilidade, visibilidade e
valor desses dados.
Trabalhar com dados governamentais abertos possibilita tornar os cidadãos mais
informados, criar eleitores conscientes de seu poder, permitindo-os supervisionar o Governo
através da transparência pública. Além de promover o uso e reutilização das informações do
Governo, criando serviços mais eficientes e amigáveis à população.
Como é afirmado no Manual... (2011, p. 11)
Dados abertos, especialmente os governamentais, são um ótimo recurso
ainda muito pouco explorado. Muitos indivíduos e organizações coletam
uma ampla gama de diferentes tipos de dados para executar suas tarefas. O
governo é particularmente importante nesse contexto, tanto por causa da
quantidade e da centralidade dos dados que coleta quanto pelo fato de que
tais dados são públicos.
Outro aspecto importante é que a maioria das informações disponibilizadas hoje pelo
Governo está publicada em formatos proprietários ou com tecnologia que restringe seu
acesso. A mera publicação na Web de dados governamentais não os torna acessíveis e/ou
abertos. Isso acarreta, por exemplo, incompatibilidade de equipamentos para uma pessoa que
usa um equipamento móvel ou um computador antigo, ou a falta de informações para alguém
que usa um computador sem o software proprietário necessário, e barreira de acessibilidade
para pessoas com deficiência. (W3C, 2009).
Chen (1990, p. 1) afirma que “conforme nos movemos para uma sociedade cada vez
mais orientada para a informação, a determinação de como organizar os dados para
maximizar sua utilidade torna-se um problema muito importante”.
Por essa razão, é necessário possibilitar o reuso, ou seja, desagregar, reprocessar e
reaplicar esses dados, permitindo novas interpretações e aplicações. Pensando nessa
necessidade, o Governo Brasileiro desenvolveu o Portal Brasileiro de Dados Abertos3 para
fomentar a publicação de dados governamentais e, ao mesmo tempo, possibilitar a
recuperação e reutilização desses dados por cidadãos interessados.
Todavia, percebe-se a dificuldade em se publicar os dados seguindo os princípios dos
dados governamentais abertos. Em 4 de março de 2014, o portal apresentava apenas 112
(cento e doze) conjuntos de dados publicados, um número pequeno para a quantidade de
órgãos públicos e as informações que geram. Ademais, os conjuntos de dados abertos estavam
3
Disponível em: <http://dados.gov.br/>. Acesso em: 19 abr. 2013.
18
publicados nos seguintes formatos: xls; pdf; xml; csv; zip+cvs; HTML; zip+txt; zip+sas;
zip+xls e json. Dentre estes, os formatos pdf. e zip, por exemplo, não são considerados
formatos adequados para publicação de dados abertos. Não apresentando nenhum conjunto de
dados em formato Resource Description Framework (RDF), formato recomendado pela
proposta de dados abertos interligados. (BENNETT; HARVEY, 2009; BERNERS-LEE,
2009). Contudo, sabe-se que o Ministério do Planejamento4 e o Tribunal de Contas do Estado
de São Paulo5, publicaram conjuntos de dados em formato RDF. Porém, esses dados não são
mostrados junto com os outros formatos existentes e nem facilmente recuperados no portal
dados.gov.br.
Segundo Berners-Lee (2009), o padrão RDF conecta melhor que qualquer outro
modelo, pois utiliza URIs e assim permite ligação de coisas e conceitos; possibilita que os
sistemas independentes possam ser interligados; ocasiona a interoperabilidade; e admite a
representação dos dados utilizando diferentes vocabulários.
O RDF é fundamental para o estabelecimento do primeiro nível de “semântica”
inteligível por programas, pois embora a eXtensible Markup Language (XML) permita aos
usuários adicionar estrutura arbitrária aos seus documentos, não diz nada sobre o que as
estruturas significam. Significados são expressos pelo RDF, que codifica em conjuntos de
triplas, sendo cada tripla composta por um sujeito, verbo e objeto de uma frase elementar.
(BERNERS-LEE; HENDLER; LASSILA, 2001).
Desta maneira, a publicação de dados governamentais abertos deve-se basear na Web
Semântica, pois assim os dados receberão significados definidos, com metadados em formato
padronizado, possibilitando a compreensão por pessoas e por computadores. A Web
Semântica, idealizada por Tim Berners-Lee, visa melhorar a interação entre as páginas
(autodescritivas) na Web com os programas.
Souza e Alvarenga (2004, p. 134) afirmam ainda que
O projeto da Web Semântica, em sua essência, é a criação e implantação de
padrões (Standards) tecnológicos para permitir este panorama, que não
somente facilite as trocas de informações entre agentes pessoais, mas
principalmente estabeleça uma língua franca para o compartilhamento mais
significativo de dados entre dispositivos e sistemas de informação de uma
maneira geral.
As tecnologias da Web Semântica proporcionam o compartilhamento e reutilização de
dados de diferentes aplicações, oferecendo tecnologias que descrevam, modelem e permitam
4
5
Disponível em: <http://www.siop.planejamento.gov.br>. Acesso em: 5 mar. 2014.
Disponível em: <http://portaldocidadao.tce.sp.gov.br>. Acesso em: 5 mar. 2014.
19
consultas a esses dados. Entretanto, faz necessária a curadoria desses dados para fins de
recuperação e reuso e, neste caso, são os modelos que dão estrutura e significado aos dados.
Esses fatores evidenciam a necessidade de modelos conceituais e consequentemente da
modelagem das relações conceituais. (SALES; SAYÃO; MOTTA, 2012).
Corroborando esse pensamento, Maia e Alvarenga (2013, p. 2) afirmam que com a
Web Semântica “surge a necessidade da modelagem conceitual, onde se busca ferramentas
para os processos de classificação e relacionamento entre os documentos visando a uma maior
eficiência na representação e recuperação do conhecimento”.
Méndez e Greenberg (2012, p. 237) também concordam que são os vocabulários a
base da semântica dos dados ligados. Para as autoras, os vocabulários baseados em linguagens
de domínio, disciplina ou comunidade, ajudam a resolver problemas relacionados à
sobrecarga de informações digitais, bem como auxilia em sua recuperação.
A capacidade de vincular vocabulários diferentes para representação de registros de
dados fornece uma infra-estrutura que permite uma recuperação de informação mais eficaz,
além de facilitar o seu reuso.
Diante disso, a modelagem conceitual pode ser utilizada como forma de se obter
resultados baseados em estruturas conceituais coerentes, elaboradas a partir de definições
específicas de um dado domínio. Le Moigne (1977, p. 34) afirma que “modelar é conceber,
para um objeto, um modelo que permita conhecê-lo, compreendê-lo, interpretá-lo e auxilie na
antecipação do comportamento dele”.
Logo, precisa-se, na publicação de dados governamentais abertos, de vocabulários e
representações semânticas dos domínios contemplados pelo Estado. E para isso se faz uso de
modelos que possibilitarão a organização e representação dos conceitos e das relações
existentes entre eles, que serão utilizados em ontologias para atribuição de semântica a esses
dados publicados.
1.2 RECORTE ESCOLHIDO
Acompanhando o processo de desenvolvimento tecnológico, político e social
internacional, o Brasil já começou a apresentar suas iniciativas em publicação de dados
governamentais em formato aberto. Um dos setores públicos interessados nesta temática é a
Previdência Social, que visa coletar dados sobre a vida profissional dos cidadãos, buscando
conhecer o perfil do trabalhador. A Previdência Social brasileira pode ser considerada “um
patrimônio do trabalhador e sua família. Transformou-se, ao longo das últimas oito décadas,
20
em um complexo e abrangente sistema de proteção social, com significativa cobertura de
riscos sociais”. (BRASIL, 2009, p. 7).
A Previdência Social é um dos setores do Governo que mais coleta e organiza dados
sociais. (RIBEIRO, C., 2008). A disseminação dessas informações tratadas também precisa de
uma atenção especial. Assim, é necessário buscar alternativas para que estes dados, cada vez
mais, sejam estudados e reutilizados pela sociedade.
Atualmente, a Previdência Social possui mais de 1.400 agências, pagando
mensalmente 30 milhões de benefícios, atendendo presencialmente a um público de mais de 4
milhões de pessoas/mês, envolvendo cerca de 40 mil servidores. (DATAPREV, 2013). Esses
números geram uma grande quantidade de dados, que estão armazenados em ambientes
tecnológicos heterogêneos e que, com frequência, são utilizados na divulgação de
informações, proporcionando um ambiente favorável para o desenvolvimento de trabalhos
que pesquisem o tratamento e a disseminação destas informações. (RIBEIRO, C., 2008).
Além disso, após um ano da implantação da Lei de Acesso a Informação, a
Controladoria-Geral da União (CGU) informou que a Previdência Social é o segundo órgão
com maior número de demandas de solicitação de informações, ficando atrás apenas da
Superintendência de Seguros Privados. (BATIMARCHI, 2013). Comprovando, dessa
maneira, o interesse do cidadão pelas informações previdenciárias.
A delimitação do tema tem como campo empírico da pesquisa o domínio de dados da
Previdência Social brasileira, tendo em vista o grande volume, a complexidade e o impacto
que estas informações podem exercer em toda a sociedade. Como afirma Ribeiro (2001, p. 3)
“o grande volume e a imensa diversidade de informações na Previdência Social Brasileira
emolduram o cenário fértil para o estudo do comportamento destas informações”.
No caso deste trabalho, o recorte da pesquisa recairá sobre dados estatísticos sobre
acidentes do trabalho, do Ministério da Previdência Social, geridos pela Empresa de
Tecnologias e Informação da Previdência Social (Dataprev). Acidente do trabalho é acidente
que “ocorre pelo exercício do trabalho a serviço da empresa ou pelo exercício do trabalho aos
segurados empregados, trabalhadores avulsos e segurados especiais”. (HORVATH JÚNIOR,
2009, p. 6)
Essa escolha se deve em função desses dados fazerem parte da primeira experiência
com a publicação de dados abertos realizada pela Dataprev, guardiã e gestora dos dados da
Previdência Social brasileira. (DATAPREV, 2012).
A Dataprev deu início à publicação dos dados governamentais abertos de acidentes do
trabalho a partir dos dados estatísticos disponíveis no Anuário Estatístico de Acidente do
21
Trabalho (2010). A publicação de dados governamentais abertos envolvendo dados
estatísticos é importante, pois a reutilização desses dados no desenvolvimento de aplicativos
ou outros serviços facilita a compreensão desses dados pelo usuário. Pois, como afirma Senra
(1999), o importante nos dados estatísticos é a informação que eles representam e não o dado
em si.
A estatística revela e mostra pouco a pouco que a população tem suas
regularidades próprias: seu número de mortos, seu número de doenças, suas
regularidades de acidentes. A estatística mostra igualmente que a população
apresenta características próprias em seu conjunto e que esses fenômenos
são irredutíveis aos da família: as grandes epidemias, as expansões
endêmicas, a espiral do trabalho e da riqueza. A estatística mostra
igualmente que, por seus deslocamentos, por suas maneiras de fazer, por sua
atividade, a população tem seus efeitos econômicos específicos. A
estatística, permitindo quantificar os fenômenos próprios à população, revela
uma especificidade irredutível ao pequeno quadro da família. (FOUCAULT,
2003).
Assim, dados estatísticos estão repletos de poderes. Poder de quem o criou (quais as
informações que foram selecionadas a serem quantificadas?), poder da metodologia escolhida
para coleta e representação dos dados e poder de quem trabalhou essa informação (estatística
é a representação quantificável de determinadas informações).
1.3 QUESTÕES A SEREM RESPONDIDAS
Nessa perspectiva, cabe-nos investigar as seguintes questões:
Como elaborar um modelo conceitual de acidente do trabalho no domínio
da Previdência Social brasileira?
Como instrumentos de representação da informação, que contemplam a
temática sobre acidente do trabalho, representam este domínio?
Como representar a proposta do modelo conceitual de acidente do trabalho
utilizando tecnologias da Web Semântica para a publicação dos dados
governamentais abertos da Previdência Social?
22
1.4 ORGANIZAÇÃO DA PESQUISA
Além desta introdução, o trabalho apresenta a seguinte organização, dividida em
seções.
A seção 2 apresenta os objetivos gerais e os específicos da pesquisa.
A seção 3 é mostra o escopo e a metodologia empregada para responder as questões da
pesquisa e, consequentemente, alcançar os objetivos.
A seção 4 faz referência ao marco teórico da pesquisa, no qual se investigará: a) a
questão do conceito na representação da informação, aprofundando-se na Teoria do Conceito
de Dalhberg (1978, 1981, 1983), na modelagem conceitual (LE MOIGNE, 1977) e no modelo
Entidade-Relacionamento de Chen (1976); b) a Web Semântica e suas tecnologias: URI,
XML, RDF, Ontologia, OWL e dados abertos interligados; c) os aspectos legais sobre acesso
à informação pública; d) o governo eletrônico no Brasil, privilegiando aspectos sobre
accountability e transparência pública; e) e, por fim, dados governamentais abertos, ilustrados
com algumas iniciativas estrangeiras e nacionais.
A seção 5 apresenta modelos ou instrumentos de representação da informação que
contemplem o universo sobre acidente do trabalho. São apresentados o Vocabulário
Controlado do Governo Eletrônico (VCGE), o modelo de publicações de dados sobre
acidentes do trabalho elaborado pela Dataprev e o tesauro e a taxonomia da Organização
Internacional do trabalho (OIT).
Já a seção 6 faz o relato da elaboração, por meio de definições sobre acidentes do
trabalho, de uma proposta de modelo conceitual na área de acidente do trabalho da
Previdência Social brasileira.
A seguir, a seção 7 mostra como o modelo conceitual pode se constituir num
vocabulário específico para descrever acidentes do trabalho.
A seção 8 revela o processo de conversão do diagrama ER em triplas de RDF,
integrando o vocabulário proposto na seção 7, e sua aplicação em uma faixa de dados
selecionada dentro do conjunto de dados publicados pela Dataprev;
As considerações finais indicadam algumas reflexões sobre os trabalhos, contribuições
e possíveis extensões ao presente trabalho.
23
2 OBJETIVOS
2.1 OBJETIVO GERAL
Propor um modelo conceitual dos dados sobre acidentes do trabalho para
publicação dos dados governamentais mantidos pela Previdência Social.
2.2 OBJETIVOS ESPECÍFICOS
Representar o conhecimento sobre acidente do trabalho, no âmbito da
Previdência Social brasileira, identificando as entidades presentes e os
relacionamentos existentes;
Propor um vocabulário sobre acidentes do trabalho, utilizando o modelo
conceitual elaborado;
Codificar em RDF uma amostra dos dados publicados pela Previdência Social
sobre acidente do trabalho.
24
3 ESCOPO E PROCEDIMENTOS METODOLÓGICOS
Metodologia significa, “na origem do termo, estudo dos caminhos, dos instrumentos
usados para se fazer ciência”. (DEMO, 1995, p. 11). Desta forma, mostra-se, agora, as
escolhas feitas para a construção da pesquisa.
3.1 ESCOPO
O campo empírico para aplicação do modelo conceitual proposto é dos dados
estatísticos mantidos pelo Ministério da Previdência Social. A temática será limitada aos
dados sobre acidente do trabalho e a abrangência cobrirá o período entre 2002 a 2009. A
temática e a abrangência foram definidas com base nos dados, atualmente, trabalhados pela
Dataprev para publicação dos dados governamentais abertos, utilizando como fonte principal
o Anuário Estatístico de Acidente do Trabalho, auxiliado pelo Anuário Estatístico da
Previdência Social, ambos publicados pelo Ministério da Previdência Social.
3.2 METODOLOGIA
De acordo com Gil (2002) e Marconi e Lakatos (1992; 2003), a pesquisa pode ser
classificada de acordo com diferentes aspectos, como: de acordo com a natureza da pesquisa,
a forma de abordagem do problema e os objetivos almejados.
Observando esta pesquisa do ponto de vista de sua natureza, pode-se classificá-la
como pesquisa aplicada, pois tem como objetivo reunir e elaborar informações para
“contribuir para fins práticos, visando à solução mais ou menos imediata do problema
encontrado na realidade.” (BARROS; LEHFELD, 2000, p. 78).
Sob a ótica da forma de abordagem do problema, ela é classificada como qualitativa,
pois “trabalha com o universo dos significados, dos motivos, das aspirações, das crenças, dos
valores e das atitudes”. (MINAYO, 2002, p. 21). Em outras palavras, a pesquisa qualitativa
trata e interpreta conjuntos de materiais disponíveis utilizando “processos hermenêuticos a
partir do que busca extrair dos discursos a expressão da subjetividade do sujeito informante
ou a percepção obtida pela participação do pesquisador em processos de coleta com
envolvimento direto ou com observação”. (SOUZA, 2003, p. 29).
Esta pesquisa pode ser classificada segundo seus objetivos como pesquisa
exploratória, pois busca proporcionar maior familiaridade com o problema, com vistas a
25
torná-lo mais explícito ou a constituir hipóteses. Utilizando-se, na maioria dos casos, de
levantamento bibliográfico e análise de exemplos que estimulem a compreensão do objeto
estudado. (GIL, 2002).
Os procedimentos metodológicos foram divididos da seguinte forma:
Pesquisa bibliográfica
Para fundamentação do marco-teórico, apresentado na seção quatro, buscou-se
levantar os autores de Ciência da Informação e áreas afins a esta pesquisa, com análises de
citação e de conteúdo para identificação e escolha dos conceitos a serem utilizados.
Foram pesquisados os termos: “conceito”, “modelagem conceitual”, “modelo
entidade-relacionamento”, “Web Semântica”, “governo eletrônico” e “dados governamentais
abertos”6. A pesquisa foi realizada nas seguintes bases de dados: Portal Capes7, Biblioteca
Digital de Teses e Dissertações (BDTD)8, Base de Dados Referencial de Artigos de
Periódicos em Ciência da Informação (BRAPCI)9, CitesserX10, Google Acadêmico11. As
bases de dados foram selecionadas por disponibilizarem relevante produção científica em
Ciência da Informação e demais áreas envolvidas neste estudo.
Identificação de modelos ou vocabulários sobre acidentes do trabalho
Pesquisou-se por modelos ou vocabulários existentes que pudessem representar ou
serem utilizados na elaboração de um modelo conceitual sobre acidente do trabalho no
domínio da Previdência Social. Observou-se o Vocabulário Controlado do Governo
Eletrônico (VCGE)12, o modelo de publicações de dados sobre acidentes do trabalho
publicado pela Dataprev13 e o tesauro e a taxonomia da Organização Internacional do
Trabalho (OIT)14.
6
Os termos foram pesquisados também com suas variações linguísticas (sinônimos) e abreviações e também em
outros idiomas (inglês, espanhol e francês).
7
Disponível em: <http://www.periodicos.capes.gov.br/>. Acesso em: 6 abr. 2013.
8
Disponível em: <http://bdtd.ibict.br/>. Acesso em: 6 abr. 2013.
9
Disponível em: <http://www.brapci.ufpr.br/>. Acesso em: 6 abr. 2013.
10
Disponível em: <http://citeseerx.ist.psu.edu/index;jsessionid=19C845A95BBA6034A1D095B5D465E7D9>.
Acesso em: 6 abr. 2013.
11
Disponível em: < http://scholar.google.com.br/>. Acesso em: 6 abr. 2013.
12
Disponível em: <http://vocab.e.gov.br/2011/03/vcge>. Acesso em: 6 abr. 2013.
13
Disponível em: <http://api.dataprev.gov.br/doc/dadosDisp.htm>. Acesso em: 6 abr. 2013.
14
Disponível em: <http://www.ilo.org/thesaurus/defaultes.asp>. Acesso em: 6 abr. 2013.
26
Para essa atividade, foi necessário observar cada instrumento de representação
levando-se em consideração a estrutura e as informações dos dados publicados pela Dataprev,
a relação entre acidente do trabalho e os benefícios previdenciários brasileiros e outras
questões particulares a cada instrumento estudado.
Esta metodologia, utilizada na seção cinco, busca conhecimentos para responder uma
questão proposta neste trabalho: “Como instrumentos de representação da informação que
contemplam a temática sobre acidente do trabalho representam este domínio?”
Elaboração de um modelo conceitual sobre acidente do trabalho
A seção seis buscará, por meio de definições sobre acidentes do trabalho, identificar
conceitos e suas relações de modo a se propor um modelo conceitual sobre este tipo de
acidente. Para que tal resultado seja conquistado, seguiram-se os seguintes passos
metodológicos:
a. Na coleta e seleção das definições buscou-se por autores representativos e/ou por
fontes de referência legais que definissem acidente do trabalho. Deste modo, foram
identificadas quatro fontes:
i.
Brasil (1991) que regulamenta a Lei n. 8.213, publicada em 24 de julho de
1991, que dispõe sobre os planos de benefícios da Previdência Social. No
artigo décimo nono da referida Lei é definido o acidente do trabalho.
ii.
Anuário Estatístico da Previdência Social (2012) que é uma publicação oficial
da Previdência Social que reúne dados estatísticos referentes às atividades
desenvolvidas no ano 2011. Nesta publicação, o quarto capítulo é dedicado
exclusivamente aos acidentes do trabalho, apresentando sua definição.
iii.
Organización Internacional del Trabajo (2011) que em seu tesauro define e
classifica acidente do trabalho.
iv.
Horvath Júnior (2009), que publicou o “Dicionário analítico de Previdência
Social”, único dicionário especializado localizado que define acidente do
trabalho.
b. Classificação das definições e identificação dos termos com base na Teoria do
Conceito, desenvolvida por Dahlberg (1978a, 1981, 1983). De acordo com Dahlberg
(1983) as definições serão classificadas em: definição genérica, definição partitiva e
definição funcional. Esta classificação mostra as características de uma definição.
27
Ademais, esta classificação auxiliou no estabelecimento das relações existentes entre
os termos encontrados;
c. Classificação dos termos identificados de acordo com as categorias das ontologias
Unified Foundational Ontology for perdurants (UFO-B) e da DOLCE15+DnS16
Ultralite (DUL), verificando semelhanças e diferenças, contribuindo para a
identificação dos elementos (objeto ou relação) do modelo a ser construído;
d. Classificação dos termos de acordo com o modelo de Entidade-Relacionamento,
desenvolvido por Chen (1976)17. Esta classificação possibilitará obter uma visão de
como os elementos estão interligados, possibilitando também uma representação
gráfica;
e. Elaboração de um diagrama de Entidade-Relacionamento para cada definição
analisada; e
f. Apresentação, ao final, de um modelo consolidado, abrangendo a área de acidente do
trabalho no domínio da Previdência Social.
Esta metodologia busca responder a pergunta: “como elaborar um modelo conceitual
de acidente do trabalho no domínio da Previdência Social brasileira?”. Procurando atingir o
objetivo geral deste estudo.
Elaboração de um vocabulário sobre acidente do trabalho
Esta parte do trabalho, presente na seção 7, apresenta o vocabulário proposto, que
seguiu os passos abaixo:
a. Escolha dos conceitos do modelo conceitual a serem utilizados na elaboração do
vocabulário. Não serão contemplados todos os conceitos neste momento, apenas
aqueles relacionados diretamente aos dados já publicados pela Previdência Social;
b. Busca por vocabulários já existentes que possam contemplar essas entidades,
relacionamentos e atributos;
c. Criação de URIs fictícios para os conceitos a serem criados;
15
Descriptive Ontology for Linguistic and Cognitive Engineering.
Descriptions and situations.
17
A escolha do Modelo Entidade-Relacionamento é justificada pela sua proximidade com o RDF, padrão
indicado para descrição de dados na Web Semântica. Chen (2002) ao falar dos possíveis usos e relações do
modelo Entidade-Relacionamento o associa ao RDF, afirmando que existem algumas semelhanças e diferenças
entre RDF e do modelo ER. Entretanto, o RDF, já é considerado um membro da família da modelagem
Entidade-Relacionamento, em que os dados estruturados como gráficos rotulados podem ser trocados através de
documentos XML. (W3C, 1999).
16
28
d. Definição de um nome (namespace) para o vocabulário;
e. Descrição dos conceitos que farão parte do vocabulário proposto;
f. Divisão do vocabulário em classes (entidades), propriedade (relacionamentos) e
elementos (atributos).
Codificação em RDF de uma amostra dos dados publicados pela Previdência
Social sobre acidente do trabalho
Esta é a parte prática da pesquisa a ser mostrada na seção 8 da dissertação, na qual será
realizada a conversão das entidades e relacionamentos do modelo proposto em triplas de
RDF, tecnologia recomendada pela W3C para descrição de dados na Web Semântica. Será
escolhida uma parte dos dados já publicados pela Dataprev sobre acidente do trabalho para
implementação do RDF.
Seguiram-se os seguintes passos:
a) Definição das triplas RDF com base no modelo conceitual proposto.
b) Representação das triplas RDF em quadros, baseados na criação de tabelas para
descrição de banco de dados lógicos (XU; LEE; KIM, 2010) para descrever as
entidades e relações e convertê-las para triplas RDF;
c) Substituição dos elementos do quadro por suas respectivas URI, de acordo com o
vocabulário proposto;
d) Implementação das triplas RDF nos dados selecionados em um modelo gráfico
RDF/XML.
Pretende-se, com isso, responder a última questão apresentada neste trabalho: “como
representar a proposta do modelo conceitual de acidente do trabalho utilizando tecnologias da
Web Semântica para a publicação dos dados governamentais abertos da Previdência Social?”.
E atender ao objetivo específico de propor um esquema, em RDF, para publicação dos dados
sobre acidente do trabalho.
29
4 MARCO TEÓRICO
Para melhor entendimento do trabalho que se pretende desenvolver e para facilitar o
agrupamento da bibliografia recolhida através da pesquisa bibliográfica, decidiu-se elaborar o
referencial teórico, que busca fornecer um panorama sobre alguns conteúdos, julgados
imprescindíveis para a compreensão da pesquisa. Desde modo, foram estudados os seguintes
assuntos: conceito (teoria e modelos), Web Semântica e dados governamentais abertos e seus,
respectivos, assuntos correlatos.
4.1 REPRESENTAÇÃO DO CONHECIMENTO
A Ciência da Informação é um campo de estudo cujos esforços estão direcionados ao
entendimento sobre as vertentes que envolvem a produção, circulação e uso da informação.
Pesquisas, nesta área, buscam fornecer teorias e instrumentos que auxiliam no
armazenamento, recuperação e disseminação da informação.
Alvarenga (2001) afirma que a criação, a disponibilização e o aperfeiçoamento das
tecnologias da informação interferiram diretamente nos sistemas de representação e
recuperação de informações documentais. Estes sistemas tradicionais foram obrigados a
expandir sua forma de representação, indo além dos catálogos referenciais em fichas,
alcançando as bases de dados online. De acordo ainda com esta autora, essas mudanças nos
sistemas de representação acarretaram o interesse de diferentes áreas no estudo deste campo,
destacando a Linguística e a Ciência da Computação, com seus estudos sobre bases de dados.
Davis, Shrobe e Szolovits (1993) estabelecem o conceito de representação do
conhecimento a partir de cinco definições concebidas com base em sua utilização: (1) a
representação do conhecimento é fundamentalmente um substituto para aquilo que representa;
(2) é uma aproximação imperfeita da realidade, selecionando o que e como observar o ser ou
objeto representado; (3) é uma teoria fragmentária de raciocínio inteligente expresso em
termos de três componentes: (a) concepção fundamental da representação do raciocínio
inteligente, (b) o conjunto de inferências que as sanções de representação, e (c) o conjunto de
inferências que ele recomenda; (4) é um meio para a computação pragmaticamente eficiente,
isto é, o ambiente em que o pensamento computacional é realizado, contribuindo para
organizar as informações de forma a facilitar a tomada das inferências recomendadas; e (5) é
um meio de expressão humana, isto é, uma linguagem em que se diz algo sobre o mundo.
30
Neste estudo, nota-se um entrosamento entre a Ciência da Informação e a Ciência da
Computação na representação de dados. Maia e Alvarenga (2013, p. 2) comentam que existe
uma preocupação recíproca entre ambas as áreas citadas, no que se refere “ao aspecto da
representação, organização intelectual, busca e recuperação da informação em sistemas
específicos”. As autoras acrescentam ainda que os “sistemas de recuperação da informação
(SRI) são estudos realizados na base estrutural da CI e, ao mesmo tempo, também participam
de um contexto de estudo da CC [Ciência da Computação]”. (Maia, Alvarenga, 2013, p. 2)
Campos (2004) analisa os mecanismos de representação do conhecimento sob a ótica
de diferentes áreas,
No âmbito da Ciência da Computação, eles servem para auxiliar a
implementação de estruturas computáveis. No âmbito da ciência da
informação, possibilitam a elaboração de linguagens documentárias verbais
e notacionais, visando à recuperação de informação e à organização dos
conteúdos informacionais de documentos. No âmbito da terminologia, esses
mesmos mecanismos permitem a sistematização dos conceitos e,
conseqüentemente, a elaboração de definições consistentes. (CAMPOS,
2004, p. 23).
Desta forma, percebe-se que a representação da informação pode ser estudada com
focos diversos, de acordo com o contexto e com os objetivos propostos. Logo, “pode-se dizer
que a representação dos objetos pelos indivíduos está diretamente ligada ao modo como cada
um percebe o mundo e interage com ele”. (LEITE, BORNIA, 2006, p. 2).
Na visão da Ciência da Informação, Novellino (1996, p. 38) considera que “a principal
característica do processo de representação da informação é a substituição de uma entidade
lingüística longa e complexa - o texto do documento - por sua descrição abreviada”. Em
outras palavras, a autora está se referindo diretamente ao processo de representação temática
de um documento. Este processo que envolve dois processos: “análise conceitual e tradução”
(LANCASTER, 1993, p. 8). Neste momento, chega-se ao Conceito, elemento tão importante
na representação do conhecimento, que será visto com mais detalhes na subseção a seguir.
4.1.1 Uma visão acerca do conceito
Há diversas abordagens de diferentes áreas do conhecimento que se debruçam sobre o
estudo do conceito. Estes estudos podem variar ainda dentro da mesma área de acordo com a
corrente teórico-epistemológica adotada. (FRANCELIN; KOBASHI, 2011, p. 208).
31
Na Ciência da Informação, são recorrentes os estudos que discutem a relação entre a
linguagem (representação) e as coisas (mundo real). Compreender as ligações entre o mundo
real, os conceitos e sua representação gráfica é necessário no processo de representação.
Na época de Aristóteles existia a preocupação de se unir o domínio das palavras ao
domínio das coisas. Ao estudar as obras de Aristóteles, Figueiredo (2000, p. 11) considera que
os conceitos têm uma realidade mental, em outras palavras, é o modo como os homens
organizam mentalmente as coisas existentes, agrupando-as de acordo com conceitos
estabelecidos e nomeando-as com uma palavra, em um determinado contexto.
Um conceito é uma rede de padrões de inferências, associações e
relacionamentos que são predicados ou ditos de outra forma trazidos em
cena através do ato da categorização [...] a cristalização ou formalização do
pensamento inferencial, nascida da percepção sensorial, condicionada pela
operação do cérebro humano e delineada pela experiência humana. Ela
repousa na fundamentação de todo pensamento, mas ela é pragmática e
instrumental. É permanente e efêmera. Permanente porque sem ela, a
cognição é impossível; efêmera porque ela pode ser rejeitada quando sua
utilidade é esgotada. (SHERA, 1957 apud ALVARENGA, 2001, p. 33).
Alvarenga (2001, p. 33) complementa a ideia de Shera (1957) afirmando que os
conceitos “ou padrões se constituem na matéria do qual as classificações são feitas. Os
conceitos podem se referir às coisas concretas e abstratas. Os conceitos e a formação de
conceitos são o material para a construção das classificações bibliográficas”.
Eugen Wüester, ao elaborar a Teoria Geral da Terminologia, definiu conceito como “a
unidade de pensamento, constituído de características que refletem as propriedades
significativas atribuídas a um objeto, ou a uma classe de objetos”. (CAMPOS, 2001, p. 71).
Todavia, outra definição clássica de conceito é a estabelecida por Dahlberg (1978c),
que define conceito como sendo “a unidade de conhecimento que surge da síntese dos
predicados necessários relacionados com determinado objeto e que, por meio de sinais
lingüísticos, pode ser comunicado”. (Dahlberg, 1978c, p. 12). A Teoria do Conceito será vista
com mais detalhes na próxima seção sobre a Teoria do Conceito.
A “compilação de enunciados verdadeiros” (DAHLBERG, 1978a, p. 102), já estava
presente no pensamento de Aristóteles, que se valia dos conceitos para verificar a validade das
proposições. As relações entre as palavras, dispostas da seguinte maneira sujeito-verbopredicado são chamadas de proposições. (FIGUEIREDO, 2000, p. 12). Sendo que o sujeito e
o predicado são os objetos concretos ou abstratos e o verbo é a relação existe entre eles. Está
32
lógica foi também apropriada pela área da Ciência da Computação, quando elaboraram a
tripla de RDF, melhor explicado na seção 4.2.3.
Para se verificar a veracidade de uma proposição se recorre a dois tipos de processos:
verificação empírica e análise conceitual. Na verificação empírica, os objetos são vistos
diretamente para se confrontar a afirmativa. Já na análise conceitual, analisa-se o conceito do
sujeito e verifica-se se é compatível com o conceito do predicado. Assim, a verificação
empírica precisa do sujeito individual, pois é necessária a observação direta, já a análise
conceitual “é um processo que nos permite declarar se uma proposição é verdadeira ou falsa,
independentemente dos sujeitos individuais a que se aplica o seu predicado”. (FIGUEIREDO,
2000, p. 13).
Os conceitos são importantes para identificar, classificar e organizar os objetos. Reunir
por conceitos, de acordo com características comuns, facilitar a organização semântica dos
objetos. Desta forma, pode-se dizer que “a organização conceitual é necessária a qualquer
sistema adequado que objetive a recuperação da informação”. (FROHMANN, 1983 apud
MOTTA, 1987, p. 30).
A seguir será mostrado a Teoria do Conceito de Dahlberg, a modelagem conceitual de
Le Moigne e o modelo Entidade-Relacionamento de Chen. A expectativa é proporcionar uma
visão de como o conceito se constitui e contribui para a representação do conhecimento, de
acordo com essas teorias.
4.1.2 Teoria do conceito
A Teoria do Conceito foi elaborada por Ingetraut Dahlberg nos anos 70. Desde então
tem sido referência para diversos estudos na área de representação do conhecimento,
principalmente, com vistas à recuperação.
Baseado nos princípios da Teoria do Conceito é possível estabelecer relações e
determinar, no plano verbal, o que se denomina termo. (CAMPOS, 2001, p. 87). Exatamente
por estes benefícios trazidos à área de representação do conhecimento, que a Teoria do
Conceito é muito utilizada para a elaboração de tesauros.
De acordo com Alvarenga (2001) a Teoria do Conceito teve grande influência do
pensamento de Aristóteles. Esta autora referencia o ato da cognição humana e a fatoração do
conceito em categorias, como exemplos de contribuições para a evolução do pensamento
filosófico e científico. Ela adiciona ainda que para Aristóteles,
33
[...] saber seria ter muitos conceitos e conhecer significava três coisas”: 1.
formar conceitos, ou seja, constituir em nossa mente um conjunto de notas
características para cada uma das essências que se realizam na substância
individual.; 2. aplicar esses conceitos que formamos a cada coisa individual,
colocar cada coisa individual sob um conceito. Chegar à natureza;
contemplar a substância; olha-la e voltar para dentro de nós mesmos para
procurar no arsenal de conceitos aquele que se ajustasse a uma singular
substância; e formular um juízo; 3. embaralhar entre si esses diversos juízos,
em forma de raciocínios que nos permitissem chegar à conclusão acerca de
substâncias que não temos presentes. (ALVARENGA, 2001, p. 7-8)
Como visto na seção anterior, em sua Teoria do Conceito, Dahlberg (1978) define
conceito como sendo uma unidade de conhecimento. O processo para formação de um
conceito é formado por três etapas constituída por três elementos (ver figura 1): A) o item de
referência ou referente (objeto real ou abstrato se pretende conceituar,); B) as características
(declarações ou proposições verdadeiras acerca do referente); e C) a forma verbal
(expressão/termo utilizada para representar o referente).
FIGURA 1 - Modelo de construção do conceito.
Fonte: DAHLBERG (1978b)
Ao observar estas etapas, percebe-se que o conceito é constituído de três elementos: o
referente, as características e a forma verbal. Formando o Triângulo do Conceito (figura 2),
desenvolvido por Dahlberg (1978b).
34
FIGURA 2 - Triângulo do conceito
Fonte: Dahlberg (1978b)
Deve-se ficar claro que o processo de formação do conceito se inicia com a escolha do
referente, que possui suas características relevantes analisadas de acordo com um determinado
domínio. Termos graficamente iguais poderão ter diferentes conceitos se observados em áreas
do saber diferentes, uma vez que as características relevantes se alteram de campo para campo
do conhecimento. (DAHLBERG, 1978a).
Dahlberg (1978a) chama de análise do conceito a identificação das características dos
conceitos, obtidas a partir da formulação de enunciados verdadeiros sobre os objetos
(referentes). Identificar as características dos conceitos se faz importante, pois elas exercem as
funções de: “ordenação classificatória dos conceitos e respectivos índices; definição dos
conceitos; formação dos nomes dos conceitos”. (DAHLBERG, 1978a, p. 104).
Na Teoria do Conceito as características são divididas em duas espécies: as
“características essenciais”, que são as necessárias para se definir conceitos gerais; e as
“características acidentais”, que são as adicionais ou possíveis de estarem presentes nos
conceitos. A identificação das características é importante para “determinar a ordem dos
conceitos”. (DAHLBERG, 1978a, p. 104).
Ademais, as características são importantes na identificação dos relacionamentos, pois
“sempre que diferentes conceitos possuem características idênticas deve-se admitir que entre
eles existam relações”. (DAHLBERG, 1978a, p. 104).
Os conceitos se relacionam entre si formando um “sistema de conceito terminológico,
pois são representações mentais das relações que ocorrem entre os objetos na realidade
empírica”. (CAMPOS, 2001b, p. 77). Para Wuester (1981) as relações, tratadas em um nível
conceitual, podem ser classificadas em relações lógicas e ontológicas.
A experiência mostra como é difícil para um grande número de pessoas
distinguir as duas espécies de relação (lógica e ontológica). Contudo, um
abismo intransponível separa muito bem estas duas categorias de relações
35
conceituais. [...] As relações ontológicas nascem do fato de elevarem-se a
um nível de abstração as relações que existem na realidade entre os
indivíduos (relações ônticas) fazendo-se destas relações individuais (por
assim dizer destes indivíduos de relações) conceitos de relação (por
exemplo, acima, abaixo). (WUESTER, 1981, p. 97 apud CAMPOS, 2001b,
p. 78).
Dahlberg (1978a) utiliza as relações lógicas para estabelecer possíveis comparações
entre os conceitos, de modo a conseguir organizá-los. Esta autora apresenta ainda outros
relacionamentos, a saber:
Relações hierárquicas ou de gênero e espécie – ocorrem quando dois conceitos
diferentes possuem características idênticas e um deles possui uma característica a
mais que o outro;
Relações partitivas – ocorrem quando existe um todo e suas partes;
Relações de oposição – ocorrem quando um conceito se opõe a outro, por
contradição ou contrariedade; e
Relações funcionais – ocorrem com conceitos que expressam processo, mostrando
as funções do objeto.
A Teoria do Conceito ainda trabalha com o sentido da intensão e extensão do conceito.
Dahlberg (1978a, p. 105) explica que a intensão do conceito é a soma total das suas
características, além da “soma total dos respectivos conceitos genéricos das diferenças
específicas”. Já a extensão do conceito seria a soma total dos conceitos mais específicos que o
conceito possui, bem como a soma dos conceitos para os quais a intensão verdadeira, ou seja,
características em comum que também se encontram na intensão do mesmo conceito.
Nas definições estão as características do conceito, delimitando estas características
(intensão), é possível determinar os conceitos que possam ser relacionados ao conceito em
análise por possuírem características semelhantes, determinando sua totalidade ou o número
de conceitos que este conceito abarca (extensão). (FELBER, 1984 apud CAMPOS, 2001b, p.
76).
A necessidade de estudos sobre as definições se faz cada vez maior. A pergunta “o que
é...?” desperta o interesse das pessoas desde a infância. A curiosidade ou a necessidade de se
saber o que é determinado objeto (concreto ou abstrato) persegue o homem ao longo da vida e
em todos os períodos históricos. Desta forma, definir algo é uma tarefa difícil que envolve
36
diversos elementos como: o assunto, o público-alvo, o profissional ou o estudioso responsável
pela definição, finalidade da definição dentre outros.
No meio acadêmico as definições sempre se mostraram fundamentais, por serem
“pressupostos indispensáveis na argumentação e nas comunicações verbais e que constituem
elementos necessários na construção de sistemas científicos”. (DAHLBERG, 1978a, p. 106).
Ainda neste pensamento, Viegas (2007, p. 73) afirma que “a ciência também tem seus
instrumentos – como a definição e a classificação – e exigências rituais – como a
argumentação”. Logo, pode-se inferir que na definição encontram-se elementos capazes de
contribuir para estudos relacionados à Organização do Conhecimento.
Nas palavras de Japiassú e Marcondes (2001, p. 49) definir, do ponto de vista lógico,
“significa determinar a ‘compreensão’ que caracteriza um conceito”. De acordo com estes
autores, para Aristóteles, a definição é a fórmula que exprime a essência de uma coisa,
composta do gênero (próximo) e das diferenças (específicas).
Definição “é uma locução que exprime o que uma coisa é ou qual o significado de um
termo” (VIEGAS, 2007, p. 75). Já para Dahlberg (1978a, p. 106) a definição é como uma
“delimitação ou fixação do conteúdo de um conceito (conteúdo do conceito = intensão, ou
conjunto de características ou atributos)”.
Isto posto, percebe-se a importância da definição não somente como instrumento de
argumentação científica, mas também como forma de delimitação de campos de estudos. Nos
quais as características, presentes nas definições dos conceitos, especificam as fronteiras
semânticas de determinadas áreas do conhecimento.
Sob essa vertente, na literatura sobre critérios para elaboração de ontologias e
estruturas taxonômicas aparecem estudos de Welty e Guarino (2001), Smith e Kumar (2004) e
Guizzardi (2005). Todavia, Marcondes (2014) ao estudar diversas metodologias para
desenvolvimento de ontologias, constatou que, apesar desses estudos mencionarem a
necessidade de se criar um primeiro glossário com termos potencialmente relevantes, para se
chegar a uma refinada lista de termos e seus sentidos (FERNANDEZ; GÓMEZ-PÉREZ;
JURISTO, 1997, p. 37), o processo de coleta e identificação dos termos para composição do
glossário não é explicado.
Acredita-se que nas definições possam estar os elementos necessários para a coleta e
identificação dos termos. A Teoria do Conceito de Dahlberg (1978a) e, em especial seus
estudos acerca de definições conceituais (DAHLBERG, 1983) podem oferecer a base teórica
necessária para a identificação e organização dos termos.
37
Por essa razão, as definições são imprescindíveis na fase de conceituação de
ontologias, pois são elas que irão “determinar ou fixar os limites de um conceito ou idéia”
(DAHLBERG, 1978a, p. 106). São esses limites que demarcarão os conceitos, identificandoos.
Há diferentes maneiras de classificar as definições. Pelo prisma filosófico, há a
definição nominal, que explica o sentido de uma palavra pelo recurso a outras palavras ou à
etimologia. E também existe a definição real que é aquela que indica a natureza do objeto ou
da coisa a ser definida. Já do ponto de vista científico, as definições são operatórias ou
empíricas, na qual os conceitos que elas descrevem são definidos por experimentações
repetíveis; não são absolutas, pois estão ligadas ao conjunto do pano de fundo teórico da
experimentação. (JAPIASSÚ; MARCONDES, 2001, p. 49).
Dahlberg (1978a, p. 106) tenta esclarecer a diferença entre definição nominal e real
dizendo que “a definição nominal procura fixar o uso de determinada palavra enquanto que a
definição real tem por finalidade apresentar o conhecimento contido em determinado
conceito”. Assim sendo, a definição nominal fixa o sentido de uma palavra, e a definição real
busca distinguir o conceito de outros com características idênticas. Entretanto, é valido
lembrar que nem sempre é fácil “saber se estamos fazendo uma definição real ou uma
definição nominal. Noutros casos efetuamos as duas ao mesmo tempo”. (DAHLBERG,
1978a, p. 106).
Alguns anos depois de seus primeiros estudos, Dahlberg (1983) amplia sua visão sobre
as definições incluindo a definição ostensiva aos outros tipos de definições já estudados por
ela: nominal e real, este último também chamado agora de definição conceitual. A definição
ostensiva seria quando o definiens (expressão verbal utilizada para definir algo) é elaborado
com base no referente nomeado pelo definiendum (termo definido). Neste presente trabalho,
as definições nominais e reais ou conceituais são as que terão maior relevância, pois essas
permitem a compatibilização no plano linguístico e no plano semântico, respectivamente.
(CAMPOS, 2010, p. 231).
Dahlberg (1983) se utiliza da Teoria do Conceito para afirmar que o que compõem a
definição de um conceito são suas características relevantes. São, justamente, as
características presentes na definição que possibilitarão a classificação destas definições em:
definição genérica, definição partitiva e definição funcional. Campos (2010) explica que a
definição genérica permite identificar a categoria do conceito, a partitiva, os
componentes do conceito definido, e a funcional insere o conceito como
38
elemento integrador no contexto analisado, ou seja, ela permite que se
identifique, na definição, a função/finalidade fornecida a base para se
estabelecer os sistemas terminológicos. (CAMPOS, 2010, p. 231)
Em analogia, pode-se observar que Le Moigne (1990, p. 79) já apontava que para se
compreender um fenômeno é necessário observar três dimensões: “A definição de um objeto
faz-se por triangulação: pondera um definição funcional (o que o objeto faz), uma definição
ontológica (o que o objeto é) e uma definição genética (o que o objeto devém)”. Tanto
Dahlberg, quanto Le Moigne trabalham com princípios parecidos para classificar as
definições.
Campos (2010) buscou desenvolver uma proposta de definição adequada para a
construção de ontologias de domínio consistente. Assim, a autora parte da hipótese que é
necessário estabelecer padrões para enunciados definitórios que atendam as especificidades de
cada domínio. Desta forma, propõe elementos que deveriam compor a descrição de um
determinado objeto (conceito), dentre eles são citados a presença de características que
“indicam o gênero próximo e a diferença específica do conceito em análise, seus componentes
(caso o conceito seja objeto concreto ou abstrato) ou suas etapas (caso seja um processo ou
atividade) e, por fim, a finalidade de aplicação no contexto no qual será aplicado”.
(CAMPOS, 2010, p. 222).
Principalmente pela necessidade de definições bem fundamentadas para a elaboração
de ontologias, o interesse pelos estudos sobre definição tem aumentado. Entretanto, há a
necessidade de maior aprofundamento nesta temática para que se consigam realmente padrões
definitórios capazes de contribuir para a elucidação de um conceito.
Acredita-se que as categorias de definição apresentadas por Dahlberg (1983), poderão
contribuir para análise das definições acerca de acidentes do trabalho. A identificação dos
termos e das características/atributos, presentes nos enunciados analisados, auxiliarão a
modelização do domínio a ser desenvolvida.
4.1.3 Modelagem conceitual
Diante de um mundo cada vez mais complexo, no qual “qualquer conhecimento opera
por seleção de dados significativos e rejeição de dados não significativos” (MORIN, 2006, p.
10), os modelos podem ser utilizados para representarem, de forma simplificada, a realidade
que se pretende compreender.
39
Dito de outra forma, modelo é uma aproximação de uma determinada realidade, “que,
de acordo com a sua função utilitária e por meio do seu modo de expressão, sua estrutura e
suas igualdades e desigualdades em relação ao seu original, tenta comunicar algo sobre o
real”. (SAYÃO, 2001, p. 82). Funcionam, desta forma, como analogias que reformulam o
conhecimento sobre certos aspectos do mundo real, “que podem ser reaplicados a novos
conjuntos de observações e, nesse sentido, são necessários por constituírem uma ponte entre
níveis da observação e do teórico”. (DODEBEI, 2002, p. 20).
Capra (1986 apud SAYÃO, 2001, p. 82-83) afirma que todas as teorias e modelos
científicos são aproximações da verdadeira natureza das coisas e é isto que constitui o método
científico. E acrescenta que a compreensão aproximada da natureza pode ajudar a descrever
grupos selecionados de fenômenos, negligenciando outros que se mostrem menos relevantes,
em dado momento.
Desta forma, os modelos podem ser considerados como “aproximações seletivas que,
pela eliminação de detalhes acidentais, permitem o aparecimento de alguns aspectos
fundamentais relevantes ou interessantes do mundo real sob alguma forma generalizada”.
(SAYÃO, 2001, p. 83).
Le Moigne (1977, p. 34) afirma que “modelar é conceber, para um objeto, um modelo
que permita conhecê-lo, compreendê-lo, interpretá-lo e auxilie na antecipação do
comportamento dele”. Em outras palavras, “o objetivo da modelagem de conhecimento é
elaborar uma conceituação da porção do mundo em estudo”. (CAMPOS, 2010, p. 223).
Stachowiak (1972 apud Sayão 2001, p. 84) apresenta três características básicas dos
modelos:
a) característica de mapeamento – modelos sempre modelam alguma coisa,
ou seja, são representações de “originais” (ou “protótipos”), naturais ou
artificiais, que, por sua vez, também podem ser modelados.
b) característica de redução – modelos geralmente não mapeiam todos os
atributos do original que eles representam, mas unicamente aqueles que são
relevantes para quem modela.
c) característica de pragmatismo – modelos não são em si pertencentes à
mesma classe que seus originais. Eles sempre cumprem suas funções de
substituição orientados unicamente para objetivos dependentes de operações
mentais ou factuais, dentro de uma faixa limitada de tempo.
Ao estabelecer a Teoria do Sistema Geral, conhecida também como Teoria da
Modelização, Le Moigne (1977, p. 23) afirma que “conhecer é modelizar, ou seja, o processo
de conhecer equivale à construção de modelos do mundo/domínio a ser construído que
permitem descrever e fornecer explicações sobre os fenômenos que observamos”.
Mylopoulos (1992, p. 3, tradução nossa) define modelagem conceitual como
40
a atividade de descrever formalmente alguns aspectos do mundo físico e
social que nos rodeia, para fins de compreensão e comunicação. [...]
Modelagem conceitual tem uma vantagem sobre a linguagem natural ou
notações diagramáticas na medida em que se baseia em uma notação formal
que permite "capturar a semântica da aplicação." [...] Modelagem conceitual
suporta estruturação e instalações de inferências que são psicologicamente
fundamentadas. [...] A adequação de uma notação de modelagem conceitual
repousa sobre a sua contribuição para a construção de modelos da realidade
que promovem um entendimento comum da realidade que envolve seus
usuários humanos.
Apesar do aumento do interesse pela modelagem conceitual nas últimas décadas,
principalmente em função do advento da Web Semântica, esta área de estudo é resultado de
pesquisas produzidas na década de 50, quando ocorreram as primeiras iniciativas para
especificação de modelos de dados. (ALMEIDA; OLIVERRA; COELHO, 2010). De acordo
com estes autores, a modelagem conceitual teve sua origem nos modelos de dados semânticos
para banco de dados.
Na visão de Sayão (2001) um modelo pode servir para diversos propósitos, mas serve
fundamentalmente para comunicar algo sobre o objeto da modelagem, com o objetivo de
gerar um entendimento mais completo sobre a realidade. Para que tal objetivo seja
conquistado, é preciso que o modelador possua uma visão clara e sem ambiguidades do ser ou
objeto modelado, além de exigir uma correta seleção dos elementos do universo do discurso
que comporão a visão a ser representada.
Ao estudar diversas pesquisas, Sayão (2001) compila como as principais funções dos
modelos: a) Função aquisitiva, na qual a informação pode ser definida, coletada e ordenada;
b) Função organizacional, que permite a otimização da extração de informações a partir do
modelo; c) Função lógica, que explica como ocorre um fenômeno; d) Função normativa, a
qual permite comparar fenômenos a outros similares; e) Função sistemática, através da qual a
realidade é descrita como conjunto de sistemas interligados; f) Função construtiva, na qual
teorias e leis são construídas; e g) Função de parentesco, que promovem a comunicação das
idéias cientificas.
A modelagem conceitual se constitui em uma etapa importante nos processos ligados a
tecnologias de informação que envolvem a construção de modelos de representação.
(CAMPOS; SOUZA; CAMPOS, 2003, p. 15). Faz-se necessário utilizar ferramentas
semânticas, como, por exemplo, as ontologias, para a elaboração de “modelos conceituais
consistentes e também para a formação de ‘classificacionistas’, como denominava
41
Ranganathan, ou dito de outra forma, de modelizadores, que são aqueles que elaboram
classificações e não somente as usam”. (CAMPOS; CAMPOS, 2012, p. 4).
As ontologias de referência ou de alto nível são utilizadas para modelagem conceitual
por conterem conceitos genéricos, passíveis de utilização em diversos domínios (ALMEIDA;
OLIVERRA; COELHO, 2010). São exemplos de ontologias de referência: Basic Formal
Ontology (BFO) (GRENON; SMITH; GOLDBERG, 2004, p. 41); Descriptive Ontology for
Linguistics and Cognitive Engineering (DOLCE) (MASOLO et al. 2003); Unified
Foundational Ontology (UFO) (GUIZZARDI; WAGNER, 2004), dentre outras.
Talvez por essa razão, em estudos ontologia e modelagem conceitual apareçam como
sinônimos:
Em modelagem conceitual e áreas afins (ex. Modelagem organizacional), o
termo [ontologia] é usado de acordo com sua definição original em filosofia,
a saber, como uma referência a um sistema formal e filosoficamente bemfundamentado de categorias que pode ser usado para articular conceituações
e modelos em domínios específicos do conhecimento. Em contraste, nas
outras áreas supracitadas, o termo ontologia tem sido usado como: (i)
artefato concreto de engenharia, projetado com um propósito específico e
sem prestar nenhuma ou quase nenhuma atenção aspectos teóricos de
fundamentação; (ii) modelo de um domínio específico do conhecimento
(ex., biologia molecular, finanças, logística, doenças infecciosas ) expresso
em uma linguagem de representação do conhecimento (ex., RDF, OWL, FLog ic) ou modelagem conceitual (ex., UML, EER, ORM)”. (GUIZZARDI
et al., 2009, p. 1, grifo nosso)
Entretanto, são instrumentos distintos de representação, “(i) modelos conceituais são
artefatos produzidos com o objetivo de representar uma determinada porção da realidade
segundo uma determinada conceituação; (ii) Ontologias de Fundamentação descrevem as
categorias que são usadas para a construção dessas conceituações”. (GUIZZARDI et al.,
2009, p. 1). Ainda de acordo esse autor, uma linguagem adequada de modelagem conceitual
deveria possuir princípios de modelagem que refletissem as categorias conceituais definidas
em uma ontologia de fundamentação, permitindo testar e validar um modelo conceitual. Desta
forma, “a partir da noção de cada tipo de elemento, que a estruturação do domínio seja
construída de forma a evitar proposições errôneas, aferindo qualidade à modelagem
conceitual realizada e respectiva a representação do conhecimento”. (CAMPOS; CAMPOS;
MEDEIROS, 2011, p. 142).
Percebe-se assim a modelagem conceitual diretamente ligada ao conceito de
representação do conhecimento. Modelos conceituais são representações que descrevem a
42
organização e, portanto, são mais simples de compreender por usuários leigos em Informática,
pois não envolvem detalhes de implementação de base de dados. (HEUSSER, 1998, p. 8).
A elaboração de um instrumento de representação do conhecimento baseado na
modelagem conceitual possui sua estrutura constituída por relacionamentos entre os seres ou
objetos de um determinado contexto. Os grupos de relações são mostrados por Campos
(2004): Relação categorial (reúne os objetos por sua natureza, ou seja, entidades, processos,
entre outros); Relação hierárquica (verifica a ordem de precedência de objetos de mesma
natureza); Relação partitiva (analisa como o objeto é constituído, ou seja, quais são suas
partes e elementos); Relações entre categorias (verificar como objetos de natureza diferente se
relacionam, representado de forma mais consistente); e Relação de equivalência (verificar, no
âmbito da Língua, a forma de expressar os conceitos).
Portanto, ao utilizar a modelagem conceitual para propor uma melhoria na semântica
de dados abertos publicados pelo Ministério da Previdência Social, pode-se estar também
contribuindo para que outros estudos busquem modelos para seus respectivos domínios dentro
do Governo Brasileiro.
4.1.4 Modelo Entidade-Relacionamento
O modelo Entidade-Relacionamento ou modelo E-R foi desenvolvido por Peter Chen
(1976) e se propunha a ser um modelo unificado para os dados, possibilitando a especificação
da estrutura lógica geral do banco de dados. O modelo Entidade-Relacionamento possui
princípios diretamente ligados aos denominados modelos de dados para construção de
sistemas de informação. Potter (1998, p. 53 apud CAMPOS, 2001b, p. 99) explica que, no
final da década de 50, os estudos sobre processamento de dados automatizados constataram
que faltava formalismo que expressassem a estrutura lógica dos dados do sistema. Este
formalismo foi definido como modelo de dados. Desta forma, “os modelos de dados podem
ser caracterizados como modelos que representam objetos (entidades) e relações em um dado
domínio”. (CAMPOS, 2001b, p. 100).
Heuser (1998, p. 5) explica que há vários níveis de abstração para modelização
(descrição) de um banco de dados. Por um lado, um modelo de dados com o objetivo de
explicar a um usuário qual é a organização de um banco de dados, em geral, não apresenta
detalhes sobre a representação em meio físico das informações. Por outro lado, um modelo de
dados utilizado por um técnico para otimizar a performance de acesso ao banco de dados
43
conterá mais detalhes de como as informações estão organizadas internamente e, assim, será
menos abstrato.
Na modelagem de dados uma das técnicas mais difundidas e utilizadas é a abordagem
entidade-relacionamento. (Heusser, 1998, p. 11). No início dos anos 70, já havia surgido o
Modelo Relacional, criado por Edgar Frank Codd, que foi o primeiro modelo de dados
descrito teoricamente. (CONNOLY; BEGG, 1999). Já no meado da mesma década, quando
Chen (1976) apresentou o modelo Entidade-Relacionamento, muitos autores da época não
reconheceram a importância do novo modelo, porém com o passar do tempo ficaram claras as
contribuições e as inovações que a proposta de Chen havia trazido para a Ciência da
Computação (CHEN, 2002), tornando seu artigo de 1976 um dos mais importantes da área até
os dias atuais. (LAPLANTE, 1996).
Chen (2002, p. 2) analisa o momento histórico da elaboração do modelo Entidaderelacionamento e conclui que ele foi o resultado de duas forças – força proveniente da
indústria e do mundo acadêmico – que demandavam uma evolução nos modelos de dados
existentes.
No modelo Entidade-Relacionamento os principais elementos são a entidade, o
relacionamento e o atributo. Chen (1976, p. 10) esclarece que uma entidade é ‘algo’ que pode
ser claramente identificado. Uma pessoa específica, uma empresa ou um evento são exemplos
de uma entidade. Um relacionamento é uma associação entre entidades. Já o atributo é o dado
associado a cada ocorrência e entidade ou de um relacionamento. Assim, os atributos são as
propriedades das entidades.
Dahlberg (1978a, p. 102) ao explicar análise do conceito, realizada utilizando
enunciados verdadeiros, afirma que um “atributo predicável do objeto que, no nível de
conceito, se chama característica”. Assim como Chen (1976), Dahlberg (1978a) utiliza os
atributos para explicitar as características do objeto, que na Teoria do Conceito formará o
conceito e no modelo E-R, caracterizará as entidades.
Para Heuser (1998, p. 12) uma entidade é o “conjunto de objetos da realidade
modelada sobre os quais deseja-se manter informações no banco de dados”. Entretanto,
grupos diferentes de pessoas podem determinar entidades e relacionamentos diferentes. A
solução dada por Chen (1976) para este impasse é considerar o contexto analisado e decidir os
resultados entre os participantes da modelização.
A cardinalidade presente em um modelo Entidade-Relacionamento é o “número
(mínimo, máximo) de ocorrências de entidades associadas a uma ocorrência da entidade em
questão através do relacionamento”. (HEUSER, 1998, p. 15).
44
Heuser (1998, p. 15) ainda explica que a cardinalidade é importante para fins de
projeto de banco de dados, pois determina quantas “ocorrências de uma entidade podem estar
associadas a uma determinada ocorrência através do relacionamento”.
Desta forma, a cardinalidade máxima indica a quantidade máxima de ocorrências de
entidades que podem estar associadas a uma ocorrência da outra entidade (1 ou n). Por sua
vez, a cardinalidade mínima especifica se a participação de todas as ocorrências das entidades
no relacionamento é obrigatória (1) ou opcional (0).
As informações cardinalidade de relacionamento também se expressam, por exemplo,
o "1" ou "N" nas linhas entre os tipos de entidade e tipos de relacionamento indicando o limite
superior das entidades desse tipo entidade participante em que os relacionamentos. (CHEN,
1976).
Estes elementos são arranjados de forma a deixar claro o que representam e seu papel
em um determinado modelo. Desta forma, o modelo Entidade-relacionamento é representado
graficamente como um diagrama Entidade-Relacionamento ou, simplesmente, diagrama ER.
O diagrama Entidade-Relacionamento é uma das principais técnicas na modelagem
Entidade-Relacionamento, pois padroniza a entidade e o relacionamento em formas gráficas
convencionalizadas. A figura 3 mostra um exemplo de diagrama Entidade-Relacionamento
típico.
A entidade é representada como retângulo, o relacionamento, em forma de losango,
ligado por linhas aos retângulos (entidades). Os atributos são representados como pequenos
círculos.
FIGURA 3 - Exemplo de Diagrama ER.
Fonte: O autor.
Na Figura 3 acima, nota-se os seguintes elementos:
“Acidente do trabalho” e “Lesão corporal” como entidades, representadas por um
retângulo;
O verbo “causa” como relacionamento entre as entidades, representado por um
losango;
45
“Local” e “Data” são atributos da entidade “Acidente do trabalho”, representados
por um pequeno círculo ligado diretamente à entidade a que se corresponde.
Ainda é apresentada na figura 3 a cardinalidade. Para se chegar a cardinalidade devese observar o relacionamento (Causa) entre as entidades (Acidente do trabalho e Lesão
corporal). Para tal pode se considerar as seguintes questões:
Um acidente do trabalho pode não causar lesão corporal?
Uma lesão corporal pode ser causada por mais de um acidente do trabalho?
Determinado acidente do trabalho pode causar mais de uma lesão corporal?
Pode existe, no âmbito da Previdência Social, alguma lesão corporal não causada
por acidente do trabalho?
No exemplo aqui mostrado, a cardinalidade (1,n) faz referência a “Acidente do
trabalho”, já a cardinalidade (1,1) faz referência a “Lesão corporal”. Assim, pode-se dizer
que:
uma ocorrência de “acidente do trabalho” pode causar uma ou muitas ocorrências
de “lesões corporais”. Por esse motivo, a cardinalidade de “Acidente do trabalho”
é (1,n);
uma ocorrência de “Lesão corporal” está associada a apenas uma ocorrência de
“Acidente do trabalho” (cada lesão corporal é conseqüência de apenas um acidente
do trabalho). Por essa razão, a cardinalidade de “Lesão corporal é (1,1).
A necessidade de se estudar o modelo Entidade-Relacionamento e seu diagrama surgiu
a partir da necessidade de representar graficamente os conceitos identificados para a
elaboração do modelo a ser proposto. Como representar, em forma gráfica, os conceitos de
forma a serem facilmente compreensíveis pelo leitor e que possibilite uma futura
representação em RDF? Esta foi a pergunta que direcionou os estudos ao modelo EntidadeRelacionamento.
Campos (2004), ao analisar algumas teorias e metodologias, verificou que a área da
Ciência da Informação não possui modelos para a elaboração de representações gráficas,
apesar de ser a área responsável por desenvolver teorias consagradas sobre o conceito e suas
relações.
46
Tanto na teoria da classificação facetada quanto na teoria do conceito, não é
apresentado nenhum modelo para expressar graficamente as relações
conceituais. Acreditamos que isso se deva ao fato de que essas teorias têm
por objetivo a elaboração de linguagens documentárias que, apesar de
possuírem uma parte sistemática, não têm os conceitos representados em
forma gráfica, mas em forma de uma lista endentada de termos, com uma
notação que, de certa forma, deixa evidentes os grupos de termos afins.
(CAMPOS, 2004, p. 31)
Por esta razão, buscou-se na Ciência da Computação o modelo ER como
conhecimento a ser aplicado na representação dos conceitos. Essa escolha se deve ao fato do
modelo ER ser um dos modelos com maior capacidade semântica, por apresentar aspectos
semânticos que se referem à tentativa de representar o significado dos dados e por possuir
uma relativa simplicidade e clareza gráfica. (SILBERSCHATZ; KORTH; SUDARSHAN,
1999, p. 21-34).
Ratificando estas idéias, Campos (2001b, p. 100-101) afirma que a “popularidade da
modelagem entidade-relacionamento para projetar base de dados mais complexas é dada por
sua simplicidade de conceitos e a crença muito difundida em entidades e relacionamentos
como conceitos naturais de modelagem”.
Desta maneira, com apoio das ontologias de fundamentação, que ainda serão vistas,
foram identificados nas definições sobre acidentes do trabalho as entidades, os
relacionamentos e os atributos, representando-os graficamente em diagrama ER.
Outro ponto que levou a escolha do modelo ER, foi sua proximidade com o RDF,
padrão indicado para descrição de dados na Web Semântica. Chen (2002) ao falar dos
possíveis usos e relações do modelo Entidade-Relacionamento, associa-o ao RDF, afirmando
que existem algumas semelhanças e diferenças entre RDF e do modelo ER. Entretanto, o
RDF, já é considerado um membro da família da modelagem Entidade-Relacionamento, em
que os dados estruturados como gráficos rotulados podem ser trocados através de documentos
XML. (W3C, 1999).
Decidiu-se trabalhar no diagrama ER apenas com relacionamento binário, ou seja,
quando o relacionamento “conecta apenas duas entidades” (LIMA, 2008, p. 76). Esta escolha
se justifica pela dificuldade de se converter relações ternárias em RDF e da identificação da
cardinalidade presente no relacionamento.
Acredita-se que o modelo ER seja capaz de representar os conceitos existentes no
campo de acidentes do trabalho da Previdência Social brasileira. Diante desta representação
47
realizada, pode-se verificar a organização do campo, como também utilizar esta organização
para outras representações, como, por exemplo, em RDF.
4.2 WEB SEMANTICA E SUAS TECNOLOGIAS
A Web surgiu no laboratório do European Organization for Nuclear Research, mais
conhecido como CERN. Berners-Lee (1989) escreveu um artigo que antevia a Web, no qual
tratava sobre gerenciamento de informações, que apresentava uma ideia de conjuntos de
documentos de hipertexto interligados e acessíveis pela Internet.
Existe uma confusão entre Internet e Worl Wide Web (WWW). Pode-se considerar que
a Internet surgiu em 1969, quando o pesquisador Leonard Kleinrock estabeleceu a primeira
comunicação entre dois computadores conectados a então denominada Advanced Research
Project Agency Network (ARPANET), enviando uma mensagem de um computador
localizado na Universidade da Califórnia para outro localizado no Instituto de Pesquisa de
Stanford. (RAMALHO; OUCHI, 2011). Por sua vez, a WWW é um de seus serviços. A
Internet adquire sua face atual com o surgimento do hipertexto e da Web, a “teia global”,
criados por Tim Berners-Lee no CERN, em 1989. A Web transforma a Internet num
gigantesco sistema de informações em escala mundial. (GREENBERG, 2003; MARCONDES
et al., 2008).
Em 30 de abril de 2013, em comemoração aos 20 anos do surgimento da Web, Cailliau
(2013), que atuou para viabilizar o projeto da Web, disse na página do CERN que a grande
escolha, na época, era entre fazer WWW disponível, livre de royalties, e mantê-lo como
propriedade intelectual do CERN. Foi quando decidiram pela disponibilização do WWW para
se tornar a grande rede de comunicação e informação que se conhece atualmente.
A Web tradicional é denominada por Breitman (2005) de Web Sintática, na qual os
computadores fazem apenas a apresentação da informação, enquanto o processo de
interpretação fica a cargo dos seres humanos, já que isso exige um grande esforço para
avaliar, classificar e selecionar informações e conhecimentos de interesse. (PICKLER, 2007).
Em contra partida a Web Sintática, surge a Web Semântica, que busca mecanismos
que possibilite às máquinas “compreenderem” o significado das páginas eletrônicas, criando
um ambiente no qual os computadores possam processar e relacionar conteúdos provenientes
de várias fontes. Para que isso se torne possível, é necessário estruturar os dados contidos
nessas páginas de forma que o próprio sistema identifique seu assunto e conteúdo e para isso
seria preciso embutir semântica na estrutura dos dados. (BREITMAN, 2005).
48
Miller e Swick (2003) previam que a Web Semântica iria permitir que as pessoas
pudessem escrever (ou gerar) arquivos que explicassem - a uma máquina - a relação entre
diferentes conjuntos de dados. Entretanto, atribuir semântica aos dados é uma tarefa
complexa, na qual diversos pesquisadores têm se dedicado ao estudo.
A semântica das informações precisa ser convencionada com antecedência,
de modo que todas as partes envolvidas tenham um entendimento comum do
significado dos dados trocados. No nível internacional, isso pode ser uma
questão complexa, visto que alguns conceitos legais podem diferir de um
país para outro. O objetivo final é ser capaz de interpretar os dados de
maneira uniforme entre as diferentes organizações e plataformas envolvidas
na troca de dados. Para isso, seria útil publicar na Web os nomes e
definições dos elementos usados no momento em formato partilhável e
referenciável, independentemente do grau de apoio que se obteve. (W3C,
2008, p. 58)
A Web Semântica pode ser entendida como sendo uma extensão da Web atual
(BERNERS-LEE; HENDLER; LASSILA, 2011), na qual a informação ganha sentidos bem
definidos, permitindo uma melhor cooperação entre pessoas e computadores na realização de
suas tarefas. Isso é baseado na ideia de se ter, na Web, dados definidos e ligados de modo que
consigam ser usados em buscas, gerando respostas mais eficazes, na automação, na integração
e no reuso com várias aplicações. (MILLER; SWICK, 2003).
Pickler (2007) complementa a definição de Web Semântica ao afirmar que ela foi uma
tentativa de se melhorar (ou mesmo otimizar) as pesquisas realizadas na Web. Servindo como
uma nova ferramenta inteligente de busca de informações no ciberespaço, acrescentando
semântica ao atual formato de representação de dados, trabalhando com associação e dedução.
Sob essa perspectiva, a tarefa de verificar o assunto do documento ficaria a cargo das
máquinas, poupando tempo e trabalho a quem realizasse uma busca.
Na figura 4, é mostrada uma representação da evolução da Web. semântica das
conexões das informações (eixo vertical do gráfico). A linha pontilhada mostra conceitos e
aplicações Web, que foram criados a partir da evolução da semântica das conexões das
informações. Dentre as tecnologias utilizadas na infraestrutura dessa evolução se encontram
as da Web Semântica.
Deve-se ficar atento para o fato que, a Web Semântica, chamada por alguns autores de
Web 3.0, trata sobre a colocação de itens de dados na Web, não servindo apenas como uma
Web de documentos, mas também de dados. “A tecnologia de dados da Web Semântica terá
muitas aplicações, todas interconectadas. Pela primeira vez haverá um formato comum de
49
dados para todos os aplicativos, permitindo que os bancos de dados e as páginas da Web
troquem arquivos”. (BERNERS-LEE, 2007, p. 3).
FIGURA 4 - Evolução da Web.
Fonte: Spivack (2007)
A Web Semântica, no contexto dos dados ligados, oferece uma infra-estrutura (figura
5) que permite páginas Web, bancos de dados, serviços, programas, dispositivos pessoais e
até mesmo eletrodomésticos tanto consumir, como produzir dados a serem disponibilizados.
Agentes de software podem usar essas informações para procurar, filtrar e preparar
informações em novos formatos de forma a ajudar os usuários da Web. (MILLER; SWICK,
2003).
FIGURA 5 - Arquitetura da Web Semântica.
Fonte: Greenberg; Sutton; Campbell (2003).
50
Abaixo segue a descrição da figura 5 de acordo com Greenberg, Sutton, Campbell
(2003, p. 16):
•
URIs e Unicode. URIs (identificadores de recursos uniforme) são
identificadores únicos para os recursos de todos os tipos de esquemas
para pessoas. Um componente importante da camada de base, URIs
são metadados e funcionam como o ISBN.
•
XML + NS + XMLschema. Extensible Markup Language (XML) e,
mais recentemente, os XML esquema facilitam a criação, o uso e a
interoperabilidade sintática de vocabulários de metadados. NS
(namespaces), que são identificados por meio de URIs, garantem a
interoperabilidade semântica entre vocabulários de metadados.
•
RDF e RDFschema. A família RDF suporta ainda a
interoperabilidade a nível semântico. Desenvolvimentos RDF
compreendem a base da linguagem Web, para que os agentes possam
fazer inferências lógicas, baseadas em metadados, para executar
tarefas.
•
Ontology vocabulary. A camada de ontologia representa artéria
central de metadados da Web Semântica, onde descrições simples de
esquemas classificatórios complexos devem ser criados e registrados
para que os agentes inteligentes possam interpretar dados, fazer
inferências, e executar tarefas.
•
Logic. Um agente pode tirar uma conclusão lógica (ou razão) no
processo de completar uma tarefa com base no que são,
essencialmente, "fatos" prestados a partir de metadados
semanticamente codificada. Outros tipos de lógica também pode ser
aplicável na Web Semântica.
•
Proof and Trust. As duas últimas camadas horizontais construídas
fora da camada de lógica, sendo uma prova de validação da
"evidência" decorrente da atividade lógica inferencial e confiança
relacionadas com a integridade da prova, que pode ser rastreada
através das outras camadas do diagrama de Berners-Lee. A
funcionalidade destas duas camadas é altamente dependente da
criação de metadados precisos e confiáveis.
•
Digital Signature. As assinaturas digitais correm verticalmente desde
a família RDF até a camada de prova e apoia a noção de confiança.
Pesquisas na área de assinaturas digitais podem ajudar a validar a
integridade dos metadados que um agente vai usar para o raciocínio e
conclusão da tarefa.
Neste trabalho se dará ênfase à linguagem XML, ao RDF e às ontologias, por serem as
tecnologias escolhidas para serem aplicadas na pesquisa em questão. Porém, não se poderia
deixar de fazer uma breve explanação sobre URI, justamente por estar na base da Web
Semântica.
51
4.2.1 Identificando recursos com URI
Uniform Resource Identifier ou simplesmente URIs são utilizados para identificar
recursos, sendo fundamentais para a implementação da Web Semântica. Usando uma
convenção de nomenclatura global, impulsionam os benefícios da Web. URIs têm escopo
global e são interpretadas de forma consistente em contextos específicos. Associando uma
URI com um recurso significa que qualquer pessoa pode se associar a ele, referindo-se a ele
ou recuperar uma representação sobre ele. (SHADBOLT; HALL; BERNERS-LEE, 2006, p.
97).
Ainda de acordo com esses autores, as URIs sustentam a Web Semântica, pois
permitem que as máquinas processem os dados diretamente. Desta forma, a Web Semântica
muda a ênfase passando dos documentos para os dados.
De acordo com Thompson (2010), no final da década de 1990, o conceito de recurso
sofreu uma generalização, passando a ser utilizado a algo identificado, ou seja, pessoas,
livros, documentos eletrônicos ou até mesmo relações abstratas, por exemplo, podem ser
considerados recursos. Este fato foi muito importante para a Web Semântica, pois já não
havia limites para se considerar um recurso.
FIGURA 6 - URI na representação de um recurso.
Fonte: Thompson (2010)
Na figura 6, pode-se perceber uma URI identificando um recurso (cidade), descrito por
outro recurso (documento com informações sobe Oaxaca), que, por sua vez, é representado
52
por metadados. Logo, a URI ganha destaque no universo da Web Semântica, pois permite a
interação com representações do recurso através da Web.
4.2.2 XML e a descrição de dados
De acordo com Leocadio (2011, p. 53), a Web Semântica também é conhecida como
Web dos dados e nesse sentido duas tecnologias se apresentam como catalisadoras: eXtensible
Markup Language (XML) e Resource Description Framework (RDF). Resumidamente, a
XML trata da sintaxe enquanto o RDF trata da semântica dos dados.
Davis (2004 apud FURGERI, 2006, p. 226) define linguagem de marcação como
“uma forma de descrever a estrutura lógica ou semântica de um documento e fornecer
instruções a computadores sobre como apresentar o conteúdo de um arquivo”. Percebe-se, por
esta definição, que a linguagem de marcação é caracterizada por delimitar um dado,
classificando-o dentro do contexto representado. Contribuindo, dessa forma, para “tornar a
comunicação livre de formatos proprietários, uma vez que elas representam padrões abertos e
podem ser usadas livremente”. (FURGERI, 2006, p. 227)
Dziekaniak e Kirinus (2004, p. 30) definem XML como a representação textual do
dado. Explicam ainda que, a XML é formada por um composto básico chamado “element, isto
é, o texto limitado entre delimitadores (tags) < >...</> (incluindo os próprios delimitadores)
tal como pessoa, nome, idade e e-mail. É possível associar atributos a elementos. Um atributo
é definido como um par (nome, valor)”. Na figura 7, pode-se observar uma representação de
dados sobre acidentes do trabalho em XML.
FIGURA 7 - Dados em XML sobre acidente do trabalho
<?xml version="1.0"?>
<acidentes_de_trabalho>
<registro>
<municipio uf="AP" cod_ibge="160027">LARANJAL DO JARI</municipio>
<quantidade>
<sem_cat>42</sem_cat>
<com_cat>
<tipicos>4</tipicos>
<trajeto>3</trajeto>
<doenca>0</doenca>
</com_cat>
<obitos>0</obitos>
</quantidade>
</registro>
</acidentes_de_trabalho>
Fonte: Dataprev (2013)
Ao analisar especificamente a linguagem XML, Dziekaniak e Kirinus (2004, p. 30)
afirmam que essa linguagem de marcação deve respeitar duas restrições: “tags devem estar
53
corretamente aninhadas e atributos devem ser únicos”. Assim, de acordo com esses autores, se
um documento atende a essas restrições, o documento estará bem formado, sendo possível
organizá-lo segundo uma estrutura de árvore e representá-lo via XML na Web.
A XML é um formato amplamente utilizado para troca de dados, pois “possibilita que
se mantenha a estrutura dos dados em operações diferentes. O modo como os arquivos XML
são construídos permite aos desenvolvedores escrever parte da documentação dentro dos
dados, sem interferir na sua leitura”. (MANUAL..., 2011, p. 36).
A linguagem XML foi desenvolvida na Sun, fornecedora de softwares e equipamentos
na área de Tecnologia da Informação. Furgeri (2006, p. 229) explica que
Assim como o HTML, o XML foi definido como um padrão de marcação
para ser utilizado na Internet, constituindo-se uma versão simplificada da
Standard Generalized Markup Language (SGML), cujo objetivo principal
foi fornecer aos desenvolvedores da Web uma maneira de definir e criar seus
próprios marcadores e atributos em vez de estarem restritos ao esquema de
marcação da HTML. O próprio significado da XML sugere essa
característica, pois é uma linguagem de marcação extensível.
A XML Schema é uma evolução do Document Type Definition (DTD) e são exemplos
de padrões de marcação surgidos a partir da XML, que permite a criação de tags específicas
para determinada área. Entretanto, para que o documento seja compreendido em diferentes
contextos é necessário que se obedeça algumas regras, que serão definidas pela XML Schema.
É este último que definirá os padrões deveram ser seguidos para que o documento seja
considerado válido. (FURGERI, 2006, p. 230).
Ao mencionar sobre as aplicações da XML em Ciência da Informação, Furgeri (2006,
p. 234) afirma que a linguagem XML pode ser usada na melhoria da recuperação da
informação no ambiente Web, uma vez que a HTML, que não fornece um modo adequado
para descrever os conteúdos do texto, o significado fica perdido e os resultados de busca nem
sempre satisfatórios. O mesmo autor afirma ainda que, a linguagem XML pode ser usada na
criação de ontologias entre comunidades. Pois, um documento poderá expressar o sentido de
seu conteúdo se o autor e o leitor estiverem de acordo com o significado dos termos
utilizados, isto é, devem ser elaborados a partir do mesmo Schema.
Miller e Swick (2003, p. 9) consideram que o XML fornece uma base sintática
interoperável sobre a qual as línguas para representar as relações e os significados são
construídos. Já o RDF fornece um meio poderoso de expressar e representar essas relações e
significados.
54
4.2.3 RDF como linguagem de representação de dados
Em 1997, o W3C definiu a primeira especificação Resource Description Framework
(RDF). RDF fornece uma linguagem de representação baseada em triplas simples, mas
poderosas para interligar URIs. Em função disso, tornou-se uma recomendação da W3C em
1999, preocupada, naquele momento, com a conscientização da necessidade de especificar os
recursos e promover a sua implantação generalizada para melhorar a funcionalidade da Web e
interoperabilidade. “A Web original tomou hipertexto e fez funcionar em escala global, a
visão para RDF era fornecer uma representação do conhecimento minimalista para a Web”.
(SHADBOLT; HALL; BERNERS-LEE, 2006, p. 96).
Senso e Hípola (2007, p. 3) relatam que o RDF foi criado como “um formato que iria
conseguir a compatibilidade entre os diferentes sistemas de metadados, proporcionando assim
uma arquitetura genérica para a meta-informação. Para isso, decidiu usar XML como um
sistema de comunicação”.
De acordo com Hjelm (2001 apud SENSO; HÍPOLA, 2007, p. 3), RDF é um formato
que tem a sua origem em dois ramos recentes da Documentação. Por um lado são metadados,
como um sistema que, além de servir como um modelo de metadados é capaz de conectar
sistemas em conjunto e, por outro lado, a representação do conhecimento, agora incorporada
no conceito de Web Semântica.
A capacidade que tem o RDF para representar metadados, em formato legível por
máquina, facilita a interoperabilidade entre diversas aplicações, proporcionando um
mecanismo perfeito para o intercâmbio de informação através da Web. É usado em projeto
dados abertos interligados (LOD, sigla em inglês de Linked Open Data), da União Européia,
oferecendo oportunidade para a interoperabilidade e o processamento automático de dados
governamentais. (MANUAL..., 2013, p. 37). Interoperabilidade pode ser entendida como a
“capacidade de bases de dados trocarem e compartilharem documentos, consultas e serviços,
usando diferentes plataformas de hardware, estrutura de dados e interfaces”. (ALVES;
SOUZA, 2007, p. 23).
Na visão de Brickey e Guha (2000 apud SENSO; HÍPOLA, 2007, p. 4), o RDF pode
ser aplicado em diferentes áreas: como a recuperação de informação (proporcionando
melhores serviços aos motores de busca); a catalogação em bibliotecas digitais (especificando
também relações de conteúdos disponíveis em um determinado site da Web); os agentes
inteligentes (facilitando o intercâmbio de conhecimento).
55
RDF é utilizado como uma representação de informações na Web. Elaborada a partir
da XML, tem como objetivo principal prover intercâmbio de informações entre aplicações
mantendo seu significado. O RDF permite criar declarações sobre esses objetos por meio de
propriedades que representam um relacionamento entre recursos.
Furgeri (2006, p. 237) apresenta aos benefícios trazidos pela utilização do RDF:
RDF resolve o problema da diversidade na representação da informação que
ocorre em XML, criando ligações únicas entre recursos e estabelecendo
vocabulários por meio de namespaces18. A RDF elimina o problema da limitação
do tamanho da estrutura enfrentada pela XML, criando ponteiros que unem
documentos com estruturas menores.
RDF é mais indicada para a criação de metadados, pois um recurso é referenciado
a um objeto por meio de um predicado com significado próprio. A ordem com que
as declarações são realizadas não importa, diferente do que ocorre na XML.
RDF elimina o problema da representação da informação em forma de árvore,
criando uma estrutura mais flexível em forma de grafos, possibilitando a formação
de uma cadeia de informações e estabelecendo uma rede de conhecimento.
O RDF é considerado por autores como Berners-Lee, Hendler e Lassila (2001) como a
possibilidade de se criar um primeiro nível de semântica nos dados publicados na Web.
Criando-se um vocabulário controlado para descrever um domínio do conhecimento, fato que
torna possível a qualquer organização publicar informações de maneira semântica. Com isso,
agentes de software podem agir de maneira automática e inteligente sobre recursos Web,
inferindo sobre o significado dos elementos. (Furgeri, 2006, p. 237-238).
A descrição de um recurso é representada como uma série de triplas com “sujeitopredicado-objeto” (ARAÚJO, SOUZA, 2011) ou, com outra nomenclatura, “recursopropriedade-valor” (FURGERI, 2006). Klyne e Carroll (2004 apud ARAÚJO, SOUZA, 2011)
explicam que o sujeito é o URI que serve para identificação do recurso descrito. Já o objeto é
o valor literal, como uma string, número ou data, ou ainda o URI de outro recurso que está
relacionado ao sujeito. Por sua vez, o predicado é um algum vocabulário, que indica o tipo de
relação que existe ente o sujeito e o objeto.
FIGURA 8 - Grafo de triplas (sujeito, predicado e objeto)
Predicado
Sujeito
Acidente do trabalho
Objeto
Lesão corporal
Causa
Fonte: O Autor.
18
Namespace pode ser entendido como um mecanismo para identificar os elementos da XML. Trata-se de um
prefixo associado à marcação que permite torná-la exclusiva. (MARCHAL, 2000 apud FURGERI, 2006).
56
Furgeri (2006) e Baptista e Machado (2001) afirmam que com o RDF Schema (RDFS)
é possível definir os termos (as triplas) que serão usados nas declarações dos documentos
RDF, uma maneira de criar um vocabulário controlado, permitindo estabelecer relações e
restrições entre os recursos. Essas relações são utilizadas para interligar termos por meio de
namespaces, estabelecendo significado entre eles por meio de associações. O Simple
Knowledge Organisation Systems (SKOS) é um exemplo de vocabulário baseado em RDF
para representação de tesauros e outros tipos similares de sistemas de organização de
conhecimento. (MILES, 2005 apud FURGERI, 2006, p. 237-238).
4.2.4 Ontologia e acidente do trabalho como evento
Berners-Lee (1989) já previa a evolução de uma Web que consistia na passagem de
uma Web com grande parte de documentos compreensíveis apenas por pessoas para uma
extensão dessa Web, que permitiria a manipulação de dados e informações compreensíveis
por computadores. A Web Semântica é uma rede de informações derivada de dados, que por
meio de uma semântica, permite que máquinas “interpretem” esses dados. (SHADBOLT;
HALL; BERNERS-LEE, 2006, p. 96).
Um dos grandes desafios na época de surgimento da Web Semântica era como atribuir
sentido aos dados de forma a serem compreensíveis por máquinas. Entretanto, esse obstáculo
tem sido transposto pela adoção de concepções comuns referidas como ontologias.
(SHADBOLT; HALL; BERNERS-LEE, 2006, p. 96). De acordo com esses autores, desde
2001, o argumento em favor do uso de ontologias vem gerando numerosas iniciativas em prol
do desenvolvimento de ontologias para utilização em diversas áreas do conhecimento, sendo
realizadas pesquisas em diversos grupos. Essas comunidades desenvolvem padrões de
linguagem que podem ser implantados na Web.
Para Gruber (2009) o termo "Ontologia" vem do campo da Filosofia que se preocupa
com o estudo do Ser ou existência. Na Filosofia, pode-se falar de uma Ontologia como uma
teoria sobre a natureza da existência. Entretanto, para esse autor, a ontologia, na Ciência da
Computação e na Ciência da Informação, é um termo técnico que indica um artefato que é
projetado para uma finalidade, que é permitir a modelagem de conhecimento sobre algum
domínio, real ou imaginária.
O termo ontologia foi cunhado no século 17 pelos filósofos Rudolf Göckel, em sua
obra Lexicon philosophicum e por Jacob Lorhard, em sua obra Ogdoas Scholastica. O termo
Ontologia, entretanto, foi popularizado no círculo filosófico somente no século 18 pela
57
publicação, em 1730, da Philosophia prima sive Ontologia de Christian Wolff.
(GUIZZARDI, 2005).
De acordo com Smith (2004 apud GUIZZARDI, 2005), o termo “ontologia” na
Ciência da Computação e na Ciência da Informação apareceu pela primeira vez em 1967, em
um trabalho de fundamentos de modelagem de dados escrito por S. H. Mealy, na passagem
que distingue três reinos diferentes na área de processamento de dados, a saber: a) o próprio
mundo real; b) idéias sobre o que existe nas mentes dos homens; c) símbolos sobre papel ou
outro meio de armazenamento.
Gruber (1995) define uma ontologia como sendo uma especificação de uma
conceituação19. Já Guarino (1998) acrescenta dizendo que a ontologia é uma especificação
parcial e explícita que tenta uma aproximação com a estrutura de mundo definida na
conceituação. Guizzardi (2000) baseado nas idéias de Guarino (1998) resume que a ontologia
é um
artefato computacional composto de um vocabulário de conceitos, suas
definições e suas possíveis propriedades, um modelo gráfico mostrando
todas as possíveis relações entre os conceitos e relações, representando de
maneira clara e não ambígua o conhecimento do domínio. (GUIZZARDI,
2000, p. 39).
Guizzardi (2005, p. 70-71) explica que ao surgir a Web Semântica, as ontologias
foram chamadas a desempenhar um papel fundamental no entrelaçamento de símbolos
compreensíveis pelos humanos e processáveis por máquina. A ideia é que, em primeiro lugar,
as ontologias representando conceituações compartilhadas da realidade são construídas e
especificadas em uma linguagem compreensível por máquina. Em seguida, as especificações
formais, que podem ser utilizadas como domínios semânticos, através da definição de
semântica formal e do mundo real, fornecendo sentido aos símbolos sintáticos apresentados
em recursos da Web.
Diante da necessidade de se utilizar ontologias na organização de dados na Web,
percebe-se, cada vez mais, o interesse de diferentes áreas do conhecimento sobre esse assunto.
Por essa razão, Almeida e Bax (2003) levantam uma grande quantidade de tipologias de
ontologias, isso se deve ao fato das ontologias não apresentarem uma única estrutura.
19
Alguns autores preferem traduzir o termo “conceptualization” para “conceitualização”, porém essa palavra
não existe na língua portuguesa. De acordo com Higuchi (2012) o termo mais próximo em português seria
“conceituação”, que não corresponde ao sentido utilizado na área de representação do conhecimento. Já
“conceitualização” é amplamente adotado para se referir a uma visão abstrata e simplificada do mundo que se
deseja representar, considerando as entidades e relacionamentos.
58
Entretanto, pode-se identificar características e componentes básicos, que podem ser
classificados em tipos bem definidos.
Uschold e Gruninger (1996) classificaram as ontologias pelo grau de formalismo:
altamente informal, semi-informal, semi-formal e rigorosamente formal. Já Guarino (1997;
1998) faz uma classificação das ontologias com base em seu conteúdo. Guizzardi (2000;
2005) explica estas classificações da seguinte maneira:
ontologias genéricas: descrevem conceitos bastante gerais, tais como, espaço,
tempo, matéria, objeto, evento, ação, etc., que são independentes de um
problema ou domínio particular;
ontologias de domínio: expressam conceituações de domínios particulares,
descrevendo o vocabulário relacionado a um domínio genérico, tal como
Medicina e Direito.
ontologias de tarefas: expressam conceituações sobre a resolução de
problemas, independentemente do domínio em que ocorram, isto é, descrevem
o vocabulário relacionado a uma atividade ou tarefa genérica, tal como,
diagnose ou vendas;
ontologias de aplicação: descrevem conceitos dependentes do domínio e da
tarefa particulares. Estes conceitos freqüentemente correspondem a papéis
desempenhados por entidades do domínio quando da realização de uma certa
atividade;
ontologias de representação: explicam as conceituações que fundamentam
os formalismos de representação de conhecimento.
Assim sendo, Guizzardi (2000, p. 39-40) sintetiza que as ontologias de domínio, o tipo
mais desenvolvido, são construídas para serem utilizadas em um micro-mundo. As ontologias
genéricas procuram construir teorias básicas do mundo, de caráter bastante abstrato,
aplicáveis a qualquer domínio (conhecimento de senso comum). Já as ontologias de
representação procuram tornar claros os compromissos ontológicos de representação
embutidos em formalismos de representação de conhecimento. E por sua vez, as ontologias de
tarefa procuram facilitar a integração dos conhecimentos de tarefa e domínio em uma
abordagem mais uniforme e consistente, tendo como base o uso de ontologias.
McGuinness (2003) cita algumas possíveis utilizações para ontologias. Uma delas
seria sua utilização para os tipos simples de verificação de consistência. Se ontologias contêm
informações sobre as propriedades e restrições de valor sobre as propriedades, pode se fazer a
verificação em sua aplicação em determinado domínio. As ontologias podem ser ainda
capazes de fornecer suporte de interoperabilidade, pois diferentes usuários/aplicações estão
usando o mesmo conjunto de termos. Utilizando uma taxonomia se reconhece quando um
aplicativo está usando um termo que é mais geral ou mais específico que outro. Já com
ontologias, que são mais expressivas que taxonomias, é possível ter uma definição
59
operacional completa de como um termo refere-se a outros e, assim, usar axiomas de
igualdade ou mapeamentos para expressar um termo precisamente igual a outro,
possibilitando uma interoperabilidade mais "inteligente".
Essa linguagem também pode contribuir para o estabelecimento dos domínios e
ranges, conceitos herdados do RDF. Esta representação em RDF “é reconhecida pela
linguagem XML, o que possibilita que a ontologia seja implementada em ambiente Web”.
(Dziekaniak, 2010, p. 181)
Guizzardi (2000, p. 41) divide os benefícios provenientes da utilização da ontologia
em três áreas:
Comunicação: ontologias são ferramentas úteis para ajudar as pessoas a
se comunicarem, sob várias formas, acerca de um determinado
conhecimento. Em primeiro lugar, elas podem ajudar as pessoas a
raciocinar e a entender o domínio do conhecimento e, portanto, atuam
como uma referência para a obtenção do consenso numa comunidade
profissional sobre o vocabulário técnico a ser usado nas suas interações.
Além disso, ontologias constituem um excelente guia no processo de
elicitação de conhecimento das diversas fontes.
Formalização: devido à natureza formal da notação usada, a
especificação do domínio elimina contradições e inconsistências
envolvendo as restrições, resultando, portanto, em uma especificação não
ambígua. Um outro ponto a ser destacado é que, já que uma notação
formal é usada, a especificação formalizada pode ser automaticamente
verificada e validada, se um provador automático de teoremas existe para
aquela notação. Com um mecanismo de inferência, é também possível
derivar novos conhecimentos de forma automática, a partir da base de
conhecimento já presente na ontologia. Por fim, esta característica torna
possível a obtenção de um processo de geração de infraestruturas
computacionais de maneira sistemática e idealmente automática.
Representação do conhecimento e reuso: A ontologia forma um
vocabulário de consenso e representa o conhecimento do domínio de
forma explícita no seu mais alto nível de abstração, possuindo um
potencial enorme de reuso. O conhecimento formalizado na camada de
domínio pode ser especializado em diferentes aplicações, servindo
diferentes propósitos, por diferentes equipes de desenvolvimento, em
diferentes pontos do tempo.
As ontologias também apresentam problemas. Guizzardi (2000) se baseou em O’Leary
(1997) e Falbo (1998) para mostrar os obstáculos que existem para se aproveitar plenamente
das vantagens apresentadas anteriormente. Diante disto, para esses autores:
(i) a escolha de uma ontologia é um processo político, já que nenhuma
ontologia pode ser totalmente adequada a todos os indivíduos ou grupos. (ii)
Ontologias não são necessariamente estacionárias, i.e., necessitam evoluir.
Poucos trabalhos têm enfocado a evolução de ontologias. (iii) Estender
60
ontologias não é um processo direto. Ontologias são, geralmente,
estruturadas de maneira precisa e, como resultado, são particularmente
vulneráveis a questões de extensão, dado o forte relacionamento entre
complexidade e precisão das definições. (iv) A noção de bibliotecas de
ontologias sugere uma relativa independência entre diferentes ontologias. A
interface entre elas constitui, portanto, um impedimento, especialmente
porque cada uma delas é desenvolvida no contexto de um processo político.
Ontologias desenvolvidas independentemente podem não se integrar
efetivamente com outras por vários motivos, desde similaridade de
vocabulário até visões conflitantes do mundo. (GUIZZARDI, 2000, p. 4142)
Vários estudos têm buscado soluções para esses problemas. Uma dessas abordagens
trata sobre a semântica axiomática, que é uma abordagem bastante específica e definida no
âmbito das linguagens e padrões da Web Semântica, em particular o RDFS. Segundo Fikes e
McGuinness (2001 apud ALMEIDA; SOUZA, 2011, p. 36), o objetivo da semântica
axiomática é proporcionar a tradução de descrições RDFS para lógica, ou seja, estabelecer
regras para mapear RDFS em Lógica de Primeira Ordem (LPO), com o objetivo de
proporcionar capacidade de inferências automáticas à linguagem de representação
considerada.
Embora alguns autores considerem taxonomias e ontologias nomes novos para antigos
sistemas de classificação, elas guardam muitas semelhanças e mantêm na classificação sua
base comum, mas talvez não sejam exatamente a mesma coisa. (GOMES, 2009, p. 76).
Vickery (1997) também apresenta algumas similaridades entre os tesauros e as taxonomias
com as ontologias. Entretanto, no contexto da Web Semântica, os tesauros parecem não ser
adequados para representação dos dados devido à ausência de flexibilidade (PICKLER, 2007,
p. 77), característica esta presente nas ontologias. A expressividade semântica de instrumentos
de representação do conhecimento pode ser observada na figura 9.
FIGURA 9 - Expressividade semântica de instrumentos de representação do conhecimento.
Fonte: Almeida; Souza, (2011, p. 45)
61
Logo, as similaridades levantadas por Vickery (1997) estão presentes na forma de
elaboração da estrutura desses instrumentos, que demanda a organização de conceitos em
processos que incluem categorização e classificação de conceitos, definição das relações entre
esses conceitos e tratamento da terminologia empregada nos conceitos e relações da estrutura.
(SILVA; SOUZA; ALMEIDA, 2008, p. 61).
Portanto, como lembra Campos (2006; 2010) não se deve reduzir o conceito de
ontologia a somente como um vocabulário controlado. Pois uma ontologia possui afirmação
“terminológica, possui um conjunto básico de conceitos e relações, e assertivas aplicadas aos
conceitos e relações, que constituem um conjunto de axiomas, diferentemente de instrumentos
de controle terminológico como os tesauros”. (CAMPOS, 2006, p. 2).
Ontologias de Fundamentação utilizadas na representação de eventos
As ontologias de fundamentação são sistemas de categorias filosoficamente bem
fundamentadas e independentes de domínio, que têm sido utilizadas com sucesso para
melhorar a qualidade de linguagens de modelagem e modelos conceituais (GUIZZARDI et
al., 2009). Em outras palavras, são ontologias genéricas que permitem modelar ontologias de
domínio, simplificando sua modelagem, aumentando sua elegibilidade e seu reuso. (SILVA,
2011, p. 1)
Almeida, Oliverra e Coelho (2010, p. 33) afirmam que “uma alternativa para verificar
possíveis deficiências de uma modelagem é comparar a linguagem utilizada na modelagem a
um padrão, a uma ontologia bem fundamentada, que são baseadas em ontologias filosóficas e
ontologias de alto nível”.
Deste modo, as ontologias de fundamentação permitem que a construção de
uma teoria sobre o domínio possibilite testar e validar um modelo
conceitual. Assim, ao diferenciar os tipos de elementos que compõem um
domínio e permitir sua representação, a ontologia de fundamentação
explicita conceitos a partir de sua tipologia, estabelecendo sua posição em
uma cadeia de elementos. Isto permite, a partir da noção de cada tipo de
elemento, que a estruturação do domínio seja construída de forma a evitar
proposições errôneas, aferindo qualidade à modelagem conceitual realizada
e respectiva a representação do conhecimento em um domínio. (CAMPOS;
CAMPOS; MEDEIROS, 2011, p. 142)
Para este trabalho, será observado nas ontologias de fundamentação Descriptive
Ontology for Linguistic and Cognitive Engineering (DOLCE) e Unified Foundational
Ontology (UFO), como a categoria de eventos é representada. A escolha destas ontologias se
62
legitima em função da importância que elas possuem tanto no uso de modelagens de
ontologias de domínio, quanto pelo interesse de estudiosos sobre elas.
A DOLCE é uma ontologia de fundamentação desenvolvida por um grupo de pesquisa
liderado por Nicola Guarino. A pesquisa que deu origem a DOLCE fez parte do projeto
WonderWeb, no qual o primeiro módulo criado foi o da Foundational Ontologies Libary.
(GUIZZARDI et al., 2009).
Esta ontologia é classificada por pesquisadores em ontologia de particulares. A
distinção fundamental entre universais e particulares se faz em relação de instanciação, na
qual particulares são entidades que não possuem instâncias e universais são entidades que as
possuem. (GANGEMI et al., 2002; MASOLO et al., 2003). Em outras palavras, particulares
são indivíduos que existem no tempo e no espaço.
Baseada no comportamento do objeto ao longo do tempo, a DOLCE trabalha as
categorias de endurantes (endurant) e perdurantes (perdurant). No primeiro, o objeto e suas
partes estão presentes em todo o tempo, já no segundo acumulam partes temporais, ou seja,
estão parcialmente presentes (GANGEMI et al., 2002, p. 225). Logo, os eventos seriam os
perdurantes.
Na figura 10, pode ser observada a estrutura da DOLCE, na qual a divisão entre
endurantes e perdurantes se mostra bem clara.
FIGURA 10 - Taxonomia das categorias básicas da DOLCE.
Fonte: Gangemi et al. (2002, p. 226)
63
A DOLCE foi utilizada como uma espécie de matriz para a elaboração da Ontologia
DUL Ontology, que é uma combinação da DOLCE e DOLCE DnS (Descriptions and
Situations), apresentada de forma mais intuitiva e simples. Para fins desta pesquisa, buscou-se
compreender a ontologia DUL, pois ela trata de questões intrínsecas aos eventos, como:
identificação dos participantes do evento, levantamento das entidades e das situações
envolvidas. Percebe-se a seguir, na figura 11, a presença de seis classes principais,
subordinadas a Entity, são elas: Agent, Object, Event, informatioEntity, Abstract e Quality.
FIGURA 11 - Visão parcial da Ontologia DUL.
Fonte: Higuchi (2012, p. 102)
Event é definido na ontologia DUL como qualquer processo físico, social ou mental,
evento ou estado. Na visão dos desenvolvedores da DUL os eventos estão relacionados a
situações observáveis, podendo ter diferentes pontos de vista em um mesmo período de
tempo. Isto acarreta a classificação de entidades de um mesmo evento de formas diferentes,
pois será baseada nos critérios do modelador. Para a W3C (2005) isto gera uma discussão,
porque os realistas irão continuar defendendo a ideia de que os acontecimentos na realidade
não são alterados pela forma como são representados, enquanto os construtivistas irão
defender a ideia de que, qualquer que seja "verdadeira realidade", não pode ser modelado sem
a carga teórica de como observar e descrever. Por esta razão, na ontologia DUL são
permitidos os dois eventos, em conjunto com a descrição, de modo a codificar a modelagem
precisa, independentemente da posição (se houver) escolhido pelo modelador.
Outra ontologia de fundamentação aqui observada é a UFO, que “tem sido aplicada
com sucesso para avaliar, (re)projetar e integrar os modelos de linguagens de modelagem
conceitual, bem como para prover semântica de mundo real (real-world semantics) para seus
elementos de modelagem”. (GUIZZARDI; FALBO; GUIZZARDI, 2008, p. 244).
A UFO é desenvolvida na tese de doutorado de Guizzardi (2005) utilizando teorias
provenientes de ontologias formais, lógica filosófica, filosofia da linguagem, linguística e
64
psicologia cognitiva. (GUIZZARDI; FALBO; GUIZZARDI, 2008, p. 244). Ela busca
diminuir algumas limitações encontradas em outras ontologias de fundamentação, como a
própria DOLCE, vista anteriormente.
A UFO é dividida em: UFO-A (Ontology of
Endurants), destinada a modelização de objetos (endurantes); UFO-B (Ontology of
Perdurants), que busca sistematizar conceitos como estados, processos, eventos, relações
temporais; e UFO-C (Ontology of Social and Intentional Entities), fundamentada na UFO-A e
UFO-B para sistematizar conceitos sociais, como plano, ação, objetivo, agente,
intencionalidade, comprometimento e compromisso.
Para fins de estudo desta pesquisa, será dada ênfase a UFO-B que trata
especificamente de eventos. A UFO-B define eventos como “indivíduos compostos de partes
temporais. Eles acontecem no tempo no sentido de se estenderem no tempo acumulando
partes temporais”. (GUIZZARDI; FALBO; GUIZZARDI, 2008, p. 246). Cada participação
de um evento é um evento que pode ser atômico (sem sub-partes) ou complexos (composto de
outros eventos), mas que existe em função de outro evento. Isto pode ser observado na figura
12, a seguir.
FIGURA 12 - Fragmento da UFO-B: Objetos e Eventos.
Fonte: Guizzardi; Falbo; Guizzardi (2008, p. 246).
Conforme mostrado também na figura 12, a UFO-B ainda diferencia “Eventos” de
“Objetos” considerando suas relações com o tempo. Objetos estão presentes em qualquer
instante do tempo que estiverem presentes. Já os Eventos (ou ocorrências) são indivíduos
compostos de partes temporais, ou seja, estendem-se no tempo acumulando partes temporais.
(GUIZZARDI; FALBO; GUIZZARDI, 2008, p. 246).
Percebe-se que a modelagem de eventos é uma tarefa difícil e desafiadora, uma vez
que envolve relações entre outros eventos e interpretações do mesmo evento por diferentes
seres humanos (profissionais preocupados com a representação e organização do
conhecimento).
65
Tanto a DOLCE, com a DUL, quanto a UFO, com a UFO-B, dedicam-se ao
desenvolvimento de partes da ontologia exclusivas a eventos.
Tanto na UFO-B, quanto na DUL, o agente ou participante parecem relacionados ao
objeto. No entanto, na UFO-B, o “Participante concreto” (termo utilizado por Guizzardi)
também se relaciona direto com o evento. Já na Dul, o “Agent” é uma subclasse de “Object” e
não se relaciona diretamente com o evento. No caso do acidente do trabalho, o “participante
concreto” ou “agent”, que, especificamente neste trabalho é “paciente”, pois é ele quem sofre
o acidente, sendo parte fundamental do evento.
De forma análoga, pode se afirmar que muitas semelhanças existem nessas
representações acerca de eventos. Categorias como agentes, local e tempo são exemplos de
similaridades.
Scherp et al. (2009, p. 3-4) utilizam como base a ontologia DUL, para elaborarem uma
ontologia chamada Event-Model-F, que visa apresentar um modelo formal de eventos. Para a
elaboração da Event-Model-F, esses autores identificaram, previamente, requisitos funcionais
presentes em qualquer evento independente do domínio. Desta forma, eles sintetizaram estes
requisitos funcionais em seis aspectos:
Participação em eventos de objetos: representa participação de agentes, ou seja,
objetos vivos e não-vivos, como pessoas, animais e outros objetos materiais em
eventos e os papéis que desempenham em eventos.
Duração temporal de eventos: Como os eventos se desenrolam ao longo do
tempo, a sua duração temporal precisa de ser modelada. Isto pode ser realizado
usando representações absolutas ou relativas dos pontos em determinado tempo.
Extensão espacial dos objetos: Objetos se desenrolam ao longo do espaço.
Assim,
sua
extensão
espacial
precisa
ser
também
modelada
usando
posicionamento absoluto ou relativo.
Relações estruturais entre eventos: são considerados três tipos, a saber:
o Relação mereológica deve ser apoiada em como os eventos são
constituídos (eventos simples ou compostos).
o Relação causal requer a modelagem de causas e efeitos e deve apoiar a
integração e uso de diferentes teorias causais.
o Relação de correlação refere-se a dois eventos que têm uma causa
comum.
66
Documentos de apoio para o evento e objetos: esta exigência compreende a
anotação de eventos e seus objetos participantes com informações arbitrárias, tais
como dados de sensores e dados de mídia. Ele fornece suporte documental que um
determinado evento aconteceu ou objeto existe.
Interpretações de eventos: relações entre eventos, tais como causalidade e
correlação pode ser questão de subjetividade e interpretação. O modelo de evento
deve apoiar tais interpretações diferentes do evento, isto é, oferecer diferentes
pontos de vista contextuais para as mesmas ocorrências no mundo real.
Assim como Scherp et al (2009), após analisar diversas ontologias que envolviam a
representação de eventos, Higuchi (2012, p. 108) notou que aspectos pareciam ser inerentes a
todo evento. A saber:
Aspecto constitutivo – o quê ou quem participa;
Aspecto temporal – data, período, duração;
Aspecto espacial – área geográfica, região, lugar relativo, localização;
Aspecto estrutural – mereologia, causalidade, correlação; e
Aspecto evidencial – documentação produzida.
Apesar das semelhanças estruturais entre as ontologias, “não existe uma ontologia
genericamente aceita para modelagem. Conceitos e relações em ontologias distintas podem
levar a resultados diferentes na avaliação de um mesmo modelo conceitual.” (ALMEIDA;
OLIVERRA; COELHO, 2010, p. 44).
A UFO-B e DUL usam modelos de classes, que é um dos diagramas que constam da
metodologia Unified Modeling Language (UML), para elaboração de sua representação. Na
modelagem conceitual aqui proposta, será utilizado o Modelo Entidade-Relacionamento
convencional, que é um modelo de diagrama de classes tradicional no campo da Ciência da
Computação. Espera-se, a partir dele, chegar à elaboração de um RDF capaz de descrever os
dados sobre acidente do trabalho.
Acidente do trabalho como evento
De acordo com o dicionário elaborado pelo Instituto Antônio Houaiss (2009), acidente
é “(1) acontecimento casual, fortuito, inesperado; ocorrência; (2) qualquer acontecimento,
67
desagradável ou infeliz, que envolva dano, perda, sofrimento ou morte”. Com base nestas
definições, pode-se afirmar que qualquer acidente é um evento, ou seja, fato, ação, processo,
que em geral, acomete algum agente e/ou paciente, em determinado espaço e tempo.
Todos os acidentes do trabalho acontecem em datas e espaços delimitados, mas sua
principal característica é a participação do trabalhador como personagem/ator/indivíduo que
sofre determinado mal. Logo, partindo-se do pensamento que “eventos são entidades
ontologicamente dependentes no sentido de, para existirem, dependem existencialmente de
seus participantes” (GUIZZARDI; FALBO; GUIZZARDI, 2008, p. 246), pode-se afirmar que
acidente do trabalho é um evento.
No âmbito das ontologias, muitos estudiosos preferem organizar, separando os objetos
estáticos dos eventos. Isto ocorre muito em função das características peculiares existentes
tanto nos objetos estáticos, quanto nos eventos. Eventos são entidades classificadas em uma
ontologia formal, que são difíceis de tratar em sistemas de base de dados. Para descrever as
ocorrências de ações e mudanças no mundo real, modeladores de representação de
conhecimento têm que considerar que os objetos e as propriedades são estáticos, mas os
eventos são dinâmicos (KANEIWA; IWAZUME; FUKUDA, 20, p. 1).
Assim sendo, estudar acidente do trabalho a partir de ontologias de fundamentação,
que buscam representar eventos, pode ser a chave para se conseguir identificar características
comuns a qualquer evento, que contribuiriam para a elaboração de um modelo acerca do
acidente do trabalho.
4.2.5 OWL como linguagem para representar ontologias para Web Semântica
De forma resumida, a Web Ontology Language (OWL) é uma ontologia recomendada
pela W3C para representar explicitamente o significado dos termos e seus relacionamentos
em vocabulários a serem utilizados na Web. A OWL destina-se a ser usada quando a
informação contida nos documentos necessita de ser processada por aplicações de máquinas e
não somente compreensíveis por seres humanos.
No guia sobre OWL escrito por Smith, Welty, e McGuinness (2004), a OWL é
definida como uma linguagem para definir e instanciar ontologias da Web. Uma ontologia
OWL pode incluir descrições de classes, propriedades e suas instâncias. Dada tal ontologia, a
semântica formal OWL especifica como derivar suas consequências lógicas, ou seja, fatos que
não estão presentes na ontologia, mas que são vinculados pela semântica. Esses vínculos
68
podem ser baseados em um único documento ou vários documentos distribuídos que foram
combinados usando os mecanismos definidos pela OWL.
A OWL é uma revisão da DAML+OIL Web Ontology Language incorporando lições
aprendidas de design e aplicação da DAML + OIL. (MCGUINNESS; HARMELEN, 2004). A
OWL tem mais facilidades para expressar significado, pois tem mais construções que
incorporam pressupostos semântico-ontológicos que RDF e RDFS. Ou seja, consegue
especificar com mais precisão o significado pretendido.
Apesar do RDF Schema também ser considerado um vocabulário capaz de fornecer
semântica aos dados, ele apresenta algumas diferenças da linguagem OWL. De acordo com
McGuinness e Harmelen (2004) o RDF Schema é um vocabulário para descrever
propriedades e classes de recursos RDF, com uma semântica de generalização, ou seja,
hierarquias de tais propriedades e classes. Enquanto que, a OWL adiciona mais vocabulário
para descrever propriedades e classes. Dentre algumas diferenças, podem ser citadas: relações
entre classes, cardinalidade, descrição mais rica de propriedades, características das
propriedades e classes enumeradas.
Logo, a OWL atende melhor os anseios da Web Semântica, que é aprimorar a Web, de
tal forma que seja dado um significado explícito à informação, tornando mais fácil para
máquinas processar e integrar, automaticamente, informações disponíveis na Web.
(MCGUINNESS; HARMELEN, 2004).
Pode-se dizer que a Web Semântica tem a necessidade de um grupo de instrumentos e
linguagens de descrição e de organização (estrutural e semântica) dos dados. Ela se apóia na
capacidade da XML para definir esquemas de marcação personalizados, na descrição do RDF
para representar dados com um primeiro nível de semântica. Entretanto, a Web Semântica
necessita de um nível maior de semântica dos dados descritos, por esta razão uma linguagem
de ontologia se torna indispensável para descrever formalmente o significado da terminologia
utilizada em documentos da Web. Neste argumento que a W3C se sustenta para justificar a
utilização da OWL. (MCGUINNESS; HARMELEN, 2004).
De acordo com a McGuinness e Harmelen (2004) a OWL fornece três sublinguagens,
em escala de expressividade, projetadas para uso por comunidades específicas de
implementadores e usuários.
OWL Lite auxilia aos usuários que necessitam principalmente de uma hierarquia de
classificação e restrições simples. Apresenta valores de cardinalidade de 0 ou 1.
Oferece um caminho de migração rápida para tesauros e outras taxonomias.
69
OWL DL ajuda aos usuários que querem a expressividade máxima, mantendo a
integralidade (todas as conclusões são garantidas serem computáveis) e decidibilidade
(todas as computações terminarão em um tempo finito) computacional. Ela é o
somatório de todas as construções da linguagem OWL, mas estas construções somente
podem ser sob certas restrições. OWL DL é assim chamado devido à sua
correspondência com as lógicas de descrição, um campo de pesquisa que estuda as
lógicas que formam a base formal da OWL.
OWL Full é destinada a usuários que desejam máxima expressividade e a liberdade
sintática do RDF sem garantias computacionais. Permite uma ontologia para aumentar
o significado do vocabulário pré-definido (RDF ou OWL).
Cabe aos usuários que utilizarão a OWL considerar qual o tipo de sublinguagem da
OWL se adapta melhor às suas necessidades em determinado momento. McGuinness e
Harmelen (2004) esclarecem, por exemplo, que a escolha entre OWL Lite e OWL DL
depende da medida em que os usuários precisam de construções mais expressivas, neste caso
fornecidas pela OWL DL.
Alguns cuidados devem ser tomados quando um usuário deseja migrar um documento
RDF para OWL. Quando a expressividade da OWL DL ou OWL Lite for considerada
apropriada, algumas precauções devem ser tomadas para garantir que o documento original
RDF está em conformidade com as restrições adicionais impostas por OWL DL e OWL Lite.
Entre outros, cada URI que é usado como um nome de classe deve ser explicitamente
declarado como sendo do tipo owl: Class (e da mesma forma para as propriedades), cada
indivíduo deve ser afirmado pertencer a pelo menos uma classe (mesmo que apenas owl:
Thing), o URI é usado para classes, propriedades e indivíduos devem ser separados
mutuamente. (MCGUINNESS; HARMELEN, 2004).
Por ser capaz de organizar, semanticamente, informações na Web, a linguagem OWL
pode ser utilizada por ferramentas automatizadas da Web para aperfeiçoar os serviços de
recuperação de informações, além de contribuir para o gerenciamento do conhecimento.
Ademais, a OWL reduz esforços na elaboração de novas linguagens, pois permite
reuso de outras ontologias já desenvolvidas. Desta forma, a OWL consegue uma unificação do
conhecimento e a formação de consensos sobre certos conceitos, que “tem levado à uma
integração maior de usuários dentro domínios específicos do conhecimento”. (LIMA;
CARVALHO, 2005, p. 21).
70
Diante da recomendação da W3C para seu uso nas tecnologias geradas no contexto da
Web Semântica, a OWL tem conseguido um papel de destaque na elaboração de linguagens
semânticas para a Web, com vista a otimizar a recuperação das informações.
4.2.6 Dados Abertos Interligados
O conceito e a aplicação de Linked Open Data (LOD) ou Dados Abertos Interligados
tem despertado interesse em organizações de pesquisa em saúde, governo e educação.
(MÉNDEZ, GREENBERG, 2012).
No final da década de 80, Berners-Lee (1989) já se preocupava com a interligação dos
dados, afirmando que se deveria trabalhar em direção a um sistema universal de informação
ligada, no qual generalidade e portabilidade sejam mais importantes que técnicas gráficas
extravagantes e instalações super complexas.
Entretanto, o termo “Dados Abertos Interligados” só foi cunhado no século XXI, por
Berners-Lee (2006) e se refere a um estilo para se publicar e interligar dados estruturados na
Web. Ideia essa defendida por Berners-Lee (2006) ao afirmar que com os Dados Abertos
Interligados o valor e a utilidade dos dados aumentarão, uma vez que estarão ligados a outros
dados provenientes de diferentes fontes.
A Web Semântica permite que as máquinas extraiam significados de dados
estruturados, que podem ser transformados quando publicados utilizando os Dados Abertos
Interligados. Este último é um passo fundamental para a implementação da Web Semântica.
(MÉNDEZ; GREENBERG, 2012).
Bizer, Cyganiak e Heath (2007) apontam como sendo os princípios básicos dos Dados
Abertos Interligados: (1) utilizar o modelo de dados RDF para publicar dados estruturados na
Web; (2) utilizar links RDF para interligar dados a partir de fontes de dados diferentes.
Aplicando esses princípios é possível se chegar à criação de um espaço comum de dados na
Web, um espaço onde as pessoas e as organizações podem publicar e consumir dados de
acordo com seus interesses.
Se na Web Sintática o que une os documentos são os links de hipertexto entre as
páginas HTML, na Web Semântica o que une os dados são as ligações em RDF. Uma ligação
utilizando o RDF afirma que uma parte do dado tem algum tipo de relação com uma parte de
outro dado. Essas relações podem ser de diferentes tipos. Por exemplo, uma ligação RDF que
conecte dados sobre um autor e suas obras que estão dispersas em bibliotecas, arquivos e
museus. (SANTOS NETO et al., 2013).
71
A Web Semântica é mais que somente disponibilizar dados na Web, é sobre fazer
ligações (links), para que pessoas e máquinas possam explorar esse conjunto de dados. Com
os Dados Abertos Interligados, quando se tem essas ligações, pode-se encontrar outros dados
relacionados. (Berners-Lee, 2006). Neste contexto, os Dados Abertos Interligados, podem ser
utilizados para descreverem um conjunto de práticas para publicar, compartilhar e conectar
dados estruturados na Web de forma a aumentar o seu valor e uso. (ARAÚJO, SOUZA, 2011;
BIZER; HEATH; BERNERS-LEE, 2009)
Nesse processo de se realizar interligações semânticas entre os dados, os vocabulários
em suas várias formas (tesauro, taxonomia, ontologia e outros) têm papel de destaque,
fornecendo sentido aos dados. Esses vocabulários podem ainda ter seu aproveitamento
melhorado e ganhar mais força se aplicados em RDF/SKOS. (MÉNDEZ, GREENBERG,
2012) e o formato básico para Dados Abertos Interligados é RDF/XML (Berners-Lee, 2006).
Na figura 13 é mostrada a evolução da Web com a utilização dos Dados Abertos Interligados.
FIGURA 13 - Evolução da Web Semântica com os Dados Abertos Interligados.
Fonte: MÉNDEZ, GREENBERG, 2012.
Quando os dados disponíveis na Web são vinculados é possível, a partir de um
determinado dado, encontrar outro. Diferentemente da Web de hipertextos com referências a
documentos escritos em HTML tem-se referência a documentos escritos em RDF. Em um
artigo sobre Dados Abertos Interligados escrito por Tim Berners-Lee, em 2006, ele propôs um
ranking que serve de guia para classificar dados que estão publicados na Web:
72
Figura 14 - Classificação de dados publicados.
Dado publicado, em qualquer formato, com licenciamento livre
Dado publicado em uma estrutura que permita a leitura por máquinas (por
exemplo, uma planilha eletrônica ao invés de uma imagem digitalizada)
Igual ao item anterior (duas estrelas) adicionado o formato não proprietário (por
exemplo, CSV ao invés de Excel)
Todos os acima, porém usando os padrões W3C (RDF e SPARQL)
Todos os acima adicionando a vinculação de seus dados aos dados de outras fontes
para identificação de contexto (linked data).
Fonte: Leocádio (2011, p. 56)
Na figura 15, pode se compreender melhor como a classificação em cinco estrelas feita
por Berners-Lee é associada às tecnologias.
FIGURA 15 - Esquema para classificar bases de dados publicados na WEB.
Fonte: 5 Stars Open Data20.
Na revisão de seu texto em 2010, Berners-Lee (2006) comenta que foi solicitado a
utilizar os Dados Abertos Interligados para dados governamentais, devendo existir metadados
sobre os dados publicados pelo Governo e disponibilizados em grandes catálogos. De acordo
com Berners-Lee (2006) qualquer conjunto de Dados Abertos (ou mesmo conjunto de dados
que não são, mas que deveriam ser abertos) podem ser registrados no ckan.net21. Esse autor
afirma que os conjuntos de dados do governo do Reino Unido e dos EUA são registrados,
respectivamente, no data.gov.uk e data.gov. E que outros países devem seguir o mesmo
caminho.
No Brasil, existe uma iniciativa da Secretaria de Logística em tecnologia de
Informação (SLTI) do Ministério do Planejamento, que se propõe a integrar, utilizando a
20
Legenda: OL: Open Licence (livre de licenças); RE: machine-REadable (tratável por computador); OF: Open
Format (formato não proprietário); URI: identificado por URI; LD: Linked Data (dados interligados).
Disponível em: http://5stardata.info/. Acesso em: 4 mar. 2014.
21
CKAN é uma ferramenta (software) para sistema de gerenciamento de conteúdo que torna os dados acessíveis,
visando simplificar a publicação, o compartilhamento, a recuperação e o uso de dados. CKAN é destinado a
editores de dados (governos, empresas e organizações nacionais e regionais) que querem fazer os seus dados
abertos e disponíveis. (CKAN, 2011)
73
infraestrutura dos Dados Abertos Interligados, as bases de dados do Governo Federal. A
figura 16 mostra a iniciativa modelada.
FIGURA 16 - Estrutura de LOD das bases de dados do Governo Brasileiro.
Fonte: Chaves (2011)
Conseguindo desenvolver uma estrutura de dados interligados, o Governo brasileiro
poderá ampliar sua participação na estrutura de dados mundiais (figura 17). Desta forma,
possibilitará conexões entre dados e informações em escala internacional, permitindo
reutilizações, correlações e aplicações ainda não vislumbradas pelos gestores dos dados.
FIGURA 17 – Diagrama da nuvem de LOD
Fonte: Cyganiak; Anja Jentzsch (2011)
Apesar do ritmo lento do uso dos Dados Abertos Interligados na publicação de dados
governamentais abertos, é possível identificar alguns exemplos de uso. Como, por exemplo, a
página “Ligado nos Políticos” (figura 18), que tem como objetivo fornecer dados de políticos
brasileiros usando os conceitos de Dados Ligados e Dados Governamentais Abertos.
74
Coletando dados públicos de fontes, como: órgãos públicos (Tribunal Superior Eleitoral
(TSE), Câmara dos Deputados e Senado Federal do Brasil) e Organizações Não
Governamentais (ONGs) e iniciativas populares (Políticos Brasileiros, Ficha Limpa e
Excelências).
FIGURA 18 - Página eletrônica do Ligado nos Políticos.
Fonte: LIGADO... (2010)
4.3 ASPECTOS LEGAIS SOBRE ACESSO À INFORMAÇÃO PÚBICA
Existem Leis brasileiras que garantem o acesso à informação pública. Nesta pesquisa,
parte-se do pressuposto que o acesso às informações governamentais é “uma prerrogativa de
todo cidadão, e as possibilidades de reutilizá-la, recombiná-la e dar a ela novos significados é
uma ampliação necessária deste direito”. (MAZONI, 2011, p. 7)
A seguir serão elencados aspectos legais que influenciaram para a abertura dos dados
públicos.
A carta magna do Brasil, a Constituição da República federativa do Brasil, publicada
em 1988, previa o acesso às informações. Segundo o inciso XXXIII do artigo 5 da
Constituição Federal do Brasil de 1998:
XXXIII - todos têm direito a receber dos órgãos públicos informações
de seu interesse particular, ou de interesse coletivo ou geral, que serão
prestados no prazo da lei, sob pena de responsabilidade, ressalvas aquelas
cujo sigilo seja imprescindível à segurança da sociedade e do Estado.
(BRASIL, 1988)
75
A Lei Complementar n. 101, conhecida como Lei de responsabilidade Fiscal,
sancionada em 4 de maio de 2000, estabelece normas de finanças públicas voltadas para a
responsabilidade na gestão fiscal e dá outras providências que envolvem a accountability e a
transparência de informações fiscal públicas. Foi acrescentada pela Lei Complementar n. 131,
de 27 de maio de 2009, E no capítulo IX, intitulado como “Da Transparência, Controle e
Fiscalização”, são apresentadas obrigações que possibilitam à sociedade controlar as ações do
Governo.
Art. 48. São instrumentos de transparência da gestão fiscal, aos quais
será dada ampla divulgação, inclusive em meios eletrônicos de acesso
público: os planos, orçamentos e leis de diretrizes orçamentárias; as
prestações de contas e o respectivo parecer prévio; o Relatório Resumido da
Execução Orçamentária e o Relatório de Gestão Fiscal; e as versões
simplificadas desses documentos. [...]
Parágrafo único. A transparência será assegurada também mediante:
[...]
II – liberação ao pleno conhecimento e acompanhamento da
sociedade, em tempo real, de informações pormenorizadas sobre a execução
orçamentária e financeira, em meios eletrônicos de acesso público; [...]
(BRASIL, 2009a)
Considerado por Batista et al. (2011, p. 1) e Ribeiro e Almeida (2011, p. 2568) o
marco brasileiro para o início da iniciativa de dados governamentais abertos foi a publicação
do Decreto n. 6.932, de 11 de agosto de 2009, que “dispõe sobre a simplificação do
atendimento público prestado ao cidadão, ratifica a dispensa do reconhecimento de firma em
documentos produzidos no Brasil, institui a “Carta de Serviços ao Cidadão” e dá outras
providências”. Menciona também a questão do uso de tecnologias para simplificar o
atendimento ao cidadão, além de criar condições propícias ao compartilhamento de
informações.
Art. 1o Os órgãos e entidades do Poder Executivo Federal observarão
as seguintes diretrizes nas relações entre si e com o cidadão: [...]
II - compartilhamento de informações, nos termos da lei; [...]
VI - aplicação de soluções tecnológicas que visem a simplificar
processos e procedimentos de atendimento ao cidadão e a propiciar melhores
condições para o compartilhamento das informações; [...]
Art. 4o No âmbito da administração pública federal, os órgãos e
entidades gestores de base de dados oficial colocarão à disposição dos
órgãos e entidades públicos interessados as orientações para acesso às
76
informações constantes dessas bases de dados, observadas as disposições
legais aplicáveis e as diretrizes, orientações e procedimentos estabelecidos
pelo Comitê Executivo do Governo Eletrônico, criado pelo Decreto de 18 de
outubro de 2000. [...] (BRASIL, 2009b)
A Lei de n. 12.527, denominada Lei de Acesso a Informação (LAI), sancionada em
novembro de 2011. Entretanto, como lembra Jardim (2012), a Lei “entrou em vigor no dia 16
de maio de 2012, quando foi regulamentada pelo Poder Executivo Federal. Desde então tem
sido objeto de regulamentação em outros Poderes da União, bem como nos estados e
municípios”.
Cabe destacar parte do capítulo 8 da Lei de Acesso à Informação, pois trata do dever
de promover acesso à informação, inclusive em meio digital e disponibilizando serviços ma
Internet:
Art. 8o É dever dos órgãos e entidades públicas promover,
independentemente de requerimentos, a divulgação em local de fácil acesso,
no âmbito de suas competências, de informações de interesse coletivo ou
geral por eles produzidas ou custodiadas. [...]
§ 2o Para cumprimento do disposto no caput, os órgãos e entidades
públicas deverão utilizar todos os meios e instrumentos legítimos de que
dispuserem, sendo obrigatória a divulgação em sítios oficiais da rede
mundial de computadores (internet).
§ 3o Os sítios de que trata o § 2o deverão, na forma de regulamento,
atender, entre outros, aos seguintes requisitos:
I - conter ferramenta de pesquisa de conteúdo que permita o acesso à
informação de forma objetiva, transparente, clara e em linguagem de fácil
compreensão;
II - possibilitar a gravação de relatórios em diversos formatos
eletrônicos, inclusive abertos e não proprietários, tais como planilhas e texto,
de modo a facilitar a análise das informações;
III - possibilitar o acesso automatizado por sistemas externos em
formatos abertos, estruturados e legíveis por máquina;
IV - divulgar em detalhes os formatos utilizados para estruturação da
informação;
V - garantir a autenticidade e a integridade das informações
disponíveis para acesso;
VI - manter atualizadas as informações disponíveis para acesso;
VII - indicar local e instruções que permitam ao interessado
comunicar-se, por via eletrônica ou telefônica, com o órgão ou entidade
detentora do sítio; [...] (BRASIL, 2011a)
Um ponto importante trazido a tona por essa Lei foi a diferenciação entre
Transparência Ativa, referente à “divulgação espontânea, proativa, de informações, pelo
Estado, pelos meios disponíveis” (VIEIRA, 2012 apud JARDIM, 2012, p. 19), e
77
Transparência Passiva, que é o “sistema para receber uma informação ou solicitação de
informação e providenciar uma resposta” (BATIMARCHI, 2013, p. 3). Entretanto, a
aplicação desses conceitos ainda enfrenta desafios para sua consolidação.
Jardim (2012) enfatiza que diante da complexidade existente no Brasil é possível
estimar os obstáculos à implantação da Lei de Acesso à Informação em todos os Poderes
Executivo, Legislativo e Judiciário. Pois para este autor, a questão dessa Lei vai além do
âmbito jurídico, tratando-se de um processo associado “a uma cultura política que vem sendo
dinamizada, nas últimas décadas, em meio às contradições que envolvem tradições
autoritárias e uma agenda democratizante nas relações Estado e Sociedade”. (JARDIM, 2012,
p. 19).
Angélico (2012, p. 14) ao analisar a Lei de Acesso à Informação aponta outro desafio
a ser enfrentado pelo Governo com a liberação de suas informações. Segundo o autor a
utilização das informações governamentais pelo setor privado, que buscam nestas
informações vantagens competitivas no mercado, sem disponibilizarem seus resultados e
conclusões para um grupo mais amplo da sociedade. Isso poderia aumentar ainda mais a
desigualdade no acesso e tratamento das informações governamentais.
Em 15 de setembro de 2011, foi instituído o Plano de Ação Nacional sobre Governo
aberto. O artigo 1 diz que este Plano é destinado a promover ações e medidas que visem ao
incremento da transparência e do acesso à informação pública, à melhoria na prestação de
serviços públicos e ao fortalecimento da integridade pública. Para que seu objetivo seja
alcançado ele estabelece critérios:
I - aumento da disponibilidade de informações acerca de atividades
governamentais, incluindo dados sobre gastos e desempenho das ações e
programas;
II - fomento à participação social nos processos decisórios;
III - estímulo ao uso de novas tecnologias na gestão e prestação de
serviços públicos, que devem fomentar a inovação, fortalecer a governança
pública e aumentar a transparência e a participação social; e
IV - incremento dos processos de transparência e de acesso a
informações públicas, e da utilização de tecnologias que apoiem esses
processos. (BRASIL, 2011b)
Pode-se concluir que o acesso à informação está presente nas discussões do Estado.
Associar a legislação, que oficializa o direito do cidadão de acesso à informação, à publicação
de dados governamentais abertos, aplicação de obrigações legislativas, podem contribuir para
que no futuro se crie uma democracia participativa, na qual a população se sinta parte da
nação, interagindo com o Estado em suas decisões.
78
4.4 UM OLHAR SOBRE O GOVERNO ELETRÔNICO
A utilização das tecnologias de informação e comunicação (TIC) pelo Estado no
provendo de produtos e serviços aos cidadãos geraram profundas mudanças na relação entre o
Estado e a população (FREY, 2007; 2000) e a formação de uma rede composta por atores
sociais (CASTELLS, 1999), que “envolvidos na gestão da coisa pública”. (FREY, 2007).
Segundo Garcia et al. (2003), “esta nova arquitetura dos espaços governamentais,
descentralizada e flexível, possibilita a elaboração de redes horizontais entre os atores,
permitindo que o e-gov se contraponha à cultura do governo centralizador e opressor”.
Os Estados Unidos é um dos países pioneiros na área de governo eletrônico. De
acordo com Matheus (2009, p. 3), em 1993, o presidente Bill Clinton promoveu uma
reformada administração pública. Esse programa teve o nome de National Performance
Review (NPR) e foi inspirado na obra de Osborne e Gaebler22. Os resultados com esse
programa superaram as expectativas do Governo americano, conseguindo alcançar grande
parte de seus objetivos.
Gontijo (2002, p. 183) e Ribeiro (2011, p. 164) apontam como iniciativas precursoras
de implantação do governo eletrônico no Brasil, o Programa Sociedade da Informação, com o
objetivo de “viabilizar a nova geração da Internet e suas aplicações em benefício da sociedade
brasileira” (BRASIL, 1999), o Programa Brasil Transparente, que visa “a promoção da
transparência e do acesso à informação” (CONTROLADORIA-GERAL DA UNIÃO, 2013a)
e o projeto do governo [email protected], o qual almejava a universalização do acesso à Internet,
dos serviços e das normas e padrões para prestação de serviços. (CHAHIN, 2004, p. 35).
Prado et al. (2011) estabelece uma evolução do governo eletrônico no Brasil diferente
da apresentada anteriormente. Apoiado em outros estudos, ele traça classificações diferentes:
a primeira classificação é dividida em três estágios: o primeiro (1970-1992) focou a gestão
interna, o segundo (1993-1998) teve como objetivo a prestação de serviços e informações ao
cidadão, e o terceiro (a partir de 1999) focou a prestação de serviços via Internet. (DINIZ,
2005 apud PRADO et al., 2011, p. 8). Já a segunda classificação divide a evolução do
governo eletrônico em quatro estágios: início (1950-1960), centralização (1960-1980),
terceirização (1980-1990) e governo eletrônico, propriamente dito, a partir de 1990.
(REINHARD; DIAS, 2005 apud PRADO et al., 2011, p. 8).
22
Para maiores informações consultar: OSBORNE, D.; GAEBLER, T. Reinventando o governo: como o
espírito empreendedor esta transformando o setor público. 7. ed. Brasília, DF: MH Comunicação, 1995.
79
O Observatório do Governo Eletrônico fornece como marco inicial do governo
eletrônico no Brasil a instituição do Sistema de Administração dos Recursos de Informação e
Informática (SISP) do Governo Federal, em 21 de janeiro de 1994. Com o objetivo de orientar
e administrar o processo de planejamento coordenação e normalização relativa aos recursos
de informação e informática da Administração Pública Federal. (GOVERNO..., 2007). Logo
no ano seguinte, maio de 1999, foi elaborado o projeto do Portal Rede Governo, apesar das
agências governamentais já possuírem páginas eletrônicas desde 1993. O Portal só entrou em
operação em 2000, sob a responsabilidade da Câmara Técnica da Rede Governo. Com a
criação do e-gov em outubro de 2000, a responsabilidade administrativa e operacionais foram
transferidas para a secretaria-executiva do Comitê Executivo do Governo Eletrônico (CEGE).
(CHAHIN et al., 2004, p. 34; SIMÃO; RODRIGUES, 2005, p. 81).
De acordo com Marcondes e Jardim (2003), Pacheco, Kern e Steil (2007) e Santos
(2012), e o governo eletrônico representa um construto, cuja definição unívoca não existe. A
seguir são apresentadas algumas definições de governo eletrônico:
O termo governo eletrônico tem foco no uso das novas tecnologias de
informação e comunicação [TIC] aplicadas a um amplo arco das funções de
governo e, em especial, deste para com a sociedade. (RUEDIGER, 2002, p.
1, sic.)
Podemos chamar de governo eletrônico o conjunto de serviços e acesso a
informações que o governo oferece aos diferentes atores da sociedade civil
por meios eletrônicos. (FERRER, 2003, p. 1)
Governo Eletrônico ou Administração Pública Eletrônica nada mais é do que
o uso das Tecnologias da Informação e Comunicações (TIC) por parte da
Administração Pública tanto em seu funcionamento externo quanto na troca
e prestação de informações e serviços com empresas, outros governos e a
população. Trata-se, em suma, de informatizar a Administração Pública”
(GOVERNO..., 2007, p. 1).
Governo Eletrônico tem como princípio a utilização das modernas
tecnologias de informação e comunicação (TICs) para democratizar o acesso
à informação, ampliar discussões e dinamizar a prestação de serviços
públicos com foco na eficiência e efetividade das funções governamentais.
(BRASIL, 2013c, p. 1).
Se no passado, o conceito de governo eletrônico era associado à modernização da
infraestrutura tecnológica dos órgãos do Estado. Percebe-se que agora os conceitos de
cidadania e democratização da informação pública aparecem com recorrência nas definições
de governo eletrônico apresentadas anteriormente.
80
Chahin et al. (2004, p. 12) afirma que a implantação do governo eletrônico visa uma
reforma administrativa, com o objetivo de contribuir para
Melhoria da qualidade e inovação nos serviços prestados ao cidadão;
Transparência e acesso à informação pela sociedade;
Reestruturação organizacional, com o realinhamento de estruturas e processos;
Ampliação da autonomia das instituições e dos gerentes, acompanhada da
flexibilidade de procedimentos e de normas, aplicada à gestão;
Planejamento, avaliação e controle da ação governamental, com base nos
resultados esperados, na elaboração de indicadores de desempenho e na
identificação da clientela-alvo;
Fortalecimento da capacidade de formulação e controle sobre as políticas públicas;
Redução de custos;
Qualificação e mudança de perfil do servidor público.
Para Jardim (2000, p. 4) o governo eletrônico pode ampliar a efetividade dos governos
em quatro aspectos, a saber:
Será mais fácil para a sociedade ter suas perspectivas consideradas pelos governos
na (re)definição de políticas públicas;
A sociedade poderá obter melhores serviços das organizações governamentais, por
exemplo, através de atividades desenvolvidas on-line;
A sociedade contará com serviços mais integrados porque as diferentes
organizações serão capazes de se comunicar mais efetivamente entre si;
A sociedade será melhor informada porque poderá obter informação atualizada e
compreensível sobre o governo, leis, regulamentos, políticas e serviços.
Da implantação até hoje, muitas pesquisas sobre governo eletrônico contribuíram para
o desenvolvimento de metodologias, técnicas e equipamentos necessários para a
modernização da administração pública e a melhoria da eficiência dos processos operacionais
e administrativos, associados a prestação de serviços públicos eletrônicos.
O Relatório do Desenvolvimento Humano (2013) com o tema: “A ascensão do Sul:
progresso humano num mundo diversificado” debruça-se sobre a evolução da geopolítica dos
tempos atuais, analisando as questões e tendências emergentes, bem como os novos atores que
moldam o panorama do desenvolvimento. De acordo com esse relatório, o governo eletrônico
possui papel fundamental no desenvolvimento das nações, pois “legitimidade da governação
internacional, no futuro, dependerá da capacidade das instituições para interagir com as redes
e comunidades de cidadãos”. (NAÇÕES UNIDAS, 2013, p. 13, sic)
Diante dos resultados observados, pode-se dizer que os recursos do governo eletrônico
conseguiram, ao longo dos anos, permitir que cidadãos acessassem informações e serviços
oferecidos pelo Governo. Buscando ampliar a abertura de dados e a promoção da
81
transparência aos cidadãos, permitindo ainda melhorar as operações internas e entre governos.
(W3C, 2009).
O desenvolvimento da tecnologia e, consequentemente, da Web ofereceu ao Governo
melhores oportunidades de atingir suas metas no fornecimento de informações e serviços e ao
mesmo tempo atender às demandas por cada vez mais contribuições e interações. (W3C,
2009, p. 13).
Pacheco (2003 apud PACHECO; KERN, 2003) ao estudar os projetos de Governo
Eletrônico como fonte de informações para sistemas de informação governamental,
apresentam uma representação piramidal (19) referente à uma plataforma tecnológica para a
gestão da informação para Ciência, Tecnologia e Inovação.
FIGURA 19 - Arquitetura para plataforma tecnológica de governo eletrônico.
Fonte: Pacheco (2003 apud PACHECO, KERN, 2003)
Esses autores explicam que:
Unidades de informação, base da pirâmide: são as classes, tipos ou sub-domínios
fundamentais da informação pertinente ao domínio da plataforma.
Fontes e sistemas de informação, segunda camada: inclui os repositórios de cada
unidade de informação e os respectivos sistemas de informação para captura,
tratamento e armazenagem.
Portais e serviços web, terceira camada: constitui-se dos instrumentos de
apresentação de informações na web. Assenta-se sobre os sistemas de informações
e as unidades de informação definidas nas camadas inferiores.
Sistemas de conhecimento, topo da pirâmide: são instrumentos projetados para
gerar novos conhecimentos a partir das unidades de informação, sistemas de
informação e portais Web. Incluem técnicas de descoberta de conhecimento como
mineração de dados, estatística e reconhecimento de padrões. (PACHECO, 2003
apud PACHECO; KERN, 2003, p. 4)
82
Todavia, existem desafios que os Governos, e especificamente o Brasil, precisam
superar para que todas as potencialidades do governo eletrônico sejam alcançadas.
De acordo com o relatório United Nations E-Government Survey 2012 (UNITED
NATIONS, 2012), que apresenta uma avaliação da situação mundial do setor de governo
eletrônico, o Brasil ocupa a posição de número 59, melhorando sua colocação em relação a
2010, no qual ocupava a colocação de número 61. Sua melhora se deve, dentre outros fatores,
a maior participação dos cidadãos em discussões políticas, como na época do Rio + 20, em
que foram disponibilizados questionários eletrônicos para a interação da população. Porém, a
falta de ampliação de serviços eletrônicos e a deficiência de infraestrutura de
telecomunicações, que compromete o atendimento a parte da população, contribuiu para que o
Brasil não tivesse um resultado melhor na avaliação das Nações Unidas.
O relatório (UNITED NATIONS, 2012) destaca também a iniciativas de dados abertos
que contribuem para a cooperação entre Estado e sociedade civil na elaboração de novos
produtos e serviços. Assim, ele faz algumas recomendações para o governo eletrônico
envolvendo a iniciativa dos dados governamentais abertos:
1. Certificar que as estratégias para a publicação de dados governamentais
abertos estão alinhadas com outras políticas relevantes, especialmente,
com a atual estratégia de governo eletrônico e estratégias para o
desenvolvimento nacional;
2. Reconhecer que as iniciativas de dados governamentais abertos são
processos que requerem compromisso contínuo e participação de
diversos colaboradores;
3. Considerar uma abordagem de parceria entre o Governo às iniciativas de
dados governamentais abertos, ou seja: a) fortalecimento da
comunicação, coordenação e cooperação dentro de diferentes setores e
níveis de governo e, b) a centralização do ponto de prestação de serviços
de entrada para um único portal onde os cidadãos e outros atores sociais
possam acessar todas as informações e serviços oferecidos pelo
Governo, independentemente, de qual autoridade do Governo lhes
fornece. (UNITED NATIONS, 2012).
Divulgado em 2012, a Pesquisa Nacional por Amostra de Domicílios (PNAD) (IBGE,
2012), investiga dados sobre a população, migração, educação, emprego, família, domicílios e
rendimento. Segundo essa pesquisa, em 2011, 46,5% da população de 10 anos ou mais de
idade declararam ter usado a Internet nos últimos três meses da época da pesquisa. Houve um
aumento de 14,7% em relação a 2009. Porém, o Brasil não conseguiu disponibilizar o serviço
de Internet a maioria da população. Esse fator compromete a efetividade do governo
eletrônico e seu desenvolvimento.
83
Mesmo com avanços, o Brasil ainda tem o desafio no que tange a democratização do
acesso a informação. Para isso, o Estado tem desenvolvido ações para o avanço no acesso a
informação. São exemplos a Lei de Acesso a Informação (BRASIL, 2011) e o Plano Nacional
de Banda Larga, que visa reduzir o preço para utilização dos serviços e aumento da cobertura
e da velocidade (BRASIL, 2010).
Entretanto, existem outras barreiras relacionadas ao governo eletrônico que o Estado
precisa enfrentar. Habermas (2002, p. 144) chama atenção para outro obstáculo relacionado
com a participação cidadã na relação do Estado com a sociedade civil. Para esse autor, “os
grupos de opinião pública criados na Internet continuam segmentados, separados uns dos
outros como comunidade aldeãs globais”.
Outro desafio vem do governo e seu papel e contribuição para a sociedade. De modo
geral, os governos têm procurado, usado e aplicado tecnologias bem depois dessas tecnologias
e os processos correspondentes terem sido testados e provados no setor privado. Os governos,
que são os grandes inovadores e às vezes são a fonte financeira para o setor privado, “não
conseguem se adaptar rapidamente ao papel de inovador, o que os coloca muito atrás do que é
considerado como norma e ambiente tecnológico corrente.” (W3C, 2009, p. 14).
Um último entrave é a necessidade de se quebrar os “silos” corporativos dos vários
órgãos e agências dos governos para melhorar atender às necessidades dos cidadãos.
(CHAHIN et al., 2004, p. xvi). Nesse caso, os dados governamentais abertos podem
contribuir para a abertura desses “silos” e a interligação entre eles.
Chahin et al. (2004) antevê a questão dos dados governamentais abertos ao associar os
benefícios do governo eletrônico à transparência pública.
Desta forma, coloca-se a perspectiva de generalização da diretriz de
transparência por meio da criação de canais integrados de acesso do
cidadão e de entidades da sociedade civil a informações, a
procedimentos administrativos, ao processo decisório e aos bancos de
dados governamentais. Por outro lado, a oferta de informações ao cidadão
com a qualidade, atualização e abrangência pressupõe a produção contínua
de conteúdo e sua formatação e modulação para público amplo e
diversificado, o que requer a revisão dos mecanismos convencionais de
comunicação da administração pública. (CHAHIN et al., 2004, p. 104, grifo
nosso).
Os dados governamentais abertos podem contribuir para facilitar o desenvolvimento
de produtos e serviços que colaboram para integração entre os cidadãos e os dados
salvaguardados nos bancos de dados governamentais.
84
4.4.1 Accountability
Ao longo de 2010, foram publicados pela WikiLeaks23 diversos documentos do
governo dos Estados Unidos, ditos confidenciais, com forte repercussão mundial. O impacto
da liberação desses documentos foi tão grande que um dos membros do parlamento norueguês
indicou o WikiLeaks para o Nobel da Paz, porque a organização teria ajudado a ‘redesenhar o
mapa da liberdade de informação’. (ROBERTS, 2011 apud ANGÉLICO, 2012, p. 45).
A democratização do Estado tem sido amplamente discutida (GONZÁLEZ DE
GÓMEZ; LIMA, 2010). Isso se deve a necessidade de se “enfrentar as contradições
estruturais que se expressam pela corrupção, pela baixa densidade dos processos eleitorais na
vida cotidiana, pela escalada da violência e pela extensão da pobreza, mesmo em países do
centro capitalismo”. (FILGUEIRAS, 2011a, p. 87)
Como declara Sant’ana (2009, p. 38) exercer plenamente a cidadania requer
comprometimento do cidadão no acompanhamento crítico dos rumos definidos pelo poder
público e com a forma com que os recursos públicos são utilizados.
Neste contexto, surge a noção de accountability como forma de controle dos cidadãos
sobre as ações governamentais.
O conceito de accountability, enquanto ideia normativa informada, surgiu em meio às
propostas de reformas liberais das décadas de 1980 e 1990. (FOWDLE, 2006 apud
FILGUEIRAS, 2011b, p. 6). Filgueiras (2011a; 2011b) analisa accountability sobre duas
vertentes, uma voltada para prestação de contas; e a outra direcionada ao caráter normativo,
que é o Estado fazer o que deve ser feito.
Accountability é um conceito fortemente relacionado ao universo político
administrativo anglo-saxão. (JARDIM, 2000). Campos (1990) tentou buscar uma tradução ou
versão desse termo para o português, porém ela chegou a conclusão que isso não seria
possível. “Ao longo dos anos fui entendendo que faltava aos brasileiros não precisamente a
palavra, ausente tanto na linguagem comum como nos dicionários. Na verdade, o que nos
falta é o próprio conceito, razão pela qual não dispomos da palavra em nosso vocabulário”.
(CAMPOS, 1990, p. 34). Pinho e Sacramento (2009) escrevem um texto retomando a busca
pela tradução do termo descrito no texto clássico de Campos (1990). Eles concluíram que se
23
WikiLeaks é uma organização de mídia sem fins lucrativos, criada em 2007. O objetivo é relatar e publicar
informações importantes, além de também desenvolver e adaptar tecnologias para apoiar essas atividades.
Fornecem formas seguras, garantindo o anonimato das fontes que fornecem o vazamento de informações para
jornalistas e demais interessados. (WIKILEAKS, 2013, tradução nossa).
85
esta mais perto da resposta do que quando Campos se defrontou com o problema, mas ainda
muito
longe
de
construir
uma
verdadeira
cultura
de
accountability.
(PINHO;
SACRAMENTO, 2009, p. 1344).
A accountability é um modo de disponibilização de informações das contas públicas
para o cidadão, que pode analisar e criticar o andamento das políticas públicas e o emprego do
erário. A accountability remete à obrigação do Estado de veicular links sobre as contas
públicas nos sites. (BANDEIRA, 2005, p. 12)
Já para Matheus (2009, p. 6), accountability é um meio de promoção para que o Brasil
tenha a participação cidadã necessária para o controle social. Passando a questionar os
gestores públicos sobre seus atos, por meio da prestação de contas e definições dos objetos de
ações.
O conceito de accountability envolve duas partes: a primeira delega responsabilidade
para que a segunda proceda à gestão dos recursos; ao mesmo tempo, gera a obrigação daquele
que administra os recursos de prestar contas de sua gestão, demonstrando o bom uso desses
recursos. (AKUTSU, PINHO, 2002, p. 371).
Tradicionalmente, existe uma “ausência de accountability na relação entre os
governantes e a sociedade”. (AKUTSU, PINHO, 2002, p. 371). Percebe-se que, em muitos
casos, há um distanciamento entre os atores envolvidos no processo de accountability, faltam
informações divulgadas e faltam também cobranças para a divulgação dessas informações.
A efetividade dos mecanismos de accountability dependeria do grau de acesso do
cidadão à informação governamental. [...] Cabe, portanto, ao Estado, produzir meios que
estimulem os governantes a, publicarem, justificarem o curso de suas ações, relacionando as
políticas adotadas com os efeitos que produzem ou esperam produzir. (JARDIM, 1999, p. 57).
Pois, quando maior a possibilidade dos cidadãos poderem discernir se os governantes estão
agindo em função do interesse da coletividade e sancioná-los apropriadamente, mais
accountable é o governo. (JARDIM, 2000, p. 5).
As demandas por accountability reforçaram a criação de outro princípio para a
democratização do Estado: o princípio da transparência. (FILGUEIRAS, 2011a; 2011b).
Alguns autores trabalham com transparência e accountability como sinônimos, porém
Vaz, Ribeiro e Matheus (2010) esclarecem que o conceito de accountability vai além da
prestação de contas e da publicidade das ações governamentais, referindo-se também a uma
atuação de controle sobre a Administração Pública que possa gerar incentivos ou sanções que
ocorram caso o agente público cumpra ou descumpra determinada obrigação.
86
Ou seja, a accountability, em uma concepção normativamente informada
pelas reformas liberais, é aprimorada com a ampliação da transparência,
tendo em vista uma questão de retorno do investimento realizado pelos
cidadãos na ação pública dos agentes. A transparência maximiza a
accountability por permitir a redução da assimetria de informação entre
principal e agent, garantindo um sistema de responsabilização derivado da
abertura dos segredos de Estado. A transparência, para a teoria da agência,
reforça a accountability nos contornos da economia da informação, sendo o
cidadão visto como um consumidor de bens públicos, no mesmo patamar
das relações de mercado. (FILGUEIRAS, 2011b, p. 8).
4.4.2 Transparência em ações pública
Um dos grandes resultados alcançados com o governo eletrônico foi sua contribuição
para a transparência pública. O governo eletrônico é uma poderosa ferramenta de reforma
administrativa do Estado, uma vez que facilita a transparência, a eficiência na entrega de
serviços públicos, a luta contra a corrupção e a individualização do atendimento aos cidadãos.
(CHAHIN et al., 2004, p. xvi).
Todavia, os dados publicados são publicados “de forma parcial e por caminhos
extremamente burocratizados e pouco transparentes”. (AGUNE; GREGORIO FILHO;
BOLLIGER; 2010, p. 3). González de Gómez (2002, p. 36) afirma que a “transparência”, no
domínio das relações Estado-sociedade, dependerá de outras condições, tais como a
convergência dos sistemas e serviços de comunicação e informação pública. Essa
convergência dos sistemas e serviços governamentais poderia ser otimizada se os dados
estivem sido publicados em formato bruto e aberto.
No âmbito dos governos democráticos, a transparência pode ser útil para muitos fins.
Transparência é central para a boa governança e pré-requisito essencial para
a accountability entre os estados e cidadão. Basicamente, governança
transparente significa uma abertura do sistema de governança através e
processos e procedimentos claros e fácil acesso á informação pública por
parte dos cidadãos, estimulando a consciência ética, no serviço público
através do compartilhamento de informações, o que em última instância
assegura accountability para o desempenho dos indivíduos e organizações
que são responsáveis por recursos públicos ou ocupam cargos públicos.
(SUK KIM et al., 2005 apud ANGÉLICO, 2012, p. 25).
O conceito de transparência pública pode ser entendido como meio de fornecer
informações à sociedade, que de acordo com sua capacidade crítica, pode inferir e participar
mais efetivamente do campo político. (GONZÁLEZ DE GOMEZ, 2002).
87
No Brasil, o principal resultado referente à transparência pública foi o
desenvolvimento do Portal da Transparência do Governo Federal. Essa iniciativa da
Controladoria-Geral da União (CGU) foi lançada em novembro de 2004, para assegurar a boa
e correta aplicação dos recursos públicos. O objetivo é aumentar a transparência da gestão
pública, permitindo que o cidadão acompanhe como o dinheiro público está sendo utilizado e
ajude a fiscalizar. (CONTROLADORIA-GERAL DA UNIÃO, 2013b).
FIGURA 20 - Portal da Transparência do Governo Federal do Brasil.
Fonte: Portal da Transparência do Governo Federal (2013)
Busca-se a transparência não como um atributo dos conteúdos de valor informacional
oferecidos pelo Estado. Todavia, como resultante das condições de geração, tratamento e uso
das informações adequadas para permitir a passagem do nível caótico, para o nível de
informação organizada, que produza sentido para um cidadão ou grupo social. (GONZÁLEZ
DE GOMEZ, 2002, p. 36).
Entretanto, concorda-se com Jardim (1999) que, no decorrer do texto, afirma que
sempre teremos a relação transparência/opacidade, pois a ação de tornar pública determinadas
informações é um processo repleto de valores, no qual julgamos o que deve ser público ou
não (seleção).
Também é esclarecido por Jardim (1999, p. 72-73) que a opacidade informacional do
Estado pode ser entendida como a ausência (total ou quase total) de interação informacional
entre o Estado e a sociedade, na qual a massa de excluídos supera em muito a de cidadãosincluídos. Constitui um território estratégico na produção de hegemonia e de exclusão de
classes sociais não dominantes. Logo, constituindo-se em uma estratégia de poder.
Já Zugman (2006, p. 10) comenta que essa “opacidade leva a uma relação entre os
cidadãos e seu governo marcada pela enorme assimetria de informações e poderes”.
88
Quer isto dizer que o campo político exerce de facto um efeito de censura ao
limitar o universo daquilo que é pensável politicamente, ao espaço finito dos
discursos suceptíveis de serem produzidos ou reproduzidos nos limites da
problemática política como espaço das tomadas de posição efectivamente
realizadas no campo, quer dizer, sociologicamente possíveis dadas as leis
que regem a entrada no campo. (BOURDIEU, 1989, p. 165, sic)
Assim a transparência pode, por um lado, ser uma alternativa para que os cidadãos
tenham um conhecimento sobre assuntos e ações políticas do Estado, promovendo uma maior
participação social. Já por outro lado, a transparência, em virtude de sua publicidade, pode ser
utilizada para legitimar, oficializar algo como verdade. “A passagem do implícito ao explícito,
da impressão subjetiva à expressão objectiva, à manifestação pública num discurso ou num
acto público constitui por si um acto de instituição e representa por isso uma forma de
oficialização, de legitimação”. (BOURDIEU, 1989, p. 165).
Silva (2001) ao discutir a ideia de esfera pública proposta por Habermas, afirma que
este autor também associa o conceito de transparência ao de publicidade. Silva (2001)
defende ainda, que na visão de Habermas, o Estado é influenciado pela esfera pública,
deixando de ser um produtor de opacidade e passando a ser um potencial produtor de
transparência.
Como conseqüência da definição constitucional da esfera pública e das suas
funções, a publicidade tornou-se o princípio organizacional dos
procedimentos dos próprios órgãos do Estado; neste sentido, fala-se na sua
“publicidade” [por outro lado, a relação entre esta noção de publicidade
(transparência) e a prática parlamentar e judicial é enfatizada.] O carácter
público das deliberações parlamentares garantia à opinião pública a sua
influência; assegurava a relação entre representantes e eleitores como partes
do mesmo público. E, por volta da mesma altura, também os procedimentos
legais nos tribunais começam a ser tornados públicos (HABERMAS, 1962
apud SILVA, 2001, p. 127)
Ribeiro, M. (2008) e Matheus (2009) apresentam o conceito de transparência sob dois
aspectos. O primeiro associa o conceito de transparência como sinônimo de publicidade, já o
segundo, a transparência vai além dos dados disponibilizados, pensando na transparência
relacionada com o acesso aos dados, inclusão digital e disponibilidade dos dados,
especialmente em relação à freqüência e atualização das informações contidas em portais e
sites governamentais. O segundo aspecto vai ao encontro dos objetivos dos dados
governamentais abertos.
Apesar de ainda não se falar na publicação de dados governamentais abertos, Matheus
(2009, p. 16) afirma que o verdadeiro significado de transparência é a
89
abertura do fornecimento de informações, de acesso livre e universal, de
constante atualização, postadas em um único canal de comunicação e
interação com o cidadão e com ferramenta de busca para ajudar a encontrar a
temática que queira rapidamente.
Cabe lembrar, que dados governamentais abertos não devem ser postos como
sinônimo de transparência, porém pode contribuir para a ampliação da transparência
governamental, em outras palavras, “uma política de dados abertos teria o poder de
potencializar as possibilidades de transparência através da Internet”. (DINIZ, 2010 apud
VAZ, RIBEIRO, MATHEUS, 2010, p. 53).
Assim, os dados governamentais abertos podem ser considerados como recurso de
transparência, promovendo o acesso à dados públicos sem restrições tecnológicas, podendo
ser reutilizados e tendo uma estrutura que facilite sua recuperação e utilização.
4.5 DADOS GOVERNAMENTAIS ABERTOS
Percebe-se que a Web é, muitas vezes, o primeiro local de busca por informações, que
vão desde notícias, até pesquisas sobre doenças. Além disso, muitos relacionamentos
humanos – amorosos, amizades, profissionais – são criados e mantidos na Web, via redes
sociais. Essas são tendências importantes que estão abrindo novas oportunidades para que
governos e cidadãos interajam. Cada vez mais, o meio-padrão usado pelo governo para
transmitir sua mensagem e oferecer serviços públicos é a Web. (W3C, 2009, p. 25).
Talvez um dos grandes motivos para o sucesso da Web seja o caráter participativo dos
usuários em inovar, que proporciona a possibilidade de criar e disseminar informação de
maneira ágil. A Web é transformadora porque permite que qualquer pessoa seja um editor.
Isso muda profundamente as relações de poder na esfera pública. (W3C, 2009, p. 26).
Habermas (1992, p. 435-436 apud LUBENOW, 2010, p. 236) afirma que a esfera
pública “constitui uma estrutura normativa capaz de diferenciar entre competências e papéis.
[...] pode ser descrita como uma rede adequada para a comunicação de conteúdos tomadas de
posição e opiniões”. Complementando essa conceituação Lima e Gonçalves (2011) afirmam
que
A esfera pública é o termo utilizado para designar espaços de cooperação
entre agentes e atores que, a partir de canais específicos de comunicação,
integram habilidades, conhecimentos e técnicas, resultando no
fortalecimento de competências e maximização de resultados. Com isso há o
compartilhamento e a discussão de opiniões e a criação de entendimento
mútuo. Essa idéia de espaço ou ambiente de discussão para os agentes
90
participantes torna-se importante pelo fato de que os próprios agentes
possuem a oportunidade. (LIMA; GONÇALVES, 2011, p. 1645)
Atualmente,
percebe-se
que
os
ambientes
de
discussão
estão
abrigados,
principalmente, na Web, basta verificar a influência que as redes sociais possuem na
repercussão de determinados assuntos. Twiter24, Crowdsourcing25 e Crowdfunding26 são
exemplos de novas maneiras dos cidadãos se manifestarem e interagirem com o Governo.
Deixam de ser passivos e apenas receptadores de informações, passando a ter uma postura
ativa, mas participativa, buscando uma interação colaborativa entre os usuários da Web em
prol de um objetivo determinado. Como lembra Habermas (2003, p. 33) “a formação
democrática da opinião e da vontade depende de opiniões públicas informais que idealmente
se formam em estruturas de uma esfera pública política não desvirtuada pelo poder”.
Vale destacar que é utilizado o conceito de Governo se referindo “não apenas ao
conjunto de pessoas que exerce o poder político e determina a orientação política de uma
determinada sociedade. Diz respeito, também, ao complexo de órgãos que institucionalmente
têm o exercício do poder”. (LEVI, 1993 apud JARDIM, 1995, p. 65).
A Open Definition (2013) aborda sobre o conhecimento aberto, no qual engloba,
dentre outros aspectos, os dados, sejam eles científicos, históricos, geográficos ou outros
quaisquer, além de informações governamentais e administrativas. Assim, “dado aberto é um
dado que pode ser livremente utilizado, reutilizado e redistribuído por qualquer um”.
(MANUAL..., 2011, p. 13).
Pode-se dizer que um dos benefícios – ou consequência – de se associar dados abertos
às informações públicas é a interoperabilidade, proporcionada pelos padrões provenientes dos
princípios dos dados abertos.
Miranda (2011, p. 65) chama a atenção para a importância da interoperabilidade
semântica, que pode ser entendida como a “habilidade de dois sistemas se comunicarem,
24
O Twitter apresenta-se como uma proposta para troca de informações e divulgação de notícias em poucas
palavras. É um forte aliado para a disseminação da informação no ambiente online, ou seja, na internet.
Utilizando estes serviços os usuários podem publicar notícias ou compartilhar informações através de vários
equipamentos que possibilitem uma conexão, entre estes o celular, e assim não precisando necessariamente do
computador. (PAUXIS, SILVA, 2011)
25
Crowdsourcing é um modelo de produção que utiliza a inteligência e os conhecimentos coletivos e voluntários
espalhados pela Internet para resolver problemas, criar conteúdo e soluções ou desenvolver novas tecnologias
como também para gerar fluxo de informação. (WIKIPEDIA, 2013b).
26
Crowdfunding, traduzido para o português como Financiamento coletivo ou Financiamento colaborativo, é
a obtenção de capital para iniciativas de interesse coletivo através da agregação de múltiplas fontes de
financiamento, em geral pessoas físicas interessadas na iniciativa. O termo é muitas vezes usado para descrever
especificamente ações na Internet com o objetivo de arrecadar dinheiro para artistas, jornalismo cidadão,
pequenos negócios e start-ups, campanhas políticas, iniciativas de software livre, filantropia e ajuda a regiões
atingidas por desastres, entre outros. (WIKIPEDIA, 2013a).
91
tendo entre eles a mesma interpretação e, portanto, as mesmas implicações lógicas sobre as
informações trocadas”. Para este mesmo autor, o movimento criado pela publicação de dados
governamentais abertos pretende utilizar padrões de arquivo ou comunicação que promovam
interoperabilidade semântica entre sistemas, permitindo interpretações automatizadas por
máquina e agregação de valor às informações apresentadas a sociedade.
Com relação a questão da interoperabilidade, o Governo Brasileiro publicou a Portaria
n. 5, em 14 de julho de 2005, que institucionaliza os Padrões de Interoperabilidade de
Governo Eletrônico (e-PING), no âmbito do Sistema de Administração dos Recursos de
Informação e Informática (SISP), cria sua Coordenação, definindo a competência de seus
integrantes e a forma de atualização das versões do Documento. O e-PING visa integrar as
operações
entre equipamentos, programas e sistemas de informática, visando o pleno
aproveitamento dos potenciais de intercâmbio de dados e informações no
âmbito da Administração Pública Federal direta, autárquica e fundacional, o
avanço na constituição da infra-estrutura para o desenvolvimento do
Governo Eletrônico e a racionalização de custos. (BRASIL, 2005, p. 1)
Utilizando o pensamento de Pastori (1993 apud JARDIM, 1995, p. 62), administração
pública pode ser definida como “conjunto de atividades diretamente destinadas à execução
concreta das tarefas ou consideradas de interesse público ou comum numa coletividade ou
numa organização estatal”. Jardim (1995; 1999) complementa a ideia de administração
pública afirmando que sua atividade corresponde tanto às ações governamentais relacionadas
com os poderes de decisão e comando e aquelas de auxílio imediato ao exercício do Governo,
quanto aos empreendimentos voltados para a consecução de objetivos públicos, definidos por
Lei e atos do Governo.
Miranda (2011), Ribeiro e Almeida (2011) e Batista et al. (2012) apontam a
publicação do Memorandum on Transparency and Open Government, pelo presidente dos
EUA, Barack Obama (2009) como ação motivadora para a ampliação de esforços para a
publicação de dados governamentais abertos. Esse documento estabelece as diretrizes do
Governo Norte-Americano, abrangendo desde as questões sobre gestão interna da informação,
indo até a publicação dos dados do Governo para a sociedade civil. (OBAMA, 2009). A partir
de então a abertura de dados governamentais passou a ser uma prática que, cada vez mais, é
adotada por diversos países.
O Manual... (2011, p. 4) define dados governamentais abertos como
92
dados produzidos pelo governo e colocados à disposição das pessoas de
forma a tornar possível não apenas sua leitura e acompanhamento, mas
também sua reutilização em novos projetos, sítios e aplicativos; seu
cruzamento com outros dados de diferentes fontes; e sua disposição em
visualizações interessantes e esclarecedoras.
Para o W3C (2010 apud VAZ; RIBEIRO; MATHEUS, 2010, p. 49) os Dados
governamentais abertos podem ser definidos como “a publicação e disseminação das
informações do setor público na Web, compartilhados em formato bruto e aberto,
compreensíveis logicamente, de modo a permitir sua reutilização em aplicações digitais
desenvolvidas pela sociedade”.
Já Batista et al. (2012, p. 2) afirma que Dados Governamentais Abertos são
“entendidos como o esforço para a publicação e disseminação das informações do setor
público na Web, permitindo a reutilização e a integração destes dados”.
Diante das definições apresentadas acima, pode-se que a questão chave dos dados
governamentais abertos é a abertura dos dados para sua reutilização pelos cidadãos. Pois,
apenas a troca de documentos entre organismos do setor público no âmbito das suas
atividades de serviço público não constitui reutilização. (VALENTIN RUIZ; BUENESTADO
DEL PESO, 2012).
Diversos estudos apontam os benefícios provenientes da adoção dos dados
governamentais abertos (BERNERS-LEE, 2009; DINIZ, 2009; MANUAL..., 2011). O W3C
(2009, p. 41-43) aponta como as principais vantagens dos dados governamentais abertos, os
seguintes pontos:
•
•
•
Reutilização: quando as informações são coletadas à disposição na Web
com uso dos padrões abertos apropriados, elas podem ser usadas várias
vezes de maneiras novas, imprevistas e imaginativas, capazes de aumentar
muito o valor dos dados por seu reuso e combinação, com maior
automação e interoperabilidade melhor.
Buscas melhoradas na Web: muitos sistemas ainda impedem a busca de
informações necessárias, pois mesmo disponíveis, não estão indexadas de
maneira adequada para sua recuperação. A utilização das tecnologias da
Web Semântica contribuirá para a estruturação e recuperação dessas
informações públicas;
Integração dos dados: possibilidade de interligar, melhorar e
compartilhar esses dados, o que produz uma grande melhoria na
integração de dados entre sistemas díspares e o florescimento de novos
serviços.
Com base nos conceitos elaborados pelo grupo defensor dos princípios para dados
governamentais abertos, o W3C (2009) amplia os benefícios já listados, acrescentando que os
93
dados governamentais abertos promovem o aumento do discurso civil, a melhoria do bemestar público e o uso mais eficiente dos recursos públicos. E alerta para que a publicação seja
eficaz é necessário identificar os dados que alguém controla, representar esses dados de uma
maneira que as pessoas possam utilizá-los e expor os dados para o mundo amplo.
DAVIES (2010, p. 3) e Eaves (2010 apud PEREIRA, 2012, p. 22) descrevem cinco
maneiras para utilização dos dados abertos. Sendo:
1.
2.
Data to fact – relacionada à busca, pesquisa e apresentação dos dados;
Data to information – forma na qual os dados foram analisados e
interpretados, comumente utilizada em trabalhos acadêmicos para
construção de análise e relatórios;
Data to interface – dados em formato mais interativo como gráficos,
mapas, tabelas, entre outros;
Data to data – dados são mais complexos por estarem agregados uns
aos outros;
Data to service – é a utilização dos dados para provimento de
serviços, como prestação de atendimento e serviço público ao cidadão
de maneira on-line pela gestão pública.
3.
4.
5.
Já os efeitos dos dados governamentais abertos sobre as políticas públicas são
apontadas pelo W3C (2009, p. 40) como sendo os seguintes:
•
•
•
Inclusão: fornecer dados em formatos padronizados abertos e
acessíveis permite que qualquer pessoa use numerosas ferramentas de
software para adaptá-los às suas necessidades;
Transparência: informações do setor público abertos e livremente
acessíveis melhoram a transparência, pois partes interessadas podem
usar essas informações da maneira mais adequada ao seu propósito,
obtendo uma ideia melhor do trabalho do governo e adaptando-os às
suas necessidades específicas;
Responsabilidade: os conjuntos apropriados de dados abertos,
devidamente ligados, podem oferecer vários pontos de vista sobre o
desempenho do governo ao tentar atingir suas metas públicas.
Um grupo de especialistas, o OpenGovData (2007), desenvolveu os oito princípios dos
dados governamentais abertos, que nortearam diversos trabalhos posteriores sobre este tema,
como Agune, Gregório Filho, Bolliger (2010); Diniz (2010); Manual... (2011); Vaz, Ribeiro,
Matheus (2010). Estes princípios são:
1. Completos. Todos os dados públicos estão disponíveis. Dado público é o
dado que não está sujeito a limitações válidas de privacidade, segurança ou
controle de acesso.
2. Primários. Os dados são apresentados tais como os coletados na fonte,
com o maior nível de granularidade e sem agregação ou modificação.
94
3. Atuais. Os dados são disponibilizados tão rapidamente quanto necessário
à preservação do seu valor.
4. Acessíveis. Os dados são disponibilizados para maior alcance possível de
usuários e para o maior conjunto possível de finalidades.
5. Compreensíveis por máquinas. Os dados são razoavelmente estruturados
de modo a possibilitar processamento automatizado.
6. Não discriminatórios. Os dados são disponíveis para todos, sem exigência
de requerimento ou cadastro.
7. Não proprietários. Os dados são disponíveis em formato sobre o qual
nenhuma entidade detenha controle exclusivo.
8. Livres de licença. Os dados não estão sujeitos a nenhuma restrição de
direito autoral, patente, propriedade intelectual ou segredo industrial.
Restrições sensatas relacionadas à privacidade, segurança e privilégios de
acesso são permitidas. (VAZ, RIBEIRO, MATHEUS, 2010, p. 47)
Ainda existem três leis dos dados governamentais abertos estabelecidas por Eaves
(2009, p. 1, tradução nossa), que determinam que
Se o dado não for encontrado e indexado na Web, ele não existe;
Se não estiver aberto e disponível em formato compreensível por máquina,
ele não pode ser aproveitado;
Se algum dispositivo legal não permitir sua replicação, ele é inútil.
Tanto nos princípios estabelecidos pelo grupo OpenGovData, quanto nas leis de
Eaves, a Web Semântica apresenta soluções para acessibilidade, compreensão por máquinas,
busca precisa e rápida. Ao fornecer significados às páginas na Web, de modo que a linguagem
seja compreendida por máquina, capturando, processando e relacionando dados de diferentes
fontes, a Web Semântica viabiliza que a publicação dos dados governamentais abertos seja
encontrada por quem a reutilize, dando outra utilidade àqueles dados.
Deve-se especificar que os dados governamentais a serem publicados em formato
aberto são aqueles que não contêm informações sobre indivíduos específicos ou restrições de
segurança nacional. Logo, os dados em questão se referem aos dados públicos, que estão ou
que deveriam estar liberados para a sociedade, tendo potencial para se tornarem abertos,
garantindo sua reutilização. (MANUAL... 2011, p. 16).
Ainda sobre essa questão, Thaney (2010) e Ribeiro e Almeida (2011) utilizam as
idéias de Auer et al. (2007), Gray et al. (2009) e Davies (2010) para chamar a atenção sobre
os aspectos ligados às questões de licença e autorização para acesso aos dados e aos
conteúdos oriundos do âmbito governamental. Pois se deve observar a diferença legal
existente entre os conteúdos individuais de uma base de dados (privacidade no conteúdo de
cada um dos campos de dados) e a coleção de conteúdos da base (privacidade global da base
de dados).
95
Berners-Lee (2009) conclui que os dados governamentais devem ser publicados de
forma aberta por três motivos: “aumentar a consciência cidadã das funções do governo para
permitir maior responsabilidade; contribuir com informações valiosas sobre o mundo; e
permitir que o governo, o país e o mundo funcionem com mais eficiência”.
Todavia, Gurstein (2011 apud RODRIGUES, 2012) acredita que a publicação de
dados governamentais abertos não será um objetivo fácil a ser conquistado. Esse autor levanta
obstáculos que os dados governamentais abertos deverão enfrentar até sua efetiva
implementação. Os principais pontos sinalizados são: a infraestrutura básica para acesso à
Internet pelo cidadão; ferramentas que são a disponibilidade dos dados em meios específicos e
não universalmente; dados que precisam de software específico para sua utilização; conteúdo
dos dados ser de difícil compreensão pelos usuários, principalmente aqueles com deficiência
ou baixa escolaridade e interpretação dos dados que necessitam de especialistas na área para
serem utilizados e compreendidos. (PEREIRA, 2012, p. 24).
Diante dos desafios apresentados, Dodds (2010, p. 13) recomenda que se deve
continuar permitindo o acesso abertos aos dados e incentivar que outras pessoas os reutilizem,
para alcançar, fora do espaço dos órgãos públicos, projetos, aplicações e organizações
criativas e inovadoras. Porém, não pode haver dúvidas que a intenção básica primeira dos
dados governamentais abertos é a reutilização.
Frente aos obstáculos para implementação das iniciativas para publicação de dados
abertos, algumas países se uniram, no espírito de colaboração multi-colaboradores, formando
um comitê de governos e organizações da sociedade civil, para supervisionar o andamento da
publicação de dados governamentais abertos. A parceria para Governo Aberto oficialmente
foi criada em 20 de setembro de 2011, quando os oito governos fundadores (Brasil, Indonésia,
México, Noruega, Filipinas, África do Sul, Reino Unido, Estados Unidos) aprovaram uma
Declaração de Governo Aberto, e anunciou seus planos de ação nacionais. Atualmente, são 47
governos membros da Open Government Partnership, que é uma iniciativa multilateral que
visa assegurar compromissos concretos dos governos para promover a transparência, capacitar
os cidadãos, combater a corrupção e aproveitar novas tecnologias para fortalecer a
governança. (OPEN GOVERNMENT PARTNERSHIP, 2012).
As primeiras iniciativas de dados governamentais abertos conhecidas por parte do
setor público são os portais de dados abertos do governo dos Estados Unidos27 e do Reino
Unido28. Nestes portais são indexadas milhares de séries de dados em formato bruto para
27
28
Disponível em: <http://www.data.gov/>. Acesso em: 1 maio 2013.
Disponível em: <http://data.gov.uk/>. Acesso em: 1 maio 2013.
96
serem utilizadas pela sociedade, lançados em maio de 2009 e setembro de 2009,
respectivamente. Em seguida, Canadá29, Austrália30 e Nova Zelândia31 começaram a publicar
dados segundo as diretrizes dos dados governamentais abertos, seguindo os passos dos
Estados Unidos e Reino Unido. (MIRANDA, 2011, p. 67-68).
Embora milhares de datasets tenham sido publicados nesses portais, houve pouca
participação da sociedade na utilização dos dados publicados. Em função disso, os Governos
dos Estados Unidos e do Canadá, começaram a promover campeonatos de elaboração de
aplicações, com prêmios para os mais úteis, estimulando o uso desses dados. (MIRANDA,
2011, p. 68).
Percebe-se assim que, além de publicar é necessário motivar a utilização dos dados,
criando, no futuro, um hábito parceria entre Estado e Governo na elaboração de ferramentas e
serviços.
Serão apontadas a seguir algumas iniciativas estrangeiras e nacionais de dados
governamentais abertos.
4.5.1 Iniciativas estrangeiras de dados governamentais abertos
Foram analisados os portais das primeiras iniciativas de dados governamentais
abertos. Desta forma, analisou-se portal norte-americano e do Reino Unido.
DATA.GOV
Criado em 2009, o portal Data.gov é uma ação efetiva do memorando sobre
transparência e governo aberto escrito por Obama (2009). Seu propósito é aumentar o acesso
do público aos dados gerados pelo Poder Executivo do Governo Federal, fornecendo
descrições dos conjuntos de dados governamentais, informações sobre como acessar as bases
de dados e ferramentas que alavancam conjuntos de dados do Governo.
O portal do Data.gov (UNITED STATES, 2013) apresenta como seu objetivo
melhorar o acesso aos dados federais e expandir o uso criativo desses dados para além das
paredes de Governo, incentivando ideias inovadoras (por exemplo, as aplicações Web). Além
de tornar o governo mais transparente.
29
Disponível em: <http://www.open.gc.ca/index-eng.asp>. Acesso em: 1 maio 2013.
Disponível em: <http://data.gov.au/>. Acesso em: 1 maio 2013.
31
Disponível em: <https://data.govt.nz/>. Acesso em: 1 maio 2013.
30
97
Data.gov utiliza-se de feedback, comentários e recomendações por parte do público e,
portanto, incentiva as pessoas a sugerirem conjuntos de dados que eles gostariam que fossem
publicados. Ademais, os conjuntos de dados já publicados podem ser avaliados e comentados,
sugerindo outras formas de melhorar sua disponibilização.
Em 1 de maio de 2013, o portal do Data.gov possuía 373.029 conjuntos de dados
brutos e geoespaciais, 1.209 ferramentas de dados, 349 aplicativos, 137 aplicativos móveis e
172 agências e subagências. E os dados são organizados em comunidades: agricultura,
negócios (EUA), cidades, consumidores, países, desenvolvedores, educação, energia, ética,
saúde, lei, industria, oceano, pesquisa, restauração do Golfo do México, Segurança, Estados e
cadeia de fornecimento sustentável.
O portal apresenta uma parte exclusiva para a Web Semântica, o Governo dos EUA
está na vanguarda das tecnologias da Web Semântica associada ao dados governamentais.
Para este fim, Data.gov está hospedando um conjunto de RDF, contendo triplas criadas pela
conversão de uma série de conjuntos de dados Data.gov para este formato, fazendo mais de
6,4 bilhões tripas de dados governamentais abertos disponíveis para a comunidade. (UNITED
STATES, 2013).
De acordo com o portal, o esquema de URI escolhido é muito simples e projetado para
permitir aos cidadãos explorarem e ampliarem os usos desses dados. Os líderes da
comunidade Data.gov, trabalham para uma nova codificação de conjuntos de dados
convertidos de Comma-Separated Values – CSV (e outros formatos) para RDF. Buscando
determinar o melhor esquema para se criar URI persistente e diferenciado, para junto com
comunidades internacionais e com W3C promover padrões internacionais de publicações de
dados do governo de forma persistentes (metadados) na Web. (UNITET STATES, 2013).
Como exemplo de utilização dos dados disponíveis no Data.gov, pode-se citar o
“Data.gov Mashathon 2010: na energy mashup”32. Ele combinou os dados da Energy
Information Administration (EIA), publicados no Data.gov, com dados de OpenEI.org, o
Censo dos EUA e SmartGrid.gov. O resultado deste mashup é comparar a variação no uso
residencial de energia de 7 cidades com população em torno de meio milhão de pessoas. Foi
possível analisar as diferentes tarifas de energia elétrica, os níveis de renda média, os
incentivos relacionados com a energia e os tipos de programas que estão sendo
32
Disponível em: <http://en.openei.org/apps/mashathon2010/>. Acesso em: 1 maio 2013.
98
implementadas pelo Smart Grid33. Com isso, cidades de todo o país estão fazendo a transição
para um novo mercado de energia de forma unificada.
FIGURA 21 - Aplicativo utilizando dados do Data.gov
Fonte: OpenEi34.
DATA.GOV.UK
O Governo do Reino Unido disponibilizou em 2009 o portal que disponibiliza os
dados públicos para ajudar os cidadãos a entenderem como o governo funciona e como as
políticas são feitas. Alguns desses dados já estavam disponíveis, mas o portal Data.gov.uk
reúne esses dados de forma unificada, possibilitando que sejam pesquisáveis em um website.
(DATA.GOV.UK, 2013).
Ramos Simón et al. (2012) afirma que o portal de dados abertos do Reino Unido
funciona também como um catalisador para outras instituições publicarem seus dados,
aumentando, desta forma, o número de dados disponível. Os dados então englobam o
Governo Central, Governos Regionais e autoridades locais, servindo como um elemento
fundamental na política de transparência do Governo. Este autor chama a atenção que não é
informação pública destinada ao público em geral, mas é destinado a um público capaz de
analisá-la e criar aplicativos que oferecem uma utilidade para o cidadão.
Em 1 maio de 2013 existiam 9.399 conjuntos de dados disponíveis, de todos os
departamentos do Governo central e uma série de outros organismos do setor público e das
autoridades locais.
33
Smart Grid é uma rede elétrica que utiliza tecnologia de informação e comunicação para reunir e agir de
acordo com informações, tais como informações sobre o comportamento de fornecedores e consumidores, de
forma automatizada para melhorar a eficiência, confiabilidade, economia e sustentabilidade da produção e
distribuição de energia elétrica. (WIKIPÉDIA, 2013c).
34
Disponível em: <Disponível em: http://en.openei.org/apps/mashathon2010/>. Acesso em 1 maio 2013.
99
O Data.gov.uk disponibiliza seus dados em 49 formatos diferentes, dos quais podem
ser destacados o CSV e RDF. Porém também disponibiliza 632 conjuntos de dados em
Portable Document Format (PDF), formato não indicado para publicação de dados abertos,
pois inviabiliza a reutilização dos dados contidos no documento.
A organização dos dados para sua recuperação é realizada por meio de tags. Estas
somam 50 assuntos utilizados para descreverem os dados. E assim, como o Data.gov, o
Data.gov.uk também utiliza ferramentas da Web 2.0 para promover a participação dos
cidadãos, podendo postar comentários sobre os dados publicados, solicitar outros dados e
sugerir melhorias.
FIGURA 22 - Aplicativo utilizando dados do Data.gov.uk
Fonte: Travel’s checklist35.
Ramos Simon et al.(2012) realizou uma pesquisa comparativa em portais de dados
abertos dos Governos Europeus. Pesquisou os portais do Governo da Alemanha, Áustria,
Bélgica, Dinamarca, Espanha, França, Grécia, Itália, Portugal e reino Unido. E concluiu que
apenas o Reino Unido trabalhava com as tecnologias de dados abertos interligados, tendo
como colaborados o Tim Berners-Lee, além de outros parceiros técnicos envolvidos no
projeto até o momento.
4.5.2 Iniciativas nacionais de dados governamentais abertos
Diante das iniciativas estrangeiras sobre publicação dos dados governamentais abertos,
o Brasil é o pioneiro nas discussões sobre dados abertos na América Latina (Mazoni, 2011, p.
9), abrindo espaço para discussões sobre dados abertos e reutilização.
35
Disponível em: <http://www.travelschecklist.com/>. Acesso em 1 maio 2013.
100
A principal iniciativa de dados governamentais abertos do Brasil é o Portal Brasileiro
de Dados Abertos ou dados.gov.br, como é citado em diversas pesquisas, é a ferramenta
disponibilizada pelo Governo Brasileiro para que os cidadãos possam encontrar e utilizar os
dados públicos. O portal também tem o objetivo de promover a interlocução entre atores da
sociedade e com o Governo para pensar a melhor utilização dos dados em prol de uma
sociedade melhor. (DADOS.GOV.BR, 2013).
O projeto dados.gov (como era chamado), iniciado em 2009 tem o objetivo principal
de criar um catálogo aberto de informações, cujo objetivo é aprimorar a gestão pública e
facilitar o acompanhamento pela sociedade das ações governamentais em suas comunidades.
(FRANZOSI et al., 2011, p. 27).
Franzosi et al. (2011, p. 27) afirma que o dados.gov.br é um catálogo de dados
organizado em árvores temáticas. Segundo este autor, ao acessar os portais de dados abertos
norte americano, do Reino Unido, da Alemanha e do Canadá não se tem a possibilidade de
acesso aos dados por diferentes árvores temáticas, tão pouco uma abordagem top-down, de
grandes assuntos até os itens primários de acesso aos dados.
Esta organização em árvores utiliza como base o Vocabulário Controlado do Governo
Eletrônico (VCGE). Franzosi et al. (2011, p. 39, grifo nosso) declara que “a busca semântica é
realizada sobre o repositório de metadados usando uma ontologia de domínio de Serviços
Públicos de Administração Federal que foi construída a partir do Vocabulário Controlado do
Governo Aberto Eletrônico (VCGE)”. Este ponto de vista será questionado na próxima seção
desta pesquisa.
Além do portal dados.gov.br, que serve como compilador dos dados abertos
publicados. Este portal indica nove outras iniciativas nacionais:
Portal da Câmara Municipal de São Paulo36 – que disponibiliza dados sobre
atividade legislativa, acervo de processos digitalizados da atividade legislativa,
recursos humanos e orçamento. Apesar de ter alguns dados disponibilizados em
XML, muitos estão em formato proprietário, contrariando os princípios de dados
abertos.
Governo Aberto SP37 – iniciativa do Governo do Estado de São Paulo, busca
estimular a criação de novos serviços eletrônicos, a promoção da transparência e a
melhoria de qualidade das informações de interesse da sociedade. Verificou- se
36
Disponível em: <http://www.camara.sp.gov.br/index.php?option=com_wrapper&view=wrapper&Item
id=219>. Acesso em 1 maio 2013.
37
Disponível em: <http://www.governoaberto.sp.gov.br/view/index.php>. Acesso em: 1 maio 2013.
101
que apesar de informar que possui 358 bases de dados cadastradas, muitas
apresentam seu conteúdo em formatos fechados. Algumas inclusive, solicitando
senha para acesso aos dados. Logo, precisa ser reformulada para que os dados
sejam realmente publicados seguindo os princípios de dados governamentais
abertos. Um diferencial positivo do portal foi a possibilidade de postar comentários
sobre as bases de dados.
Portal de dados abertos do Tribunal de Contas dos Municípios do Estado do
Ceará38 – além de fornecer uma espécie de tutorial sobre como utilizar os dados,
ainda oferece os dados disponibilizados em formatos XML, JSON, CSV e HTML.
Dados abertos do Governo de Pernambuco39 – Organiza os dados por assuntos,
classificados em: cultura, Economia, educação, Habitação, lazer, meio ambiente,
saúde, segurança, sociedade, trabalho, transporte e turismo. E os formatos
disponíveis são CSV e XML. Apresenta busca simples e detalhada para pesquisa.
Alagoas em Dados e Informações40 – classifica os dados em grupos: saúde;
educação, cultura e esporte, indicadores; trabalho; infraestrutura; demografia. E
utiliza a pesquisa por palavras-chave: IBGE; DATASUS; saúde; agropecuária;
INEP; indicadores; Educação-básica; agricultura; trabalho; MTE; emprego-formal;
infraestrutura; demografia; vacinas; comércio-exterior; MDIC; habitação,
demográficos; finanças-públicas e educação-especial. Nota-se que a escolha por
palavras chaves não segue um critério que padronize a utilização, facilitando assim
a recuperação dos dados. Fornece os dados em formato XLS, CSV e XML.
Dados abertos da Assembleia de Minas41 – apresenta algumas limitações
especificadas no próprio portal: (a) nem todos objetos são expostos como recursos
e por isso não é possível acessá-los diretamente; (b) as representações dos recursos
não são interconectadas, não é possível navegar por uma lista de objetos até chegar
a um objeto da lista diretamente. Muitas vezes, apenas as chaves são listadas; (c)
muitos objetos são acessados através de URLs de pesquisa, identificadas por
verbos como "consulta". Os dados são disponibilizados em formato txt, CML e
JSON.
38
Disponível em: <http://api.tcm.ce.gov.br/>. Acesso em: 1 maio 2013.
Disponível em: <http://www.dadosabertos.pe.gov.br/PortalDadosAbertos/public/pages/telaInicial. jsf.>.
Acesso em: 1 maio 2013.
40
Disponível em: <http://catalogo.seplande.al.gov.br/>. Acesso em: 1 maio 2013.
41
Disponível em:< http://dadosabertos.almg.gov.br/ws/ajuda/sobre>. Acesso em: 1 maio 2013.
39
102
Rio Datamine42 – Página indisponível durante o período de pesquisado de 12 fev.
2013 a 17 jun. 2013.
Rio ideias43 – Página promocional de concurso de aplicações utilizando dados do
governo da cidade do Rio de Janeiro.
Portal de Dados Abertos da Secretaria de Segurança Pública do Estado do
Rio Grande do Sul44 – apresenta dados sobre violência contra a mulher e
indicadores abertos por município, entre os anos de 2002 a 2012. Os dados podem
ser acessados em formato CSV e XML. Porém, não é possível realizar pesquisas e
nem possui uma classificação temática dos dados.
Miranda (2011, p. 67) sinaliza para o pioneirismo da Dataprev na publicação de dados
governamentais abertos. De acordo com este autor, a Dataprev trabalhou em um projeto piloto
para a publicação de dados abertos da Previdência, estimando a publicação de no mínimo um
Dataset até o final de 2010.
A Dataprev disponibilizou dados sobre acidentes do trabalho publicados no Anuário
Estatístico de Acidentes do Trabalho, publicado entre os anos de 2002 a 2009. E a partir
desses dados foi criado pela Dataprev um aplicativo que uniu os dados publicados e o Google
Maps, identificando os números ou o tipo acidente por cidade mostrada no mapa.
FIGURA 23 - Aplicativo utilizando dados do Data.gov.br
Fonte: Dataprev45.
Nota-se que há uma falta de padronização dos formatos de publicação nas iniciativas
estrangeiras e brasileiras. Percebe-se que em alguns casos nem utilizam os formatos indicados
pela W3C para serem classificados como dados governamentais abertos. Precisa-se incentivar
42
Disponível em: <http://riodatamine.com.br/>. Acesso em: 1 maio 2013.
Disponível em: <http://ideias.rioapps.com.br/landing>. Acesso em: 1 maio 2013.
44
Disponível em: <http://www.ssp.rs.gov.br/?model=conteudo&menu=196&pg=1>. Acesso em: 1 maio 2013.
45
Disponível em: <http://api.dataprev.gov.br/doc/visualizacao-mapa.html>. Acesso em: 1 maio 2013.
43
103
a utilização de padrões de formatos e critérios para publicação dos dados, levando-se em
consideração os princípios de dados governamentais abertos.
104
5
INSTRUMENTOS
DE
REPRESENTAÇÃO
DA
INFORMAÇÃO
SOBRE
ACIDENTES DO TRABALHO
Como visto anteriormente no referencial teórico, precisa-se incorporar a prática de
reutilização sistemática dos dados governamentais, de forma a facilitar a comunicação e a
recuperação de informação pela sociedade. No caso aqui apresentado, buscou-se vocabulários
ou representações da informação que descrevessem a temática sobre acidente do trabalho no
domínio da Previdência Social brasileira, com o propósito de reutilizar suas estruturas e
conceitos para publicação dos dados do Ministério da Previdência Social, salvaguardados e
geridos pela Dataprev.
Assim, foram localizados os seguintes instrumentos:
Vocabulário Controlado do Governo Eletrônico (VCGE): elaborado pelo
Governo Brasileiro para ser o formato Padrão de Metadados do Governo
Eletrônico (e-PMG). Foi escolhido para análise por ser o vocabulário indicado
pelo plano de ação para Infraestrutura Nacional de Dados Abertos (INDA) para
descrição semântica dos dados do Governo publicados no portal dados.gov.br,
sobre dados governamentais abertos.
Modelo de publicações de dados sobre acidentes do trabalho: publicado pela
Dataprev, que foi escolhido por ser o modelo preliminar que norteou a publicação
de dados abertos sobre acidentes do trabalho realizada pela Dataprev e também o
modelo que despertou o interesse pela pesquisa aqui submetida;
Tesauro e a taxonomia da Organização Internacional do Trabalho (OIT):
elaborados pela agência das Nações Unidas, que tem por missão promover
oportunidades para que homens e mulheres possam ter acesso a um trabalho
decente e produtivo, em condições de liberdade, equidade, segurança e dignidade.
Foram selecionados para análise por serem instrumentos de representação do
conhecimento do principal órgão internacional sobre o domínio do trabalho.
5.1 ACIDENTE DO TRABALHO NO VCGE
O VCGE é uma evolução da Lista de Assuntos do Governo (LAG) em março de 2004.
É um esquema para ser utilizado no elemento assunto.categoria (subject.category) do Padrão
de Metadados do Governo Eletrônico (e-PMG). Para os gerentes de sítios e portais
105
governamentais, os termos retirados do VCGE tornarão mais direta a apresentação dos
serviços disponibilizados em uma estrutura de diretório baseada em seus indexadores.
(VOCABULÁRIO..., 2011).
O vocabulário estudado apresenta as relações genéricas e específicas entre os termos,
caracterizando uma taxonomia. De acordo com Moreiro González (2011, p. 51) a taxonomia
“serve para ordenar informação em uma hierarquia [...] em forma de árvore que estabelece
relação entre os objetos de generalização-especialização”. Apesar do Vocabulário (2011)
afirmar que no seu processo de construção utilizaram os princípios de um tesauro, o VCGE se
aproxima mais de uma taxonomia do que de um tesauro, pois este último abrange uma
quantidade maior de relações (GOMES, 1990), como, por exemplo, a partitiva e associativa,
não utilizada no VCGE.
De acordo com o Vocabulário... (2011) o público-alvo do VCGE é o cidadão. O
esquema tem por objetivo ser intuitivo para os cidadãos que buscam, nas páginas
governamentais on-line, assuntos do seu interesse. Por essa razão, descrevem a metodologia
do VCGE da seguinte forma:
prefere a linguagem do leigo ao jargão do serviço público ou termos
técnicos;
não supõe que o cidadão tenha conhecimento prévio das
responsabilidades de cada nível ou órgão governamental. Procura ser
independente da estrutura governamental, devendo sobreviver às
mudanças de estruturas e organogramas;
o uso comum é mais importante do que a precisão acadêmica, quando
se está escolhendo nomes ou posições relativas aos cabeçalhos.
(VOCABULÁRIO..., 2011)
Conforme observado no primeiro item listado anteriormente, pode-se inferir que o
VCGE utilizou a “linguagem do leigo”, ou seja, linguagem livre e preocupada com o uso
comum mais que com a “precisão acadêmica”. (VOCABULÁRIO..., 2011). No entanto, surgiu
aqui uma primeira inquietação: a precisão de vocabulários controlados estudada em estudos
acadêmicos não vem justamente para fornecer teorias e métodos para uma maior precisão na
descrição dos termos e, consequentemente, melhorar a recuperação da informação?
Vislumbra-se que a utilização do vocabulário pode ir além de um mapa para
navegação em páginas eletrônicas do setor público brasileiro. Seu uso pode ser estendido a
outros propósitos, como por exemplo: ser utilizado pelo Estado para representação do
domínio – mapa conceitual – de cada setor público, mostrando sua trajetória ao longo do
tempo, ou pode ser usada pelos cidadãos para descrição, recuperação e reutilização de
106
informações governamentais, atendendo assim a organização necessária para a publicação dos
dados abertos.
Ao analisar a classe referente à Previdência Social esquematizada no VCGE (Figura
24), percebe-se que a representação feita da respectiva área não corresponde a sua
abrangência temática. Termos importantes para entendimento da Previdência Social não
estavam contemplados no vocabulário.
FIGURA 24 - Previdência social no VCGE46
Fonte: VOCABULÁRIO... (2011)
Um exemplo, da falta de cobertura constatada anteriormente, é que se um cidadão
necessitar buscar por uma espécie de pensão ao qual se beneficia, não encontrará representada
esta pensão a qual procura, pois o termo “Pensão” não é classificado pelo VCGE. Estão
ausentes da classe do VGCE sobre Previdência Social as pensões mantidas, atualmente, pelo
Ministério da Previdência Social (ANUÁRIO..., 2012). Pensões estas, a saber:
Pensão especial à pessoas atingidas pela hanseníase
Pensão especial aos dependentes de vítimas fatais por contaminação na
hemodiálise - Caruaru-PE
Pensão especial mensal vitalícia
Pensão especial vitalícia
Pensão mensal vitalícia do dependente do seringueiro
46
Disponível em: <http://vocab.e.gov.br/2011/03/vcge#previdencia-social>. Acesso em: 5 mar. 2014.
107
Pensão mensal vitalícia do seringueiro
Pensão mensal vitalícia por síndrome de talidomida
Pensão por morte (EX-SASSE)
Pensão por morte de ex-combatente
Pensão por morte por acidente de trabalho
Pensão por morte previdenciária
Outro ponto relevante é que a Previdência Social está subordinada a classe de
“Pessoas, família e sociedade”. Entretanto, outras áreas como “Saúde”, “Trabalho” e
“Educação” apesar de estarem conceitualmente ligadas aos direitos e benefícios da pessoa e
da sociedade, encontram-se em classes independentes.
De acordo com Campos e Gomes (2008, p. 5) a “categorização é um processo que
requer pensar o domínio de forma dedutiva, ou seja, determinar as classes de maior
abrangência dentro da temática escolhida”. Desta maneira, não ficaram claros os princípios
utilizados para a realização da categorização da classe de assunto da Previdência Social dentro
do domínio do Governo Eletrônico.
A estrutura organizacional do Governo Eletrônico classifica, no mesmo nível
hierárquico, a Previdência Social, Saúde, Trabalho e Educação dentro de Ministérios
(BRASIL, 2013b). Assim, poderia ser revista a categorização aplicada no VCGE, de forma a
“analisar o domínio a partir de recortes conceituais que permitem determinar a identidade dos
conceitos (categorias) que fazem parte deste domínio”. (CAMPOS; GOMES, 2008, p. 5).
Ainda sobre este ponto, foi explicitado que o foco na elaboração do vocabulário foi
facilitar seu uso pelos cidadãos (VOCABULÁRIO..., 2011), acredita-se que quando mais
evidentes os termos, mas fácil será sua localização e utilização. Dar destaque a algumas áreas
em detrimento a outras com o mesmo nível hierárquico faz o vocabulário perder a
consistência entre as relações.
Ademais, foram encontradas inconsistências conceituais, referentes ao postulado da
monorreferencialidade, no qual, a denominação de uma unidade de conhecimento – conceito
(DAHLBERG, 1978), “é um termo o qual guarda com ele uma relação unívoca, isto é, para
cada conceito existe apenas uma denominação e cada denominação vale apenas para um
conceito”. (GOMES, 1990, p. 19).
Nesta direção, foi possível observar os termos “Previdência do regime estatutário” e
“Previdência do servidor” como termos diferentes, porém possuindo uma relação de
equivalência. Previdência do regime estatutário possui como finalidade “garantir os direitos e
108
benefícios previdenciários dos servidores” (MARANHÃO, 2012, p. 4) e Previdência do
servidor é a previdência “obrigatória aos servidores públicos federais, estaduais, municipais e
do Distrito Federal” (BRASIL, 2013a, p. 1). Observou-se ainda que o termo “Previdência do
regime estatutário” não é facilmente encontrado em seu domínio da Previdência Social, sendo
mais recorrente o termo “Previdência do servidor”.
A relação de equivalência não está expressa pelo vocabulário analisado, apesar de
estar descrito na metodologia de elaboração do VCGE. Logo, conforme observado, no
parágrafo anterior, há dois termos diferentes para representar um único conceito e perde-se
assim o controle linguístico dos termos que é um dos princípios básicos de qualquer
vocabulário controlado. Embora na linguagem natural não existam sinônimos perfeitos, devese buscar na linguagem especializada o controle de sinônimos ou quase-sinônimos. (GOMES,
1990, p. 47)
Conforme mencionado por Moreiro González (2011, p. 53) uma das características das
taxonomias é não incluírem definições para os termos, somente as relações hierárquicas. O
VCGE não possui definições para os termos, embora na aba de sugestões seja solicitada a
colaboração dos usuários do vocabulário para ajudarem a comporem as notas de escopo (NE)
com definições dos termos. Além disso, as definições constam na metodologia como uma das
etapas de elaboração do vocabulário em questão. Nota-se, então, o desejo de tornar o VCGE
ainda mais específico e com relações mais bem definidas. Como afirma Gomes (1990, p. 25)
a definição “fornece as características do conceito que vão permitir seu agrupamento e indicar
as relações. É ela que vai dar segurança ao organizador do tesauro para estabelecer as
relações”.
Cabe destacar que o termo “Acidente de trabalho” não é encontrado no VCGE. Os
dados atualmente publicados no portal dados.gov.br pela Dataprev, está indexada com o
termo “Segurança do trabalho”. Este termo dentro do VCGE é subordinado ao termo
“Legislações trabalhistas”, que por sua vez é termo específico do termo “Trabalho”.
Entretanto, os dados ali publicados tratam sobre assuntos ligados a temáticas diferentes das de
legislações, sem mencionar que Previdência Social não foi relacionada aos dados (vide figura
25).
109
FIGURA 25 - Descrição temática dos dados de acidente do trabalho publicados no Portal dados.gov.br.
Fonte: Portal dados.gov.br47
Ao se deparar com o VCGE, percebeu-se pontos que o tornaram um vocabulário
inconsistente, principalmente para o uso ao qual se pretendia utilizá-lo, ou seja, na ligação
semântica entre os dados publicados pela Dataprev.
O Plano de ação para Infraestrutura Nacional de Dados Abertos (INDA) prevê a
prospecção de ontologias e vocabulários existentes a serem reutilizados para publicação de
dados governamentais abertos. O portal dados.gov.br funciona como um catálogo coletivo,
recolhendo dados dos mais diversos órgãos públicos. Desta forma, os “dados do catálogo
serão classificados e agrupados conforme os temas (assuntos) constantes no Vocabulário
Controlado de Governo Eletrônico (VCGE)” (BRASIL, 2012).
Em 2012 começou um esforço do Governo para reavaliar o VCGE e aumentar sua
utilização por parte dos Órgãos Públicos. Em dezembro de 2013, foi disponibilizado, apenas
em formato .pdf, uma nova versão (2.0.2) do VGCE. Em outubro de 2013, o Governo abriu a
nova versão à consulta pública e as considerações acima elencadas foram enviadas para
análise.
A versão 2.0.2 do VCGE pretende ser um vocabulário especializado, “sendo os
vocabulários especializados maiores que o VCGE, esperamos que cada termo dos
vocabulários especializados de alto nível encontre um termo no VCGE, mesmo que
agrupado”. (BRASIL, 2013d, p. 8).
Desta forma, a classe da Previdência Social foi reduzida para:
47
Disponível em: <http://dados.gov.br/dataset/anuario-estatistico-de-acidentes-de-trabalho>. Acesso em: 2 jun.
2013.
110
Previdência Social
◦ Previdência Básica
◦ Previdência Complementar
◦ Outros em Previdência. (BRASIL, 2013d, p. 15).
A classe sobre Previdência Social foi arranjada no mesmo nível hierárquico que as
outras classes, como: Trabalho, Educação e Meio Ambiente. Entretanto, ele se tornou ainda
mais geral. Criando uma dependência de vocabulários especializados para que os dados
produzidos pelo Governo consigam uma eficaz indexação nas bases de dados. Em outras
palavras, o VCGE parece ter se tornado um vocabulário para interligar pequenos vocabulários
elaborados pelos Órgãos Governamentais.
Diante do observado, apesar de existir expectativa e determinação do INDA para se
utilizar o VCGE para organização semântica dos dados publicados, percebe-se que o
cumprimento desta tarefa será árdua, sem o auxílio de outros vocabulários específicos.
5.2 ACIDENTE DO TRABALHO NO MODELO DE PUBLICAÇÕES DE DADOS
PUBLICADOS PELA DATAPREV
A Dataprev, decidida a cooperar com o movimento de publicação de dados
governamentais abertos no Brasil, definiu que sua primeira iniciativa seria sobre a publicação
dos dados apresentados no Anuário Estatístico de Acidente do Trabalho. Batista et al. (2011)
e Ribeiro e Almeida (2011) explicam que apesar destes dados já serem disponibilizados na
Base de dados históricos da Previdência Social48, com tecnologia que permite a extração de
consultas pela Internet, este padrão de publicação foge aos princípios de dados
governamentais abertos, principalmente, no que se refere à reutilização dos dados.
De acordo com Anuário Estatístico de Acidente do Trabalho (2010), ele contém dados
referentes aos acidentes do trabalho, registrados ou caracterizados administrativamente como
tal pelo INSS no processo de concessão de benefício. Constituindo-se, dessa forma, em um
importante conjunto de dados para tomadas de decisões e para diagnóstico sobre determinadas
condições de trabalho impostas aos empregados.
Ademais, a Dataprev lida, em sua maioria, com dados particulares, ou seja, dados
privados, que identificariam os indivíduos, violando assim o princípio de confidencialidade
48
Disponível em: <http://www3.dataprev.gov.br/infologo/>. Acesso em: 2 jun. 2013.
111
dos dados. Por se tratar de um passo inicial da Dataprev na publicação de dados
governamentais abertos, os dados sobre acidentes do trabalho serviriam para consolidar o
processo de publicação, além de servirem para o reuso dos cidadãos, algo não possível até
então.
Nesta primeira fase, foram selecionados dados disponibilizadas na Seção I, subseção
D do Anuário (2010), conteúdo que trata de Comunicação de Acidente de Trabalho (CAT),
suas consequências, por localização geográfica das ocorrências (município) e seus respectivos
quantitativos. Estas informações são originadas nos registros dos benefícios de natureza
acidentária concedidos pelo Instituto Nacional de Segurança Social – INSS. (DATAPREV,
2013). A figura 26 mostra o modelo proposto pela Dataprev para representação da publicação
dos dados.
FIGURA 26 - Modelo de domínio sobre acidentes do trabalho, publicado pela Dataprev.
Fonte: Dataprev (2013)
Percebe-se, que se trata de um protótipo, pois não contempla todo o universo de dados
a ser coberto pela publicação dos dados. Sendo útil para um uso imediato de representação de
uma ação realizada, mas não podendo ser utilizada para planejamento e organização
semântica dos dados a serem ainda publicados. Entretanto, esse modelo possui grande
importância para esta pesquisa, pois foi por meio dele que se conseguiu enxergar a
necessidade de se propor um modelo que contemplasse outras relações.
O Anuário Estatístico de Acidentes do Trabalho (2010) possui uma relação direta com
o Anuário Estatístico da Previdência Social (2011), principalmente no que tange a concessão
de benefícios em função de acidentes do trabalho. Portanto, falta ao modelo representar esses
benefícios, bem como os códigos de classificação utilizados para identificar ou agregar outras
informações aos acidentes, como: Classificação Brasileira de Ocupações (CBO),
112
Classificação Nacional de Atividades Econômicas (CNAE) e Classificação Internacional de
Doenças (CID).
Por fim, o modelo proposto pela Dataprev precisa ser aprimorado, para que as futuras
publicações consigam abranger uma maior gama de dados organizados com o máximo de
semântica possível.
5.3 ACIDENTES DO TRABALHO NO TESAURO E NA TAXONOMIA DA OIT
A OIT surgiu 1919, como parte do Tratado de Versalhes, que pôs fim à Primeira
Guerra Mundial. Sua importância para o estudo sobre acidentes do trabalho se refere ao fato
da OIT ser a responsável pela formulação e aplicação das normas internacionais do trabalho
(convenções e recomendações). O Brasil está entre os membros fundadores da OIT e participa
da Conferência Internacional do Trabalho desde sua primeira reunião. Entretanto, somente na
década de 1950 que a OIT passou a ter uma representação no Brasil, promovendo as Normas
Internacionais do Trabalho, do emprego, da melhoria das condições do trabalho e da
ampliação da proteção social. (ORGANIZAÇÃO INTERNACIONAL DO TRABALHO,
2013).
O tesauro da OIT está na 6ª edição, datada de 2008, e reúne mais de 4.000 termos
relacionados com a área do trabalho. Cada termo possui seu equivalente nas línguas inglesa,
francesa e espanhol.
Os termos do tesauro são estruturados em 19 categorias principais, a saber: (1)
Relações internacionais; (2) Política social, proteção social e segurança social; (3)
Desenvolvimento econômico; (4) Direito, direitos humanos, governo e política; (5) Ciências
sociais, cultura, humanidades e arte; (6) Educação e formação; (7) Desenvolvimento rural,
agricultura, silvicultura e pesca; (8) Atividades econômicas; (9) Comércio; (10) Transportes;
(11) Finanças; (12) Administração; (13) Trabalho e emprego; (14) População, relações raciais
e de migração; (15) Saúde e seguridade; (16) Ciências ambientais; (17) Ciências da Terra;
(18) Pesquisa e Ciência; e (19) Informação e Ciência da Informação. (ORGANIZACIÓN
INTERNACIONAL DEL TRABAJO, 2011).
113
FIGURA 27 - Termos “Previdência Social” e “Acidente do trabalho” no tesauro da OIT.
Fonte: Organización Internacional del Trabajo (2011)
Percebe-se na figura 27, que o termo “acidente do trabalho” é subordinado ao termo
“Acidente”, que é termo específico de “Segurança”. Já o termo “Previdência social” é
subordinado ao termo “Proteção social”. Na versão 2.0.2 do VCGE (BRASIL, 2003),
“Previdência social” e “Proteção social” não são subordinados, sendo organizados no mesmo
renque, ou seja, no mesmo nível hierárquico.
Observa-se ainda que, ambos os termos possuem o termo “benefício por acidente do
trabalho”49 em suas relações. Sendo termo relacionado à “Acidente do trabalho” e termo
específico do termo “Previdência Social”. Logo, a interligação entre previdência social e
acidentes do trabalho é dada pelo benefício, do mesmo modo que o modelo aqui proposto
sobre acidente do trabalho pretende trabalhar.
Por sua vez, a taxonomia da OIT foi projetada pela Biblioteca da OIT como uma
ferramenta para recuperação de informação no site da OIT. Assim, sua estrutura espelha o
programa de trabalho da OIT e é usado por departamentos e escritórios de campo para
descrever o conteúdo de suas páginas Web e fazer pesquisas no site da OIT. Os 400 termos
cobertos pela taxonomia são agrupados em 25 grupos temáticos: (a) Trabalho; (b) Condições
de trabalho; (c) Relações trabalhistas; (d) Direito do trabalho; (e) Proteção social; (f)
Educação; (g) Desenvolvimento econômico e social; (h) Economia; (i) Finanças; (j) Setores
econômicos; (k) Comércio internacional; (l) Direitos humanos; (m) Cooperação internacional;
49
Tradução livre de: “prestaciones por accidentes de trabajo”.
114
(n) Governo e administração pública; (o) Sociedade; (p) População; (q) Saúde; (r) Meio
ambiente; (s) Tecnologia; (t) administração; (u) Estatísticas; (w) Recursos de informação; (x)
Países e zonas; e (z) OIT. (ORGANIZACIÓN INTERNACIONAL DEL TRABAJO, 2013).
A diferença entre a Taxonomia e o tesauro desenvolvidos pela OIT é a sua finalidade.
Enquanto a taxonomia busca facilitar a recuperação da informação a partir da página
eletrônica da OIT, o tesauro cobre uma gama maior de temas, não se limitando ao trabalho da
OIT.
FIGURA 28 - Termos “Previdência Social” e “Acidente do trabalho” no taxonomia da OIT.
Fonte: Organización Internacional del Trabajo (2013)
Nota-se na figura 28, que na taxonomia o termo “Previdência Social” continua
subordinado ao termo “Proteção social”, assim como no tesauro. Entretanto, o termo
“Acidente de trabalho” é subordinado ao termo “Saúde e segurança no trabalho”, que é termo
específico de “Assistência Médica”, diferentemente da representação no tesauro, quando
“Acidente do trabalho” estava subordinado a “Acidente”. Por ser uma taxonomia, que
trabalha com hierarquias, os termos não encontram um termo em comum que faça relação
entre Previdência Social e Acidente do trabalho.
115
Analisar os instrumentos de representação do conhecimento elaborados pela OIT
contribuiu para notar que a relação entre Previdência Social e Acidente do Trabalho se dá
através dos benefícios concedidos. Relações não encontradas no modelo preliminar proposto
pela Dataprev e nem no VCGE. Entretanto, vislumbrado pelo modelo proposto nessa
pesquisa.
No decorrer desta seção, verificou-se que os modelos existentes não representam a
estrutura e as informações contidas nos dados sobre acidentes do trabalho, de forma a lhe
proporcionar uma semântica para recuperação e reutilização dos dados publicados.
116
6 EM BUSCA DE UM MODELO A PARTIR DAS DEFINIÇÕES SOBRE ACIDENTE
DO TRABALHO
Nesta seção, foi proposto um modelo conceitual sobre acidentes do trabalho, por meio
de definições sobre acidentes do trabalho, identificar conceitos, aí existentes, e suas relações.
A Teoria do Conceito elaborada por Dahlberg e seus trabalhos sobre definições já utilizavam
as definições como fonte de estudo na área de representação do conhecimento.
Para cumprir tal tarefa, buscou-se observar nas ontologias de fundamentação DOLCE
e UFO como os eventos eram tratados. No caso da DOLCE, privilegiou-se a DUL, que é uma
ontologia baseada na DOLCE, adaptada para descrição de eventos. O objetivo com isto é
identificar elementos comuns sobre a descrição de eventos em ontologias de alto nível. Os
elementos encontrados serviram para auxiliar na categorização dos conceitos.
Acredita-se também que, o modelo E-R, de Chen, pode auxiliar na elaboração de um
modelo que consiga representar o domínio sobre acidente do trabalho, podendo ser utilizado
para representar os dados da Previdência Social.
6.1 ANÁLISE DAS DEFINIÇÕES ACERCA DE ACIDENTES DO TRABALHO
Pretendeu-se aqui utilizar teorias e critérios já apresentados neste trabalho, para
observar definições acerca de acidentes do trabalho. Desta maneira, almejou-se determinar a
que categorias e quais relações existem entre as categorias contidas nas definições, buscando
localizar elementos capazes de representar o domínio estudado.
Acredita-se que utilizando os termos e as relações identificados nas definições, podese elaborar um modelo que represente graficamente o domínio em questão.
Nas definições analisadas a seguir foi utilizada a Teoria do Conceito de DAHLBERG
(1978) para classificação das definições e identificação dos termos, sendo estes palavra ou
expressão que tenha sempre um único referente na realidade; os termos identificados desta
maneira nas definições estão marcados com “<” e “>”. Também classificou-se os termos
identificados de acordo com as categorias das ontologias Unified Foundational Ontology for
perdurants (UFO-B) e da DOLCE+DnS Ultralite (DUL). E a partir disso, classificou-se os
termos de acordo com o modelo de Entidade-Relacionamento, desenvolvido por Chen (1976),
a fim de elaborar um diagrama Entidade-Relacionamento para o domínio estudado.
A seguir, são apresentados quadros com as definições selecionadas e análises
realizadas das definições de acidentes do trabalho.
117
QUADRO 1 - Análise da definição 1 sobre acidente do trabalho.
Definição 1
<Acidente do trabalho>: Os <acidentes> <ocorridos> <no curso do trabalho>
ou <com relação ao trabalho> que <causem> <lesões> <mortais ou não
mortais>. (OIT, 2011)
Classificação
da definição
(Dahlberg)
Conceitos
retirados da
definição
Acidente do
trabalho
acidentes
Definição genérica
no curso do
trabalho
com relação
ao trabalho
lesões
ocorre
causem
Categoria
da UFO-B
Categoria
da DUL
Categoria Observação
E-R
Evento
Evento
E
Evento
Evento
E
Situação
Situação
E
Categoria superior a acidente do
trabalho
Relaciona o participante ao evento
Situação
Situação
E
Relaciona o participante ao evento
Evento
Evento
E
Relação entre eventos. “Lesões” possui
subcategorias: “Lesões mortais” e
“lesões não-mortais”
Relação associativa
Relação causal
R
R
Fonte: O Autor.
FIGURA 29 - Proposta de diagrama ER da definição 1 sobre acidente do trabalho50.
Fonte: O autor.
A definição encontrada na OIT (2011) utiliza de forma clara o acidente do trabalho
como tipo de acidente relacionado ao trabalho. Já os seus efeitos foram reduzidas a duas
espécies, os acidentes que causem lesões mortais ou não mortais.
50
Neste momento, por se tratar de um diagrama ER para identificação das entidades, relações e atributos
presentes nas definições sobre acidentes do trabalho, não houve preocupação com a cardinalidade presente no
diagrama.
118
QUADRO 2 - Análise da definição 2 sobre acidente do trabalho.
Definição 2
Classificação
da definição
(Dahlberg)
Conceitos
retirados
da
definição
Acidente do
trabalho
pelo exercício
do trabalho
a serviço da
empresa
segurado
especial
lesão corporal
perturbação
funcional
ocorre
provocando
<Acidente do trabalho> é o que <ocorre> <pelo exercício do trabalho> <a
serviço da empresa>, ou <pelo exercício do trabalho> do <segurado
especial>, <provocando> <lesão corporal> (evento) ou <perturbação
funcional> (evento), de caráter <temporário> (atributo) ou <permanente>
(atributo). (BRASIL, 1991)
Definição genérica
Categoria
da UFO-B
Categoria
da DUL
Categoria
E-R
Evento
Evento
E
Situação
Situação
E
Relaciona o participante ao evento
Situação
Situação
E
Relaciona o participante ao evento
Objeto
Objeto /
Agente
Evento
Evento
E
O objeto é quem sofre o acidente do
trabalho
Relação entre eventos
Relação entre eventos. “Perturbação
funcional” possui subcategorias:
“Perturbação funcional permanente”
e “Perturbação funcional
temporário”
Relação associativa
Relação causal
Evento
Evento
E
E
R
R
Observação
Fonte: O Autor.
FIGURA 30 - Proposta de diagrama ER da definição 2 sobre acidente do trabalho.
Fonte: O Autor.
Acidente do trabalho definido no art. 19 da Lei n. 8.213/91 (BRASIL, 1991) apresenta
uma definição genérica do que é considerado acidente do trabalho para fins de assistência e
previdência social brasileira. Ao se aplicar os critérios escolhidos para a análise da definição,
pôde-se perceber que aparece o trabalhador (segurado especial), o contexto para que seja
caracterizado como acidente do trabalho (exercício do trabalho a serviço da empresa, ou pelo
exercício do trabalho), além de seus efeitos (lesão corporal ou perturbação funcional).
119
A relação entre os eventos foi marcada, principalmente, pela relação de causa. Que
reflete os efeitos provocados pelo acidente do trabalho.
Em comparação com a definição 1, percebe-se uma correlação de similaridade entre as
entidades “pelo exercício do trabalho” e “no curso do trabalho”, além de “a serviço da
empresa” e “com relação ao trabalho”. A definição 2 amplia os efeitos do acidente do
trabalho, apresentando a questão da perturbação funcional, não mencionado na definição 1.
Desenvolvendo melhor isto, acredita-se que as entidades apresentadas na definição 1 “lesões
mortais” e “lesões não-mortais”, correspondam, respectivamente, na definição 2, à “morte” e
“perturbações funcionais”.
QUADRO 3 - Análise da definição 3 sobre acidente do trabalho.
Definição 3
Classificação
da definição
(Dahlberg)
Conceitos
retirados da
definição
Acidente do
trabalho
pelo
exercício do
trabalho a
serviço da
empresa
a serviço da
empresa
segurado
especial
lesão
corporal
perturbação
funcional
<Acidente do trabalho> é o que <ocorre> <pelo exercício do trabalho> <a
serviço da empresa> ou <pelo exercício do trabalho> dos <segurados
especiais>, <provocando> <lesão corporal> ou <perturbação funcional>,
<permanente> ou <temporária>, que <cause> a <morte>, a <perda ou a
redução da capacidade para o trabalho>. (Anuário Estatístico da Previdência
Social, 2012, p. 507)
Definição genérica
Categoria
da UFO-B
Categoria
da DUL
Categoria
E-R
Evento
Evento
E
Situação
Situação
E
Relaciona o participante ao evento
Situação
Situação
E
Relaciona o participante ao evento
Objeto
E
Evento
Objeto /
Agente
Evento
O objeto é quem sofre o acidente do
trabalho
Relação entre eventos
Evento
Evento
E
morte
Evento
Evento
E
redução da
capacidade
para o
Evento
Evento
E
E
Observação
Relação entre eventos. “Perturbação
funcional” possui subcategorias:
“Perturbação funcional permanente” e
“Perturbação funcional temporário”
Relação causal entre eventos, “lesão
corporal” e “morte”
Relação causal entre eventos,
“Perturbação funcional” e “redução
da capacidade para o trabalho”
120
trabalho
perda da
capacidade
para o
trabalho
ocorre
provocando
cause
Evento
Evento
E
Relação causal entre eventos,
“Perturbação funcional” e “perda da
capacidade para o trabalho”
R
R
R
Relação associativa
Relação causal
Relação causal
Fonte: O Autor.
FIGURA 31 - Proposta de diagrama ER da definição 3 sobre acidente do trabalho.
Fonte: O Autor.
A definição encontrada no Anuário Estatístico da Previdência Social (2012, p. 507)
não difere muito da encontrada na Lei n. 8.213/91 (BRASIL, 1991). A principal diferença é o
acréscimo dos efeitos do acidente do trabalho (a perda ou a redução da capacidade para o
trabalho).
Na figura 31, foi representado como os termos foram apresentados na terceira
definição analisada. No entanto, adiante será verificada a relação entre as entidades
“Perturbação funcional permanente” e “Perda da capacidade para o trabalho” e também
“Perturbação funcional temporária” e “Redução da capacidade para o trabalho”.
QUADRO 4 - Análise da definição 4 sobre acidente do trabalho.
Definição 4
Classificação
<Acidente do trabalho>: Seu conceito legal é encontrado no <art. 19 da Lei
n. 8.213/91>. É o que <ocorre> <pelo exercício do trabalho> <a serviço da
empresa> ou <pelo exercício do trabalho> aos <segurados empregados>,
<trabalhadores avulsos> e <segurados especiais>. <É o> <acidente> que
<acarreta> <lesão corporal> ou <perturbação funcional> capaz de <gerar>
<morte>, a <perda ou a redução>, <permanente ou temporária>, da
<capacidade laborativa>. O <acidente do trabalho> <é classificado> em
<acidente típico>, <de trajeto> ou <atípico>, <doença profissional
(ergopatia)> ou <doença do trabalho (mesopatia)>. Os elementos para a
existência do acidente do trabalho são: nexo causal (comprovado ou
presumido) e lesividade (ou dano/atingimento à capacidade laborativa)”.
(HORVATH JÚNIOR, 2009, p. 6)
Definição genérica
121
da definição
(Dahlberg)
Conceitos
retirados da
definição
Acidente do
trabalho
art. 19 da Lei
n. 8.213/91
Categoria
da UFO-B
Categoria
da DUL
Categoria
E-R
Observação
Evento
Evento
E
Objeto
E
Documento regulamenta o acidente
do trabalho
E
Relaciona o participante ao evento
pelo
exercício do
trabalho
a serviço da
empresa
segurados
empregados
trabalhadores
avulsos
segurados
especiais
acidente
Situação
Objeto /
Objeto
social
Situação
Situação
Situação
E
Relaciona o participante ao evento
Objeto
E
Evento
Objeto /
Agente
Objeto /
Agente
Objeto /
Agente
Evento
lesão
corporal
perturbação
funcional
Evento
Evento
E
O objeto é quem sofre o acidente do
trabalho
O objeto é quem sofre o acidente do
trabalho
O objeto é quem sofre o acidente do
trabalho
Categoria superior a acidente do
trabalho
Relação entre eventos
Evento
Evento
E
capacidade
laborativa
acidente
típico
acidente
atípico
Acidente de
trajeto
doença
profissional
doença do
trabalho
ocorre
provocando
Éo
Acarreta
Gerar
É classificado
Fonte: O autor.
Objeto
Objeto
E
E
E
A
Relação entre eventos. “Perturbação
funcional” possui subcategorias:
“Perturbação funcional permanente” e
“Perturbação funcional temporário”
Atributo do trabalhador
Evento
Evento
E
Tipos de acidentes do trabalho
Evento
Evento
E
Tipos de acidentes do trabalho
Evento
Evento
E
Tipos de acidentes do trabalho
Evento
Evento
E
Sinônimo: ergopatia
Evento
Evento
E
Sinônimo: mesopatia
R
R
R
R
R
R
Relação associativa
Relação causal
Relação gênero/espécie
Relação causal
Relação causal
Relação gênero/espécie
122
FIGURA 32 - Proposta de diagrama ER da definição 4 sobre acidente do trabalho.
Fonte: O Autor.
A única obra de referência especializada em Previdência Social, que foi localizada, foi
a que apresentou a definição mais complexa sobre acidente do trabalho, pois apresenta o
documento que o regulamenta, seu paciente, ou seja, o trabalhador, especificando-os em:
segurados empregados, trabalhadores avulsos e segurados especiais.
Essa definição mostrou ainda o contexto para que se caracterize como acidente do
trabalho, seus efeitos, além de sua classificação em: acidente do trabalho típico, acidente do
trabalho atípico e acidente do trabalho de trajeto.
Ademais, foi definição que se localizou um atributo de forma clara. O atributo dos
trabalhadores, “capacidade laborativa”, foi apresentado na definição como característica do
trabalhador atingida pela perturbação funcional. Outro atributo aparece na entidade
“Legislação”, especificada pelo atributo “Art. 19 da Lei n. 8.213/91”.
Na parte final da definição aparecem os termos “nexo causal” e “lesividade”. Estes
não foram incluídos no quadro de análise, por serem considerados repetitivos. “Nexo causal”
corresponde à relação de causa do acidente do trabalho e “lesividade” às lesões.
A classificação da tipologia de Dahlberg auxiliou na identificação das definições. Ao
se trabalhar com definições gerais, acredita-se que as ontologias de fundamentação tenham
sido uma escolha apropriada. Apesar do acidente do trabalho ser um evento, não se trabalhou
com eventos específicos e sim com uma visão geral.
Diante do apresentado até aqui e utilizando a proposta de Campos (2010), na qual a
autora sugere um padrão para enunciados definitórios que atendam as especificidades de cada
domínio, propõe-se, para fins de estudo nesta pesquisa, uma definição para acidente do
trabalho:
123
Acidente do trabalho: acidente sofrido pelos segurados empregados, trabalhadores
avulsos e segurados especiais no exercício do trabalho a serviço da empresa, que
cause lesão corporal ou perturbação funcional, capaz de gerar morte, a perda ou a
redução, permanente ou temporária, da capacidade laborativa, regulamentado por art.
19 da Lei n. 8.213/91. Classificados em acidente típico, acidente de trajeto e acidente
atípico, que cause doença profissional ou doença do trabalho.
Com base nesta definição, pôde-se elaborar um modelo unificado com as
características encontradas nas outras definições estudadas sobre acidente do trabalho.
QUADRO 5 - Análise da definição 5 sobre acidente do trabalho.
Definição 5
Classificação
da definição
(Dahlberg)
Conceitos
retirados
da
definição
Acidente do
trabalho
acidente
segurados
empregados
trabalhadores
avulsos
segurados
especiais
pelo exercício
do trabalho
a serviço da
empresa
lesão corporal
perturbação
funcional
morte
<Acidente do trabalho>: <acidente> <sofrido> pelos <segurados
empregados>, <trabalhadores avulsos> e <segurados especiais> <no
exercício do trabalho> <a serviço da empresa>, que <cause> <lesão
corporal> ou <perturbação funcional>, capaz de <gerar> <morte>, <perda>
ou a <redução>, <permanente> ou <temporária>, da <capacidade
laborativa>, <regulamentado> por <art. 19 da Lei n. 8.213/91>.
<Classificados> em <acidente típico>, <acidente de trajeto> e <acidente
atípico>, que <cause> <doença profissional> ou <doença do trabalho>. (O
Autor)
Definição genérica
Categoria
da UFO-B
Categoria
da DUL
Categoria
E-R
Evento
Evento
E
Evento
Evento
E
Objeto
E
Situação
Objeto /
Agente
Objeto /
Agente
Objeto /
Agente
Situação
E
Categoria superior a acidente do
trabalho
O objeto é quem sofre o acidente do
trabalho
O objeto é quem sofre o acidente do
trabalho
O objeto é quem sofre o acidente do
trabalho
Relaciona o participante ao evento
Situação
Situação
E
Relaciona o participante ao evento
Evento
Evento
Evento
Evento
E
E
Relação entre eventos
Relação entre eventos
Evento
Evento
E
Relação causal entre eventos: “lesão
Objeto
Objeto
E
E
Observação
124
redução da
capacidade
para o
trabalho
perda da
capacidade
para o
trabalho
Evento
Evento
E
Evento
Evento
E
art. 19 da Lei
n. 8.213/91
Objeto
Objeto /
Objeto
social
E
capacidade
laborativa
acidente típico
acidente
atípico
acidente de
trajeto
doença
profissional
doença do
trabalho
sofrido
Cause
gerar
regulamentado
classificados
corporal” e “morte”
Relação causal entre eventos:
“Perturbação funcional” e “redução
da capacidade para o trabalho”
Relação causal entre eventos:
“Perturbação funcional” e “perda da
capacidade para o trabalho”. Que
possui subcategorias: “Incapacidade
permanente da capacidade para o
trabalho” ou “Incapacidade
temporária da capacidade para o
trabalho”
Documento regulamenta o acidente
do trabalho
A
Atributo do trabalhador
Evento
Evento
Evento
Evento
E
E
Tipos de acidentes do trabalho
Tipos de acidentes do trabalho
Evento
Evento
E
Tipos de acidentes do trabalho
Evento
Evento
E
Sinônimo: ergopatia
Evento
Evento
E
Sinônimo: mesopatia
R
R
R
R
R
Relação associativa
Relação causal
Relação causal
Relação associativa
Relação gênero/espécie
Fonte: O autor.
FIGURA 33 - Proposta de diagrama ER da definição 5 sobre acidente do trabalho.
Fonte: O Autor.
125
Percebem-se algumas mudanças em relação aos outros modelos apresentados
anteriormente nesta seção. Realizou-se um ajuste terminológico nos termos “Redução da
capacidade para o trabalho”, “Perda da capacidade para o trabalho”, “Incapacidade temporária
da capacidade para o trabalho” e “Incapacidade permanente da capacidade para o trabalho”.
Nesses termos a expressão “para o trabalho”, foi substituída por “laborativa”. A alteração foi
para que a relação entre esta entidade e o atributo “Capacidade laborativa” dos trabalhadores
ficasse clara.
Já na definição 1 foi utilizado o termo “lesões mortais”, porém nas definições 3 e 4 foi
empregado o termo “morte”. Ambas, se referem às lesões que levaram a óbito. Seguindo a
mesma lógica do parágrafo anterior, optou-se pelo termo “morte”, por ser a mais encontrada
nas definições.
Nas figuras 30, 31 e 32, as características “temporário” e permanente”, eram atribuídas
à “Perturbação funcional”, formando as subcategorias “Perturbação funcional temporária” e
“Perturbação funcional permanente”. No entanto, esta questão de temporalidade, está ligada a
“Perda da capacidade laborativa”, efeito da “Perturbação funcional”. Em outras palavras, o
que é temporário é a “Perda da capacidade laborativa”, que leva ao empregado a interromper
suas atividades profissionais. De acordo com o Anuário Estatístico de acidente do Trabalho
(2012), a incapacidade temporária da capacidade laborativa é “a interrupção do exercício
laboral durante o período de tratamento psicofísico-social por ocasião do acidente do
trabalho” (ANUÁRIO..., 2013). E a incapacidade permanente da capacidade laborativa referese aos trabalhadores “que ficaram permanentemente incapacitados para o exercício laboral”
(ANUÁRIO..., 2013). Assim sendo, “Incapacidade permanente da capacidade laborativa” e
“Incapacidade temporária da capacidade laborativa” foram atribuídas à “Perda da capacidade
laborativa”, e não à “Perturbação funcional”.
Cabe esclarecer que desde o primeiro modelo aqui apresentado, os verbos utilizados
para representar as relações foram alterados por outros com maior simplicidade ou com o
objetivo de uniformizar os tipos de relações.
QUADRO 6 - Relações utilizadas nas representações.
Relações utilizadas nas
representações
Regulamentado_por; Sofre;
Ocorrem_no_contexto
Causa;
Relação associativa
É_um; Do_tipo
Relação gênero/espécie
Fonte: O autor.
Tipo de relação
Relação causal
Relações encontradas nas
definições e substituídas
Regulamentado; Sofrido; Ocorrem
Causem; Provocando; Cause;
Acarreta; Gera.
É; Classificados
126
Mesmo com um modelo conceitual sobre acidente do trabalho proposto, sentiu-se falta
da inclusão de outros elementos, não apresentados nas definições estudadas. No âmbito na
Previdência Social, o acidente do trabalho é utilizado para provimento de benefícios aos
trabalhadores acidentados. Esta relação ficou clara, quando se observou outros modelos de
representação sobre acidentes do trabalho na seção 5 desta pesquisa. A relação entre acidente
do trabalho e Previdência ficou clara tanto no tesauro, quanto na taxonomia da OIT. Por esta
razão, buscou-se as entidades complementares para a elaboração do modelo proposto.
6.2 MODELO CONCEITUAL SOBRE ACIDENTE DO TRABALHO ASSOCIADO AOS
DADOS DA PREVIDÊNCIA SOCIAL
Conforme observado, o modelo elaborado cobre a área de acidente do trabalho.
Entretanto, o acidente do trabalho e seus efeitos para o trabalhador e a documentação
produzida com o evento implicam diretamente no fazer da Previdência Social, principalmente
no que tange a questão da assistência social.
Alguns benefícios e atividades concedidos pela Previdência Social provêm justamente
da ocorrência de acidentes do trabalho. A importância do acidente do trabalho para a
Previdência Social é comprovada pelas publicações exclusivas que são produzidas por este
Ministério governamental: o Anuário Estatístico de Acidentes do Trabalho (AEAT) e um
capítulo dedicado ao acidente do trabalho no Anuário Estatístico da Previdência Social
(AEPS).
Cabe interligar o modelo proposto sobre acidente do trabalho, mostrado anteriormente,
aos dados da Previdência Social já publicados e outros que se pretende publicar.
Ao analisar os dados publicados se percebe que, o Ministério da Previdência Social ao
mesmo tempo em que se preocupa em tornar esses dados públicos, também não se esquece de
preservar aspectos legais envolvendo privacidade e confidencialidade de determinadas
informações. Por esta razão, os dados são os mais gerais possíveis para a não identificação
individual dos envolvidos nos eventos. Por exemplo, para os trabalhadores que sofreram os
acidentes são classificados por sexo e não por algum número de cadastro que o identifique.
Percebe-se que os dados publicados no portal dados.gov.br, coletados do Anuário
estatístico sobre acidente do trabalho, e também na edição impressa do Anuário estatístico da
Previdência Social, são organizados de forma a possibilitar quantificação dos acidentes do
trabalho ocorridos no Brasil, contabilizados anualmente e associados a códigos que agregam
valores a estes dados publicados, como: Classificação Internacional de Doenças (CID);
127
Classificação Brasileira de Ocupações (CBO) e Classificação Nacional de atividades
Econômicas (CNAE). Também são mensurados os benefícios concedidos, separados por tipo,
como data e localização identificadas.
Desta forma, coletaram-se os termos do Anuário estatístico de acidente do trabalho
(2012) e Anuário estatístico da Previdência Social (2011), os termos que associassem os
dados publicados ao acidente do trabalho. Os tempos selecionados estão descritos no quadro
abaixo:
QUADRO 7 - Termos sobre acidente do trabalho aliados aos dados da Previdência Social.
Fontes
Conceitos
Acidente do
trabalho com
Cat
Acidente do
trabalho sem
CAT
Ano
Aposentadoria
por invalidez
Assistência
médica
Auxílio
doença por
acidente do
trabalho
Auxílioacidente por
acidente do
trabalho
CBO
Anuário estatístico de acidente do trabalho (2013)
Anuário estatístico da Previdência Social (2011)
Categoria Categoria Categoria Observação
da UFO-B da DUL
E-R
Objeto
Objeto /
E
Acidente registrado (documento)
Objeto
social
Objeto
Objeto /
E
Acidente não registrado
Objeto
social
Intervalo
A
Atributo da entidade “Acidente do
temporal
trabalho”. Ano que ocorreu o
acidente do trabalho
Objeto
Objeto /
E
Benefício concedido ao trabalhador
Objeto
em caso de comprovação de perda
social
permanente da capacidade laborativa
Objeto
Objeto /
E
Benefício concedido ao trabalhador
Objeto
em caso de lesão corporal
social
Objeto
Objeto /
E
Benefício concedido ao trabalhador
Objeto
em caso de interrupção por mais de
social
15 dias das atividades do trabalho em
função da perda da capacidade
laborativa
Objeto
Objeto /
E
Benefício concedido ao trabalhador
Objeto
em caso de redução da capacidade do
social
trabalho
A
CID
A
CNAE
A
Incapacidade
permanente
parcial
Evento
Evento
E
Atributo que identifica a ocupação
do trabalhador
Atributo dos acidentes, que identifica
a doença/lesão causada
Atributo que identifica a atividade
econômica do empregador
Sequela definitiva que implique em
redução da capacidade laboral do
trabalhador
128
Incapacidade
permanente
total
Incapacidade
temporária por
mais de 15
dias
Incapacidade
temporária por
menos de 15
dias
Mês
Evento
Evento
E
Evento
Evento
E
Evento
Evento
E
Interrupção por até 15 dias das
atividades do trabalho em função da
perda da capacidade laborativa
A
Atributo da entidade “Acidente do
trabalho”. Mês que ocorreu o
acidente do trabalho
Atributo da entidade “Acidente do
trabalho”. Cidade em que ocorreu o
acidente do trabalho
Atributo dos acidentes, que identifica
a parte do corpo do trabalhador
lesionado em função do acidente
Benefício concedido ao dependente
do trabalhador em caso de sua morte
Intervalo
temporal
Município
Lugar
Parte do corpo
atingida
Pensão por
morte
Região
geográfica
A
A
Objeto
Objeto /
Objeto
social
Lugar
Sexo
E
A
A
UF
Lugar
A
Incapacidade permanente e total para
o exercício de qualquer atividade
laborativa
Interrupção por mais de 15 dias das
atividades do trabalho em função da
perda da capacidade laborativa
Atributo da entidade “Acidente do
trabalho”. Região geográfica
brasileira na qual ocorreu o acidente
do trabalho
Atributo que identifica o sexo do
trabalhador
Atributo da entidade “Acidente do
trabalho”. Estado brasileiro no qual
ocorreu o acidente do trabalho
Fonte: O autor.
Na figura 34, pode ser observado o mesmo modelo realizado na subseção anterior,
acrescido de atributos e de outras entidades e relações presentes nos dados da Previdência
Social, publicados pela Dataprev, e também presentes na seção IV do Anuário estatístico da
Previdência Social, sobre acidente do trabalho.
129
FIGURA 34 - Proposta de diagrama ER sobre acidente do trabalho aliados aos dados da Previdência Social
Fonte: O Autor.
Tanto no Anuário estatístico de acidente do trabalho, quanto no Anuário estatístico da
Previdência Social, os dados, em sua maioria, são classificados principalmente por duas
características, tempo e local. O tempo é subdividido em mês e ano, já o espaço em
município, Unidades Federativas do Brasil (UF) e regiões geográficas do Brasil. Assim, a
entidade “Acidente do trabalho” recebeu os atributos de mês, ano, município, UF e região
geográfica.
Para a Previdência Social é de imensa importância a Comunicação de Acidentes do
Trabalho (CAT) ao Instituto Nacional de Seguro Social (INSS). De acordo com o art. 22 da
Lei n. 8.213/91, é obrigação legal da empresa comunicar ao INSS a ocorrência de acidente do
trabalho. No entanto alguns acidentes não são cadastrados no INSS, gerando o indicador
Acidentes do trabalho sem CAT. Por esta razão foi acrescida à entidade “Acidente do
trabalho” a relação de “registrado”, associada às entidades “Acidente do trabalho com CAT” e
“Acidente do trabalho sem CAT”.
As entidades “a serviço da empresa” e “no exercício do trabalho” tratam sobre o
contexto em que o trabalhador este envolvido para que se caracterize um acidente do trabalho.
130
É neste contexto que o empregador (empresa) aparece. Conhecer o ramo econômico em que a
empresa se classifica, facilita conhecer quais áreas são mais sujeitas a acidentes do trabalho.
Assim, a “CNAE” aparece como atributo das entidades em questão.
Nas entidades dos tipos de trabalhadores que sofreram algum tipo de acidente, a saber:
“Segurado especial”; “Segurado empregado”; e “Trabalhador avulso” foram incluídos os
atributos “sexo” e “CBO”. A Previdência Social distingue os trabalhadores apenas por sexo,
para que não acha possibilidade de sua identificação. A CBO identifica as ocupações dos
trabalhadores e é utilizada para agrupar e/ou mostrar as ocupações mais perigosas, que
necessitam de um cuidado específico.
Os atributos “CID” e “parte do corpo atingida” são aplicados aos tipos de acidentes do
trabalho: “acidente do trabalho típico”, “Acidente do trabalho de trajeto” e “Acidente do
trabalho atípico”, neste último, foram atribuídos aos seus efeitos, que são as doenças:
“Doença profissional” e “Doença do trabalho”. O “CID” e “parte do corpo atingida” são
utilizados para qualificar o acidente ou seu efeito, no caso do acidente atípico. São estes
atributos que possibilitarão associar o acidente a alguma doença ou sequela psicofísico-social.
Cabe esclarecer que “Doença do trabalho” se refere diretamente ao ambiente laboral, ou seja,
aos riscos ambientais que o trabalhador é exposto e o nexo causal não é presumido. Já a
“Doença profissional” é resultante da execução das tarefas ou atividades profissionais, os
trabalhadores que exercem atividades rotineiras e repetitivas são candidatos a desenvolverem
algum tipo de lesão. Neste caso, o nexo causal é presumido. (HORVATH JÚNIOR, 2009, p.
73).
A entidade “Morte” foi ligada ao benefício “Pensão por morte”, como seu efeito. E a
entidade “Redução da capacidade laborativa” recebeu a ligação com a entidade “Auxílioacidente do trabalho”, que é outro benefício decorrente de tal consequência da lesão. A
“Redução da capacidade laborativa” é a diminuição da capacidade laborativa decorrente das
sequelas irreversíveis, mesmo estando a vítima capacitada para exercer alguma atividade
laboral.
A entidade “Perda da capacidade laborativa” foi a que apresentou maior quantidade de
entidades relacionadas à Previdência Social. A entidade “Perda da capacidade do trabalho”
pode ser classificada em “Incapacidade temporária da capacidade laborativa” e “Incapacidade
permanente da capacidade laborativa”. A entidade “Incapacidade temporária da capacidade
laborativa” pode ser dividida em “Incapacidade temporária por menos de 15 dias” ou
“Incapacidade temporária por mais de 15 dias”, que é relacionado ao “Auxílio doença por
acidente do trabalho”. Após um período de tratamento, se o trabalhador for diagnosticado com
131
alguma doença ou seqüela que implique na perda total e permanente de sua capacidade
laborativa, este trabalhador é aposentado por invalidez.
Já a entidade “Incapacidade permanente da capacidade laborativa” pode ser
classificada em “Incapacidade permanente parcial” e “Incapacidade permanente total”, esta
última tem como efeito o benefício da “Aposentadoria por invalidez”.
Por fim, apresenta-se um modelo E-R sobre acidente do trabalho associado aos dados
publicados pela Previdência Social. Espera-se que este modelo possa ser utilizado para
atribuir semântica aos dados publicados, de forma a contribuir para sua recuperação e,
principalmente, seu reuso.
132
7 ELABORAÇÃO E REUSO DE VOCABULÁRIOS: A QUESTÃO SOBRE
ACIDENTE DO TRABALHO
Ao selecionar os dados a serem representados em RDF, verificou-se que, a partir do
modelo proposto, seria necessária a elaboração de um vocabulário específico para descrever
os conceitos sobre acidentes do trabalho como forma de enriquecer a representação dos dados
da Previdência em RDF. Fato este justificado na seção 5, na qual foram analisados
instrumentos de representação da informação que abordassem a área de acidente do trabalho,
não encontrando nenhum instrumento que pudesse ser reutilizado.
Desta forma, baseados no modelo conceitual proposto na seção anterior e apresentado
com base no Europeana Data Model (EDM), será proposto um vocabulário sobre acidente do
trabalho, buscando sempre que possível a reutilização de outros vocabulários para descrição
dos dados.
Dentre muitos vocabulários existentes, o EDM vem sendo utilizado tanto para
descrição de dados na Web, quanto como referência para elaboração de novos vocabulários.
A Europeana oferece acesso a conteúdos digitais provenientes de bibliotecas, museus,
arquivos e coleções áudio-visuais de toda a Europa. (FREIRE; CHARLES; CHAMBERS,
2012, p. 1).
De acordo com esses autores, o Europeana Data Model consiste numa
infraestrutura aberta para representação de dados, que se baseia na web semântica, e que
permite representar as necessidades de informação dos vários domínios das organizações. No
documento Definition of the Europeana Data Model elements (2012) é definido que a EDM é
a especificação formal das classes e propriedades que poderiam ser utilizados na Europeana.
7.1 SELEÇÃO DOS DADOS PUBLICADOS PELA DATAPREV
Conforme mostrado na introdução deste trabalho, a Dataprev publicou uma primeira
parte dos dados sobre acidentes do trabalho. Foram selecionados dados estatísticos
provenientes do Anuário Estatístico de Acidentes do Trabalho. Esta publicação ficou restrita
aos dados da Seção I subseção D do referido Anuário, conteúdo que trata de Comunicação de
Acidente de Trabalho (CAT), suas consequências, por localização geográfica das ocorrências
(município) e seus respectivos quantitativos.
Assim, foram descritos os seguintes dados:
133
1. Ano de ocorrência do acidente do trabalho;
2. Dados sobre o município, onde o acidente do trabalho ocorreu. Estes dados incluem as
seguintes informações:
I. Código da cidade, fornecido pelo IBGE;
II. Nome do Município;
III. Unidade da Federação, a qual pertence o município.
3. Quantidades de acidentes. Divididos por tipo, causas e registro:
I. Acidente do Trabalho do tipo Típico;
II. Acidente do Trabalho do tipo Trajeto;
III. Acidente do Trabalho causou Doença do Trabalho;
IV. Acidente do Trabalho causou Morte;
V. Acidente do Trabalho registrado sem CAT.
As informações sobre os acidentes do trabalho típico, de trajeto, que causaram doença
do trabalho ou morte foram o conjunto de dados sobre acidentes do trabalho com
Comunicação de Acidente do Trabalho (CAT). Estes dados são importantes para a
Previdência Social brasileira, pois são neles que surge a origem dos benefícios de natureza
acidentária concedidos pelo INSS.
Buscaram-se os dados acima descritos no diagrama ER proposto na figura 34.
Todavia, como o modelo proposto pretende atender a um conjunto de dados maiores, ele
apresenta classes e subclasses, além de relações não necessárias, neste momento, para
descrição dos dados propostos a serem descritos em RDF.
Diante deste fato, decidiu-se por recortar o modelo da figura 34, sintetizando sua
representação. Abaixo, na figura 35, pode-se observar como ficou o diagrama ER apenas dos
dados já publicados pela Dataprev.
134
FIGURA 35 - Proposta de diagrama ER dos dados publicados pela Dataprev51.
Fonte: O Autor.
Os dados são disponibilizados nos formatos XML, JSON ou CSV. Decidiu-se
trabalhar com o formato XML, por ser o recomendado pela W3C para ser utilizado junto ao
RDF no aperfeiçoamento de tecnologias da Web Semântica.
FIGURA 36 - XML de acidentes do trabalho ocorridos na cidade do Rio de Janeiro.
<acidentes_de_trabalho>
<registro>
<municipio cod_ibge="330000" uf="RJ">RIO DE JANEIRO</municipio>
<quantidade>
<sem_cat>9</sem_cat>
<com_cat>
<tipicos>17</tipicos>
<trajeto>17</trajeto>
<doenca>0</doenca>
</com_cat>
<obitos>0</obitos>
</quantidade>
</registro>
</acidentes_de_trabalho>
Fonte: Dataprev (2012)
Conforme observado na figura 36, foram selecionados os dados referentes a acidente
do trabalho ocorridas no ano de 2009, último ano disponibilizado. Dentre os dados estatísticos
de todas as cidades, optou-se pelos dados de apenas uma cidade, já que o processo seria o
mesmo para todas. A cidade escolhida foi o Rio de Janeiro.
51
Para fim de aplicação do modelo, foi inserido a cardinalidade apenas no diagrama da figura 35.
135
7.2 ELABORAÇÃO DO VOCABULÁRIO SOBRE ACIDENTE DO TRABALHO
Seguindo o diagrama ER (figura 35), foram criados esquemas para que os dados
preservem e demonstrem a semântica original das informações contidas. Buscou-se construir
um vocabulário a ser usado para dar significado às triplas RFD para publicação de dados
governamentais abertos, utilizando os moldes dos vocabulários encontrados no portal do no
Linked Open Vocabularies (LOV)52.
A partir das classes definidas, realizou-se uma pesquisa no LOV, com o objetivo de
verificar se haveria alguma classe, já existente em ontologias (vocabulários), que
representassem as classes sobre acidente do trabalho. Tal ação visava fazer o reuso de alguns
vocabulários, já existentes e consolidados, para a interligação dos dados, atendendo um dos
princípios do Linked Data. Além de fornecer um formalismo semântico maior a proposta aqui
apresentada. Entretanto, o resultado foi negativo, não encontrando nenhuma classe capaz de
atender aos significados no domínio aqui estudado.
Utilizando o modelo do EDM foi criado um quadro com as informações para
elaboração de um vocabulário a ser utilizado neste trabalho.
Antevendo, como todo vocabulário precisa possuir um URI para suas classes, além da
necessidade de descrição destas classes em RDF, foi criado um URI fictício, utilizado apenas
para exemplificação neste trabalho. Para sua elaboração foi gerado um recurso eletrônico
(“http://example.org/”) e após a barra deste endereço a classe a ser descrita. Foi dado o
prefixo “acitra” para representar o namespace do Vocabulário de Acidente do Trabalho,
também em caráter de experimentação.
Cabe lembrar, que se trata de um recorte do modelo principal proposto. Por essa razão,
apenas alguns elementos serão descritos no vocabulário neste momento. Para uma
organização que facilite o entendimento, o vocabulário será dividido em classes; propriedades
e atributos.
52
Disponível em: <http://lov.okfn.org/dataset/lov/>. Acesso em: 6 jul. 2014. LOV foi criado para ser um
compilador de ontologias (vocabulários). Seu objetivo é fornecer acesso a diversos vocabulários, tornando
explícitas as representações entre as entidades (objetos). Fornecendo, ainda, métricas sobre como os
vocabulários são usados na nuvem de Linked data, ajudando a melhorar a sua compreensão, visibilidade e
reusabilidade. (VANDENBUSSCHE, [2014?]).
136
QUADRO 8 - Classe do objeto.
Classe
acitra:acidenteTrabalho53
Namespace
Acitra
URI
http://example.org/acidenteTrabalho
Label
acidenteTrabalho
Definição
Acidente que ocorre pelo exercício do trabalho a serviço da empresa ou pelo
exercício do trabalho dos segurados especiais, provocando lesão corporal ou
perturbação
Classe
acitra:acidenteTrabalhoTípico
Namespace
Acitra
URI
http://example.org/acidenteTrabalhoTípico
Label
acidenteTrabalhoTípico
Definição
Acidente decorrente da característica da atividade profissional de risco
desempenhada pelo acidentado
Classe
acitra:acidenteTrabalhoTrajeto
Namespace
Acitra
URI
http://example.org/acidenteTrabalhoTrajeto
Label
acidenteTrabalhoTrajeto
Definição
Acidente que cause a morte ou produza lesões corporais e ocorra no percurso
direto entre o lugar de trabalho e a residência, o lugar no que o trabalhador
geralmente almoça ou recebe sua remuneração
Classe
acitra:doençaTrabalho
Namespace
Acitra
URI
http://example.org/doençaTrabalho
Label
doençaTrabalho
Definição
Doença relacionada diretamente ao ambiente laboral, ou seja, aos riscos
ambientais ao que o trabalhador é exposto
Classe
acitra:morte
Namespace
Acitra
URI
http://example.org/morte
Label
Morte
53
Para construção nos nomes das classes foram retiradas as preposições entre os substantivos. Permaneceram
apenas as que acarretassem alteração de sentido entre as classes, como no exemplo:
“acidenteTrabalhoComCAT” e “acidenteTrabalhoSemCAT”.
137
Definição
Corresponde a quantidade de segurados que faleceram em função do acidente
do trabalho.
Classe
acitra:acidenteTrabalhoSemCAT
Namespace
Acitra
URI
http://example.org/acidenteTrabalhoSemCAT
Label
acidenteTrabalhoSemCAT
Definição
Acidente cuja Comunicação de Acidentes do Trabalho (CAT) não foi
cadastrada no INSS.
Classe
acitra:acidenteTrabalhoComCAT
Namespace
Acitra
URI
http://example.org/acidenteTrabalhoComCAT
Label
acidenteTrabalhoComCAT
Definição
Acidente cuja Comunicação de Acidentes do Trabalho (CAT) foi cadastrada
no INSS.
Fonte: O Autor.
Um segundo passo, foi buscar, também no LOV, ontologias ou vocabulários capazes
de representar as relações mostradas no diagrama ER (figura 35). Pesquisou-se por
propriedades do objeto (owl:ObjectProperty) com significados iguais ao que se propunha no
modelo ER.
Foram encontrados resultados satisfatórios, que evitou a criação ou utilização de
propriedades do objeto ficcionais. Assim, os termos utilizados para representarem as relações
foram substituídos por termos de vocabulários já existentes. O termo “Do_Tipo” foi
substituído pelo termo “Type”, do vocabulário Dublin Core. Já o termo “Causa” foi
substituído pelo termo “Cause”, Schema.Org. E, o termo “hasDocumentation”, do
vocabulário Poder Vocabulary substituiu o termo “Registrado”. Desta forma, abaixo são
descritas as propriedades do objeto.
QUADRO 9 - Propriedades do objeto.
Propriedade
dc:type
Namespace
dc/elements
URI
http://purl.org/dc/elements/1.1/type
Label
Type
138
Definição
Termos que descrevem categorias gerais, funções, gêneros ou níveis de
agregação de conteúdo54.
Propriedade
dc:cause
Namespace
schema.org
URI
http://schema.org/cause
Label
Cause
Definição
Uma causa subjacente. Mais especificamente, um dos agente(s) é
responsável pelo processo fisiopatológico que, eventualmente, resulta na
ocorrência55.
Propriedade
poder:hasDocumentation
Namespace
Poder
URI
http://dev.poderopedia.com/vocb/hasDocumentation
Label
hasDocumentation
Definição
Associa um agente com a documentação relacionada56.
Fonte: O Autor
Os últimos elementos do diagrama ER (figura 35) a serem descrito no vocabulário são
os atributos. No caso apresentado, a única classe a apresentar atributos é a classe “Acidente do
trabalho”. Assim como ocorreu com as propriedades do objeto, sendo pesquisado no LOV os
“Objectdata”, que correspondessem aos atributos selecionados nesta pesquisa. Assim,
também foram encontrados vocabulários possíveis de serem reutilizados, não sendo
necessária a sua criação.
O atributo “ano” foi substituído pelo atributo “Date”, do vocabulário Dublin Core. O
“Município” foi substituído por “City”, do vocabulário Place, e deste mesmo vocabulário,
“State” substituiu “UF”. A seguir, pode se verificar estes atributos e sua descrição.
QUADRO 10 - Atributos.
Elemento
dc:date
Namespace
dc/elements
URI
http://purl.org/dc/elements/1.1/date
54
Pertence ao vocabulário DC – Dublin Core Metadata Set. Seus elementos são amplos e genéricos, utilizáveis
para descrever uma ampla gama de recursos. (DUBLIN CORE METADATA INITIATIVE, 2012)
55
Proveniente do vocabulário Schema.org, utilizado nos motores de busca do alguns motores de busca na Web:
Bing, Google, Yahoo! e Yandex, que dependem de marcação schema.org para melhorar a exibição de resultados
de pesquisa. (SCHEMA.ORG, [2014?]).
56
Retirado do Poder Vocabulary, que é um vocabulário utilizado para expressar informações acerca de pessoas
e suas relações com organizações e empresas. (PODER, [2014?]).
139
Label
Date
Definição
Representa o ano em que ocorreu o acidente do trabalho.
Domínio
acitra:acidenteTrabalho
Range
xsd57:datetime
Elemento
places:City
Namespace
Places
URI
http://purl.org/ontology/places#City
Label
City
Definição
Domínio
Representa o município (cidade brasileira) na qual ocorreu o acidente do
trabalho.
acitra:acidenteTrabalho
Range
name:nome58.
Elemento
places:State
Namespace
Places
URI
http://purl.org/ontology/places#State
Label
State
Definição
Domínio
Representa a Unidade Federativa (Estado brasileiro) na qual ocorreu o
acidente do trabalho.
acitra:acidenteTrabalho
Range
name:uf
Fonte: O Autor
Assim sendo, consegue-se mostrar, com os exemplos acima, que é possível se chegar a
um vocabulário partindo de um modelo conceitual. Espera-se, no futuro, transformar todo o
modelo conceitual proposto em um vocabulário consistente e formalizado de forma a
conseguir sua publicação, visando sua reutilização.
8 DESCRIÇÃO DOS DADOS SOBRE ACIDENTE DO TRABALHO EM RDF
57
XSD (XML Schema Definition) é um arquivo que contém definições na linguagem XML Schema e é utilizado
para descreve a estrutura de um documento XML. As declarações de atributos podem ser de variadas formas, as
principais são: “name”: especifica o nome do atributo; “type”: especifica o tipo de dados do atributo; e “use”:
especifica a utilização do atributo (requerido, opcional ou proibido). (SPERBERG-MCQUEEN; THOMPSON,
2010).
58
Retirado de Places Ontology, vocabulário para descrever os locais de interesse geográfico. (PLACES...,
[2014?].
140
O objetivo desta seção é conseguir utilizar o diagrama E-R proposto para descrição
dos dados sobre acidentes do trabalho, no âmbito da Previdência Social brasileira, publicados
pela Dataprev.
Para tal tarefa, foram selecionados os dados já publicados em XML, visto na seção
7.1, e o vocabulário elaborado a partir do modelo conceitual proposto, exposto na seção 7.2.
Com a definição das classes, das relações (propriedades do objeto) e dos atributos
(propriedade de dados), buscou-se a partir do diagrama ER (figura 35) estabelecer statements,
que são “uma espécie de declaração de um recurso contendo um nome, uma propriedade e um
valor agregado a ela” (NOLETO; BRITO, 2003, p. 114), formando a tripla RDF (sujeito,
predicado e objeto), conseguindo representar a interligação entre o recurso, suas propriedades
e seus valores.
Apesar de se perceber algumas semelhanças entre o modelo ER e o RDF, a relação
entre eles não é fácil, quando se pretende migrar de um modelo para o outro. Chen (2002) e
Berners-Lee (1998) apontam semelhanças e diferenças, porém não apresentam uma
metodologia para que os dois modelos possam trabalhar de forma cooperativa.
Berners-Lee (1998) se perguntou se o modelo RDF seria um modelo de entidaderelacionamento. Este autor responde que sim e que não. A resposta é sim, pois o RDF serve
como base para a modelagem ER, mas, a resposta também é não, porque o RDF é usado para
outras finalidades, tornando-se mais geral que o modelo ER.
O RDF é um modelo de entidades e relações (nós). Berners-Lee (1998) explica que o
modelo RDF é basicamente uma abertura do modelo ER para se trabalhar na Web. Para este
autor, o modelo ER envolve entidades, e para cada entidade, há um conjunto de relações e o
modelo RDF é o mesmo pensamento. A exceção fica a cargo dos relacionamentos que são
identificados, no RDF, por um URI. Para o autor citado, muitos conceitos envolvidos na
modelagem ER estão diretamente direcionados ao modelo de Web Semântica.
Buscou-se na literatura da área da Ciência da Computação experiências na associação
do modelo ER e RDF para descrição de dados. Foram encontrados trabalhos, como dos
autores Teorey, Yang e Fry (1986) e Borgida, Casanova e Laender (2009), que trabalham com
tabelas para representar o modelo ER, com o objetivo de preservar a capacidade de capturar e
distinguir todos os estados válidos do diagrama conceitual. Para estes autores, as tabelas
funcionariam como pequenos bancos de dados lógicos, capazes de transformar ou mapear um
diagrama (ou esquema) conceitual do domínio da aplicação em um esquema de modelo de
dados lógicos. Diante do exposto, “o uso de um esquema conceitual, em particular os
141
diagramas de Entidade Relacionamento, como um passo preliminar para projeto de banco de
dados lógico”. (BORGIDA, CASANOVA E LAENDER, 2009, p. 1646).
Essa metodologia de representar o diagrama conceitual em tabelas, para se obter um
esquema lógico de dados, poderia ser empregada para descrição de elementos RDF? Os
pesquisadores Xu, Lee e Kim (2010) utilizam o diagrama ER para armazenar dados RDF em
tabelas relacionais distintas. Os autores acreditam que com essa abordagem facilitaria a
pesquisa e a atualização de quaisquer recursos em bases relacionais.
Nesse mesmo artigo, Xu, Lee e Kim (2010) buscam descrever RDFS em um diagrama
ER. Segundo os autores, o esquema de RDFS pode ser descrito por um diagrama ER, pois o
diagrama apresenta relações de dados RDF usando dados de próprio esquema.
Para alcançar este objetivo, os referidos autores converteram todas as classes de
entidades e as propriedades das relações entre duas entidades para RDF/RDFS. Isto foi
possível, pois criaram tabelas para os esquemas: uma tabela para armazenar as entidades
(tabela de Classes) e os relacionamentos (tabela de propriedades do objeto).
Rambayon (2012) ao avaliar os resultados de Xu, Lee e Kim (2010), afirma que o
conhecimento trazido, pela experiência dos autores, prova o poder da modelagem ER e sua
eficácia em modelagem bancos de dados. E que a correlação entidade-relacionamento e RDF
aumenta a eficiência para a recuperação de informações. E conclui que, um diagrama ER,
como o exibido por Xu, Lee e Kim (2010), não precisa ser utilizado apenas para o projeto
conceitual, mas também para transformar elementos existentes de um banco de dados.
Neste estudo, acredita-se que a mesma metodologia utilizada por Xu, Lee e Kim
(2010), pode ser aplicada para ter resultados inversos, ou seja, a partir de um diagrama ER se
chegar a descrições em RDF.
Vale lembrar que, “o objetivo da modelagem conceitual é obter uma descrição
abstrata, independente de implementação em computador, dos dados que serão armazenados
no banco de dados”. (HEUSSER,1998, p. 11). Desta maneira, deve-se deixar claro que este
trabalho está na fase de abstração, ou seja, certos detalhes são deliberadamente omitidos do
modelo. E a escolha dos detalhes/características para omitir é feita considerando-se tanto a
aplicação pretendida da abstração e também seus usuários (SMITH; SMITH, 1977, p. 105).
No caso específico deste estudo, a abstração também se deve ao fato da representação dos
dados sobre acidentes do trabalho ser uma experiência, na qual se verificará uma
possibilidade de modelagem e aplicação do modelo nos dados.
Buscou-se nas entidades e relacionamentos estudados no decorrer do trabalho, para a
criação das sentenças ou triplas RDF, conforme quadro 20.
142
QUADRO 11 - Triplas de RDF propostas com base no diagrama ER
Sujeito
Acidente do trabalho
Acidente do trabalho
Acidente do trabalho
Acidente do trabalho
Acidente do trabalho
Acidente do trabalho
Predicado
Do_tipo
Do_tipo
Causa
Causa
Registrado
Registrado
Objeto
Acidente do trabalho típico
Acidente do trabalho de trajeto
Doença do trabalho
Morte
Acidente do trabalho sem CAT
Acidente do trabalho com CAT
Fonte: O Autor.
A Web Semântica se diferencia da web tradicional por se preocupar mais com seus
endereços, ou seja, tornando seus endereços permanentes, utilizando para tal tarefa os URIs.
Como lembra Noleto e Brito (2003, p. 114) “todos os recursos devem estar nomeados e
identificados por um URI”, isto permite a identificação dos recursos. Por esta razão, será
repetida a quadro 20, mostrado acima, substituindo os termos por seus respectivos URIs (vide
vocabulário proposto na seção anterior).
QUADRO 12 - Triplas de RDF propostas utilizando URIs.
Sujeito
Predicado
Objeto
http://example.org/acidenteTrabalho
http://purl.org/dc/elements/1.1/type
http://example.org/acidenteTrabalhoTípico
http://example.org/acidenteTrabalho
http://example.org/acidenteTrabalho
http://example.org/acidenteTrabalho
http://example.org/acidenteTrabalho
http://example.org/acidenteTrabalho
http://purl.org/dc/elements/1.1/type
http://schema.org/cause
http://schema.org/cause
http://dev.poderopedia.com/vocb/hasDocumentation
http://dev.poderopedia.com/vocb/hasDocumentation
http://example.org/acidenteTrabalhoTrajeto
http://example.org/doençaTrabalho
http://example.org/morte
http://example.org/acidenteTrabalhoSem CAT
http://example.org/acidenteTrabalhoComCAT
Fonte: O Autor.
Apesar da tabela 12 mostrar como ficariam as sentenças (statements) RDF, para se
construir e disponibilizar os dados sobre acidentes do trabalho em RDF, faz-se necessário que
estes estejam em forma textual. Seguindo as recomendações do W3C (2009), o RDF será
expresso textualmente na linguagem RDF/XML, que possibilita a descrição do RDF em
formato XML.
143
FIGURA 37 - Representação dos dados selecionados em RDF59
<?xml version="1.0"?>
< rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns"
xmlns:acid=“http://example.org/“
xmlns:dc="http://purl.org/dc/elements/1.1“
xmlns:vocb="http://dev.poderopedia.com/vocab/schema"
xmlns:schema=" schema.org"
xmlns:place=" http://purl.org/ontology/places#">
<RDF:DescriptionRdf:about="http://example.org/acidenteTrabalho">
<dc:date>2009</dc:date>
<place:city>330000 “Rio de Janeiro”</place:city>
<place:state>RJ</place:state>
<acid:acidenteTrabalhoSemCAT>9</acid:/acidenteTrabalhoSemCAT>
<acid:acidenteTrabalhoComCAT>34</acid:/acidenteTrabalhoComCAT>
<acid:acidenteTrabalhoTípico>17</acid:acidenteTrabalhoTípico>
<acid:acidenteTrabalhoTrajeto>17</acid:acidenteTrabalhoTrajeto>
<acid:doençaTrabalho>0</acid:doençaTrabalho>
<acid:morte>0</acid:morte>
</rdf:Description>
</rdf:RDF>
<?Xml Version=“1.0 ”?>
Fonte: O autor.
Conseguindo-se aplicar as triplas RDF geradas à faixa dos dados sobre acidentes do
trabalho, publicados pela Dataprev, torna-se mais fácil a representação de todo o conjunto de
dados também em RDF. Basta se desenvolver uma tabela das triplas e armazená-las no banco
de dados relacional, onde os dados sobre acidente do trabalho estão disponibilizados.
Conclui-se que, se os dados são ofertados nos formatos XML, JSON ou CSV, eles
também poderão ser disponibilizados em RDF, obtendo um nível semântico não permitido
pelos outros formatos atualmente utilizados.
59
RDF validado pelo W3C RDF validation service. Disponível em: <http://www.w3.org/RDF/Validator/>.
Acesso em: 28 abr. 2014.
144
9 CONSIDERAÇÕES FINAIS E EXPECTATIVAS
Recentemente, no dia 23 de abril de 2014, o Senado Federal brasileiro aprovou a Lei
n. 12.965, sancionada pela presidente Dilma Rousseff. Essa Lei, popularmente conhecida com
Marco Civil da Internet, é a lei que regula o uso da Internet no Brasil. A Lei que entrará em
vigor no final do mês de junho de 2014, trata de temas como neutralidade, privacidade,
retenção de dados, impondo direitos e obrigações de responsabilidade civil aos usuários e
provedores.
Nota-se então, a preocupação e interferência direta do Governo na gestão dos dados,
serviços e ações ocorridas no ambiente virtual. Almejando, na proposta da Lei n. 12.965,
desenvolver mecanismos de governança multiparticipativa, transparente, colaborativa,
buscando a participação de setores sociais: empresas, sociedade civil e comunidade
acadêmica.
Diante do mencionado, estudos sobre publicação de dados governamentais abertos,
como o apresentado nesta dissertação, podem contribuir para que os serviços oferecidos pelo
Governo sejam aproveitados de forma integrada, visando agilizar processos e estabelecer uma
comunicação eficaz entre os diversos setores da sociedade.
O presente estudo se propôs a oferecer uma pequena contribuição para que o Governo
Eletrônico, em destaque o portal dados.gov.br, tenha uma alternativa para publicação de
dados governamentais abertos, neste caso dados da Previdência Social. Com vista, a colaborar
para a publicidade e disseminação de dados e informações públicos, de forma aberta e
estruturada. Para que no futuro, a sociedade possa reutilizar esses dados, utilizando
tecnologias, padrões e formatos abertos e livres, promovendo a inovação e a difusão de
aplicativos para Internet.
Este trabalho teve como objetivo propor um modelo conceitual dos dados sobre
acidentes do trabalho para publicação dos dados governamentais abertos, mantidos pela
Previdência Social. O resultado da seção seis conseguiu atender a este objetivo. Entretanto,
cabe ressaltar que o modelo aqui proposto é uma visão dentre várias possibilidades de
modelos.
Com os resultados do capítulo sete, utilizando a descrição em RDF, proveniente do
modelo conceitual proposto, para descrever parte dos dados sobre acidentes do trabalho já
disponibilizados pela Dataprev, é atendido o último objetivo específico. Todavia, mais
145
importante que o cumprimento deste objetivo é poder contribuir com possibilidades viáveis
para que uma parte dos dados públicos seja mais bem utilizada.
Espera-se que este trabalho possa contribuir com idéias ou práticas para que a
publicação desses e de outros dados seja realizada, utilizando princípios dos dados
governamentais abertos. De tal forma a possibilitar a criação, pela própria sociedade, de
novos serviços e informações que contribuirão para a construção de uma cidadania, na qual os
cidadãos terão maior acesso às informações e, consequentemente, a construção de uma
sociedade mais justa, participativa e com maiores oportunidades.
O estudo da literatura mostrou que apesar do Brasil apresentar algumas experiências
com a utilização dos dados públicos para aplicativos a partir de ligações entre dados
governamentais, é pequena a participação da sociedade neste processo. A discussão sobre as
teorias e práticas necessárias para a publicação, de forma aberta, dos dados, não conseguiu
impulsionar os resultados.
O que se nota ainda é a existência de leis que garantem o acesso às informações
públicas, mas estas informações são disseminadas de forma dispersa e com baixa utilização
pela sociedade. Elas ainda são recursos pouco explorados, devido à dificuldade de busca,
processamento e reutilização.
A população que é produtora de dados, também é consumidora. Por esta razão, o
Estado, e, aqui em especial, a Previdência Social, precisa aprimorar os serviços já existentes e
ao mesmo tempo elaborar outros novos, que contribuam para uma relação de simbiose entre
ela e a sociedade. A publicação destes dados de forma aberta possibilitará a criação, por parte
da própria sociedade, de novos serviços e informações que contribuirão para a construção de
uma cidadania, no qual os cidadãos terão maior acesso às informações e, consequentemente, a
construção de uma sociedade mais participativa e consciente.
Todavia, muitos desafios ainda precisam ser vencidos, como: ausência de vocabulários
controlados e de modelos conceituais, inexpressiva cooperação entre as áreas públicas para
compartilhamento de experiências, falta de semântica entre os dados e ineficaz divulgação dos
dados já publicados.
Contra esse panorama, a Dataprev tem o papel de apoiar a evolução dos assuntos
pertinentes à Previdência Social, por meio do uso de tecnologias e informações. Tanto a
metodologia apresentada, quanto os resultados podem instrumentalizar e apoiar os projetos
em curso na Dataprev, especialmente nas ações ligadas ao trabalho de publicação de dados
governamentais abertos (projeto INDA).
146
Durante a análise do VCGE, ele acabou sofrendo uma revisão, na qual se pode
participar enviando para análise os apontamentos aqui levantados sobre o vocabulário. O
resultado de poder contribuir com sugestões para a melhoria do vocabulário (projeto ePING)
indicado pelo Governo (projeto INDA) para indexação de dados públicos, colabora para a
efetividade desta pesquisa.
Espera-se em trabalhos futuros conseguir expandir a utilização do modelo conceitual,
de forma a testá-lo na publicação de todos os dados sobre Previdência Social, coletando dados
tanto do Anuário Estatístico de Acidentes do Trabalho, quanto do Anuário estatístico da
Previdência Social. Com isto, será possível reavaliá-lo e adequá-lo as mudanças necessárias
para que se consiga representar de forma consistente os dados descritos.
Por fim, no contexto apresentado neste trabalho, a elaboração do modelo conceitual e
a descrição em RDF pareceu adequado para organizar e fornecer um nível mínimo de
semântica aos dados sobre acidente do trabalho da Previdência Social brasileira, com vista a
promover a organização e facilitar a recuperação e reuso desses dados.
147
REFERÊNCIAS
AGUNE, R. M.; GREGORIO FILHO, Á. S.; BOLLIGER, S. P. Governo aberto SP:
disponibilização de bases de dados e informações em formato aberto. In: CONGRESSO
CONSADE DE GESTÃO PÚBLICA, 3., 2010, Brasília. Anais... Brasília: [s.n.], 2010.
Disponível em: <http://www.escoladegoverno.pr.gov.br/arquivos/File/Material_%20
CONSAD/paineis_III_congresso_consad/painel_13/governo_aberto_sp_disponibilizacao_de_
bases_de_dados_e_informacoes_em_formato_aberto.pdf>. Acesso em: 28 jun. 2011.
ALMEIDA, M. B.; BAX, M. P. Uma visão geral sobre ontologias: pesquisa sobre definições,
tipos, aplicações, métodos de avaliação e de construção. Ci. Inf., Brasília, v. 32, n. 3, p. 7-30,
set. dez. 2003. Disponível em: <http://www.scielo.br/ pdf/ci/v32n3/19019>. Acesso em: 13
maio 2012.
ALMEIDA, M. B.; OLIVERRA, V. N. P.; COELHO, K. C. Estudos exploratório sobre
ontologias aplicadas a modelos de sistemas de informação: perspectivas de pesquisa em
Ciência da Informação. Enc. Bibli. R. Eletr. Bibliotecon. Ci. Inf., Florianópolis, v. 15, n. 30,
p. 32-56, 2010. Disponível em: <https://periodicos.ufsc.br/index.php/eb/article/view/10987>.
Acesso em: 11 jun. 2013.
ALONSO, L. B. N.; FERNEDA, E.; BRAGA, L. V. Governo eletrônico e políticas públicas:
análise sobre o uso da certificação digital no Brasil. Inf. & Soc.: Est., João Pessoa, v. 21, n. 2,
p. 13-24, maio/ago. 2011.
ALVARENGA, L. A Teoria do Conceito revisitada em conexão com ontologias e metadados
no contexto das bibliotecas tradicionais e digitais. DataGramaZero, v. 2, n. 6, dez. 2001.
Disponível em: <http://www.dgz.org.br/dez01/Art_05.htm>. Acesso em: 5 ago. 2013.
ALVES, M. D. R.; SOUZA, M. I. F. Estudo de correspondência de elementos metadados:
Dublin Core e MARC 21. Revista Digital de Biblioteconomia e Ciência da Informação,
Campinas, v. 4, n. 2, p. 20-38, jan./jun. 2007. Disponível em:
<http://www.brapci.ufpr.br/documento.php?dd0=0000007463&dd1=46dea>. Acesso em: 13
maio de 2012.
ANGÉLICO, F. Lei de acesso à informação pública e seus possíveis desdobramentos à
accountability democrática no Brasil. 2012. Dissertação (Mestrado em Administração
Pública e Governo) - Escola de Administração de Empresas de São Paulo da Fundação
Getúlio Vargas, São Paulo, 2012.
ANUÁRIO estatístico da previdência social: AEPS 2011. Brasília, v. 19, 2012.
ANUÁRIO estatístico da previdência social: AEPS 2012. Brasília, v. 20, 2013. Disponível
em: <http://www.previdencia.gov.br/estatisticas/aeps-2012-anuario-estatistico-daprevidencia-social-2012/>. Acesso em: 5 mar. 2014.
ANUÁRIO estatístico de acidentes do trabalho: AEAT 2010. Brasília, v. 1, 2011.
ARAÚJO, L. R.; SOUZA, J. F. Aumentando a transparência do governo por meio da
transformação de dados governamentais abertos em dados ligados. Revista Eletrônica de
148
Sistemas de Informação, v. 10, n. 1, p. 1-15, 2011. Disponível em:
<http://revistas.facecla.com.br/index.php/reinfo/article/view/880>. Acesso em: 5 mar. 2012.
AUER, S. et. al. DBpedia: a nucleus for a Web of open data. The Semantic Web, Lecture
Notes in Computer Science, v. 4825, p. 722-735, 2007. Disponível em:
<http://www.cis.upenn.edu/~zives/research/dbpedia.pdf>. Acesso em: 24 abr. 2013.
BARLOW, J. P. A taxonomy of information. Bulletin of the American Society for
Information Science, v. 20, n. 5, p. 13-17, 1994.
BANDEIRA, A. A. Informação e exercício da accountability. In: CINFORM - ENCONTRO
BRASILEIRO DE CIÊNCIA DA INFORMAÇÃO, 6., 2005, Salvador. Anais... Salvador:
UFBA, 2005.
BAPTISTA, A. A.; MACHADO, A. B. Um gato preto num quarto escuro – falando sobre
metadados. Revista de Biblioteconomia de Brasília, v. 25, n. 1, p. 77-90, 2001. Disponível
em: <http://www.brapci.ufpr.br/documento.php?dd0=000000851 4&dd1=707be>. Acesso
em: 15 jun. 2012.
BARRETO, A. de A. A questão da informação. São Paulo em Perspectiva, v. 8, n. 4, p. 3-8,
1994. Disponível em: <http://aldoibct.bighost.com.br/quest/quest2. pdf>. Acesso em: 2 jun.
2012.
BARROS, A. J. S.; LEHFELD, N. A. S. Fundamentos de metodologia: um guia para a
iniciação científica. 2. ed. São Paulo: Makron Books, 2000.
BATIMARCHI, S. Um ano da Lei de Acesso à Informação. Information Management, a. 7,
n. 35, abr. 2013.
BATISTA, A. I. et al. Ações de Governo Eletrônico: o projeto de publicação de dados abertos
da Previdência Social pela Dataprev. In: CONFERÊNCIA WEB W3C BRASIL, 3., 2011, Rio
de Janeiro. Anais... Rio de Janeiro: W3C, 2011.
BENNETT, D.; HARVEY, A. Publishing open government data. 2009. Disponivel em:
<http://www.w3.org/TR/2009/WD-gov-data-20090908/>. Acesso em: 15 jun. 2011.
BERNERS-LEE, T. Information management: a proposal. 1989. Disponível em:
<http://www.w3.org/History/1989/proposal.html>. Acesso em: 15 jun. 2011.
BERNERS-LEE, T. Linked Data. 2006. Disponível em:
<http://www.w3.org/DesignIssues/LinkedData.html>. Acesso em: 22 abr. 2012.
BERNERS-LEE, T. Putting government data online. 2009. Disponivel em:
<http://www.w3.org/DesignIssues/GovData.html>. Acesso em: 11 jul. 2012.
BERNERS-LEE, T. Qual o futuro da Web, segundo Tim Berners-Lee. Entrevistador: Peter
Moon. 2011. Disponível em: <http://peter-moon.blogspot.com.br/ 2011/04/qual-e-o-futuroda-web-segundo-tim.html>. Acesso em: 5 abr. 2013.
149
BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The Semantic Web: a new form of Web
content that is meaningful to computers will unleash a revolution of new possibilities. 2001.
Disponível em: <http://www-sop.inria.fr/acacia/cours/essi2006/ Scientific
%20American_%20Feature%20Article_%20The%20Semantic%20
Web_%20May%202001.pdf>. Acesso em: 13 mar. 2012.
BERNERS-LEE. T. Relational databases on the Semantic Web. 1998. Disponível em:
<http://www.w3.org/DesignIssues/RDB-RDF.html>. Acesso em: 2 mar. 2014.
BIRDSALL, W. F. Uma economia política da biblioteconomia? Perspectivas em Ciência da
Informação, Belo Horizonte, v. 10, n. 1, n. 1, jan./jun. 2005.
BIZER, C.; CYGANIAK, R.; HEATH, T. How to publish Linked data on the Web. 2007.
Disponível em: <http://wifo5-03.informatik.unimannheim.de/bizer/pub/LinkedDataTutorial/>. Acesso em: 22 abr. 2012.
BIZER, C.; HEATH, T.; BERNES-LEE, T. Linked data – the story so far. Preprint to special
issue on linked data. Internacional Journal on Semantic Web and Information Siystems
(IJSWIS). 2009. Disponível em: <http://www.dagstuhl.de/
Materials/Files/09/09271/09271.BizerChristian.Slides.pdf>. Acesso em: 13 maio 2012.
BORGIDA. A.; CASANOVA, M. A.; LAENDER, A. H. F. Logical database design: from
conceptual to logical schema. In: LIU, L.; Özsu, T. (Ed.). Encycopedia of database systems.
New York: Springer, 2009. p. 1645-1649.
BRASIL. Constituição (1988). Constituição da República Federativa do Brasil. Brasília:
Senado Federal, 1988. Disponível em: <http://www.senado.gov.br/
legislacao/const/con1988/CON1988_05.10.1988/CON1988.pdf>. Acesso em: 15 fev. 2013.
BRASIL. Decreto de 15 de setembro de 2011. Institui o Plano de Ação Nacional sobre
Governo Aberto e dá outras providências. Diário Oficial [da] República Federativa do
Brasil, Brasília, DF, 16 set. 2011b. Disponível em:
<http://www.planalto.gov.br/ccivil_03/_ato2011-2014/2011/dsn/dsn13117.htm>. Acesso em:
1 maio 2013.
BRASIL. Decreto nº 3.294, de 15.12.1999. Institui o Programa Sociedade da Informação e dá
outras providências. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 16
dez. 1999. Disponível em: <http://egov.wikidot.com/ decsocinfoa>. Acesso em: 21 abr. 2013.
BRASIL. Decreto nº 6.932, de 11 agosto de 2009. Dispõe sobre a simplificação do
atendimento público prestado ao cidadão, ratifica a dispensa do reconhecimento de firma em
documentos produzidos no Brasil, institui a “Carta de Serviços ao Cidadão” e dá outras
providências. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 12 ago.
2009b. Disponível em: http://www.planalto.gov.br/ccivil_03/_ato20072010/2009/decreto/d6932.htm. Acesso em: 1 maio 2013.
BRASIL. Decreto nº 7.175, de 12 de maio de 2010. Institui o Programa Nacional de Banda
Larga - PNBL. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 15 maio
2010. Disponível em: <https://www.planalto.gov.br/ccivil_03/ _ato20072010/2010/decreto/d7175.htm>. Acesso em: 4 fev. 2013.
150
BRASIL. Lei Complementar nº 101, de 4 de maio de 2000. Estabelece normas de finanças
públicas voltadas para a responsabilidade na gestão fiscal e dá outras providências. Diário
Oficial [da] República Federativa do Brasil, Brasília, DF, 5 maio 2000. Disponível em:
<http://www.planalto.gov.br/ccivil_03/leis/lcp/lcp101. htm>. Acesso em: 1 maio 2013.
BRASIL. Lei Complementar nº 131, de 27 de maio de 2009. Acrescenta dispositivos à Lei
Complementar no 101, de 4 de maio de 2000, que estabelece normas de finanças públicas
voltadas para a responsabilidade na gestão fiscal e dá outras providências, a fim de determinar
a disponibilização, em tempo real, de informações pormenorizadas sobre a execução
orçamentária e financeira da União, dos Estados, do Distrito Federal e dos Municípios. Diário
Oficial [da] República Federativa do Brasil, Brasília, DF, 28 maio 2009a. Disponível em:
<http://www.planalto.gov.br/ccivil_03/leis/lcp/lcp131.htm>. Acesso em: 1 maio 2013.
BRASIL. Lei nº 12.527, de 18 de novembro de 2011. Regula o acesso a informações previsto
no inciso XXXIII do art. 5o, no inciso II do § 3o do art. 37 e no § 2o do art. 216 da
Constituição Federal; altera a Lei no 8.112, de 11 de dezembro de 1990; revoga a Lei
no 11.111, de 5 de maio de 2005, e dispositivos da Lei no8.159, de 8 de janeiro de 1991; e dá
outras providências. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 18
nov. 2011a. Disponível em: <http://www.planalto.gov.br/ccivil_03/_ato20112014/2011/lei/l12527.htm>. Acesso em: 1 maio 2013.
BRASIL. Lei nº 8.213, de 24 de julho de 1991. Dispõe sobre os Planos de Benefícios da
Previdência Social e dá outras providências. Diário Oficial [da] República Federativa do
Brasil, Brasília, DF, 24 jul. 1991. Disponível em: <http://www.planalto.gov.br/
ccivil_03/leis/L8213cons.htm>. Acesso em: 14 out. 2012.
BRASIL. Ministério do Planejamento, Orçamento e Gestão. Gov.br. 2013c. Portal do
governo eletrônico. Disponível em: <http://www.governoeletronico.gov.br/o-gov.br>. Acesso
em: 23 abr. 2013.
BRASIL. Ministério do Planejamento, Orçamento e Gestão. Secretaria de Logística e
Tecnologia da Informação. VCGE Voabulário de Governo Eletrônico. Brasília: MP, SLTI,
2013d.
BRASIL. Brasil.gov.br: serviços. 2013a. Disponível em: <http://www.brasil.gov.br/para/
servicos/aposentadoria/previdencia-do-servidor>. Acesso em: 22 jul. 2013.
BRASIL. Controladoria-Geral da União. Estrutura organizacional do Governo Federal.
2013b. Disponível em: <http://www.cgu.gov.br/publicacoes/prestacaocontaspresidente/2010/
Arquivos/1.01.pdf>. Acesso em: 22 jul. 2013.
BRASIL. Portaria n. 5, de 14 de julho de 2005. 2005. Disponível em:
<http://www.governoeletronico.gov.br/o-gov.br/legislacao/portaria-no-05-de-14-de-julho-de2005>. Acesso em: 24 abr. 2013.
BREITMAN, K. et al. Dados Governamentais Abertos. In: ______. Publicação de dados
governamentais em padrão Linked Data. 2009. Disponível em:
<http://www.w3c.br/cursos/dados-abertos/curso/Parte-1-Modulo-2Open%20Government%20Data.pdf>. Acesso em: 13 maio 2011.
151
BREITMAN, K. Web Semântica: a Internet do futuro. Rio de Janeiro: LTC, 2005.
BURKE, C. História da Ciência da Informação. Annual Review of Information Science and
Technology, University of Maryland, Baltimore Countly, v. 41, p. 3-53, 2007. Tradução livre
de: Cavalcanti, H. C.; Gouveia Junior, M.; Queiroz, M. O. de.
CAMPOS, A. M. Accountability: quando poderemos traduzi-la para o português? Revista de
Administração Pública, Rio de Janeiro, v. 24, n. 2, p. 30-50, fev./abr. 1990. Disponível em:
<http://ebape.fgv.br/sites/ebape.fgv.br/files/ rap8_0.pdf>. Acesso em: 22 fev. 2013.
CAMPOS, M. L. A. A organização de unidades do conhecimento em hiperdocumentos: o
modelo conceitual como um espaço comunicacional para a realização da autoria. 2001b. Tese
(Doutorado em Ciência da Informação) – Instituto Brasileiro de Informação em Ciência e
Tecnologia. Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2001.
CAMPOS, M. L. A. Integração de ontologias: o domínio da Bioinformática e a problemática
da compatibilização terminológica. In: ENCONTRO NACIONAL DE PESQUISA EM
CIÊNCIA DA INFORMAÇÃO, 7., 2006, Marília). Anais... Marília: ANCIB, 2006.
Disponível em: <http://portalppgci.marilia.unesp.br/index.php>. Acesso em: 24 set. 2012.
CAMPOS, M. L. A. Linguagem documentária: teorias que fundamentam sua elaboração.
Niterói: EdUFF, 2001a.
CAMPOS, M. L. A. Modelização de domínios de conhecimento: uma investigação de
princípios fundamentais. Ci. Inf., Brasília, v. 33, n. 1, p. 22-32, jan./abr. 2004. Disponível em:
<http://revista.ibict.br/ciinf/index.php/ciinf/article/view/56>. Acesso em: 11 jun. 2013.
CAMPOS, M. L. A.; CAMPOS, L. M. A Organização do Conhecimento e suas teorias de
representação: a ontologia de fundamentação como um modelo teórico para a representação
de domínios. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA
INFORMAÇÃO, 12., 2011, Brasília). Anais... Brasília: ANCIB, 2011.
CAMPOS, M. L. A.; CAMPOS, L. M.; MEDEIROS, J. S. A representação de domínios de
conhecimento e uma teoria de representação: a ontologia de fundamentação. Inf. Inf.,
Londrina, v. 16, n. esp., p. 140-164, jan./jun. 2011.
CAMPOS, M. L. A.; GOMES, H. E. Taxonomia e Classificação: o príncipio de
Categorização. DataGramaZero: revista de Ciência da Informação, v. 9, n. 4, ago. 2008.
Disponível em: <http://www.dgz.org.br/ago08/ F_I_art.htm>. Acesso em: 13 jan. 2013.
CAMPOS, M. L. A.; SOUZA, R. F.; CAMPOS, M. L. M. Organização de unidades de
conhecimento em hiperdocumentos: o modelo conceitual como espaço comunicacional para a
realização da autoria. Ci. Inf., Brasília, v. 32, n. 2, p. 7-16, maio/ago. 2003. Disponível em:
<http://www.scielo.br/scielo.php?pid=S0100-19652003000200002&script=sci_arttext>.
Acesso em: 13 maio 2013.
CAPURRO, Rafael. Epistemologia e Ciência da Informação. 2003. Disponível em:
<http://www.capurro.de/enancib_p.htm>. Acesso em: 12 mar. 2012.
152
CASTELLS, M. A sociedade em rede. São Paulo: Paz e Terra, 1999.
CHAHIN, A. et al. E-Gov.br: a próxima revolução brasileira: eficiência, qualidade e
democracia: o governo eletrônico no Brasil e no mundo.. São Paulo: Prentice-hall, 2004.
CHAVES, M. B. F. Apresentação sobre ações de Governo para Dados Abertos. 2011.
Apresentado originalmente no IV Congresso Internacional Software Livre e Comércio
Eletrônico, realizado em 2011, na cidade de Brasília. Disponível em:
<http://www.w3c.br/conferenciaegov/06_COI-PR_Mirian.pdf>. Acesso em: 4 maio 2013.
CHEN, P. Modelagem de dados. New York: Mcgraw Hill / Makron Books,1990.
CHEN, P. P. Entity-Relationship modeling: historical events, future trends, and lessons
learned. In: SOFTWARE pioneers: contributions to software engineering. 2002. Disponível
em: <http://www.csc.lsu.edu/~chen/pdf/Chen_Pioneers.pdf>. Acesso em: 28 out. 2013.
CHEN, P. P. The Entity-Relationship Model - toward a unified view of data. ACM
Transactions on Database Systems, v. 1, n. 1. Mar. 1976.
CKAN. 2013. Disponível em: <http://ckan.org/>. Acesso em: 26 maio 2013.
CONNOLY. T.; BEGG, C. Database systems: a pratical approach to design, implementation,
and management. New York: Addison-Wesley, 1999.
CONTROLADORIA-GERAL DA UNIÃO. Programa Brasil Transparente. 2013a.
Disponível em: <http://www.cgu.gov.br/PrevencaodaCorrupcao/BrasilTransparen
te/OPrograma/index.asp>. Acesso em: 21 abr. 2013.
CONTROLADORIA-GERAL DA UNIÃO. Programa Brasil Transparente. 2013b.
Disponível em: <http://www.portaltransparencia.gov.br/>. Acesso em: 21 abr. 2013.
COSTA, I. T. M. Informação, trabalho e tempo livre: políticas de informação para o século
XXI. Ci. Inf. , Brasília, v. 28, n. 2, p. 136-138, maio/ago 1999. Disponível em:
<http://www.scielo.br/scielo.php?pid=S0100-19651999000200005&script= sci_arttext>.
Acesso em: 14 maio 2012.
CYGANIAK, R.; JENTZSCH, A. The Linking Open Data cloud diagram. 2011.
Disponível em: <http://lod-cloud.net/>. Acesso em: 24 abr. 2014.
DADOS.GOV.BR. 2013. Disponível em: <http://dados.gov.br/>. Acesso em: 1 maio 2013.
DAHLBERG, I. A referent-oriented analytical concept theory os inter concept. International
classification, Frankfurt, v. 5, n. 3, p. 142-150, 1978b.
DAHLBERG, I. Conceptual definitions for interconcept. International Classification, v. 8, n.
1, p. 16-22, 1981.
DAHLBERG, I. Fundamentos teóricos-conceituais da classificação. R. Bibliotecon., Brasília,
DF, v. 6, n. 1, jan./jun. 1978c.
153
DAHLBERG, I. Teoria do conceito. Ci. Inf., Rio de Janeiro, v. 7, n. 2, p. 101-107, 1978a.
Disponível em: <http://revista.ibict.br/ciinf/index.php/ciinf/article/viewFile/1680/1286>.
Acesso em: 11 ago. 2013.
DAHLBERG, I. Terminological definitions: characteristics and demands. In: PROBLÈMES
de la définition et de la synonymie en terminologie. Québec: GIRSTERM, 1983. p. 13-51.
DATA.GOV.UK. 2013. Disponível em: <http://data.gov.uk/>. Acesso em: 1 maio 2013.
DATAPREV. A virada da previdência social: como acabaram as filas nas portas das
agências. Brasília: Dataprev, 2013.
DATAPREV. Dados abertos. 2012. Disponível em: <http://api.dataprev.gov.br/ revidencia/
anuario/2003/acidentes-do-trabalho.xml>. Acesso em: 15 jan. 2013.
DATAPREV. Dados abertos. 2013. Disponível em:
<http://api.dataprev.gov.br/doc/index.html>. Acesso em: 7 abr. 2013.
DAVIES, T. Open data, democracy and public sector reform. A look at open government
data use from data.gov.uk. 2010. Disponível em:
<http://practicalparticipation.co.uk/odi/report/ wp-content/uploads/2010/08/How-is-opengovernment-data-being-used-in-practice.pdf>. Acesso em: 20 abr. 2013.
DAVIS, R.; SHROBE, H.; SZOLOVITS, P. What is knowledge representation? AI
Magazine, v. 14, n. 1, p. 17-33, Spring 1993. Disponível em:
<http://www.aaai.org/ojs/index.php/aimagazine/article/view/1029/947>. Aceso em: 22 jan.
2013.
DEMO, P. Metodologia científica em Ciências Sociais. 3. ed. rev e ampl. São Paulo: Atlas,
1995.
DINIZ, E. H. et al. O governo eletrônico no Brasil: perspectiva histórica a partir de um
modelo estruturado de análise. Revista de administração pública, Rio de Janeiro, v. 43, n. 1,
p. 23-48, jan./fev. 2009. Disponível em: <http://www.scielo.br/ pdf/rap/v43n1/
a03v43n1.pdf>. Acesso em: 28 jun. 2011.
DINIZ, V. A crise do governo eletrônico ou a prevalência dos monólogos simultâneos.
Informática pública, a. 11, n. 1, p. 15-22, 2009. Disponível em: <http://www.ip.pbh.gov.br/
ANO11_N1_PDF/a_crise_do_governo_eletronico. pdf>. Acesso em: 28 jun. 2011.
DINIZ, V. Como conseguir dados governamentais abertos. In: CONGRESSO CONSADE DE
GESTÃO PÚBLICA, 3., 2010, Brasília. Anais... Brasília: [s.n.], 2010. Disponível em:
<http://www.escoladegoverno.pr.gov.br/arquivos/File/
Material_%20CONSAD/paineis_III_congresso_consad/painel_13/como_conseguir_dados_go
vernamentais_abertos.pdf>. Acesso em: 19 abr. 2012.
DODDS, L. Rights statements on the Web of Data. Nodalities: the magazine of the Semantic
Web, v. 9, p. 13-14, 2010.
154
DODEBEI, V. L. D. Tesauro: linguagem de representação da memória documentária.
Niterói: Intertexto; Rio de Janeiro: Interciência, 2002.
DUBLIN CORE METADATA INITIATIVE. DCMI metadata terms. 2012. Disponível em:
<http://dublincore.org/documents/2012/06/14/dcmi-terms/?v=elements#>. Acesso em: 2 mar.
2014.
DZIEKANIAK, G. V. Desenvolvimento de uma ontologia sobre componentes de ontologias.
Perspectivas em Ciência da Informação, v. 15, n. 1, p. 173-184, jan./abr. 2010. Disponível
em: <http://www.scielo.br/scielo.php?pid=S1413-99362010000100010&script=sci_arttext>.
acesso em: 13 maio 2012.
DZIEKANIAK, G. V.; KIRINUS, J. B. Web Semântica. Enc. Bibli.: E. Eletr. Bibliotecon. Ci.
Inf., Florianópolis, n. 18, p. 20-39, jul./dez. 2004. Disponível em:
<http://www.periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2004v9n18p20>.
Acesso em: 13 maio 2012.
EUROPEANA. Definition of the Europeana Data Model elements: version 5.2.3. 2012.
Disponível em: <http://pro.europeana.eu/documents/900548/bb6b51df-ad11-4a78-8d8a44cc41810f22>. Acesso em: 10 mar 2013
FALBO, R. A. Integração de conhecimento em um ambiente de Engenharia de Software.
1998. Tese (Doutorado em Informática) - Engenharia de Sistemas e Computação, COPPE,
Universidade Federal do Rio de Janeiro.
FEIGENBAUM, L. et al. The Semantic Web in action: corporate applications are well under
way, and consumer uses are emerging. Scientific American, Dec. 2007. Disponível em:
<http://thefigtrees.net/lee/sw/sciam/semantic-web-in-action>. Acesso em: 15 jun. 2011.
FERNANDES, A. G.; AFONSO, J. R. R. e-Governo no Brasil: experiências e perspectivas.
Revista do BNDES, Rio de Janeiro, v. 8, n. 5, p. 21-64, 2001.
FERNANDES, G. C. Quatro visões no campo da Ciência da Informação. 2006. Trabalho
apresentado à banca avaliadora do concurso para Professor Adjunto 1 DE, do Departamento
de Ciência da Informação da Universidade Federal da Universidade Federal de Santa
Catarina, como requisito parcial para aprovação.
FERNANDEZ, M.; GÓMEZ-PÉREZ, A.; JURISTO, N. Methontology: from ontological art
towards ontological engineering. AAAI Technical Report SS-97-06, 1997.
FERRER, F. A importância do governo eletrônico no Brasil. 2003. Disponível em:
<http://www.florenciaferrer.com.br/detalhes.php?artg=105>. Acesso em: 20 abr. 2013.
FHOHMANN, B. A documentação rediviva: prolegômenos a uma (outra) filosofia da
informação. Morpheus: Revista Eletrônica em Ciências Humanas, Rio de Janeiro, v. 9, n. 14,
p. 227-249, 2012. Disponível em: <http://www.unirio.br/ orpheusonline/numero142012/artigos/ frohmannn _pt.pdf>. Acesso em: 14 out. 2012.
155
FILGUEIRAS, F. Além da transparência, accountability e política da publicidade. Lua Nova,
São Paulo, n. 84, p. 84-94, 2011a. Disponível em:
<http://www.scielo.br/pdf/ln/n84/a04n84.pdf>. Acesso em: 22 jul. 2012.
FILGUEIRAS, F. Transparência, publicidade e accountability. In: TEXTO para discussão n.
1. Belo Horizonte: Centro de Referência do Interesse Público, 2011b. Disponívem em:
<http://democraciaejustica.org/cienciapolitica3/sites/
default/files/transparencia_publicidade_e_accountability.pdf>. Acesso em: 22 jul. 2012.
FOUCAULT, M. A governamentabilidade. In: ______. Ditos e escritos. Rio de Janeiro:
Forense Universitária, 2003. v. 4.
FRANCELIN, M. M.; KOBASHI, N. Y. Concepções sobre o conceito na organização da
informação e do conhecimento. Ci. Inf., Brasília, DF, v. 40, n. 2, p. 207-228, maio/ago.,
2011.
FRANZOSI, E. M. et al. Rede de informações pública e aberta DadosGov – um modelo
aberto para troca de informações. In: CONGRESSO INTERNACIONAL SOFTWARE
LIVRE E COMÉRCIO ELETRÔNICO, 4., 2011, Brasília. Dados abertos para a
democracia na era digital. Brasília: Fundação Alexandre de Gusmão, 2011. p. 21-51.
FREIRE, G. H. Ciência da Informação: temática, histórias e fundamentos. Perspec. Ci. Inf.,
Belo Horizonte, v. 11, n. 1, p. 6-19, jan./abr. 2006.
FREITAS, L. S. Sentidos da história e história dos sentidos da Ciência da Informação: um
esboço arqueológico. Morpheus, Rio de Janeiro, a. 2, n. 2, 2003.
FREIRE, N.; CHARLES, V.; CHAMBERS, S. Análise do Europeana Data Model no
contexto das bibliotecas e de conteúdos de texto integral. In: CONGRESSO NACIONAL DE
BIBLIOTECÁRIOS, ARQUIVISTAS E DOCUMENTALISTAS, 11, 2012, Lisboa. Actas…
Lisboa: Fundação Calouste Gulbenkian, 2012.
FREY, K. Governança eletrônica: uma experiência de cidades européias e algumas lições para
países em desenvolvimento. Informática pública, Belo Horizonte, v. 2, p. 31-48, maio 2000.
Disponível em: <http://www.egov.ufsc.br/ portal/ sites/default/files/anexos/19407-19408-1PB.pdf>. Acesso em: 4 jan. 2013.
FREY, K. Governança urbana e participação pública. RAC-Eletrônica, v. 1, n. 1, p. 136-150,
jan./abr. 2007. Disponível em: <http://www.anpad.org.br/periodicos/ arq_pdf/a_629.pdf>.
Acesso em: 3 jan. 2013.
FURGERI, S. O papel das linguagens de marcação para a Ciência da Informação.
Transinformação, Campinas, v. 18, n. 3, p. 225-239, set./dez. 2006. Disponível em:
<http://www.brapci.ufpr.br/documento.php?dd0=0000000445&dd1 =d1f32>. Acesso em: 13
maio 2012.
GAILLIAU, R. Twenty years of a free and open WWW. 2013. Disponível em:
<http://home.web.cern.ch/cern-people/opinion/2013/04/twenty-years-free-and-open-www>.
Acesso em: 30 abr. 2013.
156
GANGEMI, A. et al. Sweetening Ontologies with DOLCE. In: KNOWLEDGE engineering
and knowledge management: ontologies and the semantic web, v. 2473, p. 223-233, 2002.
Disponível em: <http://www.loa.istc.cnr.it/Papers/DOLCE-EKAW.pdf>. Acesso em: 24 out.
2013.
GARCIA. T. et al. A democracia na era do governo eletrônico. In. Simpósio Internacional de
propriedade intelectual, informação e ética, 2003, Florianópolis. Anais... Florianópolis:
UFSC, 2003. Disponível em: <http://egov.ufsc.br/portal/ sites/ default/files/anexos/2955229568-1-PB.pdf>. Acesso em: 17 abr. 2013.
GOMES, H.E.(Coord.). Manual de elaboração de tesauros monolíngües. Brasília:
Programa Nacional de Bibliotecas das Instituições de Ensino Superior, 1990.
GOMES, H. E. Tendências da pesquisa em organização do conhecimento. Pesq. Bras. Ci.
Inf., Brasília, v. 2, n. 1, p. 60-88, jan./dez. 2009.
GONTIJO, M. Analise da proposta brasileira de e-governo como expressão de uma política de
informação a partir do conceito de regime de informação. Perspect. Cien. Inf., Belo
Horizonte, v. 7, n. 2, p. 179-188, jul./dez. 2002. Disponível em:
<http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/ download/406/217>. Acesso em:
2 dez. 2012.
GONZÁLEZ DE GOMEZ, M. N. Novos cenários políticos para a informação. Ci. Inf.
Brasília, v. 31, n. 1, p. 27-40, jan./abr. 2002.
GONZÁLEZ DE GÓMEZ, M. N.; LIMA, C. R. M. de (org.). Informação e democracia: a
reflexão contemporânea da ética e da política. Brasília: IBICT, 2010.
GOVERNO eletrônico: observatório do Governo eletrônico. 2007. Disponível em:
<http://egov.wikidot.com/start>. Acesso em: 19 abr. 2013.
GRAY, J. et. al. Unlocking the Potential of Aid Information. 2009. Disponível em
http://www. unlockingaid.info/wp-content/uploads/2010/02/UnlockingAid Information.pdf.
Acessado em: 13 de junho de 2011.
GREENBERG, J. The Web Semantic: more than a vision. Bulletin of the American Society
for Information Science and Technology, v. 29, n. 4, p. 6-7, Apr./May 2003. Disponível
em: <http://www.asis.org/Bulletin/Apr-03/BulletinAprMay03.pdf>. Acesso em: 16 set. 2012.
GREENBERG, J.; SUTTON, S.; CAMPBELL, G. Metadata: a fundamental component of the
Semantic Web. Bulletin of the American Society for Information Science and
Technology, v. 29, n. 4, p. 16-18, Apr./May 2003. Disponível em:
<http://www.asis.org/Bulletin/Apr-03/BulletinAprMay03.pdf>. Acesso em: 16 set. 2012.
GRENON, P.; SMITH, B.; GOLDBERG, L. Biodynamic ontology; applying BFO in the
biomedical domain. 2004. Disponível em:
<http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.64.5717>. Avesso em: 22 abr.
2013.
157
GRUBER, T. R. Ontology. In: Ling Liu; Özsu, M. T. (ed.). Encyclopedia of Database
Systems. New York: Springer-Verlag, 2009. Disponível em:
<http://tomgruber.org/writing/ontology-definition-2007.htm>. Acesso em: 1 maio 2013.
GRUBER, T. R. Toward Principles for the Design of Ontologies Used for Knowledge
Sharing. International Journal Human-Computer Studies, v. 43, n. 5-6, p. 907-928, 1995.
Disponível em: <http://tomgruber.org/writing/onto-design.pdf>. Acesso em: 4 maio 2013.
GUARINO, N. Formal ontology and information systems. In: FIRST INTERNATIONAL
CONFERENCE (FOIS), 1., 1998, Trento, Italy. Proceedings… Amsterdam: IOS Press, 1998.
p. 3-15. Disponível em: <http://www.loa.istc.cnr.it/ Papers/FOIS98.pdf>. Acesso em: 5 abr.
2013.
GUARINO, N. Understanding, building and using ontologies. Journal Humancomputer
Studies, v. 45, n. 2-3, fev.mar. 1997. Disponível em:
<http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.29.2610>. Acesso em: 27 maio
2012.
GUIZZARDI, G. et al. Ontologias de fundamentação e modelagem conceitual. Disponível
em: <http://nemo.inf.ufes.br/files/ontologias_de_ fundamentacao_e_modelagem_conceitual_
2009. pdf>. Acesso em: 5 abr. 2013.
GUIZZARDI, G. Uma abordagem metodológica de desenvolvimento para e com reuso,
baseada em ontologias formais de domínio. 2000. Dissertação de Mestrado, Universidade
Federal do Espirito Santo, Departamento de Informática, LabES (Laboratorio de Engenharia
de Software)/LPRM (Laboratorio de Pesquisas em Redes e Multimidia). Disponível em:
<http://www.loa.istc.cnr.it/ Guizzardi/MSc.htm>. Acesso em: 4 maio 2013.
GUIZZARDI, G.; FALBO, R. A.; GUIZZARDI, R. S. S. A importância de ontologias de
fundamentação para a engenharia de ontologias de domínio: o caso do domínio de processos
de software. IEEE Latin America Transactions, v. 6, n. 3, July 2008. Disponível em:
<http://www.ewh.ieee.org/reg/9/etrans/ieee/issues/vol06/vol6issue3July2008/6TLA3_03Guiz
zardi.pdf>. Acesso em: 22 out. 2013.
GUIZZARDI, G.; WAGNER, G. A Unified Foundations Ontology and some applications
of it in Business modeling. 2004. Disponível em:
<http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.142.9372>. Acesso em: 22 abr.
2013.
HABERMAS, J. A inclusão do outro: estudos de teoria e política. São Paulo: Loyola, 2002.
HABERMAS, J. Direito e democracia: entre faticidade e validade. 2. Ed. Rio de Janeiro:
Tempo Brasileiro, 2003. v. 2.
HEUSSER, C. A. Projeto de banco de dados. Porto Alegre: Sagra, 1998.
HJØRLAND, B. Fundamentals of Knowledge Organization. In: FRÍAS, José Antonio;
TRAVIESO, Críspulo (Ed.). Trends in Knowledge Organization Research. Salamanca:
Ediciones Universidad de Salamanca, 2003. p.83-116.
158
HJØRLAND, B. Theory and metatheory of Informacion Science: a new interpretation.
Journal of documentation, v. 54, n. 5, p. 606-621, dez. 1998.
HORVATH JÚNIOR, M. Dicionário analítico da Previdência Social. São Paulo: Atlas,
2009.
IBGE. Síntese e indicadores sociais. Rio de Janeiro: IBGE, 2012. 293 p. (Estudos e
pesquisas. Informação demográfica e socioeconômica; 29). Disponível em:
<ftp://ftp.ibge.gov.br/Indicadores_Sociais/Sintese_de_
Indicadores_Sociais_2012/SIS_2012.pdf>. Acesso em: 24 abr. 2013.
INSTITUTO ANTÔNIO HOUAISS. Dicionário eletrônico de Língua Portuguesa. 3. Ed.
Rio de Janeiro: Objetiva, 2009.
JACOB, E. K. Ontologies and the Semantic Web. Bulletin of the American Society for
Information Science and Technology, v. 29, n. 4, p. 16-18, Apr./May 2003. Disponível em:
<http://www.asis.org/Bulletin/Apr-03/BulletinAprMay03.pdf>. Acesso em: 16 set. 2012.
JAPIASSÚ, H.; MARCONDES, D. Dicionário básico de Filosofia. 3. ed. rev. ampl. Rio de
Janeiro: Zahar, 2001.
JARDIM, J. M. A Lei de Acesso à Informação Pública: dimensões político-informacionais.
In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 13.,
2012, Rio de Janeiro). Anais... Rio de Janeiro: ANCIB, 2012. Disponível em:
<http://obgi.files.wordpress.com/2012/10/jardim-xiii-enancib.pdf>. Acesso em: 1 maio 2013.
JARDIM, J. M. Capacidade governativa, informação e governo eletrônico. DataGramaZero,
Rio de Janeiro, v. 1, n. 5, out. 2000. Disponível em:
<http://www.dgz.org.br/out00/Art_01.htm>. Acesso em 6 jan. 2010.
JARDIM, J. M. Sistemas e políticas públicas de arquivos no Brasil. Niterói: EdUFF, 1995.
JARDIM, J. M. Transparência e opacidade do Estado no Brasil: usos e desusos da
informação governamental. Niterói: EdUFF, 1999.
KANEIWA, K.; IWAZUME, M.; FUKUDA, K. An upper ontology for event classifications
and relations. IN: AI'07 Proceedings of the 20th Australian joint conference on Advances
in artificial intelligence. Berlin: Springer-Verlag, 2007. Disponível em:
<http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.108.9174>. Acesso em: 12 set.
2013.
LAENDER, A. H. F.; FLYNN, D. J., A semantic comparison of modelling capabilities of the
ER and NIAM models. In: ELMASRI, R.; KOURAMAJIAN, V.; THALHEIM, B., (Eds.).
Entity-Relationship Approach - ER'93, Springer-Verlag, p. 242-256, 1994.
LANCASTER, F. W. Indexação e resumos: teoria e prática. Brasília: Briquet de Lemos,
1993.
LAPLANTE, P. Great papers in Computer Science. New York: West Publishing, 1996.
159
LE MOIGNE, J. A teoria do sistema geral: teoria da modelizacao.Trado: Jorge Pinheiro.
Instituto Piaget, Lisboa, 1977.
LEITE, M. S. A.; BORNIA, A. C. Modelagem: abordagens que consideram a complexidade
do sistema. In: Encontro Nacional de Engenharia de Produção, 26., 2006, Fortaleza. Anais...
Fortaleza: ABEPRO, 2006. Disponível em:
<http://www.abepro.org.br/biblioteca/ENEGEP2006_TR460314_7155.pdf>. acesso em: 11
dez. 2013.
LEOCADIO, J, M. Segurança eletrônica na Web Semântica. In: CONGRESSO
INTERNACIONAL SOFTWARE LIVRE E COMÉRCIO ELETRÔNICO, 4., 2011, Brasília.
Dados abertos para a democracia na era digital. Brasília: Fundação Alexandre de Gusmão,
2011. p. 7-9.
LIGADO nos políticos. 2010. Disponível em: <http://ligadonospoliticos.com.br/?
pag=home>. Acesso em: 26 maio 2013.
LIMA, C. R. M. de; GONÇALVES, M. A reinvenção da esfera pública: os discursos em rede,
reconhecimento e política deliberativa. In. ENCONTRO NACIONAL DE PESQUISA EM
CIÊNCIA DA INFORMAÇÃO, 12., 2011, Brasília). Anais... Brasília: ANCIB, 2011. p.
1643-1656.
LIMA, J. A. O. Modelo genérico de relacionamentos na organização da informação
legislativa e jurídica. 2008. Tese (Doutorado em Ciência da Informação) – Universidade de
Brasília, Brasília, 2008.
LIMA, J. C.; CARVALHO, C. L. Ontologias - OWL (Web Ontology Language). Technical
Report - RT-INF_004-05 - Relatório Técnico. 2005. Disponível em:
<http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_004-05.pdf>.
Acesso em: 3 mar. 2014.
LUBENOW, J. A. Esfera pública e democracia deliberativa em Habermas: modelo teórico e
discursos críticos. Kriterion, Belo Horizonte, n. 121, p. 227-258, jun. 2010. Disponível em:
<http://www.scielo.br/scielo.php?pid=S0100-512X2010000100012&script=sci_arttext>.
Acesso em: 25 maio 2012.
MAIA, R. M. C. S.; ALVARENGA, L. Interconexões entre a teoria da classificação facetada
(TCF) de Ranganathan e o Modelo Entidade-Relacionamento (MER) de Peter Chen. In:
ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 14., 2013,
Florianópolis. Anais... Brasília: ANCIB, 2013. Disponível em: <
http://enancib.sites.ufsc.br/index.php/enancib2013/XIVenancib/paper/viewFile/441/135>.
Acesso em: 10 dez. 2013.
MANUAL dos dados abertos: governo. 2011. Disponível em: <http://www.w3c.br/pub/
Materiais/ PublicacoesW3C/Manual_Dados_Abertos_ WEB.pdf>. Acesso em: 24 ago. 2011.
MARANHÃO. Ministério Público. Procuradoria Geral de Justiça. Coordenadoria de
Orçamento e Finanças. [Plano plurianual 2012-2015]. 2012. Disponível em:
<http://www.mp.ma.gov.br/arquivos/arquivos_site_antigo/Noticia6885A6285.pdf>. Acesso
em: 22 jul. 2013.
160
MARCONDES, C. H. Definições conceituais como subsídio à modelagem de domínios e
organização do conhecimento. 2014. Projeto de pesquisa submetido ao Programa
Institucional de Bolsas de Iniciação Científica PIBIC – UFF 2014.
MARCONDES, C. H. Documento: suas relações com informação e conhecimento. In: I
Congresso ISKO Espanha e Portugal, 2013, Porto, Portugal. I Congresso ISKO Espanha e
Portugal, XI Conreso ISKO España, Informação e/ou Conhecimento: as duas faces de
Jano. Porto: Faculdade de Letras da Univ. do Porto, CETAC.MEDIA, ISKO, 2013. v. I. p.
800-816.
MARCONDES, C. H. et al. Ontologias como novas bases de conhecimento. Perspectivas em
Ciência da Informação, v. 13, n. 3, p. 20-39, set./dez. 2008.
MARCONDES, C. H.; CAMPOS, M. L. A. Ontologia e Web Semântica: o espaço da
pesquisa em Ciência da Informação. Pontode Acesso, Salvador, v. 2, n. 1, p. 107-136,
jun./jul. 2008. Disponível em: <http://www.portalseer.ufba.br/index.php/
revistaici/article/viewArticle/2669>. Acesso em: 13 maio 2012.
MARCONDES, C. H.; JARDIM, J. M. Políticas de informação governamental: a construção
de governo eletrônico na administração federal do Brasil. DataGramaZero – Revista de
Ciência da Informação, v. 4, n. 2, abr. 2003. Disponível em:
<http://www.dgz.org.br/abr03/Art_04.htm>. Acesso em: 9 mar. 2012.
MARCONI, M. A.; LOKATOS, E. M. Fundamentos da metodologia do trabalho
científico. 5. ed. São Paulo: Atlas, 2003.
MARCONI, M. A.; LOKATOS, E. M. Metodologia do trabalho científico. 2. ed. São Paulo:
Atlas, 1992.
MARKUS, M. L. Toward a theory of knowledge reuse: types of knowledge reuse situations
and factors in reuse success. Journal of Management Information Systems, 18, 1
(Summer): 57-93, 2001. Disponível em:
<http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.85.7939>. Acesso em 12 abr.
2013.
MARTELETO, R. M. A pesquisa em Ciência da Informação no Brasil: marcos institucionais,
cenários e perspectivas. Perspectivas em Ciência da Informação. V. 14, n. especial, p. 1940, 2009. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/view/
915/605>. Acesso em: 29 jun. 2012.
MASOLO, C. et al. Ontology library. Laboratory for applied ontology – ISTC – CNR.
Trento, 2003. Disponível em:
<http://wonderweb.semanticweb.gorg/deliverables/documents/D18.pdf>. Acesso em: 11 nov.
2011.
MASOLO, C. et al. WonderWeb library of foundational ontologies; preliminary report.
2003. Disponível em: <http://www.loa.istc.cnr.it/Papers/ WonderWebD17V2.0.pdf>. Acesso
em: 22 abr. 2013.
161
MATHEUS, R. Consultas públicas online e open government. 2009. Disponível em:
<http://www.gpopai.usp.br/cursos/index.php/Usu%C3%A1rio_
Discuss%C3%A3o:Ricardomatheus>. Acesso em: 27 dez. 2012.
MAZONI, M. V. F. O papel dos dados abertos para seguir construindo um novo Brasil. In:
CONGRESSO INTERNACIONAL SOFTWARE LIVRE E COMÉRCIO ELETRÔNICO, 4.,
2011, Brasília. Dados abertos para a democracia na era digital. Brasília: Fundação
Alexandre de Gusmão, 2011. p. 7-9.
MCGUINNESS, D. L. Ontologies come of age. In: FENSEL, D. et al. (ed.). Spinning the
Semantic Web: bringing the World Wide Web to its full potential. Massachusetts: MIT
Press, 2003. Disponível em: <http://www-ksl.stanford.edu/people/dlm/papers/ontologiescome-of-age-mit-press-(with-citation).htm>. Acesso em: 11 set. 2012.
MCGUINNESS; D. L.; HARMELEN, F. (Ed.). OWL: Web Ontology Language overview.
2004. Disponível em: <http://www.w3.org/TR/owl-features/>. Acesso em: 2 fev. 2014.
MÉNDEZ, E.; GREENBERG, J. Linked Data for Open vocabularies and HIVE’s Global
Framework. El Profesional de la Información, v. 21, n.3, p. 236-244, 2012. Disponível em:
<http://dx.doi.org/10.3145/epi.2012.may.03>. Acesso em: 21 abr.2013.
MILLER, E.; SWICK, R. An overview of W3C Semantic Web activity. Bulletin of the
American Society for Information Science and Technology, v. 29, n. 4, p. 8-11, Apr./May
2003. Disponível em: <http://www.asis.org/Bulletin/Apr-03/BulletinAprMay03.pdf>. Acesso
em: 16 set. 2012.
MINAYO, M. C. de S. (org.). Pesquisa social: teoria, método e criatividade. 20. Ed.
Petrópolis: Vozes, 2002.
MIRANDA, C. M. C. A disseminação de dados governamentais abertos como serviço público
– os dados abertos governamentais e a experiência brasileira. In: CONGRESSO
INTERNACIONAL SOFTWARE LIVRE E COMÉRCIO ELETRÔNICO, 4., 2011, Brasília.
Dados abertos para a democracia na era digital. Brasília: Fundação Alexandre de Gusmão,
2011. p. 63-73.
MOREIRA, M. A. Mapas conceituais e aprendizagem significativa. 1997. Disponível em:
<http://www.if.ufrgs.br/~moreira/mapasport.pdf>. Acesso em: 5 set. 2013.
MOREIRO GONZÁLEZ, J. A. Linguagens documentárias e vocabulários semânticos
para Web: elementos conceituais. Salvador: EdUFBA, 2011.
MORIN, E. Introdução ao pensamento complexo. Porto Alegre: Sulina, 2006.
MOTTA, D. F. Método relacional como nova abordagem para construção de tesauros.
Rio de Janeiro: [s.n.], 1987. Disponível em:
<http://www.conexaorio.com/biti/dilza/index.htm>. Acesso em: 02 jan 2014.
MYLOPOULOS, J. Conceptual modeling and Telos. In: LOUCOPOULOS, P.; ZICARI, R.
(Ed.). Conceptual modeling, databases, and CASE. [S.l.]: Wiley, 1992. Disponível em:
162
<http://citeseerx.ist.psu.edu/viewdoc/summary? doi=10.1.1.83.3647>. Acesso em: 5 jan.
2013.
NAÇÕES UNIDAS. Programa das Nações Unidas para o Desenvolvimento. Relatório de
desenvolvimento Humano 2013: A Ascensão do Sul: progresso humano num mundo
diversificado. New York: Programa Das Nações Unidas para o desenvolvimento, 2013.
Disponível em: <http://hdr.undp.org/en/media/ HDR13%20Summary%20PT%20WEB.pdf>.
Acesso em: 23/04/2013.
NOLETO, D. A.; BRITO, P. F. RDF e RDF Schema na representação de páginas do portal
CEULP/ULBRA. In: ENCONTRO DE ESTUDANTES DE INFORMÁTICA DO
TOCANTINS, 5, 2003, Palmas. Anais... [Palmas: s.n.], 2003. p. 113-122.
NOVELLINO, M. S. F. Instrumentos e metodologias de representação da informação. Inf.
Inf., Londrina, v. 1, n. 2, p. 37-45, jul./dez. 1996. Disponível em:
<http://www.uel.br/revistas/uel/index.php/informacao/article/viewFile/1603/1358>. Acesso
em: 24 fev. 2014.
O’LEARY, D. E. Impediments in the use of explicit ontologies for KBS development. Int. J.
Human-Computer Studies, v. 46, n. 2/3, 1997. Disponível em:
<https://msbfile03.usc.edu/digitalmeasures/doleary/intellcont/
impediments%20to%20ontologies-1.pdf>. Acesso em: 4 maio 2013.
OBAMA, B. Memorandum on Transparency and Open Government. 2009. Disponível
em: <http://www.whitehouse.gov/the_press_office/ TransparencyandOpenGovernment>.
Acesso: 11 nov. 2011.
OPEN DEFINITION. 2013. Disponível em: <http://opendefinition.org/okd/ portuguesbrasileiro/>. Acesso em: 24 abr. 2013.
OPEN GOVERNMENT PARTNERSHIP. About. 2012. Disponível em:
<http://www.opengovpartnership.org/about>. Acesso em: 1 maio 2013.
OPENGOVDATA. 8 principles of open government data. 2007. Disponível em:
<http://www.opengovdata.org/ home/8principles>. Acesso em: 15 jun. 2011.
ORGANIZAÇÃO INTERNACIONAL DO TRABALHO. Escritório no Brasil. Organização
Internacional do trabalho: promovendo o trabalho decente. 2013. Disponível em:
<http://www.oit.org.br/>. Acesso em: 2 jun. 2013.
ORGANIZACIÓN INTERNACIONAL DEL TRABAJO. La taxonomia OIT. 2013.
Disponível em: <http://www.ilo.org/public/spanish/support/lib/tools/ taxonomy.htm>. Acesso
em: 2 jun. 2013.
ORGANIZACIÓN INTERNACIONAL DEL TRABAJO. Tesauro OIT. 2011. Disponível
em: <http://www.ilo.org/public/spanish/support/lib/tools/ aboutthes.htm>. Acesso em: 2 jun.
2013.
PACHECO, R. C. S.; KERN, V. M. Arquitetura conceitual e resultados da integração de
sistemas de informação e gestão da ciência e tecnologia. DataGramaZero – Revista de
163
Ciência da Informação, v. 4, n. 2, abr. 2003. Disponível em:
<http://www.dgz.org.br/abr03/Art_03.htm>. Acesso em: 13 maio 2012.
PACHECO, R. C. S.; KERN, V. M.; STEIL, A. V. Aplicações de arquitetura conceitual em
plataformas E-Gov: da gestão da informação pública à construção da sociedade do
conhecimento. PondodeAcesso, Salvador, v. 1, n. 1, p. 71-87, jun. 2007. Disponível em:
<http://periodicos.ufpb.br/ojs/index.php/pbcib/article/ view/6994>. Acesso em: 25 jun. 2012.
PAUXIS, D.; SILVA, W. O Twitter como disseminador de informação. DataGramaZero, v.
12, n. 6, dez. 2011. Disponível em: <http://www.dgz.org.br/dez11/ Ind_com.htm>. Acesso
em: 24 abr. 2013.
PEREIRA, C. R. Elementos para construção de um modelo de análise de iniciativas de
publicação de dados governamentais abertos. São Paulo, 2012. Trabalho de Conclusão de
Curso (Graduação em Gestão de Políticas Públicas) – Universidade de São Paulo, 2012.
PICKLER, M. E. V. Web Semântica: ontologias como ferramentas de representação do
conhecimento. Perspectivas em Ciência da Informação, v. 12, n. 1, p. 65-83, jan./abr. 2007.
Disponível em: <http://www.scielo.br/pdf/pci/v12n1/ 05.pdf>. acesso em: 5 abr. 2013.
PINHO, J. A. G.; SACRAMENTO, A. R. S. Accountability: já podemos traduzi-la para o
português. RAP, Rio de Janeiro, v. 43, n. 6, p. 1343-1368, nov./dez. 2009. Disponível em:
<http://www.scielo.br/pdf/rap/v43n6/06.pdf>. Acesso em: 22 fev. 2013.
PLACES ontology. [2014?]. Disponível em: <http://purl.org/ontology/places#>. Acesso em: 3
mar. 2014.
PODER Vocabulary. [2014?]. Disponível em: <http://dev.poderopedia.com/vocab/schema>.
Acesso em: 2 mar. 2014.
PRADO, E. P. V. et al. Iniciativas de governo eletrônico: análise das relações entre nível de
governo e características dos projetos em casos de sucesso. Revista Eletrônica de Sistemas
de Informação, v. 10, n. 1, 2011. Disponível em:
<http://revistas.facecla.com.br/index.php/reinfo/article/view/793>. Acesso em: 30 nov. 2012.
RAMALHO, R. A. S.; OUCHI, M. T. Tecnologias semânticas: novas perspectivas para
representação de recursos informacionais. Inf. Inf., Londrina, v. 16, n. 3, p. 60-75, jan./jun.
2011.
RAMBAYON, A. Storing RDF data efficiently with E-R modeling. 2012. Disponível em:
<http://misclassblog.com/database-design-and-development/storing-rdf-data-efficiently-withe-r-modeling/>. Acesso em: 2 mar. 2014.
RAMOS SIMÓN, L. F. et al. De La reutilización de información del sector público a los
portales de datos abiertos en Europa. BID: textos universittaris de biblioteconomia i
documentación, Barcelona, n. 29, p. 1-36, dic. 2012. Disponível em:
<http://www.ub.edu/bid/29/ramos2.htm>. Acesso em: 4 mar. 2013.
RIBEIRO, C. J. S. Diretrizes para o projeto de portais de informação: uma proposta
interdisciplinar baseada na Análise de Domínio e Arquitetura da Informação. 2008. 283 f.
164
Tese (Doutorado em Ciência da Informação) – Universidade Federal Fluminense, Niterói,
2008.
RIBEIRO, C. J. S. Em busca da organização do conhecimento: a gestão da informação nas
bases de dados da Previdência Social brasileira com o uso da abordagem de análise de
domínio. 2001. 162 f. Dissertação (Mestrado em Ciência da Informação) – Universidade
Federal do Rio de Janeiro, Rio de janeiro, 2001.
RIBEIRO, C. J. S.; ALMEIDA, R. F. Dados Abertos Governamentais (Open Government
Data): instrumento para exercício de cidadania pela sociedade. In. ENCONTRO NACIONAL
DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 12., 2011, Brasília). Anais... Brasília:
ANCIB, 2011. p. 2568-2580.
RIBEIRO, C. P. P. et al. Difusão da informação na administração pública. TransInformação,
Campinas, v. 23, n. 2, p. 159-171, maio/ago 2011. Disponível em: <http://periodicos.puccampinas.edu.br/seer/index.php/transinfo/article/ view/474/454>. Acesso em: 12 jan. 2013.
RIBEIRO, M. M. O uso das tecnologias de informação e comunicação como ferramentas
de combate à corrupção: Comprasnet e o Portal da Transparência. 2008. 3. Concurso de
monografias da GCU – Controladoria-Geral da União. Disponível em:
<http://www.esaf.fazenda.gov.br/esafsite/premios/CGU/
Monografias_2008/Manuella_Maia_Ribeiro_-_2_Lugar_-_U.pdf>. Acesso em: 12 fev. 2013.
RODRIGUES, G. Dados governamentais abertos no Brasil: surgimento, expansão e
perspectivas. São Paulo, 2012. Trabalho de Conclusão de Curso (Graduação em Gestão de
Políticas Públicas) - Escola de Artes, Ciências e Humanidades da Universidade de São Paulo,
2012.
RUEDIGER, M. A. Governo eletrônico ou governança eletrônica: conceitos alternativos
no uso das tecnologias de informação para o provimento de acesso cívico aos mecanismos de
governo e reforma do Estado. XVI Concurso de ensayos y monografias Del CLAD sobre
reforma Del estado y modernización de la administración pública “gobierno electrónico”.
Caracas, 2002. Disponível em:
<http://www.egov.ufsc.br/portal/sites/default/files/anexos/29564-29580-1-PB.pdf>. Acesso
em: 24 abr. 2012.
SALES,L. F.; SAYÃO, L. F.; MOTTA, D. F. Modelagem de relações conceituais para a área
nuclear. In. SEMINÁRIO DE PESQUISA EM ONTOLOGIAS DO BRASIL, 5, 2012,
Recife). Anais... Recife: UFPE, 2012.
SANT’ANA, R. C. G. Tecnologia e gestão pública municipal: mensuração da interação com
a sociedade. São Paulo: Cultura Acadêmica, 2009.
SANTOS NETO, A. et al. Tecnologias de dados abertos para interligar bibliotecas, arquivos e
museus: um caso machadiano. Transinformação, Campinas, v. 25, n. 1, 2013. Disponível
em: <https://www.puc-campinas.edu.br/periodicocientifico>. Acesso em: 26 maio 2013.
SANTOS, P. M. Teoria e prática de governo aberto: lei de acesso à informação nos
executivos municipais da região sul. Florianópolis: Fundação Boiteux, 2012.
165
SARACEVIC, T. Ciência da Informação: origem, evolução e relações. Perspec. Ci. Inf.,
Belo Horizonte, v. 1, n. 1, p. 41-62, jan./jun. 1996.
SAYÃO, L. F. Modelos teóricos em Ciência da Informação – abstração e método científico.
Ci. Inf., Brasília, v. 30, n. 1, p. 82-91, jan./abr. 2001. Disponível em:
<http://revista.ibict.br/ciinf/index.php/ciinf/article/view/228/203>. Acesso em: 22 maio 2013.
SCHEMA.ORG. [2014?]. Disponível em: <http://schema.org/>. Acesso em: 2 mar. 2014.
SCHERP, A. et al. F-A modelo f events based on the foundational ontology DOLCE+DnS
Ultralite. 2009. Disponível em: <http://west.unikoblenz.de/Research/ontologies/events/event-model-f-kcap.pdf>. Acesso em: 2 dez. 2013.
SENRA, N. C. Informação estatística: política, regulação, coordenação. Ci. Inf., Brasília, v.
28, n. 2, maio/ago. 1999. Disponível em: <http://www.scielo.br/ cielo.php?
script=sci_arttext&pid=S0100-19651999000200004>. Acesso em: 17 jan. 2013.
SENSO, J. A.; HÍPOLA, P. Creación de directorios de recursos Web con LDAP y RDF.
2007. Disponível em: <http://eprints.rclis.org/17347/1/senso-hipola-v1.0.pdf>. Acesso em: 18
abr. 2012.
SHADBOLT, N.; HALL, W.; BERNERS-LEE, T. The Semantic Web revisited. IEEE
Intelligent Systems, p. 96-101, May/Jun. 2006. Disponível em:
<http://eprints.soton.ac.uk/262614/1/Semantic_Web_Revisted.pdf>. Acesso em: 01 abr. 2012.
SILBERSCHATZ, A. ; KORTH, H. ; SUDARSHAN, S. Sistemas de bancos de dados. 3.ed.
São Paulo: Makron Books, 1999.
SILVA, D. L. da; SOUZA, R. R.; ALMEIDA, M. B. Comparação de metodologias para
construção de ontologias e vocabulários controlados. Ci. Inf., Brasília, v. 37, n. 3, p. 60-75,
set./dez, 2008. Disponível em: <http://www.scielo.br/pdf/ci/v37n3/ v37n3a05. pdf>. Acesso
em: 5 abr. 2013.
SILVA, F. C. Habermas e a esfera pública: reconstruindo a história de uma idéia. Sociologia,
problemas e práticas, n. 35, p. 117-138, 2001. Disponível em:
<http://www.scielo.gpeari.mctes.pt/scielo.php?pid=S087365292001000100006&script=sci_arttext>. Acesso em: 21 jan. 2013.
SILVA, T. L. DOLCE X UFO: comparativo entre ontologias de fundamentação. 2011.
Disponível em:
<http://greco.ppgi.ufrj.br/academico/moodledata/81/moddata/assignment/264/96/TrabalhoFin
al_v1.3.pdf>. Acesso em: 22 out. 2013.
SIMÃO, J. B., RODRIGUES, G. Acessibilidade às informações públicas: uma avaliação do
portal de serviços de serviço e informações do governo federal. Ci. Inf., Brasília, v. 34, n. 2,
p. 81-92, maio/ago. 2005. Disponível em: <http://www.scielo.br/pdf/ci/v34n2/28558.pdf>.
Acesso em: 25 mar. 2013.
166
SMITH, B.; KUMAR, A. Revisiting UMLS Semantic Network. In: FIESCHI, M. et al. (Eds.).
MEDINFO 2014, Amsterdam: IOS Press, 2004. Disponivel em:
<http://ontology.buffalo.edu/medo/UMLS_SN.pdf>. Acesso em: 20 mar. 2014.
SMITH, J. M.; SMITH, D. C. P. Database abstractions: aggregation and generalization. ACM
Transactions on database systems, v. 2, n. 2, p. 105-133, Jun. 1977.
SMITH, M. K.; WELTY, C.; MCGUINNESS, D. L. OWL: Web Ontology Language Guide.
2004. Disponível em: <http://www.w3.org/TR/2004/REC-owl-guide-20040210/>. Acesso
em: 2 fev. 2014.
SOBRAL, F. C. F.; CAMPOS, M. L. A. Modelaem conceitual como instrumento de
comunicação no processo de submissão de artigos de periódico eletrônico. In: ENCONTRO
NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 14., 2013, Florianópolis.
Anais... Brasília: ANCIB, 2013. Disponível em:
<http://enancib.sites.ufsc.br/index.php/enancib2013/XIVenancib/paper/viewFile/348/322>.
Acesso em: 10 dez. 2013.
SOUZA, F. C. S. As possibilidades pedagógicas no ensino de metodologia da pesquisa
científica em Ciência da Informação e os objetos deste campo científico: aproximações
durkheimianas. Enc. Bibli.: Eletr. Bibliotecon. Ci. Inf., Florianópplis, n. 16, jul./dez., 2003.
Disponível em: <http://eprints.rclis.org/8591/>. Acesso em: 24 mar. 2012.
SOUZA, R. R.; ALVARENGA, L. A Web Semântica e suas contribuições para a Ciência da
Informação. Ci. Inf. Brasília, v. 33, n. 1, p. 132-141, jan./abr. 2004.
SPERBERG-MCQUEEN, C. M.; THOMPSON, H. XML Schema. 2010. Disponível em:
<http://www.w3.org/XML/Schema>. Acesso em: 2 mar. 2014.
TAUILE. J. R. Uma introdução à economia política da informação. Ensaios FEE, Porto
Alegre, v. 2, n. 2, p. 89-108, 1981. Disponível em:
<http://revistas.fee.tche.br/ndex.php/ensaios/article/viewArticle/135>. Acesso em: 02 set.
2012.
TEOREY, T. J.; YANG, D.; FRY, J. A logical design methodology for relational databases
using the extended Entity-Relationship Model. Computing surveys, v. 18, n. 2, p. 197-222.
Jun. 1986.
THANEY, K. Sharing data on the Web. Nodalities: the magazine of the Semantic Web, v. 9,
p. 7-8, 2010.
THOMPSON, H. S. What’s a URI and why does it matter?. 2010. Disponível em:
<http://www.ltg.ed.ac.uk/~ht/WhatAreURIs/>. Acesso em: 5 mar. 2014.
UNITED NATIONS. Department of Economic and Social Affairs. United Nations EGovernment 2012: E-Government for the people. Ney York: United Nations, 2012.
Disponível em: <http://unpan1.un.org/intradoc/groups/public/documents/
un/unpan048065.pdf>.Acesso em: 21 abr. 2013.
167
UNITED STATES. Data.gov. 2013. Disponível em: <http://www.data.gov/about>. Acesso
em: 1 maio 2013.
USCHOLD, M.; GRÜNINGER, M. Ontologies: principles, methods, and applications.
Knownledge Enginnering Review, v. 1, p. 96-137, 1996. Disponível em:
<http://citeseerx.ist.psu.edu/viewdoc/summary? doi=10.1.1.111.5903>. Aceso em: 14 jan.
2012.
VALENTÍN RUIZ, F. J.; BUENESTADO DEL PESO, R. Aproximación al panorama actual
de la reutilización de la información del sector público. BID: textos universittaris de
biblioteconomia i documentación, Barcelona, n. 29, p. 1-36, dic. 2012. Disponível em: <
http://www.ub.edu/bid/29/valentin2.htm>. Acesso em: 4 mar. 2013.
VANDENBUSSCHE, P.-Y. Linked Open Vocabularies (LOV). [2014?]. Disponível em:
<http://lov.okfn.org/dataset/lov/index.html>. Acesso em: 2 mar. 2014.
VAZ, J. C.; RIBEIRO, M. M.; MATHEUS, R. Dados governamentais abertos e seus impactos
sobre os conceitos e práticas de transparência no Brasil. Cadernos PPG-AU/UFBA, v. 9, ed.
esp., p. 45-62, 2010. Disponível em: <http://www.portalseer.
ufba.br/index.php/ppgau/article/view/5111>. Acesso em: 28 jun. 2011.
VIEGAS, W. Fundamentos lógicos da metodologia científica. Brasília: UNB, 2007.
W3C. Escritório Brasil. Melhorando o acesso ao governo com melhor uso da Web. São
Paulo: W3C, 2009. Disponível em: <http://www.w3c.br/divulgacao/pdf/ gov-web.pdf>.
Acesso em: 28 jun. 2011.
W3C. Event. In: DUL ssn. 2005. Disponível em:
<http://www.w3.org/2005/Incubator/ssn/wiki/DUL_ssn#Event>. Acesso em: 15 dez. 2013.
W3C. SKOS Simple Knowledge Organization System: reference. 2009. Disponível em:
<http://www.w3.org/TR/2009/REC-skos-reference-20090818/>. Acesso em: 2 jun. 2013.
W3C. The Cambridge comunique: w3c note 7 October 1999. 1999. Disponível em:
<http://www.w3.org/TR/schema-arch>. Acesso em: 2 fev. 2014.
WELTY, C.; GUARINO, N. Supporting ontological analysis of taxonomic relationships.
Data & Knowledge Engineering, v. 39, p. 51-74, 2001.
WERSIG, G. Information Science: the study of postmodern knowledge usage. Information
Processing & Management, v. 29, n. 2, p. 229-239, 1993.
WIKILEAKS. What is WikiLeaks?. 2013. Disponível em: <http://wikileaks.org/About.html>.
Acesso em: 01 maio 2013.
WIKIPÉDIA. Crowdfunding. 2013a. Disponível em: <http://pt.wikipedia.org/wiki/
Financiamento_coletivo>. Acesso em: 24 abr. 2013.
WIKIPÉDIA. Crowdsourcing. 2013b. Disponível em: <http://pt.wikipedia.org/wiki/
Crowdsourcing>. Acesso em: 24 abr. 2013.
168
WIKIPÉDIA. Smart Grid. 2013c. Disponível em: <http://en.wikipedia.org/wiki/
Smart_grid>. Acesso em: 1 maio 2013.
XU, L.; LEE, S. W.; KIM, S. E-R Model based RDF data storage in RDB. In: IEEE
International Conference on Computer Science and Information Technology (ICCSIT) (3rd.,
2010, Chengdu). Proceedings… 2010. v. 9. Disponível em:
<http://ieeexplore.ieee.org/xpl/mostRecentIssue.jsp?punumber=5550976>. Acesso em: 2 mar.
2014.
ZILLER, J.; MANTOVANI, C. M. C. A.; SOUZA, R. R. Apontamentos para o futuro dos
sistemas de recuperação de informação. In: ENCONTRO NACIONAL DE PESQUISA EM
CIÊNCIA DA INFORMAÇÃO, 8, 2007, Salvador. Anais... Salvador: ANCIB, 2012.
ZUGMAN, F. Governo eletrônico. São Paulo: Livro Pronto, 2006.

Documentos relacionados