universidade federal do estado do rio de janeiro centro de ciências

Transcrição

UNIVERSIDADE FEDERAL DO ESTADO DO RIO DE JANEIRO
CENTRO DE CIÊNCIAS EXATAS E TECNOLOGIA
PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA
Identificação e Representação de Antipadrões de Correspondência em Ontologias
Anselmo Vicente Silva Guedes
Orientadoras
Fernanda Araujo Baião Amorim
Kate Cerqueira Revoredo
Rio de Janeiro, RJ - Brasil
Setembro de 2014
IDENTIFICAÇÃO E REPRESENTAÇÃO DE ANTIPADRÕES DE
CORRESPONDÊNCIA EM ONTOLOGIAS
Anselmo Vicente Silva Guedes
DISSERTAÇÃO
OBTENÇÃO
APRESENTADA
COMO
REQUISITO
DO TÍTULO DE MESTRE
PARCIAL
PELO PROGRAMA
PARA
DE PÓS-
GRADUAÇÃO EM INFORMÁTICA DA UNIVERSIDADE FEDERAL DO ESTADO
DO
RIO
DE
JANEIRO
(UNIRIO).
APROVADA
EXAMINADORA ABAIXO ASSINADA.
Aprovada por:
Rio de Janeiro, RJ - Brasil
Setembro de 2014
PELA
COMISSÃO
G924
Guedes, Anselmo Vicente Silva.
Identificação e representação de antipadrões de correspondência em
ontologias / Anselmo Vicente Silva Guedes, 2014.
225 f. ; 30 cm
Orientadora: Fernanda Araujo Baião Amorim.
Coorientadora: Kate Cerqueira Revoredo.
Dissertação (Mestrado em Informática) - Universidade Federal do
Estado do Rio de Janeiro, Rio de Janeiro, 2014.
1. Software - Desenvolvimento. 2. Ontologia. 3. Antipadrões de
correspondência. 4. Alinhamento inconsistente. 5. Framework (Programa de
computador). I. Amorim, Fernanda Araujo Baião. II. Revoredo, Kate Cerqueira.
III. Universidade Federal do Estado do Rio de Janeiro. Centro de Ciências Exatas
e Tecnológicas. Curso de Mestrado em Informática. IV. Título.
CDD – 005.1
iii
Agradecimentos
Agradeço primeiramente a Deus, por ter me dado a oportunidade de ingressar
nessa jornada assim como todas as condições de concluí-la. Agradeço imensamente a
minha esposa Luciana Maia, por ter estado ao meu lado por todo esse tempo, sempre me
incentivando, me dando forças, comemorando junto comigo as conquistas e me
apoiando nos momentos mais difíceis. Agradeço também a todo o corpo docente do
PPGI, qual sempre contribuiu para a conclusão desse trabalho, em especial às
professoras orientadoras Fernanda Baião e Kate Revoredo.
iv
GUEDES, Anselmo Vicente Silva. Identificação e Representação de Antipadrões de
Correspondência em Ontologias. UNIRIO, 2014. 225 Páginas. Dissertação de
Mestrado. Departamento de Informática Aplicada, UNIRIO.
RESUMO
A pesquisa e prática em ontologias têm se tornado muito popular, o que,
inevitavelmente, acaba por gerar uma diversidade de ontologias, que por muitas vezes
modelam o mesmo universo de discurso. No entanto, essas ontologias podem possuir
diferenças em diversas perspectivas. A área de alinhamento de ontologias lida com
essas diferenças, sendo considerado por muitos autores o elemento chave para a redução
da heterogeneidade entre as ontologias.
A tarefa de alinhamento de ontologias consiste na identificação de
correspondências corretas entre as entidades de múltiplas ontologias. Várias técnicas
podem ser utilizadas para identificar correspondências entre as entidades de duas
ontologias, no entanto, resultados atuais no estado da arte apontam que as mesmas não
são capazes de identificar todas as correspondências existentes entre duas ontoloigas e
ainda podem sugerir correspondências que não existem de fato. O estabelecimento de
correspondências inexistentes pode levar a incompatibilidades lógicas e/ou ontológicas.
Por outro lado, no contexto de desenvolvimento de software, antipadrões são
considerados uma valiosa ferramenta para a identificação de práticas ruins ou incorretas
no processo de desenvolvimento de software. Antipadrões previnem ou impedem uma
boa execução do processo de desenvolvimento e manutenção do software. No contexto
de alinhamento de ontologias, soluções ruins consistem em correspondências incorretas
ou problemáticas (incluindo a falta de correspondências). Um antipadrão de
correspondência é um modelo de alinhamento para a identificação de correspondências
problemáticas ou inconsistentes, que podem ocorrer repeditamente no processo de
v
alinhamento de ontologias. Um antipadrão de correspondência pode ser útil em vários
cenários em que o processo de alinhamento de ontologias é aplicado (como fusão de
ontologias e tradução de consultas), uma vez que auxilia no refino do alinhamento
produzido por uma ferramenta de alinhamentos de ontologias.
Neste trabalho é introduzido o conceito de antipadrões de correspondência de
ontologias e é apresentada uma metodologia para a identificação de antipadrões de
correspondência e sua representação computacional. Observando alinhamentos
disponibilizados pela OAEI (Ontology Alignment Evalutation Intiative), uma iniciativa
reconhecida que conduz campanhas anuais de avaliação de alinhamento de ontologias, a
metodologia para a identificação e construção de antipadrões de correspondência
proposta neste trabalho, foi aplicada sobre esses alinhamentos e como resultado gerouse um catálogo de antipadrões de correspondência. Além disso, este trabalho apresenta a
arquitetura de um framework de suporte ao processo de alinhamento de ontologias, o
qual pode ser utilizado como um recurso externo ao processo de alinhamento de
ontologias, de forma a verificar se uma correspondência é inconsistente, tomando como
base um catálogo de antipadrões previamente construído. Por fim, os antipadrões
construídos foram aplicados sobre uma segunda base de alinhamentos de ontologias
distinta da base utilizada para construção dos antipadrões de correspondência, também
disponibilizada pela OAEI, de forma a verificar sua aplicabilidade, tendo como
resultado geral
melhoria da qualidade dos alinhamentos avaliados em termos de
precião.
Palavras-chave: alinhamento de ontologias, antipadrões de correspondência,
alinhamento inconsistente, framework.
vi
ABSTRACT
As the research and practice on Ontology become more popular and evolve,
several ontology artifacts arise for the same universe of discourse. However, they differ
among each other in several perspectives. The Ontology Matching area deals with all
these problems, being considered by many authors the key element for heterogeneity
reduction between ontologies.
The Ontology Matching task consists in identifying the correct correspondences
among entities of multiple ontologies. A number of techniques can be used to identify
correspondences between the entities of two ontologies, however, current results of
state-of-the-art techniques are neither complete nor precise, i.e., they are not able to
identify all existing correspondences between two ontologies and sometimes suggest
correspondences that do not exist. With regard to precision errors, suggesting a
correspondence that does not exist may lead to either logical or ontological
incompatibilities.
On the other hand, in the context of software development, antipatterns are
considered a valuable tool for the identification of bad or incorrect practices in the
software development process. Antipatterns prevent or hamper a good execution of the
software development or maintenance process. In the context of ontology matching, bad
solutions consist of incorrect (including missing) or problematic correspondences. A
correspondence antipattern is a matching model for identifying problematic
correspondences that may occur repeatedly in ontology matching processes. A
correspondence antipattern may be useful in several scenarios in which Ontology
Matching is applied (such as in ontology merging, ontology comparison, query
translation), since it helps refining an alignment produced by an ontology matching tool.
vii
This work introduced the concept of ontology correspondence antipatterns and a
methodology for identifying correspondence antipatterns and its computational
representation. Looking for the alingments provided by OAEI (Ontology Alignment
Evalutation Intiative), the proposed methodology was applied on these alignments and
generated a catalog of correspondence antipatterns as its result. Furthermore, this work
presents the architecture of a framework supporting the ontology alignment process,
which can be used as an external resource to the ontolgy alignment process in order to
check whether a correspondence is inconsistent, building upon a correspondence
antipatterns catalog previously constructed. Finally, the correspondence antipatterns in
the catalog were applied on a secon set of ontology alignments distinct from the set of
ontology alignments were used for build the correspondence antipatterns, also provided
by OAEI, in order to verify its applicability. The general results are the better quality of
the alingments evaluated in terms of precision.
Keywords: ontology matching, correspondence antipatterns, inconsistent
alignment, framework.
viii
Sumário
1.
2.
3.
4.
Introdução .......................................................................................................................................... 15
1.1.
Motivação e Caracterização do Problema ............................................................................ 15
1.2.
Objetivos............................................................................................................................... 21
1.3.
Hipótese de Pesquisa ............................................................................................................ 23
1.4.
Metodologia da Pesquisa ...................................................................................................... 23
1.5.
Organização da Dissertação .................................................................................................. 24
Fundamentação Teórica ..................................................................................................................... 26
2.1.
Ontologias............................................................................................................................. 26
2.2.
Incompatibilidades Ontológicas ........................................................................................... 29
2.3.
Alinhamento de Ontologias .................................................................................................. 34
2.4.
Técnicas de Alinhamento de Ontologias .............................................................................. 38
2.5.
Qualidade do Alinhamento de Ontologias ............................................................................ 41
2.6.
Linguagens para Representação de Alinhamentos de Ontologias ........................................ 43
2.7.
Padrões de Projeto ................................................................................................................ 47
2.8.
Antipadrões de Projeto ......................................................................................................... 50
2.9.
Padrões de Correspondência de Ontologias .......................................................................... 52
Antipadrões de Correspondência de Ontologias ................................................................................ 56
3.1.
Definição de Antipadrões de Correspondência..................................................................... 56
3.2.
Processo de Identificação e Construção de Antipadrões de Correspondência ...................... 65
3.3.
Elementos da representação computacional de um antipadrão de correspondência ............. 69
Catálogo de Antipadrões de Correspondência ................................................................................... 74
4.1.
5.
6.
Buscando por Antipadrões de Correspondência ................................................................... 74
Framework de Antipadrões de Correspondência ............................................................................... 88
5.1.
Por que um Framework? ....................................................................................................... 88
5.2.
Arquitetura do Framework de Antipadrões de Correspondência .......................................... 89
Estudo de Caso: Aplicando os Antipadrões de Correspondência .................................................... 103
6.1.
Visão Geral ......................................................................................................................... 103
6.2.
Resultados Obtidos ............................................................................................................. 105
ix
7.
Trabalhos Relacionados ................................................................................................................... 119
7.1.
8.
9.
Revisão da Bibliografia ...................................................................................................... 119
Conclusão......................................................................................................................................... 126
8.1.
Considerações Finais .......................................................................................................... 126
8.2.
Principais Contribuições ..................................................................................................... 128
8.3.
Limitações da Proposta ....................................................................................................... 128
8.4.
Trabalhos Futuros ............................................................................................................... 129
Referências....................................................................................................................................... 131
10. Apêndice I - Catálogo de Antipadrões de Correspondência. ........................................................... 137
11. Apêndice II – Estudo de Caso .......................................................................................................... 153
12. Apêndice III – Estudo Baseado em Revisão Sistemática ................................................................. 168
x
Lista de Figuras
Figura 1 - Exemplo de um mapeamento de esquemas. Adaptado de [33] .................................................. 16
Figura 2 - Evolução da Medida-F de diferentes conjuntos de dados avaliados pela OAEI. ....................... 20
Figura 3 - Metamodelo de uma ontologia. Adaptado de [20] ..................................................................... 29
Figura 4 - Exemplos de representação de um conceito de formas diferentes. ............................................ 33
Figura 5 - Classificação das incompatibilidades ontológicas. Adaptado de [37]. ...................................... 34
Figura 6 - Exemplo de alinhamento entre duas ontologias. Adaptado de [45]. .......................................... 35
Figura 7 - Processo de alinhamento de duas ontologias [13]...................................................................... 36
Figura 8 – Fragmento da representação de um alinhamento entre as ontologias FOAF e vCard. .............. 38
Figura 9 - Classificação das técnicas de alinhamento de ontologias. Fonte: [13]. ...................................... 38
Figura 10 - Diagrama representando a composição de um padrão. ............................................................ 50
Figura 11 - Exemplo de padrão de correspondência “restrição de valor de atributo” ................................ 54
Figura 12 - Representação computacional na linguagem EDOAL do padrão de correspondência restrição
de valor de atributo” ................................................................................................................................... 54
Figura 13 - Exemplo de instância de um padrão de correspondência “restrição de valor de atributo”. ...... 55
Figura 14 - Fragmento de duas ontologias e um problema de alinhamento. .............................................. 57
Figura 15 - Exemplos de tipos de inferências de verificação semântica. (a) verificação de
correspondências de múltiplas entidades; (b) verificação de correspondências cruzada; (c) verificação de
contradição de disjunção-subsunção; (d) verificação de incompletude de domínio e intervalo. As setas de
linhas sólidas denotam as correspondências entre as entidades. ................................................................. 62
Figura 16 – Definição de um antipadrão de correspondência T a partir da generalização de um problema
de alinhamento do tipo verificação de contradição de disjunção-subsunção. ............................................. 64
Figura 17 - Representação computacional do antipadrão de correspondência T através da linguagem
EDOAL. ..................................................................................................................................................... 65
Figura 18 - Metodologia para construção de um antipadrão de correspondência. ...................................... 65
Figura 19 - Problema de alinhamento entre as ontologias ConfOf e Edas. ................................................ 78
Figura 20 - Generalização do problema de alinhamento Caso 1. ............................................................... 78
Figura 21 - Problema de alinhamento entre as ontologias Conference e Ekaw. ......................................... 79
Figura 23 - Problema de alinhamento entre as ontologias ConfOf e Ekaw. ............................................... 80
Figura 24 - Generalização do problema de alinhamento Caso 3 ................................................................ 80
Figura 25 - Problema de alinhamento entre as ontologias CMT e ConfOf. ............................................... 81
Figura 28 - Generalização do problema de alinhamento Caso 5 ................................................................ 82
Figura 29 - Problema de alinhamento entre as ontologias Edas e Iasted. ................................................... 83
Figura 31 - Problema de alinhamento entre as ontologias CMT e Conference. ......................................... 84
Figura 33 - Problema de alinhamento entre as ontologias Iasted e Sigkdd. ............................................... 85
xi
Figura 37 - Arquitetura de um framework de antipadrões de correspondência sob o ponto de vista de
processo de alinhamento de ontologias. ..................................................................................................... 91
Figura 38 - Pseudo-Arquitetura do framework de antipadrões de correspondência. .................................. 91
Figura 39 – Formulário Validar Correspondências ................................................................................... 92
Figura 40 – Formulário Identificar Falsos Positivos / Falsos Negativos - Individual ................................ 93
Figura 41 – Formulário Identificar Falsos Positivos / Falsos Negativos – Em lotes ................................. 93
Figura 42 – Formulário Manutenção OCA ................................................................................................. 94
Figura 43 – Formulário Manutenção de Ferramentas................................................................................ 94
Figura 44 – Formulário Manutenção de Eventos ....................................................................................... 95
Figura 45 – Formulário Manutenção de Ontologias .................................................................................. 95
Figura 46 - Classe OCAReasoner. .............................................................................................................. 96
Figura 47 - Classe Ontology. ...................................................................................................................... 99
Figura 48 - Classe Alignment. .................................................................................................................. 100
Figura 49 - Classe IncorrectCorrespondences. ......................................................................................... 101
Figura 50 - Modelo Relacional das entidades do framework de antipadrões de correspondência. .......... 102
Figura 51 - Correspondência 〈mouse:MA_0002446, human:NCI_C25444, ≡, _〉 ................................... 107
Figura 52 – Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos
alinhamentos originais e alinhamentos refatorados para o caso #1. ......................................................... 107
Figura 53 - Correspondência 〈cmt_en:c-8693270-2767092, iasted_nl:c-0447708-8078411, ≡, _〉 ......... 108
Figura 54 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos
Figura 55 - Correspondência 〈cmt_es:c-7650337-8286527, conference_pt:c-6123980-7251265, ≡, _〉 . 109
Figura 57 - Correspondência 〈biblio_101:book, biblio_101:collection, ≡, _〉 ......................................... 110
Figura 59 - Correspondência 〈biblio_101:shortName, biblio_221:name, ≡, _〉 ....................................... 111
Figura 61 - Correspondência 〈biblio_101:book, biblio_101:collection, ≡, _〉 ......................................... 112
Figura 63 - Correspondência 〈confOf_cz:c-1688149-7240940, confOf_nl:c-1180439-2483437, ≡, _〉 ... 113
Figura 65 - Correspondência 〈iasted_nl:c-0447708-8078411, sigkdd_fr:c-3448744-2358764, ≡, _〉 ..... 115
Figura 67 - Correspondência 〈confOf_nl:c-1180439-2483437, confOf_en:c-5701075-1274855, ≡, _〉 .. 116
Figura 69 - Correspondência 〈sigkdd_es:c-2763261-4560459, confOf_pt:c-1056766-4464703, ≡, _〉 ... 117
alinhamentos originais e alinhamentos refatorados para o caso #10. ....................................................... 117
Figura 71 - Gráfico com o percentual de melhoria das médias das métricas de Precisão, Cobertura e
Medida-F para cada caso analisado. ......................................................................................................... 118
xii
Lista de Tabelas
Tabela 1 - Resumo dos construtos da linguagem EDOAL. ........................................................................ 45
Tabela 2 – Comparativo entre as linguagens de alinhamento de ontologias. ............................................. 47
Tabela 3 – Modelo de Pseudo Antipadrão .................................................................................................. 51
Tabela 4 – Modelo de Mini Antipadrão ..................................................................................................... 51
Tabela 5 – Modelo de Antipadrão Completo ............................................................................................. 51
Tabela 6 – Modelo de antipadrão de correspondência representando um problema de alinhamento. ........ 67
Tabela 7 – Antipadrão de Correspondência OCA01. ................................................................................. 68
Tabela 8 - Correspondências incorretas identificadas no conjunto de alinhamentos selecionado. ............. 76
Tabela 9 – Descrição das tabelas utilizadas pelo framework. .................................................................. 101
Tabela 10 - Grupo de correspondências incorretas selecionado para o estudo de caso. ........................... 105
Tabela 11 – Trabalhos selecionados após a execução do protocolo de revisão. ....................................... 120
Tabela 12 - Correlação dos trabalhos selecionados com as questões de pesquisa. ................................... 121
Tabela 13 – Antipadrão de correspondência OCA01 ............................................................................... 137
Tabela 18 – Antipadrão de correspondência OCA05(a) ........................................................................... 143
Tabela 19 – Antipadrão de correspondência OCA05(b) .......................................................................... 145
Tabela 24 – Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #1
.................................................................................................................................................................. 153
Tabela 25 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #1
após sua refatoração. ................................................................................................................................ 153
.................................................................................................................................................................. 154
Tabela 28 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #3.
.................................................................................................................................................................. 156
.................................................................................................................................................................. 157
xiii
.................................................................................................................................................................. 158
.................................................................................................................................................................. 159
.................................................................................................................................................................. 160
.................................................................................................................................................................. 162
.................................................................................................................................................................. 163
Tabela 42 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso
#10. ........................................................................................................................................................... 165
Tabela 44 - Trabalhos selecionados após a execução do protocolo de revisão. ....................................... 177
Tabela 45 - Correlação dos trabalhos selecionados com as questões de pesquisa. ................................... 178
Tabela 46 – Relação completa de trabalhos retornados pelas expressões de busca. ................................. 178
xiv
1. Introdução
Este capítulo fornece uma visão geral da dissertação, apresentando a motivação
para a melhoria do processo de alinhamento de ontologias, bem como uma breve
descrição do enfoque da solução proposta, que inclui a definição de antipadrões de
correspondência e sua utilização como recurso no processo de alinhamento de
ontologias. A hipótese que norteia a pesquisa e a metodologia utilizada para validá-la
também são aqui apresentadas.
1.1.
Motivação e Caracterização do Problema
A tecnologia de banco de dados foi introduzida nas organizações no final da
década de 1960, de uma forma inicialmente simples, para fornecer suporte às aplicações
de negócios que eram demandadas de tais organizações [1]. Conforme o número de
aplicações e repositório de dados rapidamente cresciam, a necessidade de integração dos
dados que eram produzidos de forma isolada era cada vez mais aparente. Integração de
dados nesse contexto pode ser definida como a combinação de dados que residem em
diferentes fontes autônomas e heterogêneas, com o objetivo de prover ao usuário final
uma visualização unificada e reconciliada desses dados [2]. Como consequência, as
primeiras abordagens de integração de dados surgiram na década de 1980 na forma
sistemas de multi-bancos de dados [3]. A evolução das abordagens de integração de
dados seguiu através de sistemas mediadores [4] e de sistemas agentes [5] para
15
tecnologias que utilizam abordagens peer-to-peer (P2P) [6] e sistemas baseados em web
services [7].
Para operacionalizar a integração de dados, uma das estratégias é estabelecer
mapeamentos que traduzam informações e estruturas entre as fontes envolvidas.
Estabelecer mapeamentos (associações) entre dados de diferentes esquemas está no
centro de várias tarefas de integração e compartilhamento de dados. Dado um esquema
de origem S e um esquema de destino T, um mapeamento de dados M é a especificação
de uma relação entre as instâncias de S e as instâncias de T [33]. A Figura 1 ilustra dois
esquemas que representam visões diferentes sobre uma organização (S e T). As setas
pontilhadas indicam o mapeamento entre as entidades do esquema S e o esquema T. De
acordo com Fuxman e Miller [33], esse mapeamento é o suficiente para dizer como as
instâncias de S e T são relacionadas. Analisando, por exemplo, o mapeamentos entre
companies.name e organizations.code, temos que uma instância que ocorre em
companies.name também pode ocorrer em organizations.code.
Figura 1 - Exemplo de um mapeamento de esquemas. Adaptado de [33]
As abordagens iniciais de integração de dados eram baseadas em modelos de
dados relacionais e realizadas através de soluções rígidas, provendo um único esquema
16
de dados global [1]. Para superar as limitações com relação a aspectos de abstração,
classificação e taxonomias, abordagens de integração orientadas a objetos foram
adotadas para executar a integração de dados e homogeneizar a estrutura dos esquemas
envolvidos. Com o advento da internet e tecnologias web, o foco mudou de integrar
dados puramente bem estruturados para também incorporar dados semi-estruturados e
não estruturados. Contudo, integração de dados é muito mais que um problema
estrutural ou técnico. Ocorre que cada vez mais há a demanda de integrar dados
descritos por diferentes modelos de dados, o que levam a problemas causados devido à
semântica dos dados ser diferentes. Semânticas explícitas e precisas dos dados que
necessitam ser “integrados” são essenciais para que o resultado da integração seja
semanticamente correto e significativo.
Segundo Ziegler e Dittrich [1], na área de banco de dados, semântica pode ser
considerada como a interpretação das pessoas sobre os dados e seu esquema de acordo
com seu entendimento sobre o mundo em certo contexto. Na integração de dados,
considera-se a semântica do mundo real, visando o mapeamento de objetos do modelo
computacional em objetos do mundo real e tratando questões que envolvem a
interpretação humana, ou significado e uso dos dados ou informação [10]. Nesse
contexto, a integração semântica de dados é a tarefa de agrupar, combinar ou completar
dados de diferentes fontes levando em consideração a semântica explícita e precisa do
dado a fim de evitar que dados semanticamente incompatíveis sejam estruturalmente
combinados. Isso significa que a integração semântica garante que somente dados
relacionados ao mesmo conceito do mundo real, ou a conceitos suficientemente
similares, sejam combinados. Ziegler e Dittrich [1] afirmam ainda que um pré-requisito
para que se possa alcançar a integração semântica é resolver o problema de
ambiguidade semântica sobre os dados que serão integrados, por meio do uso de
17
metadados explícitos que elucidem suposições implícitas e subjacentes ao contexto da
informação. Uma forma de representar o conhecimento de um domínio é através do uso
de ontologias. Uma ontologia pode ser definida como a descrição explícita e formal de
conceitos e seus relacionamentos que existem em certo universo de discurso, junto com
vocabulário que referem a esses conceitos [11]. Comparada com outros esquemas de
classificação, como taxonomias ou tesauros, por exemplo, ontologias permitem
construir modelos mais completos e precisos. Segundo Ziegler e Dittrich [1] ontologias
podem ser utilizadas para expressar a semântica das fontes de dados para sua integração.
Cruz e Xiao [16] classificam 3 tipos de abordagens de integração que fazem uso de
ontologias: na abordagem de ontologia simples, todos os esquemas de fontes de dados
são diretamente relacionados a uma ontologia global e compartilhada, que fornece uma
interface única e uniforme para o usuário; na abordagem de múltiplas ontologias, cada
fonte de dados é descrita por sua própria ontologia (local) separadamente e, ao invés de
utilizar uma ontologia comum para todas as fontes de dados, as ontologias são
mapeadas entre si indicando a correspondência entre seus conceitos; a abordagem
híbrida é uma combinação das duas abordagens anteriores, em que cada fonte local é
descrita por sua própria ontologia que mapeia ontologias locais identificando a
correspondência entre seus conceitos, e uma nova ontologia global e compartilhada é
gerada a partir desses mapeamentos.
Nas abordagens de múltiplas ontologias e híbrida, é necessário que o
mapeamento entre os elementos das ontologias envolvidas seja realizado. O processo de
identificar um conjunto de correspondências (ou mapeamentos) entre elas é chamado de
alinhamento de ontologias [17]. Além da aplicabilidade dentro do problema de
integração de dados, ontologias são comumente utilizadas na web semântica, em
diversas áreas de inteligência artificial, em questões de processamento de linguagem
18
natural, dentro da engenharia de software, dentre outros [14] [15] [16]. Com essa
diversidade de cenários para a aplicação do uso das ontologias, é inevitável que haja
uma heterogeneidade semântica dos domínios representados por cada ontologia.
Realizar o alinhamento de ontologias é uma das etapas necessárias para superar
essa heterogeneidade semântica entre os domínios de cada ontologia [17]. O processo
de alinhamento de ontologias visa encontrar correspondências entre as entidades
(classes, relações e indivíduos) de cada ontologia e denota uma força para cada
correspondência encontrada.
No estado da arte dos algoritmos de alinhamento de ontologias, estes não são
capazes de realizar a descoberta de correspondências complexas entre as entidades de
duas ontologias [21], ou ainda, deixam de identificar correspondências existentes entre
duas ontologias. A Iniciativa de Avaliação de Alinhamento de Ontologias (Ontology
Alignment Evaluation Initiative – OAEI 1) conduz campanhas anuais de avaliação de
ferramentas de alinhamento de ontologias. A Figura 2 apresenta a evolução da média da
Medida-F (F-Measure) desde o início da OAEI em todos os conjuntos de dados
disponibilizados para avaliação. A Medida-F é uma média que representa a
harmonização entre a precisão e a cobertura do alinhamento obtido, e, segundo Erigh
[19], pode ser a medida principal para avaliar a qualidade de um alinhamento. Mesmo
com a busca contínua pela evolução e melhoria dos sistemas de alinhamentos, é
possível verificar através da Figura 2 que estes, por si só, não conseguem ainda resolver
todos os problemas de correspondências.
1
http://oaei.ontologymatching.org/
19
Figura 2 - Evolução da Medida-F de diferentes conjuntos de dados avaliados pela OAEI.
Um dos desafios apontados por Euzenat e Shvaiko [17], ao realizarem uma
análise da situação atual e perspectivas da área de alinhamento de ontologias, é a
criação de ambientes e ferramentas que possam armazenar e disponibilizar alinhamentos
de forma padronizada. O alinhamento de ontologias pode ser considerado como um
problema de design [20], uma vez que surgem diferentes ontologias para expressar
semânticas similares. Como qualquer tipo de problema de design, é provável que surjam
padrões decorrentes das regularidades identificadas durante repetidas tarefas de
alinhamento. Portanto, um padrão de correspondência representa uma solução genérica
para uma configuração particular de relações das entidades de duas ontologias que estão
sendo alinhadas [20]. Padrões de correspondência podem ser visualizados como
abstrações de um alinhamento, fornecendo um modelo genérico que pode ser
instanciado com as entidades que compõem cada ontologia que está sendo alinhada
[20].
20
A utilização de padrões de correspondência auxilia na identificação de
correspondências que as ferramentas de alinhamento de ontologias não são capazes de
identificar, mas não impede que tais ferramentas identifiquem correspondências
incorretas durante o processo de alinhamento. Tais correspondências incorretas quando
instanciadas, podem levar a modelos semanticamente inválidos. Desta forma, é
necessário definir novos recursos para o processo de alinhamento de forma a auxiliar as
ferramentas a decidir se uma correspondência identificada é semanticamente válida, ao
ser instanciada no mapeamento realizado entre as ontologias alinhadas.
O problema que este trabalho visa resolver é: como promover o aumento da
precisão de um alinhamento previamente definido entre duas ontologias?
1.2.
Objetivos
O objetivo geral da pesquisa é melhorar a qualidade do alinhamento final entre
as ontologias, realizado de forma automática. Para tal, uma das possíveis formas é
identificar se uma correspondência identificada por uma ferramenta de alinhamento de
ontologias é de fato válida.
Um antipadrão de projeto representa a descrição de uma solução dada a um
problema recorrente que gera, definitivamente, consequências negativas [22]. Quando
devidamente documentado, um antipadrão descreve a solução de forma geral, as causas
primárias que levam à solução problemática, sintomas que descrevem como reconhecer
o antipadrão, consequências do uso dessa solução e uma solução refatorada que pode
mudar o antipadrão em uma solução mais adequada.
Um antipadrão de correspondência pode ser definido como um conjunto de
correspondências e/ou não correspondências genéricas e de domínio independente que
representam um alinhamento incorreto entre duas ontologias. Uma correspondência
21
genérica é um modelo de correspondência, no qual as entidades correspondentes não
estão instanciadas. Dessa forma, um antipadrão de correspondência representa cenários
em que todas as instanciações possíveis de um alinhamento são incorretas. Antipadrões
de correspondência atuam como modelos que objetivam identificar correspondências
incorretas entre as entidades de duas ontologias.
Neste trabalho será definido o conceito de antipadrões de correspondências e
será apresentada uma metodologia para identificação, construção e sua representação
computacional. Além disso, para oferecer suporte aos mecanismos de alinhamento, o
presente trabalho propõe um framework de antipadrões de alinhamento, assim como a
identificação e operacionalização dos antipadrões de correspondência de ontologias
através de uma linguagem de representação de alinhamentos e a reutilização dos
mesmos, como recurso no processo de alinhamento de ontologias.
Como desdobramento desse objetivo, os seguintes objetivos específicos foram
definidos:

Definição formal do conceito de antipadrão de correspondência e
metodologia para sua construção.

Elaboração de um catálogo de antipadrões de correspondência, através da
análise de repetidas correspondências incorretas estabelecidas por
ferramentas de alinhamento de ontologias e do conhecimento tácito de
autores da área de alinhamento de ontologias.

Desenvolvimento de um framework de suporte ao processo de
alinhamento
de
ontologias
correspondência.
22
para
aplicação
de
antipadrões
de
1.3.
Hipótese de Pesquisa
A hipótese que norteia a pesquisa pode ser enunciada da seguinte forma: Se
antipadrões de correspondência forem aplicados como recursos no processo
automático de alinhamento de ontologias, então haverá uma maior precisão no
resultado final deste processo.
A qualidade do resultado final do processo de alinhamento de ontologias é
tradicionalmente avaliada utilizando as métricas de precisão e cobertura, e a média
harmônica entre elas, a medida F [19].
Ao utilizar antipadrões de correspondência como recurso no processo de
realização do alinhamento de ontologias, espera-se que haja uma melhora na métrica de
precisão e por consequência, na medida F; caso não haja, ou ainda, o resultado seja o
oposto, a hipótese será falseada.
1.4.
Metodologia da Pesquisa
A fim de obter uma referência atualizada dos estudos sobre padrões e
antipadrões para alinhamento de ontologias, foi realizado um estudo baseado em revisão
sistemática, conforme apresentado por Santos et al. [34], procurando reduzir o viés de
uma revisão informal. O protocolo utilizado para o estudo teve como base o trabalho
também desenvolvido por Santos et al. [34] e é detalhado no Apêndice III. O método de
pesquisa utilizado para avaliação dos resultados foi o experimento quantitativo. O
experimento foi aplicado utilizando a base de dados de benchmark disponibilizada pela
iniciativa Ontology Alignment Evaluation Initiative (OAEI). A OAEI é uma iniciativa
internacional que possui como objetivo avaliar, dentre outras questões, qualitativamente
ferramentas de alinhamento de ontologias. Dentro dessa base dados existem diversos
23
domínios de conhecimento, onde para cada domínio existe um grupo específico de
ontologias que modelam esse mesmo domínio.
Alguns grupos de ontologias, chamados de trilhas pela OAEI, foram analisadas
para a construção dos antipadrões de correspondência. Nas trilhas que não foram
utilizadas para a construção dos antipadrões de correspondência, um grupo de
alinhamentos encontrados, sem qualquer interferência da presente proposta (grupo de
controle) foi comparado com o grupo de alinhamentos encontrados utilizando os
antipadrões de correspondência de ontologias propostos (grupo experimental). Os dados
coletados foram a precisão e Medida-F dos alinhamentos realizados. Como fontes de
dados serão utilizadas todas as trilhas disponibilizadas pela OAEI das campanhas de
2011.5, 2012 e 2013. Os resultados foram analisados de acordo com os alinhamentos
obtidos com e sem a utilização dos padrões de alinhamento de ontologias. O método de
análise dos dados foi através de análise estatística e têm-se como resultados esperados o
aumento dos valores de precisão e medida-F.
1.5.
Organização da Dissertação
Esta dissertação está organizada em 8 capítulos, sendo o primeiro esta
Introdução. No Capítulo 2 é apresentada toda fundamentação teórica necessária para
contextualização da proposta de pesquisa deste trabalho, onde são abordados os
conceitos de Ontologias, Incompatibilidades Ontológicas, Alinhamento de Ontologias,
Padrões e Antipadrões de Projeto e Padrões de Projeto de Correspondência de
Ontologias. O Capítulo 3 apresenta formalmente o conceito de antipadrões de
correspondência assim como a metodologia proposta para a identificação e construção
de antipadrões de correspondência. Além disso, são apresentados os elementos da
linguagem computacional utilizada para a representação dos antipadrões de
24
correspondência. No Capítulo 4 é apresentado o catálogo de antipadrões de
correspondência gerado a partir da aplicação da metodologia proposta no capítulo
anterior, ilustrando o passo-a-passo utilizado para sua construção. O Capítulo 5
apresenta a arquitetura proposta para um framework de suporte à utilização de
antipadrões de correspondência, o Framework de Antipadrões de Correspondência. No
Capítulo 6 é apresentado um estudo de caso, no qual foram aplicados os antipadrões de
correspondência construídos, e os resultados obtidos. O Capítulo 7 apresenta um resumo
da revisão da bibliografia sobre o tema em questão e os trabalhos relacionados à
proposta dessa dissertação. Por fim, o Capítulo 8 apresenta a conclusão deste trabalho.
25
2. Fundamentação Teórica
Este capítulo apresenta os conceitos necessários para compreensão da proposta
de pesquisa deste trabalho. É apresentado o conceito de ontologia no sentido
computacional, as incompatibilidades ontológicas que podem ocorrer ao se alinhar
duas ontologias, a problemática do alinhamento de ontologias assim como uma
definição formal de seu processo, técnicas existentes para sua execução e métricas para
sua avaliação e por fim apresenta uma linguagem para representação de um
alinhamento entre duas ontologias. São apresentados ainda os conceitos de padrões, e
antipadrões de projeto e padrões de correspondência de ontologias.
2.1.
Ontologias
Etimologicamente, ont vem do verbo Grego einai (ser), dessa forma a palavra
latina Ontologia (ont + logia) pode ser traduzida como “o estudo da existência” [23]. O
dicionário Aurélio da língua portuguesa apresenta a seguinte definição para a palavra
ontologia [35]: “parte da filosofia que trata do ser enquanto ser, isto é, do ser
concebido como tendo uma natureza comum que é inerente a todos e a cada um dos
seres”. O termo ontologia foi introduzido na filosofia no século XIX pelo filósofo
Rudolf Gockel, em seu Lexicon Philosophicum, para distinguir o estudo do “ser” de
outros tipos de estudos da existência do ser nas ciências naturais [23]. Como uma
disciplina filosófica, ontologia está preocupada em prover sistemas de categorização
26
que consideram certo tipo de visão do mundo [12], e objetiva desenvolver teorias sobre,
por exemplo, persistência e mudança, classificação e instanciação, casualidade, dentre
outras.
A definição mais frequente de ontologia na ciência da computação é de Gruber
[11]: “uma ontologia é uma especificação explícita e formal de uma conceitualização
compartilhada”. A noção de conceitualização colocada por Gruber pode ser
interpretada na forma de um corpo que é formalmente representado por objetos,
conceitos e outras entidades que assumem sua existência em alguma área de interesse e
os relacionamentos entre eles. Uma conceitualização é uma visualização abstrata e
simplificada do mundo que se deseja representar para algum propósito. Em aplicações
práticas, é necessário utilizar uma linguagem para referir-se aos elementos de uma
conceitualização, ou seja, a linguagem utilizada deve ser aderente à conceitualização
estabelecida de forma a garantir que os símbolos utilizados são interpretáveis de acordo
com essa conceitualização. Por exemplo, a linguagem utilizada tem que garantir que
para pessoas que não dominam o idioma inglês o termo cooperates-with não será
interpretado como correspondente à conceitualização de reports-to, e vice versa.
Tipicamente uma conceitualização está na mente das pessoas, ou seja, está implícita. A
linguagem que será utilizada para representar a conceitualização desejada deve ser
explícita de forma a representar todos os estados possíveis do universo de discurso que
está modelado. Uma maneira efetiva de especificar uma conceitualização é fixar uma
linguagem e restringir as interpretações dessa linguagem de uma maneira intencional
através de axiomas adequados. Por exemplo, em um domínio organizacional que trata
das relações entre os funcionários de um departamento, é possível escrever simples
axiomas estabelecendo que reports-to é um relacionamento assimétrico e intransitivo,
enquanto cooperates-with é um relacionamento simétrico, irreflexivo e intransitivo.
27
Uma ontologia é justamente um conjunto desses axiomas, isto é, teorias lógicas
desenvolvidas a fim de capturar a intenção dos modelos correspondentes a uma
determinada conceitualização e excluir o que não é desejado nesses modelos. Os
axiomas
utilizados
para
especificar
intencionalmente
e
explicitamente
uma
conceitualização podem ser representados por uma linguagem formal. Formal nesse
sentido refere-se ao fato que devem ser interpretáveis computacionalmente, de forma
que linguagens naturais não são consideradas.
A característica distintiva das ontologias de outras representações é a existência
de um modelo teórico semântico: ontologias são teorias lógicas [13]. A interpretação
das ontologias não é deixada para os usuários que leem os diagramas ou aos sistemas de
gestão de conhecimento, a ontologia é especificada explicitamente. A semântica fornece
as regras para interpretação da sintaxe que não fornece o significado diretamente, mas
restringe as possíveis interpretações do que é declarado. A semântica das ontologias
pode ser restrita por axiomas adicionais, ou seja, asserções lógicas que são consideradas
verdadeiras. Isto pode ser em algumas linguagens, a oportunidade de aumentar a
expressividade do conceito, como por exemplo, uma autobiografia é uma biografia cujo
tema é o autor, que pode ser representado em lógica de primeira ordem [13] como:
x, autobiografia(x)  ∃y; pessoa(y)  autor(x, y)  tema(x, y)
Classes, atributos, relações e instâncias podem ser considerados como a primeira
classe de elementos de uma ontologia [20], desse modo uma ontologia O é uma tupla
O=C, R, P, I, a, onde C é um conjunto de classes, R é um conjunto de relações entre
as classes, P é um conjunto de propriedades entre classes e tipos de dados, I é um
conjunto de instâncias e a é um conjunto de axiomas.
Uma classe modela conceitos como objetos que descrevem um domínio.
Instâncias de classes são objetos concretos. Uma propriedade é um tipo específico de
28
relacionamento cujo domínio é uma classe e o intervalo é um tipo de dado. Relações são
relacionamentos estabelecidos entre qualquer par de classes. Para cada relação é
atribuído um domínio e um intervalo como classes de origem e destino na relação.
Também são consideradas três relações de subsunção estabelecidas, respectivamente,
entre duas Classes, duas Propriedades e duas Relações. Essas relações permitem
modelar
descrições
hierárquicas
dessas
entidades,
nomeadas
de
subclasses,
subpropriedades e subrelações. Também é possível referir-se ao inverso dessas relações:
superclasses, superpropriedades e superrelações. A Figura 3 representa o metamodelo
associado ao modelo de uma ontologia.
Figura 3 - Metamodelo de uma ontologia. Adaptado de [20]
Uma assinatura S de uma ontologia é uma quádrupla S = C’, P’, R’, I’ onde C’
é um subconjunto de C, P’ é um subconjunto de P, R’ é um subconjunto de R, e I’ é um
subconjunto de I [49].
2.2.
Incompatibilidades Ontológicas
Ontologias podem diferir em diversos aspectos. Existem várias pesquisas que
lidam com a categorização das incompatibilidades ontológicas [36] [37] [20]. As
incompatibilidades que podem ocorrer entre as ontologias podem ser a chave de
diversos problemas que impedem a utilização combinada de ontologias desenvolvidas
29
de forma independente. De acordo com Klein [36], tais incompatibilidades podem ser
distinguidas em dois níveis. O primeiro é o nível de linguagem ou meta-modelo. Este é
o nível da linguagem primitiva que é utilizada para especificar uma ontologia.
Incompatibilidades nesse nível são incompatibilidades entre os mecanismos que
definem classes, relações e outros. O segundo nível é o nível de ontologia ou modelo,
onde a atual ontologia de domínio reside. A incompatibilidade nesse nível é a diferença
na maneira em que o domínio é modelado.
Predoiu et al. [37] lista uma exaustiva classificação das incompatibilidades
ontológicas que podem ocorrer. Seu trabalho tem como base as classificações de Klein
[36] e Wache [38]. Os tipos de imcompatibilidades ontológicas descritos a seguir foram
identificados por Predoiu et al. [37] e compiladas por Scharffe [20].
Incompatibilidades no nível de linguagem: Incompatibilidades no nível de
linguagem podem ocorrer quando ontologias escritas em diferentes linguagens de
ontologias são combinadas. Foram definidos quatro tipos de incompatibilidades que
podem ocorrer [37].

Sintaxe: Diferentes linguagens de ontologias utilizam diferentes sintaxes. Por
exemplo, para definir uma classe cadeira em RDF Schema (Brickley e Guha
2000) utiliza-se <rdf:Class ID=”Cadeira”>, ao passo que a definição da
mesma classe em LOOM2 utiliza-se a expressão (defconcept Cadeira). Esta
diferença é provavelmente o tipo mais simples de incompatibilidade.

Representação Lógica: Uma incompatibilidade um pouco mais complicada
nesse nível é a diferença na representação das noções lógicas. Por exemplo, em
algumas linguagens é possível explicitar que duas classes são disjuntas
(exemplo: disjoint Cadeira Mesa), ao passo que é necessário utilizar
2
http://www.isi.edu/isd/LOOM/
30
negação na declaração de subclasses em outras linguagens (exemplo: Cadeira
subclasse-of (NOT Mesa), Mesa subclasse-of (NOT Cadeira)).

Semântica das primitivas: a mais sutil diferença que pode ocorrer ao nível de
linguagem é a semântica de seus construtos. Apesar do fato de algumas vezes a
mesma nomenclatura ser utilizada para um construto em duas linguagens, sua
semântica pode ser diferente; por exemplo, pode haver várias interpretações para
A equalsTo B.

Expressividade da Linguagem: A incompatibilidade ao nível de linguagem
que possui maior impacto é a diferença na expressividade entre duas linguagens.
Essa diferença implica que em algumas linguagens é possível expressar coisas
que não são expressáveis em outras linguagens. Por exemplo, algumas
linguagens podem conter construtos que expressam negação e outras não.
Incompatibilidades no nível de ontologias: Incompatibilidades ao nível de
ontologias, ou modelo, ocorrem entre duas ou mais ontologias que descrevem
(parcialmente) domínios sobrepostos. Em [37] foram mapeados três principais tipos de
incompatibilidades ao nível de modelo, que por sua vez possuem algumas variações,
conforme apresentado a seguir.
Incompatibilidade de Conceitualização: Neste tipo de incompatibilidade, as
ontologias são semanticamente diferentes, isto é, não somente a especificação, mas
também a conceitualização do domínio das ontologias envolvidas são diferentes.
Incompatibilidades de conceitualização não podem ser resolvidas automaticamente, pois
requerem o conhecimento e decisões de um especialista do domínio. Dois subtipos
podem ser identificados:

Escopo: Duas classes parecem representar o mesmo conceito, mas não podem
possuir as mesmas instâncias em nenhum estado possível do universo de
31
discurso sendo modelado, embora possa haver interseção entre elas. Também
pode ser chamada de incompatibilidade de classe.

Cobertura do modelo e granularidade: Essa é uma incompatibilidade na parte
do domínio que é coberto pelas ontologias, ou nível de detalhe em que o
domínio é modelado. Um exemplo seria o domínio de automóveis: uma
ontologia pode lidar com carros, mas não caminhões. Outra ontologia pode
representar caminhões, mas especializando os automóveis em algumas
categorias.
Incompatibilidades de Explicação: Estes tipos de incompatibilidades estão
diretamente relacionados à forma como as ontologias foram desenvolvidas, possuindo
três subtipos:

Estilo de Modelagem: Dois tipos de incompatibilidade podem ocorrer devido a
escolhas explícitas do modelador do domínio de acordo com o estilo de
modelagem adotado:
o Paradigma:
Diferentes
paradigmas
podem
ser
utilizados
para
representar conceitos como tempo, ação, planos, atitudes proposicionais,
etc. O uso de ontologias de alto nível distintas para cada ontologia [26] é
um exemplo desse tipo de incompatibilidade.
o Descrição do conceito: Várias escolhas podem ser feitas na modelagem
de conceitos em uma ontologia. Por exemplo: uma distinção entre duas
classes poderia ser modelada utilizando uma classe única, com um
atributo qualificador. Outra escolha na descrição do conceito é a maneira
em que a hierarquia “é-um” (is-a) é construída; distinções entre
características podem ser maiores ou menores na hierarquia. Por
exemplo, a distinção entre publicações científicas e não científicas pode
32
ser realizada de formas diferentes conforme ilustrado nas Figuras 4(a) e
4(b).
Figura 4 - Exemplos de representação de um conceito de formas diferentes.

Incompatibilidades Terminológicas: Esse tipo de incompatibilidade pode
ocorrer devido aos termos utilizados nos conceitos das ontologias e podem ser
classificados como:
o Termos Sinônimos: Conceitos modelados com a mesma intenção são
representados por diferentes nomes. Um exemplo trivial é o uso do termo
“carro” em uma ontologia e o termo “automóvel” em outra ontologia.
o Termos Homônimos: O significado de um termo é diferente em outro
contexto. Por exemplo, o termo “condutor”, no domínio de música,
possui significado diferente em um domínio de engenharia elétrica.

Incompatibilidades de Codificação: Valores em ontologias podem ser
codificados em diferentes formatos. Por exemplo, uma data pode ser
representada como “dd/mm/yyyy” ou como “mm-dd-yy”, distâncias podem ser
representadas em quilômetros ou milhas, etc.
A Figura 5 consolida a classificação das incompatibilidades ontológicas,
segundo Predoiu et al. [37].
33
Figura 5 - Classificação das incompatibilidades ontológicas. Adaptado de [37].
2.3.
Alinhamento de Ontologias
Alinhar alguma coisa significa “dispor em linha reta; colocar lado a lado na
mesma linha” [35]. Esta breve definição já enfatiza que alinhar é uma atividade envolve
objetos que possuem alguma relação mútua. O objetivo de alinhar duas ou mais
ontologias é reduzir a heterogeneidade entre elas. Alinhamento de ontologias ocorre no
sentido de identificar correspondências semânticas entre as entidades de múltiplas
ontologias e é uma condição necessária para estabilizar a interoperabilidade entre elas
[19].
Alinhar duas ontologias torna-se útil quando dados de uma ontologia são
necessários ser descritos em outra de diferentes formas, tais como: transformação de
dados de uma descrição para outra, transformação de consultas endereçadas para uma
ontologia para consultas em outras ontologias. Este processo é chamado de mediação de
ontologias [20]. Em alguns casos, mediação de ontologias pode também estar
relacionada com a execução de operações na estrutura das ontologias, tal como a fusão
de ontologias, relacionando duas versões de uma ontologia.
Alinhamento de ontologias é uma disciplina que possui raízes no domínio de
integração de bancos de dados, com algumas diferenças, sendo uma das principais pelo
34
fato que estruturas de ontologias são estruturas taxonômicas com a semântica mais rica
do que esquemas de bancos de dados relacionais [20].
Considerando o alinhamento ilustrado na Figura 6, as arestas pontilhadas
indicam correspondências entre as ontologias O e O’. Neste exemplo, é apresentado que
existe uma correspondência entre os elementos Carro e Automóvel das ontologias O e
O’ respectivamente. Além disso, é possível indicar o grau de confiança (também
chamado de força) de cada correspondência, através da atribuição de peso à aresta. A
confiança da correspondência entre Carro e Automóvel é 0.9.
Figura 6 - Exemplo de alinhamento entre duas ontologias. Adaptado de [45].
Sejam duas ontologias O=C, R, P, I, a e O´=C´, R´, P´, I´, a´ a serem
alinhadas. Define-se E = {C  R  I} como o conjunto de entidades de O e,
analogamente, E´ = {C´  R´  I´} o conjunto de entidades de O´.
Formalmente, um processo de alinhamento de ontologias recebe as duas
ontologias O e O’ de entrada e, opcionalmente, um alinhamento inicial A (que pode ser
um alinhamento preliminar previamente estabelecido). O resultado deste processo é um
alinhamento A´. Neste processo, podem ser aplicados um conjunto r de recursos
externos (por exemplo, conhecimentos comuns e tesauro específico de um domínio) e
um conjunto de parâmetros p [13]. A Figura 7 ilustra este processo, que pode ser
formalmente representado por A’ = f (O, O’, A, p, r).
35
Figura 7 - Processo de alinhamento de duas ontologias [13].
O processo de alinhamento de ontologias busca estabelecer ligações semânticas
(denominadas correspondências) entre as entidades das ontologias de entrada (O e O’).
Sendo assim, o resultado desse processo (A´) é o conjunto das correspondências
estabelecidas entre as entidades de O e de O´.
Formalmente, uma correspondência é uma quádrupla e, e’, r, n de modo que e
 E é a primeira entidade da relação, identificada de maneira única por uma URI e que
representa uma entidade discreta de O; e’ E’ é a segunda entidade da relação,
identificada de maneira única por uma URI e que representa uma entidade discreta de
O´; r é a semântica da correspondência entre as duas entidades (alguns exemplos podem
ser igualdade, subsunção, incompatibilidade e até mesmo uma relação fuzzy); e n 
[0,1] é um valor que denota a confiança da correspondência.
Os tipos de correspondências podem ser classificados entre correspondências
simples e correspondências complexas [13] [48]. Dadas duas ontologias O e O’, uma
correspondência simples é uma correspondência onde as entidades correspondentes
são restritas a serem conceitos atômicos ou propriedades atômicas.
Uma
correspondência complexa é uma correspondência onde entidades correspondentes
podem ser expressões OWL3 (expressão de conceito ou relação, isto é, conceitos ou
relações não nomeadas), ou possuírem semântica baseada em modelos: domínio e
intervalo entre propriedade e classes e inversão de propriedades.
3
Acrônimo para Ontology Web Language, é uma linguagem de representação de ontologias na web onde
podem ser descritas classes, propriedades e suas relações.
36
Correspondências
são
tipicamente
representadas
utilizando
linguagens
específicas. Em [20] são considerados três níveis de abstração para representar
correspondências entre ontologias, onde os níveis refletem as formas de mediação de
ontologias. O alinhamento de ontologias está no nível intermediário, fazendo a ligação
entre uma fase em tempo de projeto (design-time), onde o alinhamento é construído, e
uma fase em tempo de execução (run-time), onde o alinhamento é transformado em uma
linguagem mediadora de acordo com a tarefa a ser executada. No nível mais baixo da
pilha estão as correspondências fundamentais, representadas e executadas por sistemas
de mediação de dados. Clássicas representações neste nível são formalismos lógicos de
um reasoner ou de uma linguagem de programação de um sistema de mediação de
dados. Por exemplo, uma transformação de instâncias de uma classe origem de uma
ontologia de origem O para uma classe destino de uma ontologia O’ pode ser
representada conforme a consulta SPARQL
4
a seguir, que representa uma
correspondência fundamental para uma tarefa específica de transformação de instâncias:
CONSTRUCT{ ?X rdf:type O:source }
WHERE{ ?X rdf:type O’:target. }
A Figura 8 apresenta um exemplo de um fragmento de alinhamento entre as
ontologias FOAF 5 e vCard 6 , expresso na linguagem de alinhamento de ontologias
Alignment Format:
4
Acrônico de Simple Protocol and RDF Query Language, é uma linguagem de consulta em estruturas
RDF.
5
Friend Of A Friend: http://xmlns.com/foaf/spec/
6
vCard: http://www.w3.org/TR/vcard-rdf
37
<Alignment>
<xml>yes</xml>
<level>0</level>
<type>**</type>
<onto1>&foaf</onto1>
<onto2>&vcard</onto2>
<map>
<Cell>
<entity1 rdf:resource="&foaf;name"/>
<entity2 rdf:resource="&vcard;name"/>
<measure rdf:datatype="&xsd;float">1.0</measure>
<relation>=</relation>
</Cell>
</map>
</Alignment>
Figura 8 – Fragmento da representação de um alinhamento entre as ontologias FOAF e vCard.
2.4.
Técnicas de Alinhamento de Ontologias
As técnicas de alinhamento de ontologias podem ser divididas em várias
categorias, conforme descrito por Euzenat e Shvaiko [13] e ilustrado na Figura 9.
Figura 9 - Classificação das técnicas de alinhamento de ontologias. Fonte: [13].
As técnicas básicas (representadas pelos retângulos) são classificadas segundo
dois enfoques: (i) no eixo superior da figura, o enfoque Granularidade / Interpretação
de Entrada (Granularity/Input Interpretation) distingue as técnicas quanto à
granularidade da análise (ou seja, se a técnica analisa as ontologias no nível dos
elementos ou no nível de estrutura) e quanto ao foco na interpretação das informações
38
de entrada (ou seja, se a técnica trabalha a nível sintático, semântico ou considerando
recursos externos); (ii) no eixo inferior da figura, o enfoque Tipo de Entrada (Kind of
Input) distingue as técnicas quanto ao tipo dos insumos explorados (strings nas técnicas
terminológicas, estrutura nas técnicas estruturais, modelos nas técnicas semânticas ou
instâncias nas técnicas extensionais). A seguir cada uma das técnicas de alinhamento é
descrita de forma resumida:

Baseadas em strings (String-based): utilizadas na comparação dos nomes e
rótulos das entidades. Essas técnicas consideram as strings como uma sequência
de letras do alfabeto, em geral baseadas na seguinte intuição: quanto mais
similares as strings, maior a probabilidade de que elas representem o mesmo
conceito.

Baseadas em linguagem (Language-based): também utilizadas na comparação
dos nomes das entidades, considerando esses nomes como palavras de uma
linguagem natural. Técnicas dessa natureza são baseadas em processamento de
linguagem natural, explorando propriedades morfológicas das palavras.

Recursos linguísticos (Linguistic-resources): também consideram os nomes
como palavras de uma linguagem natural, mas nesse caso as técnicas se apoiam
em recursos externos, como tesauros específicos do domínio, com foco nas
relações linguísticas, como sinônimos, por exemplo.

Baseadas em restrições (Constraint-based): englobam algoritmos que lidam
com as restrições internas aplicadas às definições das entidades, como tipo de
dado, cardinalidade de atributos etc.

Reuso de alinhamentos (Alignment reuse): exploram recursos externos que
armazenam resultados de alinhamentos disponíveis. Com a aplicação dessa
39
técnica, os resultados do alinhamento entre O e O’ e entre O e O’’ podem ser
utilizados no processamento do alinhamento entre O’ e O’’, por exemplo.

Ontologias de fundamentação e ontologias específicas de domínio (Upper
level, domain specific ontologies): ontologias de fundamentação podem ser
utilizadas como recursos externos de conhecimento comum e a sua principal
característica é configurar-se como sistemas baseados em lógica. Desse modo,
técnicas que exploram esses recursos são classificadas como semânticas.
Ontologias específicas de domínio também podem ser utilizadas como recursos
externos de conhecimento comum, pois utilizam termos com sentidos relevantes
para o domínio e que em geral não estão relacionados a conceitos similares em
outros domínios.

Técnicas de análise e de estatísticas de dados (Data analysis and statistics):
técnicas que tiram proveito de amostras (preferencialmente grandes) de uma
população com o objetivo de identificar regularidades e discrepâncias ao agrupar
itens ou computar distâncias entre eles.

Baseadas em grafo (Graph based): técnicas baseadas na análise da estrutura
das ontologias, através da sua representação como grafos rotulados. O cálculo da
similaridade entre um par de nós das duas ontologias baseia-se na análise de
suas posições dentro do grafo, considerando que se dois nós de duas ontologias
são similares, suas vizinhanças (ou seja, seus nós adjacentes) também devem
apresentar um nível de similaridade.

Baseadas em taxonomia (Taxonomy based): também consistem em algoritmos
baseados em grafo, que restringem a análise à relação de especialização. Da
mesma forma que as técnicas baseadas em grafo, se uma ligação do tipo “é um”
40
(is-a) conecta termos já considerados similares, é provável que seus nós
adjacentes também sejam similares.

Repositório de estruturas (Repository of structures): repositórios de estruturas
armazenam ontologias e seus fragmentos, juntamente com o grau de confiança
das correspondências entre pares de entidades. Ao contrário do reuso de
alinhamento, repositórios de estruturas armazenam apenas similaridades entre
ontologias, e não alinhamentos. No alinhamento de novas estruturas (ontologias
ou fragmentos), primeiro busca-se por similaridades checando-se as estruturas
disponíveis no repositório. O objetivo é identificar estruturas suficientemente
similares que validem o esforço em prosseguir com o alinhamento, evitando
operações sobre estruturas divergentes.

Baseadas em modelo (Model based): algoritmos baseados em modelo
manipulam as entradas com base na sua interpretação semântica. A ideia por trás
desse tipo de técnica é que, se duas entidades são similares, elas compartilham a
mesma interpretação lógica. Exemplos são mecanismos de inferência lógica,
assumindo que as ontologias são expressas em um formalismo lógico adequado.
2.5.
Qualidade do Alinhamento de Ontologias
A seleção das métricas para a avaliação do alinhamento de ontologias é uma
tarefa que deve levar em consideração o critério de não favorecer qualquer abordagem
de alinhamento. Para a tarefa de alinhamento de ontologias, tipicamente têm sido
utilizadas as seguintes métricas [18] [19]:

Verdadeiros Positivos (VP): É o conjunto de correspondências encontradas,
que fazem parte do conjunto de correspondências do alinhamento de referência;
41

Falsos Positivos (FP): É o conjunto de correspondências encontradas, que não
fazem parte do conjunto correspondências do alinhamento de referência;

Falsos Negativos (FN): É o conjunto de pares de elementos que não foram
encontradas e que estão presentes no conjunto de correspondências do
alinhamento de referência;

Precisão (Precision): A precisão mede a proporção de correspondências
corretas que foram encontradas, ou seja, dentre as correspondências encontradas
quantas realmente são corretas.
Dado um alinhamento de referência R, a
precisão de um alinhamento A pode ser calculada da seguinte forma:
VP 
P(A,R) = VP  FP 

Cobertura (Recall): A cobertura mede a proporção de correspondências
encontradas dentre todas as corretas. Dado um alinhamento de referência R, a
cobertura de um alinhamento A pode ser calculada da seguinte forma:
VP 
R(A,R) = VP  FN 

Medida-F (F-Measure): A Medida-F representa a harmonização entre a
precisão e a cobertura. É a medida principal para avaliar a qualidade de um
alinhamento já que é amplamente utilizada para a avaliação geral de um
alinhamento [13] [18] [19] [39]. Dado um alinhamento de referência R, a
precisão e a cobertura, a medida-F pode ser calculada da seguinte forma:
2
( b 1).P ( A, R ).R ( A, R )
F(A,R) =
2
b . P(A,R)  R(A,R)
Com b=1 sendo um fator de peso padrão, chega-se a:
2. P ( A, R ).R ( A, R )
F1(A,R)= P ( A, R )  R ( A, R )
42
2.6.
Linguagens para Representação de Alinhamentos de Ontologias
Uma variedade de linguagens para representação de alinhamento de ontologias
surgiu nos últimos anos. A seguir serão apresentadas brevemente algumas dessas
linguagens. Uma análise exaustiva e comparativa foi realizada por Scharffe [20] e
compilada conforme a seguir.
A linguagem alignment format [39] foi originalmente desenvolvida para prover
um formato comum a fim de permitir a avaliação dos resultados gerados por algoritmos
de alinhamento de ontologias. Este formato distingue três níveis de complexidade de
alinhamentos, a saber: (i) no nível 0, correspondências simples entre duas entidades
descritas por suas URIs, com uma relação específica entre elas (equivalência,
subsunção, por exemplo); (ii) no nível 1, correspondências podem ser expressas entre
conjuntos de entidades; (iii) no nível 2, conjuntos de entidades podem ser especificados
utilizando restrições e noções de path. Este formato é utilizado pela Ontology Alignment
Evaluation Initiative7.
A C-OWL [41] é uma extensão da linguagem OWL que possui como objetivo
expressar mapeamentos entre ontologias escritas em OWL. Os construtos da linguagem
C-OWL são chamados de bridge rules (regras de pontes), e permitem expressar uma
família de relações semânticas entre conceitos / papéis e indivíduos interpretados em
domínios heterogêneos. Dadas duas ontologias O e O’, uma bridge rule de O para O’
expressa uma relação semântica entre um conceito / papel / indivíduo de O em um
conceito / papel / indivíduo de O’. Bridge rules são direcionais no sentido que bridge
rules de O para O’ não são o inverso das bridge rules de O´ para O. C-OWL é baseado
na linguagem OWL, mas é relativamente independente dessa linguagem
7
http://oaei.ontologymatching.org
43
A Distributed Description Logics (DDL), ou Lógica de Descrição Distribuída
[42], é uma lógica que formaliza uma rede de ontologias composta de múltiplos
relacionamentos um-para-um entre ontologias. Cada ontologia é representada em lógica
de descrição 𝒮ℋℐ𝒬 [28]. Correspondências entre entidades são expressas utilizando
regras de ponte que são subsunções entre uma entidade de uma ontologia e uma
entidade de outra ontologia.
A XeOML [43] é uma linguagem extensível baseada em XML para descrever
alinhamentos entre ontologias. O esquema Abstract Mapping descreve uma estrutura
genérica de um alinhamento, independente do tipo de correspondências ou entidades
que serão utilizadas no alinhamento propriamente dito. Para construir um alinhamento,
dois esquemas adicionais são utilizados: (i) o esquema Ontology Elements Definition é
uma extensão que descreve as entidades ontológicas que serão alinhadas; (ii) o esquema
Mappings Definition é uma extensão que indica as possíveis relações estabelecidas entre
entidades correspondentes. A especificação de um alinhamento é realizada entre uma
ontologia da esquerda – left ontology (LO), e uma ontologia da direita – rigth ontology
(RO). Correspondências podem ser simples ou complexas. Correspondências simples
ocorrem entre entidades simples, correspondências complexas podem envolver muitaspara-muitas entidades combinadas de acordo com a relação especificada no esquema
Ontology Elements Definition.
A Expressive Declarative Ontology Alignment Language (EDOAL) é uma
extensão da linguagem Alignment Format, apresentada anteriormente [44]. Sua
semântica permite expressar alinhamentos entre ontologias modeladas em vários
formalismos. Essa característica permite a possibilidade de padrões de alinhamento de
ontologias serem aplicados para várias linguagens de ontologias, desde que essas
linguagens sejam gerenciadas ao nível de ferramenta. EDOAL utiliza construtos de
44
classes, relações, propriedades e instâncias para a representação de entidades
ontológicas. Cada correspondência modela uma relação entre as entidades da
correspondência: equivalência, subsunção, disjunção e a adesão de indivíduo a uma
classe. Instâncias são indivíduos, classes modelam classes de indivíduos, relações são
relações binárias entre indivíduos e propriedades são relações binárias estabelecidas
entre indivíduos e um valor de dado. O termo “atributo” pode ser utilizado quando se
referir a uma relação ou a uma propriedade sem distinção. Descrições expressivas de
correspondências podem ser modeladas, permitindo a captura de correspondências
complexas necessárias para a resolução de incompatibilidades ontológicas. Entidades
ontológicas podem ser agrupadas utilizando operadores de conjuntos. Cadeias de
relações e propriedades podem ser compostas. Condições e filtros podem ser aplicados
para restringir o escopo de entidades que participam de uma correspondência.
Transformações de valores de propriedades são possíveis utilizando funções XPath 8
(linguagem utilizada para navegar através de elementos e atributos em um documento
XML). Finalmente, a linguagem foi estendida para suportar variáveis que permitam
representar placeholders (espaços reservados) para entidades em padrões. A Tabela 1
resume a representação dos construtos fornecidos pela linguagem EDOAL.
Tabela 1 - Resumo dos construtos da linguagem EDOAL.
Tipo de Construto
Relações de Correspondência
Entidades
Construtos de Classe
Construtos de Relação
8
Nome do Construto (sintaxe
abstrata)
Equivalência, Subsunção,
Disjunção, Membro
(≡, ⊑, ⊥, ∈)
Classe, Relação, Propriedade,
Instância, Valor, Tipo de Dado,
Comparador
(C, R, P, u, Val, d, cp)
E, Ou, Não
(⊓,⊔, ¬)
E, Ou, Não, Inverso, Transitivo,
Reflexivo, Simétrico
(⊓,⊔, ¬, inv(R), sym(R),
trans(R), refl(R))
http://www.w3.org/TR/xpath/
45
Comentário
Conjunto de operados para
construto de classe.
Conjunto de operadores para
construtos de relação.
first, next
(R · R)
E, Ou, Não
(⊓,⊔, ¬)
Construtos de Propriedades
First, Next (R · P)
Valor, Domínio
(cp(Val), dom(C), range(C))
Conjunto de operadores para
construtos de propriedades.
Construtos de caminho de
propriedades.
Restrição de escopo de uma
propriedade de acordo com seu
valor , domínio ou intervalo.
Função de transformação em
valores de propriedades de
transformações XPath, ou
definidas pelo usuário.
Transformação de Valores de
Propriedades
Transformação
(transf(R))
Restrições de Classe
Valor de Atribuo
(∃P cp Val),
domain,
cardinality (∃P
cp d, ∃|P| cp
Val )
Restrição de escopo de uma
classe de acordo com o valor em
um de seus atributos.
Variáveis
?x
Espaço reservado (placeholder)
de uma entidade.
A Tabela 2 apresenta um comparativo entre as linguagens apresentadas,
conforme os critérios a seguir:
Compatibilidade Web: O elemento base para referenciar recursos na web é sua
URI. Baseado nessa premissa, representações RDF são padrões que permitem um
alinhamento ser compatilhado na web. Isto pode, em princípio, habilitar a
extensibilidade de um formato, permitindo introduzir novas propriedades, assim como
referenciar um conjunto particular de correspondencias individualmente.
Entidades: Apresenta os tipos de entidades suportadas pela linguagem na
representação de uma correspondênca.
Expressividade: Características funcionais são utilizadas para descrever
correspondências mais precisas que simples correspondências um-para-um entre as
entidades de duas ontologias. A expressividade da linguagem é proporcional ao número
e complexidade das características funcionais disponíveis na linguagem.
Semântica: Este critério foca no significado do mapeamento de expressões em
cada linguagem, que é como os construtos da linguagem podem ser interpretados.
46
Extensibilidade: É a capacidade de extender a linguagem para propósitos
específicos.
Padrões: Determina se a linguagem é possivelmente utilizada para a
representação de padrões.
Tabela 2 – Comparativo entre as linguagens de alinhamento de ontologias.
Nome
Compatibilidade
Web
Entidades
Expressividade
Semântica
Extensível
Padrões
Alignment
Format
URIs +
RDF/XML
Toda entidade
que possuir uma
URI
Somente URI para
URI
Não
Sim
Não
C-OWL
Sim, extensão da
OWL
Entidades OWL
Modelos
locais
Não
conhecida
Não
DDL
Ontologias OWL
Entidades OWL
Modelos
locais
Não
conhecida
Não
Sem limitações
Não
Sim
Possível
abordagem
Alta
expressividade
Independente
de
formalismos
Sim
Sim
XeOML
Sim
EDOAL
Sim
2.7.
Classes,
propriedades,
relações,
instâncias
Classes,
propriedades,
relações,
instâncias
Entidades simples,
sem
transformações
Entidades simples,
sem
transformações.
Relações de
subsunção
somente.
Padrões de Projeto
Quando especialistas trabalham em um problema particular não é muito comum
que sejam propostas novas soluções completamente distintas das já existentes.
Frequentemente, soluções de problemas similares são recuperadas e a essência da
solução é reutilizada para a resolução do novo problema. Esse tipo de “comportamento
especialista”, que pensa no par problema-solução, é muito comum em diferentes
domínios, como Arquitetura, Economia e Engenharia de Software. Abstraindo o par
problema-solução e considerando os fatores que levam à reutilização de soluções já
aplicadas a problemas dentro do mesmo contexto, o termo “padrão” pode ser definido
da seguinte forma [46]:
47

Cada padrão é uma regra de três partes, que expressa a relação entre certo
contexto, um problema e uma solução.

Como um elemento no mundo, cada padrão é um relacionamento entre certo
contexto, certo sistema de forças que ocorrem repetidamente em um contexto e
uma determinada configuração que permite que estas forças se resolvam.

Como um elemento de linguagem, um padrão é uma instrução que demonstra
como essa configuração pode ser utilizada mais de uma vez para resolver um
sistema de forças, sempre que o contexto for relevante.
Padrões auxiliam na construção de uma experiência coletiva baseada nas
habilidades de engenheiros de software. Eles capturam experiências existentes e
comprovadas no desenvolvimento de software e ajudam a promover boas práticas de
design. Cada padrão lida com um problema específico e recorrente de design ou
implementação de um software. Padrões podem ser utilizados para construir
arquiteturas de software com propriedades específicas. Um padrão de arquitetura de
software descreve um problema particular de design (projeto) que surge em contextos
específicos e apresenta um comprovado esquema genérico para sua solução. O esquema
de solução é especificado descrevendo seus componentes, suas responsabilidades e
relacionamentos, e a maneira como estes colaboram [40]. De acordo com Buschmann et
al. [40], todo padrão possui um esquema de três partes:

Contexto: uma situação em que surge um problema.

Problema: um recorrente problema que surge um determinado contexto.

Solução: uma resolução comprovada do problema.
O contexto estende a simples dicotomia problema-solução descrevendo
situações em que o problema ocorre. O contexto de um padrão pode ser bem geral, por
exemplo, “desenvolvendo software como interface homem-máquina”. Por outro lado o
48
contexto pode amarrar padrões específicos juntos, como “implementação de mecanismo
de propagação de mudanças na arquitetura Model-View-Controller”. Especificar o
correto contexto para um padrão é uma tarefa difícil. Acredita-se que é praticamente
impossível determinar todas as situações, mais gerais e específicas, em que um padrão
pode ser aplicado [40]. Uma abordagem mais pragmática é listar todas as situações
conhecidas onde um problema endereçado por um padrão pode ocorrer. Isso não garante
que serão cobertas todas as situações em que um padrão pode ser relevante, mas ao
mesmo é um guia válido.
O problema descreve um resultado negativo que surge repetidamente em um
determinado contexto. Inclui uma especificação geral do problema capturando sua
maior essência (qual é a real questão que se deseja resolver), um conjunto de forças que
são aspectos do problema que devem ser considerados para resolvê-lo (requisitos que a
solução deve cumprir, restrições que devem ser consideradas, ou propriedades
desejáveis da solução).
A solução descreve como resolver o problema recorrente, ou melhor, como
balancear as forças associadas a ele. Na arquitetura de software uma solução inclui dois
aspectos: a estrutura e o comportamento em tempo de execução.
Um padrão fornece um esquema de solução ao invés de um artefato totalmente
especificado. Especialistas devem ser capazes de reutilizar a solução em várias
implementações, mas sua essência deve ser mantida. Após aplicar um padrão, uma
arquitetura pode incluir uma estrutura particular que provê as funções especificadas pelo
padrão, mas ajustadas e adaptadas às necessidades do problema corrente.
O diagrama a seguir sumariza os componentes principais de um padrão:
49
Figura 10 - Diagrama representando a composição de um padrão.
2.8.
Antipadrões de Projeto
Um antipadrão é uma descrição de uma situação problemática que é comumente
aplicada sobre um cenário e que gera, definitivamente, consequências negativas.
Quando devidamente documentado, um antipadrão descreve a situação problemática de
forma geral, as causas primárias que levam a essa situação problemática, sintomas que
descrevem como reconhecer o antipadrão, consequências da utilização desta situação
problemática e uma solução refatorada que pode mudar o antipadrão em uma solução
mais adequada.
O termo antipadrão ganhou grande notoriedade na comunidade de engenharia de
software através de Micheal Akroyd [47], cujo trabalho identificou construtos de
softwares prejudiciais que são recorrentes em vários projetos de software.
Um antipadrão pode ser documentado de três formas [22]:

Pseudo Antipadrão: é um modelo de documentação de antipadrão onde o autor
apenas descreve a situação problemática. Essa pode ser a forma inicial de um
antipadrão. A situação problemática é descoberta e nomeada, mas uma solução
refatorada para tal a solução problemática ainda não existe A Tabela 3 apresenta
os componentes desse modelo de documentação de antipadrão.
50
Tabela 3 – Modelo de Pseudo Antipadrão
Item
Nome
Problema

Breve Descrição
Como o antipadrão é chamado?
Como é caracterizado?
Mini Antipadrão: é um modelo de documentação de antipadrão onde o autor
descreve o antipadrão informalmente. É a forma mais básica do antipadrão,
inclui seu nome, a solução problemática e a solução refatorada. A Tabela 4
apresenta os componentes desse modelo de documentação de antipadrão.
Tabela 4 – Modelo de Mini Antipadrão
Item
Nome
Problema
Solução Refatorada

Breve Descrição
Como o antipadrão é chamado?
Qual é a solução recorrente que causa consequências negativas?
Como pode-se evitar minimizar ou refatorar o problema descrito
pelo antipadrão?
Antipadrão Completo: é um modelo de documentação de antipadrão onde o
autor descreve um antipadrão de forma mais completa. Apresenta uma descrição
detalhada e características específicas do antipadrão. A Tabela 5 apresenta os
componentes desse modelo de documentação de antipadrão.
Tabela 5 – Modelo de Antipadrão Completo
Item
Nome
Também conhecido
como
Escala mais frequente
Nome da solução
refatorada
Tipo de solução
refatorada
Causa raiz
Breve Descrição
O nome do antipadrão é uma frase com significado único. É
importante que cada antipadrão possua um nome que possa
identifica-lo individualmente.
Nomes populares ou frases descritivas adicionais ao nome do
antipadrão.
Escala de ocorrência do antipadrão. Pode ser, por exemplo,
idioma, micro-arquitetura, framework, aplicação, sistema, ou
indústria/global. A escala também abrange o escopo da dimensão
da solução. Alguns antipadrões definem soluções em diferentes
escalas.
Identifica o padrão refatorado para a solução.
Uma solução pode ser dada em nível de software, tecnologia,
processo e papeis. Solução em nível de software indica que um
novo software é criado para a solução. Tecnologia indica que a
solução implica na aquisição de nova tecnologia ou um produto.
Processo indica que deve seguir uma solução a partir do processo
envolvido. Papel indica que a solução implica na atribuição de
responsabilidades a um indivíduo ou grupo.
É, ou são, as causas gerais da solução problemática do antipadrão.
51
Forças desbalanceadas
Evidência anedótica
Plano de fundo
Forma geral do
antipadrão
Sintomas e
consequências
Causas típicas
Exceções conhecidas
Solução refatorada
Variações
Exemplo
Soluções relacionadas
2.9.
Identifica as forças primárias que são ignoradas, mal utilizadas ou
utilizadas em demasia nesse antipadrão.
Frequentes frases do dia-a-dia associadas ao antipadrão. É
opcional.
Contém exemplos de onde o problema pode ocorrer ou
informações gerais que podem ser úteis para melhor entendimento
do antipadrão. É opcional.
Apresenta um diagrama que identifica características gerais do
antipadrão.
Uma lista de consequências e sintomas que resultam do antipadrão
identificado.
Uma lista de fatores que levam à ocorrência do antipadrão.
O comportamento de um antipadrão nem sempre pode ser
considerado indesejado em alguns casos específicos. Aqui são
brevemente apresentas exceções conhecidas desse antipadrão.
Aqui é apresentada a solução refatorada que resolve as forças
desbalanceadas identificadas. Essa solução deve ser descrita sem
variações. Estas devem ser descritas no item Variações.
Item opcional que lista as maiores variações do antipadrão.
Adicionalmente, soluções alternativas devem ser descritas aqui.
Apresenta um ou mais exemplos do antipadrão abstraído da
experiência do autor.
Lista citações e referencias cruzadas apropriadas ao contexto do
antipadrão.
Padrões de Correspondência de Ontologias
Para estabelecer correspondências entre duas ontologias que estão sendo alinhadas, é
necessário conhecimento sobre o domínio, assim como sobre o sistema utilizado para
realizar o alinhamento [20]. A busca por tais correspondências pode ser uma árdua e
longa tarefa, especialmente se as ontologias forem grandes mas, uma vez definido um
alinhamento, este pode ser reutilizado em vários cenários que envolvam o par de
ontologias que foram alinhadas. No entanto, dado qualquer outro par de ontologias a
serem alinhadas, o alinhamento definido previamente não pode ser reutilizado,
requerendo executar todo o processo de busca por corrrespondências novamente.
Padrões
de
correspondência
são,
essencialmente,
um
conjunto
de
correspondências genéricas, ou seja, entre entidades não especificadas individualmente,
mas que respeitem restrições estruturais pré-definidas. Uma vez definidos, os padrões
de correspondência atuam como modelos que auxiliam a localizar correspondências em
cenários mais abrangentes do que simplesmente em um par de entidades específicas.
52
Como exemplo de um padrão de correspondência de ontologias, considere a
ontologia “Wine Ontology”
9
(que aqui denominaremos ontologia wine), sua classe
principal Wine e a classe BordeauxWine que agrupa instâncias de um popular vinho
francês feito na região de Bordeaux. Considere também a ontologia “Ontologie du Vin”
10
(que aqui denominaremos ontologia vin), na qual um vinho similar é expresso como
uma instância da classe Vin com um atributo terroir 11 indicando a procedência do
vinho. Sistemas de alinhamento de ontologias são capazes de identificar duas
correspondências: wine:Wine, vin:Vin, ≡, _, estabelecendo uma relação de
equivalência entre dois vinhos, e wine:BordeauxWine, vin:Vin, ⊑, _ estabelecendo que
wine:BordeauxWine é uma especialização de vin:Vin. Neste caso, uma correspondência
mais precisa seria restringir o escopo de vin:Vin a somente às instâncias que possuam
“Bordeaux” como valor no atributo terroir. Essa seria uma correspondência complexa,
onde o escopo de uma classe é equivalente ao subconjunto de objetos da outra classe
que tenham determinado valor em um atributo. Tal situação pode ser generalizada como
um padrão de correspondência restrição de valor de atributo, conforme ilustrado na
Figura 11.
Na Figura 11, o retângulo maior delimita o padrão de correspondência; os
retângulos menores representam correspondências entre um conjunto de entidades que
fazem parte do padrão. A linha pontilhada entre os retângulos menores representa
dependência entre correspondências. As linhas ligadas diretamente aos retângulos
menores representam entidades que fazem parte da correspondência, onde um exemplo
de instância é dado para cada caso, dentro dos retângulos pontilhados. Setas entre as
entidades indicam relações de especialização, predicados e objetos em RDF.
9
Disponível em: http://www.w3.org/TR/2003/CR-owl-guide-20030818/wine
Disponível em: http://www.scharffe.fr/ontologies/OntologyDuVin.wsml.
11
Terroir é uma palavra francesa que denota uma particular região de agricultura.
10
53
Figura 11 - Exemplo de padrão de correspondência “restrição de valor de atributo”
A Figura 12 ilustra a representação computacional na linguagem EDOAL do
padrão de correspondência ilustrado na Figura 11.
<map>
<Cell>
<entity1>
<Class rdf:about="A">
<condition>
<AttributeValueCondition>
<restriction>
<Restriction>
<onAttribute>
<Path>
<first>
<Property rdf:about="A"/>
</first>
</Path>
</onAttribute>
<comparator>xsd:Equal</comparator>
<value>X</value>
</Restriction>
</restriction>
</AttributeValueCondition>
</condition>
</Class>
</entity1>
<entity2>
<Class rdf:about="B"/>
</entity2>
</Cell>
</map>
Figura 12 - Representação computacional na linguagem EDOAL do padrão de correspondência restrição
de valor de atributo”
Uma instância do padrão de correspondência anterior é ilustrada na Figura 13,
também na linguagem EDOAL:
<map>
<Cell>
<entity1>
<Class rdf:about="vin:Vin">
<condition>
<AttributeValueCondition>
<restriction>
<Restriction>
<onAttribute>
<Path>
<first>
<Property rdf:about="vin:terroir"/>
</first>
54
</Path>
</onAttribute>
<comparator>xsd:Equal</comparator>
<value>geo:Bordelais</value>
</Restriction>
</restriction>
</AttributeValueCondition>
</condition>
</Class>
</entity1>
<entity2>
<Class rdf:about="wine:BordeauxWine"/>
</entity2>
</Cell>
</map>
Figura 13 - Exemplo de instância de um padrão de correspondência “restrição de valor de atributo”.
55
3. Antipadrões de Correspondência de Ontologias
Este capítulo apresenta formalmente a definição de antipadrões de
correspondência assim como uma metodologia para a construção de um antipadrão de
correspondência.
3.1.
Definição de Antipadrões de Correspondência
O produto resultante do processo de alinhamento de ontologias é o mapeamento entre as
entidades de duas ontologias que estão sendo alinhadas. No entanto, nem sempre um
conjunto de correspondências encontradas de fato representa um alinhamento
verdadeiro. Por exemplo, a Figura 14 apresenta o fragmento do alinhamento entre duas
ontologias o1 e o2, onde o retângulo que envolve duas classes indica que estas são
disjuntas. Suponha que uma ferramenta de alinhamentos identifique as seguintes
correspondências, representadas na Figura 14, onde o símbolo ≡ representa um
relacionamento de equivalência:
o1:Document, o2:Document, ≡, 1.0 e
o1:Reviewer, o2:Review, ≡, 0.9.
Sabemos que estas correspondências são inconsistentes, pois resultam em
problemas lógicos. Suponha em um cenário em que x é uma instância de o1:Reviewer.
Pela correspondência estabelecida, x também é uma instância de o2:Review. Assim, x é
também uma instância de o2:Document. Isto segue que cada instância de o1:Reviewer é
56
também uma instância de o1:Document. No entanto, a modelagem de o1 mostra que x
não pode ser uma instância de o1:Document, dado que as classes o1:Person e
o1:Document são disjuntas e o1:Reviewer é uma especialização de o1:Person,
originando assim uma contradição lógica [49].
Figura 14 - Fragmento de duas ontologias e um problema de alinhamento.
Assim sendo, uma correspondência, pode gerar problemas de inconsistência
lógica, quando estabelecida de forma inadequada. Isso pode ocorrer, por exemplo,
quando as ontologias alinhadas, em conjunto com o alinhamento gerado, forem
submetidas a um processo de mediação de dados ou fusão de ontologias, ou
simplesmente quando forem submetidas a um raciocinador lógico.
Desse modo, um antipadrão de correspondência é um conjunto de
correspondências e/ou de não correspondências genéricas (ou seja, entre entidades não
especificadas individualmente) que, quando ocorrem combinadas com características
das ontologias que estão sendo alinhadas, representam situações problemáticas
(inconsistentes logicamente).
O objetivo de um antipadrão de correspondência é identificar uma inconsistência
em um alinhamento. Uma vez identificada, esta inconsistência é apresentada ao
especialista de domínio, que deve ser capaz de refatorar a situação para eliminar a
57
inconsistência, de forma a manter a semântica adequada no cenário de alinhamento em
questão.
Definição 1 (Antipadrão de Correspondência): Dadas duas ontologias
alinhadas O e O’, e duas assinaturas S e S’ referentes às ontologias O e O’,
respectivamente, um antipadrão de correspondência T é uma quádrupla <D, N, S, S’>,
tal que D é um conjunto de correspondências genéricas12 e N é um conjunto de nãocorrespondências.
Assim como em padrões e antipadrões de projeto, T é especificado como um
modelo, isso é, uma teoria referindo-se a entidades genéricas (independentes de
domínio) e suas relações. Em situações reais de uso, portanto, os antipadrões de
alinhamento precisam ser instanciados.
Definição 2 (Instância de Antipadrão de Correspondência): Dadas duas
ontologias alinhadas O e O’, e um antipadrão de correspondência T=<D, N, S, S’>, uma
instância t do antipadrão de correspondência T é o resultado de um processo que indica
uma afirmação ou negação sobre uma correspondência d, tal que d  D, podendo ser
representado como t = f (O, O’, A, T, d).
O objetivo de um antipadrão de correspondência é identificar uma
correspondência inconsistente estabelecida em um alinhamento. Desse modo, uma
instância t de um antipadrão de correspondência T ocorre em um alinhamento A entre as
ontologias O e O’, tal que D  A. A procura por uma instância de T em um dado
alinhamento A pode ser executada buscando exaustivamente todas as instâncias
possíveis de T em um alinhamento A. As instâncias encontradas representam as
evidências dessa solução problemática.
12
Genéricas no sentido que representam entidades genéricas.
58
De acordo com Jean-Mary et al. [29], um alinhamento A pode ser submetido a
um processo de verificação semântica, projetado para verificar se certos axiomas
inferidos a partir de um alinhamento são realmente afirmados em uma ontologia. Essa
abordagem não encontra alinhamentos semanticamente inválidos ou insatisfatíveis, mas
sim correspondências que são menos propensas a serem satisfeitas com base nas
informações presentes nas ontologias. Essa abordagem é similar à noção de
mapeamento de instabilidade definida por Meilicke [49], onde mapeamentos são
consideráveis estáveis quando subsunções implícitas pela fusão de ontologias mapeadas
e seu mapeamento podem ser verificadas nas próprias ontologias.
Definição 3 (Correspondência Inconsistente): Sejam o1 e o2 duas ontologias,
A um alinhamento entre o1 e o2 e d = o1:e1, o2:e1, ≡, _ uma correspondência, onde d
 A, ≡ representa uma relação de equivalência e _ representa um valor de força
qualquer. Considere que oM seja uma ontologia definida pela fusão de o1, o2 e d, onde a
correspondência d é transformada em axiomas de equivalências. Suponha que um
axioma α envolvendo as entidades em o1 possa ser inferido em oM a partir de relações
derivadas da correspondência d; d diz ser verificado em o1, se α é afirmado de forma
independente por o1. Se d não pode ser verificado em o1 e o2, então d é uma
correspondência inconsistente, que, por consequência, leva a uma inconsistência em A
[23].
Para verificar se uma correspondência é inconsistente, alguns tipos de
inferências podem ser examinadas em um processo de verificação semântica [23].
Dadas as entidades o1:e1, o1:e2 e o1:e3, sendo entidades distintas em uma ontologia
o1, e o2:e1, o2:e2 e o2:e3 entidades distintas em uma ontologia o2, as seguintes
verificações semânticas podem ser realizadas, conforme apresetado em [23]:
59

Verificação de correspondências de múltiplas entidades: Uma correspondência
de múltiplas entidades, conforme ilustrada na Figura 15(a), ocorre quando um
alinhamento contém as correspondências o1:e1, o2:e1, ≡, _ e o1:e2, o2:e1, ≡,
_, e o2:e1 é especialização de o2:e2 (o2:e1 ⊑ o2:e2). Supondo que x é uma
instância de o1:e1, de acordo com a correspondência o1:e1, o2:e1, ≡, _
podemos deduzir que existe um mundo possível w no qual x é uma instância de
o2:e1. Sendo o2:e1 uma especialização de o2:e2, x é necessariamente uma
instância de o2:e2 em w. Se essa afirmação não pode ser verificada, logo esse
alinhamento também não pode ser verificado.

Verificação de correspondências cruzadas: Suponha que na ontologia o1
a entidade o1:e1 seja uma especialização de o1:e2 e na ontologia o2, a entidade
o2:e1 seja uma especialização de o2:e2; assim temos que (o1:e1 ⊑ o1:e2) e
(o2:e1 ⊑ o2:e2), ou ainda (o1:e1 ⊑ o1:e2) ⊓ (o2:e1 ⊑ o2:e2), conforme
apresentado na Figura 15(b). Suponha que x é uma instância de o1:e1; pela
correspondência o1:e1, o2:e2, ≡, _, pode-se deduzir que existe um mundo
possível w no qual x também é uma instância de o2:e2. Pela correspondência
o1:e2, o2:e1, ≡, _, pode-se deduzir também, por o1:e1 ser uma especialização
de o1:e2, que x também é uma instância de o2:e1 em w. Se ambas as
correspondências não podem ser afirmadas em o1 ou em o2, respectivamente,
então o alinhamento não pode ser verificado.

Verificação
de
contradição
de
disjunção-subsunção
(com
especialização): Suponha que em uma ontologia o1 a entidade o1:e1 seja uma
especialização da entidade o1:e2, ou seja (o1:e1 ⊑ o1:e2), e na ontologia o2 a
entidade o2:e1 seja disjunta da entidade o2:e2, podendo esta relação ser
representada como (o2:e1 ⊓ o2:e2 ⊑ ⊥) ou, de forma mais simples,
60
disjoint(o2:e1,o2:e2). Considere um alinhamento entre as ontologias o1 e o2 que
possua as correspondências o1:e1, o2:e1, ≡, _ e o1:e2, o2:e2, ≡, _, conforme
ilustrado na Figura 15(c1). Neste cenário pode-se deduzir que uma instância x de
o1:e1, em um possível mundo w, é uma instância de o2:e1 e também é uma
instância de o1:e2. Isto segue de modo que essa instância x de o1:e2 também é
uma instância de o2:e2 em w. Se ambas as correspondências não podem ser
afirmadas em o1 e em o2, respectivamente, então o alinhamento não pode ser
verificado.

Verificação de contradição de disjunção-subsunção (sem especialização):
Suponha que em uma ontologia o1 a entidade o1:e1 seja equivalente à entidade
o1:e2, ou seja o1:e1, o1:e2, ≡, _, e na ontologia o2 a entidade o2:e1 seja
disjunta da entidade o2:e2, podendo esta relação ser representada como (o2:e1 ⊓
o2:e2 ⊑ ⊥) ou, de forma mais simples, disjoint(o2:e1,o2:e2). Considere um
alinhamento entre as ontologias o1 e o2 que possua as correspondências o1:e1,
o2:e1, ≡, _ e o1:e2, o2:e2, ≡, _, conforme ilustrado na Figura 15(c2). Neste
cenário pode-se deduzir que uma instância x de o1:e1, em um mundo possível w
também é uma instância de o2:e1, que por sua vez também é uma instância de
o1:e2 em w. Isto segue de modo que essa instância x em w também é uma
instância de o2:e2, o que causa uma contradição lógica, então o alinhamento não
pode ser verificado.

Verificação de incompletude de domínio e intervalo: Sejam duas classes o1:e2 e
o2:e2 e duas propriedades o1:p1 e o2:p1, nas ontologias o1 e o2,
respectivamente, e um domínio dom(o1:p1) que denota o domínio de uma
propriedade o1:p1, e um intervalo range(o1:p1) que denota o intervalo de uma
propriedade o1:p1, onde o1:e1 ∈ dom(o1:p1) e o1:e2 ∈ range(o1:p1), podendo
61
ser representado por o1:e1 ⊓ ∃ o1:p1.(o1:e2). Ainda, assuma que o2:e1 ∈
dom(o2:p1) e o2:e2 ∈ range(o2:p1), podendo ser representado por o2:e1 ⊓
∃o2:p1.(o2:e2). Suponha um alinhamento contém as correspondências o1:e2,
o2:e2, ≡, _ e o1:p1, o2:p1, ≡, _, conforme ilustrado na Figura 15(d), isso
implica que o2:e1 ∈ dom(o1:p1) e o1:e1 ∈ dom(o2:p1). Se essas afirmações não
podem ser confirmadas, então o alinhamento não pode ser verificado. Situação
semelhante ocorre com correspondências entre intervalos.
Figura 15 - Exemplos de tipos de inferências de verificação semântica. (a) verificação de
correspondências de múltiplas entidades; (b) verificação de correspondências cruzada; (c) verificação de
contradição de disjunção-subsunção; (d) verificação de incompletude de domínio e intervalo. As setas de
linhas sólidas denotam as correspondências entre as entidades.
O formalismo lógico adotado neste trabalho para representar as relações entre os
conceitos é o SROIQ [30] [31], uma lógica de descrição subjacente à linguagem OWL-
62
DL, que é uma extensão da lógica de descrição SHOIN e é aprovada e utilizada pela
W3C13.
Para a execução do processo de verificação semântica, algoritmos específicos
para tal função são necessários para interpretar as propriedades das ontologias de forma
conjugada com o alinhamento qual é desejado verificar sua integridade semântica [29].
Entretanto, modelos de antipadrões de correspondência podem ser construídos a fim de
representar uma situação que leva a um alinhamento inconsistente. Como um modelo,
um antipadrão deve referir-se a entidades genéricas quais sejam possíveis instanciações
de entidades das ontologias que estão sendo alinhadas.
O exemplo ilustrado na Figura 14 é um caso típico em que uma verificação
semântica do tipo verificação de contradição de disjunção-subsunção identificaria que
o alinhamento estaria inconsistente. Assim, este problema, conforme apresentado na
Figura 16, pode ser generalizado da seguinte forma, definindo, portanto um antipadrão
de correspondência T: considere uma classe e1 em uma ontologia o1 que é subclasse de
uma classe e2, que por sua vez é disjunta de uma classe e3, na mesma ontologia o1. Se
uma classe e1 na ontologia o2 for equivalentemente correspondente à classe e1 na
ontologia o1 e essa mesma classe e1 em o2 for uma subclasse de uma classe e2, também
em o2, que por sua vez é equivalentemente correspondente com a classe e3 na ontologia
o1, então esse alinhamento não pode ser verificado, o que gera uma inconsistência nesse
alinhamento.
A fim de denotar que tratam-se de entidades genéricas, ou seja, não instanciadas,
utilizaremos o caracter “?” antes de cada entidade. A expressão a seguir representa um
modelo de antipadrão de correspondência escrito conforme o formalismo SROIQ:
13
http://www.w3.org/2007/OWL/wiki/SROIQ
63
(?o1:?e1 ≡ ?o2:?e1) ⊓ (?o1:?e1 ⊑ ?o1:?e2) ⊓ (?o1:?e2 ⊓ ?o1:?e3 ⊑ ⊥) ⊓ (?o1:?e3 ≡ ?o2:e2) ⊓
(?o2:?e1 ⊑ ?o2:?e2).
Figura 16 – Definição de um antipadrão de correspondência T a partir da generalização de um problema
de alinhamento do tipo verificação de contradição de disjunção-subsunção.
Para a construção e representação computacional
do antipadrão de
correspondência T, adotou-se neste trabalho a linguagem EDOAL, conforme
apresentada na Seção 2.6. As três principais vantagens dessa linguagem que levaram à
sua adoção são: (i) é uma linguagem independente de formalismos ontológicos das
entidades que estão sendo representadas; (ii) possui um modelo expressivo para
documentar correspondências; (iii) está em conformidade com a tecnologia de web
semântica dada sua sintaxe baseada nas linguagens RDF e OWL. O antipadrão T
apresentado na Figura 16 pode ser representado utilizando a linguagem EDOAL,
conforme fragmento apresentado na Figura 17:
<map>
<cell>
<entity1><Class rdf:about="?o1:?e1"/></entity1>
<relation rdf:resource="equivalence"/>
</cell>
<cell>
<entity1><Class rdf:about="?o2:?e2" /></entity1>
<entity2><Classrdf:about="?o2:?e1" /></entity2>
<relation rdf:resource="subsumedBy"/>
</cell>
<cell>
<relation rdf:resource="disjoint"/>
</cell>
<cell>
64
</cell>
<cell>
</cell>
</map>
Figura 17 - Representação computacional do antipadrão de correspondência T através da linguagem
EDOAL.
3.2.
Processo de Identificação e Construção de Antipadrões de
Correspondência
Para a construção de antipadrões de correspondência, o primeiro passo é ter o
correto entendimento do problema que está sendo tratado. Quando devidamente
compreendido, o problema identificado pode resultar em modelos de antipadrão de
correspondência. O problema que está sendo tratado pode ser em função da análise de
erros explícitos encontrados no resultado final de um processo de alinhamento ou pode
surgir em função do conhecimento tácito de um especialista. Independente da origem do
problema em questão, algumas questões essenciais devem ser observadas para a
construção de um antipadrão de correspondência. A Figura 18 apresenta a metodologia
proposta por este trabalho para auxiliar na construção de um antipadrão de
correspondência. Essa metodologia consiste em responder questões que são essenciais
para a identificação e construção de um antipadrão de correspondência.
Figura 18
- Metodologia para construção de um antipadrão de correspondência.
Passo 1 – Apresentar Solução Problemática: Todo antipadrão tem como
objetivo identificar soluções que irão gerar consequências mais negativas que positivas.
Quando duas ontologias estão alinhadas, a existência de correspondências incorretas
pode resultar em modelos conceituais de ontologias que sejam sintaticamente válidos,
65
mas são propensos a resultar em representações de domínios não intencionais, ou seja,
quando utilizado em um modelo, tipicamente fará com que o conjunto de casos válidos
(possíveis) do modelo seja diferente das instâncias que representam os estados
pretendidos nesse domínio [50], ou podem ainda resultar em incompatibilidades lógicas
[49]. O objetivo dessa etapa do processo é identificar qual é a solução utilizada, ou seja,
o conjunto de correspondências, que está sendo realizada de forma incorreta que irá
resultar em consequências negativas. No cenário apresentado na Figura 14,
demonstramos que a correspondência entre as entidades o1:Reviewer e o2:Review
resulta em uma incompatibilidade lógica por ser especialização de entidades distintas e
disjuntas.
Passo 2 – Evidenciar Solução Problemática: Este passo é opcional. A
evidenciação de uma solução problemática irá auxiliar no entendimento do problema
que está sendo tratado, mas não é obrigatório. Seguindo o exemplo da Figura 14, um
sistema de alinhamentos que observe somente a terminologia das ontologias, ou seja,
somente as strings de suas entidades, irá identificar que o1:Reviewer e o2:Review são
correspondentes, dada a semelhança das strings envolvidas.
Passo 3 – Demonstrar Implicações: Aqui deve ser demonstrado porque a
solução, ou correspondência, é de fato problemática, ou seja, qual o problema que
ocorre quando a referida correspondência é inferida. Dando sequência ao exemplo que
está sendo tratado, temos que uma instância x de o1:Reviewer, pela correspondência
identificada, também é uma instância de o2:Review. Assim temos que essa instância x é
uma especialização de o1:Person e também de o2:Document, que por sua vez são
classes disjuntas, resultando em uma contradição lógica. Este é um problema do tipo
“contradição de disjunção-subsunção” em um processo de verificação semântica,
conforme apresentado anteriormente.
66
Passo 4 – Identificação da Solução Problemática: Uma vez estabelecido o
problema, é importante apresentar como esta correspondência indevida, ou conjunto de
correspondências, podem ser identificadas dentro de um alinhamento. Aqui é
formalizado o antipadrão que está endo construído. Ainda no exemplo que está sendo
tratado, as entidades o1:Reviewer e o2:Review não podem ser alinhadas por serem
especializações de entidades disjuntas, neste caso, o1:Person e o2:Document. Neste
cenário pode-se estabelecer o seguinte postulado: Seja uma classe e1 em uma ontologia
o1 que é subclasse de uma classe e2, que por sua vez seja subclasse de uma classe e3 na
mesma ontologia o1. Se a classe e3 na ontologia o1 for correspondente por igualdade
com a classe e2 na ontologia o2 e a classe e1 da ontologia o2 for disjunta da classe e2
da ontologia o2 e a classe e1 da ontologia o1 for correspondente por igualdade com a
classe e1 na ontologia o2, então há um problema de alinhamento. Este problema pode
ser formalmente representado da seguinte forma:
(?o1:?e1 ≡ ?o2:?e1) ⊓ (?o1:?e1 ⊑ ?o1:?e2) ⊓ (?o1:?e2 ⊓ ?o1:?e3 ⊑ ⊥) ⊓
(?o1:?e3 ≡ ?o2:e2) ⊓ (?o2:?e1 ⊑ ?o2:?e2).
Conforme descrito na Definição 1, um antipadrão de correspondência é o
resultado de um processo que indica uma afirmação ou negação sobre uma
correspondência. Dessa forma o modelo apresentado quando instanciado, se retornar
verdadeiro, então há um problema de alinhamento. A Tabela 6 demonstra o exemplo
que está sendo tratado apresentando o modelo não instanciado do antipadrão de
correspondência e o mesmo modelo instanciado com as entidades das ontologias
alinhadas conforme o exemplo apresentado na Figura 14.
Tabela 6 – Modelo de antipadrão de correspondência representando um problema de alinhamento.
Modelo Não Instanciado
(?o1:?e1 ≡ ?o2:?e1) ⊓
(?o1:?e1 ⊑ ?o1:?e2) ⊓
(?o1:?e2 ⊓ ?o1:?e3 ⊑ ⊥) ⊓
Modelo Instanciado
(o1:reviewer ≡ o2:review) ⊓
(o1:reviewer ⊑ o1:person) ⊓
(o1:person ⊓ o1:document ⊑ ⊥) ⊓
67
(?o1:?e3 ≡ ?o2:e2) ⊓
(?o2:?e1 ⊑ ?o2:?e2)
(o1:document ≡ o2:document) ⊓
(o2:review ⊑ o2:document)
Passo 5 - Apresentar Solução Refatorada: Refatoração nesse caso significa
realizar o reparo do alinhamento de forma a eliminar inconsistências lógicas. Essa não é
uma tarefa trivial, uma vez que podem existir várias soluções para um cenário
específico. Além disso, a melhor solução pode também depender da tarefa, ou até
mesmo apontar algum problema na semântica da correspondência. Dessa forma, essa
tarefa deve ser conduzida por um especialista de forma a analisar a semântica do
problema. Questões como a fundamentação das ontologias devem ser levadas em
consideração para refatoração do alinhamento. Por exemplo, entidades podem ser
genericamente equivalentes uma vez que podem desempenhar o mesmo papel em
ambas as ontologias que estão sendo alinhadas, mas ser entidades sintaticamente
distintas, com domínios também sintaticamente distintos em ambas as ontologias, mas
que também desempenham o mesmo papel em ambas as ontologias.
O modelo de um antipadrão, quando devidamente documentado, garante que
importantes questões são respondidas para a cada antipadrão. A Tabela 7 apresenta um
modelo de antipadrão, conforme apresentado na Seção 2.8, e lista todas as informações
que foram utilizadas para o desenvolvimento de um antipadrão de correspondência,
seguindo o processo apresentado anteriormente.
Tabela 7 – Antipadrão de Correspondência OCA01.
Item
Nome
Tipo de solução refatorada
Causa raiz
Breve Descrição
OCA01 - Correspondência de duas subclasses em que suas
superclasses são disjuntas.
Reestabelecimento das correspondências identificadas.
Assumir que dois termos são equivalentes ignorando sua relação
semântica com outras entidades e suas respectivas
correspondências.
De acordo com a classificação das incompatibilidades ontológicas
apresentadas anteriormente, pode ocorrer aqui uma
incompatibilidade terminológica de termos homônimos, onde o
sistema de alinhamentos identifica que estes termos são similares,
no entanto seus significados são diferentes. A semântica da
68
Forma geral do antipadrão
Sintomas e consequências
Causas típicas
Variações
relação dos termos deve ser observada para composição do
alinhamento. A incompatibilidade ontológica “descrição do
conceito” deve ser observada também.
(?o1:?e1 ≡ ?o2:?e1) ⊓ (?o1:?e1 ⊑ ?o1:?e2) ⊓ (?o1:?e2 ⊓ ?o1:?e3
⊑ ⊥) ⊓ (?o1:?e3 ≡ ?o2:e2) ⊓ (?o2:?e1 ⊑ ?o2:?e2).
Sintoma: duas subclasses que possuam correspondência de
igualdade, mas suas superclasses não possuem correspondência de
igualdade e são disjuntas.
Utilização apenas de algoritmos de similaridade de strings para
composição de um alinhamento.
Não aplicável.
Não aplicável.
Não aplicável.
3.3.
Elementos da representação computacional de um antipadrão de
correspondência
A seguir a relação de elementos da EDOAL utilizados para a construção de um
antipadrão.
Placeholders: Variáveis que serão instanciadas em tempo de execução do
antipadrão. Todas as variáveis obrigatoriamente devem ser iniciadas pelo operador “?”
(por exemplo, ?o1). Os placeholders utilizados para a construção de um antipadrão são:

?uri_o1 - Define a URI da ontologia 1 no alinhamento.
Elemento: <Ontology rdf:about="?uri_o1">
Exemplo: <Ontology rdf:about="http://cmt">

?uri_o2 - Define a URI da ontologia 2 no alinhamento.
Elemento: <Ontology rdf:about="?uri_o2">
Exemplo: <Ontology rdf:about="http://conference">

?loc_o1 - Define o local da ontologia 1 no alinhamento.
Elemento:<location>?loc_o1</location>
Exemplo:
<location>http://nb.vse.cz/~svabo/oaei2010/cmt.owl</location>

?loc_o2 - Define o local da ontologia 2 no alinhamento.
Elemento: <location>?loc_o1</location>
69
Exemplo:
<location>http://nb.vse.cz/~svabo/oaei2010/Conference.owl</location>

?o1 - Define que uma entidade é uma instância da ontologia descrita em ?uri_o1.
Exemplo: rdf:resource="http://cmt#"

?o2 - Define que uma entidade é uma instância da ontologia descrita em ?uri_o2.
Exemplo: rdf:resource="http://conference#"

?eN - Define uma entidade qualquer (individuo) dentro de uma ontologia, onde
N é um número identificador único dentro de um elemento <cell>. Deve
sempre ser ocorrer depois de ?o1 ou ?o2 e um operador de relação de variáveis.
Exemplo: ?o1:?e1 -> rdf:resource="http://conference#Person"
?o1:?e2 -> rdf:resource="http://conference#Review"
Operadores:

: (dois pontos) - Define que uma entidade faz parte de uma determinada
ontologia.
Exemplo ?o1:?e1. A entidade ?e1 faz parte da ontologia ?o1.

<condition> - Estabelece uma condição para que uma entidade seja instanciada.
Exemplo:
<Class rdf:about="?o2:?e1"/>
<Condition>
<Property rdf:about="?o2:p1">
<domainRestriction>
</domainRestriction>
</Property>
</Condition>
Relações:

Equivalence: Define a relação de equivalência entre duas entidades.
70
Elemento:
ou
<relation>=</relation>

Disjoint: Define que duas entidades são disjuntas. Pode ocorrer na mesma
ontologia ou entre duas ontologias. Quando ocorrer na mesma ontologia deve
ser verificada a estrutura da referida ontologia. Quando ocorrer entre duas
ontologias o alinhamento deve ser verificado.
Elemento: <relation rdf:resource="disjoint"/>

Subsumption: Define a relação is-a entre duas ontologias. Sempre deve ocorrer
na seguinte forma: <entity1> is-a <entity2>. Pode ocorrer na mesma ontologia
ou entre duas ontologias. Quando ocorrer na mesma ontologia deve ser
verificada a estrutura da referida ontologia. Quando ocorrer entre duas
ontologias o alinhamento deve ser verificado.
Elemento: <relation rdf:resource="subsumedBy"/>
Observação: Qualquer relação que seja representada na mesma ontologia deve
ser verificada a estrutura da mesma, caso seja representada entre as duas ontologias
deve ser verificado o alinhamento entre as mesmas.
Entidades:

Classe (class):
Elemento: <Class rdf:about="" />
Exemplo: <Class rdf:about="o1:Car" />

Propriedade de Objeto (objectProperty)
Elemento: <Relation rdf:about="" />
Exemplo: <Relation rdf:about="o1:hasLocation" />
Restringindo o domínio:
<Relation rdf:about="o1:hasLocation">
<domainRestriction>
71
<Class rdf:about="o1:Worker" />
</Relation>
Restringindo o intervalo:
<Relation rdf:about="o1:madeOf">
<rangeRestriction>
<Class rdf:about="o1:Steel"/>
</rangeRestriction>
</Relation>

Propriedade de Dado (dataProperty)
Elemento: <Property rdf:about="" />
Exemplo: <Property rdf:about="o1:color" />
Restringindo o domínio:
<Property rdf:about="o1:color">
<domainRestriction>
<Class rdf:about="o1:Car"/>
</Property>
A seguir a representação da forma geral do antipadrão de correspondência acima
descrito através da linguagem EDOAL:
<?xml version="1.0" encoding="UTF-8"?>
<rdf:RDF
xmlns
="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#"
xmlns:rdf
="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:xsd
="http://www.w3.org/2001/XMLSchema#"
xmlns:align
="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#"
xmlns:dc
="http://purl.org/dc/elements/1.1/"
xmlns:dcterms ="http://purl.org/dc/terms/">
<rdf:Description>
<dc:creator>Anselmo Guedes <[email protected]></dc:creator>
<dc:description>Correspondência de duas subclasses em que suas superclasses são
disjuntas</dc:description>
<dc:date>2014-04-14</dc:date>
<dcterms:identifier>OCA01</dcterms:identifier>
<dcterms:abstract></dcterms:abstract>
<dcterms:hasVersion>0.1</dcterms:hasVersion>
</rdf:Description>
<Alignment>
<onto1>
72
<Ontology rdf:about=":uri_o1">
<location>:loc_o1</location>
</Ontology>
</onto1>
<onto2>
</Ontology>
</onto2>
<map>
<cell>
</cell>
<cell>
</cell>
<cell>
</cell>
<cell>
</cell>
<cell>
</cell>
</map>
</Alignment>
</rdf:RDF>
Dadas as propriedades existentes na linguagem de representação de
alinhamentos EDOAL, a mesma pôde ser utilizada para representação computacional
dos modelos de antipadrão de correspondência, permitindo que tais modelos possam ser
interpretados e o modelo verificado através de uma máquina de raciocínio (reasoner).
73
4. Catálogo de Antipadrões de Correspondência
Este capítulo apresenta um catálogo de antipadrões de correspondência,
construído com base na análise dos alinhamentos disponibilizados nas três últimas
edições da Iniciativa de Avaliação de Alinhamento de Ontologias – OAEI, a partir da
identificação de correspondências incorretas que ocorrem de forma frequente e
recorrente.
4.1.
Buscando por Antipadrões de Correspondência
A metodologia apresentada na Seção 3.2 foi aplicada sobre os resultados
disponibilizados pela OAEI nas suas três últimas edições (2011.5, 2012 e 2013) para a
identificação de antipadrões de correspondência a partir de erros recorrentes de
alinhamento gerados pelas ferramentas avaliadas. Cada passo deste processo será a
seguir resumidamente explicado e demonstrado sua aplicação sobre a base de
alinhamentos disponibilizados pela OAEI e os resultados obtidos. Foi considerado um
total de 40 tarefas de alinhamento, cujos pares de ontologias alinhadas estavam
disponíveis em todas as três últimas edições.
Passo 1 – Apresentar Solução Problemática: O primeiro passo para a construção de
antipadrões de correspondência é ter o correto entendimento do problema que está
sendo tratado. Para iniciar a busca por antipadrões de correspondência, o primeiro passo
74
foi a identificação das correspondências incorretas, ou falsos positivos, no conjunto de
alinhamentos selecionado. Falsos positivos são as correspondências encontradas, que
não fazem parte do conjunto real de correspondências (correspondências corretas) entre
duas ontologias. Dentro do universo das correspondências incorretas identificadas,
foram selecionadas para análise aquelas que ocorrem com mais frequência dentro do
conjunto de alinhamentos a fim de limitar o escopo do estudo. Utilizou-se como critério
para seleção das correspondências incorretas, aquelas que ocorrem em mais de 50% do
total de correspondências incorretas identificadas. Para as correspondências incorretas
que ocorrem abaixo de 50% do total de correspondências incorretas identificadas,
percebeu-se uma tendência de repetição dos erros, o que levou-se a limitar o escopo do
estudo dessa forma.
A Tabela 8 lista todas as correspondências incorretas que ocorreram com uma
frequência acima do limite mínimo nas tarefas de alinhamento analisadas. Este conjunto
de correspondências foi gerado a partir dos aterfatos disponibilizados pela OAEI,
alinhamentos finais gerados pelas ferramentas analisadas e alinhamentos de referência
das tarefas de alinhamento avaliadas. Ao realizar o cruzamento desses dois aterfatos
(correspondências identificadas x correspondências verdadeiras) foi possível gerar um
conjunto de correspondências incorretas para análise.
As colunas Ontologia 1 e Ontologia 2 apresentam o par de ontologias da tarefa
de alinhamento, as colunas Entidade 1 e Entidade 2 apresentam o par de entidades da
correspondência incorreta. A coluna Frequência apresenta o número de vezes em que a
correspondência incorreta foi retornada no conjunto de tarefas de alinhamento
analisado, ou seja, o número de ferramentas que incorretamente identificaram esta
correspondência. Uma correspondência é considerada incorreta quando esta ocorre no
alinhamento final gerado por uma ferramenta, mas não consta em seu alinhamento de
75
referência. A coluna Total de Ferramentas representa o total de ferramentas que
geraram alinhamento entre o par de ontologias, sendo que uma ferramenta gera apenas
um alinhamento entre um par de ontologias por campanha da OAEI. A coluna %
representa a razão entre a frequência e o total de ferramentas.
Não foi levada em conta nesta análise a força da relação na correspondência, ou
seja, todas as correspondências identificadas pelas ferramentas foram consideradas,
independente da força atribuída a essa relação.
Tabela 8 - Correspondências incorretas identificadas no conjunto de alinhamentos selecionado.
#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
Tarefa de Alinhamento
Ontologia 1
Conference
Cmt
Edas
Iasted
Conference
Edas
Conference
Conference
Edas
Cmt
Conference
ConfOf
mouse
mouse
Conference
Edas
Cmt
Conference
Conference
Cmt
mouse
ConfOf
ConfOf
mouse
Iasted
ConfOf
Cmt
Iasted
Cmt
ConfOf
ConfOf
Cmt
ConfOf
ConfOf
Cmt
ConfOf
Conference
Cmt
Conference
Conference
Ontologia 2
Ekaw
Iasted
Ekaw
Sigkdd
Ekaw
Iasted
Iasted
ConfOf
Ekaw
Conference
Edas
Edas
human
human
Ekaw
Ekaw
ConfOf
Ekaw
Sigkdd
Conference
human
Edas
Ekaw
human
Sigkdd
Edas
Sigkdd
Sigkdd
ConfOf
Edas
Edas
Sigkdd
Edas
Edas
Ekaw
Ekaw
Iasted
Edas
Edas
Edas
Correspondência incorreta identificada
<Entidade1, Entidade2, ≡,_>
Entidade 1
Entidade 2
Invited talk
Invited Talk
Document
Document
Presenter
Presenter
Document
Document
Conference participant Conference Participant
Person
Person
Presentation
Presentation
Conference
Conference
Conference
Conference
Reviewer
Reviewer
Conference
Conference
Conference
Conference
MA 0000065
NCI C12685
MA 0000323
NCI C12378
Conference
Conference
Conference Session
Conference Session
Paper
Paper
Paper
Paper
Conference
Conference
Paper
Paper
UNDEFINED part of
UNDEFINED part of
hasEmail
hasEmail
Paper
Paper
MA 0000003
NCI C12919
pay
pay
hasPhone
hasPhone
name
Name
obtain
obtain
writtenBy
writtenBy
hasPostalCode
hasPostalCode
hasStreet
hasStreet
date
Date
hasTopic
hasTopic
hasCountry
hasCountry
writtenBy
writtenBy
writtenBy
writtenBy
is given by
is given by
email
hasEmail
Call for paper
CallForPapers
has an email
hasEmail
76
Frequência
Total de
Ferramentas
%
53
53
53
53
52
52
52
52
52
51
51
50
39
39
49
48
47
47
47
47
37
46
46
36
44
43
43
42
41
41
40
40
39
39
38
38
37
31
29
27
57
57
57
57
57
57
57
57
57
57
57
57
45
45
57
57
57
57
57
57
45
57
57
45
57
57
57
57
57
57
57
57
57
57
57
57
57
57
57
57
93%
93%
93%
93%
91%
91%
91%
91%
91%
89%
89%
88%
87%
87%
86%
84%
82%
82%
82%
82%
82%
81%
81%
80%
77%
75%
75%
74%
72%
72%
70%
70%
68%
68%
67%
67%
65%
54%
51%
47%
Com os dados apresentados na Tabela 8, temos então 40 casos de soluções
problemáticas para analisar para compor o catálogo de antipadrões de correspondência.
Passo 2 – Evidenciar Solução Problemática: Este passo possui como objetivo
demonstrar que a solução problemática de fato ocorre. Ainda na Tabela 8, as colunas
Frequência, Total de Ferramentas e % confirmam que estas 40 correspondências
ocorreram de forma recorrente nas três últimas edições da OAEI (mais de 41% das
ferramentas) e são frequentes entre os sistemas de alinhamentos avaliados.
Passo 3 – Demonstrar Implicações: Para cada correspondência apresentada na Tabela
8, foi realizada uma análise do problema e de suas implicações. A seguir, será
apresentado cada caso que gera um problema de alinhamento. Os casos que apresentam
o mesmo problema são indicados como casos relacionados.

Caso #1: Correspondência #8 〈confof:conference, edas:conference, ≡, _〉
Postulado: Seja uma classe e1 em uma ontologia o1 que é subclasse de uma
classe e2, que por sua vez seja subclasse de uma classe e3 na mesma ontologia o1. Se a
classe e3 na ontologia o1 for correspondente por igualdade com a classe e2 na ontologia
o2 e a classe e1 da ontologia o2 for disjunta da classe e2 da ontologia o2, então a classe
e1 da ontologia o1 não pode ser correspondente por igualdade com a classe e1 na
ontologia o2.
O tipo de problema identificado neste caso foi uma contradição de disjunçãosubsunção. As Figuras 19 e 20 ilustram respectivamente um fragmento do alinhamento
analisado e a generalização do problema identificado.
77
Figura 19 - Problema de alinhamento entre as ontologias ConfOf e Edas.
Figura 20
- Generalização do problema de alinhamento Caso 1.
Correspondências qual apresentam o mesmo problema identificado no Caso 1:
〈edas:conferencesession, ekaw:conference_session, ≡, _〉

Caso #2: Correspondência #18 〈conference:paper, ekaw:paper, ≡, _〉.
Postulado: Seja uma classe e1 em uma ontologia o1 que é subclasse de uma
classe e2, que por sua vez seja uma classe disjunta de uma classe e3, também na
ontologia o1. Se a classe e1 na ontologia o1 for correspondente por igualdade com uma
classe e1 em uma ontologia o2, a classe e3 em o1 for correspondente com uma classe e2
na ontologia o2 e a classe e2 em o2 for uma subclasse de e1 em o2, então há um
problema de alinhamento.
78
Figura 21 - Problema de alinhamento entre as ontologias Conference e Ekaw.
Figura 22
- Generalização do problema de alinhamento Caso 2.
〈edas:conference, ekaw:conference, ≡, _〉

Caso #3: Correspondência #23 〈confof:paper, ekaw:paper, ≡, _〉
Postulado: Seja uma classe e1 em uma ontologia o1 que é disjunta de uma classe
e2 na mesma ontologia o1 e uma classe e1 na ontologia o2 que seja subclasse de uma
classe e2 na mesma ontologia o2. Se a classe e1 em o1 for correspondente por igualdade
com a classe e1 em o2 e a classe e2 em o1 for correspondente por igualdade com a
classe e2 em o2, então há um problema de alinhamento.
79
Figura 23 - Problema de alinhamento entre as ontologias ConfOf e Ekaw.
Figura 24 - Generalização do problema de alinhamento Caso 3
Não existem correspondências similares ao Caso 3 no grupo de estudo
selecionado.

Caso #4: Correspondência #29 〈cmt:writtenBy, confof:writtenBy, ≡, _〉
Postulado: Seja uma propriedade p1 na ontologia o1 que possui como domínio
uma classe e1 e intervalo a classe e2, ambas na ontologia o1, e uma propriedade p1 em
uma ontologia o2 que possui como domínio uma classe e1 e intervalo a classe e2,
ambas na ontologia o2. Se essa propriedade p1 em o1 for correspondente por igualdade
com a propriedade p1 em o2, mas a classe e1 em o1 não for correspondente com a
classe e1 na ontologia o2 ou a classe e2 na ontologia o1 não for correspondente com a
classe e2 na ontologia o2, então há um problema de alinhamento.
O tipo de problema identificado neste caso foi uma incompletude de domínio e
intervalo. As Figuras 25 e 26 ilustram respectivamente um fragmento do alinhamento
80
Figura 25 - Problema de alinhamento entre as ontologias CMT e ConfOf.
Figura 26 - Generalização do problema de alinhamento Caso 4.
〈confof:hasPhone, edas:hasPhone, ≡, _〉, 〈iasted:obtain, sigkdd:obtain, ≡, _〉 e
〈confof:writtenBy, confof:writtenBy, ≡, _〉

Caso #5: Correspondência #31 〈confof:hasStreet, edas:hasStreet, ≡, _〉
Postulado: Seja uma propriedade p1 em uma ontologia o1 que possui como
domínio uma classe e1 e uma outra classe e2, ambas também na ontologia o114 e uma
propriedade p1 em uma ontologia o2 que possui como domínio uma classe e1, também
na ontologia e2. Se a propriedade p1 em o1 for correspondente por igualdade com a
propriedade p1 em o2 e a classe e1 na ontologia o2 não for correspondente com
nenhuma das classes de domínio de p1 em o1, então há um problema de alinhamento.
14
Uma propriedade pode definir múltiplos domínios. Múltiplos domínios são permitidos e podem ser
interpretados como uma conjução: estes restringem o domínio da propriedade para aqueles indivíduos que
pertence à interseção das descrições de classe. Disponível em: http://www.w3.org/TR/owl-ref/
81
O tipo de problema identificado neste caso foi incompletude de domínio e
Figura 28 - Generalização do problema de alinhamento Caso 5
〈confof:hasPostalCode, edas:hasPostalCode, ≡, _〉 e 〈cmt:date, sigkdd:date, ≡, _〉

Caso #6: Correspondência #6 〈edas:person, iasted:person, ≡, _〉
Postulado: Seja uma classe e1 na ontologia o1 e uma classe o2, também na
ontologia o1 que são disjuntas, e seja uma classe e1 em uma ontologia o2 que possui a
propriedade de equivalência com uma propriedade p1 também em o2, que por sua vez
possui como domínio uma classe e3 (o2:e1 é equivalente a o2:e3, tal que possua uma
propriedade o2:p1), que é uma subclasse de e2, ambas na ontologia o2. Se a classe e1
na ontologia o2 for correspondente por igualdade com a classe e2 na ontologia o1 e a
classe e1 em o1 for correspondente por igualdade com a classe e2 em o2, então tem-se
um problema de alinhamento.
82
Os tipos de problema identificados neste caso foram incompletude de domínio e
intervalo e contradição de disjunção-subsunção. As Figuras 29 e 30 ilustram
respectivamente um fragmento do alinhamento analisado e a generalização do problema
identificado.
Figura 29 - Problema de alinhamento entre as ontologias Edas e Iasted.
〈conference:invited_talk, ekaw:invited_talk, ≡, _〉

Caso #7: Correspondência #20 〈cmt:paper,conference:paper, ≡, _〉
Postulado: Seja uma classe e1 em uma ontologia o1 que é uma superclasse de
uma classe e2, também na ontologia o1, uma classe e1 em uma ontologia o2, que é
subclasse de uma classe e2 também em o2, que por sua vez é disjunta de uma classe e3,
também na ontologia o2. Se a classe e2 na ontologia o1, for correspondente por
83
igualdade com a classe e1 na ontologia o2 e a classe e1 na ontologia o1 for
correspondente por igualdade com a classe e3 na ontologia o2, então tem-se um
O tipo de problema identificado neste caso foi contradição de disjunçãosubsunção. As Figuras 31 e 32 ilustram respectivamente um fragmento do alinhamento
Figura 31 - Problema de alinhamento entre as ontologias CMT e Conference.
〈conference:callForPaper,edas:callForPapers, ≡, _〉

Caso #8: Correspondência #25 〈iasted:pay, sigkdd:pay, ≡, _〉
domínio uma classe e1 e como intervalo uma classe e2, ambas na ontologia o1. Se essa
propriedade p1 em o1, for correspodente por igualdade com uma propriedade p1 em
uma ontologia o2, que por sua vez possui como domínio uma classe e1 e intervalo e2,
84
ambas em o2, as classes e1 em o1 e e1 em o2 forem correspondentes por igualdade e as
classes e2 em o1 e e2 em o2 não possuírem relação de equivalência, então tem-se um
Figura 33 - Problema de alinhamento entre as ontologias Iasted e Sigkdd.
〈cmt:writtenBy, ekaw:writtenBy, ≡, _〉

Caso #9: Correspondência #33 〈confof:hasTopic, edas:hasTopic, ≡, _〉
domínio uma classe e1 e como intervalo uma classe e2, ambas da ontologia o1. Se a
propriedade p1 na ontologia o1 for correspondente por igualdade com uma propriedade
p1 em uma ontologia o2, que por sua vez possui como domínio duas classes e1 e e2,
ambas em o2, e possui como intervalo uma classe e3, também em o2 e as classes e2 em
o1 e e3 em o2 forem correspondentes por igualdade e as classes e1 e e2 na ontologia o2
85
não possuirem relações de correspondência com outras classes de domínio na
propriedade p1 na ontologia o1, então tem-se um problema de alinhamento.
〈confof:hasCountry,
edas:hasCountry,
≡,
_〉
e
〈conference:isGivenBy,
iasted:isGivenBy, ≡, _〉
Passo 4 – Identificação da Solução Problemática: A representação formal de como
identificar um problema de alinhamento é o que dá vida ao antipadrão de
correspondência. Para cada problema identificado nos casos analisados no passo
anterior, foi criado um antipadrão de correspondência. A Seção 4.2 apresenta o modelo
completo dos antipadrões de correspondências desenvolvidos.
86
Passo 5 – Apresentar Solução Refatorada: Conforme apresentado anteriormente,
realizar a refatoração de uma correspondência inconsistente não é uma tarefa trivial. A
avaliação de abordagens para a refatoração automática de um alinhamento será
conduzida em trabalhos futuros.
87
5. Framework de Antipadrões de Correspondência
Este capítulo apresenta a arquitetura de um framework de antipadrões de
correspondência assim como o protótipo de framework construído para manutenção e
identificação de antipadrões de correspondência.
5.1.
Por que um Framework?
Framework de aplicações são uma abordagem que atualmente favorecem o
suporte para a retutilização de projetos de software e sua implementação. Um
framework destina-se a identificar abstrações chave que são úteis para a implementação
de classes de aplicações, bem como a implementação padrão de grande parte dessas
abstrações [32]. Configurações em tempo de projeto e em tempo de execução permitem
a composição lógica para construir uma aplicação a partir de um framework,
incorporando o código fornecido pelo desenvolvedor que “completa” a aplicação
definida pelo framework. Existem vários benefícios potenciais ao utilizar frameworks
[32], dentre os quais pode-se destacar:

Modularidade: Frameworks podem fornecer interfaces estáveis que encapsulam
detalhes de implementação e dissociam clientes da implementação de mudanças.
Componentes dentro de um framework podem ser fornecidos pelo framework,
propriamente dito, assim como pelo cliente que o utiliza.
88

Reusabilidade: Componentes estáveis dentro de um framework podem ser
reutilizáveis em multiplas aplicações.

Extensibilidade: Frameworks fornecem pontos de entrada que permitem a
incorporação de um código do cliente no framework.
Em um processo de alinhamento de ontologias, conforme apresentado na Seção
2.3, recursos podem ser adicionado no referido processo. Antipadrões de
correspondência, ao atuarem como modelos que visam identificar correspondências
incorretas dentro de um alinhamento gerado entre duas ontologias, podem ser utilizados
como recursos no processo de alinhamento das mesmas, de modo que as
correspondências encontradas possam ser validadas de acordo com o modelo de
antipadrão fornecido. Sendo assim, esse recurso utilizado para a verificação de uma
correspondência, pode ser considerado um módulo que estende o sistema que está
realizando o alinhamento entre duas ontologias. Além disso, os antipadrões de
correspondência podem ser desenvolvidos por qualquer especialista e cadastrados na
base de dados do framework, além de poder selecionar em um catálogo de antipadrões
de correspondências quais deseja-se utilizar. Este conjunto de fatores está alinhado com
a definição de um framework de aplicações, o que torna a aplicação proposta neste
trabalho modular, extensível e reutilizável, características básicas de um framework de
aplicações.
5.2.
Arquitetura do Framework de Antipadrões de Correspondência
A Figura 37 ilustra a arquitetura proposta de um framework de padrões de
alinhamento de ontologias do ponto de vista do processo de alinhamento de ontologias.
Ao submeter duas ontologias a um processo de alinhamento, o sistema de alinhamento
pode solicitar a um sistema externo (recurso) que realize a validação das
89
correspondências encontradas com base nos modelos de antipadrões disponíveis. Sob
essa ótica, os principais componentes de um framework de antipadrões de
correspondência são:
1. Validador: Quando o usuário realizar o cadastro de um novo antipadrão
de correspondência, o componente de cadastro deverá realizar análise
lógica e sintática do antipadrão de correspondência que está sendo
cadastrado pelo usuário, como por exemplo, sintaxe XML, abertura e
fechamento de elementos do antipadrão, construtos da linguagem, etc. O
validador deverá observar ainda se a forma e linguagem em que o padrão
está escrito são interpretáveis pelo motor de raciocínio de padrões.
2. Banco de Dados de Antipadrões: Ao realizar o cadastro de um antipadrão
de correspondência, este deverá ser persistido em uma base de dados de
antipadrões de correspondência. Este é o repositório no qual estão
persistidos os antipadrões catalogados, para que possam ser reutilizados
por qualquer sistema de alinhamentos de ontologias.
3. Interpretador de Antipadrões de Correspondência: No processo de busca
por todas as instâncias possíveis em um modelo de um antipadrão de
correspondência em um alinhamento, o interpretador de antipadrões de
correspondência é que executa esta tarefa. O sistema de alinhamento
solicita
diretamente
a
este
componente
a
validação
de
uma
correspondência, e recebe uma resposta afirmativa ou negativa sobre a
mesma.
4. Banco de Dados Externo: um banco de dados externo, como a WordNet
[64], pode ser utilizado como referência para encontrar correspondências
entre os termos das ontologias.
90
Figura 37 - Arquitetura de um framework de antipadrões de correspondência sob o ponto de vista de
processo de alinhamento de ontologias.
A Figura 38 ilustra os componentes do protótipo desenvolvido para o framework
de antipadrões de correspondência e suas correlações.
Figura 38 - Pseudo-Arquitetura do framework de antipadrões de correspondência.

GUI: Interface gráfica com o usuário. Representa a camada de apresentação
do framework. Este componente é que realiza a interação direta com do
usuário com os outros componentes do framework. Diretamente a este
componente estão os formulários individuais, a saber:
91
o Valid. Corresp. (Validar Correspondências): Formulário de entrada
para a execução do processo de verificação de um antipadrão de
correspodência. Um usuário pode, manualmente, submeter um par de
entidades ao processo de verificação de antiapdrões de correspondência,
ou pode solicitar que o framework valide todo um alinhamento.
Figura 39 – Formulário Validar Correspondências
o Ident. FP / FN (Identificar Falsos Positivos / Falsos Negativos):
Módulo do sistema que automatiza a identificação de correspondências
incorretas e correspondências ausentes em um alinhamento (falsos
positivos e falsos negativos). Os falsos positivos e falsos negativos são
persistidos em banco de dados para posterior análise, manual, de um
especialista. A busca por falsos positivos e falsos negativos pode ser
realizada individulamente em um alinhamento ou em lotes de
alinhamentos.
92
Figura 40 – Formulário Identificar Falsos Positivos / Falsos Negativos - Individual
Figura 41 – Formulário Identificar Falsos Positivos / Falsos Negativos – Em lotes
93
o Manut. OCA (Manutenção OCA): Formulário de cadastro dos
antipadrões de correspondência (oca – ontology correspondence
antipaterns). Neste formulário, além do modelo final escrito na
linguagem EDOAL, é possivel que cadastra uma documentação básica
sobre o antipadrão em questão. Ambos são persistidos em banco de
dados.
Figura 42 – Formulário Manutenção OCA
o Manut. Ferramentas (Manutenção de Ferramentas): Cadastro das
ferramentas quais gerarm alinhamentos apurados pelo módulo de
identificação de falsos positivos e falsos negativos.
Figura 43 – Formulário Manutenção de Ferramentas
o Manut. Eventos (Manutenção de Eventos): Cadastro de eventos quais
foram originados os alinhamentos apurados pelo módulo de
94
Figura 44 – Formulário Manutenção de Eventos
o Manut. Ontologias (Manutenção de Ontologias): Cadastro de
ontologias presentes nos alinhamentos apurados pelo módulo de
Figura 45 – Formulário Manutenção de Ontologias

OCA Reasoner: Classe que efetivamente busca a instanciação de um
antipadrão de correspondência a partir de um modelo informado. Pode ser
executada manualmente por um usuário através do formulário “Validar
Correspondências” ou pode ser executada diretamente por um sistema
externo. A classe OCA Reasoner possui os seguintes métodos, conforme
ilustrado na Figura 46:
95
Figura 46 - Classe OCAReasoner.
o getAntipatternInstance: Método do tipo lógico que realiza a
instanciação de uma correspondência em um alinhamento de acordo
com o modelo de antipadrão de correspondência informado. O retorno
falso do método significa que o modelo não foi instanciado, logo o
antipadrão não pode ser verificado, o retorno verdadeiro indica que o
modelo foi instanciado, logo o antipadrão foi verificado de acordo com
os parâmetros informados. Parâmetros do método:

URI Ontologia 1: caminho completo da especificação OWL da
ontologia l alinhanda.

URI Ontologia 2: caminho completo da especificação OWL da
ontologia 2 alinhanda.

URI Alinhamento: caminho completo da especificação EDOAL do
alinhamento gerado entre as ontologias 1 e 2 informadas.

Entidade 1: descrição da entidade 1 da correspondência a ser
verificada.

Entidade 2: descrição da entidade 2 da correspondência a ser
verficada.

Modelo
Antipadrão:
modelo
EDOAL
correspondência qual será verificado.
96
do
antipadrão
de
o getEntityType: Retorna o tipo de uma entidade (classe, propriedade,
relação).
o validRelation: Verifica se uma relação entre duas entidades seja da
mesma ontologia ou no alinhamento informado, de fato existe. Não
realizada validação semântica da relação, apenas verifica se a mesma
está declarada explicitamente.

Ontology: Classe que instancia os elementos de uma ontologia. Possui os
seguintes atributos e métodos, conforme ilustrado na Figura 47:
Atributos:
o classes: Lista de classes da ontologia.
o classesDisjoint: Matriz de classes disjuntas da ontologia.
o classesDomain: Matriz de classes que compõem os domínios das
relações presentes na ontologia.
o classesEquivalent: Matriz de classes equivalentes da ontologia.
o classesRange: Matriz de classes que compõem os intervalos das
relações presentes na ontologia.
o ontologyName: Nome da ontolgia
o pathOntology: Caminho físico ou URI da ontologia.
o properties: Lista de propriedades da ontologia.
o relations: Lista de relações da ontologia.
o superClasses: Matriz de superclasses com suas repectivas subclasses na
ontologia.
o XMLOnto: representação da ontologia em OWL.
Métodos:
97
o cleanseEntityName: Realizada a “limpeza” no nome de uma entidade,
removendo caracters como “#”, “_”, “&”, “/” e textos como “http://”.
o getClassesDisjoint: Retorna as classes disjuntas de uma determinada
classe.
o getClassesDomain: Retorna as classes de domínio de uma determinada
relação.
o getClassesEquivalents: Retorna as classes equivalentes de uma
determinada classe.
o getClassesRange: Retorna as classes de intervalo de uma determinada
relação.
o loadOntology: Instancia uma ontologia e todas suas entidades e
propriedades. Apenas executa os métodos do tipo “set” abaixo listados.
o setClasses: Instancia o atributo classes.
o setClassesDisjoint: Instancia o atributo classesDisjoint.
o setClassesDomain: Instancia o atributo classesDomain.
o setClassesEquivalents: Instancia o atributo classesEquivalent.
o setClassesRange: Instancia o atributo classesRange.
o setOntologyName: Instancia o atributo ontologyName.
o setPathOntology: Instancia o atributo pathOntology
o setProperties: Instancia o atributo properties.
o setRelations: Instancia o atributo relations.
o setSuperClasses: Instancia o atributo superClasses.
98
Figura 47 - Classe Ontology.

Alignment: Classe que instancia um alinhamento realizado entre duas
ontologias, conforme ilustrada na Figura 48.
Atributos:
o alignment: Matriz de correspondências do alinhamento instanciado.
Possui os elementos e, e’, r, n de uma correspondência.
o pathAlignmentFile: Caminho físico ou URI do alinhamento.
Métodos:
99
o equalizeRelation:
Equaliza
os
termos
da
relação
de
uma
correspondência. Por exemplo: os termos “xsd:Equivalence” ou
“equivalence”, são transformados em “=”.
o getCorrespondence: Retorna se uma correspondência informada existe
no alinhamento instanciado.
o repairAlignment: Remove uma correspondência do alinhamento
instanciado.
o setAlignment: Instancia o atributo alignment.
o setPathAlignmentFile: Instancia o atributo pathAlignmentFile.
Figura 48 - Classe Alignment.

IncorrectCorrespondences:
Classe
que
realiaza
a
apuração
das
correspondências incorretas e inexistente em um alinhamento final. Para tal
é necessário possuir o alinhamento de referência.
Métodos:
o getFalseNegatives:
Realiza
a
apuração
dos
falsos
negativos
(correspondências corretas não identiticadas em alihamento final) em
um determinado alinhamento.
100
o getFalsePositives:
Realiza
a
apuração
dos
falsos
positivos
(correspondências incorretas identificadas em um alinhamento final).
o getTruePositives: Realiza a apuração dos verdadeiros positivos
(correpondências corretas identificadas em um alinhamento final).
o setFinalAlignment: Instancia um alinhamneto final.
o setReferenceAlignment: Instancia um alinhamento de referência.
Figura 49 - Classe IncorrectCorrespondences.

ORM: Object-Relational Mapping – Mapeamento objeto-relacional. Realiza
a abstração das tabelas do banco de dados utilizado pelo framework de
antipadrões de correspondência para classes, onde cada tabela torna-se uma
classe e seus respectivos dados em instâncias.

Banco de Dados: Para persitir os dados gerados pelo framework de
antipadrões de correspondência para reutilização, foi construído um banco
de dados relacional, cuja modelagem é ilustrada na Figura 50. A descrição
de cada tabela do banco de dados é apresentada na Tabela 9.
Tabela 9 – Descrição das tabelas utilizadas pelo framework.
Tabela
Descrição
Alinhamentos entre duas ontologias gerados por uma
TB_Alinhamento
ferramenta de alinhamento em um determinado evento.
TB_AlinhamentoCorrespondencia
Correspondências existentes em um alinhamento
Persistência do alinhamento de referência entre duas
TB_AlinhamentoReferencia
ontologias
Correspondências existentes em um alinhamento de
TB_AlinhamentoReferenciaCorrespondencia
referência
101
TB_Antipattern
TB_Evento
TB_FalsoNegativo
TB_FalsoPositivo
TB_Ferramenta
TB_Ontologia
Persistência dos modelos de antipadrões de
correspondência
Evento qual se origina os alinhamentos
Correspondências existentes, de acordo com o
alinhamento de referência, que não existem em um
determinado alinhamento.
Correspondências identificadas em um determinado
alinhamento que não existem em seu respetivo
alinhamento de referência
Ferramenta de alinhamento de ontologias qual gerou um
alinhamento
Ontologia que faz parte de um alinhamento
Figura 50 - Modelo Relacional das entidades do framework de antipadrões de correspondência.
102
6. Estudo de Caso: Aplicando os Antipadrões de
Correspondência
Este capítulo apresenta o estudo de caso realizado a partir dos antipadrões de
correspondência construídos. Os antipadrões construídos foram aplicados sobre uma
base real de alinhamentos, disponbilizada pela iniciativa de avaliação de alinhamento
de ontoloigas – OAEI, a fim de verificar sua aplicabilidade.
6.1.
Visão Geral
Nos capítulos anteriores, foram apresentados os conceitos de antipadrões de
correspondência, uma metodologia para sua identificação e construção, assim como um
catálogo de antipadrões de correspondência identificados ao aplicar a metodologia
proposta sobre uma base real de alinhamentos. Também foi apresentada a arquitetura de
um sistema de suporte a antipadrões de correspondência. Com o intuito de enriquecer a
avaliação da proposta, evidenciando a aplicabilidade dos antipadrões construídos em
cenários reais de alinhamento de ontologias, nesta seção será apresentado o resultado de
um estudo de caso explanatório conduzido sobre a base de alinhamentos disponibilizada
pela Iniciativa de Avaliação de Alinhamento de Ontoloigas (OAEI).
A estratégia para a aplicação dos antipadrões de correspondência adotada neste
estudo de caso considera a arquitetura proposta na Seção 5.2 com a diferença que os
alinhamentos finais foram submetidos manualmente para o framework de antipadrões
103
de correspondência. Conforme apresentado ainda na Seção 5.2, o framework possui
interface com usuário final de forma a possibilitar a execução do processo de
verificação de um antipadrão de correspondência pelo mesmo, não sendo necessário que
a ferramenta que realizou o alinhamento submeta os dados ao raciocinador de
antipadrões de correspondência.
A seleção dos domínios disponibilizados pela OAEI para o estudo de caso levou
em consideração os seguintes critérios: (i) possuir os alinhamentos gerados pelas
ferramentas avaliadas pela OAEI; (ii) possuir o alinhamento de referência; (iii) possuir
as ontologias que foram alinhadas; (iv) estar disponível em ao menos uma das três
últimas edições do evento; (v) não estar no escopo de estudo para construção dos
antipadrões. De acordo com tais critérios foram selecionados os seguintes domínios
para o estudo: Anatomy15, Benchmark16 e Multifarm17.
O domínio Anatomy consiste em identificar um alinhamento entre uma ontologia
de um rato adulto e uma parte do tesauro NCI18, o qual descreve a anatomia humana. O
domínio Benchmark consiste em duas ontologias base estáveis (bibliografia e finanças)
e variações das mesmas, como por exemplo, sem comentários, sem restrições, sem
propriedades, sem tipos de dados, com sinônimos, traduções, etc., totalizando 188
ontologias, sendo 94 de bibliografia e 94 de finanças. O domínio Multifarm é composto
por um conjunto de sete ontologias traduzidas em nove idiomas (Inglês (en), Chinês
(cn), Checa (cz), Holandês (nl), Francês (fr), Alemão (de), Português (pt), Russo (ru) e
Espanhol (es)), totalizado 63 ontologias. Dentro do critério estabelecido de seleção de
dados, no domínio Multifarm foram obtidos 31777 alinhamentos, no domínio
15
http://oaei.ontologymatching.org/2013/anatomy/index.html
http://oaei.ontologymatching.org/2013/benchmarks/index.html
17
http://oaei.ontologymatching.org/2013/multifarm/index.html
18
http://www.cancer.gov/cancertopics/cancerlibrary/terminologyresources
16
104
Benchmark foram obtidos 1471 alinhamentos e no domínio Anatomy foram obtidos 45
alinhamentos.
Com exceção dos antipadrões de correspondência, todos os dados estão
disponíveis no próprio site da OAEI. Todo o processo foi realizado utilizando o
framework de antipadrões de correspondência desenvolvido neste trabalho. A avaliação
final dos alinhamentos foi realizada através da API de alinhamento 19 por meio do
framework de antipadrões de correspondência.
6.2.
Resultados Obtidos
Dos 11 antipadrões de correspondência construídos neste trabalho, somente 6
ocorrem nos domínios selecionados para o estudo. Tal situação pode ser justificada pelo
fato das ontologias envolvidas nos alinhamentos analisados para a construção de cada
antipadrão possuírem uma riqueza de características (propriedades, relações,
especializações, disjunções, restrições, etc.) maior que as ontologias selecionadas para o
estudo de caso.
A fim de delimitar o escopo do estudo conduzido, foram selecionadas as 10
correspondências incorretas que aparecem de forma mais recorrente no conjunto de
alinhamentos avaliados. A Tabela 10 apresenta o grupo selecionado. Para efeitos de
estudo, a refatoração dos alinhamentos analisados, ou seja, o reparo dos alinhamento
quais foram identificados as correspondências incorretas, considerou-se apenas a
eliminação da correspondência incorreta na qual foi identificado um antipadrão de
correspondência.
Tabela 10 - Grupo de correspondências incorretas selecionado para o estudo de caso.
Tarefa de Alinhamento
#
Domínio
Ontologia 1
19
Ontologia 2
Correspondência incorreta
identificada
<Entidade1, Entidade2, ≡,_>
Entidade 1
http://alignapi.gforge.inria.fr/
105
Entidade 2
Total
Alin.
Total
Ocorr.
%
OCA
01
Anatomy
Mouse
Human
MA_0002446
NCI_C25444
c-8693270iasted_nl
2767092
c-7650337conference_pt
8286527
c-04477088078411
c-61239807251265
45
22
49%
OCA02
43
40
93%
OCA04
43
35
81%
OCA04
02
Multifarm
cmt_en
03
Multifarm
cmt_es
04
Benchmark biblio_101
biblio_101
book
collection
17
5
29%
OCA05a
05
biblio_221
shortName
name
17
7
41%
OCA05b
06
biblio_101
book
collection
17
5
29%
OCA05b
c-16881497240940
c-04477088078411
c-11804392483437
c-27632614560459
c-11804392483437
c-34487442358764
c-57010751274855
c-10567664464703
43
38
88%
OCA06
43
37
86%
OCA06
43
39
91%
OCA09
43
32
74%
OCA09
07
Multifarm
confOf_
cz
08
Multifarm
iasted_nl
sigkdd_fr
09
Multifarm
confOf_nl
confOf_en
10
Multifarm
sigkdd_es
confOf_pt
confOf_nl
As colunas Ontologia 1 e Ontologia 2 indicam as ontologias que foram
alinhadas, as colunas Entidade 1 e Entidade 2 apresentam as entidades de cada
correspondência, sendo Entidade 1 pertecente à Ontologia 1 a Entidade 2 pertencente à
Ontologia 2. As colunas Total Alin. e Total Ocorr. apresentam o total de alinhamentos e
de correspondências encontradas entre as entidades descritas nas colunas Entidade 1 e
Entidade 2 e por fim, a coluna OCA apresenta o antipadrão de correspondência que
identificou a correspondência como inconsistente.
Em cada caso analisado foram obtidos os valores de Precisão, Cobertura e
Medida–F dos alinhamentos originais e após sua refatoração para fins de comparação.
Para composição da análise foram gerados valores médios das métricas de Precisão,
Cobertura e Medida-F, considerando todos os alinhamentos gerados pelas ferramentas
avaliadas pela OAEI com a correspondência incorreta identificada pelo referido
antipadrão de correspondência e sem o mesmo.
Caso 01 - Correspondência 〈mouse:MA_0002446, human:NCI_C25444, ≡, _〉
A correspondência 〈mouse:MA_0002446, human:NCI_C25444, ≡, _〉, indicada
pela seta vermelha na Figura 51, ocorre 22 vezes dentro de um conjunto de 45
alinhamentos. Nesta situação o antipadrão OCA02 - Contradição de disjunção-
106
subsunção, quando aplicado sobre os alinhamentos, identificou essa correspondência
como inconsistente.
Figura 51 - Correspondência 〈mouse:MA_0002446, human:NCI_C25444, ≡, _〉
Ao refatorar os alinhamentos, de forma a remover a correspondência identificada
como inconsistente, houve uma pequena melhora nas médias das métricas de Precisão
(0,03%) e Medida-F (0,02%) considerando o conjunto de alinhamentos analisados neste
caso, conforme apresentado na Figura 52. A média da métrica de Cobertura não foi
alterada.
valor médio
Figura 52 – Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos
alinhamentos originais e alinhamentos refatorados para o caso #1.
Caso 02 - Correspondência 〈cmt_en:c-8693270-2767092, iasted_nl:c0447708-8078411, ≡, _〉
107
A correspondência 〈cmt_en:c-8693270-2767092, iasted_nl:c-0447708-8078411,
≡, _〉, indicada pela seta vermelha na Figura 53, ocorre 40 vezes dentro de um conjunto
de 43 alinhamentos. Nesta situação o antipadrão OCA04 - Contradição de disjunçãosubsunção, quando aplicado sobre os alinhamentos, identificou essa correspondência
como inconsistente.
Figura 53 - Correspondência 〈cmt_en:c-8693270-2767092, iasted_nl:c-0447708-8078411, ≡, _〉
como inconsistente, houve melhora nas médias das métricas de Precisão (17,45%) e
Medida-F (7,08%) considerando o conjunto de alinhamentos analisados neste caso,
conforme apresentado na Figura 54. A média da métrica de Cobertura não foi alterada.
valor médio
108
Caso 03 - Correspondência 〈cmt_es:c-7650337-8286527, conference_pt:c6123980-7251265, ≡, _〉
A correspondência 〈cmt_es:c-7650337-8286527, conference_pt:c-61239807251265, ≡, _〉, indicada pela seta vermelha na Figura 55, ocorre 35 vezes dentro de um
conjunto de 43 alinhamentos. Nesta situação o antipadrão OCA04 - Contradição de
disjunção-subsunção, quando aplicado sobre os alinhamentos, identificou essa
correspondência como inconsistente.
Figura 55 - Correspondência 〈cmt_es:c-7650337-8286527, conference_pt:c-6123980-7251265, ≡, _〉
alterada.
109
valor médio
Caso 04 - Correspondência 〈biblio_101:book, biblio_101:collection, ≡, _〉
A correspondência 〈biblio_101:book, biblio_101:collection, ≡, _〉, indicada pela
seta vermelha na Figura 57, ocorre 5 vezes dentro de um conjunto de 17 alinhamentos.
Nesta situação o antipadrão OCA05a - Incompletude de domínio e intervalo, quando
aplicado sobre os alinhamentos, identificou essa correspondência como inconsistente.
Figura 57 - Correspondência 〈biblio_101:book, biblio_101:collection, ≡, _〉
alterada.
110
valor médio
Caso 05 - Correspondência 〈biblio_101:shortName, biblio_221:name, ≡, _〉
A correspondência 〈biblio_101:shortName, biblio_221:name, ≡, _〉, indicada
pela seta vermelha na Figura 59, ocorre 7 vezes dentro de um conjunto de 17
alinhamentos. Nesta situação o antipadrão OCA05b - Incompletude de domínio e
intervalo, quando aplicado sobre os alinhamentos, identificou essa correspondência
como inconsistente.
Figura 59 - Correspondência 〈biblio_101:shortName, biblio_221:name, ≡, _〉
111
alterada.
valor médio
Caso 06 - Correspondência 〈biblio_101:book, biblio_101:collection, ≡, _〉
A correspondência 〈biblio_101:book, biblio_101:collection, ≡, _〉, indicada pela
seta vermelha na Figura 61, ocorre 5 vezes dentro de um conjunto de 17 alinhamentos.
Nesta situação o antipadrão OCA05b - Incompletude de domínio e intervalo, quando
aplicado sobre os alinhamentos, identificou essa correspondência como inconsistente.
Figura 61 - Correspondência 〈biblio_101:book, biblio_101:collection, ≡, _〉
112
alterada.
valor médio
Caso 07 - Correspondência 〈confOf_cz:c-1688149-7240940, confOf_nl:c1180439-2483437, ≡, _〉
A
correspondência
〈confOf_cz:c-1688149-7240940,
confOf_nl:c-1180439-
2483437, ≡, _〉, indicada pela seta vermelha na Figura 63, ocorre 38 vezes dentro de um
conjunto de 43 alinhamentos. Nesta situação o antipadrão OCA06 - Incompletude de
domínio e intervalo, quando aplicado sobre os alinhamentos, identificou essa
Figura 63 - Correspondência 〈confOf_cz:c-1688149-7240940, confOf_nl:c-1180439-2483437, ≡, _〉
113
(10,5%) e Medida-F (0,78%), e houve uma queda na métrica de Cobertura (-0,39%)
considerando o conjunto de alinhamentos analisados neste caso, conforme apresentado
na Figura 64.
valor médio
Caso 08 - Correspondência 〈iasted_nl:c-0447708-8078411, sigkdd_fr:c3448744-2358764, ≡, _〉
A
correspondência
〈iasted_nl:c-0447708-8078411,
sigkdd_fr:c-3448744-
conjunto de 43 alinhamentos. Nesta situação o antipadrão OCA06 - Incompletude de
domínio e intervalo, quando aplicado sobre os alinhamentos, identificou essa
114
Figura 65 - Correspondência 〈iasted_nl:c-0447708-8078411, sigkdd_fr:c-3448744-2358764, ≡, _〉
como inconsistente, houve uma melhora nas médias das métricas de Precisão (18,27%)
e Medida-F (3,18%) considerando o conjunto de alinhamentos analisados neste caso,
conforme apresentado na Figura 66. A média da métrica de Cobertura não foi alterada.
valor médio
Caso 09 - Correspondência 〈confOf_nl:c-1180439-2483437, confOf_en:c5701075-1274855, ≡, _〉
A
correspondência
〈confOf_nl:c-1180439-2483437,
confOf_en:c-5701075-
115
Figura 67 - Correspondência 〈confOf_nl:c-1180439-2483437, confOf_en:c-5701075-1274855, ≡, _〉
(2,95%) e Medida-F (0,41%), considerando o conjunto de alinhamentos analisados
neste caso, e houve uma queda na métrica de Cobertura (-0,41%), conforme apresentado
na Figura 68.
valor médio
Caso 10 - Correspondência 〈sigkdd_es:c-2763261-4560459, confOf_pt:c1056766-4464703, ≡, _〉
A
correspondência
〈sigkdd_es:c-2763261-4560459,
confOf_pt:c-1056766-
116
Figura 69 - Correspondência 〈sigkdd_es:c-2763261-4560459, confOf_pt:c-1056766-4464703, ≡, _〉
(11,42%) e Medida-F (5,12%), considerando o conjunto de alinhamentos analisados
neste caso, conforme apresentado na Figura 70. A média da métrica de Cobertura não
foi alterada.
valor médio
A Figura 70 apresenta um comparativo na alteração das médias de Precisão,
Cobertura e Medida-F após a refatoração das ontologias nas quais foram identificadas as
correspondências inconsistentes.
117
No Casos 02, 07, 08 e 10, houve uma melhora de mais de 10% na métrica de
Precisão. Não houve casos em melhora de Cobertura, pelo contrário, em dois casos, 07
e 09, essa métrica reduziu. Já a Medida-F, que representa a harmonização entre a
Precisão e Cobertura, somente em três casos, 02, 08 e 10, sua melhora significou mais
de 1%, entretanto em 100% dos casos houve melhora em sua média. Vale ressaltar que
a análise de todos os casos é em função da remoção de apenas uma correspondência.
% melhora
Figura 71 - Gráfico com o percentual de melhoria das médias das métricas de Precisão, Cobertura e
Medida-F para cada caso analisado.
A Figura 71 demonstra que em 100% dos casos quais as correspondências
inconsistentes foram removidas individualmente, houve algum ganho na métrica de
Precisão e Medida-F. Nesse cenário, espera-se que em uma utilização prática da
abordagem proposta, haja um ganho mais significativo dessas métricas, já que,
possívelmente, mais correspondências inconsistentes serão identificadas e removidas
em conjunto.
118
7. Trabalhos Relacionados
Neste capítulo serão apresentados os principais trabalhos relacionados à
pesquisa. A fim de obter uma referência atualizada dos estudos sobre padrões e
antipadrões para alinhamento de ontologias, foi realizado um estudo baseado em
revisão sistemática, procurando reduzir o viés de uma revisão informal. Aqui será
apresentado somente um resumo do processo executado e um estudo comparativo dos
trabalhos relacionados com a proposta desta pesquisa, o protocolo completo pode ser
verificado no Apêndice III. Por fim será apresentado um comparativo dos trabalhos
selecionados como resultado da revisão sistemática com a abordagem proposta neste
trabalho.
7.1.
Revisão da Bibliografia
A pesquisa foi realizada com base em trabalhos publicados em conferências e
periódicos relatando iniciativas de utilização e aplicação de padrões e antipadrões para
alinhamento de ontologias.
A partir da identificação dos elementos que compõem as diferentes abordagens e
iniciativas de utilização de antipadrões foi realizada uma análise mais detalhada a fim
de identificar formatos, linguagens e ferramentas utilizadas dentro do contexto de
antipadrões de alinhamento de ontologias, com o objetivo de caracterizá-las e, se
possível influenciar a extensão de sua classificação, a extensão de uma linguagem
119
computacional para sua representação e a proposta de uma ferramenta para utilização
dos padrões e antipadrões de alinhamento de ontologias em seu referido processo.
A revisão dos trabalhos tem como objetivo responder questões relevantes à
pesquisa conduzida. A seguir são apresentadas as questões quais delinearam a revisão
realizada:
Q1: Quais são as principais técnicas e/ou abordagens para utilização de padrões
e/ou antipadrões para alinhamento de ontologias?
Q2: Quais têm sido as linguagens e/ou formatos para representação de padrões
e/ou antipadrões para alinhamento de ontologias utilizadas e/ou propostas?
Q3: Existem softwares para provimento de padrões e/ou antipadrões para
alinhamento de ontologias como recurso no processo de alinhamento das mesmas?
Q4: Existem softwares de alinhamento de ontologias que utilizem padrões e/ou
antipadrões para alinhamento de ontologias?
Após a execução de todo protocolo elaborado para a o processo de revisão da
bibliografia (vide Apêndice III), chegou-se a um número total de 11 trabalhos
selecionados. A Tabela 11 apresenta os dados compilados com o título da publicação,
autores e ano em que foi publicado o trabalho. A disposição dos dados está em ordem
alfabética do título do trabalho.
Tabela 11 – Trabalhos selecionados após a execução do protocolo de revisão.
Id.
Título
Ano
Autores
1
A Pattern-based Ontology Matching Approach for
Detecting Complex Correspondences [51]
2009
Dominique Ritze, Christian Meilicke, Ondrej
Sváb-Zamazal, Heiner Stuckenschmidt
2
APIs à gogo: Automatic generation of ontology APIs
[52]
2009
Parreiras, F.S.; Saathoff, C.; Walter, T.; Franz, T.;
Staab, S.
3
Alignment Patterns Based on Unified Foundational
Ontology [53]
2012
Natalia Fonseca Padilha, Fernanda Araujo
Baião, Kate Revoredo
4
AUTOMS-F: A framework for the synthesis of
ontology mapping methods [54]
2009
Valarakos A.G., Spiliopoulos V., Vouros G.A.
5
Correspondence Patterns for Ontology Alignment [55]
2008
François Scharffe, Dieter Fensel
6
Exploiting patterns in ontology mapping [56]
2007
Svab O.
120
7
Ontology alignment design patterns [57]
2014
Scharffe F., Zamazal O., Fensel D.
8
Ontology Fusion with Complex Mapping Patterns [58]
2006
Jinguang Gu, Yi Zhou
9
Ontology matching with semantic verification [59]
2009
Jean-Mary, Y., Shironoshita, E., Kabuka, M.
10
Towards correspondence patterns for ontology
mediation [60]
2007
Scharffe F., Ding Y., Fensel D.
11
Towards design patterns for ontology alignment [61]
2008
Scharffe F., Euzenat J., Fensel D.
A Tabela 12 apresenta a correlação dos trabalhos selecionados com as questões
de pesquisa delineadas para direcionamento dessa revisão.
Tabela 12 - Correlação dos trabalhos selecionados com as questões de pesquisa.
Tipo de Trabalho
Grupo Selecionado
Total
Q1-Técnica / Aborgadem
1, 2, 3, 5, 6, 7, 8, 9, 10, 11
11
Q2-Linguagem / Formato
2, 5, 7, 10, 11
5
Q3-Ferramenta como Recurso
-
0
Q4-Ferramenta Proprietária
4, 8, 9
3
Para cada um dos 11 trabalhos selecionados foi realizado um comparativo da
proposta do referido trabalho com a proposta dessa pesquisa, onde foram identificados
pontos interseção e onde a pesquisa deste trabalho contribui na evolução do objeto de
pesquisa.
O trabalho apresentado em [51] propõe vários padrões de correspondências
complexas e métodos para identificação automática dessas correspondências complexas
entre duas ontologias e sua transformação em padrões de correspondência.
Correspondências complexas podem ser utilizadas na composição de antipadrões de
correspondência, mas devem ser construídas manualmente. Enquanto o referido
trabalho propõe a identificação automática de correspondências e sua transformação em
padrões de correspondências, este trabalho propõe a identificação de antipadrões de
correspondência, tomando como base correspondências incorretas, ou problemas de
alinhamento.
121
O trabalho apresentado em [52] propõe uma linguagem de domínio específico
para a manipulação de correspondências complexas, de forma a construir padrões de
projeto de ontologias (ontology design patterns). No referido trabalho é proposta uma
linguagem específica para a construção de padrões de ontologias, ao passo que este
trabalho utiliza uma linguagem agnóstica para a construção de antipadrões de
correspondência.
No trabalho apresentado em [53] a utilização da OntoUML, linguagem
conceitual baseada na ontologia de fundamentação
UFO – Unified Foundational
Ontology, é base para a construção de padrões e antipadrões de alinhamento de
ontologias. Os padrões e antipadrões de alinhamento de ontologias apresentados no
referido trabalho tomam como base uma determinada ontologia de fundamentação,
neste caso a UFO. Além disso, os artefatos gerados são apenas conceituais, ou de
modelagem, e não é apresentada uma representação computacional dos mesmos. Na
proposta desta dissertação, além dos antipadrões ser independentes de domínio ou
fundamentação, é apresentada sua representação computacional em uma linguagem que
possibilita sua utilização para tal finalidade.
Em [54] é apresentado um framework cujo objetivo é facilitar o
desenvolvimento de métodos para realização de alinhamento automático de ontologias
com a possibilidade de utilização de padrões de projeto de desenvolvimento. Apesar de
ser um framework de alinhamento de ontologias, seu objetivo é facilitar o
desenvolvimento de técnicas de alinhamento através de técnicas de prototipação e com a
possibilidade do uso de padrões de projeto no desenvolvimento de tais métodos, mas
não utiliza padrões de correspondência de ontologias. O framework proposto nessa
dissertação tem como finalidade estender qualquer tipo de técnica de alinhamento,
122
fornecendo como recurso no processo de alinhamento a utilização de antipadrões de
correspondência para identificação de correspondências inconsistentes.
Em [55] é apresentada a proposta de utilização de padrões de correspondência
como modelos pré-definidos para a construção de um alinhamento entre duas
ontologias. Assim como os padrões de correspondência trabalham com modelos para a
identificação de correspondências no processo de alinhamento de duas ontologias,
antipadrões de correspondência agem como modelos para a identificação de
correspondências inconsistentes estabelecidas no processo de alinhamento de duas
ontologias.
O foco do trabalho apresentado em [56] é a exploração de padrões como
estruturas para melhorar a performance de métodos de alinhamento de ontologias,
fornecendo algum conhecimento preliminar para tal tarefa. A proposta desta dissertação
também fornece um conhecimento preliminar a ser utilizado no processo de
alinhamento de ontologias, entretanto não possui como objetivo melhorar a performance
da tarefa de alinhamento de ontologias, mas sim, melhorar a qualidade do alinhamento
final, gerado como resultado deste processo.
Em [57] é apresentado formalmente o conceito de padrões de correspondência e
um catálogo de padrões de correspondência, baseado na análise de incompatibilidades
ontológicas existentes na litetura. A linguagem utilizada para a representação de padrões
também é apresentada neste trabalho. Ao invés de padrões de correspondência, esta
dissertação apresenta um catálogo de antipadrões de correspondência, quais foram
criados a partir de casos reais de correspondências incorretas. A representação
computacional dos antipadrões de correspondência utiliza a mesma linguagem
apresentada neste trabalho.
123
O objetivo em [58] é apresentar a utilização de padrões para correspondências
complexas entre duas omtologias através de um algoritmo de identificação de
correspondências complexas e fusão das ontologias. Antipadrões de correspondências
também lidam com correspondências complexas, mas com o intuito de identificar
correspondências inconsistentes. Entretanto neste trabalho, não são utilizados
algoritmos para sua identificação, ao invés disso, utilizam modelos pré-definidos quais
estão aptos a identificar uma situação inconsistente.
Em [59] é apresentado um sistema que realiza o alinhamento entre duas
ontologias e o valide através de um algoritmo que identifica inconsistências semânticas,
analisando as propriedades das ontologias versus o alinhamento gerado. Nessa
dissertação é apresentada uma metodologia para a criação de antipadrões de
correspondência onde a mesma é aplicada utilizando os mesmo conceitos de veificação
semântica. No entanto, não são necessários algoritmos para a verificação dos mesmos,
através de modelos pré-definidos, inconsistências semânticas quais possam ocorrer em
um alinhamento podem ser identificadas através destes modelos. O modelo é extensível
e pode ser utilizado por qualquer ferramenta, uma vez que o framework aqui proposto
pode ser utilizado como recurso no processo de alinhamento realizado por qualquer
ferramenta.
Em [60] padrões de correspondência são apresentados como uma ferramenta
para projetar alinhamentos de ontologias mais precisos. Um modelo de padrão de
correspondência é apresentado de forma que é utilizado para a construção de uma
biblioteca de padrões de correspondência. Antipadrões de correspondência são
utilizados com o propósito de projetar alinhamentos de ontologias mais precisos,
entretando têm como objetivo identificar correspondências inconsistentes que possam
ocorrer em um alinhamento já definido. Essa dissertação também apresenta um modelo
124
e uma metodologia para a construção dos mesmos, quais possibilitam a criação de uma
biblioteca, ou catálogo, de antipadrões de correspondência.
Novamente, em [61], padrões de correspondência são apresentados como uma
ferramenta que auxilia a construção de um alinhamento entre duas ontologias de forma
mais precisa. Antipadrões de correspondência também auxililam na construção de
alinhamentos entre duas ontologias de forma mais precisa, fornecendo modelos para a
identificação de correspondências inconsistentes entre duas ontologias.
O principal diferencial deste trabalho em relação aos demais é o fornecimento de
antipadrões de correspondência como recurso no processo de alinhameto de ontologias,
de uma forma independente da técnica utilizada para o alinhamento que está sendo
realizado. Além disso, este trabalho apresenta uma linguagem para representação de
padrões de alinhamento de ontologias, qual foi utilizada para a representação de
antipadrões de correspondência de ontologias. E por fim, este trabalho difere-se dos
demais por apresentar um framework que é extensível, uma vez que usuários podem
adicionar antipadrões de correspondência.
125
8. Conclusão
Este capítulo apresenta as considerações finais do trabalho, destacando suas
principais contribuições, limitações identificadas na condução da pesquisa bem como
oportunidades de trabalhos futuros.
8.1. Considerações Finais
O alinhamento de ontologias é um campo de pesquisa bastante ativo na
comunidade científica, onde várias ténicas, abordagens e ferramentas têm sido propostas
para a execução de tal tarefa. No entanto, mesmo com o esforço contínuo da
comunidade científica para melhoria do processo de alinhamento de ontologias, tais
métodos ainda estão suscetíveis a indentificar correspondências incorretas entre as
ontologias que estão sendo alinhadas.
O objetivo geral da pesquisa consistiu em melhorar a qualidade de um
alinhamento entre duas ontologias através da utilização de antipadrões de
correspondência no processo de alinhamento. Antipadrões de correspondência auxiliam
na identificação de correspondências incorretas entre duas ontologias que estão sendo
alinhadas.
Esse objetivo foi atingido a partir da definição formal de um antipadrão de
correspondência. Além disso, este trabalho apresentou uma metodologia para a
construção de um antipadrão de correspondência, através de um processo sistemático de
126
análise do problema que está sendo tratado, assim como a elaboração de sua
documentação geral, de forma que o mesmo possa ser utilizado como um modelo
genérico, e ainda a representação computacional de um antipadrão de correspondência.
Foram apresentados também a aquitetura de um framework de suporte ao processo
alinhamento de ontologias, de forma a fornecer os antiparões de correspondência como
recursos no referido processo, assim como seu desenvolvimento.
Para a verificação da hipótese delineada neste trabalho e aplicabilidade da
proposta da pesquisa, dois estudos de caso foram realizados. No primeiro estudo de
caso, a metodologia para a construção de antipadrões de correspondência foi aplicada
sobre uma base real de alinhamentos. Além de comprovar a aplicabilidade da
metodologia proposta, teve como resultado um catálogo inicial de antipadrões de
correspondência, construído a partir de problemas de alinhamentos reais. No segundo
estudo de caso, os antipadrões de correspondência construídos e catalogados foram
aplicados sobre outra base real de alinhamentos, com auxílio do sistema construído para
suporte na identificação dos antipadrões de correspondência, o qual demonstrou a
melhoria na qualidade final do alinhamento, considerando as métricas de Precisão e
Medida-F.
Em ambos os estudos de casos foram consideradas ontologias e alinhamentos
disponilizados por uma importante e reconhecida inciativa de pesquisa na área, a OAEI.
Uma importante característica do estudo é que os domínios selecionados não possuem
sobreposição entre os estudos de caso, o que permitiu uma avaliação mais precisa da
proposta.
127
8.2. Principais Contribuições
A principal contribuição da pesquisa consiste na definição e formalização de
antipadrões de correspondência de ontologias, e a apresentação de uma metodologia
para a construção de antipadrões de correspondência. A aplicabilidade da metodologia
foi avaliada em um estudo de caso ao buscar por correspondências incorretas em uma
base de alinhamentos real, e seguindo a sistemática do processo, um catálogo de
antipadrões foi gerado, também como contribuição importante desta pesquisa.
As contribuições de cunho tecnológico desta pesquisa consistem na arquitetura
de um framework de suporte ao processo de alinhamento de ontologias que forneça e
identifique antipadrões de correspondência como recursos no processo de alinhamento
de ontologias, e a implementação de um protótipo desse sistema.
Durante o desenvolvimento da pesquisa dois trabalhos foram publicados em
workshops inseridos em importantes eventos relacionados ao tema de ontologias, sendo
o primeiro com o foco de introduzir o conceito de antipadrões de corresponência [62] e
o segundo demonstrando a aplicabilidade da metodologia de criação de antipadrões de
correspondência e apresentando uma prévia do catáologo de antipadrões de
correspondência [63], apresentado em sua totalidade nesta dissertação.
8.3. Limitações da Proposta
Uma limitação no processo de aplicabilidade dos antiparões de correspondência
foi no úlitmo passo da metodologia de construção de antipadrões de correspondência. A
natureza de um antipadrão deve apresentar uma solução refatorada para o problema
identificado. No entanto, refatorar um alinhamento entre duas ontologias, confome
apresentado na Seção 3.2, significa realizar o reparo do alinhamento de forma a eliminar
128
inconsistências lógicas, e essa não é uma tarefa trivial, uma vez que podem existir várias
soluções para um cenário específico.
Outra limitação refere-se à semântica da relação das correspondências que
representam uma correspondência inconsistente. Nesse trabalho considerou-se somente
relações de igualdade. A simetria da relação também é um ponto que deve ser
considerado. Nesse cenário de alinhamento de duas ontologias qual foi realizado o
estudo, a correspondência é simétrica, em outros casos de correspondências, como em
linked open data, a correspondência parte apenas de um dos lados que está identificando
a igualdade. Esse cenário não foi contemplado para a análise dos antipadrões de
correspondência.
Por fim, uma última limitação é sobre a força da correspondência estabelecida
não entre duas entidades, que não é considerada na construção dos antipadrões de
correspondência. O tratamento e a análise da semântica da força das correspondências
podem ser explorados a fim de refinar a aplicação dos antipadrões de correspondência.
8.4. Trabalhos Futuros
Embora a aplicabilidade dos antipadrões de correspondência tenha sido avaliada
em cenários reais de alinhamentos de ontologias, para fins de estudo, as
correspondências incorretas foram simplesmente eliminadas. O último passo da
metodologia de construção de antipadrões de correspondência, que é a refatoração do
alinhamento, oferece uma oportunidade de trabalho de forma a explorar métodos
automaticos e/ou semi-automaticos, e deve ainda considerar a interação com usuário, de
forma que o mesmo seja envolvido na melhor solução a ser aplicada para o problema
identificado.
129
A construção dos antipadrões de correspondência tomando como base a análise
de erros identificados foi aqui realiza de forma manual. Uma oportunidade de trabalho
futuro é a automatização ou semi-automatização deste processo de identificação de
antipadrões de correspondência.
A proposta do framework apresentada neste trabalho foi concretizada em um
protótipo, que pode ser estendido e mais explorado, oferencendo APIs padronizadas e
compartilhando o catálogo de antiapdrões de correspondência em infraestruturas em
cloud computing, ou diretamente por URIs na web.
130
9. Referências
[1] ZIEGLER, P.; DITTRICH, K. R. Three Decades of Data Integration—all Problems
Solved? Building the Information Society. [S.l.]: Springer, 2004
[2] CALVANESE, D.; DE GIACOMO, G. Data integration: A logic-based perspective.
AI magazine, v. 26, n. 1, p. 59, 2005.
[3] HURSON, A.; R. BRIGHT, M. W. Multidatabase Systems: An Advanced Concept
in Handling Distributed Data. Advances in Computers, 32:149–200, 1991.
[4] CAREY, M.J. Towards Heterogeneous Multimedia Information Systems: The
Garlic Approach. In 5th International Workshop on Research Issues in Data
Engineering-Distributed Object Management (RIDE-DOM 1995), p. 124–131, 1995.
[5] BAYARDO, R. J. InfoSleuth: Agent-Based Semantic Integration of Information in
Open and Dynamic Environments. In 1997 ACM SIGMOD International Conference on
Management of Data (SIGMOD 1997), p. 195–206, 1997.
[6] ARENAS, M. The Hyperion Project: From Data Integration to Data Coordination.
SIGMOD Record, 32, p. 53–58, 2003.
[7] ABITEBOUL, S.; BENJELLOUN, O.; MILO, T. Web Services and Data
Integration. Third International Conference on Web Information Systems Engineering
(WISE 2002), p. 3–7, IEEE Computer Society, 2002.
[8] DOAN, A.; HALEVY, A. Y. Semantic integration research in the database
community: A brief survey. AI magazine, v. 26, n. 1, p. 83, 2005.
[9] BUKHRES, A.; ELMAGARMID, K. Object-Oriented Multidatabase Systems: A
Solution for Advanced Applications. Prentice-Hall, 1996.
131
[10] OUKSEL, M.; SHETH, P. Semantic Interoperability in Global Information
Systems: A Brief Introduction to the Research Area and the Special Section. SIGMOD
Record, 28, p. 5–12, 1999.
[11] GRUBER, T.R. (1993) A translation approach to portable ontologies. Knowledge
Acquisition, Vol. 5, N. 2, p.199–220, 1993.
[12] BREITMAN, K. K.; CASANOVA, M.A.; TRUSZKOWSKI, W. Semantic Web:
concepts, technologies and applications. New York; London: Springer, 2007.
[13] EUZENAT, J.; SHVAIKO, P. Ontology Matching Second Edition. Springer-Verlag
Berlin Heidelberg, 2013.
[14] MITCHELL, T. M. Machine Learning. Burr Ridge, IL:McGraw-Hill. v. 45, 1997.
[15] BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The semantic web, Scientific
American, 2001.
[16] CRUZ, I. F.; XIAO, H.; The role of ontologies in data integration, Engineering
intelligent systems for electrical engineering and communications, 2005.
[17] SHVAIKO, P.; EUZENAT, J. Ontology matching: state of the art and future
challenges. IEEE Transactions on Knowledge and Data Engineering, 2013.
[18] EUZENAT, J.; MEILICKE, C.; STUCKENSCHMIDT, H.; SHVAIKO, P.;
TROJAHN, C. Ontology Alignment Evaluation Initiative: six years of experience,
Journal on data semantics XV, 2011.
[19] EHRIG, M. Ontology Alignment: Bridging the Semantic Gap, Springer. 2007.
[20] SCHARFFE, F. Correspondence Patterns Representation. Ph.D Thesis, University
of Innsbruck, 2009.
[21] SCHARFFE, F.; ZAMAZAL, O.; FENSEL, D. Ontology alignment design
patterns. Knowledge Information Systems, Springer-Verlag London, 2013.
[22] BROWN, W J.; MALVEAU, R. C.; MCCORMICK III, H. W.; MOWBRAY, T.
J. Antipatterns – Refactoring Software, Architectures and Projetcs in Crisis, John Wiley
& Sons, Inc., 1998.
[23] GUIZZARDI, G. Ontological Foundations for Structural Conceptual Models,
Ph.D. Thesis, University of Twente, The Netherlands, 2005.
[24] SOWA, J. F. Principles of Ontology, 2004. Disponível em: http://wwwksl.stanford.edu/ontostd/mailarchive/0136.html.
132
[25] GRUNINGER, M.; LEE, J. Introduction to the ontology application and design.
Communications of the ACM, Vol. 45, No. 2, pp. 39- 41, 2002.
[26] GUARINO, N.; CARRARA, M.; GIARETTA, P. An ontology of meta-level
categories. Proceedings of the Principles of Knowledge Representation and Reasoning KR'94. San Francisco, CA, USA, pp. 270–280, 1994.
[27] DACONTA, M. C.; OBRST, L. J.; SMITH, K. T. The Semantic Web: A Guide to
the Future of XML, Web Services, and Knowledge Management. Wiley Publishing, Inc,
2003.
[28] GLIMM, B.; HORROCKS, I.; LUTZ, C.; SATTLER, U. Conjunctive query
answering for the description logic SHIQ. Journal of Artificial Intelligence Research,
Volume 31 Issue 1, pp. 157-204, 2008.
[29] JEAN-MARY, Y., SHIRONOSHITA, E., KABUKA, M.: Ontology matching with
semantic verification. Journal Web Semantics: Science, Services and Agents on the
World Wide Web archive. Volume 7 Issue 3, pp. 235-251, 2009.
[30] HORROCKS, I.; KUTZ, O.; SATTLER, U. The Even More Irresistible SROIQ. In
Proc. of the 10th Int. Conf. on Principles of Knowledge Representation and Reasoning
(KR 2006), pp. 57-67. AAAI Press, 2006.
[31] KRÖTZSCH, M.; SIMANČÍK, F. HORROCKS, I. A Description Logic Primer.
CoRR, abs/1201.4089. 2012.
[32] DUGGAN, D. Enterprises software architecture and design: entities, services, and
resources applications. John Wiley & Sons, 2012.
[33] FUXMAN, A.; MILLER, J.: Schema Mapping, Encyclopedia of Database
Systems. Springer Science, 2009.
[34] SANTOS, G.; ROCHA, A.; TRAVASSOS, G.: Ambientes de Engenharia de
Software Orientados a Corporação. VIII Simpósio Brasileiro de Qualidade de Software,
2009.
[35] FERREIRA, A. Dicionário da Língua Portuguesa. Rio de Janeiro: Positivo. 2010
133
[36] KLEIN, M. Combining a relating ontologies: an analysis of problems and
solutions, Workshop on Ontologies and Information Sharing, International Joint
Conference on Artificial Intelligence, 2001.
[37] PREDOIU L., MARTIN-RECUERDA, F., POLLERES, A., FEIER, C. MOCAN,
A. DE BRUIJN, J. PORTO, F. FOXVOG, D. E ZIMMERMANN, K.: Framework for
representing ontology networks with mappings that deal with conflicting and
complementary concept definitions. Technical report, DIP EU project, FP6 – 507483,
2004.
[38] WACHE, H.: Semantisches mediation für heterogene informationsquellen,2003.
[39] EUZENAT, J.: An API for ontology alignment. The Semantic Web–ISWC 2004, p.
698–712, 2004.
[40] BUSCHMANN, F.; MEUNIER, R.; ROHNERT, H.; SORNMERLAD, P.; STAL,
M.: Pattern-Oriented Software Architecture. A System of Patterns,. John'Wiley & Sons
Ltd., England 1996.
[41] BOUQUET, P.; GIUNCHIGLIA, F.; VAN HARMELEN, F.; SERAFINI, L.;
STUCKENSCHMIDT. H.: C-OWL: Contextualizing Ontologies. The Semantic Web ISWC 2003, Second International Semantic Web Conference, volume 2870 of LNCS.
Springer, 2003.
[42] BORGIDA, A.; SERAFINI, L.: Distributed Description Logics: Assimilating
Information from Peer Sources. Journal on Data Semantics, 1:153–184, 2003.
[43] PAZIENZA, M.; STELLATO, A.; VINDIGNI, M.; ZANZOTTO, F.: XeOML: An
XML-based extensible Ontology Mapping Language. In Proceedings of the Meaning
Coordination and Negotiation workshop (MCN-04), 2004.
[44] SCHARFFE, F., ZAMAZAL, O. FENSEL, D.: Ontology alignment design
patterns. Knowledge and Information Systems, pp. 1–28, 2012.
[45] ABOLHASSANI, H.; HARIRI, B.; HAERI, H.: On Ontology Alignment
Experiments. 2006. Disponível em: http://www.webology.org/2006/v3n3/a28.html.
Acesso em: 09/01/2013.
134
[46] ALEXANDER, C.; ISHIKAWA, S.; SILVERSTEIN, M.: A Pattern Language.
Oxford University Press, New York, 1977.
[47] AKROYD, M.: AntiPatterns: Vaccinations against Object Misuse, Object World
West, San Francisco, 1996.
[48] SVÁB-ZAMAZAL O.: Pattern-based Ontology Matching and Ontology Alignment
Evaluation, PhD Dissertation thesis, VSE-FIS, Prague, 2010.
[49] MEILICKE, C.: Alignment Incoherence in Ontology Matching. PhD thesis
Universitat Mannheim, Mannheim, 2011.
[50] SALES, T., BARCELOS, F., GUIZZARDI, G.: Identification of Semantic AntiPatterns in Ontology-Driven Conceptual Modeling via Visual Simulation. 4th
International Workshop on Ontology-Driven Information Systems. 2012.
[51] Ritze, D.; Meilicke, C.; Sváb-zamazal, O.; Stuckenschmidt, H.: A Pattern-based
Ontology Matching Approach for Detecting Complex Correspondences. International
Semantic Web Conference - ISWC. 2009.
[52] PARREIRAS, F.; SAATHOFF, C.; WALTER, T.; FRANZ, T.; STAAB, S.: APIs à
gogo: Automatic Generation of Ontology APIs. ICSC '09 Proceedings of the 2009 IEEE
International Conference on Semantic Computing. pp 342-348. 2009.
[53] PADILHA, N.; BAIÃO, F.; REVOREDO. R.: Alignment Patterns Based on
Unified Foundational Ontology. V Seminar on Ontology Research in Brazil and VII
International Workshop on Metamodels, Ontologies and Semantic Technologies.
Volume 938 of CEUR Workshop Proceedings, pp 48-59, CEUR-WS.org, 2012.
[54] VALARAKOS, A.; SPILIOPOULOS, V.; VOUROS, G.: AUTOMS-F: A
Framework for the Synthesis of Ontology Mapping Methods. Studies in Computational
Intelligence Volume 221, 2009, pp 45-59, 2009.
[55] SCHARFFE, F.; FENSEL, D.: Correspondence Patterns for Ontology Alignment.
Lecture Notes in Computer Science Volume 5268, pp 83-92, 2008.
[56] ŠVÁB, O.: Exploiting Patterns in Ontology Mapping. Lecture Notes in Computer
Science Volume 4825, 2007, pp 956-960, 2007.
135
[57] SCHARFFE, F.; ZAMAZAL, O.; FENSEL, D.: Ontology alignment design
patterns. Journal Knowledge and Information Systems archive. Volume 40 Issue 1, pp
1-28 , 2014.
[58] GU, J.; ZHOU, Y.: Ontology fusion with complex mapping patterns. Proceeding
KES'06 Proceedings of the 10th international conference on Knowledge-Based
Intelligent Information and Engineering Systems - Volume Part I, pp. 738-745, 2006.
[59] JEAN-MARY, Y.; SHIRONOSHITA, P.; KABUKA, M.: Ontology matching with
semantic verification. Journal Web Semantics: Science, Services and Agents on the
World Wide Web. Volume 7 Issue 3, pp. 235-251, 2009.
[60] SCHARFFE, F.; DING, Y.; FENSEL, D.: Towards Correspondence Patterns for
Ontology Mediation. Proceedings of the 2nd International Workshop on Ontology
Matching (OM-2007) Collocated with the 6th International Semantic Web Conference
(ISWC-2007) and the 2nd Asian Semantic Web Conference (ASWC-2007), Volume
304 of CEUR Workshop Proceedings, CEUR-WS.org, 2007.
[61] SCHARFFE, F.; EUZENAT, J.; FENSEL, D.: Towards design patterns for
ontology alignment. Proceeding SAC '08 Proceedings of the 2008 ACM symposium on
Applied computing. pp.2321-2325, 2008.
[62] GUEDES, A., BAIÃO, F., REVOREDO, K.: On the Identification and
Representation of Ontology Correspondence Antipatterns. 8th International Workshop
on Modular Ontologies in 8th International Conference on Formal Ontology in
Information System. To be appear. 2014.
[63] GUEDES, A., BAIÃO, F., REVOREDO, K.: Digging Ontology Correspondence
Antipatterns. 5th Workshop on Ontology and Semantic Web Patterns in 13th
International Semantic Web Conference. To be appear. 2014.
[64] FELLBAUM, C.: WordNet: An Electronic Lexical Database. MIT Press,
Cambridge, MA, p. 47–73, 1998.
136
10. Apêndice I - Catálogo de Antipadrões de
Correspondência.
A seguir são apresentados todos os modelos de antipadrão de correspondência
gerados a partir dos erros recorrentes de alinhamento apresentados na Seção 4.1. Os
antipadrões de correspondência podem ser agrupados de acordo com os tipos de
verificações semâticas quais os mesmos identificam um problema.
Antipadrões de Correspondência do tipo Contradição de disjunçãosubsunção:
Tabela 13 – Antipadrão de correspondência OCA01
Item
Nome
Causa raiz
Variações
Evidências
Breve Descrição
OCA01
Contradição de disjunção-subsunção
De acordo com a classificação das incompatibilidades ontológicas
apresentadas anteriormente, pode ocorrer aqui uma
incompatibilidade terminológica de termos homônimos, onde o
sistema de alinhamentos identifica que estes termos são similares,
no entanto seus significados são diferentes. A semântica da relação
dos termos deve ser observada para composição do alinhamento. A
incompatibilidade ontológica “descrição do conceito” deve ser
observada também.
(?o1:?e1 ≡ ?o2:?e1) ⊓ (?o1:?e1 ⊑ ?o1:?e2) ⊓ (?o1:?e2 ⊓ ?o1:?e3
⊑ ⊥) ⊓ (?o1:?e3 ≡ ?o2:?e2) ⊓ (?o2:?e1 ⊑ ?o2:?e2).
Sintoma: duas subclasses que possuam correspondência de
igualdade, mas suas superclasses não possuem correspondência de
igualdade e são disjuntas.
Não aplicável.
Não aplicável.
Não aplicável.
-
Representação computacional do antipadrão OCA01:
137
<rdf:RDF
xmlns ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#"
xmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:xsd ="http://www.w3.org/2001/XMLSchema#"
xmlns:align ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#"
xmlns:dc ="http://purl.org/dc/elements/1.1/"
xmlns:dcterms ="http://purl.org/dc/terms/" >
<rdf:Description>
<dc:description>Contradição de disjunção-subsunção</dc:description>
</rdf:Description>
<Alignment>
<onto1>
</Ontology>
</onto1>
<onto2>
</Ontology>
</onto2>
<map>
<cell>
</cell>
<cell>
</cell>
<cell>
</cell>
<cell>
</cell>
<cell>
</cell>
</map>
</Alignment>
</rdf:RDF>
Item
Nome
Causa raiz
Breve Descrição
OCA02
Incompatibilidades ontológicas do tipo escopo e cobertura do
modelo e granularidade. Incompatibilidade terminológica de termos
homônimos também pode ocorrer.
(?o1:?e1 ≡ ?o2:?e1) ⊓ (?o1:?e1 ⊑ ?o1:?e2) ⊓ (?o1:?e2 ⊑ ?o1:?e3)
⊓ (?o1:?e3 ≡ ?o2:?e2) ⊓ (?o2:?e1 ⊓ ?o2:?e2 ⊑ ⊥)
Sintomas: Classes disjuntas em uma ontologia correspondentes com
classes na mesma estrutura hierárquica em outra ontologia.
138
Variações
Evidências
Consequências: implicações lógicas em inferências e em um
processo de mediação de dados.
Não aplicável
OCA03, OCA04, OCA09
Não aplicável
Caso #1:
〈confof:conference, edas:conference, ≡, _〉
〈edas:conferencesession, ekaw:conference_session, ≡, _〉
<rdf:RDF
<rdf:Description>
</rdf:Description>
<Alignment>
<onto1>
</Ontology>
</onto1>
<onto2>
</Ontology>
</onto2>
<map>
<cell>
</cell>
<cell>
</cell>
<cell>
</cell>
<cell>
</cell>
<cell>
</cell>
</map>
</Alignment>
</rdf:RDF>
139
Item
Nome
Causa raiz
Variações
Breve Descrição
OCA03
(?o1:?e1 ≡ ?o2:?e1) ⊓ (?o1:?e1 ⊑ ?o1:?e2) ⊓ (?o1:?e2 ⊓ ?o1:?e3
⊑ ⊥) ⊓ (?o1:?e3 ≡ ?o2:?e2) ⊓ (?o2:?e2 ⊑ ?o2:?e1)
Não aplicável
OCA02, OCA04, OCA09
Não aplicável
Evidências
Caso #2:
〈conference:paper, ekaw:paper, ≡, _〉
〈edas:conference, ekaw:conference, ≡, _〉
<rdf:RDF
<rdf:Description>
</rdf:Description>
<Alignment>
<onto1>
</Ontology>
</onto1>
<onto2>
</Ontology>
</onto2>
<map>
<cell>
</cell>
<cell>
</cell>
<cell>
140
</cell>
<cell>
</cell>
<cell>
</cell>
</map>
</Alignment>
</rdf:RDF>
Item
Nome
Causa raiz
Variações
Breve Descrição
OCA04
(?o1:?e1 ≡ ?o2:?e1) ⊓ (?o1:?e1 ⊓ ?o1:?e2 ⊑ ⊥) ⊓ (?o1:?e2 ≡
?o2:?e2) ⊓ (?o2:?e1 ⊑ ?o2:?e2)
Não aplicável
OCA02, OCA03, OCA09
Não aplicável
Evidências
Caso #3:
〈conference:paper, ekaw:paper, ≡, _〉
<rdf:RDF
<rdf:Description>
</rdf:Description>
<Alignment>
<onto1>
</Ontology>
</onto1>
<onto2>
141
</Ontology>
</onto2>
<map>
<cell>
</cell>
<cell>
</cell>
<cell>
</cell>
<cell>
</cell>
</map>
</Alignment>
</rdf:RDF>
Item
Nome
Causa raiz
Variações
Evidências
Breve Descrição
OCA09
homônimos também pode ocorrer
(?o1:?e2 ≡ ?o2:?e1) ⊓ (?o1:?e2 ⊑ ?o1:?e1) ⊓ (?o1:?e1 ≡ ?o2:?e3)
⊓ (?o2:?e3 ⊓ ?o2:?e2 ⊑ ⊥) ⊓ (?o2:?e1 ⊑ ?o2:?e2)
Não aplicável
OCA02, OCA03, OCA04
Não aplicável
Caso #7:
〈cmt:paper,conference:paper, ≡, _〉
〈conference:callForPaper,edas:callForPapers, ≡, _〉
<rdf:RDF
<rdf:Description>
142
</rdf:Description>
<Alignment>
<onto1>
</Ontology>
</onto1>
<onto2>
</Ontology>
</onto2>
<map>
<cell>
</cell>
<cell>
</cell>
<cell>
</cell>
<cell>
</cell>
<cell>
</cell>
</map>
</Alignment>
</rdf:RDF>
Antipadrões de Correspondência do tipo Incompletude de domínio e
intervalo:
Tabela 18 – Antipadrão de correspondência OCA05(a)
Item
Nome
Causa raiz
Variações
Breve Descrição
OCA05(a)
Incompletude de domínio e intervalo
Incompatibilidades ontológicas do tipo escopo. Incompatibilidade
terminológica de termos homônimos também pode ocorrer.
(?o1:?p1≡?o2:?p1) ⊓ (?o1:?e1 ∈ domain(?o1:?p1)) ⊓ (?o2:?e1 ∈
domain(?o2:?p1)) ⊓ ∄(?o1:?e1≡?o2:?e1)
Sintomas: Propriedades ou relações correspondentes entre duas
ontologias, mas suas classes de domínio e intervalo não são
correspondentes.
Não aplicável
OCA05(b), OCA06, OCA10, OCA11, OCA12
Não aplicável
143
Evidências
Caso #4:
〈cmt:writtenBy, confof:writtenBy, ≡, _〉
〈confof:hasPhone, edas:hasPhone, ≡, _〉
〈iasted:obtain, sigkdd:obtain, ≡, _〉
Representação computacional do antipadrão OCA05(a):
<rdf:RDF
<rdf:Description>
<dc:description>Incompletude de domínio e intervalo </dc:description>
<dcterms:identifier>OCA05a</dcterms:identifier>
</rdf:Description>
<Alignment>
<onto1>
</Ontology>
</onto1>
<onto2>
</Ontology>
</onto2>
<map>
<cell>
<entity1><Relation rdf:about="?o1:?p1"/></entity1>
</cell>
<cell>
<entity1>
<Condition>
<Relation rdf:about="?o1:?p1">
<domainRestriction>
<Class rdf:about="?o1:?e1" />
</Relation>
</Condition>
</entity1>
<entity2>
<Condition>
<domainRestriction>
</Relation>
</Condition>
</entity2>
<not><relation rdf:resource="equivalence"/></not>
</cell>
</map>
</Alignment>
</rdf:RDF>
144
Tabela 19 – Antipadrão de correspondência OCA05(b)
Item
Nome
Causa raiz
Variações
Evidências
Breve Descrição
OCA05(b)
(?o1:?p1≡?o2:?p1) ⊓ (?o1:?e2 ∈ range(?o1:?p1)) ⊓ (?o2:?e2 ∈
range(?o2:?p1)) ⊓ ∄(?o1:?e2≡?o2:?e2)
correspondentes.
Não aplicável
OCA05(a), OCA06, OCA10, OCA11, OCA12
Não aplicável
Caso #4:
〈cmt:writtenBy, confof:writtenBy, ≡, _〉
〈confof:hasPhone, edas:hasPhone, ≡, _〉
〈iasted:obtain, sigkdd:obtain, ≡, _〉
Representação computacional do antipadrão OCA05(b):
<rdf:RDF
<rdf:Description>
<dcterms:identifier>OCA05b</dcterms:identifier>
</rdf:Description>
<Alignment>
<onto1>
</Ontology>
</onto1>
<onto2>
</Ontology>
</onto2>
<map>
<cell>
</cell>
<cell>
<entity1>
<Condition>
<rangeRestriction>
145
</rangeRestriction>
</Relation>
</Condition>
</entity1>
<entity2>
<Condition>
<rangeRestriction>
</rangeRestriction>
</Relation>
</Condition>
</entity2>
</cell>
</map>
</Alignment>
</rdf:RDF>
Item
Nome
Causa raiz
Variações
Evidências
Breve Descrição
OCA06
(?o1:?p1≡?o2:?p1) ⊓ (?o1:?e1 ∈ domain(?o1:?p1)) ⊓ (?o1:?e2 ∈
domain(?o1:?p1)) ⊓ (?o1:?e2≡?o2:?e2) ⊓ (?o2:?e1 ∈
domain(?o2:?p1))
correspondentes.
Consequencias: implicações lógicas em inferências e em um
Não aplicável
OCA05(b), OCA05(b), OCA10, OCA11, OCA12
Não aplicável
Caso #5:
〈confof:hasStreet, edas:hasStreet, ≡, _〉
〈confof:hasPostalCode, edas:hasPostalCode, ≡, _〉
〈cmt:date, sigkdd:date, ≡, _〉
<rdf:RDF
<rdf:Description>
</rdf:Description>
<Alignment>
<onto1>
146
</Ontology>
</onto1>
<onto2>
</Ontology>
</onto2>
<map>
<cell>
</cell>
<cell>
<entity1>
<Condition>
<domainRestriction>
</Relation>
</Condition>
</entity1>
<entity2>
<Condition>
<domainRestriction>
</Relation>
</Condition>
</entity2>
</cell>
<cell>
<entity1>
<Condition>
<domainRestriction>
</Relation>
</Condition>
</entity1>
</cell>
</map>
</Alignment>
</rdf:RDF>
Item
Nome
Causa raiz
Breve Descrição
OCA10
(?o1:?p1 ≡ ?o2:?p1) ⊓ (?o1:?e1 ∈ domain(?o1:?p1)) ⊓ (?o1:?e2 ∈
range(?o1:?p1)) ⊓ (?o1:?e1 ≡ ?o2:?e1) ⊓ (?o2:?e1 ∈
domain(?o2:?p1)) ⊓ (?o2:?e2 ∈ range(?o2:?p1)) ⊓ ∄(?o1:?e2 ≡
?o2:?e2)
ontologias, mas apenas suas classes de domínio ou intervalo são
147
Variações
Evidências
correspondentes.
Não aplicável
OCA05(b), OCA05(b), OCA06, OCA11
Não aplicável
Caso #8:
〈iasted:pay, sigkdd:pay, ≡, _〉
〈cmt:writtenBy, ekaw:writtenBy, ≡, _〉
<rdf:RDF
<rdf:Description>
</rdf:Description>
<Alignment>
<onto1>
</Ontology>
</onto1>
<onto2>
</Ontology>
</onto2>
<map>
<cell>
</cell>
<cell>
<entity1>
<Condition>
<domainRestriction>
</Relation>
</Condition>
</entity1>
<entity2>
<Condition>
<domainRestriction>
</Relation>
</Condition>
</entity2>
</cell>
<cell>
<entity1>
148
<Condition>
<rangeRestriction>
</rangeRestriction>
</Relation>
</Condition>
</entity1>
<entity2>
<Condition>
<rangeRestriction>
</rangeRestriction>
</Relation>
</Condition>
</entity2>
</cell>
</map>
</Alignment>
</rdf:RDF>
Item
Nome
Causa raiz
Variações
Evidências
Breve Descrição
OCA11
(?o1:?p1 ≡ ?o2:?p1) ⊓ (?o1:?e1 ∈ domain(?o1:?p1)) ⊓ (?o1:?e2 ∈
range(?o1:?p1)) ⊓ (?o1:?e2 ≡ ?o2:?e3) ⊓ (?o2:?e1 ∈
domain(?o2:?p1)) ⊓ (?o2:?e2 ∈ domain(?o2:?p1)) ⊓ (?o2:?e3 ∈
range(?o2:?p1)) ⊓ ∄(?o1:?e1 ≡ ?o2:?e1) ⊓ ∄(?o1:?e1 ≡ ?o2:?e2)
ontologias, mas apenas suas classes de domínio ou intervalo são
correspondentes.
Não aplicável
OCA05(b), OCA05(b), OCA06, OCA10, OCA11
Não aplicável
Caso #9:
〈confof:hasTopic, edas:hasTopic, ≡, _〉
〈confof:hasCountry, edas:hasCountry, ≡, _〉
〈conference:isGivenBy, iasted:isGivenBy, ≡, _〉
<rdf:RDF
<rdf:Description>
<dc:description>Incompletude de domínio e intervalo</dc:description>
149
</rdf:Description>
<Alignment>
<onto1>
</Ontology>
</onto1>
<onto2>
</Ontology>
</onto2>
<map>
<cell>
</cell>
<cell>
<entity1>
<Condition>
<rangeRestriction>
</rangeRestriction>
</Relation>
</Condition>
</entity1>
<entity2>
<Condition>
<rangeRestriction>
</rangeRestriction>
</Relation>
</Condition>
</entity2>
</cell>
<cell>
<entity1>
<Condition>
<domainRestriction>
</Relation>
</Condition>
</entity1>
<entity2>
<Condition>
<domainRestriction>
</Relation>
</Condition>
</entity2>
</cell>
<cell>
<entity1>
<Condition>
<domainRestriction>
</Relation>
</Condition>
</entity1>
150
<entity2>
<Condition>
<domainRestriction>
</Relation>
</Condition>
</entity2>
</cell>
</map>
</Alignment>
</rdf:RDF>
Antipadrões de Correspondência do tipo Incompletude de domínio e
intervalo e contradição de disjunção-subsunção:
Item
Nome
Causa raiz
Variações
Evidências
Breve Descrição
OCA07
Incompletude de domínio e intervalo e contradição de disjunçãosubsunção.
(?o1:?e1 ≡ ?o2:?e2) ⊓ (?o1:?e1 ⊓ ?o1:?e2 ⊑ ⊥) ⊓ (?o1:?e2 ≡
?o2:?e1) ⊓ (?o2:?e3 ⊑ ?o2:?e2) ⊓ (?o2:?e1 ≡ ?o2:?p1.(?o2:?e3))
classes pertencentes ao domínio e/ou equivalentes a uma
propriedade em outra ontologia.
Não aplicável
Não aplicável
Não aplicável
Caso #6:
〈edas:person, iasted:person, ≡, _〉
〈conference:invited_talk, ekaw:invited_talk, ≡, _〉
<rdf:RDF
<rdf:Description>
<dc:description>Incompletude de domínio e intervalo e contradição de disjunçãosubsunção</dc:description>
151
</rdf:Description>
<Alignment>
<onto1>
</Ontology>
</onto1>
<onto2>
</Ontology>
</onto2>
<map>
<cell>
</cell>
<cell>
</cell>
<cell>
</cell>
<cell>
</cell>
<cell>
<entity2>
<Relation rdf:about="?o2:?p1"/>
<Condition>
<domainRestriction>
</Relation>
</Condition>
</entity2>
</cell>
</map>
</Alignment>
</rdf:RDF>
152
11. Apêndice II – Estudo de Caso
Esta seção apresenta o detalhamento do estudo de caso apresentado na seção
6.2
Estudo Caso 1
Tabela 24 – Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #1
Evento
2011.5
2013
2012
2012
2013
2011.5
2011.5
2012
2013
2012
2012
2013
2012
2013
2012
2012
2013
2012
2013
2013
2013
2012
Ferramenta
AgrMaker
AML
GO2A
GOMMA
GOMMA
Lily
LogMap
LogMap
ODGOMS
Optima
ServOMap
ServOMap
ServOMapL
StringsAuto
TOAST
WeSeE
WeSeE
Wmatch
XMapGen
XMapSig
YAM++
YAM++
Ontologia1
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
Ontologia2 Precisão
Cobertura
Medida-F
human
0,942200557 0,892480211 0,916666667
human
0,953612167 0,827176781
0,88590604
human
0,918044572 0,842348285 0,878568971
human
0,950471698 0,797493404 0,867288379
human
0,950471698 0,797493404 0,867288379
human
0,810948905 0,732849604
0,76992377
human
0,918044572 0,842348285 0,878568971
human
0,913756237 0,845646438 0,878383008
human
0,97824116 0,711741425 0,823978618
human
0,853564547 0,584432718 0,693813626
human
0,994861254 0,638522427 0,777822419
human
0,959058342 0,618073879 0,751704773
human
0,989754098 0,637203166 0,775280899
human
0,89469697 0,779023747 0,832863188
human
0,854368932 0,754617414 0,801401051
human
0,910023678
0,76055409 0,828602228
human
0,615384615
0,37994723 0,469820555
human
0,858221477 0,674802111 0,755539143
human
0,806278714 0,694591029 0,746279235
human
0,854271357 0,672823219 0,752767528
human
0,944086022 0,868733509 0,904843696
human
0,943396226 0,857519789 0,898410504
após sua refatoração.
Evento Ferramenta Ontologia1 Ontologia2 Precisão
Cobertura
Medida-F
2011.5 AgrMaker
mouse
human
0,942857143 0,892480211 0,916977296
153
2013
2012
2012
2013
2011.5
2011.5
2012
2013
2012
2012
2013
2012
2013
2012
2012
2013
2012
2013
2013
2013
2012
AML
GO2A
GOMMA
GOMMA
Lily
LogMap
LogMap
ODGOMS
Optima
ServOMap
ServOMap
ServOMapL
StringsAuto
TOAST
WeSeE
WeSeE
Wmatch
XMapGen
XMapSig
YAM++
YAM++
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
mouse
human
human
human
human
human
human
human
human
human
human
human
human
human
human
human
human
human
human
human
human
human
0,9543379
0,918705036
0,951219512
0,951219512
0,811541271
0,918705036
0,914407989
0,97824116
0,853564547
0,994861254
0,959058342
0,989754098
0,89469697
0,855007474
0,910023678
0,615384615
0,858221477
0,806896552
0,854271357
0,943396226
0,944086022
0,827176781
0,842348285
0,797493404
0,797493404
0,732849604
0,842348285
0,845646438
0,711741425
0,584432718
0,638522427
0,618073879
0,637203166
0,779023747
0,754617414
0,76055409
0,37994723
0,674802111
0,694591029
0,672823219
0,857519789
0,868733509
0,886219081
0,878871301
0,867599569
0,867599569
0,770190641
0,878871301
0,87868403
0,823978618
0,693813626
0,777822419
0,751704773
0,775280899
0,832863188
0,80168185
0,828602228
0,469820555
0,755539143
0,746543779
0,752767528
0,898410504
0,904843696
Estudo Caso 2
Evento
2013
2011.5
2012
2011.5
2012
2011.5
2011.5
2012
2011.5
2012
2012
2013
2013
2011.5
2012
2013
2013
2011.5
2012
2013
2011.5
2012
2011.5
2011.5
Ferramenta
AML
AROMA
AROMA
AUTOMSv2
AUTOMSv2
CIDER
CODI
CODI
CSA
GO2A
HotMatch
HotMatch
IAMA
LogMap
LogMap
LogMap
LogMapLite
LogMapLt
LogMapLt
MaasMatch
MaasMtch
MaasMtch
MapEvo
MapPSO
Ontologia1
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
Cobertura Medida-F
iasted_nl
0
0
0
iasted_nl
1
0
0
iasted_nl
1
0
0
iasted_nl
0,5
0,5
0,5
iasted_nl
0,5
0,5
0,5
iasted_nl
0,333333333
0,25 0,285714286
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0,125
0,5
0,2
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0,014285714
0,25 0,027027027
iasted_nl
0,014084507
0,25 0,026666667
iasted_nl
0,028169014
0,5 0,053333333
iasted_nl
0
0
0
iasted_nl
0
0
0
154
2012
2013
2012
2013
2013
2012
2013
2013
2011.5
2012
2013
2013
2012
2011.5
2012
2013
MapSSS
MapSSS
MEDLEY
ODGOMS
OntoK
Optima
StringsAuto
Synthesis
WeSeE
WeSeE
WeSeE
WikiMatch
Wmatch
YAM++
YAM++
YAM++
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
0,166666667
0
0,125
0,333333333
0
0,333333333
0
0
0,3
0,375
0,333333333
0,25
0,214285714
0,4
0,166666667
0,2
0,25
0
0,5
0,25
0
1
0
0
0,75
0,75
0,5
0,5
0,75
0,5
0,5
0,25
0,2
0
0,2
0,285714286
0
0,001463325
0
0
0,428571429
0,5
0,4
0,333333333
0,333333333
0,444444444
0,4
0,222222222
Evento
2013
2011.5
2012
2011.5
2012
2011.5
2011.5
2012
2011.5
2012
2012
2013
2013
2011.5
2012
2013
2013
2011.5
2012
2013
2011.5
2012
2011.5
2011.5
2012
2013
2012
2013
2013
2012
Ferramenta
AML
AROMA
AROMA
AUTOMSv2
AUTOMSv2
CIDER
CODI
CODI
CSA
GO2A
HotMatch
HotMatch
IAMA
LogMap
LogMap
LogMap
LogMapLite
LogMapLt
LogMapLt
MaasMatch
MaasMtch
MaasMtch
MapEvo
MapPSO
MapSSS
MapSSS
MEDLEY
ODGOMS
OntoK
Optima
Ontologia1
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
Cobertura Medida-F
iasted_nl
0
0
0
iasted_nl
1
0
0
iasted_nl
1
0
0
iasted_nl
0,666666667
0,5 0,571428571
iasted_nl
0,666666667
0,5 0,571428571
iasted_nl
0,5
0,25 0,333333333
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0,125
0,5
0,2
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0,014285714
0,25 0,027027027
iasted_nl
0,014285714
0,25 0,027027027
iasted_nl
0,028169014
0,5 0,053333333
iasted_nl
0
0
0
iasted_nl
0
0
0
iasted_nl
0,2
0,25 0,222222222
iasted_nl
0
0
0
iasted_nl
0,125
0,5
0,2
iasted_nl
0,5
0,25 0,333333333
iasted_nl
0
0
0
iasted_nl
0,666666667
1 0,001463325
155
2013
2013
2011.5
2012
2013
2013
2012
2011.5
2012
2013
StringsAuto
Synthesis
WeSeE
WeSeE
WeSeE
WikiMatch
Wmatch
YAM++
YAM++
YAM++
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
cmt_en
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
0
0
0,333333333
0,375
0,333333333
0,285714286
0,214285714
0,5
0,333333333
0,25
0
0
0,75
0,75
0,5
0,5
0,75
0,5
0,5
0,25
0
0
0,461538462
0,5
0,4
0,363636364
0,333333333
0,5
0,4
0,25
Estudo Caso 3
Evento
2013
2011.5
2012
2011.5
2011.5
2011.5
2011.5
2013
2012
2013
2013
2011.5
2012
2013
2013
2011.5
2012
2013
2011.5
2012
2011.5
2011.5
2012
2013
2012
2013
2013
2013
2013
2011.5
2013
2013
2012
2011.5
2012
Ferramenta
AML
AROMA
AROMA
AUTOMSv2
CIDER
CODI
CSA
HerTUDA
HotMatch
HotMatch
IAMA
LogMap
LogMap
LogMap
LogMapLite
LogMapLt
LogMapLt
MaasMatch
MaasMtch
MaasMtch
MapEvo
MapPSO
MapSSS
MapSSS
MEDLEY
ODGOMS
OntoK
StringsAuto
Synthesis
WeSeE
WeSeE
WikiMatch
Wmatch
YAM++
YAM++
Ontologia1
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
Ontologia2
Precisão
Cobertura
Medida-F
conference_pt
0,4
0,125
0,19047619
conference_pt
1
0
0
conference_pt
1
0
0
conference_pt 0,571428571
0,25 0,347826087
conference_pt
0,6
0,1875 0,285714286
0,0625 0,105263158
0,125 0,090909091
1 0,007476636
conference_pt
0
0
0
conference_pt
0
0
0
conference_pt
0,6
0,1875 0,285714286
0,0625 0,105263158
0,0625 0,105263158
0,0625 0,105263158
conference_pt
0,25
0,0625
0,1
conference_pt
0,25
0,0625
0,1
conference_pt
0,25
0,0625
0,1
0,1875 0,057692308
conference_pt
0,06741573
0,375 0,114285714
0,3125 0,095238095
conference_pt
0
0
0
conference_pt
0,1
0,1875 0,130434783
conference_pt
0,5
0,125
0,2
conference_pt
0,6
0,1875 0,285714286
conference_pt
0,25
0,0625
0,1
conference_pt
0,5
0,1875 0,272727273
conference_pt
0
0
0
0,3125 0,434782609
conference_pt
0,5
0,0625 0,111111111
conference_pt
0,25
0,375
0,3
0,3125 0,357142857
conference_pt
0,375
0,375
0,375
0,3125 0,172413793
conference_pt
0,5
0,125
0,2
conference_pt
0,5
0,125
0,2
156
Evento
2013
2011.5
2012
2011.5
2011.5
2011.5
2011.5
2013
2012
2013
2013
2011.5
2012
2013
2013
2011.5
2012
2013
2011.5
2012
2011.5
2011.5
2012
2013
2012
2013
2013
2013
2013
2011.5
2013
2013
2012
2011.5
2012
Ferramenta
AML
AROMA
AROMA
AUTOMSv2
CIDER
CODI
CSA
HerTUDA
HotMatch
HotMatch
IAMA
LogMap
LogMap
LogMap
LogMapLite
LogMapLt
LogMapLt
MaasMatch
MaasMtch
MaasMtch
MapEvo
MapPSO
MapSSS
MapSSS
MEDLEY
ODGOMS
OntoK
StringsAuto
Synthesis
WeSeE
WeSeE
WikiMatch
Wmatch
YAM++
YAM++
Ontologia1
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
cmt_es
Ontologia2
Precisão
Cobertura
Medida-F
conference_pt
0,4
0,125
0,19047619
conference_pt
1
0
0
conference_pt
1
0
0
0,25 0,347826087
conference_pt
0,75
0,1875
0,3
0,0625 0,105263158
0,125 0,090909091
1 0,007476636
conference_pt
0
0
0
conference_pt
0
0
0
conference_pt
0,6
0,1875 0,285714286
0,0625 0,105263158
0,0625 0,105263158
0,0625 0,105263158
conference_pt
0,25
0,0625
0,1
conference_pt
0,25
0,0625
0,1
conference_pt
0,25
0,0625
0,1
0,1875 0,057692308
conference_pt
0,06741573
0,375 0,114285714
0,3125 0,095238095
conference_pt
0
0
0
conference_pt
0,1
0,1875 0,130434783
conference_pt
0,5
0,125
0,2
conference_pt
0,6
0,1875 0,285714286
conference_pt
0,25
0,0625
0,1
conference_pt
0,5
0,1875 0,272727273
conference_pt
0
0
0
0,3125 0,434782609
conference_pt
0,5
0,0625 0,111111111
conference_pt
0,25
0,375
0,3
0,3125 0,357142857
conference_pt
0,375
0,375
0,375
0,3125 0,172413793
conference_pt
0,5
0,125
0,2
conference_pt
0,5
0,125
0,2
Estudo Caso 4
Evento Ferramenta
2012
2012
Ontologia1
benchmarks_
ASE
biblio_1_101_
onto
AUTOMSv2 benchmarks_
Ontologia2
benchmarks_
biblio_1_101_
onto
benchmarks_
157
Precisão
Cobertura
0,577380952 1
Medida-F
0,732075472
0,956989247 0,917525773 0,936842105
2012
Hertuda
2012
HotMatch
2012
WeSeE
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
0,889908257 1
0,941747573
0,913580247 0,762886598 0,831460674
0,968085106 0,93814433
0,952879581
Evento Ferramenta Ontologia1
benchmarks_
2012
ASE
biblio_1_101_
onto
benchmarks_
2012
AUTOMSv2 biblio_1_101_
onto
benchmarks_
2012
Hertuda
biblio_1_101_
onto
benchmarks_
2012
HotMatch
biblio_1_101_
onto
benchmarks_
2012
WeSeE
biblio_1_101_
onto
Ontologia2
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
Precisão
Cobertura
0,584337349 1
Medida-F
0,737642586
0,978021978 0,917525773 0,946808511
0,91509434
1
0,955665025
0,913580247 0,762886598 0,831460674
0,978494624 0,93814433
0,957894737
Estudo Caso 5
Evento
2012
2012
2012
2012
2012
2012
Ferramenta Ontologia1
benchmarks_
ASE
biblio_1_101_
onto
benchmarks_
onto
benchmarks_
edna
biblio_1_101_
onto
benchmarks_
Hertuda
biblio_1_101_
onto
benchmarks_
HotMatch
biblio_1_101_
onto
benchmarks_
MapSSS
biblio_1_101_
onto
Ontologia2
benchmarks_
biblio_1_221_
onto
benchmarks_
biblio_1_221_
onto
benchmarks_
biblio_1_221_
onto
benchmarks_
biblio_1_221_
onto
benchmarks_
biblio_1_221_
onto
benchmarks_
biblio_1_221_
onto
158
Precisão
Cobertura
Medida-F
0,577380952
1
0,732075472
0,941747573
1
0,97
0,638157895
1
0,779116466
0,889908257
1
0,941747573
0,966666667
0,896907216 0,930481283
0,979381443
0,979381443 0,979381443
2012
WeSeE
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_221_
onto
0,979166667
0,969072165 0,974093264
Evento Ferramenta
2012
ASE
2012
AUTOMSv2
2012
edna
2012
Hertuda
2012
HotMatch
2012
MapSSS
2012
WeSeE
Ontologia1
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
Ontologia2
benchmarks_
biblio_1_221_
onto
benchmarks_
biblio_1_221_
onto
benchmarks_
biblio_1_221_
onto
benchmarks_
biblio_1_221_
onto
benchmarks_
biblio_1_221_
onto
benchmarks_
biblio_1_221_
onto
benchmarks_
biblio_1_221_
onto
Precisão
Cobertura
Medida-F
0,580838323 1
0,734848485
0,950980392 1
0,974874372
0,638157895 1
0,779116466
0,889908257 1
0,941747573
0,97752809
0,896907216 0,935483871
0,989583333 0,979381443 0,984455959
0,989473684 0,969072165 0,979166667
Estudo Caso 6
Evento
2012
2012
2012
2012
2012
benchmarks_
ASE
biblio_1_101_
onto
benchmarks_
onto
benchmarks_
Hertuda
biblio_1_101_
onto
benchmarks_
HotMatch
biblio_1_101_
onto
benchmarks_
WeSeE
biblio_1_101_
onto
Ontologia2
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
159
Precisão
Cobertura
0,577380952 1
Medida-F
0,732075472
0,956989247 0,917525773 0,936842105
0,889908257 1
0,941747573
0,913580247 0,762886598 0,831460674
0,968085106 0,93814433
0,952879581
Evento
2012
2012
2012
2012
2012
benchmarks_
ASE
biblio_1_101_
onto
benchmarks_
onto
benchmarks_
Hertuda
biblio_1_101_
onto
benchmarks_
HotMatch
biblio_1_101_
onto
benchmarks_
WeSeE
biblio_1_101_
onto
Ontologia2
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
benchmarks_
biblio_1_101_
onto
Precisão
Cobertura
Medida-F
0,584337349 1
0,737642586
0,978021978 0,917525773 0,946808511
0,91509434
1
0,955665025
0,913580247 0,762886598 0,831460674
0,978494624 0,93814433
0,957894737
Estudo Caso 7
Evento
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2013
2013
2013
Ferramenta
AROMA
CIDER
CODI
CSA
LogMap
LogMapLt
MaasMtch
MapPSO
WeSeE
YAM++
AROMA
AUTOMSv2
CODI
GO2A
GOMMA
Hertuda
LogMap
LogMapLt
MaasMtch
MapSSS
MEDLEY
Optima
WeSeE
Wmatch
YAM++
HerTUDA
IAMA
LogMap
Ontologia1
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
Ontologia2
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
160
Precisão
Cobertura
Medida-F
1
0,357142857
0,731707317
0,474576271
0,6
0,6
0,226666667
0,75
0,714285714
0,893939394
1
0,333333333
0,756097561
0,625
0,702702703
0,033348355
0,6
0,6
0,24
0,933333333
0,666666667
0,046065259
0,92
0,6875
0,867647059
0,033348355
0,6
0,6
0
0,067567568
0,405405405
0,378378378
0,040540541
0,040540541
0,22972973
0,040540541
0,337837838
0,797297297
0
0,013513514
0,418918919
0,067567568
0,351351351
1
0,040540541
0,040540541
0,243243243
0,378378378
0,054054054
0,972972973
0,310810811
0,148648649
0,797297297
1
0,040540541
0,040540541
0
0,113636364
0,52173913
0,421052632
0,075949367
0,075949367
0,228187919
0,076923077
0,458715596
0,842857143
0
0,025974026
0,539130435
0,12195122
0,468468468
0,064544265
0,075949367
0,075949367
0,241610738
0,538461538
0,1
0,087965791
0,464646465
0,244444444
0,830985915
0,064544265
0,075949367
0,075949367
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
LogMapLite
MaasMatch
MapSSS
ODGOMS
OntoK
StringsAuto
Synthesis
WeSeE
WikiMatch
YAM++
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
0,6
0,573333333
0,6
0,666666667
0,186666667
0,6
0,2
0,428571429
0,785714286
0,897058824
0,040540541
0,581081081
0,040540541
0,054054054
0,189189189
0,040540541
0,108108108
0,040540541
0,148648649
0,824324324
0,075949367
0,577181208
0,075949367
0,1
0,187919463
0,075949367
0,140350877
0,074074074
0,25
0,85915493
Evento
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
Ferramenta
AROMA
CIDER
CODI
CSA
LogMap
LogMapLt
MaasMtch
MapPSO
WeSeE
YAM++
AROMA
AUTOMSv2
CODI
GO2A
GOMMA
Hertuda
LogMap
LogMapLt
MaasMtch
MapSSS
MEDLEY
Optima
WeSeE
Wmatch
YAM++
HerTUDA
IAMA
LogMap
LogMapLite
MaasMatch
MapSSS
ODGOMS
OntoK
StringsAuto
Synthesis
WeSeE
Ontologia1
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
confOf_cz
Ontologia2
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
161
Precisão
Cobertura
Medida-F
1
0,384615385
0,75
0,473684211
0,75
0,75
0,22972973
1
0,735294118
0,907692308
1
0,5
0,775
0,714285714
0,722222222
0,033501606
0,75
0,75
0,243243243
0,965517241
0,8
0,04609475
0,958333333
0,785714286
0,880597015
0,033501606
0,75
0,75
0,75
0,581081081
0,75
0,8
0,189189189
0,75
0,210526316
0,5
0
0,067567568
0,405405405
0,364864865
0,040540541
0,040540541
0,22972973
0,040540541
0,337837838
0,797297297
0
0,013513514
0,418918919
0,067567568
0,351351351
0,986486486
0,040540541
0,040540541
0,243243243
0,378378378
0,054054054
0,972972973
0,310810811
0,148648649
0,797297297
0,986486486
0,040540541
0,040540541
0,040540541
0,581081081
0,040540541
0,054054054
0,189189189
0,040540541
0,108108108
0,040540541
0
0,114942529
0,526315789
0,41221374
0,076923077
0,076923077
0,22972973
0,077922078
0,462962963
0,848920863
0
0,026315789
0,543859649
0,12345679
0,472727273
0,064802486
0,076923077
0,076923077
0,243243243
0,54368932
0,101265823
0,08801956
0,469387755
0,25
0,836879433
0,064802486
0,076923077
0,076923077
0,076923077
0,581081081
0,076923077
0,101265823
0,189189189
0,076923077
0,142857143
0,075
2013
2013
WikiMatch
YAM++
confOf_cz
confOf_cz
confOf_nl
confOf_nl
0,846153846
0,910447761
0,148648649
0,824324324
0,252873563
0,865248227
Estudo Caso 8
Evento
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
Ferramenta
AUTOMSv2
CIDER
CSA
LogMap
MaasMtch
MapEvo
MapPSO
WeSeE
YAM++
AROMA
AUTOMSv2
CODI
GO2A
GOMMA
Hertuda
HotMatch
LogMap
MaasMtch
MapSSS
MEDLEY
Optima
WeSeE
Wmatch
YAM++
AML
HerTUDA
HotMatch
IAMA
LogMap
ODGOMS
OntoK
RiMON2013
StringsAuto
Synthesis
WeSeE
WikiMatch
YAM++
Ontologia1
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
Ontologia2
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
Precisão
0,444444444
0,4
0
0,5
0,038461538
0
0
0,2
0,6875
1
0,444444444
0,5
0,133333333
0,04
0,001940743
0
0,5
0,038461538
0,166666667
0,25
0,002189461
0,636363636
0,230769231
0,555555556
0,5
0,001940743
0
0,5
0,5
0,5
0,038461538
0
0,6
0,666666667
0,153846154
0,3
0,5
Cobertura
0,266666667
0,133333333
0
0,133333333
0,2
0
0
0,333333333
0,733333333
0
0,266666667
0,133333333
0,133333333
0,333333333
1
0
0,133333333
0,2
0,133333333
0,133333333
1
0,466666667
0,2
0,666666667
0,133333333
1
0
0,133333333
0,133333333
0,133333333
0,2
0
0,2
0,133333333
0,133333333
0,2
0,466666667
Medida-F
0,333333333
0,2
0
0,210526316
0,064516129
0
0
0,25
0,709677419
0
0,333333333
0,210526316
0,133333333
0,071428571
0,003873967
0
0,210526316
0,064516129
0,148148148
0,173913043
0,004369356
0,538461538
0,214285714
0,606060606
0,210526316
0,003873967
0
0,210526316
0,210526316
0,210526316
0,064516129
0
0,3
0,222222222
0,142857143
0,24
0,482758621
Evento Ferramenta Ontologia1 Ontologia2
162
Precisão
Cobertura
Medida-F
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
AUTOMSv2
CIDER
CSA
AROMA
LogMapLt
MaasMtch
MapEvo
MapPSO
WeSeE
YAM++
AROMA
AUTOMSv2
CODI
GO2A
GOMMA
Hertuda
HotMatch
LogMapLt
MaasMtch
MapSSS
MEDLEY
Optima
WeSeE
Wmatch
YAM++
AML
HerTUDA
HotMatch
IAMA
MapSSS
ODGOMS
OntoK
StringsAuto
Synthesis
WeSeE
WikiMatch
YAM++
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
iasted_nl
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
sigkdd_fr
0,5
0,5
0
1
0,5
0,038961039
0
0
0,208333333
0,733333333
1
0,5
0,5
0,133333333
0,04
0,001953379
0
0,5
0,038961039
0,181818182
0,25
0,002189461
0,7
0,25
0,588235294
0,5
0,001953379
0
0,666666667
0,666666667
0,666666667
0,038961039
0,75
1
0,166666667
0,333333333
0,538461538
0,266666667
0,133333333
0
0
0,133333333
0,2
0
0
0,333333333
0,733333333
0
0,266666667
0,133333333
0,133333333
0,333333333
1
0
0,133333333
0,2
0,133333333
0,133333333
1
0,466666667
0,2
0,666666667
0,133333333
1
0
0,133333333
0,133333333
0,133333333
0,2
0,2
0,133333333
0,133333333
0,2
0,466666667
0,347826087
0,210526316
0
0
0,210526316
0,065217391
0
0
0,256410256
0,733333333
0
0,347826087
0,210526316
0,133333333
0,071428571
0,003899142
0
0,210526316
0,065217391
0,153846154
0,173913043
0,004369356
0,56
0,222222222
0,625
0,210526316
0,003899142
0
0,222222222
0,222222222
0,222222222
0,065217391
0,315789474
0,235294118
0,148148148
0,25
0,5
Estudo Caso 9
Evento
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
Ferramenta
AROMA
AUTOMSv2
CIDER
CODI
CSA
MaasMtch
WeSeE
YAM++
Ontologia1
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
Ontologia2
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
163
Precisão
Cobertura
Medida-F
1
0,846153846
0,65
0,780487805
0,440677966
0,28
0,9375
0,921875
0
0,297297297
0,175675676
0,432432432
0,351351351
0,283783784
0,405405405
0,797297297
0
0,44
0,276595745
0,556521739
0,390977444
0,281879195
0,566037736
0,855072464
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
AROMA
AUTOMSv2
CODI
GO2A
GOMMA
Hertuda
HotMatch
LogMap
LogMapLt
MaasMtch
MapSSS
MEDLEY
Optima
WeSeE
Wmatch
YAM++
AML
HerTUDA
HotMatch
IAMA
LogMap
LogMapLite
MaasMatch
MapSSS
ODGOMS
OntoK
StringsAuto
Synthesis
WeSeE
WikiMatch
YAM++
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
1
0,846153846
0,853658537
0,766666667
0,787878788
0,033348355
0,2
0,6
0,666666667
0,32
0,9375
0,766666667
0,046065259
0,942857143
0,740740741
0,876923077
0,6
0,033348355
0,2
0,6
0,6
0,666666667
0,64
0,727272727
0,714285714
0,213333333
0,75
0,296296296
0,863636364
0,833333333
0,907692308
0
0,297297297
0,472972973
0,621621622
0,351351351
1
0,013513514
0,040540541
0,054054054
0,324324324
0,405405405
0,621621622
0,972972973
0,445945946
0,27027027
0,77027027
0,040540541
1
0,013513514
0,040540541
0,040540541
0,054054054
0,648648649
0,108108108
0,067567568
0,216216216
0,121621622
0,216216216
0,256756757
0,27027027
0,797297297
0
0,44
0,608695652
0,686567164
0,485981308
0,064544265
0,025316456
0,075949367
0,1
0,322147651
0,566037736
0,686567164
0,087965791
0,605504587
0,396039604
0,820143885
0,075949367
0,064544265
0,025316456
0,075949367
0,075949367
0,1
0,644295302
0,188235294
0,12345679
0,214765101
0,209302326
0,25
0,395833333
0,408163265
0,848920863
Evento
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2012
2012
2012
2012
2012
2012
2012
Ferramenta
AUTOMSv2
CIDER
CODI
CSA
AROMA
MaasMtch
WeSeE
YAM++
AROMA
AUTOMSv2
CODI
GO2A
GOMMA
Hertuda
HotMatch
Ontologia1
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
Ontologia2
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
164
Precisão
0,88
0,684210526
0,780487805
0,431034483
1
0,283783784
0,967741935
0,936507937
1
0,88
0,853658537
0,766666667
0,787878788
0,033486239
0,2
Cobertura
0,297297297
0,175675676
0,432432432
0,337837838
0
0,283783784
0,405405405
0,797297297
0
0,297297297
0,472972973
0,621621622
0,351351351
0,986486486
0,013513514
Medida-F
0,444444444
0,279569892
0,556521739
0,378787879
0
0,283783784
0,571428571
0,861313869
0
0,444444444
0,608695652
0,686567164
0,485981308
0,064773736
0,025316456
2012
2012
2012
2012
2012
2012
2012
2012
2012
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
LogMap
LogMapLt
MaasMtch
MapSSS
MEDLEY
Optima
WeSeE
Wmatch
YAM++
AML
HerTUDA
HotMatch
IAMA
LogMap
LogMapLite
MaasMatch
MapSSS
ODGOMS
OntoK
StringsAuto
Synthesis
WeSeE
WikiMatch
YAM++
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_nl
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
confOf_en
0,6
0,666666667
0,324324324
0,967741935
0,766666667
0,046065259
0,970588235
0,769230769
0,890625
0,6
0,033486239
0,2
0,75
0,6
0,666666667
0,648648649
0,8
0,833333333
0,216216216
0,818181818
0,294117647
0,904761905
0,869565217
0,921875
0,040540541
0,054054054
0,324324324
0,405405405
0,621621622
0,972972973
0,445945946
0,27027027
0,77027027
0,040540541
0,986486486
0,013513514
0,040540541
0,040540541
0,054054054
0,648648649
0,108108108
0,067567568
0,216216216
0,121621622
0,202702703
0,256756757
0,27027027
0,797297297
0,075949367
0,1
0,324324324
0,571428571
0,686567164
0,087965791
0,611111111
0,4
0,826086957
0,075949367
0,064773736
0,025316456
0,076923077
0,075949367
0,1
0,648648649
0,19047619
0,125
0,216216216
0,211764706
0,24
0,4
0,412371134
0,855072464
Estudo Caso 10
#10.
Evento
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
Ferramenta
AROMA
AUTOMSv2
CIDER
CODI
CSA
MaasMtch
MapEvo
MapPSO
WeSeE
YAM++
AROMA
AUTOMSv2
Hertuda
HotMatch
LogMap
MaasMtch
MapSSS
MEDLEY
Optima
WeSeE
Ontologia1
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
Ontologia2
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
165
Precisão
Cobertura
Medida-F
1
0,571428571
0,5
0,333333333
0,015873016
0,074626866
0
0,051282051
0,15
0,5
1
0,571428571
0,002887789
0
0,333333333
0,059701493
0,2
0,333333333
0,00345679
0,5
0
0,571428571
0,428571429
0,142857143
0,142857143
0,714285714
0
0,285714286
0,428571429
0,142857143
0
0,571428571
1
0
0,142857143
0,571428571
0,142857143
0,142857143
1
0,428571429
0
0,571428571
0,461538462
0,2
0,028571429
0,135135135
0
0,086956522
0,222222222
0,222222222
0
0,571428571
0,005758947
0
0,2
0,108108108
0,166666667
0,2
0,006889764
0,461538462
2012
2012
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
2013
Wmatch
YAM++
AML
HerTUDA
HotMatch
IAMA
LogMap
LogMapLite
MapSSS
ODGOMS
OntoK
StringsAuto
Synthesis
WeSeE
WikiMatch
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
0,173913043
0,5
0,5
0,002887789
0
0,5
0,333333333
0,333333333
0,428571429
0,5
0,029850746
0,428571429
0,5
0,272727273
0,266666667
0,571428571
0,142857143
0,285714286
1
0
0,285714286
0,142857143
0,142857143
0,428571429
0,428571429
0,285714286
0,428571429
0,142857143
0,428571429
0,571428571
0,266666667
0,222222222
0,363636364
0,005758947
0
0,363636364
0,2
0,2
0,428571429
0,461538462
0,054054054
0,428571429
0,222222222
0,333333333
0,363636364
#10 após sua refatoração.
Evento
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2011.5
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2012
2013
2013
2013
2013
2013
2013
2013
2013
2013
Ferramenta
AUTOMSv2
CIDER
CODI
CSA
AROMA
MaasMtch
MapEvo
MapPSO
WeSeE
YAM++
AROMA
AUTOMSv2
Hertuda
HotMatch
LogMap
MaasMtch
MapSSS
MEDLEY
Optima
WeSeE
Wmatch
YAM++
AML
HerTUDA
HotMatch
IAMA
LogMap
LogMapLite
MapSSS
ODGOMS
OntoK
Ontologia1
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
confOf_pt
Ontologia2
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
166
Precisão
0,666666667
0,6
0,333333333
0,016129032
1
0,075757576
0
0,051282051
0,157894737
0,5
1
0,666666667
0,00293501
0
0,333333333
0,060606061
0,25
0,333333333
0,00345679
0,6
0,181818182
0,5
0,5
0,00293501
0
0,666666667
0,333333333
0,333333333
0,5
0,6
0,03030303
Cobertura
0,571428571
0,428571429
0,142857143
0,142857143
0
0,714285714
0
0,285714286
0,428571429
0,142857143
0
0,571428571
1
0
0,142857143
0,571428571
0,142857143
0,142857143
1
0,428571429
0,571428571
0,142857143
0,285714286
1
0
0,285714286
0,142857143
0,142857143
0,428571429
0,428571429
0,285714286
Medida-F
0,615384615
0,5
0,2
0,028985507
0
0,136986301
0
0,086956522
0,230769231
0,222222222
0
0,615384615
0,005852843
0
0,2
0,109589041
0,181818182
0,2
0,006889764
0,5
0,275862069
0,222222222
0,363636364
0,005852843
0
0,4
0,2
0,2
0,461538462
0,5
0,054794521
2013
2013
2013
2013
StringsAuto
Synthesis
WeSeE
WikiMatch
confOf_pt
confOf_pt
confOf_pt
confOf_pt
sigkdd_es
sigkdd_es
sigkdd_es
sigkdd_es
167
0,5
1
0,3
0,285714286
0,428571429
0,142857143
0,428571429
0,571428571
0,461538462
0,25
0,352941176
0,380952381
12. Apêndice III – Estudo Baseado em Revisão Sistemática
O protocolo utilizado para o estudo teve como base o trabalho desenvolvido
por Santos [34]. Para cada uma das subseções a seguir serão apresentados o que se
espera a partir do protocolo (texto em {itálico}) e o conteúdo de fato utilizado no
estudo em questão.
1. Objetivo e Questões de Pesquisa
{Descrever o objetivo e as questões de pesquisa do estudo.}
Objetivo
{Descrever o objetivo do estudo através do seguinte padrão: Analisar [Fontes
de evidências / indícios: relatos de experiência / publicações científicas / estudos
primários / softwares etc.]; Com o propósito de [caracterizar / identificar] o [objeto de
estudo: abordagens / processo / tecnologia / técnica / método etc.]; Com relação à
[características de interesse do objeto de estudo]; Do ponto de vista [organizações de
software / grupo de processo / alta gerência / Instituições Implementadoras de
Processos / pesquisador / desenvolvedor etc.]; No contexto [industrial / acadêmico /
ambos] [com foco em estudos / projetos / programas / iniciativas] [com tais
características].}
Analisar relatos de experiência e publicações científicas através de um estudo
baseado em revisão sistemática.
168
Com o propósito de identificar os elementos que compõem as abordagens de
padrões e antipadrões de alinhamento de ontologias.
Com relação às técnicas / abordagens propostas, linguagens / formatos de
representação e ferramentas desenvolvidas com vistas à aplicação de padrões e
antipadrões de alinhamento de ontologias.
Do ponto de vista dos pesquisadores.
No contexto acadêmico com foco em iniciativas de desenvolvimento e aplicação
padrões e antipadrões de alinhamento de ontologias.
Questões de pesquisa
{Identificar que questões serão respondidas a partir da identificação e
caracterização do objeto de estudo. Ou seja, uma vez identificados/caracterizados os
objetos de estudo, que questões relevantes ao problema descrito poderão ser
respondidas/discutidas?}
Q1: Quais são as principais técnicas e/ou abordagens para utilização de padrões
e/ou antipadrões para alinhamento de ontologias?
Q2: Quais têm sido as linguagens e/ou formatos para representação de padrões
e/ou antipadrões para alinhamento de ontologias utilizadas e/ou propostas?
Q3: Existem softwares para provimento de padrões e/ou antipadrões para
alinhamento de ontologias como recurso no processo de alinhamento das mesmas?
Q4: Existem softwares de alinhamento de ontologias que utilizem padrões e/ou
antipadrões para alinhamento de ontologias?
População
Trabalhos publicados em conferências e periódicos relatando iniciativas de
utilização e aplicação de padrões e antipadrões para alinhamento de ontologias.
Resultados
169
A partir da identificação dos elementos que compõem as diferentes abordagens e
iniciativas de utilização de padrões e antipadrões será realizada uma análise mais
detalhada a fim de identificar formatos, linguagens e ferramentas utilizadas dentro do
contexto de padrões e antipadrões de alinhamento de ontologias, com o objetivo de
caracterizá-las e, se possível influenciar a extensão de sua classificação, a extenção de
uma linguagem computacional para sua representação e a proposta de uma ferramenta
para utilização dos padrões e antipadrões de alinhamento de ontologias em seu referido
processo.
2. Escopo da pesquisa
{Delimitar os tipos de mecanismos que serão utilizados para realizar as buscas,
por exemplo, bibliotecas digitais através dos seus respectivos engenhos de busca,
bibliotecas, consultas a especialistas, catálogo especializado de produtos etc.}
Para delinear o escopo da pesquisa foram estabelecidos critérios para garantir, de
forma equilibrada, a viabilidade da execução (custo, esforço e tempo), acessibilidade
aos dados e abrangência do estudo. A pesquisa dar-se-á a partir de bibliotecas digitais
através dos seus respectivos engenhos de busca.
Critérios adotados para seleção das fontes
{Identificar os critérios que devem ser adotados para a seleção das fontes de
pesquisa.}
Para as bibliotecas digitais é desejado:

Possuir engenho de busca que permita o uso de expressões lógicas ou
mecanismo equivalente;

Incluir em sua base publicações da área de exatas ou correlatas que possuam
relação direta com o tema a ser pesquisado;

Os engenhos de busca deverão permitir a busca por palavras-chave e a busca no
resumo (abstract) das publicações.
170
Os mecanismos de busca utilizados devem garantir resultados únicos através da
busca de um mesmo conjunto de palavras-chaves. Quando isto não for possível, deve-se
estudar e documentar uma forma de minimizar os potenciais efeitos colaterais desta
limitação.
3. Restrições
{Identificar todas as restrições associadas ao estudo. Identificar o intervalo de
tempo válido para as buscas. O acesso aos dados, em geral, não deve incorrer em ônus
para a pesquisa.}
A pesquisa está restrita à análise de publicações obtidas, exclusivamente, a partir
das fontes selecionadas a partir dos critérios supracitados.
O estudo englobará todos os dados disponíveis nas fontes.
4. Idiomas
{Deve-se identificar os idiomas das publicações que serão aceitas para a
pesquisa. Se possível, deve-se justificar essa escolha.}
Para a realização desta pesquisa foram selecionados os idiomas inglês e
português. A escolha do idioma inglês deve-se à sua adoção pela grande maioria das
conferências e periódicos internacionais relacionados como tema de pesquisa e por ser o
idioma utilizado pela maioria das editoras relacionadas com o tema listadas no Portal de
Periódicos da CAPES. A escolha do idioma português deve-se à sua adoção pelas
principais conferências e periódicos nacionais da área de Sistemas de Informação.
5. Métodos de Busca de Publicações
{Deve-se descrever a forma de busca (manual e/ou eletrônica) além da
expressão de busca: expressão lógica contendo uma combinação de palavras chaves
extraída do objetivo do estudo relacionada ao objeto de estudo, características de
interesse e respectivos sinônimos.}
171
As fontes digitais serão acessadas via Web, através de expressões de busca préestabelecidas.
6. Expressão de Busca
Para artigos em inglês deve-se utilizar a expressão de busca abaixo:
(ontology OR ontologies) AND (matching OR alignment OR mapping OR
correspondence) AND (design pattern OR desing patterns OR antipattern OR antipattern OR antipatterns OR anti-patterns).
Para artigos em português deve-se utilizar a expressão de busca abaixo:
(ontologia OR ontologias) AND (alinhamento OR mapeamento OR correspondencia)
AND (padrão OR padrões OR antipadrão OR antipadrões OR anti-padrão OR antipadrões).
7. Busca Manual
A busca manual não será contemplada neste trabalho.
8. Procedimentos de Seleção e Critérios
{Deve-se descrever os procedimentos para seleção das publicações, incluindo
procedimentos avaliação da inclusão de publicações no escopo da pesquisa e critérios
de inclusão e exclusão.}
A estratégia de busca será aplicada por um pesquisador para identificar as
publicações em potencial. As publicações identificadas serão selecionadas pelo mesmo
pesquisador que efetuou a busca através da verificação dos critérios de inclusão e
exclusão e de qualidade estabelecidos.
Procedimentos de Seleção
{Identificar as etapas necessárias para seleção das publicações para o estudo.}
A seleção dos estudos será efetuada em 2 etapas:
172
i) Seleção e catalogação preliminar dos dados coletados. A seleção preliminar
das publicações será feita a partir da aplicação da expressão de busca às fontes
selecionadas. Cada publicação será catalogada em uma planilha para análise posterior;
ii) Seleção dos dados relevantes. A seleção preliminar com o uso da expressão
de busca não garante que todo o material coletado seja útil no contexto da pesquisa, pois
a aplicação das expressões de busca é restrita ao aspecto sintático. Dessa forma, após a
identificação das publicações através dos mecanismos de buscas, deve-se ler os
resumos/abstracts e analisá-los seguindo os critérios de inclusão e exclusão
identificados a seguir.
Devem ser excluídas as publicações contidas no conjunto preliminar que
(critérios de exclusão):
CE 1. As palavras chave não estão presentes na publicação e não há variações
destas palavras chave;
CE 2. As palavras chave da busca não apareçam no título, resumo e/ou palavraschave da publicação;
CE 3. O contexto da pesquisa não seja de alinhamento de ontologias.
Podem ser incluídas apenas as publicações que satisfaçam os seguintes critérios
(critérios de inclusão):
CI 1. Publicações que tratam de ontologias no sentido computacional;
CI 2. Publicações que tratam do problema de alinhamento de ontologias;
CI 3. Publicações que tratem de padrões (design patterns) ou antipadrões dentro do
contexto de alinhamento de ontologias;
CI 4. Publicações que tratem de ferramentas ou técnicas de aplicações de padrões
e/ou antipadrões no processo de alinhamento de ontologias.
9. Planejamento e Execução
O protocolo descrito na seção anterior é a base para a execução do estudo
baseado em revisão sistemática. Para a escolha das palavras chave foi observado 1
artigo de controle, que serviu de base para calibragem da expressão de busca. A escolha
173
dos artigos de controle levou em consideração temas e autores de grande influência na
área pesquisada.

Scharffe, F.; Zamazal, O.; Fensel, D. 2013, Ontology Alignment Design
Patterns. Knowledge Information Systems, Springer-Verlag London.
Ao final do processo de calibragem, pode-se observar uma notável diferença na
indexação dos mecanismos de busca quando buscado os artigos de controle.
10. Identificação do Período de Busca
Por se tratar de um assunto relativamente novo, não foram aplicados filtros sobre
o período de busca, justamente para avaliá-la de forma completa e observar a evolução
do tema.
11. Definição das Máquinas de Busca
Durante o processo testes e calibragem da expressão de busca, verificou-se que a
base de dados da Scopus (http://www.scopus.com.br) retornou maior quantidade de
artigos em relação às máquinas de busca da IEEE (http://ieeexplore.ieee.org/) e DBLP
(http://www.dblp.org/search/). A máquina de busca da DBLP não permite gerar
expressões de busca estruturadas, no entanto por ser uma máquina de busca de alta
relevância para o tema que está sendo pesquisado, foram realizadas diversas buscas
individuais, de acordo com as expressões de busca definidas no item 2.5.1 e seus
resultados compilados em uma planilha eletrônica. Para garantir maior cobertura dos
resultados, as quatro máquinas de foram utilizadas neste trabalho.
Expressão de Busca na Biblioteca Digital da IEEE
Inglês:
( ( ( "Abstract":ontology OR "Abstract":ontologies ) AND ( "Abstract":matching OR
"Abstract":alignment OR "Abstract":mapping OR "Abstract":correspondence) AND (
"Abstract":design pattern OR "Abstract":design patterns OR "Abstract":antidesign
pattern OR "Abstract":anti-design pattern OR "Abstract":antidesign patterns OR
174
"Abstract":anti-design patterns) ) OR ( ( "Index Terms":ontology OR "Index
Terms":ontologies ) AND ( "Index Terms":matching OR "Index Terms":alignment OR
"Index Terms":mapping OR "Abstract":correspondence) AND ( "Index Terms":design
pattern OR "Index Terms":design patterns OR "Index Terms":antidesign pattern OR
"Index Terms":antidesign patterns OR "Index Terms":anti-design pattern OR "Index
Terms":anti-design patterns) ) )
Português:
( ( ( "Abstract":ontologia OR "Abstract":ontologias ) AND ( "Abstract":alinhamento
OR "Abstract":mapeamento OR "Abstract":correspondência) AND ( "Abstract":padrão
OR "Abstract":padrões OR "Abstract":antipadrão OR "Abstract":anti-padrão OR
"Abstract":antipadrões OR "Abstract":anti-padrões) ) OR ( ( "Index Terms":ontologia
OR "Index Terms":ontologias ) AND ( "Index Terms":alinhamento OR "Index
Terms":mapeamento OR "Abstract":correspondência) AND ( "Index Terms":padrão OR
"Index Terms":padrões OR "Index Terms":antipadrão OR "Index Terms":antipadrões
OR "Index Terms":anti-padrão OR "Index Terms":anti-padrões) ) )
Expressão de Busca na Biblioteca Digital da Scopus
Inglês:
( ( (TITLE-ABS-KEY(ontology) OR TITLE-ABS-KEY(ontologies)) AND (TITLEABS-KEY(matching)
OR
KEY(mapping)
TITLE-ABS-KEY(correspondence))
OR
TITLE-ABS-KEY(alignment)
OR
TITLE-ABS-
AND
(TITLE-ABS-
KEY(design pattern) OR TITLE-ABS-KEY(design patterns) OR TITLE-ABSKEY(anti-design pattern) OR TITLE-ABS-KEY(anti-design patterns) OR TITLE-ABSKEY(antidesign pattern) OR TITLE-ABS-KEY(antidesign patterns)) ) OR (
(INDEXTERMS(ontology)
(INDEXTERMS(matching)
OR
INDEXTERMS(ontologies))
OR
INDEXTERMS(alignment)
175
AND
OR
INDEXTERMS(mapping)
(INDEXTERMS(design
OR
INDEXTERMS(correspondence))
pattern)
OR
INDEXTERMS(design
patterns)
AND
OR
INDEXTERMS(anti-design pattern) OR INDEXTERMS(anti-design patterns) OR
INDEXTERMS(antidesign pattern) OR INDEXTERMS(antidesign patterns)) ) )
Português:
( ( (TITLE-ABS-KEY(ontologia) OR TITLE-ABS-KEY(ontologias)) AND (TITLEABS-KEY(alinhamento)
OR
KEY(correspondência))
AND
TITLE-ABS-KEY(mapeamento)
(TITLE-ABS-KEY(padrão)
OR
OR
TITLE-ABSTITLE-ABS-
KEY(padrões) OR TITLE-ABS-KEY(anti-padrão) OR TITLE-ABS-KEY(anti-padrões)
OR TITLE-ABS-KEY(antipadrão) OR TITLE-ABS-KEY(antipadrões)) ) OR (
(INDEXTERMS(ontologia)
(INDEXTERMS(alinhamento)
OR
INDEXTERMS(ontologias))
OR
INDEXTERMS(correspondência))
AND
INDEXTERMS(mapeamento)
OR
(INDEXTERMS(padrão)
OR
AND
INDEXTERMS(padrões) OR INDEXTERMS(anti-padrão) OR INDEXTERMS(antipadrões) OR INDEXTERMS(antipadrão) OR INDEXTERMS(antipadrões)) ) )
Expressão de Busca na Biblioteca Digital da DBLP
Inglês:
ontolog~ alignment design.pattern~
ontolog~ matching design.pattern~
ontolog~ mapping design.pattern~
ontolog~ correspondence design.pattern~
ontolog~ alignment antipattern~
ontolog~ matching antipattern~
ontolog~ mapping antipattern~
ontolog~ correspondence antipattern~
176
ontolog~ alignment anti-pattern~
ontolog~ matching anti-pattern~
ontolog~ mapping anti-pattern~
ontolog~ correspondence anti-pattern~
Português:
ontologia~ alinhamento padr~
ontologia~ mapeamento padr~
ontologia~ correspondência padr~
ontologia~ alinhamento antipadr~
ontologia~ mapeamento antipadr~
ontologia~ correspondência antipadr~
ontologia~ alinhamento anti-padr~
ontologia~ mapeamento anti-padr~
ontologia~ correspondência anti-padr~
12. Execução do Protocolo
Total de trabalhos coletados através dos mecanismos de busca: 126.
Trabalhos selecionados através dos critérios de inclusão e exclusão após a leitura
dos resumos: 11 (8%)
13. Dados Coletados
A seguir são apresentados os dados compilados com o título da publicação,
autores e ano em que foi publicado o trabalho. A disposição dos dados está em ordem
alfabética do título do trabalho.
Tabela 44 - Trabalhos selecionados após a execução do protocolo de revisão.
Id
Título
Ano
Autores
1
A Pattern-based Ontology Matching Approach for
Detecting Complex Correspondences [51]
2009
Dominique Ritze, Christian Meilicke, Ondrej
Sváb-Zamazal, Heiner Stuckenschmidt
177
2
APIs à gogo: Automatic generation of ontology APIs
[52]
2009
Parreiras, F.S.; Saathoff, C.; Walter, T.; Franz,
T.; Staab, S.
3
Alignment Patterns Based on Unified Foundational
Ontology [53]
2012
Natalia Fonseca Padilha, Fernanda Araujo
Baião, Kate Revoredo
4
AUTOMS-F: A framework for the synthesis of
ontology mapping methods [54]
2009
Valarakos A.G., Spiliopoulos V., Vouros G.A.
5
Correspondence Patterns for Ontology Alignment
[55]
2008
François Scharffe, Dieter Fensel
6
Exploiting patterns in ontology mapping [56]
2007
Svab O.
7
Ontology alignment design patterns [57]
2013
Scharffe F., Zamazal O., Fensel D.
8
Ontology Fusion with Complex Mapping Patterns
[58]
2006
Jinguang Gu, Yi Zhou
9
Ontology matching with semantic verification [59]
2009
Jean-Mary, Y., Shironoshita, E., Kabuka, M.
10
Towards correspondence patterns for ontology
mediation [60]
2007
Scharffe F., Ding Y., Fensel D.
11
Towards design patterns for ontology alignment [61]
2008
Scharffe F., Euzenat J., Fensel D.
A Tabela 45 apresenta a correlação dos trabalhos selecionados com as questões
de pesquisa citadas.
Tabela 45 - Correlação dos trabalhos selecionados com as questões de pesquisa.
Tipo de Trabalho
Grupo Selecionado
Total
Q1-Técnica / Aborgadem
1, 2, 3, 5, 6, 7, 8, 9, 10, 11
11
Q2-Linguagem / Formato
2, 5, 7, 10, 11
5
Q3-Ferramenta como Recurso
-
0
Q4-Ferramenta Proprietária
4, 8, 9
3
A seguir a relação completa de trabalhos retornados pelas expressões de busca
construídas e executadas nos motores de busca selecionados.
Tabela 46 – Relação completa de trabalhos retornados pelas expressões de busca.
CI
CE
Título do
Documento
Ano
Resumo
Autores
CE2
CE3
[Front cover]
2010
The following topics are dealt with: machine
intelligence; fuzzy cognitive maps; imaging
method; task scheduling; man-machine
software interface; aspect-oriented design
patterns; virtual collaboration; ambient
intelligence; intelligent control system;
measuring system verification; artificial
intelligence; intelligent search machine; and
ontology key concept interpretation.
178
Motor
de
Busca
IEEE
CE2
CE3
[Title page i]
2012
CE2
CE3
[Title page]
2010
CE3
2006 Seventh
International Baltic
Conference on
Databases and
Information Systems,
Proceedings
2nd International
Conference on
Engineering and
Technology Innovation
2012, ICETI 2012
2006
The proceedings contain 30 papers. The
topics discussed include: avoidance of
deadline-violations for inter-organizational
business processes
[No author name
available]
Scopus
2013
[No author name
available]
Scopus
A blocking strategy to
improve gene selection
for classification of
gene expression data
2007
special focus in this conference is on
Innovation for Applied Science and
Technology. The topics include: A study on
the gelation properties and rheological
behavior of gellan gum
Because of high dimensionality, machine
learning algorithms typically rely on feature
selection techniques in order to perform
effective classification In microarray gene
expression data sets. However, the large
number of features compared to the number
of samples makes the task of feature
selection computationally hard and prone to
errors. This paper interprets feature selection
as a task of stochastic optimization, where
the goal is to select among an exponential
number of alternative gene subsets the one
expected to return the highest generalization
in classification. Blocking is an experimental
design strategy which produces similar
experimental conditions to compare
Bontempi G.
Scopus
CE2
CE3
The following topics are dealt with: largescale medical image analysis; electronic
health records data; dynamic task
optimization; remote diabetes monitoring
systems; clinical decision support;
colonoscopy surveillance; natural language
processing; knowledge-based biomedical
word sense disambiguation; biomedical time
series data; percutaneous coronary
intervention; unsupervised pattern matching
method; image retrieval framework; visual
region-of-interest identification; visual
region-of-interest classification; robust
feature selection method; premicroRNA
identification; nucleotide-structure triplets;
enhancing twitter data analysis; simple
semantic filtering; pathogenic organisms;;
designing clinical data presentation
cognitive task analysis methods;
computational drug repositioning; RNA-seq
splicing; cell type identity; mammalian
transcriptomes; coronary vessels; crossinstitutional medication description patterns;
integrating transcriptome; proteome
information; clinical element models;
tumour progression segmentation
algorithms; CT scanning; temporal analysis;
intrarelation reconstruction; gene expression;
cloud computing; personal genome
sequencing data; and gene ontology.
The following topics are dealt with : hidden
Markov model; support vector machines;
microarray sample classification; automated
knowledge engineering; medical image edge
enhancement; recurrent fuzzy multilayer
perceptron; self organizing maps; data
mining; business intelligence tool; context
ontology driven relevant search; Web search
result optimization; image compression
analysis; natural feature identification;
optimized vertex coloring; data
compression; nonlinear boundary value
problems; design pattern detection; media
processor performance optimization; CGSR
protocol; centralized routing; integrated
packet networks; MIPv6; and mobile ad hoc
network routing protocol.
179
IEEE
IEEE
CE2
CE3
A clustering based
approach for domain
relevant relation
extraction
2008
alternative stochastic configurations in order
to be confident that observed differences in
accuracy are due to actual differences rather
than to fluctuations and noise effects. We
propose an original blocking strategy for
improving feature selection which
aggregates in a paired way the validation
outcomes of several learning algorithms to
assess a gene subset and compare it to
others. This is a novelty with respect to
conventional wrappers, which commonly
adopt a sole learning algorithm to evaluate
the relevance of a given set of variables. The
rationale of the approach is that, by
increasing the amount of experimental
conditions under which we validate a feature
subset, we can lessen the problems related to
the scarcity of samples and consequently
come up with a better selection. The paper
shows that the blocking strategy
significantly improves the performance of a
conventional forward selection for a set of
16 publicly available cancer expression data
sets. The experiments involve six different
classifiers and show that improvements take
place independent of the classification
algorithm used after the selection step. Two
further validations based on available
biological annotation support the claim that
blocking strategies in feature selection may
improve the accuracy and the quality of the
solution. The first validation is based on
retrieving PubMEd abstracts associated to
the selected genes and matching them to
regular expressions describing the biological
phenomenon underlying the expression data
sets. The biological validation that follows Is
based on the use of the Bioconductor
package GoStats in order to perform Gene
Ontology statistical analysis. © 2007 IEEE.
Most existing corpus based relation
extraction techniques focus on predefined
relations. In this paper, a clustering based
method is presented for domain relevant
relation extraction including both relation
type discovery and relation instance
extraction. Given two raw corpora, one in
the general domain, one in an application
domain, domain specific verbs connecting
different instances are extracted based on
syntactic dependency as well as a small set
of domain concept instance seeds. Relation
types are then discovered based on verb
clustering followed by relation instance
extraction. The proposed approach requires
no predefined relation types, no prior
training of domain knowledge, and no need
for manually annotated corpora. This
method is applicable to any domain corpus
and it is especially useful for knowledgelimited and resource-limited domains.
Evaluations conducted on Chinese football
domain for relation extraction show that the
approach discovers various relations with
good performance.
180
Yuhang Yang;
Qin Lu; Tiejun
Zhao
IEEE
CI1
CE2
A Comparative Study:
Syntactic versus
Semantic Matching
Systems
2009
CE1
CE2
CE3
A context dependency
relation pattern based
algorithm for term
similarity calculation
2012
CE2
A declarative
recommender system
for cloud infrastructure
services selection
2012
CE3
A framework for
adaptive configuration
of business model
oriented to networks
deployment
2006
Although there have been many matching
systems evaluations, the need for more
evaluations remains one of the most
important issues in this field, because
without evaluation no progress. In this
paper, we propose to compare two matching
systems according to the matching
approaches classification which
distinguishes between syntactic and
semantic systems using three OWL
ontologies describing the same domain: the
American University Organization.
In this paper, we put forward a new term
similarity algorithm which automatically
extracts context patterns by sentence
dependency analysis, and then calculates
term similarity by mapping those patterns.
The algorithm provides better way to extract
term context patterns with stronger context
expression ability than current algorithms.
Meanwhile, the length of patterns is modest,
which makes it convenient to be matched.
We also evaluate the algorithm on the basis
of gene engineering field experiment data
set. Experiment result shows that the
algorithm evidently improves the calculating
performance.
The cloud infrastructure services landscape
advances steadily leaving users in the agony
of choice. Therefore, we present
CloudRecommender, a new declarative
approach for selecting Cloud-based
infrastructure services. CloudRecommender
automates the mapping of users' specified
application requirements to cloud service
configurations. We formally capture cloud
service configurations in ontology and
provide its implementation in a structured
data model which can be manipulated
through both regular expressions and SQL.
By exploiting the power of a visual
programming language (widgets),
CloudRecommender further enables
simplified and intuitive cloud service
selection. We describe the design and a
prototype implementation of
CloudRecommender, and demonstrate its
effectiveness and scalability through a
service configuration selection experiment
on most of today's prominent cloud
providers including Amazon, Azure, and
GoGrid. © 2012 Springer-Verlag.
Facing the rising tide of modularity of
production and operation organizations, the
basic strategy to deal with is implementing
the information and communication
technology (ICT) applications, or searching
the ICT solutions. There are two directions
that coming to solving the dynamics
organization problem. One is starting from
the business process modelling (BPM),
creating the views to describe the operation
relationships among them. The other is to
provide the advices from the cases analysis
and applying the economics theory to
comparing the competition status. During
the two sides, could find that the
transforming of management & Control
patterns was not put on the heavy emphasis
or was neglected. So the management
problem that existing continuously is not
solved satisfactorily due to the gap between
management requirements and the BPM
which dominate by the views. Considering
the gap that existing above, the framework
181
Ghomari, L.;
Ghomari, A.R.
IEEE
Xu Jian; Zhang
Qingliang
IEEE
Zhang M., Ranjan
R., Nepal S.,
Menzel M., Haller
A.
Gu, Yuanxun;
Guo, Jingjuan
Scopus
IEEE
CI1
CI2
CI3
CI4
CE3
A LEGO-like Metadata
Architecture for Image
Search & Retrieval
2009
A logical geo-ontology
design pattern for
quantifying over types
2012
of business model (BM) adaptive
configuration (FBMAC) oriented to
networks deployment is put forward which
is driven by the capability and role, not
process. In FBMAC, the role and capability
were not regarded as the variable, but as the
result that factors which constructed the
adaptive configuration. From the findings of
business model elements, to creating the
ontology of BM, and then put forward the
configurable point and configuration
parameter that completed the configuration
design. The FBMAC makes BM play the
role of integrating the capabilities of
organization cell, beyond the executive,
which improving the adaptability of
organization under ICT environments.
FBMAC builds the mapping from
management requirements to the
application-design of enterprise solutions.
This paper proposes a set of architectural
patterns for the design of interoperable
image search&retrieval systems on top of
the latest standards in the area, ISO/IEC
15938-12 (MPEG Query Format) and
ISO/IEC 24800 (JPSearch). The work
introduces the notion of a "composable
metadata model" as a means to allow the
usage of multiple metadata ontologies
together, along with mechanisms to specify
semantic mappings among them. The paper
also studies the process to choose a Core
Metadata Ontology (based on the work
taking place at the W3C Media Annotations
Working Group), which plays the role of a
minimal lingua franca among the different
systems, providing a basic level of
interoperability.
Ontology design patterns ease the
engineering of ontologies, improve their
quality, foster reusability, and support the
alignment of ontologies by acting as
common building blocks or strategies for
reoccurring modeling problems. This makes
ontology design patterns key enablers of
semantic interoperability and, hence, a
crucial technology for representing the body
of knowledge of such heterogeneous
domains as the geosciences. While different
types of patterns can be distinguished,
existing work on geo-ontology design
patterns has solely focused on content
patterns, i.e., design solutions for domain
classes and relationships. In this work, we
propose a logical pattern that addresses a
frequent modeling problem that has
hampered the development of sophisticated
geo-ontologies in the past, namely how to
model the quantification over types. We
argue for the need for such a pattern, explain
why it is difficult to model, demonstrate how
to implement it using the Web Ontology
Language OWL, and finally show how it can
be applied to modeling concepts such as
biodiversity. © 2012 ACM.
182
Tous, R.;
Delgado, J.
Martinez D.C.,
Janowicz K.,
Hitzler P.
IEEE
Scopus
CE3
CI1
CE3
A new matching
algorithm for Chinese
place names
2011
A Pattern-based
Ontology Matching
Approach for Detecting
Complex
Correspondences
2009
A practical ontology
framework for static
model analysis
2011
Matching algorithm for Place Names is one
of the most important research topics in the
construction of digital gazetteers. Taking
account of the morphological characteristics
of Chinese Place Names and ontology
method, we first pretreat the Chinese Place
Names to remove illegal characters,
decompose the Chinese Place Names into
special names and generic terms, and then
use both the Levenshtein Distance(LD)
method and the semantic distance method to
calculate relationship of similarity between
them. Finally, we get the comprehensive
similarity for Chinese Place Names by
calculating the weighted average for both
similarity of special names and that of
generic terms. In this study, the example
shows that similarity index for special
names, generic terms and the overall place
names, enhance the completeness and
accuracy of the place names matching
theory.
State of the art ontology matching
techniques are limited to detect simple
correspondences between atomic concepts
and properties. Nevertheless, for many
concepts and properties atomic counterparts
will not exist, while it is possible to
construct equivalent complex concept and
property descriptions. We define a
correspondence where at least one of the
linked entities is non-atomic as complex
correspondence. Further, we introduce
several patterns describing complex
correspondences. In particular, we focus on
methods for automatically detecting
complex correspondences. These methods
are based on a combination of basic
matching techniques. We conduct
experiments with different datasets and
discuss the results.
In embedded software, there are many
reasons to include concepts from the
problem domain during design. Not only
does doing so make the software more
comprehensible to those with domain
understanding, it also becomes possible to
check that the software conforms to
correctness criteria expressed in the domain
of interest. Here we present a unified
framework that enables users to create
ontologies representing arbitrary domains of
interest and analyses over those domains.
These analyses may then be run against
software specifications, encapsulated as
models, checking that they are sound with
respect to the given ontology. Our approach
is general, in that the framework is agnostic
to the semantic meaning of the ontologies
that it uses and does not privilege the
example ontologies that we present here.
Where practical use-cases and principled
theory exist, we provide for the expression
of certain patterns of infinite ontologies. In
this paper we present two patterns of infinite
ontologies: those containing values, and
those containing ontologies recursively. We
show how these two patterns map to use
cases of unit systems and structured data
types, and show how these are applicable to
cyber-physical systems examples drawn
from automotive and avionic domains.
Despite the range of ontologies and analyses
that we present here, we see user-built
ontologies as a key feature of our approach.
183
Gang Cheng; Fei
Wang; Haiyang
Lv; Yinling Zhang
IEEE
Dominique
Ritze, Christian
Meilicke, Ondrej
SvábZamazal, Heiner
Stuckenschmidt
DBLP
Lickly, B.;
Shelton, C.;
Latronico, E.;
Lee, E.A.
IEEE
CI1
CI3
A Quantitative
Treatment to Data from
Computer-Supported
Collaboration: An
Ontological Approach
2008
CE3
A Sequence Similarity
Technique for Mapping
Alternative Features in
Event-Related
Potentials (ERP) Data
2010
Collaborative activity performed over
specific platforms, designed for such
purpose, can provide a deep knowledge
about the roles, intentions and effects
regarding participants and their interaction
among themselves and with the knowledge
objects available. This study aims at
proposing a structured process for gathering
the semantics of the activity hidden behind
the raw data collected in log files from
CSCL platforms. The proposal is based on
exploring the semantic elements (activity
awareness) through a social networks
analysis (SNA). The main focus of our work
is to match different behavioral profiles
detected in the collaborative activity from
CSCL with the formal profiles identified
inside a complex concept-network. This
network defines an ontology that describes
the behavior expected when collaborating in
different scenarios and types of activity.
When a certain activity sequence matches
with a predefined pattern, the concepts
related to the pattern are then bound to the
real activity sequence.
In this paper, we present a method for
identifying correspondences, or mappings,
between alternative features of brainwave
activity in event-related potentials (ERP)
data. The goal is to simulate mapping across
results from heterogeneous methods that
might be used in different neuroscience
research labs. The input to the mapping
consists of two ERP datasets whose
spatiotemporal characteristics are captured
by alternative sets of features, that is,
summary spatial and temporal measures
capturing distinct neural patterns that are
linked to concepts in a set of ERP
ontologies, called NEMO (Neural
ElectroMagnetic Ontologies) [3, 6]. The
feature value vector of each summary metric
is transformed into a point-sequence curve,
and clustering is performed to extract similar
subsequences (clusters) representing the
neural patterns that can then be aligned
across datasets. Finally, the similarity
between measures is derived by calculating
the similarity between corresponding pointsequence curves. Experiment results showed
that the proposed approach is robust and has
achieved significant improvement on
precision than previous algorithms.
184
Casillas, L.;
Daradoumis, T.
IEEE
Haishan
Liu, Gwen A.
Frishkoff, Robert
M. Frank, Dejing
Dou: OntologyBased Mining of
Brainwaves
DBLP
CE3
Adaptive requirementdriven architecture for
integrated healthcare
systems
2010
CE1
CE2
CE3
Advanced Information
Systems Engineering
Workshops - CAiSE
2011 International
Workshops,
Proceedings
Advances in
Conceptual Modeling Applications and
Challenges, ER 2010
Workshops ACM-L,
CMLSA, CMS,
DE@ER, FP-UML,
SeCoGIS, WISM,
Proceedings
Alignment of ontology
design patterns: Class
as property value,
value partition and
normalisation
2011
CE1
CE2
CE3
CI1
CI2
CI3
In order to improve the quality of healthcare
services, large-scale medical information
systems should be integrated with
adaptability in response to the changing
medical environment. In this paper, we
propose a requirement-driven architecture
for healthcare information systems that will
be able to respond to new requirements. The
system operates through the mapping
mechanism between these layers and thus
can organize functions dynamically adapting
to user's requirement. Furthermore, we
introduce the organizational semiotics
methods to capture and analyze user's
requirement through ontology chart and
norms. Based on these results, the structure
of user's requirement pattern (URP) is
established as the driving factor of our
system. Finally, we propose an integration
framework for data sharing amongst
different hospital organizations and also
present the HL7 based virtual database to
realize the data integration. Our research
makes a contribution to the design and
implementation of the architecture of
healthcare systems which can adapt to the
changing medical environment. © 2010
ACADEMY PUBLISHER.
topics discussed include: business IT
alignment from business model to enterprise
architecture
Yang H., Liu K.,
Li W.
Scopus
[No author name
available]
Scopus
2010
topics discussed include: G-map semantic
mapping approach to improve semantic
interoperability of distributed geospatial web
services
[No author name
available]
Scopus
2012
Design-pattern driven ontology construction,
whether manual or (partially) automated,
relies on the availability of curated
repositories of Ontology Design Patterns
(ODPs) adequately characterized. In order to
consistently apply a given ODP, not only it
is important to characterize it in full, but also
examine its alignment or deviation to other
relevant ODPs in relation to it. Otherwise,
possible inconsistencies in the application
can lead to interoperability issues among the
ontology models involved. In that context,
this paper revisits a specific version of three
different ODPs: Class as a Property Value
(CPV), Value Partition (VP) and
Normalisation. The review of the CPV
identifies two distinct modelling problems
being tangled that prompt to decouple the
pattern into two variants: a strict and a
coarse CPV pattern. The examination
continues with a comparative analysis
among the patterns that reveals key
alignments and differences at the structural
and semantic level. These findings extends
the reusability and compositional
characteristics of the strict and coarse
variants of the CPV ODP in relation to the
other two patterns. To illustrate our
contribution existing examples in the
literature are revisited. They demonstrate the
alignments, differences and prototypical
OWL idioms identified, which can assist
Rodriguez-Castro
B., Ge M., Hepp
M.
Scopus
185
ontology practitioners in mitigating the
opportunity for inconsistencies when
applying these recurrent ontology building
blocks. © 2012 Springer-Verlag.
CE2
Alignment of the
UMLS semantic
network with BioTop:
Methodology and
assessment
2009
Alignment Patterns
Based on Unified
Foundational Ontology
2012
Motivation: For many years, the Unified
Medical Language System (UMLS)
semantic network (SN) has been used as an
upper-level semantic framework for the
categorization of terms from terminological
resources in biomedicine. BioTop has
recently been developed as an upper-level
ontology for the biomedical domain. In
contrast to the SN, it is founded upon strict
ontological principles, using OWL DL as a
formal representation language, which has
become standard in the semantic Web. In
order to make logic-based reasoning
available for the resources annotated or
categorized with the SN, a mapping
ontology was developed aligning the SN
with BioTop. Methods: The theoretical
foundations and the practical realization of
the alignment are being described, with a
focus on the design decisions taken, the
problems encountered and the adaptations of
BioTop that became necessary. For
evaluation purposes, UMLS concept pairs
obtained from MEDLINE abstracts by a
named entity recognition system were tested
for possible semantic relationships.
Furthermore, all semantic-type combinations
that occur in the UMLS Metathesaurus were
checked for satisfiability. Results: The
effort-intensive alignment process required
major design changes and enhancements of
BioTop and brought up several design errors
that could be fixed. A comparison between a
human curator and the ontology yielded only
a low agreement. Ontology reasoning was
also used to successfully identify 133
inconsistent semantic-type combinations. ©
2009 The Author(s).
Ontology alignment is the process of finding
related entities in different ontologies. In this
context, precise and explicit representation
of conceptualizations is essential for
reaching semantic integration to ensure that
only data related to the same (or sufficiently
similar) real-world entity are merged.
Foundational ontologies describe general
concepts independent of a domain and
precisely define meta-properties so as to
make the semantics of each concept in the
ontology explicit. In this paper we show how
the use of OntoUML, a conceptual modeling
language based on Unified Foundational
Ontology, allows the application of
alignment patterns and exemplify how this
approach may improve precision, recall and
refine the type of the alignment.
186
Schulz S.,
Beisswanger E.,
van den Hoek L.,
Bodenreider O.,
van Mulligen
E.M.
Scopus
Natalia Fonseca
Padilha, Fernanda
Araujo
Baião, Kate
Revoredo
DBLP
CE2
CE3
An Adaptive System
for Optimal Matches
between Human Needs
and Offers
2012
CE3
An Algorithm for SWS
Matching Based on
Subsumption Relation
Defined in Domain
Ontology
2010
CE1
CE3
An algorithm to find
the largest adjacent
repeated pattern based
on Suffix Tree
2012
CE2
CE3
An extended event
matching approach in
content-based pub/sub
systems for EAI
2005
The paper presents a very general technique
to represent human needs and offers along
with a technology to find optimal matches.
Moreover, the system is able to learn from
its use by collecting user feedback and
changing its parameters accordingly. This
way, the system adjusts itself to the human
expectations and desires and even follows
the trend of these desires and expectations.
Semantic Web Services (SWS) is proposed
to ensure Web Service core missions
automation, nevertheless, a dedicated Web
Service discovery technology based on SWS
is desired currently. For this reason, we
propose an effective SWS matching
algorithm to achieve service discovery based
on semantics. In the paper, we first refine
core properties and requirements to apply
subsumption relation to involved SWS
matching method, which is based on the
semantic information of service's inputs and
outputs. Then, we discuss a feasible service
semantic matching algorithm in detail. Next,
we implement and test it in related SWS
registry. Finally, we point out its main
properties. In fact, the algorithm proves to
fully satisfy our expectations and be
practical and feasible.
This paper analyses the features of the
adjacent repeated patterns with Suffix Tree,
and proposes an algorithm based on Suffix
Tree through constructing Suffix Tree again
to find the largest adjacent repeated pattern.
The comparable and analyzable experiment
shows that this algorithm can find the largest
repeated patterns which are effective and
true.
Content-based publish/subscribe offers a
convenient abstraction for information
producers and consumers, supporting a
large-scale system design and evolution by
integrating several distributed independent
application systems. Unlike in the traditional
address-based unicast or multicast, its core
problem is how to match events by
predicates on the content of events. In
existing matching approaches, matching
predicates are composed by the conjunction
and disjunction of non-semantic constraints.
But, in context of enterprise application
integration, although they can match events
by their contents, this traditional matching
predicates are not expressive enough in
manipulating the complex event matching,
such as the "one-to-many" and "many-toone" matching. Therefore, traditional
matching approaches should be extended to
solve the complex matching problems. After
analyzing information matching patterns in
enterprise application integration, we
propose three matching models, extend this
simple matching approach to the multisemantic matching approach and further
introduce the temporal constraint variable.
The multi-semantic matching approach
allows using different operations in
accordance with different semantics; the
temporal constraint variable supports
processing several discrete events in
temporal sequences. Then, we extend OBDD
graphs into hierarchy coloured OBDD
graphs and prove the equivalence of the
transformation. Based on the extended
OBDD graphs, the composite matching
algorithm is presented and analysed. By
187
Tsuruta, S.;
Tsuruta, K.;
Takada, K.;
Sakurai, Y.;
Mizuno, Y.;
Kawabe, T.;
Knauf, R.
IEEE
Zhao Yun; Si
Huayou; Qi
Hengnian; Ni
Yulin
IEEE
Xu Yuan-Chun;
Tian Yuan; Zhang
Yi-Lai; Guo DeXian
IEEE
Gang Xu; Wei
Xu; Tao Huang
IEEE
experiments, we show the proposed
algorithm is efficient.
CI1
CE3
An observer designpattern detection
technique
2012
CE3
An ontological
approach to oracle
BPM
2012
CE3
An ontological
approach to support the
description of nursing
practice in Japan with
the ICNP
2007
The paper presents an approach for design
patterns recognition in legacy code by the
combination of static and dynamic analysis
techniques. The implement process has three
steps: static parser, SWRL rules and
dynamic validation. The static parser
translates the input source code into the
AST. The proteÌ•geÌ• tool defines
programming concepts with ontology model
and design pattern into SWRL rules, and
these SWRL rules are defined in OWL
format, and then the code instances are
constructed as OWL individuals and map to
the individuals of the program ontology
model. Finally, subsequent dynamic analysis
is employed to confirm or weaken the results
from static analysis. We discuss our
approach for the Observer design pattern on
a Java system.
A modern business process management
(BPM) operates using common tenants of an
underlying Service Oriented Architecture
(SOA) runtime infrastructure based on the
Service Component Architecture (SCA) and
supports the BPMN 2.0 OMG 1 standard.
Semantically-enabling all BPM artifacts,
from high-level design to deployment and
the runtime model of a BPM application,
promotes continuous process refinement,
comprehensive impact analysis, and reuse to
minimize process and service proliferation.
A semantic database can manage
semantically-enabled BPM ontologies and
models, enable machine-driven inference to
discover implicit relationships in the models,
and perform pattern-matching queries to find
associations. This paper presents an
ontology for BPM based upon BPMN 2.0,
Service Component Architecture (SCA) and
the Web Ontology Language (OWL 2) that
can support a wide range of use cases for
process analysis, governance, business
intelligence and systems management. It has
the potential to bring together stakeholders
across an enterprise, for a truly agile, end-toend enterprise architecture. © 2012
Springer-Verlag.
Background: With increasing
computerization of nursing records in Japan,
standardization of nursing terminology is
becoming imperative. Although some efforts
have been made to formalize description of
nursing practice in Japan with the
International Classification of Nursing
Practice (ICNP), lack of effective
description tools has impacted negatively on
the initiatives. Purpose: To develop and
evaluate an ontological approach that could
be used to facilitate the description of
nursing practice in Japan with the ICNP.
Methodology: An ontology-based support
system was developed using Protégé-2000,
mainly by the following three steps: (1)
representing a standard classification of
nursing practice (the Nursing Master) in
Japan
188
Wu Ren; Wenyun
Zhao
IEEE
Prater J., Mueller
R., Beauregard B.
Scopus
Jiang G., Sato H.,
Endoh A.,
Ogasawara K.,
Sakurai T.
Scopus
CE2
An Ontology-Based
Method for Similarity
Calculation of
Concepts in the
Semantic Web
2006
CE3
Analysing ontological
structures through
name pattern tracking
2008
CE3
AOCI: Ontology-based
pointcuts
2009
In the semantic Web, evaluating the
semantic similarity between concepts in a
same ontology is a central component of
techniques such as clustering, data-mining,
semantic sense disambiguation, ontology
translations, automatic database schema
matching, and simple object comparison.
Traditionally, the distance based approach
and the information content based approach
are the two major methods. In this paper, on
the basis of analyzing these previous
approaches, a new method based on
hierarchy information content and attribute
information content is provided and a
similarity calculating algorithm, HIC-AIC,
based on this theory is presented. In terms of
theoretical analysis and experiments, the
new approach obtains higher accuracy in
calculating the semantic similarity between
concepts
Concept naming over the taxonomic
structure is a useful indicator of the quality
of design as well as source of information
exploitable for various tasks such as
ontology refactoring and mapping. We
analysed collections of OWL ontologies
with the aim of determining the frequency of
several combined name&graph patterns
potentially indicating underlying semantic
structures. Such structures range from
simple set-theoretic subsumption to more
complex constructions such as parallel
taxonomies of different entity types. The
final goal is to help refactor legacy
ontologies as well as to ease automatic
alignment among different models. The
results show that in most ontologies there is
a significant number of occurrences of such
patterns. Moreover, their detection even
using very simple methods has precision
sufficient for a semi-automated analysis
scenario. © 2008 Springer-Verlag Berlin
Heidelberg.
In this paper, we propose ontology-based
pointcuts, a novel mechanism based on the
ideas of AOP, the separation of concerns and
system modularization, to enhance
components, thus making them more
adaptable and evolvable. The core idea of
ontologybased pointcuts is to specify
pointcuts in terms of ontological concepts
instead of patterns that are matched against
source code. Components are usually
considered as black boxes that can be
combined to a complex system using their
outer interfaces. In the context of our
infrastructure, components are extended by
exporting possible adaptation points, which
are enriched by ontological information.
This ontological metadata represents
concepts from a domain model, defined by a
domain expert. The ontology is implemented
within an intermediate layer that decouples
the matching pointcuts from the concrete
source level within the components. This
enables the application of AOP techniques
without detailed knowledge about the
component's internals, enabling dynamic and
distributed adaptation and reducing the
fragile pointcut problem to the component
scope. This paper presents the design and the
expressiveness of the ontology-based
pointcuts. We show several practical
examples how to use joinpoint model and
the pointcut specification followed by a
189
Guo-Hua Wang;
Ya-Dong Wang;
Mao-Zu Guo
IEEE
Svab-Zamazal O.,
Svatek V.
Scopus
Soldner G.,
Kapitza R.,
Schober S.
Scopus
short discussion. Copyright 2009 ACM.
CI1
CI2
CI3
CI4
CE3
APIs à gogo:
Automatic generation
of ontology APIs
2009
Approximate query
approach based on
ontology for multisource and
heterogeneous XML
data
2007
When developing application programming
interfaces of ontologies that include many
instances of ontology design patterns,
developers of semantic web applications
usually have to handle complex mappings
between descriptions of information given
by ontologies and object oriented
representations of the same information. In
current approaches, annotations on API
source code handle these mappings, leading
to problems with reuse and maintenance. We
propose a domain-specific language to tackle
these mappings in a platform independent
way - agogo. Agogo provides improvements
on software engineering quality attributes
like usability, reusability, maintainability,
and portability.
An ontology-based approach to effectively
process approximate query for multi-source
and heterogeneous XML data is proposed, in
which the traditional approximate XML
query strategy using tree pattern relaxation is
integrated with the idea of ontology-based
XML data integration. Firstly, a mapping
model (PTO) from document type definition
(DTD) structure to global schema is
constructed, then PTO is combined with
relaxation and scoring mechanism and a
novel algorithm-OAXQ is presented. Thus,
user query language based on global schema
becomes a simple subset of object query
language instead of Xpath expressions, and
relaxations are accomplished by a series of
conversion of mapping rules instead of
transform of query tree patterns.
Experiments of intelligent design of
automobile shape show that comparing with
SSO algorithm the query speed and
precision is increased by 20 times and 2%24% respectively by OAXQ.
190
Parreiras, F.S.;
Saathoff, C.;
Walter, T.; Franz,
T.; Staab, S.
IEEE
Tian L., Qin Z.,
Heng X., Shao L.
Scopus
CI1
CI2
CI3
CI4
Associative Artificial
Neural Network for
Discovery of Highly
Correlated Gene
Groups Based on Gene
Ontology and Gene
Expression
2007
CI1
CI2
CI3
CI4
AUTOMS-F: A
framework for the
synthesis of ontology
mapping methods
2009
Building Ontologies by
using Re-engineering
Patterns and R2RML
Mappings
2012
CE3
The advance of high-throughput
experimental technologies poses continuous
challenges to computational data analysis in
functional and comparative genomics
studies. Gene ontology (GO) annotation and
transcriptional profiling using gene
expression array have been two of the major
approaches for system-wide analysis of gene
functions and gene interactions. In the
literature, extensive studies have been
reported in each aspect. Yet there is a lack of
efficient algorithm that discover associative
patterns across these two data domains. We
proposed a mixture model associative
artificial neural network to tackle this
deficiency. The algorithm inherits the
theoretical foundation of adaptive resonance
associative map (ARAM), with essential
redefinition of pattern similarity measures
and learning functions. The proposed
algorithm is capable of clustering data based
on both GO semantic similarity and
expressional correlation, for the purpose of
systematically discovering genome-wide,
highly correlated gene groups, which in turn
suggest similar or closely related functions.
We applied the proposed algorithm to the
analysis of the Saccharomyces cerevisiae
(yeast) dataset and obtained satisfactory
results.
Effective information integration is still one
of today's emerging research goals. The
explosive growth of heterogeneous
information sources makes the task harder
and more challenging. Although ontologies
promise an effective solution towards
information management and coordination,
it would be a surprise if two independent
parties have constructed the same ontology
to manage information for the same domain.
Hence, to integrate information effectively,
ontology mapping methods are invaluable.
This paper presents the AUTOMS-F
framework, which aims to facilitate the
development of synthesized methods for the
efficient and effective automatic mapping of
ontologies. AUTOMS-F is highly extendable
and customizable, providing facilities for
supporting the rapid prototyping of
synthesized mapping methods, adapting
some well established programming design
patterns. The paper presents the AUTOMS
mapping method as an evaluated case of
AUTOMS-F's potential. © 2009 SpringerVerlag Berlin Heidelberg.
The ontologization of non-ontological
resources has led to the design of several
speci c methods, techniques and tools.
Among those techniques, we have the Reengineering Patterns. More speci cally, we
have the Patterns for re-engineering NORs
(PR-NOR) that de ne a procedure that
transforms the NOR terms into ontology
representational primitives. Currently, the
W3C RDB2RDF Working Group is at the
final stage of formalizing R2RML, a
language for describing mappings among
RDB elements and RDF. In this paper we
claim that it is possible to combine PRNORs with R2RML mappings for building
ontologies from relational database content,
i.e., transforming the database content into
an ontology schema by using Re-engineering
Patterns and R2RML mappings.
191
Ji He; Xinbin Dai;
Xuechun Zhao
IEEE
Valarakos A.G.,
Spiliopoulos V.,
Vouros G.A.
Scopus
Boris VillazónTerrazas, Freddy
Priyatna
DBLP
CE2
CE3
CAVEman:
Standardized
anatomical context for
biomedical data
mapping
2008
CE3
Component retrieval
based on ontology and
graph patterns
matching
2010
Correspondence
Patterns for Ontology
Alignment
2008
Data Integration in the
Life Sciences - 5th
InternationalWorkshop,
DILS 2008,
Proceedings
2008
The authors have created a software system
called the CAVEman, for the visual
integration and exploration of heterogeneous
anatomical and biomedical data. The
CAVEman can be applied for both education
and research tasks. The main component of
the system is a three-dimensional digital
atlas of the adult male human anatomy,
structured according to the nomenclature of
Terminologia Anatomica. The underlying
data-indexing mechanism uses standard
ontologies to map a range of biomedical data
types onto the atlas. The CAVEman system
is now used to visualize genetic processes in
the context of the human anatomy and to
facilitate visual exploration of the data.
Through the use of Java™ software, the
atlas-based system is portable to virtually
any computer environment, including
personal computers and workstations.
Existing Java tools for biomedical data
analysis have been incorporated into the
system. The affordability of virtual-reality
installations has increased dramatically over
the last several years. This creates new
opportunities for educational scenarios that
model important processes in a patient's
body, including gene expression patterns,
metabolic activity, the effects of
interventions such as drug treatments, and
eventually surgical simulations. © 2007
American Association of Anatomists.
Recently, the Component Based Software
Development has become the main direction
of software development, and with the
expansion of the component library, efficient
retrieval is crucial for us to improve the
software development, in which the trend is
semantic retrieval. The component concept
ontology model and component domain
ontology model this paper proposes, provide
common knowledge foundation for
component semantic retrieval. The users
retrieval content is regularized to normal
retrieval pattern, and then matched with
component domain ontology model in
accordance with matching algorithm, and the
matching results are components which meet
users need. The ontology models and
component retrieval algorithm based on
graph patterns matching, not only make up
for the lack of semantic expression, but also
enhance the retrieval efficiency. © 2010
Binary Information Press.
We introduce in this paper correspondence
patterns as templates to model ontology
alignments. Correspondence patterns capture
regularities recurring when aligning
ontologies. They come in complement of
ontology matching algorithms and graphical
mapping tools, and facilitate the task of the
engineer building the alignment between a
pair of ontologies. We develop an ontology
mediation framework based on three
ontology correspondence abstraction levels.
We particularly detail the most abstract
level: correspondence patterns.
topics discussed include: ontologies and data
integration in biomedicine: success stories
and challenging issues
192
Turinsky A.L.,
Fanea E., Trinh
Q., Wat S.,
Hallgrimsson B.,
Dong X., Shu X.,
Stromer J.N., Hill
J.W., Edwards C.,
Grosenick B.,
Yajima M.,
Sensen C.W.
Scopus
Yan W.,
Rousselot F.,
Zanni-Merk C.
Scopus
François
Scharffe, Dieter
Fensel
DBLP
[No author name
available]
Scopus
CE2
CE3
Describing generic
expertise models as
object-oriented analysis
patterns: The heuristic
multi-attribute decision
pattern
2002
CE2
CE3
Design Issues of
Semantic Service
Discovery for
Ubiquitous Computing
2007
CE2
CE3
Design Pattern for
Object Triple Mapping
2009
We report on work concerning the use of
object-oriented analysis and design (OAD)
methods in the development of artificial
intelligence (AI) software applications, in
which we compare such techniques to
software development methods more
commonly used in AI, in particular
CommonKADS. As a contribution to
clarifying the role of OAD methods in AI, in
this paper we compare the analysis models
of the object-oriented methods and the
CommonKADS high-level expertise model.
In particular, we study the correspondences
between generic tasks, methods and
ontologies in methodologies such as
CommonKADS and analysis patterns in
object-oriented analysis. Our aim in carrying
out this study is to explore to what extent, in
areas of AI where the object-oriented
paradigm may be the most adequate way of
conceiving applications, an analysis level
'pattern language' could play the role of the
libraries of generic knowledge models in the
more commonly used AI software
development methods. As a case study we
use the decision task - its importance arising
from its status as the basic task of the
intelligent agent - and the associated
heuristic multi-attribute decision method, for
which we derive a corresponding decision
pattern described in the unified modelling
language, a de facto standard in OAD.
Services in the ubiquitous computing are
heterogeneous in nature. To be pervasive,
these services should be defined in terms of
their functionality and capabilities rather
than the meaningless UUIDs or types of
services. Thus, clients can access the proper
service based on semantic requests. In this
paper, we study the demand of semantic
query in service discovery processes.
Current discovery protocols and the concept
of semantics are bringing together to
construct a framework to realize the
semantic service discovery for ubiquitous
computing. Many issues are discussed in
relation to service discovery topologies,
ontology languages, and semantic query
languages.
Up to now, developing software for the
Semantic Web is much more complex than
developing software for other data
representation paradigms, such as relational
databases. Software development for
relational databases is dramatically
simplified by so-called object-relational
mappers. Due to the conceptual difference
between relational databases and the
Semantic Web, the design patterns for
object-relational mapping cannot directly be
used for linked data. In this paper we show
how design patterns for object-relational
mapping can be used to achieve the more
complex object triple mapping, which will
make developing Semantic Web-enabled
software much easier.
193
Manjarres A.,
Pickin S.
Scopus
Reen-Cheng
Wang; YaoChung Chang;
Ruay-Shiung
Chang
IEEE
Quasthoff, M.;
Meinel, C.
IEEE
CE3
Design resource
application services
based on the semantic
web services
2006
Enterprise, BusinessProcess and
Information Systems
Modeling: 10th
International
Workshop, BPMDS
2009, and 14th
International
Conference, EMMSAD
2009
2009
Exploiting patterns in
ontology mapping
2007
CE2
CE3
Exploring alternatives
for representing and
accessing design
knowledge about
enterprise integration
2007
CE2
CE3
Exploring Semantic
Web Services Selection
Method with
Effectivity in
Collaborative
Environment
2007
CI1
CI2
CI3
CI4
Enterprise cooperation is an inevitable trend
for business development and how to
transfer and acquire knowledge quickly but
effectively is becoming a bottleneck
problem. To solve the problem, this paper
presents a design resource application
services pattern based on OWL-S. In this
paper design resources service categories are
constructed according to analyzing the
existence form and state of design
knowledge, basing on which the upper
ontology of OWL-S is extended and the
design resource application services are
semantically described. Then, the system
architecture of design resource application
services is constructed in which design
resource services can be discovered and
invoked dynamically by semantic matching
mechanism to satisfy the requirements that
enterprises quickly acquire and integrate
design resources. At last, this paper gives an
example of a document service to describe
implementation process of the design
resource application services.
topics discussed include: a conceptual
framework for business process redesign
Xing Y., Cheng
H., Sun J., Yuan
C.
Scopus
[No author name
available]
Scopus
Unsatisfactory performance of ontology
mapping methods on many tasks seems to
indicate the need for employing some
background knowledge. My PhD work
focuses on exploiting pattern-like structures
for this purpose. Design patterns are related
to different styles of modelling ontology
structure and/or naming of concepts. On the
other hand, mapping patterns emerge as
result of the mapping process. Preliminary
results and schedule of future work are
presented. © 2008 Springer-Verlag Berlin
Heidelberg.
Enterprise integration refers to solutions that
facilitate meaningful interactions among
heterogeneous legacy applications. The
scale, complexity and specificity of most
enterprise integration efforts mean that
design knowledge for enterprise integration
has resisted codification. Important
exceptions to this include: use of Business
Process Models (BPM) to understand
integration requirements
There are more and more Web services used
in collaborative design, hence it is becoming
important to locate proper Web services in
an accurate and efficient way. In our design,
we give an annexed algorithm to improve
the existing semantic-based matchmaking
algorithm which is focused on Web services
containing single input and output. The
annexed algorithm arranges the result
advertisements according to the clients'
convenience to execute the Web services,
specially it can efficiently deal with Web
services which have multiple inputs and
outputs. Moreover, we implemented the
matching method in semantic Web servicesbased application integration framework
(SWSAIF) which is used for collaborative
design.
Svab O.
Scopus
Umapathy K.,
Purao S.
Scopus
194
Daolin Du;
Qingzhong Li;
Tiangang Dong
IEEE
CE3
Extended models of
dynamic selection
using ontological
elements - Application
to design and image
analysis problems
2003
CE3
Flexible Wireless Trust
Through OntologyBased Mapping and Its
Attendant Semantic
Limitations
2009
Fully automatic
construction of
enterprise ontologies
using design patterns:
Initial method and first
experiences
2005
In this work, we present two practical
extensions about the integration of
knowledge elements into ontologies and the
dynamic selection of methods. First, we
propose a mechanism to integrate the
abstracted methods and other elements of the
knowledge model developed for the given
problem into an ontology, using them later
via a set of adapters or bridges. Second, as
we detected the recurrence of some complex
patterns of selection, we propose some
extensions of the basic selection mechanism,
in order to simplify the notation and the
treatment
Trusted interaction in a wireless
environment is highly challenging as
possibly interacting mobile entities are not
known to each other at design or deployment
time. This paper proposes an architecture,
and considers the inherent semantic
limitations, for intelligent trust establishment
and dynamic authentication and
authorization between mobile entities
previously unknown to each other, utilizing
ontology-based mapping at a common
certificate authority server. The proposed
solution can assist with mapping of
attributes on which to base trust decisions, in
a range of instances but there are also
inherent semantic limitations discussed later
in the paper.
The main contribution of this paper is an
initial method for automatically exploiting
ontology design patterns with the aim of
further automating the creation of enterprise
ontologies in small-scale application
contexts. The focus is so far on developing a
fully automated construction method,
thereby somewhat reducing the requirements
on ontology customization and level of
detail. In this paper we present an approach
how to use knowledge (patterns) from other
areas, like data modeling, knowledge reuse,
software analysis and software design, to
create ontology patterns. These design
patterns are then used within our method for
automatically matching and pruning them, in
accordance with information extracted from
existing knowledge sources within the
company in question. Though the method
still needs some fine-tuning, it has already
been used when creating an enterprise
ontology for a supplier-company within the
automotive industry. © Springer-Verlag
Berlin Heidelberg 2005.
195
Bienvenido J.F.,
Flores-Parra I.M.
Scopus
Robert
Steele, Kyongho
Min
DBLP
Blomqvist E.
Scopus
CE2
CE3
Fuzzy modeling of
metabolic maps in
MetNetDB
2004
CE3
Growing applications
and advancements in
microarray technology
and analysis tools
2005
CE3
How to reuse a faceted
classification and put it
on the semantic web
2010
Metabolic networks combine metabolism
and regulation. These complex networks are
difficult to understand and visualize due to
the diverse types of information that need to
be represented. FCModeler, a publicly
available software package is designed to
enable the biologist to visualize and model
metabolic and regulatory network maps in
plants. It links to an interactions database
(MetNetDB) containing information on
regulatory and metabolic interactions
derived from a combination of web
databases and input from biologists in their
area of expertise. FCModeler evaluates
hypotheses and provides a graph-theoretic
modeling framework for assessing the large
amounts of data captured by high-throughput
gene expression experiments. This leads to a
new method for classifying gene expression
data by combining network, gene ontology,
and measured expression information in a
fuzzy clustering framework.
In today's field of genomics, traditional
gene-by-gene approach is not adequate to
meet the demand of processing information
generated from mapping the complex
biology of the human genome. More global
views of analyzing the magnitude of
information are necessary, such as with
microarrays. Microarray technology today is
rapidly uncovering broad patterns of genetic
activity and showing insight into gene
functions, processes, and pathways. With the
growing technology, imminent knowledge is
being generated looking into transcriptional
processes and biological mechanisms from
many different organisms and phylogeny.
Many tools are being developed to assist
with the analysis of such high-throughput
data, many applications are being utilized by
this technology, and the field is growing and
expanding rapidly to accommodate the
expanding genomics era. © Copyright 2005
by Humana Press Inc. All rights of any
nature whatsoever reserved.
There are ontology domain concepts that can
be represented according to multiple
alternative classification criteria. Current
ontology modeling guidelines do not
explicitly consider this aspect in the
representation of such concepts. To assist
with this issue, we examined a domainspecific simplified model for facet analysis
used in Library Science. This model
produces a Faceted Classification Scheme
(FCS) which accounts for the multiple
alternative classification criteria of the
domain concept under scrutiny. A
comparative analysis between a FCS and the
Normalisation Ontology Design Pattern
(ODP) indicates the existence of key
similarities between the elements in the
generic structure of both knowledge
representation models. As a result, a
mapping is identified that allows to
transform a FCS into an OWL DL ontology
applying the Normalisation ODP. Our
contribution is illustrated with an existing
FCS example in the domain of Dishwashing
Detergent that benefits from the outcome of
this study. © 2010 Springer-Verlag.
196
Dickerson, J.A.;
Pan Du; Wurtele,
E.; Jie Li
IEEE
Peeters J.K., Van
Der Spek P.J.
Scopus
Rodriguez-Castro
B., Glaser H.,
Carr L.
Scopus
CE3
CE3
Hybrid pattern
matching for complex
ontology term
recognition
2012
ICSOFT 2007 Proceedings of the 2nd
International
Conference on
Software and Data
Technologies
Improving UML
profile design practices
by leveraging
conceptual domain
models
2007
2007
Ontology term recognition is a key task of
ontology-based text mining. Previous
approaches of statistical analysis and
syntactic pattern matching have such
limitations that they do not consider
relations between words and that their
handcrafted patterns are expensive and show
low coverage, respectively. These
limitations are critical especially when
dealing with long and complex ontology
terms. We propose a hybrid approach that
combines the two approaches sequentially: It
first uses syntactic pattern matching and,
when its results are partial due to lack of
required patterns, then completes them with
supplementary evidence from a statistical
method. Additionally, we present a novel
method that automatically learns syntactic
patterns from an annotated corpus. We tested
the proposed approach for the tasks of
recognizing Gene Ontology (GO) terms in
text and also of associating the GO terms
with proteins. When compared with existing
systems of statistical analysis and syntactic
pattern matching, it significantly improves
'relative' recall by 11%~13% and F-score by
7%.
topics discussed include: a language for
specifying informational graphics from first
principles
Jung-jae
Kim, Anh Tuan
Luu
DBLP
[No author name
available]
Scopus
The profile extension mechanism has
permitted a rapid growth of the use of UML
as a domain-specific modeling language.
However, designing profiles typically falls
into ad-hoc processes that often rely on
domain-inappropriate primitives. One of the
fundamental reasons is that profiles are
specified on the same level of abstraction as
the UML abstract syntax and consequently
they narrow down the design space to an
implementation level. In order to
improvethis situation, some profile designers
start from a conceptual domain model that
states the domain ontology, and only then
deal with finding out the profile extensions
to support it. In spite of this, building
truthfulness conceptual domain models and
maintaining traceable mapping with the
profile view is a bit of an art. In this paper,
we propose to systematize the design of
UML profiles built-upon conceptual domain
models, by adopting a minimal setof framing
rules. As these rules are defined on the basis
of regularly occurring design patterns,
domain models can be afterward checked for
self-consistency and interactively
transformed in stereotypes, tags and
constraints. Copyright 2007 ACM.
Lagarde F.,
Espinoza H.,
Terrier F., Gerard
S.
Scopus
197
CE3
Improving Web
Service Discovery by a
Functional and
Structural Approach
2011
CE3
Information reuse and
interoperability with
ontology patterns and
linked data - First
experiences from the
ExpertFinder project
2010
Service oriented Architecture (SOA) has
been widely used in service computing
applications and this fact has been
encouraged the publication over the Web in
a Web Service format. Whereas the number
of Web services published on the Web is
growing up, discovery techniques must be
improved so as to retrieve more desirable
services. Nowadays, the most commonly
used technique is semantic filters based on
ontological concepts. However, such
mechanisms can leave out some important
Web services of the matching process,
because of their structural relationship not
mentioned in an ontology. In order to
overcome such problems, some authors have
proposed a hybrid approach to combine
traditional syntactic and semantic
approaches. These proposals remain
restricted especially with respect to
complexity, precision and time of execution,
thus making such solutions in most of cases
unfeasible. In this paper, we combine
semantic filters based on functional
properties with a structural approach,
analyzing each neighbor relationship in an
ontology. The results showed a considerable
improvement in terms of performance and a
complexity reduction with respect to other
existing techniques. Furthermore, we
implement a tool called OWLS-S Discovery
in order to simplify the use of our approach
by developers.
Semantic web technologies show great
promise in usage scenarios that involve
information logistics. This paper is an
experience report on improving the semantic
web ontology underlying an application used
in expert finding. We use ontology design
patterns to find and correct poor design
choices, and align the application ontology
to commonly used semantic web ontologies
in order to increase the interoperability of
the ontology and application. Lessons
learned and problems faced are discussed,
and possible future developments of the
project mapped out. © 2010 Springer-Verlag
Berlin Heidelberg.
198
Amorim, R.;
Claro, D.B.;
Lopes, D.; Albers,
P.; Andrade, A.
Hammar K., Lin
F., Tarasov V.
IEEE
Scopus
CI1
CI2
CI3
CI4
CE2
Interleaving Ontology
Mapping for Online
Semantic Annotation
on Semantic Wiki
2008
Interoperating
ontologies of
organizational memory
through hybrid
unsupervised data
mining
2009
We have designed a system that
automatically annotates language resources
online by referring to the semantic
correspondences obtained from ontology
mapping methods. Every time user inputs a
term, triplets are created using a predefined
pattern-triplet mapping table. If an
unidentifiable term has been entered (i.e.,
triplets could not be created from it), the
system suggests alternative terms from a
thesaurus. An ontology mapping task is to
map the triplets into background ontologies,
efficiently producing a semantic wiki page
whose tag vocabularies are derived from the
ontologies. In practice, collaborative editing
is also available without leading to semantic
inconsistency between editors, by allowing
them to use their own background ontologies
and aligning these different background
ontologies.
Purpose: The purpose of this paper is to
present an automated ontology mapping and
merging algorithm, namely OntoDNA,
which employs data mining techniques
(FCA, SOM, K-means) to resolve
ontological heterogeneities among
distributed data sources in organizational
memory and subsequently generate a merged
ontology to facilitate resource retrieval from
distributed resources for organizational
decision making.
Design/methodology/approach: The
OntoDNA employs unsupervised data
mining techniques (FCA, SOM, K-means) to
resolve ontological heterogeneities to
integrate distributed data sources in
organizational memory. Unsupervised
methods are needed as an alternative in the
absence of prior knowledge for managing
this knowledge. Given two ontologies that
are to be merged as the input, the ontologies'
conceptual pattern is discovered using FCA.
Then, string normalizations are applied to
transform their attributes in the formal
context prior to lexical similarity mapping.
Mapping rules are applied to reconcile the
attributes. Subsequently, SOM and K-means
are applied for semantic similarity mapping
based on the conceptual pattern discovered
in the formal context to reduce the problem
size of the SOM clusters as validated by the
Davies-Bouldin index. The mapping rules
are then applied to discover semantic
similarity between ontological concepts in
the clusters and the ontological concepts of
the target ontology are updated to the source
ontology based on the merging rules.
Merged ontology in a concept lattice is
formed. Findings: In experimental
comparisons between PROMPT and
OntoDNA ontology mapping and merging
tool based on precision, recall and fmeasure, average mapping results for
OntoDNA is 95.97 percent compared to
PROMPT's 67.24 percent. In terms of recall,
OntoDNA outperforms PROMPT on all the
paired ontology except for one paired
ontology. For the merging of one paired
ontology, PROMPT fails to identify the
mapping elements. OntoDNA significantly
outperforms PROMPT due to the utilization
of FCA in the OntoDNA to capture
attributes and the inherent structural
relationships among concepts. Better
performance in OntoDNA is due to the
199
Jinhyun Ahn;
Jung, J.J.; KeySun Choi
Kiu C.-C., Lee C.S.
IEEE
Scopus
CI
CE3
Intersection-Based
Matchmaking for
Semantic Web Service
Discovery
2007
K-CAP'09 Proceedings of the 5th
International
Conference on
Knowledge Capture
Knowledge
Engineering: Practice
and Patterns: 16th
International
Conference, EKAW
2008, Proceedings
2009
2008
following reasons. First, semantic problems
such as synonymy and polysemy are
resolved prior to contextual clustering.
Second, unsupervised data mining
techniques (SOM and K-means) have
reduced problem size. Third, string matching
performs better than PROMPT's linguisticsimilarity matching in addressing semantic
heterogeneity, in context it also contributes
to the OntoDNA results. String matching
resolves concept names based on similarity
between concept names in each cluster for
ontology mapping. Linguistic-similarity
matching resolves concept names based on
concept-representation structure and
relations between concepts for ontology
mapping. Originality/value: The OntoDNA
automates ontology mapping and merging
without the need of any prior knowledge to
generate a merged ontology. String matching
is shown to perform better than linguisticsimilarity matching in resolving concept
names. The OntoDNA will be valuable for
organizations interested in merging
ontologies from distributed or different
organizational memories. For example, an
organization might want to merge their
organization-specific ontologies with
community standard ontologies. © Emerald
Group Publishing Limited.
For semantic Web service discovery,
matchmaking techniques are used to
compare descriptions of semantically
annotated services issued by service
requesters and providers. Such semantic
descriptions are typically expressed in
ontology languages to capture the
functionality of a service in a meaningful
and machine - interpretable way. Among
various other techniques proposed in the
literature, intersection-based matchmaking
rates two service descriptions as compatible
if they agree on some concrete instantiation
of service parameters. We report on an
intersection-based matchmaking framework
which we have applied to an industrial
logistics case study. We particularly focus
on the how-to of designing semantic service
descriptions, providing modelling guidelines
and patterns, an aspect that is often
neglected in matchmaking literature. By an
example from our logistics case study that
involves sophisticated ontology reasoning,
we show how some of the limitations of this
matching technique can be overcome by an
appropriate modelling.
topics discussed include: interactively
shaping agents via human reinforcement: the
TAMER framework
topics discussed include: computational
semantics and knowledge engineering
200
Grimm, S.
IEEE
[No author name
available]
Scopus
[No author name
available]
Scopus
CE3
Knowledge extraction
based on discourse
representation theory
and linguistic frames
2012
CE2
Large-scale ontologies:
pattern and partitionbased alignment
2011
CE2
CE3
Making a difference
through e-governance
from below: An
evaluation and future
directions
2008
We have implemented a novel approach for
robust ontology design from natural
language texts by combining Discourse
Representation Theory (DRT), linguistic
frame semantics, and ontology design
patterns. We show that DRT-based frame
detection is feasible by conducting a
comparative evaluation of our approach and
existing tools. Furthermore, we define a
mapping between DRT and RDF/OWL for
the production of quality linked data and
ontologies, and present FRED, an online tool
for converting text into internally wellconnected and linked-data-ready ontologies
in web-service-acceptable time. © 2012
Springer-Verlag.
Several ontologies covering the same
domain or overlapping domains have been
independently built of each others. They are
often a source of heterogeneity. In order to
make them interoperable, the semantic links
between their entities must be established.
This task is called ‘ontologies alignment’.
However, the proposed alignment methods
meet the challenge of ‘scaling up’. To take
up this challenge, we propose an alignment
method with partitioning. This method
consists of partitioning each ontology into
blocks around the anchors. In the alignment
step, each block of the first ontology is
aligned with one block of the second one.
The results obtained in the evaluation of our
method on selected ontologies show its
efficiency.
This paper discusses a process evaluation of
a project funded by an Australian Research
Council Linkage Project with the South
Australian Department of Health, Flinders
University, University of South Australia
and Neporendi Forum Inc, an Aboriginal
NGO. The co-researchers comprising
academics across a range of disciplines,
service users and providers address
wellbeing in terms of their lived experiences
of what works, why and how. The outcome
is the development of prototype software
that is co-owned by the partners and has
been tested out by the participants. The
process has taken knowledge management
beyond storage and retrieval of information
to include the perceptions and meanings of
the stakeholders. It has potential to enable
costing the pathways in social justice terms,
in order to make a case for participation both
as 'a means and an end' to support wellbeing
within particular contexts. The software can
be updated as it is used and it has the wider
potential to be applied in a range of
governance contexts. The use of meaningful
metaphors designed by the participants could
a) tailor the software to different user and
provider groups by b) enabling the
participants to collect data on their areas of
concern. User-centric design is based on
telling narratives and exploring perceived
ontologies or meanings. The next step is to
analyze the discourses for patterns
(Christakis and Bausch 2006 and Van Gigch
1991, 2003 on meta modelling). Making
sense of perceptions is through identification
of patterns and making meaning/sense of the
patterns based on weighting the choices. The
number of times particular themes were
raised or particular service choices made
equals a weighting. We used a pluralist
201
Presutti V.,
Draicchio F.,
Gangemi A.
Scopus
Soumaya
Kasri, Fouzia
Benchikha
DBLP
McIntyre-Mills J.
Scopus
approach and avoided a 'one size fits all'
approach by using a) participatory action
research and questioning, b) soft systems
mapping, c) critique informed by Critical
Systems Thinking and a Design of Inquiry
System and d) social cybernetics applied to
'if then' scenarios. The approach
demonstrates the ability of people to design
the content of the software and thus to
engage in participatory design, e-governance
and e-democracy which could be used to
extend democracy to the marginalized and
socially excluded. In the Australian context
these include Aboriginal Australians,
refugees and young people without the vote
who will have to live with the decisions in
the future. The current research is only with
Aboriginal stakeholders aged 18 and above
and it needs to be extended in the next phase
to include younger Australians. I will use
most of the presentation time to give a
practical demonstration of the software and
to discuss its potential application.
CE3
Matching Patient
Records to Clinical
Trials Using
Ontologies
2007
CE2
CE3
Model-based failure
management for
distributed reactive
systems
2007
This paper describes a large case study that
explores the applicability of ontology
reasoning to problems in the medical
domain. We investigate whether it is
possible to use such reasoning to automate
common clinical tasks that are currently
labor intensive and error prone, and focus
our case study on improving cohort selection
for clinical trials. An obstacle to automating
such clinical tasks is the need to bridge the
semantic gulf between raw patient data, such
as laboratory tests or specific medications,
and the way a clinician interprets this data.
Our key insight is that matching patients to
clinical trials can be formulated as a problem
of semantic retrieval. We describe the
technical challenges to building a realistic
case study, which include problems related
to scalability, the integration of large
ontologies, and dealing with noisy,
inconsistent data. Our solution is based on
the SNOMED CT® ontology, and scales to
one year of patient records (approx. 240,000
patients).
Failure management is key to the
development of safety-critical, distributed,
reactive systems common in such
applications as avionics, automotive, and
sensor/actuator networks. Specific
challenges to effective failure management
include (i) developing an understanding of
the application domain so as to define what
constitutes a failure
202
Chintan
Patel, James J.
Cimino, Julian
Dolby, Achille
Fokoue, Aditya
Kalyanpur, Aaron
Kershenbaum, Li
Ma, Edith
Schonberg, Kavith
a Srinivas
DBLP
Ermagan V.,
Kruger I.,
Menarini M.
Scopus
CI1
CE3
Modeling Requirement
Driven Architecture of
Adaptive Healthcare
System Based on
Semiotics
2009
CE3
Motor ontology in
representing gazeobject relations
2008
CE3
Natural language-based
approach for helping in
the reuse of ontology
design patterns
2008
In order to improve the quality of healthcare
services, the integrated large-scale medical
information system is needed to adapt to the
changing medical environment. In this
paper, we propose a requirement driven
architecture of healthcare information
system with hierarchical architecture. The
system operates through the mapping
mechanism between these layers and thus
can organize functions dynamically adapting
to user's requirement. Furthermore, we
introduce the organizational semiotics
methods to capture and analyze user's
requirement through ontology chart and
norms. Based on these results, the structure
of user's requirement pattern(URP) is
established as the driven factor of our
system. Our research makes a contribution to
design architecture of healthcare system
which can adapt to the changing medical
environment.
Event-related functional magnetic resonance
imaging (fMRI) was used to explore how the
human brain models gaze-object relations.
During scanning participants observed a
human model gazing towards or away a
target object presented either in isolation or
flanked by a distractor object. In two further
conditions the model's gaze was shifted and
subsequently maintained away from the
stimulus/i. These four conditions were
implemented within a factorial design in
which the main factors were type of
observed behavior (gaze vs. gaze-away) and
context (target alone vs. target flanked by a
distractor). Results revealed that premotor,
parietal and temporal areas, known to subserve the understanding of other people
actions, were significantly more activated by
the observation of the model gazing towards
rather than away from the stimulus/i. In
addition, a significant interaction indicated
that, when the target was presented in
isolation, neural activity within the inferior
frontal gyrus, another key area for action
understanding, was influenced by gazeobject relations. Our findings suggest that
this area is important for the establishment
of intentional gaze-object relations and
indicate that the presence of a distractor
interferes with the representation of such
relations. © 2007 Elsevier Ireland Ltd. All
rights reserved.
Experiments in the reuse of Ontology
Design Patterns (ODPs) have revealed that
users with different levels of expertise in
ontology modelling face difficulties when
reusing ODPs. With the aim of tackling this
problem we propose a method and a tool for
supporting a semi-automatic reuse of ODPs
that takes as input formulations in natural
language (NL) of the domain aspect to be
modelled, and obtains as output a set of
ODPs for solving the initial ontological
needs. The correspondence between ODPs
and NL formulations is done through
Lexico-Syntactic Patterns, linguistic
constructs that convey the semantic relations
present in ODPs, and which constitute the
main contribution of this paper. The main
benefit of the proposed approach is the use
of non-restricted NL formulations in various
languages for obtaining ODPs. The use of
full NL poses challenges in the
disambiguation of linguistic expressions that
203
Yang Hongqiao;
Li Weizi
IEEE
Pierno A.C.,
Becchio C.,
Tubaldi F.,
Turella L.,
Castiello U.
Scopus
De Cea G.A.,
Gomez-Perez A.,
Montiel-Ponsoda
E., SuarezFigueroa M.C.
Scopus
we expect to solve with user interaction,
among other strategies. © 2008 SpringerVerlag Berlin Heidelberg.
CE2
CE3
CI1
CI2
CI3
CI4
On-site task assistant
pattern based on
wearable computing
2007
Ontology alignment
design patterns
2013
Traditional on-site task assistant pattern can't
satisfy the dynamic and complex
information requirement of mobile
technicians. To tackle this problem,
wearable computer and wireless sensor were
introduced to the maintenance task site.
Firstly, a special wearable computing system
and an on-site task assistant pattern based on
wearable computing was introduced.
Secondly, implementation challenges of
application structure constructing for this
pattern were analyzed. Thirdly, for some key
methods, the methods of extended Petri net
and domain ontology design were proposed
which was used to describe application
function module. The domain structure
analysis and Petri net mapping were put
forward to generate layered colored Petri
net. Assistant construction process of
application structure based on ontology
reasoning and transitions substitution was
also realized. Finally, the application
instance and analysis were also discussed.
Interoperability between heterogeneous
ontological descriptions can be performed
through ontology mediation techniques. At
the heart of ontology mediation lies the
alignment: a specification of
correspondences between ontology entities.
Ontology matching can bring some
automation but are limited to finding simple
correspondences. Design patterns have
proven themselves useful to capture
experience in design problems. In this
article, we introduce ontology alignment
patterns as reusable templates of recurring
correspondences. Based on a detailed
analysis of frequent ontology mismatches,
we develop a library of common patterns.
Ontology alignment patterns can be used to
refine correspondences, either by the
alignment designer or via pattern detection
algorithms. We distinguish three levels of
abstraction for ontology alignment
representation, going from executable
transformation rules, to concrete
correspondences between two ontologies, to
ontology alignment patterns at the third
level. We express patterns using an ontology
alignment representation language, making
them ready to use in practical mediation
tasks. We extract mismatches from
vocabularies associated with data sets
204
Xiahou S.-J.,
Chen D.-Y.,
Huang Z.-Q.
Scopus
Scharffe F.,
Zamazal O.,
Fensel D.
Scopus
published as linked open data, and we
evaluate the ability of correspondence
patterns to provide proper alignments for
these mismatches. Finally, we describe an
application of ontology alignment patterns
for an ontology transformation service.
CE3
Ontology based design
for similarity discovery
in SYMBAD project
2006
CE3
Ontology based
semantic mapping
architecture
2005
The SYMBAD (Similarity Based Agents for
Design) system is a project developed to aid
Architectural design team members to share
knowledge used in Stand design. Stands play
important role in promoting a Company
image, projects its presence and emphasizes
the corporate identity in events and Fairs.
The processes and problems in stand
projects are quite common and can be easily
found in other design situations. From
conceptual design to the construction of a
final product, a stand project passes through
many hands, each one adding bits and pieces
until it is completed. The physical distance,
difficulties in communication and cultural
aspects make designers interact less than
necessary, generating problems in all phases
of the design activities. The SYMBAD
project uses an Ontology based framework
to improve process awareness in a Design
activity. Based on the knowledge kept from
previous projects and Similarity aspects,
agents can identify possibilities for reuse and
provide information to help the design team
to built new Stands using past materials and
ideas. Through a constructed Ontology and
collaborative features agents can produce
global awareness, to facilitate later steps and
optimize the process as a whole. In this
paper we present some of the functions and
architecture aspects, as well as some of the
implementations choices made for this
project. © 2006 IEEE.
Integrating with ontology and XML schema,
taking advantage of Web service, this paper
develops a service oriented information
representation architecture & SOIRA to
solve the semantic heterogeneity of
distributed and semi-structured information.
It introduces a mediated semantic schema
originating from ontology to XML schema,
discusses the multi-matching strategy
between the mediated schema and source
schemas. The implementation of SOIRA
with two kinds of semantic representation
services are presented at the end of this
paper, which enable interoperability,
translation of information, and queries
across the representations as well.
205
Pinho D.,
Vivacqua A.S.,
Medeiros S., De
Souza J.M.
Scopus
Lin Zhang; JinGuang Gu
IEEE
CE3
CE2
Ontology driven design
of EMF metamodels
and well-formedness
constraints
2012
Ontology Fusion with
Complex Mapping
Patterns
2006
Ontology Matching
Using Weighted
Graphs
2007
Ontologies provide high-level means for
capturing requirements of systems with
precise semantics and automated meta-level
reasoning techniques to identify
specification flaws early in the design even
if certain parts of the system is
underspecified. Domain-specific modeling
environments effectively support domain
engineers for designing the system by
providing efficient means for instance-level
validation of well-formedness constraints. In
the current paper, we aim at a combined use
of ontologies and DSM techniques where
domain requirements captured in textual
ontology languages like OWL2/SWRL will
drive the development of a DSM
environment. More specifically, we provide
(i) an automated mapping from OWL2
ontologies to metamodels defined by the
industry-standard EMF platform, which is
extended by a (ii) mapping of requirements
and constraints (captured in OWL2 and
SWRL) into a textual graph pattern language
efficiently evaluated by the EMF-IncQuery
incremental model query technology. ©
2012 ACM.
Ontology mapping plays a key role in
information integration systems. This paper
discusses the patterns of complex ontology
mapping. It proposes the definition and
properties of ontology mappings, and
discusses the procedure and algorithm of
ontology fusion with complex ontology
mapping.
In this paper, we present a new way towards
ontology matching. Using the graph
representation for ontologies and schemas
we proceed to calculate the weights for each
node of the graph using the lexical similarity
of the ancestors. With the guiding intuition
that, if the parent nodes match then their
children are likely to match as well. This
simple observation helps on to build a fast
and efficient algorithm for matching
different graphs (which represent ontology
or schema). Since the algorithm is very fast
it can be used as a quickly and dirty method
to do initial matching of a large dataset and
then drill down to the exact match with other
algorithms. The algorithm is not dependent
on the method used for calculating the
lexical similarity so the best lexical analysis
can be used to derive the weights. Once the
weights are in place we can calculate the
matching in just a single traversal of the
graphs. No other algorithm that we know of
can give such fast response time.
206
Izso B., Szatmari
Z., Bergmann G.,
Horvath A., Rath
I., Varro D.
Scopus
Jinguang Gu, Yi
Zhou
DBLP
Sharma, A.
IEEE
CI1
CE3
Ontology patterns for
complex topographic
feature types
2011
CE3
Ontology-based pattern
generator and root
semantic analyser for
spoken dialogue
systems
2012
CE3
Ontology-driven
mapping of temporal
data in biomedical
databases.
2006
Abstract Complex feature types are defined
as integrated relations between basic features
for a shared meaning or concept. The shared
semantic concept is difficult to define in
commonly used geographic information
systems (GIS) and remote sensing
technologies. The role of spatial relations
between complex feature parts was
recognized in early GIS literature, but had
limited representation in the feature or
coverage data models of GIS. Spatial
relations are more explicitly specified in
semantic technology. In this paper,
semantics for topographic feature ontology
design patterns (ODP) are developed as data
models for the representation of complex
features. In the context of topographic
processes, component assemblages are
supported by resource systems and are found
on local landscapes. The topographic
ontology is organized across six thematic
modules that can account for basic feature
types, resource systems, and landscape
types. Types of complex feature attributes
include location, generative processes and
physical description. Node/edge networks
model standard spatial relations and relations
specific to topographic science to represent
complex features. To demonstrate these
concepts, data from The National Map of the
U.S. Geological Survey was converted and
assembled into ODP.
This paper presents improvements in a
dialogue interpreter sub-system for an
application that allows the user to interact by
speech with a Radio-Frequency
IDentification (RFID) network working in a
highly noisy environment. A new dialog
framework is proposed in order to give the
human operators the ability to communicate
with the system in a more natural fashion.
This is achieved by the implementation of
the Artificial Intelligence Markup Language
combined with an ontology-based pattern
generation and root semantical analysis
algorithms, which allows the system to
respond to close-to natural language queries
by means of pattern matching.
Biomedical databases contain considerable
amounts of time-oriented data, which are not
typically in a format suitable for querying
complex temporal patterns. We address this
problem in implementing Synchronus, a tool
for ontology-driven mapping of data from an
existing relational database to a database
schema with a uniform temporal
representation. We discuss the design of
Synchronus, which consists of a schemamapping ontology and a data-mapping
algorithm that together provide general
capabilities for database transformation.
207
Varanka D.E.
Scopus
Benahmed, Y.;
Selouani, S.;
O'Shaughnessy,
D.
IEEE
Narayanan P.S.,
O'Connor M.J.,
Das A.K.
Scopus
CE3
OpenDMAP: An open
source, ontologydriven concept analysis
engine, with
applications to
capturing knowledge
regarding protein
transport, protein
interactions and celltype-specific gene
expression
2008
CE3
OpenFlyData: An
exemplar data web
integrating gene
expression data on the
fruit fly Drosophila
melanogaster
2010
Background: Information extraction (IE)
efforts are widely acknowledged to be
important in harnessing the rapid advance of
biomedical knowledge, particularly in areas
where important factual information is
published in a diverse literature. Here we
report on the design, implementation and
several evaluations of OpenDMAP, an
ontology-driven, integrated concept analysis
system. It significantly advances the state of
the art in information extraction by
leveraging knowledge in ontological
resources, integrating diverse text processing
applications, and using an expanded pattern
language that allows the mixing of syntactic
and semantic elements and variable
ordering. Results: OpenDMAP information
extraction systems were produced for
extracting protein transport assertions
(transport), protein-protein interaction
assertions (interaction) and assertions that a
gene is expressed in a cell type (expression).
Evaluations were performed on each system,
resulting in F-scores ranging from .26 - .72
(precision .39 - .85, recall .16 - .85).
Additionally, each of these systems was run
over all abstracts in MEDLINE, producing a
total of 72,460 transport instances, 265,795
interaction instances and 176,153 expression
instances. Conclusion: OpenDMAP
advances the performance standards for
extracting protein-protein interaction
predications from the full texts of
biomedical research articles. Furthermore,
this level of performance appears to
generalize to other information extraction
tasks, including extracting information about
predicates of more than two arguments. The
output of the information extraction system
is always constructed from elements of an
ontology, ensuring that the knowledge
representation is grounded with respect to a
carefully constructed model of reality. The
results of these efforts can be used to
increase the efficiency of manual curation
efforts and to provide additional features in
systems that integrate multiple sources for
information extraction. The open source
OpenDMAP code library is freely available
at http://bionlp.sourceforge.net/. © 2008
Hunter et al
Motivation: Integrating heterogeneous data
across distributed sources is a major
requirement for in silico bioinformatics
supporting translational research. For
example, genome-scale data on patterns of
gene expression in the fruit fly Drosophila
melanogaster are widely used in functional
genomic studies in many organisms to
inform candidate gene selection and validate
experimental results. However, current data
integration solutions tend to be heavy
weight, and require significant initial and
ongoing investment of effort. Development
of a common Web-based data integration
infrastructure (a.k.a. data web), using
Semantic Web standards, promises to
alleviate these difficulties, but little is known
about the feasibility, costs, risks or practical
means of migrating to such an infrastructure.
Results: We describe the development of
OpenFlyData, a proof-of-concept system
integrating gene expression data on D.
melanogaster, combining Semantic Web
standards with light-weight approaches to
208
Hunter L., Lu Z.,
Firby J.,
Baumgartner Jr.
W.A., Johnson
H.L., Ogren P.V.,
Cohen K.B.
Scopus
Miles A., Zhao J.,
Klyne G., WhiteCooper H.,
Shotton D.
Scopus
Web programming based on Web 2.0 design
patterns. To support researchers designing
and validating functional genomic studies,
OpenFlyData includes user-facing search
applications providing intuitive access to and
comparison of gene expression data from
FlyAtlas, the BDGP in situ database, and
FlyTED, using data from FlyBase to expand
and disambiguate gene names.
OpenFlyData's services are also openly
accessible, and are available for reuse by
other bioinformaticians and application
developers. Semi-automated methods and
tools were developed to support labour- and
knowledge-intensive tasks involved in
deploying SPARQL services. These include
methods for generating ontologies and
relational-to-RDF mappings for relational
databases, which we illustrate using the
FlyBase Chado database schema
CE3
CE2
CE3
OWL-S based service
composition of threedimensional geometry
modeling
2012
Pacific Symposium on
Biocomputing 2009,
PSB 2009
2009
Pattern Recognition
with Spatial Data
Mining in Web: An
Infrastructure to
Engineering of the
Urban Cadaster
2011
This paper proposes an OWL-S framework
for distributed CAD system based on the
combination of semantic web service and
CAD technology. Service ontology mapping
mechanism is analyzed in detail and
semantic model is built with the study of the
correlation across the geometry modeling
service. On the purpose of accommodating
the design pattern of network modeling, this
framework supports the service composition
of threedimensional geometry modeling
and achieves further integration of service
information. At last, a case study from the
developed prototype system shows the
feasibility and flexibility of this method
under distributed CAD environment. © 2012
Academy Publisher.
topics discussed include: stochastic transient
analysis of biochemical systems and its
application to the design of biochemical
logic gates
In recent times are constant the problems of
interoperability of data, mainly due to the
constant emergence of different structures
CAD/GIS (Computer Aided
Design/Geographic Information Systems)
produced by engineers, managers and other
professionals through the fast development
of collaborative technologies on the web.
However, structures are also detected for
manipulating objects that determine the
cognitive domain of a problem, especially in
the construction of urban or rural properties
and land management. To this end, the study
presents an investigation into the relevant
aspects that influence in projects of
engineering. It also investigates the demands
for detecting predefined structures for agile
actions and the exchange of experiences.
Identifying factors critical to development
and assisting in the recognition of
integration structures. During the discussion
are also presented the results extracted with
the framework, providing web mapping
applications through the implementation of
collaborative strategies and combining the
main techniques used in geographical data
mining. Finally, the article discusses priority
issues in the implementation of spatial data
mining and the advancement of civil
engineering technology for knowledge
management.
209
Yu J., Cai H., Bu
F., Liu A.
Scopus
[No author name
available]
Scopus
de Moraes, A.F.;
Bastos, L.C.
IEEE
CE2
Pattern-based core
word recognition to
support ontology
matching
2013
CE3
PeptideMine - A
webserver for the
design of peptides for
protein-peptide binding
studies derived from
protein-protein
interactomes
2010
Ontology matching is a crucial issue in the
domain of semantic web and data
interoperability. In this paper, a core word
based method for measuring similarity from
the semantic level of ontology entities is
described. In ontology, most labels of
entities are compound words rather than
single meaningful words. However, the main
meaning is represented usually by one word
of them, which is called core word. The core
word is learned by investigating certain
patterns, which are defined based on part of
speech (POS) and linguistics knowledge.
The other information is noted as
complementary information. An algorithm is
given to measure the similarity between a
pair of compound words and short texts. In
order to support diverse situation, especially
when core words cannot be recognized, non
semantic based ontology matching
techniques are applied from lexical and
structural level of ontology. The described
method is tested on real ontology and
benchmarking data sets. It showed good
matching ability and obtained promising
results.
Background: Signal transduction events
often involve transient, yet specific,
interactions between structurally conserved
protein domains and polypeptide sequences
in target proteins. The identification and
validation of these associating domains is
crucial to understand signal transduction
pathways that modulate different cellular or
developmental processes. Bioinformatics
strategies to extract and integrate
information from diverse sources have been
shown to facilitate the experimental design
to understand complex biological events.
These methods, primarily based on
information from high-throughput
experiments, have also led to the
identification of new connections thus
providing hypothetical models for cellular
events. Such models, in turn, provide a
framework for directing experimental efforts
for validating the predicted molecular
rationale for complex cellular processes. In
this context, it is envisaged that the rational
design of peptides for protein-peptide
binding studies could substantially facilitate
the experimental strategies to evaluate a
predicted interaction. This rational design
procedure involves the integration of
protein-protein interaction data, gene
ontology, physico-chemical calculations,
domain-domain interaction data and
information on functional sites or critical
residues.Results: Here we describe an
integrated approach called PeptideMine for
the identification of peptides based on
specific functional patterns present in the
sequence of an interacting protein. This
approach based on sequence searches in the
interacting sequence space has been
developed into a webserver, which can be
used for the identification and analysis of
peptides, peptide homologues or functional
patterns from the interacting sequence space
of a protein. To further facilitate
experimental validation, the PeptideMine
webserver also provides a list of physicochemical parameters corresponding to the
peptide to determine the feasibility of using
the peptide for in vitro biochemical or
210
Fuqi
Song, Gregory
Zacharewicz, Dav
id Chen
DBLP
Shameer K.,
Madan L.L.,
Veeranna S.,
Gopal B.,
Sowdhamini R.
Scopus
biophysical studies.Conclusions: The
strategy described here involves the
integration of data and tools to identify
potential interacting partners for a protein
and design criteria for peptides based on
desired biochemical properties. Alongside
the search for interacting protein sequences
using three different search programs, the
server also provides the biochemical
characteristics of candidate peptides to prune
peptide sequences based on features that are
most suited for a given experiment. The
PeptideMine server is available at the URL:
http://caps.ncbs.res.in/peptidemine. © 2010
Khader et al
CE3
CE1
CE2
CE3
Predicting gene
ontology functions
from protein's regional
surface structures
2007
Proceedings of 6th
Asia-Pacific
Bioinformatics
Conference, APBC
2008
Proceedings of the
2010 IEEE
International
Conference on
Progress in Informatics
and Computing, PIC
2008
2010
Background: Annotation of protein functions
is an important task in the post-genomic era.
Most early approaches for this task exploit
only the sequence or global structure
information. However, protein surfaces are
believed to be crucial to protein functions
because they are the main interfaces to
facilitate biological interactions. Recently,
several databases related to structural
surfaces, such as pockets and cavities, have
been constructed with a comprehensive
library of identified surface structures. For
example, CASTp provides identification and
measurements of surface accessible pockets
as well as interior inaccessible cavities.
Results: A novel method was proposed to
predict the Gene Ontology (GO) functions of
proteins from the pocket similarity network,
which is constructed according to the
structure similarities of pockets. The
statistics of the networks were presented to
explore the relationship between the similar
pockets and GO functions of proteins. Crossvalidation experiments were conducted to
evaluate the performance of the proposed
method. Results and codes are available at:
http://zhangroup.aporc.org/bioinfo/PSN/.
Conclusion: The computational results
demonstrate that the proposed method based
on the pocket similarity network is effective
and efficient for predicting GO functions of
proteins in terms of both computational
complexity and prediction accuracy. The
proposed method revealed strong
relationship between small surface patterns
(or pockets) and GO functions, which can be
further used to identify active sites or
functional motifs. The high quality
performance of the prediction method
together with the statistics also indicates that
pockets play essential roles in biological
interactions or the GO functions. Moreover,
in addition to pockets, the proposed network
framework can also be used for adopting
other protein spatial surface patterns to
predict the protein functions. © 2007 Liu et
al
topics discussed include: string kernels with
feature selection for SVM protein
classification
Liu Z.-P., Wu L.Y., Wang Y.,
Chen L., Zhang
X.-S.
Scopus
[No author name
available]
Scopus
topics discussed include: a simple robot
paths planning based on Quadtree
[No author name
available]
Scopus
211
2010
CE1
CE2
CE3
Proceedings of the 6th
International Workshop
on Ontology Matching,
OM-2011 - In
Conjunction with the
International Semantic
Web Conference,
ISWC 2011
2011
topics discussed include: AROMA results
for OAEI 2011
[No author name
available]
Scopus
CE3
Product ontology
screening and its
application in variant
design
2010
Yan C.-P., Zhou
Q.-H., Fan H.-X.,
Liu F.
Scopus
CE3
Providing universal
accessibility using
connecting ontologies:
A holistic approach
2007
Karim S., Latif
K., Tjoa A.M.
Scopus
CE3
Research of semantic
Web service discovery
in heterogeneous
environment
2011
A product ontology screening method which
can be used in variant design is proposed.
With the support of complete ontology view
of product resources, the product functional
requirement and structural characteristics are
converted to demand constraints, which are
used to screen product ontology. For
different screening hierarchies and objects,
different screening rules such as pattern
matching, case matching combined with
manual decision and auto matching on the
basis of case-based reasoning are adopted.
The semi-automatic screening method with
human-computer cooperation has impressive
effectiveness on the improvements of the
accuracy of design schemes and the
flexibility and efficiency of design process.
Finally, a variant design supporting system
for building door and window is developed,
which proves the feasibility and
effectiveness of the method.
Accessibility implementation efforts are
generally focused towards some typical user
impairments and a few interaction devices
for a particular user scenario. Whereas there
are numerous factors in the prevalent context
which can leverage the overall accessibility
to its full potential, only if those are
orchestrated together. In absence of a
common and unifying approach the industry
has little choice in abstaining from legacy
and is therefore not very successful in
producing universally accessible software.
Exploiting enabling technology of Semantic
Web, we present an approach by developing
Connecting Ontologies for these different
factors. Exemplars are developed to show its
correctness and practicability. © SpringerVerlag Berlin Heidelberg 2007.
When semantic Web service composition
involved in heterogeneous environment,
Web service discovery was a key technology
to users' needs. This paper stands on the
application background of mine information
query system, based on the best matching
bipartite graph, a Web service differentiation
discovery algorithm was proposed in this
paper, and performed semantic matching of
different services by computing different
Web services parameters in heterogeneous
environments, and a classification algorithm
instance was discussed too.
212
Xianmin Wei
IEEE
CE3
Research on concept
semantic similarity
computation based on
ontology
2011
CE3
Research on
knowledge model for
ontology-based
knowledge base
2011
CE3
Reservoir simulation
and modeling based on
artificial intelligence
and data mining
(AI&DM)
2011
The current concept semantic similarity
calculation based on ontology does not take
full advantage of the concept semantic
information. In this paper we will present a
new concept semantic similarity algorithm
deviding the concept similarity into two
parts: one is concept name similarity
calculation, concept name degree and
concept name edit distance calculation. The
other is concept property similarity
calculation, concept object property and data
property calculation. Thus we obtain the
actual similarity of the ontology concept
according to an integrated analysis. The
experimental results indicate that, compared
with other similarity algorithms, this method
can make full use of concept semantic
information, and can obtain a better match
result.
The robust knowledge base needs a
reasonable design pattern to represent
knowledge model. On the foundation of the
research about relationship of knowledge
model with knowledge ontology, the
knowledge model defined by three
categories of domain knowledge, reasoning
knowledge and task knowledge is set up.
Furthermore, the matching relationship
mechanism of knowledge model with
knowledge base is put forward. At last,
according to design pattern of knowledge
model, the example of knowledge base for
project risk management based on ontology
is implemented. © 2011 IEEE.
In this paper a new class of reservoir models
that are developed based on the pattern
recognition technologies collectively known
as Artificial Intelligence and Data Mining
(AI&DM) is introduced. The workflows
developed based on this new class of
reservoir simulation and modeling tools
break new ground in modeling fluid flow
through porous media by providing a
completely new and different angle on
reservoir simulation and modeling. The
philosophy behind this modeling approach
and its major commonalities and differences
with numerical and analytical models are
explored and two different categories of
such models are explained. Details of this
technology are presented using examples of
most recent applications to several prolific
reservoirs in the Middle East and in the Gulf
of Mexico.AI-based Reservoir Models can
be developed for green or brown fields.
Since these models are developed based on
spatio-temporal databases that are
specifically developed for this purpose, they
require the existence of a basic numerical
reservoir simulator for the green fields while
can be developed entirely based on historical
data for brown fields. The run-time of AIbased Reservoir Models that provide
complete field responses is measured in
seconds rather than hours and days (even for
a multi-million grid block reservoir).
Therefore, providing means for fast track
reservoir analysis and AI-assisted history
matching are intrinsic characteristics of these
models. AI-based Reservoir Models can, in
some cases, completely substitute numerical
reservoir simulation models, work side by
side but completely independent or be
integrated with them in order to increase
their productivity.Advantages associated
213
Wen Yu; Gao
Chun-ming; Pan
Hua-wei
IEEE
Hao C.
Scopus
Mohaghegh S.D.
Scopus
with AI-based Reservoir Models are short
development time, low development cost,
fast track analysis and practical capability to
quantify the uncertainties associated with the
static model. AI-based Reservoir Model
includes a novel design tool for
comprehensive analysis of the full field and
design of field development strategies to
meet operational targets. They have open
data requirement architecture that can
accommodate a wide variety of data from
pressure tests to seismic. © 2011 Elsevier
B.V.
CE1
CE2
CE3
Review of QSAR
models for Enzyme
classes of drug targets:
Theoretical background
and applications in
parasites, hosts and
other organisms
2010
CE3
Semantic mapping:
ontology-based vs.
model-based approach
Alternative or
complementary
approaches?
2006
The number of protein 3D structures without
function annotation in Protein Data Bank
(PDB) has been steadily increased. Many of
these proteins are relevant for
Pharmaceutical Design because they may be
enzymes of different classes that could
become drug targets. This fact has led in turn
to an increment of demand for theoretical
models to give a quick characterization of
these proteins. In this work, we present a
review and discussion of Alignment-Free
Methods (AFMs) for fast prediction of the
Enzyme Classification (EC) number from
structural patterns. We referred to both
methods based on linear techniques such as
Linear Discriminant Analysis (LDA) and/or
non-linear models like Artificial Neural
Networks (ANN) or Support Vector
Machine (SVM) in order to compare linear
vs. nonlinear classifiers. We also detected
which of these models have been
implemented as Web Servers free to the
public and compiled a list of some of these
websites. For instance, we reviewed the
servers implemented at portal Bio-AIMS
(http://miaja.tic.udc.es/BioAIMS/EnzClassPred.php) and the server
EzyPred
(http://www.csbio.sjtu.edu.cn/bioinf/EzyPre
d/). © 2010 Bentham Science Publishers
Ltd.
Model transformation and semantic mapping
are enabling technologies for new, advanced
solutions to address enterprise software
interoperability. Such technlogies are
nowdays tackled by two different
disciplines: software architectures, with the
MDA approach, and semantic
interoperability, with an ontology-based
approach. This paper briefly compares the
model-based (MB) and the ontology-based
(OB) approaches and draws some
preliminary conclusions on similarities and
differences, in the perspective of combining
these approaches in a value-adding way.
214
Concu R., Podda
G., Ubeira F.M.,
Gonzalez-Diaz H.
Scopus
K.
Arnarsdóttir, Arne
-Jørgen
Berre, Axel
Hahn, Michele
Missikoff, Frances
co Taglino
DBLP
CE3
Sequencing and
analysis of the generich space of cowpea
2008
Background: Cowpea, Vigna unguiculata
(L.) Walp., is one of the most important food
and forage legumes in the semi-arid tropics
because of its drought tolerance and ability
to grow on poor quality soils. Approximately
80% of cowpea production takes place in the
dry savannahs of tropical West and Central
Africa, mostly by poor subsistence farmers.
Despite its economic and social importance
in the developing world, cowpea remains to
a large extent an underexploited crop.
Among the major goals of cowpea breeding
and improvement programs is the stacking
of desirable agronomic traits, such as disease
and pest resistance and response to abiotic
stresses. Implementation of marker-assisted
selection and breeding programs is severely
limited by a paucity of trait-linked markers
and a general lack of information on gene
structure and organization. With a nuclear
genome size estimated at 6̃ 20 Mb, the
cowpea genome is an ideal target for
reduced representation sequencing. Results:
We report here the sequencing and analysis
of the gene-rich, hypomethylated portion of
the cowpea genome selectively cloned by
methylation filtration (MF) technology. Over
250,000 gene-space sequence reads (GSRs)
with an average length of 610 bp were
generated, yielding ̃160 Mb of sequence
information. The GSRs were assembled,
annotated by BLAST homology searches of
four public protein annotation databases and
four plant proteomes (A. thaliana, M.
truncatula, O. sativa, and P. trichocarpa), and
analyzed using various domain and gene
modeling tools. A total of 41,260 GSR
assemblies and singletons were annotated, of
which 19,786 have unique GenBank
accession numbers. Within the GSR dataset,
29% of the sequences were annotated using
the Arabidopsis Gene Ontology (GO) with
the largest categories of assigned function
being catalytic activity and metabolic
processes, groups that include the majority
of cellular enzymes and components of
amino acid, carbohydrate and lipid
metabolism. A total of 5,888 GSRs had
homology to genes encoding transcription
factors (TFs) and transcription associated
factors (TAFs) representing about 5% of the
total annotated sequences in the dataset.
Sixty-two (62) of the 64 well-characterized
plant transcription factor (TF) gene families
are represented in the cowpea GSRs, and
these families are of similar size and
phylogenetic organization to those
characterized in other plants. The cowpea
GSRs also provides a rich source of genes
involved in photoperiodic control,
symbiosis, and defense-related responses.
Comparisons to available databases revealed
that about 74% of cowpea ESTs and 70% of
all legume ESTs were represented in the
GSR dataset. As approximately 12% of all
GSRs contain an identifiable simplesequence repeat, the dataset is a powerful
resource for the design of microsatellite
markers. Conclusion: The availability of
extensive publicly available genomic data
for cowpea, a non-model legume with
significant importance in the developing
world, represents a significant step forward
in legume research. Not only does the gene
space sequence enable the detailed analysis
215
Timko M.P.,
Rushton P.J.,
Laudeman T.W.,
Bokowiec M.T.,
Chipumuro E.,
Cheung F., Town
C.D., Chen X.
Scopus
of gene structure, gene family organization
and phylogenetic relationships within
cowpea, but it also facilitates the
characterization of syntenic relationships
with other cultivated and model legumes,
and will contribute to determining patterns
of chromosomal evolution in the
Leguminosae. The micro and macrosyntenic
relationships detected between cowpea and
other cultivated and model legumes should
simplify the identification of informative
markers for marker-assisted trait selection
and map-based gene isolation necessary for
cowpea improvement. © 2008 Timko et al
CE2
SMC '03 Conference
Proceedings: 2003
IEEE International
Conference on
Systems, Man and
Cybernetics
2003
Social Alignment for
Preprocessing UserConstructed Ontologies
2007
This Volume 3 of 5 of the conference
proceedings contains 165 papers. Topics
discussed include image processing,
visualization and decision support, control
with soft computing, agents, ontologies and
markup language, image editing, robotics,
systems and control, intrusion detection and
security, signal processing, human and
machines, pattern matching and
classifications, systems and control, rule
based reasoning, behavioral information
security, learning systems, hybrid techniques
in machine learning and knowledge based
systems, modeling, tools and innovations,
theory and applications, modeling
optimization and design of supply chains,
data analysis and mining, Petri Nets and
discrete event systems, neuro-fuzzy
methods, pattern matching and
classification, emerging technologies in
medical mechatronics, learning control and
non-traditional systems.
User-constructed ontologies have caused
some difficulties in being discriminated from
other user-constructed ontologies. For
efficiently annotating resources in their own
repositories, people simply append ontology
fragments retrieved from standard ontologies
and from other neighbors' ontologies along
to social links. In this paper, we propose a
preprocessing method to extract preferential
concepts for comparing with social
semantics. In order to prune out irrelevant
concepts from user-constructed ontologies,
alignment-based concept classification
process is designed by checking these two
main criteria; i) redundancy (e.g., if there
already exist semantically identical
concepts), and ii) tendency (e.g., if there
exist semantically declined concepts).
Finally, we want to show an application
scenario to demonstrate our contributions.
216
[No author name
available]
Scopus
Jung, J.J.; HongGee Kim
IEEE
CI1
CE3
Story extraction from
the Web: A case study
in security informatics
2010
CI1
CE3
Systemic Approach
Towards Enterprise
Functional
Decomposition
2011
CE3
Talea: An ontologybased framework for ebusiness applications
development
2005
CE3
Template-Based
Adaptation of Semantic
Web Services with
Model-Driven
Engineering
2010
CI1
Open source intelligence is becoming more
and more important in security-related
applications. Effective extraction of valuable
information from these intelligence sources
so as to understand the content of
intelligence is one of the central issues in
security domain. To address this key
problem, this paper studies how to extract
domain events and generate story
representation of the events. We implement
a story extraction platform (SEP) which
applies pattern matching to extract events
from Web news and organizes events based
on theme using narrative structure. We also
design extraction rules, use domain-specific
features and employ ontology to facilitate
story extraction in SEP. The experimental
results show the effectiveness of our system
in security informatics.
Functional decomposition is the primary
component of enterprise activities
description and is often associated with
business process architecture. It guides any
business improvement initiative, enables to
design the enterprise construction organizational structure, IT- and HRarchitectures, etc, as well as to deploy goals
and strategies. The paper suggests the
framework for enterprise functional
decomposition, which includes the ontology
for enterprise activities description,
foundations and the process of functional
decomposition. The suggested framework
integrates the following features: alignment
with goals decomposition, support for
reference models and other reusable
activities descriptions, recursive
decomposition using a single activities
pattern, value-based management and ISO
9004:2009 harmonization. The paper also
describes framework implementation at
Russian enterprises and IT tool to support
the approach.
In this paper we present Talea, a platform
aimed at supporting the development of
web-based e-business applications. Talea
supports a flexible matching between service
provision and request. The platform can be
easily customized thanks to XML-based
communication, Semantic Web
technologies, and the exploitation of a
generator/performer design pattern which
greatly simplifies the task of adding new
functionality. Moreover, Talea provides
multidevice access to both service providers
and final users. An ontological description of
the application domain, expressed in
RDF/RDFS format, is exploited in order to
facilitate the customization and to provide
personalized navigation as well as semanticbased search. The ontology-driven
personalized navigation is particularly useful
for limited display devices (like smartphones
or PDAs), since it reduces the amount of
information displayed. A first evaluation of
the current prototype is planned with a
restricted number of users and will be
carried on by the Local Tourist
Organization.
Service-oriented enterprise systems, which
tend to be heterogeneous, loosely coupled,
long-lived, and continuously running, have
to cope with frequent changes to their
requirements and the environment. In order
to address such changes, applications need to
217
Ansheng Ge;
Wenji Mao;
Daniel Zeng
IEEE
Kudryavtsev, D.;
Grigoriev, L.
IEEE
Levi G.,
Vagliengo A.,
Goy A.
Staikopoulos, A.;
Cliffe, O.;
Popescu, R.;
Padget, J.; Clarke,
S.
Scopus
IEEE
CE3
Testing the Impact of
Pattern-based Ontology
Refactoring on
Ontology Matching
Results
2008
Text analysis for
constructing design
representations
1997
be inherently flexible and adaptive,
supported by appropriate infrastructures. In
this paper, we propose a model-driven
approach for the dynamic adaptation of Web
services based on ontology-aware service
templates. Model-driven engineering raises
the level of abstraction from concrete Web
service implementations to high-level
service models, which leads to more flexible
and automated adaptations through template
designs and transformations. The ontological
semantics enhances the service matching
capabilities required by the dynamic
adaptation process. Service templates are
based on OWL-S descriptions and provide
the necessary means to capture and
parameterize specific behavior patterns of
service models. In this paper, we apply our
approach in the context of the EU-funded
ALIVE project and illustrate, as an example,
how the proposed framework supports the
adaptation of the authentication mechanism
used by an interactive tourist
recommendation system.
We observe the impact of ontology
refactoring, based on detection of name
patterns in the ontology structure, on the
results of ontology matching. Results of our
experiment are evaluated using novel logicbased measures accompanied by an analysis
of typical effects. Although the pattern
detection method only covers a fraction of
ontological errors, there seems to be a
measurable effect on the quality of the
resulting matching.
An emerging model in concurrent product
design and manufacturing is the federation
of workgroups across traditional functional
'silos'. Along with the benefits of this
concurrency comes the complexity of
sharing and accessing design information.
The primary challenge in sharing design
information across functional workgroups
lies in reducing the complex expressions of
associations between design elements.
Collaborative design systems have addressed
this problem from the perspective of
formalizing a shared ontology or product
model. We share the perspective that the
design model and ontology are an expression
of the 'meaning' of the design and provide a
means by which information sharing in
design may be achieved. However, in many
design cases, formalizing an ontology before
the design begins, establishing the
knowledge sharing agreements or mapping
out the design hierarchy is potentially more
expensive than the design itself. This paper
introduces a technique for inducing a
representation of the design based upon the
syntactic patterns contained in the corpus of
design documents. The association between
the design and the representation for the
design is captured by basing the
representation on terminological patterns at
the design text. In the first stage, we create a
'dictionary' of noun-phrases found in the text
corpus based upon a measurement of the
content carrying power of the phrase. In the
218
Ondrej SvábZamazal, Vojtech
Svátek, Christian
Meilicke, Heiner
Stuckenschmidt
DBLP
Dong A., Agogino
A.M.
Scopus
second stage, we cluster the words to
discover inter-term dependencies and build a
Bayesian belief network which describes a
conceptual hierarchy specific to the domain
of the design. We integrate the design
document learning system with an agentbased collaborative design system for
fetching design information based on our
'smart drawings' paradigm. © 1996 Kluwer
Academic Publishers. Published by Elsevier
Science Ltd. All rights reserved.
CE3
The design and
optimization of a
storage model for
distributed ontology
repositories
2010
CE3
The design of computer
simulation experiments
of complex adaptive
social systems for risk
based analysis of
intervention strategies
2012
Oriented to how to establish distributed
ontology repositories efficiently to support
semantic interaction among different users
though the Internet, at the beginning, the
paper reviews some semantic interoperation
platforms based on ontology repositories to
extract the common architecture of this kind
of system, which helps to define the role of
distributed ontology repositories in the
whole system. A storage model for
distributed ontology repositories is
presented. According to the model, the
method for making mapping between
network ontology repositories and local
repositories is discussed, and the encoding
mechanism for semantic entities is
explained. Then, the principles of the
instruction dissemination controller and the
data evolution controller are analyzed in
detail. Finally, based on the experiment, it is
validated that data transfer in network
contributes much less to time cost than query
itself in the cluster storage pattern, which
presents the base for optimizing the retrieval
efficiency in distributed ontologies
repositories, namely, the optimization for the
efficiency of data retrieval in ontologies
repositories can be achieved by adopting the
distributed cluster storage. The storage
model has been applied to the project of the
software for ambient semantic interoperable
service (STASIS).
Computational social science, as with all
complex adaptive systems sciences, involves
a great amount of uncertainty on several
fronts, including intrinsic arbitrariness such
as that due to path dependence, disagreement
on social theory and how to capture it in
software, input data of different credibility
that does not exactly match the requirements
of software because it was gathered for
another purpose, and inexactly matching
translations between models that were
designed for different purposes than the
study at hand. This paper presents a method
of formally tracking that uncertainty,
keeping the data input parameters
proportionate with logical and probabilistic
constraints, and capturing proportionate
dynamics of the output ordered by the
decision points of policy change, for the
purpose of risk-based analysis. Once ordered
this way, the data can be compared to other
data similarly expressed, whether that data is
from simulation excursions or from the real
world, for objective comparison and distance
scoring at the level of dynamic patterns as
opposed to single outcome validation. This
219
Guo J., Fan Y., Di
X.
Scopus
Duong D.V.
Scopus
CE1
CE2
CE3
The Semantic Web,
ISWC 2005 - 4th
Web Conference,
ISWC 2005,
Proceedings
The Semantic Web,
ISWC 2009 - 8th
Web Conference,
ISWC 2009,
Proceedings
The Semantic Web: 6th
Web Conference - 2nd
Asian Semantic Web
Conference, ISWC
2007 + ASWC 2007,
Proceedings
2005
The use of Library of
Congress Subject
Headings in digital
collections
method enables wargame adjudicators to be
run out with data gleaned from the wargame,
enables data to be repurposed for both
training and testing set, and facilitates
objective validation scoring through soft
matching. Artificial intelligence tools used
in the method include probabilistic
ontologies with crisp and Bayesian
inference, game trees that are multiplayer
non-zero sum and decision point based
rather than turn-based, and Markov
processes to represent the dynamic data and
align the models for objective comparison.
Copyright © 2011, Association for the
Advancement of Artificial Intelligence. All
rights reserved.
topics discussed include: using the semantic
web for e-science: inspiration, incubation,
irritation
[No author name
available]
Scopus
2009
topics discussed include: queries to hybrid
MKNF knowledge bases through oracular
tabling
[No author name
available]
Scopus
2007
topics discussed include: enabling advanced
and context-dependent access control in
RDF stores
[No author name
available]
Scopus
2011
Purpose: This paper attempts to explain the
wide dissemination of Library of Congress
Subject Headings (LCSH) within digital
libraries and presents some of the
advantages and disadvantages of using this
controlled vocabulary in digital collections.
The paper also presents other classifications
used in digital collections for subject access
and explores ways of improving search
functionality in digital collections that
employ LCSH.
Design/methodology/approach: Unlike
traditional libraries that use Library of
Congress Classification for organization and
retrieval, digital libraries use metadata forms
for organization and retrieval. The
collections exist in cyberspace of the internet
which is known for containing the universe
of knowledge. The use of LCSH for
information retrieval has been widely
criticized for its difficulty of use and its
information retrieval effectiveness in online
environments. The Library of Congress
(LOC) has claimed the headings were not
based on comprehensive principles nor ever
intended to cover the universe of knowledge.
Despite these claims and criticisms, LCSH is
the most popular choice for subject access in
digital libraries. Findings: The number of
digital collections increases every year and
LCSH is still the most popular choice of
controlled vocabulary for subject access. Of
the numerous criticisms, difficulties of use
and user unfamiliarity are the greatest
disadvantages of using LCSH for subject
access. Average users only have a vague
notion of what they are looking for when
initializing a search. More work is required
in automated generation of subject headings
and increased usage of LCSH in faceted
Walsh J.
Scopus
220
CI1
CI2
CI3
CI4
Towards
correspondence
patterns for ontology
mediation
2007
CI1
CI2
CI3
CI4
Towards design
patterns for ontology
alignment
2008
Towards the
formalization of
interaction semantics
2010
CE3
search retrieval systems. This will provide
users with better access to the LCSH used in
the back end of information retrieval.
Originality/value: The Greek researchers
who developed the Dissertation DSPace
system believe this type of module will
eventually replace the traditional keywordbased indexing back ends employed by
many information retrieval modules within
current digital library systems. The system
offers the type of access and interactivity
that will acquaint users with how LCSH
looks and is used. Faceted search and
automated pattern matching using an
ontology based on LCSH have the best
promise of overcoming the disadvantages
that have always plagued the LOCcontrolled vocabulary. These retrieval
techniques give LCSH an opportunity to
finally achieve the optimal precision and
recall it has so far failed to deliver. ©
Emerald Group Publishing Limited.
We introduce in this paper correspondence
patterns as a tool to design ontology
alignments. Based on existing research on
patterns in the fields of software and
ontology engineering, we define a pattern
template and use it to develop a
correspondence patterns library. This library
is published in RDF following a structured
vocabulary. It is meant to be used in
ontology alignment systems, in order to
support the user or improve matching
algorithms to refine ontology alignments.
Aligning ontologies is a crucial and tedious
task. Matching algorithms and tools provide
support to facilitate the task of the user in
defining correspondences between
ontologies entities. However, automatic
matching is actually limited to the detection
of simple one to one correspondences to be
further refined by the user. We propose in
this paper the use of correspondence patterns
as a tool to assist the design of ontology
alignments. Based on existing research on
patterns in the fields of software and
ontology engineering, we propose a pattern
template as an helper to develop a
correspondence patterns library. We give
ways towards the representation of patterns
using an appropriate correspondence
representation formalism: the Alignment
Ontology. Copyright 2008 ACM.
With the advent of Web 2.0 and the
emergence of improved technologies to
enhance UI, the importance of user
experience and intuitiveness of Web
interfaces led to the growth and success of
Interaction Design. Web designers often turn
to pre-defined and well-founded design
patterns and user interaction paradigms to
build novel and more effective Web
interfaces. The rational behind Interaction
Design patterns is based on user behavior
and Web navigation studies. The semantics
of user interaction is therefore a rich and
interesting area that is worth exploring in
association with traditional Semantic Web
approaches. In this paper, we present our
first attempts of an ontological formalization
of interaction patterns and its implications.
To prove our concept, we illustrate the
mapping approach we employed to put in
relation that interaction formalization with
data-specific ontologies, to create Web
221
Scharffe F., Ding
Y., Fensel D.
Scopus
Scharffe F.,
Euzenat J., Fensel
D.
Scopus
Celino I.,
Corcoglioniti F.
Scopus
interfaces to browse and navigate that
specialized kind of information
CE3
Tree pattern matching
in phylogenetic trees:
automatic search for
orthologs or paralogs
in homologous gene
sequence databases
2005
Motivation: Comparative sequence analysis
is widely used to study genome function and
evolution. This approach first requires the
identification of homologous genes and then
the interpretation of their homology
relationships (orthology or paralogy). To
provide help in this complex task, we
developed three databases of homologous
genes containing sequences, multiple
alignments and phylogenetic trees:
HOBACGEN, HOVERGEN and
HOGENOM. In this paper, we present two
new tools for automating the search for
orthologs or paralogs in these databases.
Results: First, we have developed and
implemented an algorithm to infer speciation
and duplication events by comparison of
gene and species trees (tree reconciliation).
Second, we have developed a general
method to search in our databases the gene
families for which the tree topology matches
a peculiar tree pattern. This algorithm of
unordered tree pattern matching has been
implemented in the FamFetch graphical
interface. With the help of a graphical editor,
the user can specify the topology of the tree
pattern, and set constraints on its nodes and
leaves. Then, this pattern is compared with
all the phylogenetic trees of the database, to
retrieve the families in which one or several
occurrences of this pattern are found. By
specifying ad hoc patterns, it is therefore
possible to identify orthologs in our
databases.
Availability: The tree reconciliation program
and the FamFetch interface are available
from the Pôle Bioinformatique Lyonnais
Web server at the following addresses:
http://pbil.univlyon1.fr/software/RAP/RAP.htm and
http://pbil.univlyon1.fr/software/famfetch.html
222
Jean-François
Dufayard, Laurent
Duret, Simon
Penel, Manolo
Gouy, François
Rechenmann, Guy
Perrière
DBLP
CE3
Using ontology
reasoning for reverse
engineering design
patterns
2010
CE3
Using restricted natural
language for geometric
construction
2012
CE1
CE2
CE3
Work in progress:
Transitioning from
novice to expert
software engineers
through design
patterns: Is it really
working?
2012
Capturing design knowledge in large
software systems reduces the complexity of
understanding and reusing these systems.
Model Driven Engineering (MDE) is seen
by many as the new trend to cope with
software complexity. MDE promotes the
notion of modeling and model
transformations in model-driven
development. In this paper, we propose an
approach that utilizes ontological modeling
and reasoning for recovering design pattern
information from source code. We thus
provide a formal representation of the
conceptual knowledge found in source code
and match it to similar representation of
design patterns. This proper matching is the
basis for applying semantic reasoning to
infer design pattern instances. We have
tested our approach on multiple open source
application frameworks. The results we
obtained are promising and show an
improvement in terms of recall and
precision. © Springer-Verlag Berlin
Heidelberg 2010.
Human-Computer Interaction is crucial for
Instructional Software. It is significant to
make Geometry Instructional Software
understand geometric proposition described
by natural language and construct geometric
Figura automatically. However, it is difficult
for computer to accurately understand the
flexible and variable geometric proposition
because of the immaturity of Natural
Language Processing Technology. This
paper defines a restricted geometric
proposition, presents a corresponding
comprehension model based on ontology,
and designs a matching algorithm for
geometric relation pattern, finally transforms
the restricted geometric proposition to
geometric construction command sequence.
The experiment results suggest that the
average accuracy of understanding clauses
of geometric proposition is almost to 88.9%,
and the percentage of constructing correct
geometric Figura is to 82.5%.
Since their wide adoption by the software
engineering community in the mid-90's,
design patterns have become an important
educational component in the training of
novice software engineers due to the
common belief that, as distilled experience
of seasoned software designers, they can
transform novice software engineers into
skilled professionals in a relatively short
time frame. This paper questions the validity
of this commonly-held belief about the
educational value of conventional patterns,
arguing that although there is tremendous
value in capturing and disseminating
software engineering experience in the form
of patterns, conventional design patterns
cannot deliver on this expectation to
significantly shorten the experience growth
curve. We report initial results from an
ongoing research project that aims to not
only identify the difficulties in using
conventional patterns as educational means
for novices, but also to use such insights to
develop new forms of patterns to help
educators and experts to more effectively
communicate and transfer their software
engineering knowledge, experience, and
understanding of best practices to novices.
223
Alnusair A., Zhao
T.
Scopus
Liu Q.-T., Huang
H., Wu L.-J.
Scopus
Ghazarian, A.
IEEE
AUTOMS-F: A java
framework for
synthesizing ontology
mapping methods
2007
Although ontologies promise an effective
technology for information integration, it is
often the case that two or more information
providers do not share the same ontology.
Several (semi)-automated ontology mapping
methods have been developed towards
solving this problem. This paper presents
AUTOMS-F, a framework implemented as a
Java API, which aims to facilitate the rapid
development of tools for automatic mapping
of ontologies by synthesizing several
individual ontology mapping methods.
Towards this goal, AUTOMS-F provides a
highly extensible and customizable
application programming interface.
AUTOMS is a case study ontology mapping
tool that has been implemented using the
AUTOMS-F framework, and has been
successfully evaluated in the international
OAEI 2006 contest.
224
Alexandros G.
Valarakos ,
Vassilis
Spiliopoulos ,
Konstantinos
Kotis , George
Vouros
Manual
225

universidade federal do estado do rio de janeiro centro de ciências

Transcrição

Documentos relacionados

WPUC 2007

Recordes Superados na Competição

Projeto de Lei N° 96 DE 15 DE Março DE 2016

Ontologias - ENANCIB - Encontro Nacional de Pesquisa em Ciência

Informação - Prova de Equivalência à Frequência Química Código

João Paulo Andrade Almeida – Professor associado da

Administrando o serviço postal americano

:: Portfólio 01

documento comercial de apresentação de produto - Aveiro

Internet do Futuro: aspectos de uma visão centrada no usuário