universidade federal do estado do rio de janeiro centro de ciências
Transcrição
universidade federal do estado do rio de janeiro centro de ciências
UNIVERSIDADE FEDERAL DO ESTADO DO RIO DE JANEIRO CENTRO DE CIÊNCIAS EXATAS E TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA Identificação e Representação de Antipadrões de Correspondência em Ontologias Anselmo Vicente Silva Guedes Orientadoras Fernanda Araujo Baião Amorim Kate Cerqueira Revoredo Rio de Janeiro, RJ - Brasil Setembro de 2014 IDENTIFICAÇÃO E REPRESENTAÇÃO DE ANTIPADRÕES DE CORRESPONDÊNCIA EM ONTOLOGIAS Anselmo Vicente Silva Guedes DISSERTAÇÃO OBTENÇÃO APRESENTADA COMO REQUISITO DO TÍTULO DE MESTRE PARCIAL PELO PROGRAMA PARA DE PÓS- GRADUAÇÃO EM INFORMÁTICA DA UNIVERSIDADE FEDERAL DO ESTADO DO RIO DE JANEIRO (UNIRIO). APROVADA EXAMINADORA ABAIXO ASSINADA. Aprovada por: Rio de Janeiro, RJ - Brasil Setembro de 2014 PELA COMISSÃO G924 Guedes, Anselmo Vicente Silva. Identificação e representação de antipadrões de correspondência em ontologias / Anselmo Vicente Silva Guedes, 2014. 225 f. ; 30 cm Orientadora: Fernanda Araujo Baião Amorim. Coorientadora: Kate Cerqueira Revoredo. Dissertação (Mestrado em Informática) - Universidade Federal do Estado do Rio de Janeiro, Rio de Janeiro, 2014. 1. Software - Desenvolvimento. 2. Ontologia. 3. Antipadrões de correspondência. 4. Alinhamento inconsistente. 5. Framework (Programa de computador). I. Amorim, Fernanda Araujo Baião. II. Revoredo, Kate Cerqueira. III. Universidade Federal do Estado do Rio de Janeiro. Centro de Ciências Exatas e Tecnológicas. Curso de Mestrado em Informática. IV. Título. CDD – 005.1 iii Agradecimentos Agradeço primeiramente a Deus, por ter me dado a oportunidade de ingressar nessa jornada assim como todas as condições de concluí-la. Agradeço imensamente a minha esposa Luciana Maia, por ter estado ao meu lado por todo esse tempo, sempre me incentivando, me dando forças, comemorando junto comigo as conquistas e me apoiando nos momentos mais difíceis. Agradeço também a todo o corpo docente do PPGI, qual sempre contribuiu para a conclusão desse trabalho, em especial às professoras orientadoras Fernanda Baião e Kate Revoredo. iv GUEDES, Anselmo Vicente Silva. Identificação e Representação de Antipadrões de Correspondência em Ontologias. UNIRIO, 2014. 225 Páginas. Dissertação de Mestrado. Departamento de Informática Aplicada, UNIRIO. RESUMO A pesquisa e prática em ontologias têm se tornado muito popular, o que, inevitavelmente, acaba por gerar uma diversidade de ontologias, que por muitas vezes modelam o mesmo universo de discurso. No entanto, essas ontologias podem possuir diferenças em diversas perspectivas. A área de alinhamento de ontologias lida com essas diferenças, sendo considerado por muitos autores o elemento chave para a redução da heterogeneidade entre as ontologias. A tarefa de alinhamento de ontologias consiste na identificação de correspondências corretas entre as entidades de múltiplas ontologias. Várias técnicas podem ser utilizadas para identificar correspondências entre as entidades de duas ontologias, no entanto, resultados atuais no estado da arte apontam que as mesmas não são capazes de identificar todas as correspondências existentes entre duas ontoloigas e ainda podem sugerir correspondências que não existem de fato. O estabelecimento de correspondências inexistentes pode levar a incompatibilidades lógicas e/ou ontológicas. Por outro lado, no contexto de desenvolvimento de software, antipadrões são considerados uma valiosa ferramenta para a identificação de práticas ruins ou incorretas no processo de desenvolvimento de software. Antipadrões previnem ou impedem uma boa execução do processo de desenvolvimento e manutenção do software. No contexto de alinhamento de ontologias, soluções ruins consistem em correspondências incorretas ou problemáticas (incluindo a falta de correspondências). Um antipadrão de correspondência é um modelo de alinhamento para a identificação de correspondências problemáticas ou inconsistentes, que podem ocorrer repeditamente no processo de v alinhamento de ontologias. Um antipadrão de correspondência pode ser útil em vários cenários em que o processo de alinhamento de ontologias é aplicado (como fusão de ontologias e tradução de consultas), uma vez que auxilia no refino do alinhamento produzido por uma ferramenta de alinhamentos de ontologias. Neste trabalho é introduzido o conceito de antipadrões de correspondência de ontologias e é apresentada uma metodologia para a identificação de antipadrões de correspondência e sua representação computacional. Observando alinhamentos disponibilizados pela OAEI (Ontology Alignment Evalutation Intiative), uma iniciativa reconhecida que conduz campanhas anuais de avaliação de alinhamento de ontologias, a metodologia para a identificação e construção de antipadrões de correspondência proposta neste trabalho, foi aplicada sobre esses alinhamentos e como resultado gerouse um catálogo de antipadrões de correspondência. Além disso, este trabalho apresenta a arquitetura de um framework de suporte ao processo de alinhamento de ontologias, o qual pode ser utilizado como um recurso externo ao processo de alinhamento de ontologias, de forma a verificar se uma correspondência é inconsistente, tomando como base um catálogo de antipadrões previamente construído. Por fim, os antipadrões construídos foram aplicados sobre uma segunda base de alinhamentos de ontologias distinta da base utilizada para construção dos antipadrões de correspondência, também disponibilizada pela OAEI, de forma a verificar sua aplicabilidade, tendo como resultado geral melhoria da qualidade dos alinhamentos avaliados em termos de precião. Palavras-chave: alinhamento de ontologias, antipadrões de correspondência, alinhamento inconsistente, framework. vi ABSTRACT As the research and practice on Ontology become more popular and evolve, several ontology artifacts arise for the same universe of discourse. However, they differ among each other in several perspectives. The Ontology Matching area deals with all these problems, being considered by many authors the key element for heterogeneity reduction between ontologies. The Ontology Matching task consists in identifying the correct correspondences among entities of multiple ontologies. A number of techniques can be used to identify correspondences between the entities of two ontologies, however, current results of state-of-the-art techniques are neither complete nor precise, i.e., they are not able to identify all existing correspondences between two ontologies and sometimes suggest correspondences that do not exist. With regard to precision errors, suggesting a correspondence that does not exist may lead to either logical or ontological incompatibilities. On the other hand, in the context of software development, antipatterns are considered a valuable tool for the identification of bad or incorrect practices in the software development process. Antipatterns prevent or hamper a good execution of the software development or maintenance process. In the context of ontology matching, bad solutions consist of incorrect (including missing) or problematic correspondences. A correspondence antipattern is a matching model for identifying problematic correspondences that may occur repeatedly in ontology matching processes. A correspondence antipattern may be useful in several scenarios in which Ontology Matching is applied (such as in ontology merging, ontology comparison, query translation), since it helps refining an alignment produced by an ontology matching tool. vii This work introduced the concept of ontology correspondence antipatterns and a methodology for identifying correspondence antipatterns and its computational representation. Looking for the alingments provided by OAEI (Ontology Alignment Evalutation Intiative), the proposed methodology was applied on these alignments and generated a catalog of correspondence antipatterns as its result. Furthermore, this work presents the architecture of a framework supporting the ontology alignment process, which can be used as an external resource to the ontolgy alignment process in order to check whether a correspondence is inconsistent, building upon a correspondence antipatterns catalog previously constructed. Finally, the correspondence antipatterns in the catalog were applied on a secon set of ontology alignments distinct from the set of ontology alignments were used for build the correspondence antipatterns, also provided by OAEI, in order to verify its applicability. The general results are the better quality of the alingments evaluated in terms of precision. Keywords: ontology matching, correspondence antipatterns, inconsistent alignment, framework. viii Sumário 1. 2. 3. 4. Introdução .......................................................................................................................................... 15 1.1. Motivação e Caracterização do Problema ............................................................................ 15 1.2. Objetivos............................................................................................................................... 21 1.3. Hipótese de Pesquisa ............................................................................................................ 23 1.4. Metodologia da Pesquisa ...................................................................................................... 23 1.5. Organização da Dissertação .................................................................................................. 24 Fundamentação Teórica ..................................................................................................................... 26 2.1. Ontologias............................................................................................................................. 26 2.2. Incompatibilidades Ontológicas ........................................................................................... 29 2.3. Alinhamento de Ontologias .................................................................................................. 34 2.4. Técnicas de Alinhamento de Ontologias .............................................................................. 38 2.5. Qualidade do Alinhamento de Ontologias ............................................................................ 41 2.6. Linguagens para Representação de Alinhamentos de Ontologias ........................................ 43 2.7. Padrões de Projeto ................................................................................................................ 47 2.8. Antipadrões de Projeto ......................................................................................................... 50 2.9. Padrões de Correspondência de Ontologias .......................................................................... 52 Antipadrões de Correspondência de Ontologias ................................................................................ 56 3.1. Definição de Antipadrões de Correspondência..................................................................... 56 3.2. Processo de Identificação e Construção de Antipadrões de Correspondência ...................... 65 3.3. Elementos da representação computacional de um antipadrão de correspondência ............. 69 Catálogo de Antipadrões de Correspondência ................................................................................... 74 4.1. 5. 6. Buscando por Antipadrões de Correspondência ................................................................... 74 Framework de Antipadrões de Correspondência ............................................................................... 88 5.1. Por que um Framework? ....................................................................................................... 88 5.2. Arquitetura do Framework de Antipadrões de Correspondência .......................................... 89 Estudo de Caso: Aplicando os Antipadrões de Correspondência .................................................... 103 6.1. Visão Geral ......................................................................................................................... 103 6.2. Resultados Obtidos ............................................................................................................. 105 ix 7. Trabalhos Relacionados ................................................................................................................... 119 7.1. 8. 9. Revisão da Bibliografia ...................................................................................................... 119 Conclusão......................................................................................................................................... 126 8.1. Considerações Finais .......................................................................................................... 126 8.2. Principais Contribuições ..................................................................................................... 128 8.3. Limitações da Proposta ....................................................................................................... 128 8.4. Trabalhos Futuros ............................................................................................................... 129 Referências....................................................................................................................................... 131 10. Apêndice I - Catálogo de Antipadrões de Correspondência. ........................................................... 137 11. Apêndice II – Estudo de Caso .......................................................................................................... 153 12. Apêndice III – Estudo Baseado em Revisão Sistemática ................................................................. 168 x Lista de Figuras Figura 1 - Exemplo de um mapeamento de esquemas. Adaptado de [33] .................................................. 16 Figura 2 - Evolução da Medida-F de diferentes conjuntos de dados avaliados pela OAEI. ....................... 20 Figura 3 - Metamodelo de uma ontologia. Adaptado de [20] ..................................................................... 29 Figura 4 - Exemplos de representação de um conceito de formas diferentes. ............................................ 33 Figura 5 - Classificação das incompatibilidades ontológicas. Adaptado de [37]. ...................................... 34 Figura 6 - Exemplo de alinhamento entre duas ontologias. Adaptado de [45]. .......................................... 35 Figura 7 - Processo de alinhamento de duas ontologias [13]...................................................................... 36 Figura 8 – Fragmento da representação de um alinhamento entre as ontologias FOAF e vCard. .............. 38 Figura 9 - Classificação das técnicas de alinhamento de ontologias. Fonte: [13]. ...................................... 38 Figura 10 - Diagrama representando a composição de um padrão. ............................................................ 50 Figura 11 - Exemplo de padrão de correspondência “restrição de valor de atributo” ................................ 54 Figura 12 - Representação computacional na linguagem EDOAL do padrão de correspondência restrição de valor de atributo” ................................................................................................................................... 54 Figura 13 - Exemplo de instância de um padrão de correspondência “restrição de valor de atributo”. ...... 55 Figura 14 - Fragmento de duas ontologias e um problema de alinhamento. .............................................. 57 Figura 15 - Exemplos de tipos de inferências de verificação semântica. (a) verificação de correspondências de múltiplas entidades; (b) verificação de correspondências cruzada; (c) verificação de contradição de disjunção-subsunção; (d) verificação de incompletude de domínio e intervalo. As setas de linhas sólidas denotam as correspondências entre as entidades. ................................................................. 62 Figura 16 – Definição de um antipadrão de correspondência T a partir da generalização de um problema de alinhamento do tipo verificação de contradição de disjunção-subsunção. ............................................. 64 Figura 17 - Representação computacional do antipadrão de correspondência T através da linguagem EDOAL. ..................................................................................................................................................... 65 Figura 18 - Metodologia para construção de um antipadrão de correspondência. ...................................... 65 Figura 19 - Problema de alinhamento entre as ontologias ConfOf e Edas. ................................................ 78 Figura 20 - Generalização do problema de alinhamento Caso 1. ............................................................... 78 Figura 21 - Problema de alinhamento entre as ontologias Conference e Ekaw. ......................................... 79 Figura 22 - Generalização do problema de alinhamento Caso 2. ............................................................... 79 Figura 23 - Problema de alinhamento entre as ontologias ConfOf e Ekaw. ............................................... 80 Figura 24 - Generalização do problema de alinhamento Caso 3 ................................................................ 80 Figura 25 - Problema de alinhamento entre as ontologias CMT e ConfOf. ............................................... 81 Figura 26 - Generalização do problema de alinhamento Caso 4. ............................................................... 81 Figura 27 - Problema de alinhamento entre as ontologias ConfOf e Edas. ................................................ 82 Figura 28 - Generalização do problema de alinhamento Caso 5 ................................................................ 82 Figura 29 - Problema de alinhamento entre as ontologias Edas e Iasted. ................................................... 83 Figura 30 - Generalização do problema de alinhamento Caso 6. ............................................................... 83 Figura 31 - Problema de alinhamento entre as ontologias CMT e Conference. ......................................... 84 Figura 32 - Generalização do problema de alinhamento Caso 7. ............................................................... 84 Figura 33 - Problema de alinhamento entre as ontologias Iasted e Sigkdd. ............................................... 85 xi Figura 34 - Generalização do problema de alinhamento Caso 8. ............................................................... 85 Figura 35 - Problema de alinhamento entre as ontologias ConfOf e Edas. ................................................ 86 Figura 36 - Generalização do problema de alinhamento Caso 9. ............................................................... 86 Figura 37 - Arquitetura de um framework de antipadrões de correspondência sob o ponto de vista de processo de alinhamento de ontologias. ..................................................................................................... 91 Figura 38 - Pseudo-Arquitetura do framework de antipadrões de correspondência. .................................. 91 Figura 39 – Formulário Validar Correspondências ................................................................................... 92 Figura 40 – Formulário Identificar Falsos Positivos / Falsos Negativos - Individual ................................ 93 Figura 41 – Formulário Identificar Falsos Positivos / Falsos Negativos – Em lotes ................................. 93 Figura 42 – Formulário Manutenção OCA ................................................................................................. 94 Figura 43 – Formulário Manutenção de Ferramentas................................................................................ 94 Figura 44 – Formulário Manutenção de Eventos ....................................................................................... 95 Figura 45 – Formulário Manutenção de Ontologias .................................................................................. 95 Figura 46 - Classe OCAReasoner. .............................................................................................................. 96 Figura 47 - Classe Ontology. ...................................................................................................................... 99 Figura 48 - Classe Alignment. .................................................................................................................. 100 Figura 49 - Classe IncorrectCorrespondences. ......................................................................................... 101 Figura 50 - Modelo Relacional das entidades do framework de antipadrões de correspondência. .......... 102 Figura 51 - Correspondência 〈mouse:MA_0002446, human:NCI_C25444, ≡, _〉 ................................... 107 Figura 52 – Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #1. ......................................................... 107 Figura 53 - Correspondência 〈cmt_en:c-8693270-2767092, iasted_nl:c-0447708-8078411, ≡, _〉 ......... 108 Figura 54 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #2. ......................................................... 108 Figura 55 - Correspondência 〈cmt_es:c-7650337-8286527, conference_pt:c-6123980-7251265, ≡, _〉 . 109 Figura 56 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #3. ......................................................... 110 Figura 57 - Correspondência 〈biblio_101:book, biblio_101:collection, ≡, _〉 ......................................... 110 Figura 58 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #4. ......................................................... 111 Figura 59 - Correspondência 〈biblio_101:shortName, biblio_221:name, ≡, _〉 ....................................... 111 Figura 60 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #5. ......................................................... 112 Figura 61 - Correspondência 〈biblio_101:book, biblio_101:collection, ≡, _〉 ......................................... 112 Figura 62 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #6. ......................................................... 113 Figura 63 - Correspondência 〈confOf_cz:c-1688149-7240940, confOf_nl:c-1180439-2483437, ≡, _〉 ... 113 Figura 64 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #7. ......................................................... 114 Figura 65 - Correspondência 〈iasted_nl:c-0447708-8078411, sigkdd_fr:c-3448744-2358764, ≡, _〉 ..... 115 Figura 66 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #8. ......................................................... 115 Figura 67 - Correspondência 〈confOf_nl:c-1180439-2483437, confOf_en:c-5701075-1274855, ≡, _〉 .. 116 Figura 68 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #9. ......................................................... 116 Figura 69 - Correspondência 〈sigkdd_es:c-2763261-4560459, confOf_pt:c-1056766-4464703, ≡, _〉 ... 117 Figura 70 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #10. ....................................................... 117 Figura 71 - Gráfico com o percentual de melhoria das médias das métricas de Precisão, Cobertura e Medida-F para cada caso analisado. ......................................................................................................... 118 xii Lista de Tabelas Tabela 1 - Resumo dos construtos da linguagem EDOAL. ........................................................................ 45 Tabela 2 – Comparativo entre as linguagens de alinhamento de ontologias. ............................................. 47 Tabela 3 – Modelo de Pseudo Antipadrão .................................................................................................. 51 Tabela 4 – Modelo de Mini Antipadrão ..................................................................................................... 51 Tabela 5 – Modelo de Antipadrão Completo ............................................................................................. 51 Tabela 6 – Modelo de antipadrão de correspondência representando um problema de alinhamento. ........ 67 Tabela 7 – Antipadrão de Correspondência OCA01. ................................................................................. 68 Tabela 8 - Correspondências incorretas identificadas no conjunto de alinhamentos selecionado. ............. 76 Tabela 9 – Descrição das tabelas utilizadas pelo framework. .................................................................. 101 Tabela 10 - Grupo de correspondências incorretas selecionado para o estudo de caso. ........................... 105 Tabela 11 – Trabalhos selecionados após a execução do protocolo de revisão. ....................................... 120 Tabela 12 - Correlação dos trabalhos selecionados com as questões de pesquisa. ................................... 121 Tabela 13 – Antipadrão de correspondência OCA01 ............................................................................... 137 Tabela 14 – Antipadrão de correspondência OCA02 ............................................................................... 138 Tabela 15 – Antipadrão de correspondência OCA03 ............................................................................... 140 Tabela 16 – Antipadrão de correspondência OCA04 ............................................................................... 141 Tabela 17 – Antipadrão de correspondência OCA09 ............................................................................... 142 Tabela 18 – Antipadrão de correspondência OCA05(a) ........................................................................... 143 Tabela 19 – Antipadrão de correspondência OCA05(b) .......................................................................... 145 Tabela 20 – Antipadrão de correspondência OCA06 ............................................................................... 146 Tabela 21 – Antipadrão de correspondência OCA10 ............................................................................... 147 Tabela 22 – Antipadrão de correspondência OCA11 ............................................................................... 149 Tabela 23 – Antipadrão de correspondência OCA07 ............................................................................... 151 Tabela 24 – Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #1 .................................................................................................................................................................. 153 Tabela 25 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #1 após sua refatoração. ................................................................................................................................ 153 Tabela 26 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #2 .................................................................................................................................................................. 154 Tabela 27 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #2 após sua refatoração. ................................................................................................................................ 155 Tabela 28 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #3. .................................................................................................................................................................. 156 Tabela 29 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #3 após sua refatoração. ................................................................................................................................ 157 Tabela 30 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #4. .................................................................................................................................................................. 157 Tabela 31 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #4 após sua refatoração. ................................................................................................................................ 158 xiii Tabela 32 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #5. .................................................................................................................................................................. 158 Tabela 33 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #5 após sua refatoração. ................................................................................................................................ 159 Tabela 34 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #6. .................................................................................................................................................................. 159 Tabela 35 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #6 após sua refatoração. ................................................................................................................................ 160 Tabela 36 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #7. .................................................................................................................................................................. 160 Tabela 37 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #7 após sua refatoração. ................................................................................................................................ 161 Tabela 38 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #8. .................................................................................................................................................................. 162 Tabela 39 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #8 após sua refatoração. ................................................................................................................................ 162 Tabela 40 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #9. .................................................................................................................................................................. 163 Tabela 41 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #9 após sua refatoração. ................................................................................................................................ 164 Tabela 42 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #10. ........................................................................................................................................................... 165 Tabela 43 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #10 após sua refatoração. ................................................................................................................................ 166 Tabela 44 - Trabalhos selecionados após a execução do protocolo de revisão. ....................................... 177 Tabela 45 - Correlação dos trabalhos selecionados com as questões de pesquisa. ................................... 178 Tabela 46 – Relação completa de trabalhos retornados pelas expressões de busca. ................................. 178 xiv 1. Introdução Este capítulo fornece uma visão geral da dissertação, apresentando a motivação para a melhoria do processo de alinhamento de ontologias, bem como uma breve descrição do enfoque da solução proposta, que inclui a definição de antipadrões de correspondência e sua utilização como recurso no processo de alinhamento de ontologias. A hipótese que norteia a pesquisa e a metodologia utilizada para validá-la também são aqui apresentadas. 1.1. Motivação e Caracterização do Problema A tecnologia de banco de dados foi introduzida nas organizações no final da década de 1960, de uma forma inicialmente simples, para fornecer suporte às aplicações de negócios que eram demandadas de tais organizações [1]. Conforme o número de aplicações e repositório de dados rapidamente cresciam, a necessidade de integração dos dados que eram produzidos de forma isolada era cada vez mais aparente. Integração de dados nesse contexto pode ser definida como a combinação de dados que residem em diferentes fontes autônomas e heterogêneas, com o objetivo de prover ao usuário final uma visualização unificada e reconciliada desses dados [2]. Como consequência, as primeiras abordagens de integração de dados surgiram na década de 1980 na forma sistemas de multi-bancos de dados [3]. A evolução das abordagens de integração de dados seguiu através de sistemas mediadores [4] e de sistemas agentes [5] para 15 tecnologias que utilizam abordagens peer-to-peer (P2P) [6] e sistemas baseados em web services [7]. Para operacionalizar a integração de dados, uma das estratégias é estabelecer mapeamentos que traduzam informações e estruturas entre as fontes envolvidas. Estabelecer mapeamentos (associações) entre dados de diferentes esquemas está no centro de várias tarefas de integração e compartilhamento de dados. Dado um esquema de origem S e um esquema de destino T, um mapeamento de dados M é a especificação de uma relação entre as instâncias de S e as instâncias de T [33]. A Figura 1 ilustra dois esquemas que representam visões diferentes sobre uma organização (S e T). As setas pontilhadas indicam o mapeamento entre as entidades do esquema S e o esquema T. De acordo com Fuxman e Miller [33], esse mapeamento é o suficiente para dizer como as instâncias de S e T são relacionadas. Analisando, por exemplo, o mapeamentos entre companies.name e organizations.code, temos que uma instância que ocorre em companies.name também pode ocorrer em organizations.code. Figura 1 - Exemplo de um mapeamento de esquemas. Adaptado de [33] As abordagens iniciais de integração de dados eram baseadas em modelos de dados relacionais e realizadas através de soluções rígidas, provendo um único esquema 16 de dados global [1]. Para superar as limitações com relação a aspectos de abstração, classificação e taxonomias, abordagens de integração orientadas a objetos foram adotadas para executar a integração de dados e homogeneizar a estrutura dos esquemas envolvidos. Com o advento da internet e tecnologias web, o foco mudou de integrar dados puramente bem estruturados para também incorporar dados semi-estruturados e não estruturados. Contudo, integração de dados é muito mais que um problema estrutural ou técnico. Ocorre que cada vez mais há a demanda de integrar dados descritos por diferentes modelos de dados, o que levam a problemas causados devido à semântica dos dados ser diferentes. Semânticas explícitas e precisas dos dados que necessitam ser “integrados” são essenciais para que o resultado da integração seja semanticamente correto e significativo. Segundo Ziegler e Dittrich [1], na área de banco de dados, semântica pode ser considerada como a interpretação das pessoas sobre os dados e seu esquema de acordo com seu entendimento sobre o mundo em certo contexto. Na integração de dados, considera-se a semântica do mundo real, visando o mapeamento de objetos do modelo computacional em objetos do mundo real e tratando questões que envolvem a interpretação humana, ou significado e uso dos dados ou informação [10]. Nesse contexto, a integração semântica de dados é a tarefa de agrupar, combinar ou completar dados de diferentes fontes levando em consideração a semântica explícita e precisa do dado a fim de evitar que dados semanticamente incompatíveis sejam estruturalmente combinados. Isso significa que a integração semântica garante que somente dados relacionados ao mesmo conceito do mundo real, ou a conceitos suficientemente similares, sejam combinados. Ziegler e Dittrich [1] afirmam ainda que um pré-requisito para que se possa alcançar a integração semântica é resolver o problema de ambiguidade semântica sobre os dados que serão integrados, por meio do uso de 17 metadados explícitos que elucidem suposições implícitas e subjacentes ao contexto da informação. Uma forma de representar o conhecimento de um domínio é através do uso de ontologias. Uma ontologia pode ser definida como a descrição explícita e formal de conceitos e seus relacionamentos que existem em certo universo de discurso, junto com vocabulário que referem a esses conceitos [11]. Comparada com outros esquemas de classificação, como taxonomias ou tesauros, por exemplo, ontologias permitem construir modelos mais completos e precisos. Segundo Ziegler e Dittrich [1] ontologias podem ser utilizadas para expressar a semântica das fontes de dados para sua integração. Cruz e Xiao [16] classificam 3 tipos de abordagens de integração que fazem uso de ontologias: na abordagem de ontologia simples, todos os esquemas de fontes de dados são diretamente relacionados a uma ontologia global e compartilhada, que fornece uma interface única e uniforme para o usuário; na abordagem de múltiplas ontologias, cada fonte de dados é descrita por sua própria ontologia (local) separadamente e, ao invés de utilizar uma ontologia comum para todas as fontes de dados, as ontologias são mapeadas entre si indicando a correspondência entre seus conceitos; a abordagem híbrida é uma combinação das duas abordagens anteriores, em que cada fonte local é descrita por sua própria ontologia que mapeia ontologias locais identificando a correspondência entre seus conceitos, e uma nova ontologia global e compartilhada é gerada a partir desses mapeamentos. Nas abordagens de múltiplas ontologias e híbrida, é necessário que o mapeamento entre os elementos das ontologias envolvidas seja realizado. O processo de identificar um conjunto de correspondências (ou mapeamentos) entre elas é chamado de alinhamento de ontologias [17]. Além da aplicabilidade dentro do problema de integração de dados, ontologias são comumente utilizadas na web semântica, em diversas áreas de inteligência artificial, em questões de processamento de linguagem 18 natural, dentro da engenharia de software, dentre outros [14] [15] [16]. Com essa diversidade de cenários para a aplicação do uso das ontologias, é inevitável que haja uma heterogeneidade semântica dos domínios representados por cada ontologia. Realizar o alinhamento de ontologias é uma das etapas necessárias para superar essa heterogeneidade semântica entre os domínios de cada ontologia [17]. O processo de alinhamento de ontologias visa encontrar correspondências entre as entidades (classes, relações e indivíduos) de cada ontologia e denota uma força para cada correspondência encontrada. No estado da arte dos algoritmos de alinhamento de ontologias, estes não são capazes de realizar a descoberta de correspondências complexas entre as entidades de duas ontologias [21], ou ainda, deixam de identificar correspondências existentes entre duas ontologias. A Iniciativa de Avaliação de Alinhamento de Ontologias (Ontology Alignment Evaluation Initiative – OAEI 1) conduz campanhas anuais de avaliação de ferramentas de alinhamento de ontologias. A Figura 2 apresenta a evolução da média da Medida-F (F-Measure) desde o início da OAEI em todos os conjuntos de dados disponibilizados para avaliação. A Medida-F é uma média que representa a harmonização entre a precisão e a cobertura do alinhamento obtido, e, segundo Erigh [19], pode ser a medida principal para avaliar a qualidade de um alinhamento. Mesmo com a busca contínua pela evolução e melhoria dos sistemas de alinhamentos, é possível verificar através da Figura 2 que estes, por si só, não conseguem ainda resolver todos os problemas de correspondências. 1 http://oaei.ontologymatching.org/ 19 Figura 2 - Evolução da Medida-F de diferentes conjuntos de dados avaliados pela OAEI. Um dos desafios apontados por Euzenat e Shvaiko [17], ao realizarem uma análise da situação atual e perspectivas da área de alinhamento de ontologias, é a criação de ambientes e ferramentas que possam armazenar e disponibilizar alinhamentos de forma padronizada. O alinhamento de ontologias pode ser considerado como um problema de design [20], uma vez que surgem diferentes ontologias para expressar semânticas similares. Como qualquer tipo de problema de design, é provável que surjam padrões decorrentes das regularidades identificadas durante repetidas tarefas de alinhamento. Portanto, um padrão de correspondência representa uma solução genérica para uma configuração particular de relações das entidades de duas ontologias que estão sendo alinhadas [20]. Padrões de correspondência podem ser visualizados como abstrações de um alinhamento, fornecendo um modelo genérico que pode ser instanciado com as entidades que compõem cada ontologia que está sendo alinhada [20]. 20 A utilização de padrões de correspondência auxilia na identificação de correspondências que as ferramentas de alinhamento de ontologias não são capazes de identificar, mas não impede que tais ferramentas identifiquem correspondências incorretas durante o processo de alinhamento. Tais correspondências incorretas quando instanciadas, podem levar a modelos semanticamente inválidos. Desta forma, é necessário definir novos recursos para o processo de alinhamento de forma a auxiliar as ferramentas a decidir se uma correspondência identificada é semanticamente válida, ao ser instanciada no mapeamento realizado entre as ontologias alinhadas. O problema que este trabalho visa resolver é: como promover o aumento da precisão de um alinhamento previamente definido entre duas ontologias? 1.2. Objetivos O objetivo geral da pesquisa é melhorar a qualidade do alinhamento final entre as ontologias, realizado de forma automática. Para tal, uma das possíveis formas é identificar se uma correspondência identificada por uma ferramenta de alinhamento de ontologias é de fato válida. Um antipadrão de projeto representa a descrição de uma solução dada a um problema recorrente que gera, definitivamente, consequências negativas [22]. Quando devidamente documentado, um antipadrão descreve a solução de forma geral, as causas primárias que levam à solução problemática, sintomas que descrevem como reconhecer o antipadrão, consequências do uso dessa solução e uma solução refatorada que pode mudar o antipadrão em uma solução mais adequada. Um antipadrão de correspondência pode ser definido como um conjunto de correspondências e/ou não correspondências genéricas e de domínio independente que representam um alinhamento incorreto entre duas ontologias. Uma correspondência 21 genérica é um modelo de correspondência, no qual as entidades correspondentes não estão instanciadas. Dessa forma, um antipadrão de correspondência representa cenários em que todas as instanciações possíveis de um alinhamento são incorretas. Antipadrões de correspondência atuam como modelos que objetivam identificar correspondências incorretas entre as entidades de duas ontologias. Neste trabalho será definido o conceito de antipadrões de correspondências e será apresentada uma metodologia para identificação, construção e sua representação computacional. Além disso, para oferecer suporte aos mecanismos de alinhamento, o presente trabalho propõe um framework de antipadrões de alinhamento, assim como a identificação e operacionalização dos antipadrões de correspondência de ontologias através de uma linguagem de representação de alinhamentos e a reutilização dos mesmos, como recurso no processo de alinhamento de ontologias. Como desdobramento desse objetivo, os seguintes objetivos específicos foram definidos: Definição formal do conceito de antipadrão de correspondência e metodologia para sua construção. Elaboração de um catálogo de antipadrões de correspondência, através da análise de repetidas correspondências incorretas estabelecidas por ferramentas de alinhamento de ontologias e do conhecimento tácito de autores da área de alinhamento de ontologias. Desenvolvimento de um framework de suporte ao processo de alinhamento de ontologias correspondência. 22 para aplicação de antipadrões de 1.3. Hipótese de Pesquisa A hipótese que norteia a pesquisa pode ser enunciada da seguinte forma: Se antipadrões de correspondência forem aplicados como recursos no processo automático de alinhamento de ontologias, então haverá uma maior precisão no resultado final deste processo. A qualidade do resultado final do processo de alinhamento de ontologias é tradicionalmente avaliada utilizando as métricas de precisão e cobertura, e a média harmônica entre elas, a medida F [19]. Ao utilizar antipadrões de correspondência como recurso no processo de realização do alinhamento de ontologias, espera-se que haja uma melhora na métrica de precisão e por consequência, na medida F; caso não haja, ou ainda, o resultado seja o oposto, a hipótese será falseada. 1.4. Metodologia da Pesquisa A fim de obter uma referência atualizada dos estudos sobre padrões e antipadrões para alinhamento de ontologias, foi realizado um estudo baseado em revisão sistemática, conforme apresentado por Santos et al. [34], procurando reduzir o viés de uma revisão informal. O protocolo utilizado para o estudo teve como base o trabalho também desenvolvido por Santos et al. [34] e é detalhado no Apêndice III. O método de pesquisa utilizado para avaliação dos resultados foi o experimento quantitativo. O experimento foi aplicado utilizando a base de dados de benchmark disponibilizada pela iniciativa Ontology Alignment Evaluation Initiative (OAEI). A OAEI é uma iniciativa internacional que possui como objetivo avaliar, dentre outras questões, qualitativamente ferramentas de alinhamento de ontologias. Dentro dessa base dados existem diversos 23 domínios de conhecimento, onde para cada domínio existe um grupo específico de ontologias que modelam esse mesmo domínio. Alguns grupos de ontologias, chamados de trilhas pela OAEI, foram analisadas para a construção dos antipadrões de correspondência. Nas trilhas que não foram utilizadas para a construção dos antipadrões de correspondência, um grupo de alinhamentos encontrados, sem qualquer interferência da presente proposta (grupo de controle) foi comparado com o grupo de alinhamentos encontrados utilizando os antipadrões de correspondência de ontologias propostos (grupo experimental). Os dados coletados foram a precisão e Medida-F dos alinhamentos realizados. Como fontes de dados serão utilizadas todas as trilhas disponibilizadas pela OAEI das campanhas de 2011.5, 2012 e 2013. Os resultados foram analisados de acordo com os alinhamentos obtidos com e sem a utilização dos padrões de alinhamento de ontologias. O método de análise dos dados foi através de análise estatística e têm-se como resultados esperados o aumento dos valores de precisão e medida-F. 1.5. Organização da Dissertação Esta dissertação está organizada em 8 capítulos, sendo o primeiro esta Introdução. No Capítulo 2 é apresentada toda fundamentação teórica necessária para contextualização da proposta de pesquisa deste trabalho, onde são abordados os conceitos de Ontologias, Incompatibilidades Ontológicas, Alinhamento de Ontologias, Padrões e Antipadrões de Projeto e Padrões de Projeto de Correspondência de Ontologias. O Capítulo 3 apresenta formalmente o conceito de antipadrões de correspondência assim como a metodologia proposta para a identificação e construção de antipadrões de correspondência. Além disso, são apresentados os elementos da linguagem computacional utilizada para a representação dos antipadrões de 24 correspondência. No Capítulo 4 é apresentado o catálogo de antipadrões de correspondência gerado a partir da aplicação da metodologia proposta no capítulo anterior, ilustrando o passo-a-passo utilizado para sua construção. O Capítulo 5 apresenta a arquitetura proposta para um framework de suporte à utilização de antipadrões de correspondência, o Framework de Antipadrões de Correspondência. No Capítulo 6 é apresentado um estudo de caso, no qual foram aplicados os antipadrões de correspondência construídos, e os resultados obtidos. O Capítulo 7 apresenta um resumo da revisão da bibliografia sobre o tema em questão e os trabalhos relacionados à proposta dessa dissertação. Por fim, o Capítulo 8 apresenta a conclusão deste trabalho. 25 2. Fundamentação Teórica Este capítulo apresenta os conceitos necessários para compreensão da proposta de pesquisa deste trabalho. É apresentado o conceito de ontologia no sentido computacional, as incompatibilidades ontológicas que podem ocorrer ao se alinhar duas ontologias, a problemática do alinhamento de ontologias assim como uma definição formal de seu processo, técnicas existentes para sua execução e métricas para sua avaliação e por fim apresenta uma linguagem para representação de um alinhamento entre duas ontologias. São apresentados ainda os conceitos de padrões, e antipadrões de projeto e padrões de correspondência de ontologias. 2.1. Ontologias Etimologicamente, ont vem do verbo Grego einai (ser), dessa forma a palavra latina Ontologia (ont + logia) pode ser traduzida como “o estudo da existência” [23]. O dicionário Aurélio da língua portuguesa apresenta a seguinte definição para a palavra ontologia [35]: “parte da filosofia que trata do ser enquanto ser, isto é, do ser concebido como tendo uma natureza comum que é inerente a todos e a cada um dos seres”. O termo ontologia foi introduzido na filosofia no século XIX pelo filósofo Rudolf Gockel, em seu Lexicon Philosophicum, para distinguir o estudo do “ser” de outros tipos de estudos da existência do ser nas ciências naturais [23]. Como uma disciplina filosófica, ontologia está preocupada em prover sistemas de categorização 26 que consideram certo tipo de visão do mundo [12], e objetiva desenvolver teorias sobre, por exemplo, persistência e mudança, classificação e instanciação, casualidade, dentre outras. A definição mais frequente de ontologia na ciência da computação é de Gruber [11]: “uma ontologia é uma especificação explícita e formal de uma conceitualização compartilhada”. A noção de conceitualização colocada por Gruber pode ser interpretada na forma de um corpo que é formalmente representado por objetos, conceitos e outras entidades que assumem sua existência em alguma área de interesse e os relacionamentos entre eles. Uma conceitualização é uma visualização abstrata e simplificada do mundo que se deseja representar para algum propósito. Em aplicações práticas, é necessário utilizar uma linguagem para referir-se aos elementos de uma conceitualização, ou seja, a linguagem utilizada deve ser aderente à conceitualização estabelecida de forma a garantir que os símbolos utilizados são interpretáveis de acordo com essa conceitualização. Por exemplo, a linguagem utilizada tem que garantir que para pessoas que não dominam o idioma inglês o termo cooperates-with não será interpretado como correspondente à conceitualização de reports-to, e vice versa. Tipicamente uma conceitualização está na mente das pessoas, ou seja, está implícita. A linguagem que será utilizada para representar a conceitualização desejada deve ser explícita de forma a representar todos os estados possíveis do universo de discurso que está modelado. Uma maneira efetiva de especificar uma conceitualização é fixar uma linguagem e restringir as interpretações dessa linguagem de uma maneira intencional através de axiomas adequados. Por exemplo, em um domínio organizacional que trata das relações entre os funcionários de um departamento, é possível escrever simples axiomas estabelecendo que reports-to é um relacionamento assimétrico e intransitivo, enquanto cooperates-with é um relacionamento simétrico, irreflexivo e intransitivo. 27 Uma ontologia é justamente um conjunto desses axiomas, isto é, teorias lógicas desenvolvidas a fim de capturar a intenção dos modelos correspondentes a uma determinada conceitualização e excluir o que não é desejado nesses modelos. Os axiomas utilizados para especificar intencionalmente e explicitamente uma conceitualização podem ser representados por uma linguagem formal. Formal nesse sentido refere-se ao fato que devem ser interpretáveis computacionalmente, de forma que linguagens naturais não são consideradas. A característica distintiva das ontologias de outras representações é a existência de um modelo teórico semântico: ontologias são teorias lógicas [13]. A interpretação das ontologias não é deixada para os usuários que leem os diagramas ou aos sistemas de gestão de conhecimento, a ontologia é especificada explicitamente. A semântica fornece as regras para interpretação da sintaxe que não fornece o significado diretamente, mas restringe as possíveis interpretações do que é declarado. A semântica das ontologias pode ser restrita por axiomas adicionais, ou seja, asserções lógicas que são consideradas verdadeiras. Isto pode ser em algumas linguagens, a oportunidade de aumentar a expressividade do conceito, como por exemplo, uma autobiografia é uma biografia cujo tema é o autor, que pode ser representado em lógica de primeira ordem [13] como: x, autobiografia(x) ∃y; pessoa(y) autor(x, y) tema(x, y) Classes, atributos, relações e instâncias podem ser considerados como a primeira classe de elementos de uma ontologia [20], desse modo uma ontologia O é uma tupla O=C, R, P, I, a, onde C é um conjunto de classes, R é um conjunto de relações entre as classes, P é um conjunto de propriedades entre classes e tipos de dados, I é um conjunto de instâncias e a é um conjunto de axiomas. Uma classe modela conceitos como objetos que descrevem um domínio. Instâncias de classes são objetos concretos. Uma propriedade é um tipo específico de 28 relacionamento cujo domínio é uma classe e o intervalo é um tipo de dado. Relações são relacionamentos estabelecidos entre qualquer par de classes. Para cada relação é atribuído um domínio e um intervalo como classes de origem e destino na relação. Também são consideradas três relações de subsunção estabelecidas, respectivamente, entre duas Classes, duas Propriedades e duas Relações. Essas relações permitem modelar descrições hierárquicas dessas entidades, nomeadas de subclasses, subpropriedades e subrelações. Também é possível referir-se ao inverso dessas relações: superclasses, superpropriedades e superrelações. A Figura 3 representa o metamodelo associado ao modelo de uma ontologia. Figura 3 - Metamodelo de uma ontologia. Adaptado de [20] Uma assinatura S de uma ontologia é uma quádrupla S = C’, P’, R’, I’ onde C’ é um subconjunto de C, P’ é um subconjunto de P, R’ é um subconjunto de R, e I’ é um subconjunto de I [49]. 2.2. Incompatibilidades Ontológicas Ontologias podem diferir em diversos aspectos. Existem várias pesquisas que lidam com a categorização das incompatibilidades ontológicas [36] [37] [20]. As incompatibilidades que podem ocorrer entre as ontologias podem ser a chave de diversos problemas que impedem a utilização combinada de ontologias desenvolvidas 29 de forma independente. De acordo com Klein [36], tais incompatibilidades podem ser distinguidas em dois níveis. O primeiro é o nível de linguagem ou meta-modelo. Este é o nível da linguagem primitiva que é utilizada para especificar uma ontologia. Incompatibilidades nesse nível são incompatibilidades entre os mecanismos que definem classes, relações e outros. O segundo nível é o nível de ontologia ou modelo, onde a atual ontologia de domínio reside. A incompatibilidade nesse nível é a diferença na maneira em que o domínio é modelado. Predoiu et al. [37] lista uma exaustiva classificação das incompatibilidades ontológicas que podem ocorrer. Seu trabalho tem como base as classificações de Klein [36] e Wache [38]. Os tipos de imcompatibilidades ontológicas descritos a seguir foram identificados por Predoiu et al. [37] e compiladas por Scharffe [20]. Incompatibilidades no nível de linguagem: Incompatibilidades no nível de linguagem podem ocorrer quando ontologias escritas em diferentes linguagens de ontologias são combinadas. Foram definidos quatro tipos de incompatibilidades que podem ocorrer [37]. Sintaxe: Diferentes linguagens de ontologias utilizam diferentes sintaxes. Por exemplo, para definir uma classe cadeira em RDF Schema (Brickley e Guha 2000) utiliza-se <rdf:Class ID=”Cadeira”>, ao passo que a definição da mesma classe em LOOM2 utiliza-se a expressão (defconcept Cadeira). Esta diferença é provavelmente o tipo mais simples de incompatibilidade. Representação Lógica: Uma incompatibilidade um pouco mais complicada nesse nível é a diferença na representação das noções lógicas. Por exemplo, em algumas linguagens é possível explicitar que duas classes são disjuntas (exemplo: disjoint Cadeira Mesa), ao passo que é necessário utilizar 2 http://www.isi.edu/isd/LOOM/ 30 negação na declaração de subclasses em outras linguagens (exemplo: Cadeira subclasse-of (NOT Mesa), Mesa subclasse-of (NOT Cadeira)). Semântica das primitivas: a mais sutil diferença que pode ocorrer ao nível de linguagem é a semântica de seus construtos. Apesar do fato de algumas vezes a mesma nomenclatura ser utilizada para um construto em duas linguagens, sua semântica pode ser diferente; por exemplo, pode haver várias interpretações para A equalsTo B. Expressividade da Linguagem: A incompatibilidade ao nível de linguagem que possui maior impacto é a diferença na expressividade entre duas linguagens. Essa diferença implica que em algumas linguagens é possível expressar coisas que não são expressáveis em outras linguagens. Por exemplo, algumas linguagens podem conter construtos que expressam negação e outras não. Incompatibilidades no nível de ontologias: Incompatibilidades ao nível de ontologias, ou modelo, ocorrem entre duas ou mais ontologias que descrevem (parcialmente) domínios sobrepostos. Em [37] foram mapeados três principais tipos de incompatibilidades ao nível de modelo, que por sua vez possuem algumas variações, conforme apresentado a seguir. Incompatibilidade de Conceitualização: Neste tipo de incompatibilidade, as ontologias são semanticamente diferentes, isto é, não somente a especificação, mas também a conceitualização do domínio das ontologias envolvidas são diferentes. Incompatibilidades de conceitualização não podem ser resolvidas automaticamente, pois requerem o conhecimento e decisões de um especialista do domínio. Dois subtipos podem ser identificados: Escopo: Duas classes parecem representar o mesmo conceito, mas não podem possuir as mesmas instâncias em nenhum estado possível do universo de 31 discurso sendo modelado, embora possa haver interseção entre elas. Também pode ser chamada de incompatibilidade de classe. Cobertura do modelo e granularidade: Essa é uma incompatibilidade na parte do domínio que é coberto pelas ontologias, ou nível de detalhe em que o domínio é modelado. Um exemplo seria o domínio de automóveis: uma ontologia pode lidar com carros, mas não caminhões. Outra ontologia pode representar caminhões, mas especializando os automóveis em algumas categorias. Incompatibilidades de Explicação: Estes tipos de incompatibilidades estão diretamente relacionados à forma como as ontologias foram desenvolvidas, possuindo três subtipos: Estilo de Modelagem: Dois tipos de incompatibilidade podem ocorrer devido a escolhas explícitas do modelador do domínio de acordo com o estilo de modelagem adotado: o Paradigma: Diferentes paradigmas podem ser utilizados para representar conceitos como tempo, ação, planos, atitudes proposicionais, etc. O uso de ontologias de alto nível distintas para cada ontologia [26] é um exemplo desse tipo de incompatibilidade. o Descrição do conceito: Várias escolhas podem ser feitas na modelagem de conceitos em uma ontologia. Por exemplo: uma distinção entre duas classes poderia ser modelada utilizando uma classe única, com um atributo qualificador. Outra escolha na descrição do conceito é a maneira em que a hierarquia “é-um” (is-a) é construída; distinções entre características podem ser maiores ou menores na hierarquia. Por exemplo, a distinção entre publicações científicas e não científicas pode 32 ser realizada de formas diferentes conforme ilustrado nas Figuras 4(a) e 4(b). Figura 4 - Exemplos de representação de um conceito de formas diferentes. Incompatibilidades Terminológicas: Esse tipo de incompatibilidade pode ocorrer devido aos termos utilizados nos conceitos das ontologias e podem ser classificados como: o Termos Sinônimos: Conceitos modelados com a mesma intenção são representados por diferentes nomes. Um exemplo trivial é o uso do termo “carro” em uma ontologia e o termo “automóvel” em outra ontologia. o Termos Homônimos: O significado de um termo é diferente em outro contexto. Por exemplo, o termo “condutor”, no domínio de música, possui significado diferente em um domínio de engenharia elétrica. Incompatibilidades de Codificação: Valores em ontologias podem ser codificados em diferentes formatos. Por exemplo, uma data pode ser representada como “dd/mm/yyyy” ou como “mm-dd-yy”, distâncias podem ser representadas em quilômetros ou milhas, etc. A Figura 5 consolida a classificação das incompatibilidades ontológicas, segundo Predoiu et al. [37]. 33 Figura 5 - Classificação das incompatibilidades ontológicas. Adaptado de [37]. 2.3. Alinhamento de Ontologias Alinhar alguma coisa significa “dispor em linha reta; colocar lado a lado na mesma linha” [35]. Esta breve definição já enfatiza que alinhar é uma atividade envolve objetos que possuem alguma relação mútua. O objetivo de alinhar duas ou mais ontologias é reduzir a heterogeneidade entre elas. Alinhamento de ontologias ocorre no sentido de identificar correspondências semânticas entre as entidades de múltiplas ontologias e é uma condição necessária para estabilizar a interoperabilidade entre elas [19]. Alinhar duas ontologias torna-se útil quando dados de uma ontologia são necessários ser descritos em outra de diferentes formas, tais como: transformação de dados de uma descrição para outra, transformação de consultas endereçadas para uma ontologia para consultas em outras ontologias. Este processo é chamado de mediação de ontologias [20]. Em alguns casos, mediação de ontologias pode também estar relacionada com a execução de operações na estrutura das ontologias, tal como a fusão de ontologias, relacionando duas versões de uma ontologia. Alinhamento de ontologias é uma disciplina que possui raízes no domínio de integração de bancos de dados, com algumas diferenças, sendo uma das principais pelo 34 fato que estruturas de ontologias são estruturas taxonômicas com a semântica mais rica do que esquemas de bancos de dados relacionais [20]. Considerando o alinhamento ilustrado na Figura 6, as arestas pontilhadas indicam correspondências entre as ontologias O e O’. Neste exemplo, é apresentado que existe uma correspondência entre os elementos Carro e Automóvel das ontologias O e O’ respectivamente. Além disso, é possível indicar o grau de confiança (também chamado de força) de cada correspondência, através da atribuição de peso à aresta. A confiança da correspondência entre Carro e Automóvel é 0.9. Figura 6 - Exemplo de alinhamento entre duas ontologias. Adaptado de [45]. Sejam duas ontologias O=C, R, P, I, a e O´=C´, R´, P´, I´, a´ a serem alinhadas. Define-se E = {C R I} como o conjunto de entidades de O e, analogamente, E´ = {C´ R´ I´} o conjunto de entidades de O´. Formalmente, um processo de alinhamento de ontologias recebe as duas ontologias O e O’ de entrada e, opcionalmente, um alinhamento inicial A (que pode ser um alinhamento preliminar previamente estabelecido). O resultado deste processo é um alinhamento A´. Neste processo, podem ser aplicados um conjunto r de recursos externos (por exemplo, conhecimentos comuns e tesauro específico de um domínio) e um conjunto de parâmetros p [13]. A Figura 7 ilustra este processo, que pode ser formalmente representado por A’ = f (O, O’, A, p, r). 35 Figura 7 - Processo de alinhamento de duas ontologias [13]. O processo de alinhamento de ontologias busca estabelecer ligações semânticas (denominadas correspondências) entre as entidades das ontologias de entrada (O e O’). Sendo assim, o resultado desse processo (A´) é o conjunto das correspondências estabelecidas entre as entidades de O e de O´. Formalmente, uma correspondência é uma quádrupla e, e’, r, n de modo que e E é a primeira entidade da relação, identificada de maneira única por uma URI e que representa uma entidade discreta de O; e’ E’ é a segunda entidade da relação, identificada de maneira única por uma URI e que representa uma entidade discreta de O´; r é a semântica da correspondência entre as duas entidades (alguns exemplos podem ser igualdade, subsunção, incompatibilidade e até mesmo uma relação fuzzy); e n [0,1] é um valor que denota a confiança da correspondência. Os tipos de correspondências podem ser classificados entre correspondências simples e correspondências complexas [13] [48]. Dadas duas ontologias O e O’, uma correspondência simples é uma correspondência onde as entidades correspondentes são restritas a serem conceitos atômicos ou propriedades atômicas. Uma correspondência complexa é uma correspondência onde entidades correspondentes podem ser expressões OWL3 (expressão de conceito ou relação, isto é, conceitos ou relações não nomeadas), ou possuírem semântica baseada em modelos: domínio e intervalo entre propriedade e classes e inversão de propriedades. 3 Acrônimo para Ontology Web Language, é uma linguagem de representação de ontologias na web onde podem ser descritas classes, propriedades e suas relações. 36 Correspondências são tipicamente representadas utilizando linguagens específicas. Em [20] são considerados três níveis de abstração para representar correspondências entre ontologias, onde os níveis refletem as formas de mediação de ontologias. O alinhamento de ontologias está no nível intermediário, fazendo a ligação entre uma fase em tempo de projeto (design-time), onde o alinhamento é construído, e uma fase em tempo de execução (run-time), onde o alinhamento é transformado em uma linguagem mediadora de acordo com a tarefa a ser executada. No nível mais baixo da pilha estão as correspondências fundamentais, representadas e executadas por sistemas de mediação de dados. Clássicas representações neste nível são formalismos lógicos de um reasoner ou de uma linguagem de programação de um sistema de mediação de dados. Por exemplo, uma transformação de instâncias de uma classe origem de uma ontologia de origem O para uma classe destino de uma ontologia O’ pode ser representada conforme a consulta SPARQL 4 a seguir, que representa uma correspondência fundamental para uma tarefa específica de transformação de instâncias: CONSTRUCT{ ?X rdf:type O:source } WHERE{ ?X rdf:type O’:target. } A Figura 8 apresenta um exemplo de um fragmento de alinhamento entre as ontologias FOAF 5 e vCard 6 , expresso na linguagem de alinhamento de ontologias Alignment Format: 4 Acrônico de Simple Protocol and RDF Query Language, é uma linguagem de consulta em estruturas RDF. 5 Friend Of A Friend: http://xmlns.com/foaf/spec/ 6 vCard: http://www.w3.org/TR/vcard-rdf 37 <Alignment> <xml>yes</xml> <level>0</level> <type>**</type> <onto1>&foaf</onto1> <onto2>&vcard</onto2> <map> <Cell> <entity1 rdf:resource="&foaf;name"/> <entity2 rdf:resource="&vcard;name"/> <measure rdf:datatype="&xsd;float">1.0</measure> <relation>=</relation> </Cell> </map> </Alignment> Figura 8 – Fragmento da representação de um alinhamento entre as ontologias FOAF e vCard. 2.4. Técnicas de Alinhamento de Ontologias As técnicas de alinhamento de ontologias podem ser divididas em várias categorias, conforme descrito por Euzenat e Shvaiko [13] e ilustrado na Figura 9. Figura 9 - Classificação das técnicas de alinhamento de ontologias. Fonte: [13]. As técnicas básicas (representadas pelos retângulos) são classificadas segundo dois enfoques: (i) no eixo superior da figura, o enfoque Granularidade / Interpretação de Entrada (Granularity/Input Interpretation) distingue as técnicas quanto à granularidade da análise (ou seja, se a técnica analisa as ontologias no nível dos elementos ou no nível de estrutura) e quanto ao foco na interpretação das informações 38 de entrada (ou seja, se a técnica trabalha a nível sintático, semântico ou considerando recursos externos); (ii) no eixo inferior da figura, o enfoque Tipo de Entrada (Kind of Input) distingue as técnicas quanto ao tipo dos insumos explorados (strings nas técnicas terminológicas, estrutura nas técnicas estruturais, modelos nas técnicas semânticas ou instâncias nas técnicas extensionais). A seguir cada uma das técnicas de alinhamento é descrita de forma resumida: Baseadas em strings (String-based): utilizadas na comparação dos nomes e rótulos das entidades. Essas técnicas consideram as strings como uma sequência de letras do alfabeto, em geral baseadas na seguinte intuição: quanto mais similares as strings, maior a probabilidade de que elas representem o mesmo conceito. Baseadas em linguagem (Language-based): também utilizadas na comparação dos nomes das entidades, considerando esses nomes como palavras de uma linguagem natural. Técnicas dessa natureza são baseadas em processamento de linguagem natural, explorando propriedades morfológicas das palavras. Recursos linguísticos (Linguistic-resources): também consideram os nomes como palavras de uma linguagem natural, mas nesse caso as técnicas se apoiam em recursos externos, como tesauros específicos do domínio, com foco nas relações linguísticas, como sinônimos, por exemplo. Baseadas em restrições (Constraint-based): englobam algoritmos que lidam com as restrições internas aplicadas às definições das entidades, como tipo de dado, cardinalidade de atributos etc. Reuso de alinhamentos (Alignment reuse): exploram recursos externos que armazenam resultados de alinhamentos disponíveis. Com a aplicação dessa 39 técnica, os resultados do alinhamento entre O e O’ e entre O e O’’ podem ser utilizados no processamento do alinhamento entre O’ e O’’, por exemplo. Ontologias de fundamentação e ontologias específicas de domínio (Upper level, domain specific ontologies): ontologias de fundamentação podem ser utilizadas como recursos externos de conhecimento comum e a sua principal característica é configurar-se como sistemas baseados em lógica. Desse modo, técnicas que exploram esses recursos são classificadas como semânticas. Ontologias específicas de domínio também podem ser utilizadas como recursos externos de conhecimento comum, pois utilizam termos com sentidos relevantes para o domínio e que em geral não estão relacionados a conceitos similares em outros domínios. Técnicas de análise e de estatísticas de dados (Data analysis and statistics): técnicas que tiram proveito de amostras (preferencialmente grandes) de uma população com o objetivo de identificar regularidades e discrepâncias ao agrupar itens ou computar distâncias entre eles. Baseadas em grafo (Graph based): técnicas baseadas na análise da estrutura das ontologias, através da sua representação como grafos rotulados. O cálculo da similaridade entre um par de nós das duas ontologias baseia-se na análise de suas posições dentro do grafo, considerando que se dois nós de duas ontologias são similares, suas vizinhanças (ou seja, seus nós adjacentes) também devem apresentar um nível de similaridade. Baseadas em taxonomia (Taxonomy based): também consistem em algoritmos baseados em grafo, que restringem a análise à relação de especialização. Da mesma forma que as técnicas baseadas em grafo, se uma ligação do tipo “é um” 40 (is-a) conecta termos já considerados similares, é provável que seus nós adjacentes também sejam similares. Repositório de estruturas (Repository of structures): repositórios de estruturas armazenam ontologias e seus fragmentos, juntamente com o grau de confiança das correspondências entre pares de entidades. Ao contrário do reuso de alinhamento, repositórios de estruturas armazenam apenas similaridades entre ontologias, e não alinhamentos. No alinhamento de novas estruturas (ontologias ou fragmentos), primeiro busca-se por similaridades checando-se as estruturas disponíveis no repositório. O objetivo é identificar estruturas suficientemente similares que validem o esforço em prosseguir com o alinhamento, evitando operações sobre estruturas divergentes. Baseadas em modelo (Model based): algoritmos baseados em modelo manipulam as entradas com base na sua interpretação semântica. A ideia por trás desse tipo de técnica é que, se duas entidades são similares, elas compartilham a mesma interpretação lógica. Exemplos são mecanismos de inferência lógica, assumindo que as ontologias são expressas em um formalismo lógico adequado. 2.5. Qualidade do Alinhamento de Ontologias A seleção das métricas para a avaliação do alinhamento de ontologias é uma tarefa que deve levar em consideração o critério de não favorecer qualquer abordagem de alinhamento. Para a tarefa de alinhamento de ontologias, tipicamente têm sido utilizadas as seguintes métricas [18] [19]: Verdadeiros Positivos (VP): É o conjunto de correspondências encontradas, que fazem parte do conjunto de correspondências do alinhamento de referência; 41 Falsos Positivos (FP): É o conjunto de correspondências encontradas, que não fazem parte do conjunto correspondências do alinhamento de referência; Falsos Negativos (FN): É o conjunto de pares de elementos que não foram encontradas e que estão presentes no conjunto de correspondências do alinhamento de referência; Precisão (Precision): A precisão mede a proporção de correspondências corretas que foram encontradas, ou seja, dentre as correspondências encontradas quantas realmente são corretas. Dado um alinhamento de referência R, a precisão de um alinhamento A pode ser calculada da seguinte forma: VP P(A,R) = VP FP Cobertura (Recall): A cobertura mede a proporção de correspondências encontradas dentre todas as corretas. Dado um alinhamento de referência R, a cobertura de um alinhamento A pode ser calculada da seguinte forma: VP R(A,R) = VP FN Medida-F (F-Measure): A Medida-F representa a harmonização entre a precisão e a cobertura. É a medida principal para avaliar a qualidade de um alinhamento já que é amplamente utilizada para a avaliação geral de um alinhamento [13] [18] [19] [39]. Dado um alinhamento de referência R, a precisão e a cobertura, a medida-F pode ser calculada da seguinte forma: 2 ( b 1).P ( A, R ).R ( A, R ) F(A,R) = 2 b . P(A,R) R(A,R) Com b=1 sendo um fator de peso padrão, chega-se a: 2. P ( A, R ).R ( A, R ) F1(A,R)= P ( A, R ) R ( A, R ) 42 2.6. Linguagens para Representação de Alinhamentos de Ontologias Uma variedade de linguagens para representação de alinhamento de ontologias surgiu nos últimos anos. A seguir serão apresentadas brevemente algumas dessas linguagens. Uma análise exaustiva e comparativa foi realizada por Scharffe [20] e compilada conforme a seguir. A linguagem alignment format [39] foi originalmente desenvolvida para prover um formato comum a fim de permitir a avaliação dos resultados gerados por algoritmos de alinhamento de ontologias. Este formato distingue três níveis de complexidade de alinhamentos, a saber: (i) no nível 0, correspondências simples entre duas entidades descritas por suas URIs, com uma relação específica entre elas (equivalência, subsunção, por exemplo); (ii) no nível 1, correspondências podem ser expressas entre conjuntos de entidades; (iii) no nível 2, conjuntos de entidades podem ser especificados utilizando restrições e noções de path. Este formato é utilizado pela Ontology Alignment Evaluation Initiative7. A C-OWL [41] é uma extensão da linguagem OWL que possui como objetivo expressar mapeamentos entre ontologias escritas em OWL. Os construtos da linguagem C-OWL são chamados de bridge rules (regras de pontes), e permitem expressar uma família de relações semânticas entre conceitos / papéis e indivíduos interpretados em domínios heterogêneos. Dadas duas ontologias O e O’, uma bridge rule de O para O’ expressa uma relação semântica entre um conceito / papel / indivíduo de O em um conceito / papel / indivíduo de O’. Bridge rules são direcionais no sentido que bridge rules de O para O’ não são o inverso das bridge rules de O´ para O. C-OWL é baseado na linguagem OWL, mas é relativamente independente dessa linguagem 7 http://oaei.ontologymatching.org 43 A Distributed Description Logics (DDL), ou Lógica de Descrição Distribuída [42], é uma lógica que formaliza uma rede de ontologias composta de múltiplos relacionamentos um-para-um entre ontologias. Cada ontologia é representada em lógica de descrição 𝒮ℋℐ𝒬 [28]. Correspondências entre entidades são expressas utilizando regras de ponte que são subsunções entre uma entidade de uma ontologia e uma entidade de outra ontologia. A XeOML [43] é uma linguagem extensível baseada em XML para descrever alinhamentos entre ontologias. O esquema Abstract Mapping descreve uma estrutura genérica de um alinhamento, independente do tipo de correspondências ou entidades que serão utilizadas no alinhamento propriamente dito. Para construir um alinhamento, dois esquemas adicionais são utilizados: (i) o esquema Ontology Elements Definition é uma extensão que descreve as entidades ontológicas que serão alinhadas; (ii) o esquema Mappings Definition é uma extensão que indica as possíveis relações estabelecidas entre entidades correspondentes. A especificação de um alinhamento é realizada entre uma ontologia da esquerda – left ontology (LO), e uma ontologia da direita – rigth ontology (RO). Correspondências podem ser simples ou complexas. Correspondências simples ocorrem entre entidades simples, correspondências complexas podem envolver muitaspara-muitas entidades combinadas de acordo com a relação especificada no esquema Ontology Elements Definition. A Expressive Declarative Ontology Alignment Language (EDOAL) é uma extensão da linguagem Alignment Format, apresentada anteriormente [44]. Sua semântica permite expressar alinhamentos entre ontologias modeladas em vários formalismos. Essa característica permite a possibilidade de padrões de alinhamento de ontologias serem aplicados para várias linguagens de ontologias, desde que essas linguagens sejam gerenciadas ao nível de ferramenta. EDOAL utiliza construtos de 44 classes, relações, propriedades e instâncias para a representação de entidades ontológicas. Cada correspondência modela uma relação entre as entidades da correspondência: equivalência, subsunção, disjunção e a adesão de indivíduo a uma classe. Instâncias são indivíduos, classes modelam classes de indivíduos, relações são relações binárias entre indivíduos e propriedades são relações binárias estabelecidas entre indivíduos e um valor de dado. O termo “atributo” pode ser utilizado quando se referir a uma relação ou a uma propriedade sem distinção. Descrições expressivas de correspondências podem ser modeladas, permitindo a captura de correspondências complexas necessárias para a resolução de incompatibilidades ontológicas. Entidades ontológicas podem ser agrupadas utilizando operadores de conjuntos. Cadeias de relações e propriedades podem ser compostas. Condições e filtros podem ser aplicados para restringir o escopo de entidades que participam de uma correspondência. Transformações de valores de propriedades são possíveis utilizando funções XPath 8 (linguagem utilizada para navegar através de elementos e atributos em um documento XML). Finalmente, a linguagem foi estendida para suportar variáveis que permitam representar placeholders (espaços reservados) para entidades em padrões. A Tabela 1 resume a representação dos construtos fornecidos pela linguagem EDOAL. Tabela 1 - Resumo dos construtos da linguagem EDOAL. Tipo de Construto Relações de Correspondência Entidades Construtos de Classe Construtos de Relação 8 Nome do Construto (sintaxe abstrata) Equivalência, Subsunção, Disjunção, Membro (≡, ⊑, ⊥, ∈) Classe, Relação, Propriedade, Instância, Valor, Tipo de Dado, Comparador (C, R, P, u, Val, d, cp) E, Ou, Não (⊓,⊔, ¬) E, Ou, Não, Inverso, Transitivo, Reflexivo, Simétrico (⊓,⊔, ¬, inv(R), sym(R), trans(R), refl(R)) http://www.w3.org/TR/xpath/ 45 Comentário Conjunto de operados para construto de classe. Conjunto de operadores para construtos de relação. first, next (R · R) E, Ou, Não (⊓,⊔, ¬) Construtos de Propriedades First, Next (R · P) Valor, Domínio (cp(Val), dom(C), range(C)) Conjunto de operadores para construtos de propriedades. Construtos de caminho de propriedades. Restrição de escopo de uma propriedade de acordo com seu valor , domínio ou intervalo. Função de transformação em valores de propriedades de transformações XPath, ou definidas pelo usuário. Transformação de Valores de Propriedades Transformação (transf(R)) Restrições de Classe Valor de Atribuo (∃P cp Val), domain, cardinality (∃P cp d, ∃|P| cp Val ) Restrição de escopo de uma classe de acordo com o valor em um de seus atributos. Variáveis ?x Espaço reservado (placeholder) de uma entidade. A Tabela 2 apresenta um comparativo entre as linguagens apresentadas, conforme os critérios a seguir: Compatibilidade Web: O elemento base para referenciar recursos na web é sua URI. Baseado nessa premissa, representações RDF são padrões que permitem um alinhamento ser compatilhado na web. Isto pode, em princípio, habilitar a extensibilidade de um formato, permitindo introduzir novas propriedades, assim como referenciar um conjunto particular de correspondencias individualmente. Entidades: Apresenta os tipos de entidades suportadas pela linguagem na representação de uma correspondênca. Expressividade: Características funcionais são utilizadas para descrever correspondências mais precisas que simples correspondências um-para-um entre as entidades de duas ontologias. A expressividade da linguagem é proporcional ao número e complexidade das características funcionais disponíveis na linguagem. Semântica: Este critério foca no significado do mapeamento de expressões em cada linguagem, que é como os construtos da linguagem podem ser interpretados. 46 Extensibilidade: É a capacidade de extender a linguagem para propósitos específicos. Padrões: Determina se a linguagem é possivelmente utilizada para a representação de padrões. Tabela 2 – Comparativo entre as linguagens de alinhamento de ontologias. Nome Compatibilidade Web Entidades Expressividade Semântica Extensível Padrões Alignment Format URIs + RDF/XML Toda entidade que possuir uma URI Somente URI para URI Não Sim Não C-OWL Sim, extensão da OWL Entidades OWL Modelos locais Não conhecida Não DDL Ontologias OWL Entidades OWL Modelos locais Não conhecida Não Sem limitações Não Sim Possível abordagem Alta expressividade Independente de formalismos Sim Sim XeOML Sim EDOAL Sim 2.7. Classes, propriedades, relações, instâncias Classes, propriedades, relações, instâncias Entidades simples, sem transformações Entidades simples, sem transformações. Relações de subsunção somente. Padrões de Projeto Quando especialistas trabalham em um problema particular não é muito comum que sejam propostas novas soluções completamente distintas das já existentes. Frequentemente, soluções de problemas similares são recuperadas e a essência da solução é reutilizada para a resolução do novo problema. Esse tipo de “comportamento especialista”, que pensa no par problema-solução, é muito comum em diferentes domínios, como Arquitetura, Economia e Engenharia de Software. Abstraindo o par problema-solução e considerando os fatores que levam à reutilização de soluções já aplicadas a problemas dentro do mesmo contexto, o termo “padrão” pode ser definido da seguinte forma [46]: 47 Cada padrão é uma regra de três partes, que expressa a relação entre certo contexto, um problema e uma solução. Como um elemento no mundo, cada padrão é um relacionamento entre certo contexto, certo sistema de forças que ocorrem repetidamente em um contexto e uma determinada configuração que permite que estas forças se resolvam. Como um elemento de linguagem, um padrão é uma instrução que demonstra como essa configuração pode ser utilizada mais de uma vez para resolver um sistema de forças, sempre que o contexto for relevante. Padrões auxiliam na construção de uma experiência coletiva baseada nas habilidades de engenheiros de software. Eles capturam experiências existentes e comprovadas no desenvolvimento de software e ajudam a promover boas práticas de design. Cada padrão lida com um problema específico e recorrente de design ou implementação de um software. Padrões podem ser utilizados para construir arquiteturas de software com propriedades específicas. Um padrão de arquitetura de software descreve um problema particular de design (projeto) que surge em contextos específicos e apresenta um comprovado esquema genérico para sua solução. O esquema de solução é especificado descrevendo seus componentes, suas responsabilidades e relacionamentos, e a maneira como estes colaboram [40]. De acordo com Buschmann et al. [40], todo padrão possui um esquema de três partes: Contexto: uma situação em que surge um problema. Problema: um recorrente problema que surge um determinado contexto. Solução: uma resolução comprovada do problema. O contexto estende a simples dicotomia problema-solução descrevendo situações em que o problema ocorre. O contexto de um padrão pode ser bem geral, por exemplo, “desenvolvendo software como interface homem-máquina”. Por outro lado o 48 contexto pode amarrar padrões específicos juntos, como “implementação de mecanismo de propagação de mudanças na arquitetura Model-View-Controller”. Especificar o correto contexto para um padrão é uma tarefa difícil. Acredita-se que é praticamente impossível determinar todas as situações, mais gerais e específicas, em que um padrão pode ser aplicado [40]. Uma abordagem mais pragmática é listar todas as situações conhecidas onde um problema endereçado por um padrão pode ocorrer. Isso não garante que serão cobertas todas as situações em que um padrão pode ser relevante, mas ao mesmo é um guia válido. O problema descreve um resultado negativo que surge repetidamente em um determinado contexto. Inclui uma especificação geral do problema capturando sua maior essência (qual é a real questão que se deseja resolver), um conjunto de forças que são aspectos do problema que devem ser considerados para resolvê-lo (requisitos que a solução deve cumprir, restrições que devem ser consideradas, ou propriedades desejáveis da solução). A solução descreve como resolver o problema recorrente, ou melhor, como balancear as forças associadas a ele. Na arquitetura de software uma solução inclui dois aspectos: a estrutura e o comportamento em tempo de execução. Um padrão fornece um esquema de solução ao invés de um artefato totalmente especificado. Especialistas devem ser capazes de reutilizar a solução em várias implementações, mas sua essência deve ser mantida. Após aplicar um padrão, uma arquitetura pode incluir uma estrutura particular que provê as funções especificadas pelo padrão, mas ajustadas e adaptadas às necessidades do problema corrente. O diagrama a seguir sumariza os componentes principais de um padrão: 49 Figura 10 - Diagrama representando a composição de um padrão. 2.8. Antipadrões de Projeto Um antipadrão é uma descrição de uma situação problemática que é comumente aplicada sobre um cenário e que gera, definitivamente, consequências negativas. Quando devidamente documentado, um antipadrão descreve a situação problemática de forma geral, as causas primárias que levam a essa situação problemática, sintomas que descrevem como reconhecer o antipadrão, consequências da utilização desta situação problemática e uma solução refatorada que pode mudar o antipadrão em uma solução mais adequada. O termo antipadrão ganhou grande notoriedade na comunidade de engenharia de software através de Micheal Akroyd [47], cujo trabalho identificou construtos de softwares prejudiciais que são recorrentes em vários projetos de software. Um antipadrão pode ser documentado de três formas [22]: Pseudo Antipadrão: é um modelo de documentação de antipadrão onde o autor apenas descreve a situação problemática. Essa pode ser a forma inicial de um antipadrão. A situação problemática é descoberta e nomeada, mas uma solução refatorada para tal a solução problemática ainda não existe A Tabela 3 apresenta os componentes desse modelo de documentação de antipadrão. 50 Tabela 3 – Modelo de Pseudo Antipadrão Item Nome Problema Breve Descrição Como o antipadrão é chamado? Como é caracterizado? Mini Antipadrão: é um modelo de documentação de antipadrão onde o autor descreve o antipadrão informalmente. É a forma mais básica do antipadrão, inclui seu nome, a solução problemática e a solução refatorada. A Tabela 4 apresenta os componentes desse modelo de documentação de antipadrão. Tabela 4 – Modelo de Mini Antipadrão Item Nome Problema Solução Refatorada Breve Descrição Como o antipadrão é chamado? Qual é a solução recorrente que causa consequências negativas? Como pode-se evitar minimizar ou refatorar o problema descrito pelo antipadrão? Antipadrão Completo: é um modelo de documentação de antipadrão onde o autor descreve um antipadrão de forma mais completa. Apresenta uma descrição detalhada e características específicas do antipadrão. A Tabela 5 apresenta os componentes desse modelo de documentação de antipadrão. Tabela 5 – Modelo de Antipadrão Completo Item Nome Também conhecido como Escala mais frequente Nome da solução refatorada Tipo de solução refatorada Causa raiz Breve Descrição O nome do antipadrão é uma frase com significado único. É importante que cada antipadrão possua um nome que possa identifica-lo individualmente. Nomes populares ou frases descritivas adicionais ao nome do antipadrão. Escala de ocorrência do antipadrão. Pode ser, por exemplo, idioma, micro-arquitetura, framework, aplicação, sistema, ou indústria/global. A escala também abrange o escopo da dimensão da solução. Alguns antipadrões definem soluções em diferentes escalas. Identifica o padrão refatorado para a solução. Uma solução pode ser dada em nível de software, tecnologia, processo e papeis. Solução em nível de software indica que um novo software é criado para a solução. Tecnologia indica que a solução implica na aquisição de nova tecnologia ou um produto. Processo indica que deve seguir uma solução a partir do processo envolvido. Papel indica que a solução implica na atribuição de responsabilidades a um indivíduo ou grupo. É, ou são, as causas gerais da solução problemática do antipadrão. 51 Forças desbalanceadas Evidência anedótica Plano de fundo Forma geral do antipadrão Sintomas e consequências Causas típicas Exceções conhecidas Solução refatorada Variações Exemplo Soluções relacionadas 2.9. Identifica as forças primárias que são ignoradas, mal utilizadas ou utilizadas em demasia nesse antipadrão. Frequentes frases do dia-a-dia associadas ao antipadrão. É opcional. Contém exemplos de onde o problema pode ocorrer ou informações gerais que podem ser úteis para melhor entendimento do antipadrão. É opcional. Apresenta um diagrama que identifica características gerais do antipadrão. Uma lista de consequências e sintomas que resultam do antipadrão identificado. Uma lista de fatores que levam à ocorrência do antipadrão. O comportamento de um antipadrão nem sempre pode ser considerado indesejado em alguns casos específicos. Aqui são brevemente apresentas exceções conhecidas desse antipadrão. Aqui é apresentada a solução refatorada que resolve as forças desbalanceadas identificadas. Essa solução deve ser descrita sem variações. Estas devem ser descritas no item Variações. Item opcional que lista as maiores variações do antipadrão. Adicionalmente, soluções alternativas devem ser descritas aqui. Apresenta um ou mais exemplos do antipadrão abstraído da experiência do autor. Lista citações e referencias cruzadas apropriadas ao contexto do antipadrão. Padrões de Correspondência de Ontologias Para estabelecer correspondências entre duas ontologias que estão sendo alinhadas, é necessário conhecimento sobre o domínio, assim como sobre o sistema utilizado para realizar o alinhamento [20]. A busca por tais correspondências pode ser uma árdua e longa tarefa, especialmente se as ontologias forem grandes mas, uma vez definido um alinhamento, este pode ser reutilizado em vários cenários que envolvam o par de ontologias que foram alinhadas. No entanto, dado qualquer outro par de ontologias a serem alinhadas, o alinhamento definido previamente não pode ser reutilizado, requerendo executar todo o processo de busca por corrrespondências novamente. Padrões de correspondência são, essencialmente, um conjunto de correspondências genéricas, ou seja, entre entidades não especificadas individualmente, mas que respeitem restrições estruturais pré-definidas. Uma vez definidos, os padrões de correspondência atuam como modelos que auxiliam a localizar correspondências em cenários mais abrangentes do que simplesmente em um par de entidades específicas. 52 Como exemplo de um padrão de correspondência de ontologias, considere a ontologia “Wine Ontology” 9 (que aqui denominaremos ontologia wine), sua classe principal Wine e a classe BordeauxWine que agrupa instâncias de um popular vinho francês feito na região de Bordeaux. Considere também a ontologia “Ontologie du Vin” 10 (que aqui denominaremos ontologia vin), na qual um vinho similar é expresso como uma instância da classe Vin com um atributo terroir 11 indicando a procedência do vinho. Sistemas de alinhamento de ontologias são capazes de identificar duas correspondências: wine:Wine, vin:Vin, ≡, _, estabelecendo uma relação de equivalência entre dois vinhos, e wine:BordeauxWine, vin:Vin, ⊑, _ estabelecendo que wine:BordeauxWine é uma especialização de vin:Vin. Neste caso, uma correspondência mais precisa seria restringir o escopo de vin:Vin a somente às instâncias que possuam “Bordeaux” como valor no atributo terroir. Essa seria uma correspondência complexa, onde o escopo de uma classe é equivalente ao subconjunto de objetos da outra classe que tenham determinado valor em um atributo. Tal situação pode ser generalizada como um padrão de correspondência restrição de valor de atributo, conforme ilustrado na Figura 11. Na Figura 11, o retângulo maior delimita o padrão de correspondência; os retângulos menores representam correspondências entre um conjunto de entidades que fazem parte do padrão. A linha pontilhada entre os retângulos menores representa dependência entre correspondências. As linhas ligadas diretamente aos retângulos menores representam entidades que fazem parte da correspondência, onde um exemplo de instância é dado para cada caso, dentro dos retângulos pontilhados. Setas entre as entidades indicam relações de especialização, predicados e objetos em RDF. 9 Disponível em: http://www.w3.org/TR/2003/CR-owl-guide-20030818/wine Disponível em: http://www.scharffe.fr/ontologies/OntologyDuVin.wsml. 11 Terroir é uma palavra francesa que denota uma particular região de agricultura. 10 53 Figura 11 - Exemplo de padrão de correspondência “restrição de valor de atributo” A Figura 12 ilustra a representação computacional na linguagem EDOAL do padrão de correspondência ilustrado na Figura 11. <map> <Cell> <entity1> <Class rdf:about="A"> <condition> <AttributeValueCondition> <restriction> <Restriction> <onAttribute> <Path> <first> <Property rdf:about="A"/> </first> </Path> </onAttribute> <comparator>xsd:Equal</comparator> <value>X</value> </Restriction> </restriction> </AttributeValueCondition> </condition> </Class> </entity1> <entity2> <Class rdf:about="B"/> </entity2> </Cell> </map> Figura 12 - Representação computacional na linguagem EDOAL do padrão de correspondência restrição de valor de atributo” Uma instância do padrão de correspondência anterior é ilustrada na Figura 13, também na linguagem EDOAL: <map> <Cell> <entity1> <Class rdf:about="vin:Vin"> <condition> <AttributeValueCondition> <restriction> <Restriction> <onAttribute> <Path> <first> <Property rdf:about="vin:terroir"/> </first> 54 </Path> </onAttribute> <comparator>xsd:Equal</comparator> <value>geo:Bordelais</value> </Restriction> </restriction> </AttributeValueCondition> </condition> </Class> </entity1> <entity2> <Class rdf:about="wine:BordeauxWine"/> </entity2> </Cell> </map> Figura 13 - Exemplo de instância de um padrão de correspondência “restrição de valor de atributo”. 55 3. Antipadrões de Correspondência de Ontologias Este capítulo apresenta formalmente a definição de antipadrões de correspondência assim como uma metodologia para a construção de um antipadrão de correspondência. 3.1. Definição de Antipadrões de Correspondência O produto resultante do processo de alinhamento de ontologias é o mapeamento entre as entidades de duas ontologias que estão sendo alinhadas. No entanto, nem sempre um conjunto de correspondências encontradas de fato representa um alinhamento verdadeiro. Por exemplo, a Figura 14 apresenta o fragmento do alinhamento entre duas ontologias o1 e o2, onde o retângulo que envolve duas classes indica que estas são disjuntas. Suponha que uma ferramenta de alinhamentos identifique as seguintes correspondências, representadas na Figura 14, onde o símbolo ≡ representa um relacionamento de equivalência: o1:Document, o2:Document, ≡, 1.0 e o1:Reviewer, o2:Review, ≡, 0.9. Sabemos que estas correspondências são inconsistentes, pois resultam em problemas lógicos. Suponha em um cenário em que x é uma instância de o1:Reviewer. Pela correspondência estabelecida, x também é uma instância de o2:Review. Assim, x é também uma instância de o2:Document. Isto segue que cada instância de o1:Reviewer é 56 também uma instância de o1:Document. No entanto, a modelagem de o1 mostra que x não pode ser uma instância de o1:Document, dado que as classes o1:Person e o1:Document são disjuntas e o1:Reviewer é uma especialização de o1:Person, originando assim uma contradição lógica [49]. Figura 14 - Fragmento de duas ontologias e um problema de alinhamento. Assim sendo, uma correspondência, pode gerar problemas de inconsistência lógica, quando estabelecida de forma inadequada. Isso pode ocorrer, por exemplo, quando as ontologias alinhadas, em conjunto com o alinhamento gerado, forem submetidas a um processo de mediação de dados ou fusão de ontologias, ou simplesmente quando forem submetidas a um raciocinador lógico. Desse modo, um antipadrão de correspondência é um conjunto de correspondências e/ou de não correspondências genéricas (ou seja, entre entidades não especificadas individualmente) que, quando ocorrem combinadas com características das ontologias que estão sendo alinhadas, representam situações problemáticas (inconsistentes logicamente). O objetivo de um antipadrão de correspondência é identificar uma inconsistência em um alinhamento. Uma vez identificada, esta inconsistência é apresentada ao especialista de domínio, que deve ser capaz de refatorar a situação para eliminar a 57 inconsistência, de forma a manter a semântica adequada no cenário de alinhamento em questão. Definição 1 (Antipadrão de Correspondência): Dadas duas ontologias alinhadas O e O’, e duas assinaturas S e S’ referentes às ontologias O e O’, respectivamente, um antipadrão de correspondência T é uma quádrupla <D, N, S, S’>, tal que D é um conjunto de correspondências genéricas12 e N é um conjunto de nãocorrespondências. Assim como em padrões e antipadrões de projeto, T é especificado como um modelo, isso é, uma teoria referindo-se a entidades genéricas (independentes de domínio) e suas relações. Em situações reais de uso, portanto, os antipadrões de alinhamento precisam ser instanciados. Definição 2 (Instância de Antipadrão de Correspondência): Dadas duas ontologias alinhadas O e O’, e um antipadrão de correspondência T=<D, N, S, S’>, uma instância t do antipadrão de correspondência T é o resultado de um processo que indica uma afirmação ou negação sobre uma correspondência d, tal que d D, podendo ser representado como t = f (O, O’, A, T, d). O objetivo de um antipadrão de correspondência é identificar uma correspondência inconsistente estabelecida em um alinhamento. Desse modo, uma instância t de um antipadrão de correspondência T ocorre em um alinhamento A entre as ontologias O e O’, tal que D A. A procura por uma instância de T em um dado alinhamento A pode ser executada buscando exaustivamente todas as instâncias possíveis de T em um alinhamento A. As instâncias encontradas representam as evidências dessa solução problemática. 12 Genéricas no sentido que representam entidades genéricas. 58 De acordo com Jean-Mary et al. [29], um alinhamento A pode ser submetido a um processo de verificação semântica, projetado para verificar se certos axiomas inferidos a partir de um alinhamento são realmente afirmados em uma ontologia. Essa abordagem não encontra alinhamentos semanticamente inválidos ou insatisfatíveis, mas sim correspondências que são menos propensas a serem satisfeitas com base nas informações presentes nas ontologias. Essa abordagem é similar à noção de mapeamento de instabilidade definida por Meilicke [49], onde mapeamentos são consideráveis estáveis quando subsunções implícitas pela fusão de ontologias mapeadas e seu mapeamento podem ser verificadas nas próprias ontologias. Definição 3 (Correspondência Inconsistente): Sejam o1 e o2 duas ontologias, A um alinhamento entre o1 e o2 e d = o1:e1, o2:e1, ≡, _ uma correspondência, onde d A, ≡ representa uma relação de equivalência e _ representa um valor de força qualquer. Considere que oM seja uma ontologia definida pela fusão de o1, o2 e d, onde a correspondência d é transformada em axiomas de equivalências. Suponha que um axioma α envolvendo as entidades em o1 possa ser inferido em oM a partir de relações derivadas da correspondência d; d diz ser verificado em o1, se α é afirmado de forma independente por o1. Se d não pode ser verificado em o1 e o2, então d é uma correspondência inconsistente, que, por consequência, leva a uma inconsistência em A [23]. Para verificar se uma correspondência é inconsistente, alguns tipos de inferências podem ser examinadas em um processo de verificação semântica [23]. Dadas as entidades o1:e1, o1:e2 e o1:e3, sendo entidades distintas em uma ontologia o1, e o2:e1, o2:e2 e o2:e3 entidades distintas em uma ontologia o2, as seguintes verificações semânticas podem ser realizadas, conforme apresetado em [23]: 59 Verificação de correspondências de múltiplas entidades: Uma correspondência de múltiplas entidades, conforme ilustrada na Figura 15(a), ocorre quando um alinhamento contém as correspondências o1:e1, o2:e1, ≡, _ e o1:e2, o2:e1, ≡, _, e o2:e1 é especialização de o2:e2 (o2:e1 ⊑ o2:e2). Supondo que x é uma instância de o1:e1, de acordo com a correspondência o1:e1, o2:e1, ≡, _ podemos deduzir que existe um mundo possível w no qual x é uma instância de o2:e1. Sendo o2:e1 uma especialização de o2:e2, x é necessariamente uma instância de o2:e2 em w. Se essa afirmação não pode ser verificada, logo esse alinhamento também não pode ser verificado. Verificação de correspondências cruzadas: Suponha que na ontologia o1 a entidade o1:e1 seja uma especialização de o1:e2 e na ontologia o2, a entidade o2:e1 seja uma especialização de o2:e2; assim temos que (o1:e1 ⊑ o1:e2) e (o2:e1 ⊑ o2:e2), ou ainda (o1:e1 ⊑ o1:e2) ⊓ (o2:e1 ⊑ o2:e2), conforme apresentado na Figura 15(b). Suponha que x é uma instância de o1:e1; pela correspondência o1:e1, o2:e2, ≡, _, pode-se deduzir que existe um mundo possível w no qual x também é uma instância de o2:e2. Pela correspondência o1:e2, o2:e1, ≡, _, pode-se deduzir também, por o1:e1 ser uma especialização de o1:e2, que x também é uma instância de o2:e1 em w. Se ambas as correspondências não podem ser afirmadas em o1 ou em o2, respectivamente, então o alinhamento não pode ser verificado. Verificação de contradição de disjunção-subsunção (com especialização): Suponha que em uma ontologia o1 a entidade o1:e1 seja uma especialização da entidade o1:e2, ou seja (o1:e1 ⊑ o1:e2), e na ontologia o2 a entidade o2:e1 seja disjunta da entidade o2:e2, podendo esta relação ser representada como (o2:e1 ⊓ o2:e2 ⊑ ⊥) ou, de forma mais simples, 60 disjoint(o2:e1,o2:e2). Considere um alinhamento entre as ontologias o1 e o2 que possua as correspondências o1:e1, o2:e1, ≡, _ e o1:e2, o2:e2, ≡, _, conforme ilustrado na Figura 15(c1). Neste cenário pode-se deduzir que uma instância x de o1:e1, em um possível mundo w, é uma instância de o2:e1 e também é uma instância de o1:e2. Isto segue de modo que essa instância x de o1:e2 também é uma instância de o2:e2 em w. Se ambas as correspondências não podem ser afirmadas em o1 e em o2, respectivamente, então o alinhamento não pode ser verificado. Verificação de contradição de disjunção-subsunção (sem especialização): Suponha que em uma ontologia o1 a entidade o1:e1 seja equivalente à entidade o1:e2, ou seja o1:e1, o1:e2, ≡, _, e na ontologia o2 a entidade o2:e1 seja disjunta da entidade o2:e2, podendo esta relação ser representada como (o2:e1 ⊓ o2:e2 ⊑ ⊥) ou, de forma mais simples, disjoint(o2:e1,o2:e2). Considere um alinhamento entre as ontologias o1 e o2 que possua as correspondências o1:e1, o2:e1, ≡, _ e o1:e2, o2:e2, ≡, _, conforme ilustrado na Figura 15(c2). Neste cenário pode-se deduzir que uma instância x de o1:e1, em um mundo possível w também é uma instância de o2:e1, que por sua vez também é uma instância de o1:e2 em w. Isto segue de modo que essa instância x em w também é uma instância de o2:e2, o que causa uma contradição lógica, então o alinhamento não pode ser verificado. Verificação de incompletude de domínio e intervalo: Sejam duas classes o1:e2 e o2:e2 e duas propriedades o1:p1 e o2:p1, nas ontologias o1 e o2, respectivamente, e um domínio dom(o1:p1) que denota o domínio de uma propriedade o1:p1, e um intervalo range(o1:p1) que denota o intervalo de uma propriedade o1:p1, onde o1:e1 ∈ dom(o1:p1) e o1:e2 ∈ range(o1:p1), podendo 61 ser representado por o1:e1 ⊓ ∃ o1:p1.(o1:e2). Ainda, assuma que o2:e1 ∈ dom(o2:p1) e o2:e2 ∈ range(o2:p1), podendo ser representado por o2:e1 ⊓ ∃o2:p1.(o2:e2). Suponha um alinhamento contém as correspondências o1:e2, o2:e2, ≡, _ e o1:p1, o2:p1, ≡, _, conforme ilustrado na Figura 15(d), isso implica que o2:e1 ∈ dom(o1:p1) e o1:e1 ∈ dom(o2:p1). Se essas afirmações não podem ser confirmadas, então o alinhamento não pode ser verificado. Situação semelhante ocorre com correspondências entre intervalos. Figura 15 - Exemplos de tipos de inferências de verificação semântica. (a) verificação de correspondências de múltiplas entidades; (b) verificação de correspondências cruzada; (c) verificação de contradição de disjunção-subsunção; (d) verificação de incompletude de domínio e intervalo. As setas de linhas sólidas denotam as correspondências entre as entidades. O formalismo lógico adotado neste trabalho para representar as relações entre os conceitos é o SROIQ [30] [31], uma lógica de descrição subjacente à linguagem OWL- 62 DL, que é uma extensão da lógica de descrição SHOIN e é aprovada e utilizada pela W3C13. Para a execução do processo de verificação semântica, algoritmos específicos para tal função são necessários para interpretar as propriedades das ontologias de forma conjugada com o alinhamento qual é desejado verificar sua integridade semântica [29]. Entretanto, modelos de antipadrões de correspondência podem ser construídos a fim de representar uma situação que leva a um alinhamento inconsistente. Como um modelo, um antipadrão deve referir-se a entidades genéricas quais sejam possíveis instanciações de entidades das ontologias que estão sendo alinhadas. O exemplo ilustrado na Figura 14 é um caso típico em que uma verificação semântica do tipo verificação de contradição de disjunção-subsunção identificaria que o alinhamento estaria inconsistente. Assim, este problema, conforme apresentado na Figura 16, pode ser generalizado da seguinte forma, definindo, portanto um antipadrão de correspondência T: considere uma classe e1 em uma ontologia o1 que é subclasse de uma classe e2, que por sua vez é disjunta de uma classe e3, na mesma ontologia o1. Se uma classe e1 na ontologia o2 for equivalentemente correspondente à classe e1 na ontologia o1 e essa mesma classe e1 em o2 for uma subclasse de uma classe e2, também em o2, que por sua vez é equivalentemente correspondente com a classe e3 na ontologia o1, então esse alinhamento não pode ser verificado, o que gera uma inconsistência nesse alinhamento. A fim de denotar que tratam-se de entidades genéricas, ou seja, não instanciadas, utilizaremos o caracter “?” antes de cada entidade. A expressão a seguir representa um modelo de antipadrão de correspondência escrito conforme o formalismo SROIQ: 13 http://www.w3.org/2007/OWL/wiki/SROIQ 63 (?o1:?e1 ≡ ?o2:?e1) ⊓ (?o1:?e1 ⊑ ?o1:?e2) ⊓ (?o1:?e2 ⊓ ?o1:?e3 ⊑ ⊥) ⊓ (?o1:?e3 ≡ ?o2:e2) ⊓ (?o2:?e1 ⊑ ?o2:?e2). Figura 16 – Definição de um antipadrão de correspondência T a partir da generalização de um problema de alinhamento do tipo verificação de contradição de disjunção-subsunção. Para a construção e representação computacional do antipadrão de correspondência T, adotou-se neste trabalho a linguagem EDOAL, conforme apresentada na Seção 2.6. As três principais vantagens dessa linguagem que levaram à sua adoção são: (i) é uma linguagem independente de formalismos ontológicos das entidades que estão sendo representadas; (ii) possui um modelo expressivo para documentar correspondências; (iii) está em conformidade com a tecnologia de web semântica dada sua sintaxe baseada nas linguagens RDF e OWL. O antipadrão T apresentado na Figura 16 pode ser representado utilizando a linguagem EDOAL, conforme fragmento apresentado na Figura 17: <map> <cell> <entity1><Class rdf:about="?o1:?e1"/></entity1> <entity2><Class rdf:about="?o2:?e1"/></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1><Class rdf:about="?o2:?e2" /></entity1> <entity2><Classrdf:about="?o2:?e1" /></entity2> <relation rdf:resource="subsumedBy"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e1" /></entity1> <entity2><Class rdf:about="?o1:?e3" /></entity2> <relation rdf:resource="disjoint"/> </cell> <cell> 64 <entity1><Class rdf:about="?o1:?e2" /></entity1> <entity2><Classrdf:about="?o2:?e2" /></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e2" /></entity1> <entity2><Class rdf:about="?o1:?e3" /></entity2> <relation rdf:resource="subsumedBy"/> </cell> </map> Figura 17 - Representação computacional do antipadrão de correspondência T através da linguagem EDOAL. 3.2. Processo de Identificação e Construção de Antipadrões de Correspondência Para a construção de antipadrões de correspondência, o primeiro passo é ter o correto entendimento do problema que está sendo tratado. Quando devidamente compreendido, o problema identificado pode resultar em modelos de antipadrão de correspondência. O problema que está sendo tratado pode ser em função da análise de erros explícitos encontrados no resultado final de um processo de alinhamento ou pode surgir em função do conhecimento tácito de um especialista. Independente da origem do problema em questão, algumas questões essenciais devem ser observadas para a construção de um antipadrão de correspondência. A Figura 18 apresenta a metodologia proposta por este trabalho para auxiliar na construção de um antipadrão de correspondência. Essa metodologia consiste em responder questões que são essenciais para a identificação e construção de um antipadrão de correspondência. Figura 18 - Metodologia para construção de um antipadrão de correspondência. Passo 1 – Apresentar Solução Problemática: Todo antipadrão tem como objetivo identificar soluções que irão gerar consequências mais negativas que positivas. Quando duas ontologias estão alinhadas, a existência de correspondências incorretas pode resultar em modelos conceituais de ontologias que sejam sintaticamente válidos, 65 mas são propensos a resultar em representações de domínios não intencionais, ou seja, quando utilizado em um modelo, tipicamente fará com que o conjunto de casos válidos (possíveis) do modelo seja diferente das instâncias que representam os estados pretendidos nesse domínio [50], ou podem ainda resultar em incompatibilidades lógicas [49]. O objetivo dessa etapa do processo é identificar qual é a solução utilizada, ou seja, o conjunto de correspondências, que está sendo realizada de forma incorreta que irá resultar em consequências negativas. No cenário apresentado na Figura 14, demonstramos que a correspondência entre as entidades o1:Reviewer e o2:Review resulta em uma incompatibilidade lógica por ser especialização de entidades distintas e disjuntas. Passo 2 – Evidenciar Solução Problemática: Este passo é opcional. A evidenciação de uma solução problemática irá auxiliar no entendimento do problema que está sendo tratado, mas não é obrigatório. Seguindo o exemplo da Figura 14, um sistema de alinhamentos que observe somente a terminologia das ontologias, ou seja, somente as strings de suas entidades, irá identificar que o1:Reviewer e o2:Review são correspondentes, dada a semelhança das strings envolvidas. Passo 3 – Demonstrar Implicações: Aqui deve ser demonstrado porque a solução, ou correspondência, é de fato problemática, ou seja, qual o problema que ocorre quando a referida correspondência é inferida. Dando sequência ao exemplo que está sendo tratado, temos que uma instância x de o1:Reviewer, pela correspondência identificada, também é uma instância de o2:Review. Assim temos que essa instância x é uma especialização de o1:Person e também de o2:Document, que por sua vez são classes disjuntas, resultando em uma contradição lógica. Este é um problema do tipo “contradição de disjunção-subsunção” em um processo de verificação semântica, conforme apresentado anteriormente. 66 Passo 4 – Identificação da Solução Problemática: Uma vez estabelecido o problema, é importante apresentar como esta correspondência indevida, ou conjunto de correspondências, podem ser identificadas dentro de um alinhamento. Aqui é formalizado o antipadrão que está endo construído. Ainda no exemplo que está sendo tratado, as entidades o1:Reviewer e o2:Review não podem ser alinhadas por serem especializações de entidades disjuntas, neste caso, o1:Person e o2:Document. Neste cenário pode-se estabelecer o seguinte postulado: Seja uma classe e1 em uma ontologia o1 que é subclasse de uma classe e2, que por sua vez seja subclasse de uma classe e3 na mesma ontologia o1. Se a classe e3 na ontologia o1 for correspondente por igualdade com a classe e2 na ontologia o2 e a classe e1 da ontologia o2 for disjunta da classe e2 da ontologia o2 e a classe e1 da ontologia o1 for correspondente por igualdade com a classe e1 na ontologia o2, então há um problema de alinhamento. Este problema pode ser formalmente representado da seguinte forma: (?o1:?e1 ≡ ?o2:?e1) ⊓ (?o1:?e1 ⊑ ?o1:?e2) ⊓ (?o1:?e2 ⊓ ?o1:?e3 ⊑ ⊥) ⊓ (?o1:?e3 ≡ ?o2:e2) ⊓ (?o2:?e1 ⊑ ?o2:?e2). Conforme descrito na Definição 1, um antipadrão de correspondência é o resultado de um processo que indica uma afirmação ou negação sobre uma correspondência. Dessa forma o modelo apresentado quando instanciado, se retornar verdadeiro, então há um problema de alinhamento. A Tabela 6 demonstra o exemplo que está sendo tratado apresentando o modelo não instanciado do antipadrão de correspondência e o mesmo modelo instanciado com as entidades das ontologias alinhadas conforme o exemplo apresentado na Figura 14. Tabela 6 – Modelo de antipadrão de correspondência representando um problema de alinhamento. Modelo Não Instanciado (?o1:?e1 ≡ ?o2:?e1) ⊓ (?o1:?e1 ⊑ ?o1:?e2) ⊓ (?o1:?e2 ⊓ ?o1:?e3 ⊑ ⊥) ⊓ Modelo Instanciado (o1:reviewer ≡ o2:review) ⊓ (o1:reviewer ⊑ o1:person) ⊓ (o1:person ⊓ o1:document ⊑ ⊥) ⊓ 67 (?o1:?e3 ≡ ?o2:e2) ⊓ (?o2:?e1 ⊑ ?o2:?e2) (o1:document ≡ o2:document) ⊓ (o2:review ⊑ o2:document) Passo 5 - Apresentar Solução Refatorada: Refatoração nesse caso significa realizar o reparo do alinhamento de forma a eliminar inconsistências lógicas. Essa não é uma tarefa trivial, uma vez que podem existir várias soluções para um cenário específico. Além disso, a melhor solução pode também depender da tarefa, ou até mesmo apontar algum problema na semântica da correspondência. Dessa forma, essa tarefa deve ser conduzida por um especialista de forma a analisar a semântica do problema. Questões como a fundamentação das ontologias devem ser levadas em consideração para refatoração do alinhamento. Por exemplo, entidades podem ser genericamente equivalentes uma vez que podem desempenhar o mesmo papel em ambas as ontologias que estão sendo alinhadas, mas ser entidades sintaticamente distintas, com domínios também sintaticamente distintos em ambas as ontologias, mas que também desempenham o mesmo papel em ambas as ontologias. O modelo de um antipadrão, quando devidamente documentado, garante que importantes questões são respondidas para a cada antipadrão. A Tabela 7 apresenta um modelo de antipadrão, conforme apresentado na Seção 2.8, e lista todas as informações que foram utilizadas para o desenvolvimento de um antipadrão de correspondência, seguindo o processo apresentado anteriormente. Tabela 7 – Antipadrão de Correspondência OCA01. Item Nome Tipo de solução refatorada Causa raiz Forças desbalanceadas Breve Descrição OCA01 - Correspondência de duas subclasses em que suas superclasses são disjuntas. Reestabelecimento das correspondências identificadas. Assumir que dois termos são equivalentes ignorando sua relação semântica com outras entidades e suas respectivas correspondências. De acordo com a classificação das incompatibilidades ontológicas apresentadas anteriormente, pode ocorrer aqui uma incompatibilidade terminológica de termos homônimos, onde o sistema de alinhamentos identifica que estes termos são similares, no entanto seus significados são diferentes. A semântica da 68 Forma geral do antipadrão Sintomas e consequências Causas típicas Exceções conhecidas Variações Soluções relacionadas relação dos termos deve ser observada para composição do alinhamento. A incompatibilidade ontológica “descrição do conceito” deve ser observada também. (?o1:?e1 ≡ ?o2:?e1) ⊓ (?o1:?e1 ⊑ ?o1:?e2) ⊓ (?o1:?e2 ⊓ ?o1:?e3 ⊑ ⊥) ⊓ (?o1:?e3 ≡ ?o2:e2) ⊓ (?o2:?e1 ⊑ ?o2:?e2). Sintoma: duas subclasses que possuam correspondência de igualdade, mas suas superclasses não possuem correspondência de igualdade e são disjuntas. Utilização apenas de algoritmos de similaridade de strings para composição de um alinhamento. Não aplicável. Não aplicável. Não aplicável. 3.3. Elementos da representação computacional de um antipadrão de correspondência A seguir a relação de elementos da EDOAL utilizados para a construção de um antipadrão. Placeholders: Variáveis que serão instanciadas em tempo de execução do antipadrão. Todas as variáveis obrigatoriamente devem ser iniciadas pelo operador “?” (por exemplo, ?o1). Os placeholders utilizados para a construção de um antipadrão são: ?uri_o1 - Define a URI da ontologia 1 no alinhamento. Elemento: <Ontology rdf:about="?uri_o1"> Exemplo: <Ontology rdf:about="http://cmt"> ?uri_o2 - Define a URI da ontologia 2 no alinhamento. Elemento: <Ontology rdf:about="?uri_o2"> Exemplo: <Ontology rdf:about="http://conference"> ?loc_o1 - Define o local da ontologia 1 no alinhamento. Elemento:<location>?loc_o1</location> Exemplo: <location>http://nb.vse.cz/~svabo/oaei2010/cmt.owl</location> ?loc_o2 - Define o local da ontologia 2 no alinhamento. Elemento: <location>?loc_o1</location> 69 Exemplo: <location>http://nb.vse.cz/~svabo/oaei2010/Conference.owl</location> ?o1 - Define que uma entidade é uma instância da ontologia descrita em ?uri_o1. Exemplo: rdf:resource="http://cmt#" ?o2 - Define que uma entidade é uma instância da ontologia descrita em ?uri_o2. Exemplo: rdf:resource="http://conference#" ?eN - Define uma entidade qualquer (individuo) dentro de uma ontologia, onde N é um número identificador único dentro de um elemento <cell>. Deve sempre ser ocorrer depois de ?o1 ou ?o2 e um operador de relação de variáveis. Exemplo: ?o1:?e1 -> rdf:resource="http://conference#Person" ?o1:?e2 -> rdf:resource="http://conference#Review" Operadores: : (dois pontos) - Define que uma entidade faz parte de uma determinada ontologia. Exemplo ?o1:?e1. A entidade ?e1 faz parte da ontologia ?o1. <condition> - Estabelece uma condição para que uma entidade seja instanciada. Exemplo: <Class rdf:about="?o2:?e1"/> <Condition> <Property rdf:about="?o2:p1"> <domainRestriction> <Class rdf:about="?o2:?e3"/> </domainRestriction> </Property> </Condition> Relações: Equivalence: Define a relação de equivalência entre duas entidades. 70 Elemento: <relation rdf:resource="equivalence"/> ou <relation>=</relation> Disjoint: Define que duas entidades são disjuntas. Pode ocorrer na mesma ontologia ou entre duas ontologias. Quando ocorrer na mesma ontologia deve ser verificada a estrutura da referida ontologia. Quando ocorrer entre duas ontologias o alinhamento deve ser verificado. Elemento: <relation rdf:resource="disjoint"/> Subsumption: Define a relação is-a entre duas ontologias. Sempre deve ocorrer na seguinte forma: <entity1> is-a <entity2>. Pode ocorrer na mesma ontologia ou entre duas ontologias. Quando ocorrer na mesma ontologia deve ser verificada a estrutura da referida ontologia. Quando ocorrer entre duas ontologias o alinhamento deve ser verificado. Elemento: <relation rdf:resource="subsumedBy"/> Observação: Qualquer relação que seja representada na mesma ontologia deve ser verificada a estrutura da mesma, caso seja representada entre as duas ontologias deve ser verificado o alinhamento entre as mesmas. Entidades: Classe (class): Elemento: <Class rdf:about="" /> Exemplo: <Class rdf:about="o1:Car" /> Propriedade de Objeto (objectProperty) Elemento: <Relation rdf:about="" /> Exemplo: <Relation rdf:about="o1:hasLocation" /> Restringindo o domínio: <Relation rdf:about="o1:hasLocation"> <domainRestriction> 71 <Class rdf:about="o1:Worker" /> </domainRestriction> </Relation> Restringindo o intervalo: <Relation rdf:about="o1:madeOf"> <rangeRestriction> <Class rdf:about="o1:Steel"/> </rangeRestriction> </Relation> Propriedade de Dado (dataProperty) Elemento: <Property rdf:about="" /> Exemplo: <Property rdf:about="o1:color" /> Restringindo o domínio: <Property rdf:about="o1:color"> <domainRestriction> <Class rdf:about="o1:Car"/> </domainRestriction> </Property> A seguir a representação da forma geral do antipadrão de correspondência acima descrito através da linguagem EDOAL: <?xml version="1.0" encoding="UTF-8"?> <rdf:RDF xmlns ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:xsd ="http://www.w3.org/2001/XMLSchema#" xmlns:align ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:dc ="http://purl.org/dc/elements/1.1/" xmlns:dcterms ="http://purl.org/dc/terms/"> <rdf:Description> <dc:creator>Anselmo Guedes <[email protected]></dc:creator> <dc:description>Correspondência de duas subclasses em que suas superclasses são disjuntas</dc:description> <dc:date>2014-04-14</dc:date> <dcterms:identifier>OCA01</dcterms:identifier> <dcterms:abstract></dcterms:abstract> <dcterms:hasVersion>0.1</dcterms:hasVersion> </rdf:Description> <Alignment> <onto1> 72 <Ontology rdf:about=":uri_o1"> <location>:loc_o1</location> </Ontology> </onto1> <onto2> <Ontology rdf:about=":uri_o2"> <location>:loc_o2</location> </Ontology> </onto2> <map> <cell> <entity1><Class rdf:about="?o1:?e1"/></entity1> <entity2><Class rdf:about="?o2:?e1"/></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1><Class rdf:about="?o2:?e2" /></entity1> <entity2><Classrdf:about="?o2:?e1" /></entity2> <relation rdf:resource="subsumedBy"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e1" /></entity1> <entity2><Class rdf:about="?o1:?e3" /></entity2> <relation rdf:resource="disjoint"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e2" /></entity1> <entity2><Classrdf:about="?o2:?e2" /></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e2" /></entity1> <entity2><Class rdf:about="?o1:?e3" /></entity2> <relation rdf:resource="subsumedBy"/> </cell> </map> </Alignment> </rdf:RDF> Dadas as propriedades existentes na linguagem de representação de alinhamentos EDOAL, a mesma pôde ser utilizada para representação computacional dos modelos de antipadrão de correspondência, permitindo que tais modelos possam ser interpretados e o modelo verificado através de uma máquina de raciocínio (reasoner). 73 4. Catálogo de Antipadrões de Correspondência Este capítulo apresenta um catálogo de antipadrões de correspondência, construído com base na análise dos alinhamentos disponibilizados nas três últimas edições da Iniciativa de Avaliação de Alinhamento de Ontologias – OAEI, a partir da identificação de correspondências incorretas que ocorrem de forma frequente e recorrente. 4.1. Buscando por Antipadrões de Correspondência A metodologia apresentada na Seção 3.2 foi aplicada sobre os resultados disponibilizados pela OAEI nas suas três últimas edições (2011.5, 2012 e 2013) para a identificação de antipadrões de correspondência a partir de erros recorrentes de alinhamento gerados pelas ferramentas avaliadas. Cada passo deste processo será a seguir resumidamente explicado e demonstrado sua aplicação sobre a base de alinhamentos disponibilizados pela OAEI e os resultados obtidos. Foi considerado um total de 40 tarefas de alinhamento, cujos pares de ontologias alinhadas estavam disponíveis em todas as três últimas edições. Passo 1 – Apresentar Solução Problemática: O primeiro passo para a construção de antipadrões de correspondência é ter o correto entendimento do problema que está sendo tratado. Para iniciar a busca por antipadrões de correspondência, o primeiro passo 74 foi a identificação das correspondências incorretas, ou falsos positivos, no conjunto de alinhamentos selecionado. Falsos positivos são as correspondências encontradas, que não fazem parte do conjunto real de correspondências (correspondências corretas) entre duas ontologias. Dentro do universo das correspondências incorretas identificadas, foram selecionadas para análise aquelas que ocorrem com mais frequência dentro do conjunto de alinhamentos a fim de limitar o escopo do estudo. Utilizou-se como critério para seleção das correspondências incorretas, aquelas que ocorrem em mais de 50% do total de correspondências incorretas identificadas. Para as correspondências incorretas que ocorrem abaixo de 50% do total de correspondências incorretas identificadas, percebeu-se uma tendência de repetição dos erros, o que levou-se a limitar o escopo do estudo dessa forma. A Tabela 8 lista todas as correspondências incorretas que ocorreram com uma frequência acima do limite mínimo nas tarefas de alinhamento analisadas. Este conjunto de correspondências foi gerado a partir dos aterfatos disponibilizados pela OAEI, alinhamentos finais gerados pelas ferramentas analisadas e alinhamentos de referência das tarefas de alinhamento avaliadas. Ao realizar o cruzamento desses dois aterfatos (correspondências identificadas x correspondências verdadeiras) foi possível gerar um conjunto de correspondências incorretas para análise. As colunas Ontologia 1 e Ontologia 2 apresentam o par de ontologias da tarefa de alinhamento, as colunas Entidade 1 e Entidade 2 apresentam o par de entidades da correspondência incorreta. A coluna Frequência apresenta o número de vezes em que a correspondência incorreta foi retornada no conjunto de tarefas de alinhamento analisado, ou seja, o número de ferramentas que incorretamente identificaram esta correspondência. Uma correspondência é considerada incorreta quando esta ocorre no alinhamento final gerado por uma ferramenta, mas não consta em seu alinhamento de 75 referência. A coluna Total de Ferramentas representa o total de ferramentas que geraram alinhamento entre o par de ontologias, sendo que uma ferramenta gera apenas um alinhamento entre um par de ontologias por campanha da OAEI. A coluna % representa a razão entre a frequência e o total de ferramentas. Não foi levada em conta nesta análise a força da relação na correspondência, ou seja, todas as correspondências identificadas pelas ferramentas foram consideradas, independente da força atribuída a essa relação. Tabela 8 - Correspondências incorretas identificadas no conjunto de alinhamentos selecionado. # 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 Tarefa de Alinhamento Ontologia 1 Conference Cmt Edas Iasted Conference Edas Conference Conference Edas Cmt Conference ConfOf mouse mouse Conference Edas Cmt Conference Conference Cmt mouse ConfOf ConfOf mouse Iasted ConfOf Cmt Iasted Cmt ConfOf ConfOf Cmt ConfOf ConfOf Cmt ConfOf Conference Cmt Conference Conference Ontologia 2 Ekaw Iasted Ekaw Sigkdd Ekaw Iasted Iasted ConfOf Ekaw Conference Edas Edas human human Ekaw Ekaw ConfOf Ekaw Sigkdd Conference human Edas Ekaw human Sigkdd Edas Sigkdd Sigkdd ConfOf Edas Edas Sigkdd Edas Edas Ekaw Ekaw Iasted Edas Edas Edas Correspondência incorreta identificada <Entidade1, Entidade2, ≡,_> Entidade 1 Entidade 2 Invited talk Invited Talk Document Document Presenter Presenter Document Document Conference participant Conference Participant Person Person Presentation Presentation Conference Conference Conference Conference Reviewer Reviewer Conference Conference Conference Conference MA 0000065 NCI C12685 MA 0000323 NCI C12378 Conference Conference Conference Session Conference Session Paper Paper Paper Paper Conference Conference Paper Paper UNDEFINED part of UNDEFINED part of hasEmail hasEmail Paper Paper MA 0000003 NCI C12919 pay pay hasPhone hasPhone name Name obtain obtain writtenBy writtenBy hasPostalCode hasPostalCode hasStreet hasStreet date Date hasTopic hasTopic hasCountry hasCountry writtenBy writtenBy writtenBy writtenBy is given by is given by email hasEmail Call for paper CallForPapers has an email hasEmail 76 Frequência Total de Ferramentas % 53 53 53 53 52 52 52 52 52 51 51 50 39 39 49 48 47 47 47 47 37 46 46 36 44 43 43 42 41 41 40 40 39 39 38 38 37 31 29 27 57 57 57 57 57 57 57 57 57 57 57 57 45 45 57 57 57 57 57 57 45 57 57 45 57 57 57 57 57 57 57 57 57 57 57 57 57 57 57 57 93% 93% 93% 93% 91% 91% 91% 91% 91% 89% 89% 88% 87% 87% 86% 84% 82% 82% 82% 82% 82% 81% 81% 80% 77% 75% 75% 74% 72% 72% 70% 70% 68% 68% 67% 67% 65% 54% 51% 47% Com os dados apresentados na Tabela 8, temos então 40 casos de soluções problemáticas para analisar para compor o catálogo de antipadrões de correspondência. Passo 2 – Evidenciar Solução Problemática: Este passo possui como objetivo demonstrar que a solução problemática de fato ocorre. Ainda na Tabela 8, as colunas Frequência, Total de Ferramentas e % confirmam que estas 40 correspondências ocorreram de forma recorrente nas três últimas edições da OAEI (mais de 41% das ferramentas) e são frequentes entre os sistemas de alinhamentos avaliados. Passo 3 – Demonstrar Implicações: Para cada correspondência apresentada na Tabela 8, foi realizada uma análise do problema e de suas implicações. A seguir, será apresentado cada caso que gera um problema de alinhamento. Os casos que apresentam o mesmo problema são indicados como casos relacionados. Caso #1: Correspondência #8 〈confof:conference, edas:conference, ≡, _〉 Postulado: Seja uma classe e1 em uma ontologia o1 que é subclasse de uma classe e2, que por sua vez seja subclasse de uma classe e3 na mesma ontologia o1. Se a classe e3 na ontologia o1 for correspondente por igualdade com a classe e2 na ontologia o2 e a classe e1 da ontologia o2 for disjunta da classe e2 da ontologia o2, então a classe e1 da ontologia o1 não pode ser correspondente por igualdade com a classe e1 na ontologia o2. O tipo de problema identificado neste caso foi uma contradição de disjunçãosubsunção. As Figuras 19 e 20 ilustram respectivamente um fragmento do alinhamento analisado e a generalização do problema identificado. 77 Figura 19 - Problema de alinhamento entre as ontologias ConfOf e Edas. Figura 20 - Generalização do problema de alinhamento Caso 1. Correspondências qual apresentam o mesmo problema identificado no Caso 1: 〈edas:conferencesession, ekaw:conference_session, ≡, _〉 Caso #2: Correspondência #18 〈conference:paper, ekaw:paper, ≡, _〉. Postulado: Seja uma classe e1 em uma ontologia o1 que é subclasse de uma classe e2, que por sua vez seja uma classe disjunta de uma classe e3, também na ontologia o1. Se a classe e1 na ontologia o1 for correspondente por igualdade com uma classe e1 em uma ontologia o2, a classe e3 em o1 for correspondente com uma classe e2 na ontologia o2 e a classe e2 em o2 for uma subclasse de e1 em o2, então há um problema de alinhamento. O tipo de problema identificado neste caso foi uma contradição de disjunçãosubsunção. As Figuras 21 e 22 ilustram respectivamente um fragmento do alinhamento analisado e a generalização do problema identificado. 78 Figura 21 - Problema de alinhamento entre as ontologias Conference e Ekaw. Figura 22 - Generalização do problema de alinhamento Caso 2. Correspondências qual apresentam o mesmo problema identificado no Caso 2: 〈edas:conference, ekaw:conference, ≡, _〉 Caso #3: Correspondência #23 〈confof:paper, ekaw:paper, ≡, _〉 Postulado: Seja uma classe e1 em uma ontologia o1 que é disjunta de uma classe e2 na mesma ontologia o1 e uma classe e1 na ontologia o2 que seja subclasse de uma classe e2 na mesma ontologia o2. Se a classe e1 em o1 for correspondente por igualdade com a classe e1 em o2 e a classe e2 em o1 for correspondente por igualdade com a classe e2 em o2, então há um problema de alinhamento. O tipo de problema identificado neste caso foi uma contradição de disjunçãosubsunção. As Figuras 23 e 24 ilustram respectivamente um fragmento do alinhamento analisado e a generalização do problema identificado. 79 Figura 23 - Problema de alinhamento entre as ontologias ConfOf e Ekaw. Figura 24 - Generalização do problema de alinhamento Caso 3 Não existem correspondências similares ao Caso 3 no grupo de estudo selecionado. Caso #4: Correspondência #29 〈cmt:writtenBy, confof:writtenBy, ≡, _〉 Postulado: Seja uma propriedade p1 na ontologia o1 que possui como domínio uma classe e1 e intervalo a classe e2, ambas na ontologia o1, e uma propriedade p1 em uma ontologia o2 que possui como domínio uma classe e1 e intervalo a classe e2, ambas na ontologia o2. Se essa propriedade p1 em o1 for correspondente por igualdade com a propriedade p1 em o2, mas a classe e1 em o1 não for correspondente com a classe e1 na ontologia o2 ou a classe e2 na ontologia o1 não for correspondente com a classe e2 na ontologia o2, então há um problema de alinhamento. O tipo de problema identificado neste caso foi uma incompletude de domínio e intervalo. As Figuras 25 e 26 ilustram respectivamente um fragmento do alinhamento analisado e a generalização do problema identificado. 80 Figura 25 - Problema de alinhamento entre as ontologias CMT e ConfOf. Figura 26 - Generalização do problema de alinhamento Caso 4. Correspondências qual apresentam o mesmo problema identificado no Caso 4: 〈confof:hasPhone, edas:hasPhone, ≡, _〉, 〈iasted:obtain, sigkdd:obtain, ≡, _〉 e 〈confof:writtenBy, confof:writtenBy, ≡, _〉 Caso #5: Correspondência #31 〈confof:hasStreet, edas:hasStreet, ≡, _〉 Postulado: Seja uma propriedade p1 em uma ontologia o1 que possui como domínio uma classe e1 e uma outra classe e2, ambas também na ontologia o114 e uma propriedade p1 em uma ontologia o2 que possui como domínio uma classe e1, também na ontologia e2. Se a propriedade p1 em o1 for correspondente por igualdade com a propriedade p1 em o2 e a classe e1 na ontologia o2 não for correspondente com nenhuma das classes de domínio de p1 em o1, então há um problema de alinhamento. 14 Uma propriedade pode definir múltiplos domínios. Múltiplos domínios são permitidos e podem ser interpretados como uma conjução: estes restringem o domínio da propriedade para aqueles indivíduos que pertence à interseção das descrições de classe. Disponível em: http://www.w3.org/TR/owl-ref/ 81 O tipo de problema identificado neste caso foi incompletude de domínio e intervalo. As Figuras 27 e 28 ilustram respectivamente um fragmento do alinhamento analisado e a generalização do problema identificado. Figura 27 - Problema de alinhamento entre as ontologias ConfOf e Edas. Figura 28 - Generalização do problema de alinhamento Caso 5 Correspondências qual apresentam o mesmo problema identificado no Caso 5: 〈confof:hasPostalCode, edas:hasPostalCode, ≡, _〉 e 〈cmt:date, sigkdd:date, ≡, _〉 Caso #6: Correspondência #6 〈edas:person, iasted:person, ≡, _〉 Postulado: Seja uma classe e1 na ontologia o1 e uma classe o2, também na ontologia o1 que são disjuntas, e seja uma classe e1 em uma ontologia o2 que possui a propriedade de equivalência com uma propriedade p1 também em o2, que por sua vez possui como domínio uma classe e3 (o2:e1 é equivalente a o2:e3, tal que possua uma propriedade o2:p1), que é uma subclasse de e2, ambas na ontologia o2. Se a classe e1 na ontologia o2 for correspondente por igualdade com a classe e2 na ontologia o1 e a classe e1 em o1 for correspondente por igualdade com a classe e2 em o2, então tem-se um problema de alinhamento. 82 Os tipos de problema identificados neste caso foram incompletude de domínio e intervalo e contradição de disjunção-subsunção. As Figuras 29 e 30 ilustram respectivamente um fragmento do alinhamento analisado e a generalização do problema identificado. Figura 29 - Problema de alinhamento entre as ontologias Edas e Iasted. Figura 30 - Generalização do problema de alinhamento Caso 6. Correspondências qual apresentam o mesmo problema identificado no Caso 6: 〈conference:invited_talk, ekaw:invited_talk, ≡, _〉 Caso #7: Correspondência #20 〈cmt:paper,conference:paper, ≡, _〉 Postulado: Seja uma classe e1 em uma ontologia o1 que é uma superclasse de uma classe e2, também na ontologia o1, uma classe e1 em uma ontologia o2, que é subclasse de uma classe e2 também em o2, que por sua vez é disjunta de uma classe e3, também na ontologia o2. Se a classe e2 na ontologia o1, for correspondente por 83 igualdade com a classe e1 na ontologia o2 e a classe e1 na ontologia o1 for correspondente por igualdade com a classe e3 na ontologia o2, então tem-se um problema de alinhamento. O tipo de problema identificado neste caso foi contradição de disjunçãosubsunção. As Figuras 31 e 32 ilustram respectivamente um fragmento do alinhamento analisado e a generalização do problema identificado. Figura 31 - Problema de alinhamento entre as ontologias CMT e Conference. Figura 32 - Generalização do problema de alinhamento Caso 7. Correspondências qual apresentam o mesmo problema identificado no Caso 7: 〈conference:callForPaper,edas:callForPapers, ≡, _〉 Caso #8: Correspondência #25 〈iasted:pay, sigkdd:pay, ≡, _〉 Postulado: Seja uma propriedade p1 em uma ontologia o1 que possui como domínio uma classe e1 e como intervalo uma classe e2, ambas na ontologia o1. Se essa propriedade p1 em o1, for correspodente por igualdade com uma propriedade p1 em uma ontologia o2, que por sua vez possui como domínio uma classe e1 e intervalo e2, 84 ambas em o2, as classes e1 em o1 e e1 em o2 forem correspondentes por igualdade e as classes e2 em o1 e e2 em o2 não possuírem relação de equivalência, então tem-se um problema de alinhamento. O tipo de problema identificado neste caso foi incompletude de domínio e intervalo. As Figuras 33 e 34 ilustram respectivamente um fragmento do alinhamento analisado e a generalização do problema identificado. Figura 33 - Problema de alinhamento entre as ontologias Iasted e Sigkdd. Figura 34 - Generalização do problema de alinhamento Caso 8. Correspondências qual apresentam o mesmo problema identificado no Caso 8: 〈cmt:writtenBy, ekaw:writtenBy, ≡, _〉 Caso #9: Correspondência #33 〈confof:hasTopic, edas:hasTopic, ≡, _〉 Postulado: Seja uma propriedade p1 em uma ontologia o1 que possui como domínio uma classe e1 e como intervalo uma classe e2, ambas da ontologia o1. Se a propriedade p1 na ontologia o1 for correspondente por igualdade com uma propriedade p1 em uma ontologia o2, que por sua vez possui como domínio duas classes e1 e e2, ambas em o2, e possui como intervalo uma classe e3, também em o2 e as classes e2 em o1 e e3 em o2 forem correspondentes por igualdade e as classes e1 e e2 na ontologia o2 85 não possuirem relações de correspondência com outras classes de domínio na propriedade p1 na ontologia o1, então tem-se um problema de alinhamento. O tipo de problema identificado neste caso foi incompletude de domínio e intervalo. As Figuras 35 e 36 ilustram respectivamente um fragmento do alinhamento analisado e a generalização do problema identificado. Figura 35 - Problema de alinhamento entre as ontologias ConfOf e Edas. Figura 36 - Generalização do problema de alinhamento Caso 9. Correspondências qual apresentam o mesmo problema identificado no Caso 9: 〈confof:hasCountry, edas:hasCountry, ≡, _〉 e 〈conference:isGivenBy, iasted:isGivenBy, ≡, _〉 Passo 4 – Identificação da Solução Problemática: A representação formal de como identificar um problema de alinhamento é o que dá vida ao antipadrão de correspondência. Para cada problema identificado nos casos analisados no passo anterior, foi criado um antipadrão de correspondência. A Seção 4.2 apresenta o modelo completo dos antipadrões de correspondências desenvolvidos. 86 Passo 5 – Apresentar Solução Refatorada: Conforme apresentado anteriormente, realizar a refatoração de uma correspondência inconsistente não é uma tarefa trivial. A avaliação de abordagens para a refatoração automática de um alinhamento será conduzida em trabalhos futuros. 87 5. Framework de Antipadrões de Correspondência Este capítulo apresenta a arquitetura de um framework de antipadrões de correspondência assim como o protótipo de framework construído para manutenção e identificação de antipadrões de correspondência. 5.1. Por que um Framework? Framework de aplicações são uma abordagem que atualmente favorecem o suporte para a retutilização de projetos de software e sua implementação. Um framework destina-se a identificar abstrações chave que são úteis para a implementação de classes de aplicações, bem como a implementação padrão de grande parte dessas abstrações [32]. Configurações em tempo de projeto e em tempo de execução permitem a composição lógica para construir uma aplicação a partir de um framework, incorporando o código fornecido pelo desenvolvedor que “completa” a aplicação definida pelo framework. Existem vários benefícios potenciais ao utilizar frameworks [32], dentre os quais pode-se destacar: Modularidade: Frameworks podem fornecer interfaces estáveis que encapsulam detalhes de implementação e dissociam clientes da implementação de mudanças. Componentes dentro de um framework podem ser fornecidos pelo framework, propriamente dito, assim como pelo cliente que o utiliza. 88 Reusabilidade: Componentes estáveis dentro de um framework podem ser reutilizáveis em multiplas aplicações. Extensibilidade: Frameworks fornecem pontos de entrada que permitem a incorporação de um código do cliente no framework. Em um processo de alinhamento de ontologias, conforme apresentado na Seção 2.3, recursos podem ser adicionado no referido processo. Antipadrões de correspondência, ao atuarem como modelos que visam identificar correspondências incorretas dentro de um alinhamento gerado entre duas ontologias, podem ser utilizados como recursos no processo de alinhamento das mesmas, de modo que as correspondências encontradas possam ser validadas de acordo com o modelo de antipadrão fornecido. Sendo assim, esse recurso utilizado para a verificação de uma correspondência, pode ser considerado um módulo que estende o sistema que está realizando o alinhamento entre duas ontologias. Além disso, os antipadrões de correspondência podem ser desenvolvidos por qualquer especialista e cadastrados na base de dados do framework, além de poder selecionar em um catálogo de antipadrões de correspondências quais deseja-se utilizar. Este conjunto de fatores está alinhado com a definição de um framework de aplicações, o que torna a aplicação proposta neste trabalho modular, extensível e reutilizável, características básicas de um framework de aplicações. 5.2. Arquitetura do Framework de Antipadrões de Correspondência A Figura 37 ilustra a arquitetura proposta de um framework de padrões de alinhamento de ontologias do ponto de vista do processo de alinhamento de ontologias. Ao submeter duas ontologias a um processo de alinhamento, o sistema de alinhamento pode solicitar a um sistema externo (recurso) que realize a validação das 89 correspondências encontradas com base nos modelos de antipadrões disponíveis. Sob essa ótica, os principais componentes de um framework de antipadrões de correspondência são: 1. Validador: Quando o usuário realizar o cadastro de um novo antipadrão de correspondência, o componente de cadastro deverá realizar análise lógica e sintática do antipadrão de correspondência que está sendo cadastrado pelo usuário, como por exemplo, sintaxe XML, abertura e fechamento de elementos do antipadrão, construtos da linguagem, etc. O validador deverá observar ainda se a forma e linguagem em que o padrão está escrito são interpretáveis pelo motor de raciocínio de padrões. 2. Banco de Dados de Antipadrões: Ao realizar o cadastro de um antipadrão de correspondência, este deverá ser persistido em uma base de dados de antipadrões de correspondência. Este é o repositório no qual estão persistidos os antipadrões catalogados, para que possam ser reutilizados por qualquer sistema de alinhamentos de ontologias. 3. Interpretador de Antipadrões de Correspondência: No processo de busca por todas as instâncias possíveis em um modelo de um antipadrão de correspondência em um alinhamento, o interpretador de antipadrões de correspondência é que executa esta tarefa. O sistema de alinhamento solicita diretamente a este componente a validação de uma correspondência, e recebe uma resposta afirmativa ou negativa sobre a mesma. 4. Banco de Dados Externo: um banco de dados externo, como a WordNet [64], pode ser utilizado como referência para encontrar correspondências entre os termos das ontologias. 90 Figura 37 - Arquitetura de um framework de antipadrões de correspondência sob o ponto de vista de processo de alinhamento de ontologias. A Figura 38 ilustra os componentes do protótipo desenvolvido para o framework de antipadrões de correspondência e suas correlações. Figura 38 - Pseudo-Arquitetura do framework de antipadrões de correspondência. GUI: Interface gráfica com o usuário. Representa a camada de apresentação do framework. Este componente é que realiza a interação direta com do usuário com os outros componentes do framework. Diretamente a este componente estão os formulários individuais, a saber: 91 o Valid. Corresp. (Validar Correspondências): Formulário de entrada para a execução do processo de verificação de um antipadrão de correspodência. Um usuário pode, manualmente, submeter um par de entidades ao processo de verificação de antiapdrões de correspondência, ou pode solicitar que o framework valide todo um alinhamento. Figura 39 – Formulário Validar Correspondências o Ident. FP / FN (Identificar Falsos Positivos / Falsos Negativos): Módulo do sistema que automatiza a identificação de correspondências incorretas e correspondências ausentes em um alinhamento (falsos positivos e falsos negativos). Os falsos positivos e falsos negativos são persistidos em banco de dados para posterior análise, manual, de um especialista. A busca por falsos positivos e falsos negativos pode ser realizada individulamente em um alinhamento ou em lotes de alinhamentos. 92 Figura 40 – Formulário Identificar Falsos Positivos / Falsos Negativos - Individual Figura 41 – Formulário Identificar Falsos Positivos / Falsos Negativos – Em lotes 93 o Manut. OCA (Manutenção OCA): Formulário de cadastro dos antipadrões de correspondência (oca – ontology correspondence antipaterns). Neste formulário, além do modelo final escrito na linguagem EDOAL, é possivel que cadastra uma documentação básica sobre o antipadrão em questão. Ambos são persistidos em banco de dados. Figura 42 – Formulário Manutenção OCA o Manut. Ferramentas (Manutenção de Ferramentas): Cadastro das ferramentas quais gerarm alinhamentos apurados pelo módulo de identificação de falsos positivos e falsos negativos. Figura 43 – Formulário Manutenção de Ferramentas o Manut. Eventos (Manutenção de Eventos): Cadastro de eventos quais foram originados os alinhamentos apurados pelo módulo de identificação de falsos positivos e falsos negativos. 94 Figura 44 – Formulário Manutenção de Eventos o Manut. Ontologias (Manutenção de Ontologias): Cadastro de ontologias presentes nos alinhamentos apurados pelo módulo de identificação de falsos positivos e falsos negativos. Figura 45 – Formulário Manutenção de Ontologias OCA Reasoner: Classe que efetivamente busca a instanciação de um antipadrão de correspondência a partir de um modelo informado. Pode ser executada manualmente por um usuário através do formulário “Validar Correspondências” ou pode ser executada diretamente por um sistema externo. A classe OCA Reasoner possui os seguintes métodos, conforme ilustrado na Figura 46: 95 Figura 46 - Classe OCAReasoner. o getAntipatternInstance: Método do tipo lógico que realiza a instanciação de uma correspondência em um alinhamento de acordo com o modelo de antipadrão de correspondência informado. O retorno falso do método significa que o modelo não foi instanciado, logo o antipadrão não pode ser verificado, o retorno verdadeiro indica que o modelo foi instanciado, logo o antipadrão foi verificado de acordo com os parâmetros informados. Parâmetros do método: URI Ontologia 1: caminho completo da especificação OWL da ontologia l alinhanda. URI Ontologia 2: caminho completo da especificação OWL da ontologia 2 alinhanda. URI Alinhamento: caminho completo da especificação EDOAL do alinhamento gerado entre as ontologias 1 e 2 informadas. Entidade 1: descrição da entidade 1 da correspondência a ser verificada. Entidade 2: descrição da entidade 2 da correspondência a ser verficada. Modelo Antipadrão: modelo EDOAL correspondência qual será verificado. 96 do antipadrão de o getEntityType: Retorna o tipo de uma entidade (classe, propriedade, relação). o validRelation: Verifica se uma relação entre duas entidades seja da mesma ontologia ou no alinhamento informado, de fato existe. Não realizada validação semântica da relação, apenas verifica se a mesma está declarada explicitamente. Ontology: Classe que instancia os elementos de uma ontologia. Possui os seguintes atributos e métodos, conforme ilustrado na Figura 47: Atributos: o classes: Lista de classes da ontologia. o classesDisjoint: Matriz de classes disjuntas da ontologia. o classesDomain: Matriz de classes que compõem os domínios das relações presentes na ontologia. o classesEquivalent: Matriz de classes equivalentes da ontologia. o classesRange: Matriz de classes que compõem os intervalos das relações presentes na ontologia. o ontologyName: Nome da ontolgia o pathOntology: Caminho físico ou URI da ontologia. o properties: Lista de propriedades da ontologia. o relations: Lista de relações da ontologia. o superClasses: Matriz de superclasses com suas repectivas subclasses na ontologia. o XMLOnto: representação da ontologia em OWL. Métodos: 97 o cleanseEntityName: Realizada a “limpeza” no nome de uma entidade, removendo caracters como “#”, “_”, “&”, “/” e textos como “http://”. o getClassesDisjoint: Retorna as classes disjuntas de uma determinada classe. o getClassesDomain: Retorna as classes de domínio de uma determinada relação. o getClassesEquivalents: Retorna as classes equivalentes de uma determinada classe. o getClassesRange: Retorna as classes de intervalo de uma determinada relação. o loadOntology: Instancia uma ontologia e todas suas entidades e propriedades. Apenas executa os métodos do tipo “set” abaixo listados. o setClasses: Instancia o atributo classes. o setClassesDisjoint: Instancia o atributo classesDisjoint. o setClassesDomain: Instancia o atributo classesDomain. o setClassesEquivalents: Instancia o atributo classesEquivalent. o setClassesRange: Instancia o atributo classesRange. o setOntologyName: Instancia o atributo ontologyName. o setPathOntology: Instancia o atributo pathOntology o setProperties: Instancia o atributo properties. o setRelations: Instancia o atributo relations. o setSuperClasses: Instancia o atributo superClasses. 98 Figura 47 - Classe Ontology. Alignment: Classe que instancia um alinhamento realizado entre duas ontologias, conforme ilustrada na Figura 48. Atributos: o alignment: Matriz de correspondências do alinhamento instanciado. Possui os elementos e, e’, r, n de uma correspondência. o pathAlignmentFile: Caminho físico ou URI do alinhamento. Métodos: 99 o equalizeRelation: Equaliza os termos da relação de uma correspondência. Por exemplo: os termos “xsd:Equivalence” ou “equivalence”, são transformados em “=”. o getCorrespondence: Retorna se uma correspondência informada existe no alinhamento instanciado. o repairAlignment: Remove uma correspondência do alinhamento instanciado. o setAlignment: Instancia o atributo alignment. o setPathAlignmentFile: Instancia o atributo pathAlignmentFile. Figura 48 - Classe Alignment. IncorrectCorrespondences: Classe que realiaza a apuração das correspondências incorretas e inexistente em um alinhamento final. Para tal é necessário possuir o alinhamento de referência. Métodos: o getFalseNegatives: Realiza a apuração dos falsos negativos (correspondências corretas não identiticadas em alihamento final) em um determinado alinhamento. 100 o getFalsePositives: Realiza a apuração dos falsos positivos (correspondências incorretas identificadas em um alinhamento final). o getTruePositives: Realiza a apuração dos verdadeiros positivos (correpondências corretas identificadas em um alinhamento final). o setFinalAlignment: Instancia um alinhamneto final. o setReferenceAlignment: Instancia um alinhamento de referência. Figura 49 - Classe IncorrectCorrespondences. ORM: Object-Relational Mapping – Mapeamento objeto-relacional. Realiza a abstração das tabelas do banco de dados utilizado pelo framework de antipadrões de correspondência para classes, onde cada tabela torna-se uma classe e seus respectivos dados em instâncias. Banco de Dados: Para persitir os dados gerados pelo framework de antipadrões de correspondência para reutilização, foi construído um banco de dados relacional, cuja modelagem é ilustrada na Figura 50. A descrição de cada tabela do banco de dados é apresentada na Tabela 9. Tabela 9 – Descrição das tabelas utilizadas pelo framework. Tabela Descrição Alinhamentos entre duas ontologias gerados por uma TB_Alinhamento ferramenta de alinhamento em um determinado evento. TB_AlinhamentoCorrespondencia Correspondências existentes em um alinhamento Persistência do alinhamento de referência entre duas TB_AlinhamentoReferencia ontologias Correspondências existentes em um alinhamento de TB_AlinhamentoReferenciaCorrespondencia referência 101 TB_Antipattern TB_Evento TB_FalsoNegativo TB_FalsoPositivo TB_Ferramenta TB_Ontologia Persistência dos modelos de antipadrões de correspondência Evento qual se origina os alinhamentos Correspondências existentes, de acordo com o alinhamento de referência, que não existem em um determinado alinhamento. Correspondências identificadas em um determinado alinhamento que não existem em seu respetivo alinhamento de referência Ferramenta de alinhamento de ontologias qual gerou um alinhamento Ontologia que faz parte de um alinhamento Figura 50 - Modelo Relacional das entidades do framework de antipadrões de correspondência. 102 6. Estudo de Caso: Aplicando os Antipadrões de Correspondência Este capítulo apresenta o estudo de caso realizado a partir dos antipadrões de correspondência construídos. Os antipadrões construídos foram aplicados sobre uma base real de alinhamentos, disponbilizada pela iniciativa de avaliação de alinhamento de ontoloigas – OAEI, a fim de verificar sua aplicabilidade. 6.1. Visão Geral Nos capítulos anteriores, foram apresentados os conceitos de antipadrões de correspondência, uma metodologia para sua identificação e construção, assim como um catálogo de antipadrões de correspondência identificados ao aplicar a metodologia proposta sobre uma base real de alinhamentos. Também foi apresentada a arquitetura de um sistema de suporte a antipadrões de correspondência. Com o intuito de enriquecer a avaliação da proposta, evidenciando a aplicabilidade dos antipadrões construídos em cenários reais de alinhamento de ontologias, nesta seção será apresentado o resultado de um estudo de caso explanatório conduzido sobre a base de alinhamentos disponibilizada pela Iniciativa de Avaliação de Alinhamento de Ontoloigas (OAEI). A estratégia para a aplicação dos antipadrões de correspondência adotada neste estudo de caso considera a arquitetura proposta na Seção 5.2 com a diferença que os alinhamentos finais foram submetidos manualmente para o framework de antipadrões 103 de correspondência. Conforme apresentado ainda na Seção 5.2, o framework possui interface com usuário final de forma a possibilitar a execução do processo de verificação de um antipadrão de correspondência pelo mesmo, não sendo necessário que a ferramenta que realizou o alinhamento submeta os dados ao raciocinador de antipadrões de correspondência. A seleção dos domínios disponibilizados pela OAEI para o estudo de caso levou em consideração os seguintes critérios: (i) possuir os alinhamentos gerados pelas ferramentas avaliadas pela OAEI; (ii) possuir o alinhamento de referência; (iii) possuir as ontologias que foram alinhadas; (iv) estar disponível em ao menos uma das três últimas edições do evento; (v) não estar no escopo de estudo para construção dos antipadrões. De acordo com tais critérios foram selecionados os seguintes domínios para o estudo: Anatomy15, Benchmark16 e Multifarm17. O domínio Anatomy consiste em identificar um alinhamento entre uma ontologia de um rato adulto e uma parte do tesauro NCI18, o qual descreve a anatomia humana. O domínio Benchmark consiste em duas ontologias base estáveis (bibliografia e finanças) e variações das mesmas, como por exemplo, sem comentários, sem restrições, sem propriedades, sem tipos de dados, com sinônimos, traduções, etc., totalizando 188 ontologias, sendo 94 de bibliografia e 94 de finanças. O domínio Multifarm é composto por um conjunto de sete ontologias traduzidas em nove idiomas (Inglês (en), Chinês (cn), Checa (cz), Holandês (nl), Francês (fr), Alemão (de), Português (pt), Russo (ru) e Espanhol (es)), totalizado 63 ontologias. Dentro do critério estabelecido de seleção de dados, no domínio Multifarm foram obtidos 31777 alinhamentos, no domínio 15 http://oaei.ontologymatching.org/2013/anatomy/index.html http://oaei.ontologymatching.org/2013/benchmarks/index.html 17 http://oaei.ontologymatching.org/2013/multifarm/index.html 18 http://www.cancer.gov/cancertopics/cancerlibrary/terminologyresources 16 104 Benchmark foram obtidos 1471 alinhamentos e no domínio Anatomy foram obtidos 45 alinhamentos. Com exceção dos antipadrões de correspondência, todos os dados estão disponíveis no próprio site da OAEI. Todo o processo foi realizado utilizando o framework de antipadrões de correspondência desenvolvido neste trabalho. A avaliação final dos alinhamentos foi realizada através da API de alinhamento 19 por meio do framework de antipadrões de correspondência. 6.2. Resultados Obtidos Dos 11 antipadrões de correspondência construídos neste trabalho, somente 6 ocorrem nos domínios selecionados para o estudo. Tal situação pode ser justificada pelo fato das ontologias envolvidas nos alinhamentos analisados para a construção de cada antipadrão possuírem uma riqueza de características (propriedades, relações, especializações, disjunções, restrições, etc.) maior que as ontologias selecionadas para o estudo de caso. A fim de delimitar o escopo do estudo conduzido, foram selecionadas as 10 correspondências incorretas que aparecem de forma mais recorrente no conjunto de alinhamentos avaliados. A Tabela 10 apresenta o grupo selecionado. Para efeitos de estudo, a refatoração dos alinhamentos analisados, ou seja, o reparo dos alinhamento quais foram identificados as correspondências incorretas, considerou-se apenas a eliminação da correspondência incorreta na qual foi identificado um antipadrão de correspondência. Tabela 10 - Grupo de correspondências incorretas selecionado para o estudo de caso. Tarefa de Alinhamento # Domínio Ontologia 1 19 Ontologia 2 Correspondência incorreta identificada <Entidade1, Entidade2, ≡,_> Entidade 1 http://alignapi.gforge.inria.fr/ 105 Entidade 2 Total Alin. Total Ocorr. % OCA 01 Anatomy Mouse Human MA_0002446 NCI_C25444 c-8693270iasted_nl 2767092 c-7650337conference_pt 8286527 c-04477088078411 c-61239807251265 45 22 49% OCA02 43 40 93% OCA04 43 35 81% OCA04 02 Multifarm cmt_en 03 Multifarm cmt_es 04 Benchmark biblio_101 biblio_101 book collection 17 5 29% OCA05a 05 Benchmark biblio_101 biblio_221 shortName name 17 7 41% OCA05b 06 Benchmark biblio_101 biblio_101 book collection 17 5 29% OCA05b c-16881497240940 c-04477088078411 c-11804392483437 c-27632614560459 c-11804392483437 c-34487442358764 c-57010751274855 c-10567664464703 43 38 88% OCA06 43 37 86% OCA06 43 39 91% OCA09 43 32 74% OCA09 07 Multifarm confOf_ cz 08 Multifarm iasted_nl sigkdd_fr 09 Multifarm confOf_nl confOf_en 10 Multifarm sigkdd_es confOf_pt confOf_nl As colunas Ontologia 1 e Ontologia 2 indicam as ontologias que foram alinhadas, as colunas Entidade 1 e Entidade 2 apresentam as entidades de cada correspondência, sendo Entidade 1 pertecente à Ontologia 1 a Entidade 2 pertencente à Ontologia 2. As colunas Total Alin. e Total Ocorr. apresentam o total de alinhamentos e de correspondências encontradas entre as entidades descritas nas colunas Entidade 1 e Entidade 2 e por fim, a coluna OCA apresenta o antipadrão de correspondência que identificou a correspondência como inconsistente. Em cada caso analisado foram obtidos os valores de Precisão, Cobertura e Medida–F dos alinhamentos originais e após sua refatoração para fins de comparação. Para composição da análise foram gerados valores médios das métricas de Precisão, Cobertura e Medida-F, considerando todos os alinhamentos gerados pelas ferramentas avaliadas pela OAEI com a correspondência incorreta identificada pelo referido antipadrão de correspondência e sem o mesmo. Caso 01 - Correspondência 〈mouse:MA_0002446, human:NCI_C25444, ≡, _〉 A correspondência 〈mouse:MA_0002446, human:NCI_C25444, ≡, _〉, indicada pela seta vermelha na Figura 51, ocorre 22 vezes dentro de um conjunto de 45 alinhamentos. Nesta situação o antipadrão OCA02 - Contradição de disjunção- 106 subsunção, quando aplicado sobre os alinhamentos, identificou essa correspondência como inconsistente. Figura 51 - Correspondência 〈mouse:MA_0002446, human:NCI_C25444, ≡, _〉 Ao refatorar os alinhamentos, de forma a remover a correspondência identificada como inconsistente, houve uma pequena melhora nas médias das métricas de Precisão (0,03%) e Medida-F (0,02%) considerando o conjunto de alinhamentos analisados neste caso, conforme apresentado na Figura 52. A média da métrica de Cobertura não foi alterada. valor médio Figura 52 – Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #1. Caso 02 - Correspondência 〈cmt_en:c-8693270-2767092, iasted_nl:c0447708-8078411, ≡, _〉 107 A correspondência 〈cmt_en:c-8693270-2767092, iasted_nl:c-0447708-8078411, ≡, _〉, indicada pela seta vermelha na Figura 53, ocorre 40 vezes dentro de um conjunto de 43 alinhamentos. Nesta situação o antipadrão OCA04 - Contradição de disjunçãosubsunção, quando aplicado sobre os alinhamentos, identificou essa correspondência como inconsistente. Figura 53 - Correspondência 〈cmt_en:c-8693270-2767092, iasted_nl:c-0447708-8078411, ≡, _〉 Ao refatorar os alinhamentos, de forma a remover a correspondência identificada como inconsistente, houve melhora nas médias das métricas de Precisão (17,45%) e Medida-F (7,08%) considerando o conjunto de alinhamentos analisados neste caso, conforme apresentado na Figura 54. A média da métrica de Cobertura não foi alterada. valor médio Figura 54 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #2. 108 Caso 03 - Correspondência 〈cmt_es:c-7650337-8286527, conference_pt:c6123980-7251265, ≡, _〉 A correspondência 〈cmt_es:c-7650337-8286527, conference_pt:c-61239807251265, ≡, _〉, indicada pela seta vermelha na Figura 55, ocorre 35 vezes dentro de um conjunto de 43 alinhamentos. Nesta situação o antipadrão OCA04 - Contradição de disjunção-subsunção, quando aplicado sobre os alinhamentos, identificou essa correspondência como inconsistente. Figura 55 - Correspondência 〈cmt_es:c-7650337-8286527, conference_pt:c-6123980-7251265, ≡, _〉 Ao refatorar os alinhamentos, de forma a remover a correspondência identificada como inconsistente, houve uma pequena melhora nas médias das métricas de Precisão (1,25%) e Medida-F (0,27%) considerando o conjunto de alinhamentos analisados neste caso, conforme apresentado na Figura 56. A média da métrica de Cobertura não foi alterada. 109 valor médio Figura 56 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #3. Caso 04 - Correspondência 〈biblio_101:book, biblio_101:collection, ≡, _〉 A correspondência 〈biblio_101:book, biblio_101:collection, ≡, _〉, indicada pela seta vermelha na Figura 57, ocorre 5 vezes dentro de um conjunto de 17 alinhamentos. Nesta situação o antipadrão OCA05a - Incompletude de domínio e intervalo, quando aplicado sobre os alinhamentos, identificou essa correspondência como inconsistente. Figura 57 - Correspondência 〈biblio_101:book, biblio_101:collection, ≡, _〉 Ao refatorar os alinhamentos, de forma a remover a correspondência identificada como inconsistente, houve uma pequena melhora nas médias das métricas de Precisão (1,46%) e Medida-F (0,78%) considerando o conjunto de alinhamentos analisados neste caso, conforme apresentado na Figura 58. A média da métrica de Cobertura não foi alterada. 110 valor médio Figura 58 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #4. Caso 05 - Correspondência 〈biblio_101:shortName, biblio_221:name, ≡, _〉 A correspondência 〈biblio_101:shortName, biblio_221:name, ≡, _〉, indicada pela seta vermelha na Figura 59, ocorre 7 vezes dentro de um conjunto de 17 alinhamentos. Nesta situação o antipadrão OCA05b - Incompletude de domínio e intervalo, quando aplicado sobre os alinhamentos, identificou essa correspondência como inconsistente. Figura 59 - Correspondência 〈biblio_101:shortName, biblio_221:name, ≡, _〉 Ao refatorar os alinhamentos, de forma a remover a correspondência identificada como inconsistente, houve uma pequena melhora nas médias das métricas de Precisão (0,73%) e Medida-F (0,36%) considerando o conjunto de alinhamentos analisados neste 111 caso, conforme apresentado na Figura 60. A média da métrica de Cobertura não foi alterada. valor médio Figura 60 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #5. Caso 06 - Correspondência 〈biblio_101:book, biblio_101:collection, ≡, _〉 A correspondência 〈biblio_101:book, biblio_101:collection, ≡, _〉, indicada pela seta vermelha na Figura 61, ocorre 5 vezes dentro de um conjunto de 17 alinhamentos. Nesta situação o antipadrão OCA05b - Incompletude de domínio e intervalo, quando aplicado sobre os alinhamentos, identificou essa correspondência como inconsistente. Figura 61 - Correspondência 〈biblio_101:book, biblio_101:collection, ≡, _〉 Ao refatorar os alinhamentos, de forma a remover a correspondência identificada como inconsistente, houve uma pequena melhora nas médias das métricas de Precisão (1,46%) e Medida-F (0,78%) considerando o conjunto de alinhamentos analisados neste 112 caso, conforme apresentado na Figura 62. A média da métrica de Cobertura não foi alterada. valor médio Figura 62 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #6. Caso 07 - Correspondência 〈confOf_cz:c-1688149-7240940, confOf_nl:c1180439-2483437, ≡, _〉 A correspondência 〈confOf_cz:c-1688149-7240940, confOf_nl:c-1180439- 2483437, ≡, _〉, indicada pela seta vermelha na Figura 63, ocorre 38 vezes dentro de um conjunto de 43 alinhamentos. Nesta situação o antipadrão OCA06 - Incompletude de domínio e intervalo, quando aplicado sobre os alinhamentos, identificou essa correspondência como inconsistente. Figura 63 - Correspondência 〈confOf_cz:c-1688149-7240940, confOf_nl:c-1180439-2483437, ≡, _〉 113 Ao refatorar os alinhamentos, de forma a remover a correspondência identificada como inconsistente, houve uma pequena melhora nas médias das métricas de Precisão (10,5%) e Medida-F (0,78%), e houve uma queda na métrica de Cobertura (-0,39%) considerando o conjunto de alinhamentos analisados neste caso, conforme apresentado na Figura 64. valor médio Figura 64 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #7. Caso 08 - Correspondência 〈iasted_nl:c-0447708-8078411, sigkdd_fr:c3448744-2358764, ≡, _〉 A correspondência 〈iasted_nl:c-0447708-8078411, sigkdd_fr:c-3448744- 2358764, ≡, _〉, indicada pela seta vermelha na Figura 65, ocorre 37 vezes dentro de um conjunto de 43 alinhamentos. Nesta situação o antipadrão OCA06 - Incompletude de domínio e intervalo, quando aplicado sobre os alinhamentos, identificou essa correspondência como inconsistente. 114 Figura 65 - Correspondência 〈iasted_nl:c-0447708-8078411, sigkdd_fr:c-3448744-2358764, ≡, _〉 Ao refatorar os alinhamentos, de forma a remover a correspondência identificada como inconsistente, houve uma melhora nas médias das métricas de Precisão (18,27%) e Medida-F (3,18%) considerando o conjunto de alinhamentos analisados neste caso, conforme apresentado na Figura 66. A média da métrica de Cobertura não foi alterada. valor médio Figura 66 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #8. Caso 09 - Correspondência 〈confOf_nl:c-1180439-2483437, confOf_en:c5701075-1274855, ≡, _〉 A correspondência 〈confOf_nl:c-1180439-2483437, confOf_en:c-5701075- 1274855, ≡, _〉, indicada pela seta vermelha na Figura 67, ocorre 39 vezes dentro de um conjunto de 43 alinhamentos. Nesta situação o antipadrão OCA09 - Contradição de 115 disjunção-subsunção, quando aplicado sobre os alinhamentos, identificou essa correspondência como inconsistente. Figura 67 - Correspondência 〈confOf_nl:c-1180439-2483437, confOf_en:c-5701075-1274855, ≡, _〉 Ao refatorar os alinhamentos, de forma a remover a correspondência identificada como inconsistente, houve uma pequena melhora nas médias das métricas de Precisão (2,95%) e Medida-F (0,41%), considerando o conjunto de alinhamentos analisados neste caso, e houve uma queda na métrica de Cobertura (-0,41%), conforme apresentado na Figura 68. valor médio Figura 68 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #9. Caso 10 - Correspondência 〈sigkdd_es:c-2763261-4560459, confOf_pt:c1056766-4464703, ≡, _〉 A correspondência 〈sigkdd_es:c-2763261-4560459, confOf_pt:c-1056766- 4464703, ≡, _〉, indicada pela seta vermelha na Figura 69, ocorre 32 vezes dentro de um 116 conjunto de 43 alinhamentos. Nesta situação o antipadrão OCA09 - Contradição de disjunção-subsunção, quando aplicado sobre os alinhamentos, identificou essa correspondência como inconsistente. Figura 69 - Correspondência 〈sigkdd_es:c-2763261-4560459, confOf_pt:c-1056766-4464703, ≡, _〉 Ao refatorar os alinhamentos, de forma a remover a correspondência identificada como inconsistente, houve uma pequena melhora nas médias das métricas de Precisão (11,42%) e Medida-F (5,12%), considerando o conjunto de alinhamentos analisados neste caso, conforme apresentado na Figura 70. A média da métrica de Cobertura não foi alterada. valor médio Figura 70 - Gráfico comparativo das médias das métricas de Precisão, Cobertura e Medida-F relativo aos alinhamentos originais e alinhamentos refatorados para o caso #10. A Figura 70 apresenta um comparativo na alteração das médias de Precisão, Cobertura e Medida-F após a refatoração das ontologias nas quais foram identificadas as correspondências inconsistentes. 117 No Casos 02, 07, 08 e 10, houve uma melhora de mais de 10% na métrica de Precisão. Não houve casos em melhora de Cobertura, pelo contrário, em dois casos, 07 e 09, essa métrica reduziu. Já a Medida-F, que representa a harmonização entre a Precisão e Cobertura, somente em três casos, 02, 08 e 10, sua melhora significou mais de 1%, entretanto em 100% dos casos houve melhora em sua média. Vale ressaltar que a análise de todos os casos é em função da remoção de apenas uma correspondência. % melhora Figura 71 - Gráfico com o percentual de melhoria das médias das métricas de Precisão, Cobertura e Medida-F para cada caso analisado. A Figura 71 demonstra que em 100% dos casos quais as correspondências inconsistentes foram removidas individualmente, houve algum ganho na métrica de Precisão e Medida-F. Nesse cenário, espera-se que em uma utilização prática da abordagem proposta, haja um ganho mais significativo dessas métricas, já que, possívelmente, mais correspondências inconsistentes serão identificadas e removidas em conjunto. 118 7. Trabalhos Relacionados Neste capítulo serão apresentados os principais trabalhos relacionados à pesquisa. A fim de obter uma referência atualizada dos estudos sobre padrões e antipadrões para alinhamento de ontologias, foi realizado um estudo baseado em revisão sistemática, procurando reduzir o viés de uma revisão informal. Aqui será apresentado somente um resumo do processo executado e um estudo comparativo dos trabalhos relacionados com a proposta desta pesquisa, o protocolo completo pode ser verificado no Apêndice III. Por fim será apresentado um comparativo dos trabalhos selecionados como resultado da revisão sistemática com a abordagem proposta neste trabalho. 7.1. Revisão da Bibliografia A pesquisa foi realizada com base em trabalhos publicados em conferências e periódicos relatando iniciativas de utilização e aplicação de padrões e antipadrões para alinhamento de ontologias. A partir da identificação dos elementos que compõem as diferentes abordagens e iniciativas de utilização de antipadrões foi realizada uma análise mais detalhada a fim de identificar formatos, linguagens e ferramentas utilizadas dentro do contexto de antipadrões de alinhamento de ontologias, com o objetivo de caracterizá-las e, se possível influenciar a extensão de sua classificação, a extensão de uma linguagem 119 computacional para sua representação e a proposta de uma ferramenta para utilização dos padrões e antipadrões de alinhamento de ontologias em seu referido processo. A revisão dos trabalhos tem como objetivo responder questões relevantes à pesquisa conduzida. A seguir são apresentadas as questões quais delinearam a revisão realizada: Q1: Quais são as principais técnicas e/ou abordagens para utilização de padrões e/ou antipadrões para alinhamento de ontologias? Q2: Quais têm sido as linguagens e/ou formatos para representação de padrões e/ou antipadrões para alinhamento de ontologias utilizadas e/ou propostas? Q3: Existem softwares para provimento de padrões e/ou antipadrões para alinhamento de ontologias como recurso no processo de alinhamento das mesmas? Q4: Existem softwares de alinhamento de ontologias que utilizem padrões e/ou antipadrões para alinhamento de ontologias? Após a execução de todo protocolo elaborado para a o processo de revisão da bibliografia (vide Apêndice III), chegou-se a um número total de 11 trabalhos selecionados. A Tabela 11 apresenta os dados compilados com o título da publicação, autores e ano em que foi publicado o trabalho. A disposição dos dados está em ordem alfabética do título do trabalho. Tabela 11 – Trabalhos selecionados após a execução do protocolo de revisão. Id. Título Ano Autores 1 A Pattern-based Ontology Matching Approach for Detecting Complex Correspondences [51] 2009 Dominique Ritze, Christian Meilicke, Ondrej Sváb-Zamazal, Heiner Stuckenschmidt 2 APIs à gogo: Automatic generation of ontology APIs [52] 2009 Parreiras, F.S.; Saathoff, C.; Walter, T.; Franz, T.; Staab, S. 3 Alignment Patterns Based on Unified Foundational Ontology [53] 2012 Natalia Fonseca Padilha, Fernanda Araujo Baião, Kate Revoredo 4 AUTOMS-F: A framework for the synthesis of ontology mapping methods [54] 2009 Valarakos A.G., Spiliopoulos V., Vouros G.A. 5 Correspondence Patterns for Ontology Alignment [55] 2008 François Scharffe, Dieter Fensel 6 Exploiting patterns in ontology mapping [56] 2007 Svab O. 120 7 Ontology alignment design patterns [57] 2014 Scharffe F., Zamazal O., Fensel D. 8 Ontology Fusion with Complex Mapping Patterns [58] 2006 Jinguang Gu, Yi Zhou 9 Ontology matching with semantic verification [59] 2009 Jean-Mary, Y., Shironoshita, E., Kabuka, M. 10 Towards correspondence patterns for ontology mediation [60] 2007 Scharffe F., Ding Y., Fensel D. 11 Towards design patterns for ontology alignment [61] 2008 Scharffe F., Euzenat J., Fensel D. A Tabela 12 apresenta a correlação dos trabalhos selecionados com as questões de pesquisa delineadas para direcionamento dessa revisão. Tabela 12 - Correlação dos trabalhos selecionados com as questões de pesquisa. Tipo de Trabalho Grupo Selecionado Total Q1-Técnica / Aborgadem 1, 2, 3, 5, 6, 7, 8, 9, 10, 11 11 Q2-Linguagem / Formato 2, 5, 7, 10, 11 5 Q3-Ferramenta como Recurso - 0 Q4-Ferramenta Proprietária 4, 8, 9 3 Para cada um dos 11 trabalhos selecionados foi realizado um comparativo da proposta do referido trabalho com a proposta dessa pesquisa, onde foram identificados pontos interseção e onde a pesquisa deste trabalho contribui na evolução do objeto de pesquisa. O trabalho apresentado em [51] propõe vários padrões de correspondências complexas e métodos para identificação automática dessas correspondências complexas entre duas ontologias e sua transformação em padrões de correspondência. Correspondências complexas podem ser utilizadas na composição de antipadrões de correspondência, mas devem ser construídas manualmente. Enquanto o referido trabalho propõe a identificação automática de correspondências e sua transformação em padrões de correspondências, este trabalho propõe a identificação de antipadrões de correspondência, tomando como base correspondências incorretas, ou problemas de alinhamento. 121 O trabalho apresentado em [52] propõe uma linguagem de domínio específico para a manipulação de correspondências complexas, de forma a construir padrões de projeto de ontologias (ontology design patterns). No referido trabalho é proposta uma linguagem específica para a construção de padrões de ontologias, ao passo que este trabalho utiliza uma linguagem agnóstica para a construção de antipadrões de correspondência. No trabalho apresentado em [53] a utilização da OntoUML, linguagem conceitual baseada na ontologia de fundamentação UFO – Unified Foundational Ontology, é base para a construção de padrões e antipadrões de alinhamento de ontologias. Os padrões e antipadrões de alinhamento de ontologias apresentados no referido trabalho tomam como base uma determinada ontologia de fundamentação, neste caso a UFO. Além disso, os artefatos gerados são apenas conceituais, ou de modelagem, e não é apresentada uma representação computacional dos mesmos. Na proposta desta dissertação, além dos antipadrões ser independentes de domínio ou fundamentação, é apresentada sua representação computacional em uma linguagem que possibilita sua utilização para tal finalidade. Em [54] é apresentado um framework cujo objetivo é facilitar o desenvolvimento de métodos para realização de alinhamento automático de ontologias com a possibilidade de utilização de padrões de projeto de desenvolvimento. Apesar de ser um framework de alinhamento de ontologias, seu objetivo é facilitar o desenvolvimento de técnicas de alinhamento através de técnicas de prototipação e com a possibilidade do uso de padrões de projeto no desenvolvimento de tais métodos, mas não utiliza padrões de correspondência de ontologias. O framework proposto nessa dissertação tem como finalidade estender qualquer tipo de técnica de alinhamento, 122 fornecendo como recurso no processo de alinhamento a utilização de antipadrões de correspondência para identificação de correspondências inconsistentes. Em [55] é apresentada a proposta de utilização de padrões de correspondência como modelos pré-definidos para a construção de um alinhamento entre duas ontologias. Assim como os padrões de correspondência trabalham com modelos para a identificação de correspondências no processo de alinhamento de duas ontologias, antipadrões de correspondência agem como modelos para a identificação de correspondências inconsistentes estabelecidas no processo de alinhamento de duas ontologias. O foco do trabalho apresentado em [56] é a exploração de padrões como estruturas para melhorar a performance de métodos de alinhamento de ontologias, fornecendo algum conhecimento preliminar para tal tarefa. A proposta desta dissertação também fornece um conhecimento preliminar a ser utilizado no processo de alinhamento de ontologias, entretanto não possui como objetivo melhorar a performance da tarefa de alinhamento de ontologias, mas sim, melhorar a qualidade do alinhamento final, gerado como resultado deste processo. Em [57] é apresentado formalmente o conceito de padrões de correspondência e um catálogo de padrões de correspondência, baseado na análise de incompatibilidades ontológicas existentes na litetura. A linguagem utilizada para a representação de padrões também é apresentada neste trabalho. Ao invés de padrões de correspondência, esta dissertação apresenta um catálogo de antipadrões de correspondência, quais foram criados a partir de casos reais de correspondências incorretas. A representação computacional dos antipadrões de correspondência utiliza a mesma linguagem apresentada neste trabalho. 123 O objetivo em [58] é apresentar a utilização de padrões para correspondências complexas entre duas omtologias através de um algoritmo de identificação de correspondências complexas e fusão das ontologias. Antipadrões de correspondências também lidam com correspondências complexas, mas com o intuito de identificar correspondências inconsistentes. Entretanto neste trabalho, não são utilizados algoritmos para sua identificação, ao invés disso, utilizam modelos pré-definidos quais estão aptos a identificar uma situação inconsistente. Em [59] é apresentado um sistema que realiza o alinhamento entre duas ontologias e o valide através de um algoritmo que identifica inconsistências semânticas, analisando as propriedades das ontologias versus o alinhamento gerado. Nessa dissertação é apresentada uma metodologia para a criação de antipadrões de correspondência onde a mesma é aplicada utilizando os mesmo conceitos de veificação semântica. No entanto, não são necessários algoritmos para a verificação dos mesmos, através de modelos pré-definidos, inconsistências semânticas quais possam ocorrer em um alinhamento podem ser identificadas através destes modelos. O modelo é extensível e pode ser utilizado por qualquer ferramenta, uma vez que o framework aqui proposto pode ser utilizado como recurso no processo de alinhamento realizado por qualquer ferramenta. Em [60] padrões de correspondência são apresentados como uma ferramenta para projetar alinhamentos de ontologias mais precisos. Um modelo de padrão de correspondência é apresentado de forma que é utilizado para a construção de uma biblioteca de padrões de correspondência. Antipadrões de correspondência são utilizados com o propósito de projetar alinhamentos de ontologias mais precisos, entretando têm como objetivo identificar correspondências inconsistentes que possam ocorrer em um alinhamento já definido. Essa dissertação também apresenta um modelo 124 e uma metodologia para a construção dos mesmos, quais possibilitam a criação de uma biblioteca, ou catálogo, de antipadrões de correspondência. Novamente, em [61], padrões de correspondência são apresentados como uma ferramenta que auxilia a construção de um alinhamento entre duas ontologias de forma mais precisa. Antipadrões de correspondência também auxililam na construção de alinhamentos entre duas ontologias de forma mais precisa, fornecendo modelos para a identificação de correspondências inconsistentes entre duas ontologias. O principal diferencial deste trabalho em relação aos demais é o fornecimento de antipadrões de correspondência como recurso no processo de alinhameto de ontologias, de uma forma independente da técnica utilizada para o alinhamento que está sendo realizado. Além disso, este trabalho apresenta uma linguagem para representação de padrões de alinhamento de ontologias, qual foi utilizada para a representação de antipadrões de correspondência de ontologias. E por fim, este trabalho difere-se dos demais por apresentar um framework que é extensível, uma vez que usuários podem adicionar antipadrões de correspondência. 125 8. Conclusão Este capítulo apresenta as considerações finais do trabalho, destacando suas principais contribuições, limitações identificadas na condução da pesquisa bem como oportunidades de trabalhos futuros. 8.1. Considerações Finais O alinhamento de ontologias é um campo de pesquisa bastante ativo na comunidade científica, onde várias ténicas, abordagens e ferramentas têm sido propostas para a execução de tal tarefa. No entanto, mesmo com o esforço contínuo da comunidade científica para melhoria do processo de alinhamento de ontologias, tais métodos ainda estão suscetíveis a indentificar correspondências incorretas entre as ontologias que estão sendo alinhadas. O objetivo geral da pesquisa consistiu em melhorar a qualidade de um alinhamento entre duas ontologias através da utilização de antipadrões de correspondência no processo de alinhamento. Antipadrões de correspondência auxiliam na identificação de correspondências incorretas entre duas ontologias que estão sendo alinhadas. Esse objetivo foi atingido a partir da definição formal de um antipadrão de correspondência. Além disso, este trabalho apresentou uma metodologia para a construção de um antipadrão de correspondência, através de um processo sistemático de 126 análise do problema que está sendo tratado, assim como a elaboração de sua documentação geral, de forma que o mesmo possa ser utilizado como um modelo genérico, e ainda a representação computacional de um antipadrão de correspondência. Foram apresentados também a aquitetura de um framework de suporte ao processo alinhamento de ontologias, de forma a fornecer os antiparões de correspondência como recursos no referido processo, assim como seu desenvolvimento. Para a verificação da hipótese delineada neste trabalho e aplicabilidade da proposta da pesquisa, dois estudos de caso foram realizados. No primeiro estudo de caso, a metodologia para a construção de antipadrões de correspondência foi aplicada sobre uma base real de alinhamentos. Além de comprovar a aplicabilidade da metodologia proposta, teve como resultado um catálogo inicial de antipadrões de correspondência, construído a partir de problemas de alinhamentos reais. No segundo estudo de caso, os antipadrões de correspondência construídos e catalogados foram aplicados sobre outra base real de alinhamentos, com auxílio do sistema construído para suporte na identificação dos antipadrões de correspondência, o qual demonstrou a melhoria na qualidade final do alinhamento, considerando as métricas de Precisão e Medida-F. Em ambos os estudos de casos foram consideradas ontologias e alinhamentos disponilizados por uma importante e reconhecida inciativa de pesquisa na área, a OAEI. Uma importante característica do estudo é que os domínios selecionados não possuem sobreposição entre os estudos de caso, o que permitiu uma avaliação mais precisa da proposta. 127 8.2. Principais Contribuições A principal contribuição da pesquisa consiste na definição e formalização de antipadrões de correspondência de ontologias, e a apresentação de uma metodologia para a construção de antipadrões de correspondência. A aplicabilidade da metodologia foi avaliada em um estudo de caso ao buscar por correspondências incorretas em uma base de alinhamentos real, e seguindo a sistemática do processo, um catálogo de antipadrões foi gerado, também como contribuição importante desta pesquisa. As contribuições de cunho tecnológico desta pesquisa consistem na arquitetura de um framework de suporte ao processo de alinhamento de ontologias que forneça e identifique antipadrões de correspondência como recursos no processo de alinhamento de ontologias, e a implementação de um protótipo desse sistema. Durante o desenvolvimento da pesquisa dois trabalhos foram publicados em workshops inseridos em importantes eventos relacionados ao tema de ontologias, sendo o primeiro com o foco de introduzir o conceito de antipadrões de corresponência [62] e o segundo demonstrando a aplicabilidade da metodologia de criação de antipadrões de correspondência e apresentando uma prévia do catáologo de antipadrões de correspondência [63], apresentado em sua totalidade nesta dissertação. 8.3. Limitações da Proposta Uma limitação no processo de aplicabilidade dos antiparões de correspondência foi no úlitmo passo da metodologia de construção de antipadrões de correspondência. A natureza de um antipadrão deve apresentar uma solução refatorada para o problema identificado. No entanto, refatorar um alinhamento entre duas ontologias, confome apresentado na Seção 3.2, significa realizar o reparo do alinhamento de forma a eliminar 128 inconsistências lógicas, e essa não é uma tarefa trivial, uma vez que podem existir várias soluções para um cenário específico. Outra limitação refere-se à semântica da relação das correspondências que representam uma correspondência inconsistente. Nesse trabalho considerou-se somente relações de igualdade. A simetria da relação também é um ponto que deve ser considerado. Nesse cenário de alinhamento de duas ontologias qual foi realizado o estudo, a correspondência é simétrica, em outros casos de correspondências, como em linked open data, a correspondência parte apenas de um dos lados que está identificando a igualdade. Esse cenário não foi contemplado para a análise dos antipadrões de correspondência. Por fim, uma última limitação é sobre a força da correspondência estabelecida não entre duas entidades, que não é considerada na construção dos antipadrões de correspondência. O tratamento e a análise da semântica da força das correspondências podem ser explorados a fim de refinar a aplicação dos antipadrões de correspondência. 8.4. Trabalhos Futuros Embora a aplicabilidade dos antipadrões de correspondência tenha sido avaliada em cenários reais de alinhamentos de ontologias, para fins de estudo, as correspondências incorretas foram simplesmente eliminadas. O último passo da metodologia de construção de antipadrões de correspondência, que é a refatoração do alinhamento, oferece uma oportunidade de trabalho de forma a explorar métodos automaticos e/ou semi-automaticos, e deve ainda considerar a interação com usuário, de forma que o mesmo seja envolvido na melhor solução a ser aplicada para o problema identificado. 129 A construção dos antipadrões de correspondência tomando como base a análise de erros identificados foi aqui realiza de forma manual. Uma oportunidade de trabalho futuro é a automatização ou semi-automatização deste processo de identificação de antipadrões de correspondência. A proposta do framework apresentada neste trabalho foi concretizada em um protótipo, que pode ser estendido e mais explorado, oferencendo APIs padronizadas e compartilhando o catálogo de antiapdrões de correspondência em infraestruturas em cloud computing, ou diretamente por URIs na web. 130 9. Referências [1] ZIEGLER, P.; DITTRICH, K. R. Three Decades of Data Integration—all Problems Solved? Building the Information Society. [S.l.]: Springer, 2004 [2] CALVANESE, D.; DE GIACOMO, G. Data integration: A logic-based perspective. AI magazine, v. 26, n. 1, p. 59, 2005. [3] HURSON, A.; R. BRIGHT, M. W. Multidatabase Systems: An Advanced Concept in Handling Distributed Data. Advances in Computers, 32:149–200, 1991. [4] CAREY, M.J. Towards Heterogeneous Multimedia Information Systems: The Garlic Approach. In 5th International Workshop on Research Issues in Data Engineering-Distributed Object Management (RIDE-DOM 1995), p. 124–131, 1995. [5] BAYARDO, R. J. InfoSleuth: Agent-Based Semantic Integration of Information in Open and Dynamic Environments. In 1997 ACM SIGMOD International Conference on Management of Data (SIGMOD 1997), p. 195–206, 1997. [6] ARENAS, M. The Hyperion Project: From Data Integration to Data Coordination. SIGMOD Record, 32, p. 53–58, 2003. [7] ABITEBOUL, S.; BENJELLOUN, O.; MILO, T. Web Services and Data Integration. Third International Conference on Web Information Systems Engineering (WISE 2002), p. 3–7, IEEE Computer Society, 2002. [8] DOAN, A.; HALEVY, A. Y. Semantic integration research in the database community: A brief survey. AI magazine, v. 26, n. 1, p. 83, 2005. [9] BUKHRES, A.; ELMAGARMID, K. Object-Oriented Multidatabase Systems: A Solution for Advanced Applications. Prentice-Hall, 1996. 131 [10] OUKSEL, M.; SHETH, P. Semantic Interoperability in Global Information Systems: A Brief Introduction to the Research Area and the Special Section. SIGMOD Record, 28, p. 5–12, 1999. [11] GRUBER, T.R. (1993) A translation approach to portable ontologies. Knowledge Acquisition, Vol. 5, N. 2, p.199–220, 1993. [12] BREITMAN, K. K.; CASANOVA, M.A.; TRUSZKOWSKI, W. Semantic Web: concepts, technologies and applications. New York; London: Springer, 2007. [13] EUZENAT, J.; SHVAIKO, P. Ontology Matching Second Edition. Springer-Verlag Berlin Heidelberg, 2013. [14] MITCHELL, T. M. Machine Learning. Burr Ridge, IL:McGraw-Hill. v. 45, 1997. [15] BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The semantic web, Scientific American, 2001. [16] CRUZ, I. F.; XIAO, H.; The role of ontologies in data integration, Engineering intelligent systems for electrical engineering and communications, 2005. [17] SHVAIKO, P.; EUZENAT, J. Ontology matching: state of the art and future challenges. IEEE Transactions on Knowledge and Data Engineering, 2013. [18] EUZENAT, J.; MEILICKE, C.; STUCKENSCHMIDT, H.; SHVAIKO, P.; TROJAHN, C. Ontology Alignment Evaluation Initiative: six years of experience, Journal on data semantics XV, 2011. [19] EHRIG, M. Ontology Alignment: Bridging the Semantic Gap, Springer. 2007. [20] SCHARFFE, F. Correspondence Patterns Representation. Ph.D Thesis, University of Innsbruck, 2009. [21] SCHARFFE, F.; ZAMAZAL, O.; FENSEL, D. Ontology alignment design patterns. Knowledge Information Systems, Springer-Verlag London, 2013. [22] BROWN, W J.; MALVEAU, R. C.; MCCORMICK III, H. W.; MOWBRAY, T. J. Antipatterns – Refactoring Software, Architectures and Projetcs in Crisis, John Wiley & Sons, Inc., 1998. [23] GUIZZARDI, G. Ontological Foundations for Structural Conceptual Models, Ph.D. Thesis, University of Twente, The Netherlands, 2005. [24] SOWA, J. F. Principles of Ontology, 2004. Disponível em: http://wwwksl.stanford.edu/ontostd/mailarchive/0136.html. 132 [25] GRUNINGER, M.; LEE, J. Introduction to the ontology application and design. Communications of the ACM, Vol. 45, No. 2, pp. 39- 41, 2002. [26] GUARINO, N.; CARRARA, M.; GIARETTA, P. An ontology of meta-level categories. Proceedings of the Principles of Knowledge Representation and Reasoning KR'94. San Francisco, CA, USA, pp. 270–280, 1994. [27] DACONTA, M. C.; OBRST, L. J.; SMITH, K. T. The Semantic Web: A Guide to the Future of XML, Web Services, and Knowledge Management. Wiley Publishing, Inc, 2003. [28] GLIMM, B.; HORROCKS, I.; LUTZ, C.; SATTLER, U. Conjunctive query answering for the description logic SHIQ. Journal of Artificial Intelligence Research, Volume 31 Issue 1, pp. 157-204, 2008. [29] JEAN-MARY, Y., SHIRONOSHITA, E., KABUKA, M.: Ontology matching with semantic verification. Journal Web Semantics: Science, Services and Agents on the World Wide Web archive. Volume 7 Issue 3, pp. 235-251, 2009. [30] HORROCKS, I.; KUTZ, O.; SATTLER, U. The Even More Irresistible SROIQ. In Proc. of the 10th Int. Conf. on Principles of Knowledge Representation and Reasoning (KR 2006), pp. 57-67. AAAI Press, 2006. [31] KRÖTZSCH, M.; SIMANČÍK, F. HORROCKS, I. A Description Logic Primer. CoRR, abs/1201.4089. 2012. [32] DUGGAN, D. Enterprises software architecture and design: entities, services, and resources applications. John Wiley & Sons, 2012. [33] FUXMAN, A.; MILLER, J.: Schema Mapping, Encyclopedia of Database Systems. Springer Science, 2009. [34] SANTOS, G.; ROCHA, A.; TRAVASSOS, G.: Ambientes de Engenharia de Software Orientados a Corporação. VIII Simpósio Brasileiro de Qualidade de Software, 2009. [35] FERREIRA, A. Dicionário da Língua Portuguesa. Rio de Janeiro: Positivo. 2010 133 [36] KLEIN, M. Combining a relating ontologies: an analysis of problems and solutions, Workshop on Ontologies and Information Sharing, International Joint Conference on Artificial Intelligence, 2001. [37] PREDOIU L., MARTIN-RECUERDA, F., POLLERES, A., FEIER, C. MOCAN, A. DE BRUIJN, J. PORTO, F. FOXVOG, D. E ZIMMERMANN, K.: Framework for representing ontology networks with mappings that deal with conflicting and complementary concept definitions. Technical report, DIP EU project, FP6 – 507483, 2004. [38] WACHE, H.: Semantisches mediation für heterogene informationsquellen,2003. [39] EUZENAT, J.: An API for ontology alignment. The Semantic Web–ISWC 2004, p. 698–712, 2004. [40] BUSCHMANN, F.; MEUNIER, R.; ROHNERT, H.; SORNMERLAD, P.; STAL, M.: Pattern-Oriented Software Architecture. A System of Patterns,. John'Wiley & Sons Ltd., England 1996. [41] BOUQUET, P.; GIUNCHIGLIA, F.; VAN HARMELEN, F.; SERAFINI, L.; STUCKENSCHMIDT. H.: C-OWL: Contextualizing Ontologies. The Semantic Web ISWC 2003, Second International Semantic Web Conference, volume 2870 of LNCS. Springer, 2003. [42] BORGIDA, A.; SERAFINI, L.: Distributed Description Logics: Assimilating Information from Peer Sources. Journal on Data Semantics, 1:153–184, 2003. [43] PAZIENZA, M.; STELLATO, A.; VINDIGNI, M.; ZANZOTTO, F.: XeOML: An XML-based extensible Ontology Mapping Language. In Proceedings of the Meaning Coordination and Negotiation workshop (MCN-04), 2004. [44] SCHARFFE, F., ZAMAZAL, O. FENSEL, D.: Ontology alignment design patterns. Knowledge and Information Systems, pp. 1–28, 2012. [45] ABOLHASSANI, H.; HARIRI, B.; HAERI, H.: On Ontology Alignment Experiments. 2006. Disponível em: http://www.webology.org/2006/v3n3/a28.html. Acesso em: 09/01/2013. 134 [46] ALEXANDER, C.; ISHIKAWA, S.; SILVERSTEIN, M.: A Pattern Language. Oxford University Press, New York, 1977. [47] AKROYD, M.: AntiPatterns: Vaccinations against Object Misuse, Object World West, San Francisco, 1996. [48] SVÁB-ZAMAZAL O.: Pattern-based Ontology Matching and Ontology Alignment Evaluation, PhD Dissertation thesis, VSE-FIS, Prague, 2010. [49] MEILICKE, C.: Alignment Incoherence in Ontology Matching. PhD thesis Universitat Mannheim, Mannheim, 2011. [50] SALES, T., BARCELOS, F., GUIZZARDI, G.: Identification of Semantic AntiPatterns in Ontology-Driven Conceptual Modeling via Visual Simulation. 4th International Workshop on Ontology-Driven Information Systems. 2012. [51] Ritze, D.; Meilicke, C.; Sváb-zamazal, O.; Stuckenschmidt, H.: A Pattern-based Ontology Matching Approach for Detecting Complex Correspondences. International Semantic Web Conference - ISWC. 2009. [52] PARREIRAS, F.; SAATHOFF, C.; WALTER, T.; FRANZ, T.; STAAB, S.: APIs à gogo: Automatic Generation of Ontology APIs. ICSC '09 Proceedings of the 2009 IEEE International Conference on Semantic Computing. pp 342-348. 2009. [53] PADILHA, N.; BAIÃO, F.; REVOREDO. R.: Alignment Patterns Based on Unified Foundational Ontology. V Seminar on Ontology Research in Brazil and VII International Workshop on Metamodels, Ontologies and Semantic Technologies. Volume 938 of CEUR Workshop Proceedings, pp 48-59, CEUR-WS.org, 2012. [54] VALARAKOS, A.; SPILIOPOULOS, V.; VOUROS, G.: AUTOMS-F: A Framework for the Synthesis of Ontology Mapping Methods. Studies in Computational Intelligence Volume 221, 2009, pp 45-59, 2009. [55] SCHARFFE, F.; FENSEL, D.: Correspondence Patterns for Ontology Alignment. Lecture Notes in Computer Science Volume 5268, pp 83-92, 2008. [56] ŠVÁB, O.: Exploiting Patterns in Ontology Mapping. Lecture Notes in Computer Science Volume 4825, 2007, pp 956-960, 2007. 135 [57] SCHARFFE, F.; ZAMAZAL, O.; FENSEL, D.: Ontology alignment design patterns. Journal Knowledge and Information Systems archive. Volume 40 Issue 1, pp 1-28 , 2014. [58] GU, J.; ZHOU, Y.: Ontology fusion with complex mapping patterns. Proceeding KES'06 Proceedings of the 10th international conference on Knowledge-Based Intelligent Information and Engineering Systems - Volume Part I, pp. 738-745, 2006. [59] JEAN-MARY, Y.; SHIRONOSHITA, P.; KABUKA, M.: Ontology matching with semantic verification. Journal Web Semantics: Science, Services and Agents on the World Wide Web. Volume 7 Issue 3, pp. 235-251, 2009. [60] SCHARFFE, F.; DING, Y.; FENSEL, D.: Towards Correspondence Patterns for Ontology Mediation. Proceedings of the 2nd International Workshop on Ontology Matching (OM-2007) Collocated with the 6th International Semantic Web Conference (ISWC-2007) and the 2nd Asian Semantic Web Conference (ASWC-2007), Volume 304 of CEUR Workshop Proceedings, CEUR-WS.org, 2007. [61] SCHARFFE, F.; EUZENAT, J.; FENSEL, D.: Towards design patterns for ontology alignment. Proceeding SAC '08 Proceedings of the 2008 ACM symposium on Applied computing. pp.2321-2325, 2008. [62] GUEDES, A., BAIÃO, F., REVOREDO, K.: On the Identification and Representation of Ontology Correspondence Antipatterns. 8th International Workshop on Modular Ontologies in 8th International Conference on Formal Ontology in Information System. To be appear. 2014. [63] GUEDES, A., BAIÃO, F., REVOREDO, K.: Digging Ontology Correspondence Antipatterns. 5th Workshop on Ontology and Semantic Web Patterns in 13th International Semantic Web Conference. To be appear. 2014. [64] FELLBAUM, C.: WordNet: An Electronic Lexical Database. MIT Press, Cambridge, MA, p. 47–73, 1998. 136 10. Apêndice I - Catálogo de Antipadrões de Correspondência. A seguir são apresentados todos os modelos de antipadrão de correspondência gerados a partir dos erros recorrentes de alinhamento apresentados na Seção 4.1. Os antipadrões de correspondência podem ser agrupados de acordo com os tipos de verificações semâticas quais os mesmos identificam um problema. Antipadrões de Correspondência do tipo Contradição de disjunçãosubsunção: Tabela 13 – Antipadrão de correspondência OCA01 Item Nome Tipo de solução refatorada Causa raiz Forças desbalanceadas Forma geral do antipadrão Sintomas e consequências Exceções conhecidas Variações Soluções relacionadas Evidências Breve Descrição OCA01 Reestabelecimento das correspondências identificadas. Contradição de disjunção-subsunção De acordo com a classificação das incompatibilidades ontológicas apresentadas anteriormente, pode ocorrer aqui uma incompatibilidade terminológica de termos homônimos, onde o sistema de alinhamentos identifica que estes termos são similares, no entanto seus significados são diferentes. A semântica da relação dos termos deve ser observada para composição do alinhamento. A incompatibilidade ontológica “descrição do conceito” deve ser observada também. (?o1:?e1 ≡ ?o2:?e1) ⊓ (?o1:?e1 ⊑ ?o1:?e2) ⊓ (?o1:?e2 ⊓ ?o1:?e3 ⊑ ⊥) ⊓ (?o1:?e3 ≡ ?o2:?e2) ⊓ (?o2:?e1 ⊑ ?o2:?e2). Sintoma: duas subclasses que possuam correspondência de igualdade, mas suas superclasses não possuem correspondência de igualdade e são disjuntas. Não aplicável. Não aplicável. Não aplicável. - Representação computacional do antipadrão OCA01: 137 <rdf:RDF xmlns ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:xsd ="http://www.w3.org/2001/XMLSchema#" xmlns:align ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:dc ="http://purl.org/dc/elements/1.1/" xmlns:dcterms ="http://purl.org/dc/terms/" > <rdf:Description> <dc:creator>Anselmo Guedes <[email protected]></dc:creator> <dc:description>Contradição de disjunção-subsunção</dc:description> <dc:date>2014-04-23</dc:date> <dcterms:identifier>OCA01</dcterms:identifier> <dcterms:abstract></dcterms:abstract> <dcterms:hasVersion>0.1</dcterms:hasVersion> </rdf:Description> <Alignment> <onto1> <Ontology rdf:about=":uri_o1"> <location>:loc_o1</location> </Ontology> </onto1> <onto2> <Ontology rdf:about=":uri_o2"> <location>:loc_o2</location> </Ontology> </onto2> <map> <cell> <entity1><Class rdf:about="?o1:?e1"/></entity1> <entity2><Class rdf:about="?o2:?e1"/></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1><Class rdf:about="?o2:?e2" /></entity1> <entity2><Class rdf:about="?o2:?e1" /></entity2> <relation rdf:resource="subsumedBy"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e1" /></entity1> <entity2><Class rdf:about="?o1:?e3" /></entity2> <relation rdf:resource="disjoint"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e2" /></entity1> <entity2><Class rdf:about="?o2:?e2" /></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e2" /></entity1> <entity2><Class rdf:about="?o1:?e3" /></entity2> <relation rdf:resource="subsumedBy"/> </cell> </map> </Alignment> </rdf:RDF> Tabela 14 – Antipadrão de correspondência OCA02 Item Nome Tipo de solução refatorada Causa raiz Forças desbalanceadas Forma geral do antipadrão Sintomas e consequências Breve Descrição OCA02 Reestabelecimento das correspondências identificadas. Contradição de disjunção-subsunção Incompatibilidades ontológicas do tipo escopo e cobertura do modelo e granularidade. Incompatibilidade terminológica de termos homônimos também pode ocorrer. (?o1:?e1 ≡ ?o2:?e1) ⊓ (?o1:?e1 ⊑ ?o1:?e2) ⊓ (?o1:?e2 ⊑ ?o1:?e3) ⊓ (?o1:?e3 ≡ ?o2:?e2) ⊓ (?o2:?e1 ⊓ ?o2:?e2 ⊑ ⊥) Sintomas: Classes disjuntas em uma ontologia correspondentes com classes na mesma estrutura hierárquica em outra ontologia. 138 Exceções conhecidas Variações Soluções relacionadas Evidências Consequências: implicações lógicas em inferências e em um processo de mediação de dados. Não aplicável OCA03, OCA04, OCA09 Não aplicável Caso #1: 〈confof:conference, edas:conference, ≡, _〉 〈edas:conferencesession, ekaw:conference_session, ≡, _〉 Representação computacional do antipadrão OCA02: <rdf:RDF xmlns ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:xsd ="http://www.w3.org/2001/XMLSchema#" xmlns:align ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:dc ="http://purl.org/dc/elements/1.1/" xmlns:dcterms ="http://purl.org/dc/terms/" > <rdf:Description> <dc:creator>Anselmo Guedes <[email protected]></dc:creator> <dc:description>Contradição de disjunção-subsunção</dc:description> <dc:date>2014-04-23</dc:date> <dcterms:identifier>OCA02</dcterms:identifier> <dcterms:abstract></dcterms:abstract> <dcterms:hasVersion>0.1</dcterms:hasVersion> </rdf:Description> <Alignment> <onto1> <Ontology rdf:about=":uri_o1"> <location>:loc_o1</location> </Ontology> </onto1> <onto2> <Ontology rdf:about=":uri_o2"> <location>:loc_o2</location> </Ontology> </onto2> <map> <cell> <entity1><Class rdf:about="?o1:?e1"/></entity1> <entity2><Class rdf:about="?o2:?e1"/></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e1" /></entity1> <entity2><Class rdf:about="?o1:?e2" /></entity2> <relation rdf:resource="subsumedBy"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e2" /></entity1> <entity2><Class rdf:about="?o1:?e3" /></entity2> <relation rdf:resource="subsumedBy"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e3" /></entity1> <entity2><Class rdf:about="?o2:?e2" /></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1><Class rdf:about="?o2:?e1" /></entity1> <entity2><Class rdf:about="?o2:?e2" /></entity2> <relation rdf:resource="disjoint"/> </cell> </map> </Alignment> </rdf:RDF> 139 Tabela 15 – Antipadrão de correspondência OCA03 Item Nome Tipo de solução refatorada Causa raiz Exceções conhecidas Variações Soluções relacionadas Breve Descrição OCA03 Reestabelecimento das correspondências identificadas. Contradição de disjunção-subsunção Incompatibilidades ontológicas do tipo escopo e cobertura do modelo e granularidade. Incompatibilidade terminológica de termos homônimos também pode ocorrer. (?o1:?e1 ≡ ?o2:?e1) ⊓ (?o1:?e1 ⊑ ?o1:?e2) ⊓ (?o1:?e2 ⊓ ?o1:?e3 ⊑ ⊥) ⊓ (?o1:?e3 ≡ ?o2:?e2) ⊓ (?o2:?e2 ⊑ ?o2:?e1) Sintomas: Classes disjuntas em uma ontologia correspondentes com classes na mesma estrutura hierárquica em outra ontologia. Consequências: implicações lógicas em inferências e em um processo de mediação de dados. Não aplicável OCA02, OCA04, OCA09 Não aplicável Evidências Caso #2: Forças desbalanceadas Forma geral do antipadrão Sintomas e consequências 〈conference:paper, ekaw:paper, ≡, _〉 〈edas:conference, ekaw:conference, ≡, _〉 Representação computacional do antipadrão OCA03: <rdf:RDF xmlns ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:xsd ="http://www.w3.org/2001/XMLSchema#" xmlns:align ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:dc ="http://purl.org/dc/elements/1.1/" xmlns:dcterms ="http://purl.org/dc/terms/" > <rdf:Description> <dc:creator>Anselmo Guedes <[email protected]></dc:creator> <dc:description>Contradição de disjunção-subsunção</dc:description> <dc:date>2014-04-23</dc:date> <dcterms:identifier>OCA03</dcterms:identifier> <dcterms:abstract></dcterms:abstract> <dcterms:hasVersion>0.1</dcterms:hasVersion> </rdf:Description> <Alignment> <onto1> <Ontology rdf:about=":uri_o1"> <location>:loc_o1</location> </Ontology> </onto1> <onto2> <Ontology rdf:about=":uri_o2"> <location>:loc_o2</location> </Ontology> </onto2> <map> <cell> <entity1><Class rdf:about="?o1:?e1"/></entity1> <entity2><Class rdf:about="?o2:?e1"/></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e1" /></entity1> <entity2><Class rdf:about="?o1:?e2" /></entity2> <relation rdf:resource="subsumedBy"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e2" /></entity1> <entity2><Class rdf:about="?o1:?e3" /></entity2> 140 <relation rdf:resource="disjoint"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e3" /></entity1> <entity2><Class rdf:about="?o2:?e2" /></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1><Class rdf:about="?o2:?e2" /></entity1> <entity2><Class rdf:about="?o2:?e1" /></entity2> <relation rdf:resource="subsumedBy"/> </cell> </map> </Alignment> </rdf:RDF> Tabela 16 – Antipadrão de correspondência OCA04 Item Nome Tipo de solução refatorada Causa raiz Exceções conhecidas Variações Soluções relacionadas Breve Descrição OCA04 Reestabelecimento das correspondências identificadas. Contradição de disjunção-subsunção Incompatibilidades ontológicas do tipo escopo e cobertura do modelo e granularidade. Incompatibilidade terminológica de termos homônimos também pode ocorrer. (?o1:?e1 ≡ ?o2:?e1) ⊓ (?o1:?e1 ⊓ ?o1:?e2 ⊑ ⊥) ⊓ (?o1:?e2 ≡ ?o2:?e2) ⊓ (?o2:?e1 ⊑ ?o2:?e2) Sintomas: Classes disjuntas em uma ontologia correspondentes com classes na mesma estrutura hierárquica em outra ontologia. Consequências: implicações lógicas em inferências e em um processo de mediação de dados. Não aplicável OCA02, OCA03, OCA09 Não aplicável Evidências Caso #3: Forças desbalanceadas Forma geral do antipadrão Sintomas e consequências 〈conference:paper, ekaw:paper, ≡, _〉 Representação computacional do antipadrão OCA04: <rdf:RDF xmlns ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:xsd ="http://www.w3.org/2001/XMLSchema#" xmlns:align ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:dc ="http://purl.org/dc/elements/1.1/" xmlns:dcterms ="http://purl.org/dc/terms/" > <rdf:Description> <dc:creator>Anselmo Guedes <[email protected]></dc:creator> <dc:description>Contradição de disjunção-subsunção</dc:description> <dc:date>2014-04-23</dc:date> <dcterms:identifier>OCA04</dcterms:identifier> <dcterms:abstract></dcterms:abstract> <dcterms:hasVersion>0.1</dcterms:hasVersion> </rdf:Description> <Alignment> <onto1> <Ontology rdf:about=":uri_o1"> <location>:loc_o1</location> </Ontology> </onto1> <onto2> <Ontology rdf:about=":uri_o2"> 141 <location>:loc_o2</location> </Ontology> </onto2> <map> <cell> <entity1><Class rdf:about="?o1:?e1"/></entity1> <entity2><Class rdf:about="?o2:?e1"/></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e1" /></entity1> <entity2><Class rdf:about="?o1:?e2" /></entity2> <relation rdf:resource="disjoint"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e2" /></entity1> <entity2><Class rdf:about="?o2:?e2" /></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1><Class rdf:about="?o2:?e1" /></entity1> <entity2><Class rdf:about="?o2:?e2" /></entity2> <relation rdf:resource="subsumedBy"/> </cell> </map> </Alignment> </rdf:RDF> Tabela 17 – Antipadrão de correspondência OCA09 Item Nome Tipo de solução refatorada Causa raiz Forças desbalanceadas Forma geral do antipadrão Sintomas e consequências Exceções conhecidas Variações Soluções relacionadas Evidências Breve Descrição OCA09 Reestabelecimento das correspondências identificadas. Contradição de disjunção-subsunção Incompatibilidades ontológicas do tipo escopo e cobertura do modelo e granularidade. Incompatibilidade terminológica de termos homônimos também pode ocorrer (?o1:?e2 ≡ ?o2:?e1) ⊓ (?o1:?e2 ⊑ ?o1:?e1) ⊓ (?o1:?e1 ≡ ?o2:?e3) ⊓ (?o2:?e3 ⊓ ?o2:?e2 ⊑ ⊥) ⊓ (?o2:?e1 ⊑ ?o2:?e2) Sintomas: Classes disjuntas em uma ontologia correspondentes com classes na mesma estrutura hierárquica em outra ontologia. Consequências: implicações lógicas em inferências e em um processo de mediação de dados. Não aplicável OCA02, OCA03, OCA04 Não aplicável Caso #7: 〈cmt:paper,conference:paper, ≡, _〉 〈conference:callForPaper,edas:callForPapers, ≡, _〉 Representação computacional do antipadrão OCA09: <rdf:RDF xmlns ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:xsd ="http://www.w3.org/2001/XMLSchema#" xmlns:align ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:dc ="http://purl.org/dc/elements/1.1/" xmlns:dcterms ="http://purl.org/dc/terms/" > <rdf:Description> <dc:creator>Anselmo Guedes <[email protected]></dc:creator> <dc:description>Contradição de disjunção-subsunção</dc:description> <dc:date>2014-04-23</dc:date> <dcterms:identifier>OCA09</dcterms:identifier> 142 <dcterms:abstract></dcterms:abstract> <dcterms:hasVersion>0.1</dcterms:hasVersion> </rdf:Description> <Alignment> <onto1> <Ontology rdf:about=":uri_o1"> <location>:loc_o1</location> </Ontology> </onto1> <onto2> <Ontology rdf:about=":uri_o2"> <location>:loc_o2</location> </Ontology> </onto2> <map> <cell> <entity1><Class rdf:about="?o1:?e2"/></entity1> <entity2><Class rdf:about="?o2:?e1"/></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e2"/></entity1> <entity2><Class rdf:about="?o1:?e1"/></entity2> <relation rdf:resource="subsumedBy"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e1"/></entity1> <entity2><Class rdf:about="?o2:?e3"/></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1><Class rdf:about="?o2:?e3"/></entity1> <entity2><Class rdf:about="?o2:?e2"/></entity2> <relation rdf:resource="disjoint"/> </cell> <cell> <entity1><Class rdf:about="?o2:?e1"/></entity1> <entity2><Class rdf:about="?o2:?e2"/></entity2> <relation rdf:resource="subsumedBy"/> </cell> </map> </Alignment> </rdf:RDF> Antipadrões de Correspondência do tipo Incompletude de domínio e intervalo: Tabela 18 – Antipadrão de correspondência OCA05(a) Item Nome Tipo de solução refatorada Causa raiz Forças desbalanceadas Forma geral do antipadrão Sintomas e consequências Exceções conhecidas Variações Soluções relacionadas Breve Descrição OCA05(a) Reestabelecimento das correspondências identificadas. Incompletude de domínio e intervalo Incompatibilidades ontológicas do tipo escopo. Incompatibilidade terminológica de termos homônimos também pode ocorrer. (?o1:?p1≡?o2:?p1) ⊓ (?o1:?e1 ∈ domain(?o1:?p1)) ⊓ (?o2:?e1 ∈ domain(?o2:?p1)) ⊓ ∄(?o1:?e1≡?o2:?e1) Sintomas: Propriedades ou relações correspondentes entre duas ontologias, mas suas classes de domínio e intervalo não são correspondentes. Consequências: implicações lógicas em inferências e em um processo de mediação de dados. Não aplicável OCA05(b), OCA06, OCA10, OCA11, OCA12 Não aplicável 143 Evidências Caso #4: 〈cmt:writtenBy, confof:writtenBy, ≡, _〉 〈confof:hasPhone, edas:hasPhone, ≡, _〉 〈iasted:obtain, sigkdd:obtain, ≡, _〉 〈confof:writtenBy, confof:writtenBy, ≡, _〉 Representação computacional do antipadrão OCA05(a): <rdf:RDF xmlns ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:xsd ="http://www.w3.org/2001/XMLSchema#" xmlns:align ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:dc ="http://purl.org/dc/elements/1.1/" xmlns:dcterms ="http://purl.org/dc/terms/" > <rdf:Description> <dc:creator>Anselmo Guedes <[email protected]></dc:creator> <dc:description>Incompletude de domínio e intervalo </dc:description> <dc:date>2014-04-23</dc:date> <dcterms:identifier>OCA05a</dcterms:identifier> <dcterms:abstract></dcterms:abstract> <dcterms:hasVersion>0.1</dcterms:hasVersion> </rdf:Description> <Alignment> <onto1> <Ontology rdf:about=":uri_o1"> <location>:loc_o1</location> </Ontology> </onto1> <onto2> <Ontology rdf:about=":uri_o2"> <location>:loc_o2</location> </Ontology> </onto2> <map> <cell> <entity1><Relation rdf:about="?o1:?p1"/></entity1> <entity2><Relation rdf:about="?o2:?p1"/></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1> <Class rdf:about="?o1:?e1"/> <Condition> <Relation rdf:about="?o1:?p1"> <domainRestriction> <Class rdf:about="?o1:?e1" /> </domainRestriction> </Relation> </Condition> </entity1> <entity2> <Class rdf:about="?o2:?e1"/> <Condition> <Relation rdf:about="?o2:?p1"> <domainRestriction> <Class rdf:about="?o2:?e1" /> </domainRestriction> </Relation> </Condition> </entity2> <not><relation rdf:resource="equivalence"/></not> </cell> </map> </Alignment> </rdf:RDF> 144 Tabela 19 – Antipadrão de correspondência OCA05(b) Item Nome Tipo de solução refatorada Causa raiz Forças desbalanceadas Forma geral do antipadrão Sintomas e consequências Exceções conhecidas Variações Soluções relacionadas Evidências Breve Descrição OCA05(b) Reestabelecimento das correspondências identificadas. Incompletude de domínio e intervalo Incompatibilidades ontológicas do tipo escopo. Incompatibilidade terminológica de termos homônimos também pode ocorrer. (?o1:?p1≡?o2:?p1) ⊓ (?o1:?e2 ∈ range(?o1:?p1)) ⊓ (?o2:?e2 ∈ range(?o2:?p1)) ⊓ ∄(?o1:?e2≡?o2:?e2) Sintomas: Propriedades ou relações correspondentes entre duas ontologias, mas suas classes de domínio e intervalo não são correspondentes. Consequências: implicações lógicas em inferências e em um processo de mediação de dados. Não aplicável OCA05(a), OCA06, OCA10, OCA11, OCA12 Não aplicável Caso #4: 〈cmt:writtenBy, confof:writtenBy, ≡, _〉 〈confof:hasPhone, edas:hasPhone, ≡, _〉 〈iasted:obtain, sigkdd:obtain, ≡, _〉 〈confof:writtenBy, confof:writtenBy, ≡, _〉 Representação computacional do antipadrão OCA05(b): <rdf:RDF xmlns ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:xsd ="http://www.w3.org/2001/XMLSchema#" xmlns:align ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:dc ="http://purl.org/dc/elements/1.1/" xmlns:dcterms ="http://purl.org/dc/terms/" > <rdf:Description> <dc:creator>Anselmo Guedes <[email protected]></dc:creator> <dc:description>Incompletude de domínio e intervalo </dc:description> <dc:date>2014-04-23</dc:date> <dcterms:identifier>OCA05b</dcterms:identifier> <dcterms:abstract></dcterms:abstract> <dcterms:hasVersion>0.1</dcterms:hasVersion> </rdf:Description> <Alignment> <onto1> <Ontology rdf:about=":uri_o1"> <location>:loc_o1</location> </Ontology> </onto1> <onto2> <Ontology rdf:about=":uri_o2"> <location>:loc_o2</location> </Ontology> </onto2> <map> <cell> <entity1><Relation rdf:about="?o1:?p1"/></entity1> <entity2><Relation rdf:about="?o2:?p1"/></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1> <Class rdf:about="?o1:?e2"/> <Condition> <Relation rdf:about="?o1:?p1"> <rangeRestriction> <Class rdf:about="?o1:?e2" /> 145 </rangeRestriction> </Relation> </Condition> </entity1> <entity2> <Class rdf:about="?o2:?e2"/> <Condition> <Relation rdf:about="?o2:?p1"> <rangeRestriction> <Class rdf:about="?o2:?e2" /> </rangeRestriction> </Relation> </Condition> </entity2> <not><relation rdf:resource="equivalence"/></not> </cell> </map> </Alignment> </rdf:RDF> Tabela 20 – Antipadrão de correspondência OCA06 Item Nome Tipo de solução refatorada Causa raiz Forças desbalanceadas Forma geral do antipadrão Sintomas e consequências Exceções conhecidas Variações Soluções relacionadas Evidências Breve Descrição OCA06 Reestabelecimento das correspondências identificadas. Incompletude de domínio e intervalo Incompatibilidades ontológicas do tipo escopo. Incompatibilidade terminológica de termos homônimos também pode ocorrer. (?o1:?p1≡?o2:?p1) ⊓ (?o1:?e1 ∈ domain(?o1:?p1)) ⊓ (?o1:?e2 ∈ domain(?o1:?p1)) ⊓ (?o1:?e2≡?o2:?e2) ⊓ (?o2:?e1 ∈ domain(?o2:?p1)) Sintomas: Propriedades ou relações correspondentes entre duas ontologias, mas suas classes de domínio e intervalo não são correspondentes. Consequencias: implicações lógicas em inferências e em um processo de mediação de dados. Não aplicável OCA05(b), OCA05(b), OCA10, OCA11, OCA12 Não aplicável Caso #5: 〈confof:hasStreet, edas:hasStreet, ≡, _〉 〈confof:hasPostalCode, edas:hasPostalCode, ≡, _〉 〈cmt:date, sigkdd:date, ≡, _〉 Representação computacional do antipadrão OCA06: <rdf:RDF xmlns ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:xsd ="http://www.w3.org/2001/XMLSchema#" xmlns:align ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:dc ="http://purl.org/dc/elements/1.1/" xmlns:dcterms ="http://purl.org/dc/terms/" > <rdf:Description> <dc:creator>Anselmo Guedes <[email protected]></dc:creator> <dc:description>Incompletude de domínio e intervalo </dc:description> <dc:date>2014-04-23</dc:date> <dcterms:identifier>OCA06</dcterms:identifier> <dcterms:abstract></dcterms:abstract> <dcterms:hasVersion>0.1</dcterms:hasVersion> </rdf:Description> <Alignment> <onto1> 146 <Ontology rdf:about=":uri_o1"> <location>:loc_o1</location> </Ontology> </onto1> <onto2> <Ontology rdf:about=":uri_o2"> <location>:loc_o2</location> </Ontology> </onto2> <map> <cell> <entity1><Relation rdf:about="?o1:?p1"/></entity1> <entity2><Relation rdf:about="?o2:?p1"/></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1> <Class rdf:about="?o1:?e1"/> <Condition> <Relation rdf:about="?o1:?p1"> <domainRestriction> <Class rdf:about="?o1:?e1" /> </domainRestriction> </Relation> </Condition> </entity1> <entity2> <Class rdf:about="?o2:?e1"/> <Condition> <Relation rdf:about="?o2:?p1"> <domainRestriction> <Class rdf:about="?o2:?e1" /> </domainRestriction> </Relation> </Condition> </entity2> <not><relation rdf:resource="equivalence"/></not> </cell> <cell> <entity1> <Class rdf:about="?o1:?e2"/> <Condition> <Relation rdf:about="?o1:?p1"> <domainRestriction> <Class rdf:about="?o1:?e2" /> </domainRestriction> </Relation> </Condition> </entity1> <entity2><Class rdf:about="?o2:?e2"/></entity2> <relation rdf:resource="equivalence"/> </cell> </map> </Alignment> </rdf:RDF> Tabela 21 – Antipadrão de correspondência OCA10 Item Nome Tipo de solução refatorada Causa raiz Forças desbalanceadas Forma geral do antipadrão Sintomas e consequências Breve Descrição OCA10 Reestabelecimento das correspondências identificadas. Incompletude de domínio e intervalo Incompatibilidades ontológicas do tipo escopo. Incompatibilidade terminológica de termos homônimos também pode ocorrer. (?o1:?p1 ≡ ?o2:?p1) ⊓ (?o1:?e1 ∈ domain(?o1:?p1)) ⊓ (?o1:?e2 ∈ range(?o1:?p1)) ⊓ (?o1:?e1 ≡ ?o2:?e1) ⊓ (?o2:?e1 ∈ domain(?o2:?p1)) ⊓ (?o2:?e2 ∈ range(?o2:?p1)) ⊓ ∄(?o1:?e2 ≡ ?o2:?e2) Sintomas: Propriedades ou relações correspondentes entre duas ontologias, mas apenas suas classes de domínio ou intervalo são 147 Exceções conhecidas Variações Soluções relacionadas Evidências correspondentes. Consequencias: implicações lógicas em inferências e em um processo de mediação de dados. Não aplicável OCA05(b), OCA05(b), OCA06, OCA11 Não aplicável Caso #8: 〈iasted:pay, sigkdd:pay, ≡, _〉 〈cmt:writtenBy, ekaw:writtenBy, ≡, _〉 Representação computacional do antipadrão OCA10: <rdf:RDF xmlns ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:xsd ="http://www.w3.org/2001/XMLSchema#" xmlns:align ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:dc ="http://purl.org/dc/elements/1.1/" xmlns:dcterms ="http://purl.org/dc/terms/" > <rdf:Description> <dc:creator>Anselmo Guedes <[email protected]></dc:creator> <dc:description>Incompletude de domínio e intervalo </dc:description> <dc:date>2014-04-23</dc:date> <dcterms:identifier>OCA10</dcterms:identifier> <dcterms:abstract></dcterms:abstract> <dcterms:hasVersion>0.1</dcterms:hasVersion> </rdf:Description> <Alignment> <onto1> <Ontology rdf:about=":uri_o1"> <location>:loc_o1</location> </Ontology> </onto1> <onto2> <Ontology rdf:about=":uri_o2"> <location>:loc_o2</location> </Ontology> </onto2> <map> <cell> <entity1><Relation rdf:about="?o1:?p1"/></entity1> <entity2><Relation rdf:about="?o2:?p1"/></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1> <Class rdf:about="?o1:?e1"/> <Condition> <Relation rdf:about="?o1:?p1"> <domainRestriction> <Class rdf:about="?o1:?e1" /> </domainRestriction> </Relation> </Condition> </entity1> <entity2> <Class rdf:about="?o2:?e1"/> <Condition> <Relation rdf:about="?o2:?p1"> <domainRestriction> <Class rdf:about="?o2:?e1" /> </domainRestriction> </Relation> </Condition> </entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1> <Class rdf:about="?o1:?e2"/> 148 <Condition> <Relation rdf:about="?o1:?p1"> <rangeRestriction> <Class rdf:about="?o1:?e2" /> </rangeRestriction> </Relation> </Condition> </entity1> <entity2> <Class rdf:about="?o2:?e2"/> <Condition> <Relation rdf:about="?o2:?p1"> <rangeRestriction> <Class rdf:about="?o2:?e2" /> </rangeRestriction> </Relation> </Condition> </entity2> <not><relation rdf:resource="equivalence"/></not> </cell> </map> </Alignment> </rdf:RDF> Tabela 22 – Antipadrão de correspondência OCA11 Item Nome Tipo de solução refatorada Causa raiz Forças desbalanceadas Forma geral do antipadrão Sintomas e consequências Exceções conhecidas Variações Soluções relacionadas Evidências Breve Descrição OCA11 Reestabelecimento das correspondências identificadas. Incompletude de domínio e intervalo Incompatibilidades ontológicas do tipo escopo. Incompatibilidade terminológica de termos homônimos também pode ocorrer. (?o1:?p1 ≡ ?o2:?p1) ⊓ (?o1:?e1 ∈ domain(?o1:?p1)) ⊓ (?o1:?e2 ∈ range(?o1:?p1)) ⊓ (?o1:?e2 ≡ ?o2:?e3) ⊓ (?o2:?e1 ∈ domain(?o2:?p1)) ⊓ (?o2:?e2 ∈ domain(?o2:?p1)) ⊓ (?o2:?e3 ∈ range(?o2:?p1)) ⊓ ∄(?o1:?e1 ≡ ?o2:?e1) ⊓ ∄(?o1:?e1 ≡ ?o2:?e2) Sintomas: Propriedades ou relações correspondentes entre duas ontologias, mas apenas suas classes de domínio ou intervalo são correspondentes. Consequencias: implicações lógicas em inferências e em um processo de mediação de dados. Não aplicável OCA05(b), OCA05(b), OCA06, OCA10, OCA11 Não aplicável Caso #9: 〈confof:hasTopic, edas:hasTopic, ≡, _〉 〈confof:hasCountry, edas:hasCountry, ≡, _〉 〈conference:isGivenBy, iasted:isGivenBy, ≡, _〉 Representação computacional do antipadrão OCA11: <rdf:RDF xmlns ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:xsd ="http://www.w3.org/2001/XMLSchema#" xmlns:align ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:dc ="http://purl.org/dc/elements/1.1/" xmlns:dcterms ="http://purl.org/dc/terms/" > <rdf:Description> <dc:creator>Anselmo Guedes <[email protected]></dc:creator> <dc:description>Incompletude de domínio e intervalo</dc:description> <dc:date>2014-04-23</dc:date> <dcterms:identifier>OCA11</dcterms:identifier> 149 <dcterms:abstract></dcterms:abstract> <dcterms:hasVersion>0.1</dcterms:hasVersion> </rdf:Description> <Alignment> <onto1> <Ontology rdf:about=":uri_o1"> <location>:loc_o1</location> </Ontology> </onto1> <onto2> <Ontology rdf:about=":uri_o2"> <location>:loc_o2</location> </Ontology> </onto2> <map> <cell> <entity1><Relation rdf:about="?o1:?p1"/></entity1> <entity2><Relation rdf:about="?o2:?p1"/></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1> <Class rdf:about="?o1:?e2"/> <Condition> <Relation rdf:about="?o1:?p1"> <rangeRestriction> <Class rdf:about="?o1:?e2" /> </rangeRestriction> </Relation> </Condition> </entity1> <entity2> <Class rdf:about="?o2:?e3"/> <Condition> <Relation rdf:about="?o2:?p1"> <rangeRestriction> <Class rdf:about="?o2:?e3" /> </rangeRestriction> </Relation> </Condition> </entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1> <Class rdf:about="?o1:?e1"/> <Condition> <Relation rdf:about="?o1:?p1"> <domainRestriction> <Class rdf:about="?o1:?e1" /> </domainRestriction> </Relation> </Condition> </entity1> <entity2> <Class rdf:about="?o2:?e1"/> <Condition> <Relation rdf:about="?o2:?p1"> <domainRestriction> <Class rdf:about="?o2:?e1" /> </domainRestriction> </Relation> </Condition> </entity2> <not><relation rdf:resource="equivalence"/></not> </cell> <cell> <entity1> <Class rdf:about="?o1:?e1"/> <Condition> <Relation rdf:about="?o1:?p1"> <domainRestriction> <Class rdf:about="?o1:?e1" /> </domainRestriction> </Relation> </Condition> </entity1> 150 <entity2> <Class rdf:about="?o2:?e2"/> <Condition> <Relation rdf:about="?o2:?p1"> <domainRestriction> <Class rdf:about="?o2:?e2" /> </domainRestriction> </Relation> </Condition> </entity2> <not><relation rdf:resource="equivalence"/></not> </cell> </map> </Alignment> </rdf:RDF> Antipadrões de Correspondência do tipo Incompletude de domínio e intervalo e contradição de disjunção-subsunção: Tabela 23 – Antipadrão de correspondência OCA07 Item Nome Tipo de solução refatorada Causa raiz Forças desbalanceadas Forma geral do antipadrão Sintomas e consequências Exceções conhecidas Variações Soluções relacionadas Evidências Breve Descrição OCA07 Reestabelecimento das correspondências identificadas. Incompletude de domínio e intervalo e contradição de disjunçãosubsunção. Incompatibilidades ontológicas do tipo escopo e cobertura do modelo e granularidade. Incompatibilidade terminológica de termos homônimos também pode ocorrer. (?o1:?e1 ≡ ?o2:?e2) ⊓ (?o1:?e1 ⊓ ?o1:?e2 ⊑ ⊥) ⊓ (?o1:?e2 ≡ ?o2:?e1) ⊓ (?o2:?e3 ⊑ ?o2:?e2) ⊓ (?o2:?e1 ≡ ?o2:?p1.(?o2:?e3)) Sintomas: Classes disjuntas em uma ontologia correspondentes com classes pertencentes ao domínio e/ou equivalentes a uma propriedade em outra ontologia. Consequencias: implicações lógicas em inferências e em um processo de mediação de dados. Não aplicável Não aplicável Não aplicável Caso #6: 〈edas:person, iasted:person, ≡, _〉 〈conference:invited_talk, ekaw:invited_talk, ≡, _〉 Representação computacional do antipadrão OCA07: <rdf:RDF xmlns ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:xsd ="http://www.w3.org/2001/XMLSchema#" xmlns:align ="http://knowledgeweb.semanticweb.org/heterogeneity/alignment#" xmlns:dc ="http://purl.org/dc/elements/1.1/" xmlns:dcterms ="http://purl.org/dc/terms/" > <rdf:Description> <dc:creator>Anselmo Guedes <[email protected]></dc:creator> <dc:description>Incompletude de domínio e intervalo e contradição de disjunçãosubsunção</dc:description> <dc:date>2014-04-23</dc:date> <dcterms:identifier>OCA07</dcterms:identifier> <dcterms:abstract></dcterms:abstract> <dcterms:hasVersion>0.1</dcterms:hasVersion> 151 </rdf:Description> <Alignment> <onto1> <Ontology rdf:about=":uri_o1"> <location>:loc_o1</location> </Ontology> </onto1> <onto2> <Ontology rdf:about=":uri_o2"> <location>:loc_o2</location> </Ontology> </onto2> <map> <cell> <entity1><Class rdf:about="?o1:?e1"/></entity1> <entity2><Class rdf:about="?o2:?e2"/></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e1"/></entity1> <entity2><Class rdf:about="?o1:?e2"/></entity2> <relation rdf:resource="disjoint"/> </cell> <cell> <entity1><Class rdf:about="?o1:?e2"/></entity1> <entity2><Class rdf:about="?o2:?e1"/></entity2> <relation rdf:resource="equivalence"/> </cell> <cell> <entity1><Class rdf:about="?o2:?e3"/></entity1> <entity2><Class rdf:about="?o2:?e2"/></entity2> <relation rdf:resource="subsumedBy"/> </cell> <cell> <entity1><Class rdf:about="?o2:?e1"/></entity1> <entity2> <Relation rdf:about="?o2:?p1"/> <Condition> <Relation rdf:about="?o2:?p1"> <domainRestriction> <Class rdf:about="?o2:?e3" /> </domainRestriction> </Relation> </Condition> </entity2> <relation rdf:resource="equivalence"/> </cell> </map> </Alignment> </rdf:RDF> 152 11. Apêndice II – Estudo de Caso Esta seção apresenta o detalhamento do estudo de caso apresentado na seção 6.2 Estudo Caso 1 Tabela 24 – Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #1 Evento 2011.5 2013 2012 2012 2013 2011.5 2011.5 2012 2013 2012 2012 2013 2012 2013 2012 2012 2013 2012 2013 2013 2013 2012 Ferramenta AgrMaker AML GO2A GOMMA GOMMA Lily LogMap LogMap ODGOMS Optima ServOMap ServOMap ServOMapL StringsAuto TOAST WeSeE WeSeE Wmatch XMapGen XMapSig YAM++ YAM++ Ontologia1 mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse Ontologia2 Precisão Cobertura Medida-F human 0,942200557 0,892480211 0,916666667 human 0,953612167 0,827176781 0,88590604 human 0,918044572 0,842348285 0,878568971 human 0,950471698 0,797493404 0,867288379 human 0,950471698 0,797493404 0,867288379 human 0,810948905 0,732849604 0,76992377 human 0,918044572 0,842348285 0,878568971 human 0,913756237 0,845646438 0,878383008 human 0,97824116 0,711741425 0,823978618 human 0,853564547 0,584432718 0,693813626 human 0,994861254 0,638522427 0,777822419 human 0,959058342 0,618073879 0,751704773 human 0,989754098 0,637203166 0,775280899 human 0,89469697 0,779023747 0,832863188 human 0,854368932 0,754617414 0,801401051 human 0,910023678 0,76055409 0,828602228 human 0,615384615 0,37994723 0,469820555 human 0,858221477 0,674802111 0,755539143 human 0,806278714 0,694591029 0,746279235 human 0,854271357 0,672823219 0,752767528 human 0,944086022 0,868733509 0,904843696 human 0,943396226 0,857519789 0,898410504 Tabela 25 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #1 após sua refatoração. Evento Ferramenta Ontologia1 Ontologia2 Precisão Cobertura Medida-F 2011.5 AgrMaker mouse human 0,942857143 0,892480211 0,916977296 153 2013 2012 2012 2013 2011.5 2011.5 2012 2013 2012 2012 2013 2012 2013 2012 2012 2013 2012 2013 2013 2013 2012 AML GO2A GOMMA GOMMA Lily LogMap LogMap ODGOMS Optima ServOMap ServOMap ServOMapL StringsAuto TOAST WeSeE WeSeE Wmatch XMapGen XMapSig YAM++ YAM++ mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse mouse human human human human human human human human human human human human human human human human human human human human human 0,9543379 0,918705036 0,951219512 0,951219512 0,811541271 0,918705036 0,914407989 0,97824116 0,853564547 0,994861254 0,959058342 0,989754098 0,89469697 0,855007474 0,910023678 0,615384615 0,858221477 0,806896552 0,854271357 0,943396226 0,944086022 0,827176781 0,842348285 0,797493404 0,797493404 0,732849604 0,842348285 0,845646438 0,711741425 0,584432718 0,638522427 0,618073879 0,637203166 0,779023747 0,754617414 0,76055409 0,37994723 0,674802111 0,694591029 0,672823219 0,857519789 0,868733509 0,886219081 0,878871301 0,867599569 0,867599569 0,770190641 0,878871301 0,87868403 0,823978618 0,693813626 0,777822419 0,751704773 0,775280899 0,832863188 0,80168185 0,828602228 0,469820555 0,755539143 0,746543779 0,752767528 0,898410504 0,904843696 Estudo Caso 2 Tabela 26 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #2 Evento 2013 2011.5 2012 2011.5 2012 2011.5 2011.5 2012 2011.5 2012 2012 2013 2013 2011.5 2012 2013 2013 2011.5 2012 2013 2011.5 2012 2011.5 2011.5 Ferramenta AML AROMA AROMA AUTOMSv2 AUTOMSv2 CIDER CODI CODI CSA GO2A HotMatch HotMatch IAMA LogMap LogMap LogMap LogMapLite LogMapLt LogMapLt MaasMatch MaasMtch MaasMtch MapEvo MapPSO Ontologia1 cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en Ontologia2 Precisão Cobertura Medida-F iasted_nl 0 0 0 iasted_nl 1 0 0 iasted_nl 1 0 0 iasted_nl 0,5 0,5 0,5 iasted_nl 0,5 0,5 0,5 iasted_nl 0,333333333 0,25 0,285714286 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0,125 0,5 0,2 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0,014285714 0,25 0,027027027 iasted_nl 0,014084507 0,25 0,026666667 iasted_nl 0,028169014 0,5 0,053333333 iasted_nl 0 0 0 iasted_nl 0 0 0 154 2012 2013 2012 2013 2013 2012 2013 2013 2011.5 2012 2013 2013 2012 2011.5 2012 2013 MapSSS MapSSS MEDLEY ODGOMS OntoK Optima StringsAuto Synthesis WeSeE WeSeE WeSeE WikiMatch Wmatch YAM++ YAM++ YAM++ cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl 0,166666667 0 0,125 0,333333333 0 0,333333333 0 0 0,3 0,375 0,333333333 0,25 0,214285714 0,4 0,166666667 0,2 0,25 0 0,5 0,25 0 1 0 0 0,75 0,75 0,5 0,5 0,75 0,5 0,5 0,25 0,2 0 0,2 0,285714286 0 0,001463325 0 0 0,428571429 0,5 0,4 0,333333333 0,333333333 0,444444444 0,4 0,222222222 Tabela 27 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #2 após sua refatoração. Evento 2013 2011.5 2012 2011.5 2012 2011.5 2011.5 2012 2011.5 2012 2012 2013 2013 2011.5 2012 2013 2013 2011.5 2012 2013 2011.5 2012 2011.5 2011.5 2012 2013 2012 2013 2013 2012 Ferramenta AML AROMA AROMA AUTOMSv2 AUTOMSv2 CIDER CODI CODI CSA GO2A HotMatch HotMatch IAMA LogMap LogMap LogMap LogMapLite LogMapLt LogMapLt MaasMatch MaasMtch MaasMtch MapEvo MapPSO MapSSS MapSSS MEDLEY ODGOMS OntoK Optima Ontologia1 cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en Ontologia2 Precisão Cobertura Medida-F iasted_nl 0 0 0 iasted_nl 1 0 0 iasted_nl 1 0 0 iasted_nl 0,666666667 0,5 0,571428571 iasted_nl 0,666666667 0,5 0,571428571 iasted_nl 0,5 0,25 0,333333333 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0,125 0,5 0,2 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0,014285714 0,25 0,027027027 iasted_nl 0,014285714 0,25 0,027027027 iasted_nl 0,028169014 0,5 0,053333333 iasted_nl 0 0 0 iasted_nl 0 0 0 iasted_nl 0,2 0,25 0,222222222 iasted_nl 0 0 0 iasted_nl 0,125 0,5 0,2 iasted_nl 0,5 0,25 0,333333333 iasted_nl 0 0 0 iasted_nl 0,666666667 1 0,001463325 155 2013 2013 2011.5 2012 2013 2013 2012 2011.5 2012 2013 StringsAuto Synthesis WeSeE WeSeE WeSeE WikiMatch Wmatch YAM++ YAM++ YAM++ cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en cmt_en iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl 0 0 0,333333333 0,375 0,333333333 0,285714286 0,214285714 0,5 0,333333333 0,25 0 0 0,75 0,75 0,5 0,5 0,75 0,5 0,5 0,25 0 0 0,461538462 0,5 0,4 0,363636364 0,333333333 0,5 0,4 0,25 Estudo Caso 3 Tabela 28 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #3. Evento 2013 2011.5 2012 2011.5 2011.5 2011.5 2011.5 2013 2012 2013 2013 2011.5 2012 2013 2013 2011.5 2012 2013 2011.5 2012 2011.5 2011.5 2012 2013 2012 2013 2013 2013 2013 2011.5 2013 2013 2012 2011.5 2012 Ferramenta AML AROMA AROMA AUTOMSv2 CIDER CODI CSA HerTUDA HotMatch HotMatch IAMA LogMap LogMap LogMap LogMapLite LogMapLt LogMapLt MaasMatch MaasMtch MaasMtch MapEvo MapPSO MapSSS MapSSS MEDLEY ODGOMS OntoK StringsAuto Synthesis WeSeE WeSeE WikiMatch Wmatch YAM++ YAM++ Ontologia1 cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es Ontologia2 Precisão Cobertura Medida-F conference_pt 0,4 0,125 0,19047619 conference_pt 1 0 0 conference_pt 1 0 0 conference_pt 0,571428571 0,25 0,347826087 conference_pt 0,6 0,1875 0,285714286 conference_pt 0,333333333 0,0625 0,105263158 conference_pt 0,071428571 0,125 0,090909091 conference_pt 0,003752345 1 0,007476636 conference_pt 0 0 0 conference_pt 0 0 0 conference_pt 0,6 0,1875 0,285714286 conference_pt 0,333333333 0,0625 0,105263158 conference_pt 0,333333333 0,0625 0,105263158 conference_pt 0,333333333 0,0625 0,105263158 conference_pt 0,25 0,0625 0,1 conference_pt 0,25 0,0625 0,1 conference_pt 0,25 0,0625 0,1 conference_pt 0,034090909 0,1875 0,057692308 conference_pt 0,06741573 0,375 0,114285714 conference_pt 0,056179775 0,3125 0,095238095 conference_pt 0 0 0 conference_pt 0,1 0,1875 0,130434783 conference_pt 0,5 0,125 0,2 conference_pt 0,6 0,1875 0,285714286 conference_pt 0,25 0,0625 0,1 conference_pt 0,5 0,1875 0,272727273 conference_pt 0 0 0 conference_pt 0,714285714 0,3125 0,434782609 conference_pt 0,5 0,0625 0,111111111 conference_pt 0,25 0,375 0,3 conference_pt 0,416666667 0,3125 0,357142857 conference_pt 0,375 0,375 0,375 conference_pt 0,119047619 0,3125 0,172413793 conference_pt 0,5 0,125 0,2 conference_pt 0,5 0,125 0,2 156 Tabela 29 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #3 após sua refatoração. Evento 2013 2011.5 2012 2011.5 2011.5 2011.5 2011.5 2013 2012 2013 2013 2011.5 2012 2013 2013 2011.5 2012 2013 2011.5 2012 2011.5 2011.5 2012 2013 2012 2013 2013 2013 2013 2011.5 2013 2013 2012 2011.5 2012 Ferramenta AML AROMA AROMA AUTOMSv2 CIDER CODI CSA HerTUDA HotMatch HotMatch IAMA LogMap LogMap LogMap LogMapLite LogMapLt LogMapLt MaasMatch MaasMtch MaasMtch MapEvo MapPSO MapSSS MapSSS MEDLEY ODGOMS OntoK StringsAuto Synthesis WeSeE WeSeE WikiMatch Wmatch YAM++ YAM++ Ontologia1 cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es cmt_es Ontologia2 Precisão Cobertura Medida-F conference_pt 0,4 0,125 0,19047619 conference_pt 1 0 0 conference_pt 1 0 0 conference_pt 0,571428571 0,25 0,347826087 conference_pt 0,75 0,1875 0,3 conference_pt 0,333333333 0,0625 0,105263158 conference_pt 0,071428571 0,125 0,090909091 conference_pt 0,003752345 1 0,007476636 conference_pt 0 0 0 conference_pt 0 0 0 conference_pt 0,6 0,1875 0,285714286 conference_pt 0,333333333 0,0625 0,105263158 conference_pt 0,333333333 0,0625 0,105263158 conference_pt 0,333333333 0,0625 0,105263158 conference_pt 0,25 0,0625 0,1 conference_pt 0,25 0,0625 0,1 conference_pt 0,25 0,0625 0,1 conference_pt 0,034090909 0,1875 0,057692308 conference_pt 0,06741573 0,375 0,114285714 conference_pt 0,056179775 0,3125 0,095238095 conference_pt 0 0 0 conference_pt 0,1 0,1875 0,130434783 conference_pt 0,5 0,125 0,2 conference_pt 0,6 0,1875 0,285714286 conference_pt 0,25 0,0625 0,1 conference_pt 0,5 0,1875 0,272727273 conference_pt 0 0 0 conference_pt 0,714285714 0,3125 0,434782609 conference_pt 0,5 0,0625 0,111111111 conference_pt 0,25 0,375 0,3 conference_pt 0,416666667 0,3125 0,357142857 conference_pt 0,375 0,375 0,375 conference_pt 0,119047619 0,3125 0,172413793 conference_pt 0,5 0,125 0,2 conference_pt 0,5 0,125 0,2 Estudo Caso 4 Tabela 30 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #4. Evento Ferramenta 2012 2012 Ontologia1 benchmarks_ ASE biblio_1_101_ onto AUTOMSv2 benchmarks_ Ontologia2 benchmarks_ biblio_1_101_ onto benchmarks_ 157 Precisão Cobertura 0,577380952 1 Medida-F 0,732075472 0,956989247 0,917525773 0,936842105 2012 Hertuda 2012 HotMatch 2012 WeSeE biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto 0,889908257 1 0,941747573 0,913580247 0,762886598 0,831460674 0,968085106 0,93814433 0,952879581 Tabela 31 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #4 após sua refatoração. Evento Ferramenta Ontologia1 benchmarks_ 2012 ASE biblio_1_101_ onto benchmarks_ 2012 AUTOMSv2 biblio_1_101_ onto benchmarks_ 2012 Hertuda biblio_1_101_ onto benchmarks_ 2012 HotMatch biblio_1_101_ onto benchmarks_ 2012 WeSeE biblio_1_101_ onto Ontologia2 benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto Precisão Cobertura 0,584337349 1 Medida-F 0,737642586 0,978021978 0,917525773 0,946808511 0,91509434 1 0,955665025 0,913580247 0,762886598 0,831460674 0,978494624 0,93814433 0,957894737 Estudo Caso 5 Tabela 32 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #5. Evento 2012 2012 2012 2012 2012 2012 Ferramenta Ontologia1 benchmarks_ ASE biblio_1_101_ onto benchmarks_ AUTOMSv2 biblio_1_101_ onto benchmarks_ edna biblio_1_101_ onto benchmarks_ Hertuda biblio_1_101_ onto benchmarks_ HotMatch biblio_1_101_ onto benchmarks_ MapSSS biblio_1_101_ onto Ontologia2 benchmarks_ biblio_1_221_ onto benchmarks_ biblio_1_221_ onto benchmarks_ biblio_1_221_ onto benchmarks_ biblio_1_221_ onto benchmarks_ biblio_1_221_ onto benchmarks_ biblio_1_221_ onto 158 Precisão Cobertura Medida-F 0,577380952 1 0,732075472 0,941747573 1 0,97 0,638157895 1 0,779116466 0,889908257 1 0,941747573 0,966666667 0,896907216 0,930481283 0,979381443 0,979381443 0,979381443 2012 WeSeE benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_221_ onto 0,979166667 0,969072165 0,974093264 Tabela 33 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #5 após sua refatoração. Evento Ferramenta 2012 ASE 2012 AUTOMSv2 2012 edna 2012 Hertuda 2012 HotMatch 2012 MapSSS 2012 WeSeE Ontologia1 benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto Ontologia2 benchmarks_ biblio_1_221_ onto benchmarks_ biblio_1_221_ onto benchmarks_ biblio_1_221_ onto benchmarks_ biblio_1_221_ onto benchmarks_ biblio_1_221_ onto benchmarks_ biblio_1_221_ onto benchmarks_ biblio_1_221_ onto Precisão Cobertura Medida-F 0,580838323 1 0,734848485 0,950980392 1 0,974874372 0,638157895 1 0,779116466 0,889908257 1 0,941747573 0,97752809 0,896907216 0,935483871 0,989583333 0,979381443 0,984455959 0,989473684 0,969072165 0,979166667 Estudo Caso 6 Tabela 34 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #6. Evento 2012 2012 2012 2012 2012 Ferramenta Ontologia1 benchmarks_ ASE biblio_1_101_ onto benchmarks_ AUTOMSv2 biblio_1_101_ onto benchmarks_ Hertuda biblio_1_101_ onto benchmarks_ HotMatch biblio_1_101_ onto benchmarks_ WeSeE biblio_1_101_ onto Ontologia2 benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto 159 Precisão Cobertura 0,577380952 1 Medida-F 0,732075472 0,956989247 0,917525773 0,936842105 0,889908257 1 0,941747573 0,913580247 0,762886598 0,831460674 0,968085106 0,93814433 0,952879581 Tabela 35 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #6 após sua refatoração. Evento 2012 2012 2012 2012 2012 Ferramenta Ontologia1 benchmarks_ ASE biblio_1_101_ onto benchmarks_ AUTOMSv2 biblio_1_101_ onto benchmarks_ Hertuda biblio_1_101_ onto benchmarks_ HotMatch biblio_1_101_ onto benchmarks_ WeSeE biblio_1_101_ onto Ontologia2 benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto benchmarks_ biblio_1_101_ onto Precisão Cobertura Medida-F 0,584337349 1 0,737642586 0,978021978 0,917525773 0,946808511 0,91509434 1 0,955665025 0,913580247 0,762886598 0,831460674 0,978494624 0,93814433 0,957894737 Estudo Caso 7 Tabela 36 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #7. Evento 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2013 2013 2013 Ferramenta AROMA CIDER CODI CSA LogMap LogMapLt MaasMtch MapPSO WeSeE YAM++ AROMA AUTOMSv2 CODI GO2A GOMMA Hertuda LogMap LogMapLt MaasMtch MapSSS MEDLEY Optima WeSeE Wmatch YAM++ HerTUDA IAMA LogMap Ontologia1 confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz Ontologia2 confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl 160 Precisão Cobertura Medida-F 1 0,357142857 0,731707317 0,474576271 0,6 0,6 0,226666667 0,75 0,714285714 0,893939394 1 0,333333333 0,756097561 0,625 0,702702703 0,033348355 0,6 0,6 0,24 0,933333333 0,666666667 0,046065259 0,92 0,6875 0,867647059 0,033348355 0,6 0,6 0 0,067567568 0,405405405 0,378378378 0,040540541 0,040540541 0,22972973 0,040540541 0,337837838 0,797297297 0 0,013513514 0,418918919 0,067567568 0,351351351 1 0,040540541 0,040540541 0,243243243 0,378378378 0,054054054 0,972972973 0,310810811 0,148648649 0,797297297 1 0,040540541 0,040540541 0 0,113636364 0,52173913 0,421052632 0,075949367 0,075949367 0,228187919 0,076923077 0,458715596 0,842857143 0 0,025974026 0,539130435 0,12195122 0,468468468 0,064544265 0,075949367 0,075949367 0,241610738 0,538461538 0,1 0,087965791 0,464646465 0,244444444 0,830985915 0,064544265 0,075949367 0,075949367 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 LogMapLite MaasMatch MapSSS ODGOMS OntoK StringsAuto Synthesis WeSeE WikiMatch YAM++ confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl 0,6 0,573333333 0,6 0,666666667 0,186666667 0,6 0,2 0,428571429 0,785714286 0,897058824 0,040540541 0,581081081 0,040540541 0,054054054 0,189189189 0,040540541 0,108108108 0,040540541 0,148648649 0,824324324 0,075949367 0,577181208 0,075949367 0,1 0,187919463 0,075949367 0,140350877 0,074074074 0,25 0,85915493 Tabela 37 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #7 após sua refatoração. Evento 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 Ferramenta AROMA CIDER CODI CSA LogMap LogMapLt MaasMtch MapPSO WeSeE YAM++ AROMA AUTOMSv2 CODI GO2A GOMMA Hertuda LogMap LogMapLt MaasMtch MapSSS MEDLEY Optima WeSeE Wmatch YAM++ HerTUDA IAMA LogMap LogMapLite MaasMatch MapSSS ODGOMS OntoK StringsAuto Synthesis WeSeE Ontologia1 confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz confOf_cz Ontologia2 confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl 161 Precisão Cobertura Medida-F 1 0,384615385 0,75 0,473684211 0,75 0,75 0,22972973 1 0,735294118 0,907692308 1 0,5 0,775 0,714285714 0,722222222 0,033501606 0,75 0,75 0,243243243 0,965517241 0,8 0,04609475 0,958333333 0,785714286 0,880597015 0,033501606 0,75 0,75 0,75 0,581081081 0,75 0,8 0,189189189 0,75 0,210526316 0,5 0 0,067567568 0,405405405 0,364864865 0,040540541 0,040540541 0,22972973 0,040540541 0,337837838 0,797297297 0 0,013513514 0,418918919 0,067567568 0,351351351 0,986486486 0,040540541 0,040540541 0,243243243 0,378378378 0,054054054 0,972972973 0,310810811 0,148648649 0,797297297 0,986486486 0,040540541 0,040540541 0,040540541 0,581081081 0,040540541 0,054054054 0,189189189 0,040540541 0,108108108 0,040540541 0 0,114942529 0,526315789 0,41221374 0,076923077 0,076923077 0,22972973 0,077922078 0,462962963 0,848920863 0 0,026315789 0,543859649 0,12345679 0,472727273 0,064802486 0,076923077 0,076923077 0,243243243 0,54368932 0,101265823 0,08801956 0,469387755 0,25 0,836879433 0,064802486 0,076923077 0,076923077 0,076923077 0,581081081 0,076923077 0,101265823 0,189189189 0,076923077 0,142857143 0,075 2013 2013 WikiMatch YAM++ confOf_cz confOf_cz confOf_nl confOf_nl 0,846153846 0,910447761 0,148648649 0,824324324 0,252873563 0,865248227 Estudo Caso 8 Tabela 38 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #8. Evento 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 Ferramenta AUTOMSv2 CIDER CSA LogMap MaasMtch MapEvo MapPSO WeSeE YAM++ AROMA AUTOMSv2 CODI GO2A GOMMA Hertuda HotMatch LogMap MaasMtch MapSSS MEDLEY Optima WeSeE Wmatch YAM++ AML HerTUDA HotMatch IAMA LogMap ODGOMS OntoK RiMON2013 StringsAuto Synthesis WeSeE WikiMatch YAM++ Ontologia1 iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl Ontologia2 sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr Precisão 0,444444444 0,4 0 0,5 0,038461538 0 0 0,2 0,6875 1 0,444444444 0,5 0,133333333 0,04 0,001940743 0 0,5 0,038461538 0,166666667 0,25 0,002189461 0,636363636 0,230769231 0,555555556 0,5 0,001940743 0 0,5 0,5 0,5 0,038461538 0 0,6 0,666666667 0,153846154 0,3 0,5 Cobertura 0,266666667 0,133333333 0 0,133333333 0,2 0 0 0,333333333 0,733333333 0 0,266666667 0,133333333 0,133333333 0,333333333 1 0 0,133333333 0,2 0,133333333 0,133333333 1 0,466666667 0,2 0,666666667 0,133333333 1 0 0,133333333 0,133333333 0,133333333 0,2 0 0,2 0,133333333 0,133333333 0,2 0,466666667 Medida-F 0,333333333 0,2 0 0,210526316 0,064516129 0 0 0,25 0,709677419 0 0,333333333 0,210526316 0,133333333 0,071428571 0,003873967 0 0,210526316 0,064516129 0,148148148 0,173913043 0,004369356 0,538461538 0,214285714 0,606060606 0,210526316 0,003873967 0 0,210526316 0,210526316 0,210526316 0,064516129 0 0,3 0,222222222 0,142857143 0,24 0,482758621 Tabela 39 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #8 após sua refatoração. Evento Ferramenta Ontologia1 Ontologia2 162 Precisão Cobertura Medida-F 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 AUTOMSv2 CIDER CSA AROMA LogMapLt MaasMtch MapEvo MapPSO WeSeE YAM++ AROMA AUTOMSv2 CODI GO2A GOMMA Hertuda HotMatch LogMapLt MaasMtch MapSSS MEDLEY Optima WeSeE Wmatch YAM++ AML HerTUDA HotMatch IAMA MapSSS ODGOMS OntoK StringsAuto Synthesis WeSeE WikiMatch YAM++ iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl iasted_nl sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr sigkdd_fr 0,5 0,5 0 1 0,5 0,038961039 0 0 0,208333333 0,733333333 1 0,5 0,5 0,133333333 0,04 0,001953379 0 0,5 0,038961039 0,181818182 0,25 0,002189461 0,7 0,25 0,588235294 0,5 0,001953379 0 0,666666667 0,666666667 0,666666667 0,038961039 0,75 1 0,166666667 0,333333333 0,538461538 0,266666667 0,133333333 0 0 0,133333333 0,2 0 0 0,333333333 0,733333333 0 0,266666667 0,133333333 0,133333333 0,333333333 1 0 0,133333333 0,2 0,133333333 0,133333333 1 0,466666667 0,2 0,666666667 0,133333333 1 0 0,133333333 0,133333333 0,133333333 0,2 0,2 0,133333333 0,133333333 0,2 0,466666667 0,347826087 0,210526316 0 0 0,210526316 0,065217391 0 0 0,256410256 0,733333333 0 0,347826087 0,210526316 0,133333333 0,071428571 0,003899142 0 0,210526316 0,065217391 0,153846154 0,173913043 0,004369356 0,56 0,222222222 0,625 0,210526316 0,003899142 0 0,222222222 0,222222222 0,222222222 0,065217391 0,315789474 0,235294118 0,148148148 0,25 0,5 Estudo Caso 9 Tabela 40 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #9. Evento 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 Ferramenta AROMA AUTOMSv2 CIDER CODI CSA MaasMtch WeSeE YAM++ Ontologia1 confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl Ontologia2 confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en 163 Precisão Cobertura Medida-F 1 0,846153846 0,65 0,780487805 0,440677966 0,28 0,9375 0,921875 0 0,297297297 0,175675676 0,432432432 0,351351351 0,283783784 0,405405405 0,797297297 0 0,44 0,276595745 0,556521739 0,390977444 0,281879195 0,566037736 0,855072464 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 AROMA AUTOMSv2 CODI GO2A GOMMA Hertuda HotMatch LogMap LogMapLt MaasMtch MapSSS MEDLEY Optima WeSeE Wmatch YAM++ AML HerTUDA HotMatch IAMA LogMap LogMapLite MaasMatch MapSSS ODGOMS OntoK StringsAuto Synthesis WeSeE WikiMatch YAM++ confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en 1 0,846153846 0,853658537 0,766666667 0,787878788 0,033348355 0,2 0,6 0,666666667 0,32 0,9375 0,766666667 0,046065259 0,942857143 0,740740741 0,876923077 0,6 0,033348355 0,2 0,6 0,6 0,666666667 0,64 0,727272727 0,714285714 0,213333333 0,75 0,296296296 0,863636364 0,833333333 0,907692308 0 0,297297297 0,472972973 0,621621622 0,351351351 1 0,013513514 0,040540541 0,054054054 0,324324324 0,405405405 0,621621622 0,972972973 0,445945946 0,27027027 0,77027027 0,040540541 1 0,013513514 0,040540541 0,040540541 0,054054054 0,648648649 0,108108108 0,067567568 0,216216216 0,121621622 0,216216216 0,256756757 0,27027027 0,797297297 0 0,44 0,608695652 0,686567164 0,485981308 0,064544265 0,025316456 0,075949367 0,1 0,322147651 0,566037736 0,686567164 0,087965791 0,605504587 0,396039604 0,820143885 0,075949367 0,064544265 0,025316456 0,075949367 0,075949367 0,1 0,644295302 0,188235294 0,12345679 0,214765101 0,209302326 0,25 0,395833333 0,408163265 0,848920863 Tabela 41 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #9 após sua refatoração. Evento 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2012 2012 2012 2012 2012 2012 2012 Ferramenta AUTOMSv2 CIDER CODI CSA AROMA MaasMtch WeSeE YAM++ AROMA AUTOMSv2 CODI GO2A GOMMA Hertuda HotMatch Ontologia1 confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl Ontologia2 confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en 164 Precisão 0,88 0,684210526 0,780487805 0,431034483 1 0,283783784 0,967741935 0,936507937 1 0,88 0,853658537 0,766666667 0,787878788 0,033486239 0,2 Cobertura 0,297297297 0,175675676 0,432432432 0,337837838 0 0,283783784 0,405405405 0,797297297 0 0,297297297 0,472972973 0,621621622 0,351351351 0,986486486 0,013513514 Medida-F 0,444444444 0,279569892 0,556521739 0,378787879 0 0,283783784 0,571428571 0,861313869 0 0,444444444 0,608695652 0,686567164 0,485981308 0,064773736 0,025316456 2012 2012 2012 2012 2012 2012 2012 2012 2012 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 LogMap LogMapLt MaasMtch MapSSS MEDLEY Optima WeSeE Wmatch YAM++ AML HerTUDA HotMatch IAMA LogMap LogMapLite MaasMatch MapSSS ODGOMS OntoK StringsAuto Synthesis WeSeE WikiMatch YAM++ confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_nl confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en confOf_en 0,6 0,666666667 0,324324324 0,967741935 0,766666667 0,046065259 0,970588235 0,769230769 0,890625 0,6 0,033486239 0,2 0,75 0,6 0,666666667 0,648648649 0,8 0,833333333 0,216216216 0,818181818 0,294117647 0,904761905 0,869565217 0,921875 0,040540541 0,054054054 0,324324324 0,405405405 0,621621622 0,972972973 0,445945946 0,27027027 0,77027027 0,040540541 0,986486486 0,013513514 0,040540541 0,040540541 0,054054054 0,648648649 0,108108108 0,067567568 0,216216216 0,121621622 0,202702703 0,256756757 0,27027027 0,797297297 0,075949367 0,1 0,324324324 0,571428571 0,686567164 0,087965791 0,611111111 0,4 0,826086957 0,075949367 0,064773736 0,025316456 0,076923077 0,075949367 0,1 0,648648649 0,19047619 0,125 0,216216216 0,211764706 0,24 0,4 0,412371134 0,855072464 Estudo Caso 10 Tabela 42 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #10. Evento 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 Ferramenta AROMA AUTOMSv2 CIDER CODI CSA MaasMtch MapEvo MapPSO WeSeE YAM++ AROMA AUTOMSv2 Hertuda HotMatch LogMap MaasMtch MapSSS MEDLEY Optima WeSeE Ontologia1 confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt Ontologia2 sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es 165 Precisão Cobertura Medida-F 1 0,571428571 0,5 0,333333333 0,015873016 0,074626866 0 0,051282051 0,15 0,5 1 0,571428571 0,002887789 0 0,333333333 0,059701493 0,2 0,333333333 0,00345679 0,5 0 0,571428571 0,428571429 0,142857143 0,142857143 0,714285714 0 0,285714286 0,428571429 0,142857143 0 0,571428571 1 0 0,142857143 0,571428571 0,142857143 0,142857143 1 0,428571429 0 0,571428571 0,461538462 0,2 0,028571429 0,135135135 0 0,086956522 0,222222222 0,222222222 0 0,571428571 0,005758947 0 0,2 0,108108108 0,166666667 0,2 0,006889764 0,461538462 2012 2012 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 2013 Wmatch YAM++ AML HerTUDA HotMatch IAMA LogMap LogMapLite MapSSS ODGOMS OntoK StringsAuto Synthesis WeSeE WikiMatch confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es 0,173913043 0,5 0,5 0,002887789 0 0,5 0,333333333 0,333333333 0,428571429 0,5 0,029850746 0,428571429 0,5 0,272727273 0,266666667 0,571428571 0,142857143 0,285714286 1 0 0,285714286 0,142857143 0,142857143 0,428571429 0,428571429 0,285714286 0,428571429 0,142857143 0,428571429 0,571428571 0,266666667 0,222222222 0,363636364 0,005758947 0 0,363636364 0,2 0,2 0,428571429 0,461538462 0,054054054 0,428571429 0,222222222 0,333333333 0,363636364 Tabela 43 - Dados de Precisão, Cobertura e Medida F do alinhamento apresentado no Estudo de Caso #10 após sua refatoração. Evento 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2011.5 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2013 2013 2013 2013 2013 2013 2013 2013 2013 Ferramenta AUTOMSv2 CIDER CODI CSA AROMA MaasMtch MapEvo MapPSO WeSeE YAM++ AROMA AUTOMSv2 Hertuda HotMatch LogMap MaasMtch MapSSS MEDLEY Optima WeSeE Wmatch YAM++ AML HerTUDA HotMatch IAMA LogMap LogMapLite MapSSS ODGOMS OntoK Ontologia1 confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt confOf_pt Ontologia2 sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es sigkdd_es 166 Precisão 0,666666667 0,6 0,333333333 0,016129032 1 0,075757576 0 0,051282051 0,157894737 0,5 1 0,666666667 0,00293501 0 0,333333333 0,060606061 0,25 0,333333333 0,00345679 0,6 0,181818182 0,5 0,5 0,00293501 0 0,666666667 0,333333333 0,333333333 0,5 0,6 0,03030303 Cobertura 0,571428571 0,428571429 0,142857143 0,142857143 0 0,714285714 0 0,285714286 0,428571429 0,142857143 0 0,571428571 1 0 0,142857143 0,571428571 0,142857143 0,142857143 1 0,428571429 0,571428571 0,142857143 0,285714286 1 0 0,285714286 0,142857143 0,142857143 0,428571429 0,428571429 0,285714286 Medida-F 0,615384615 0,5 0,2 0,028985507 0 0,136986301 0 0,086956522 0,230769231 0,222222222 0 0,615384615 0,005852843 0 0,2 0,109589041 0,181818182 0,2 0,006889764 0,5 0,275862069 0,222222222 0,363636364 0,005852843 0 0,4 0,2 0,2 0,461538462 0,5 0,054794521 2013 2013 2013 2013 StringsAuto Synthesis WeSeE WikiMatch confOf_pt confOf_pt confOf_pt confOf_pt sigkdd_es sigkdd_es sigkdd_es sigkdd_es 167 0,5 1 0,3 0,285714286 0,428571429 0,142857143 0,428571429 0,571428571 0,461538462 0,25 0,352941176 0,380952381 12. Apêndice III – Estudo Baseado em Revisão Sistemática O protocolo utilizado para o estudo teve como base o trabalho desenvolvido por Santos [34]. Para cada uma das subseções a seguir serão apresentados o que se espera a partir do protocolo (texto em {itálico}) e o conteúdo de fato utilizado no estudo em questão. 1. Objetivo e Questões de Pesquisa {Descrever o objetivo e as questões de pesquisa do estudo.} Objetivo {Descrever o objetivo do estudo através do seguinte padrão: Analisar [Fontes de evidências / indícios: relatos de experiência / publicações científicas / estudos primários / softwares etc.]; Com o propósito de [caracterizar / identificar] o [objeto de estudo: abordagens / processo / tecnologia / técnica / método etc.]; Com relação à [características de interesse do objeto de estudo]; Do ponto de vista [organizações de software / grupo de processo / alta gerência / Instituições Implementadoras de Processos / pesquisador / desenvolvedor etc.]; No contexto [industrial / acadêmico / ambos] [com foco em estudos / projetos / programas / iniciativas] [com tais características].} Analisar relatos de experiência e publicações científicas através de um estudo baseado em revisão sistemática. 168 Com o propósito de identificar os elementos que compõem as abordagens de padrões e antipadrões de alinhamento de ontologias. Com relação às técnicas / abordagens propostas, linguagens / formatos de representação e ferramentas desenvolvidas com vistas à aplicação de padrões e antipadrões de alinhamento de ontologias. Do ponto de vista dos pesquisadores. No contexto acadêmico com foco em iniciativas de desenvolvimento e aplicação padrões e antipadrões de alinhamento de ontologias. Questões de pesquisa {Identificar que questões serão respondidas a partir da identificação e caracterização do objeto de estudo. Ou seja, uma vez identificados/caracterizados os objetos de estudo, que questões relevantes ao problema descrito poderão ser respondidas/discutidas?} Q1: Quais são as principais técnicas e/ou abordagens para utilização de padrões e/ou antipadrões para alinhamento de ontologias? Q2: Quais têm sido as linguagens e/ou formatos para representação de padrões e/ou antipadrões para alinhamento de ontologias utilizadas e/ou propostas? Q3: Existem softwares para provimento de padrões e/ou antipadrões para alinhamento de ontologias como recurso no processo de alinhamento das mesmas? Q4: Existem softwares de alinhamento de ontologias que utilizem padrões e/ou antipadrões para alinhamento de ontologias? População Trabalhos publicados em conferências e periódicos relatando iniciativas de utilização e aplicação de padrões e antipadrões para alinhamento de ontologias. Resultados 169 A partir da identificação dos elementos que compõem as diferentes abordagens e iniciativas de utilização de padrões e antipadrões será realizada uma análise mais detalhada a fim de identificar formatos, linguagens e ferramentas utilizadas dentro do contexto de padrões e antipadrões de alinhamento de ontologias, com o objetivo de caracterizá-las e, se possível influenciar a extensão de sua classificação, a extenção de uma linguagem computacional para sua representação e a proposta de uma ferramenta para utilização dos padrões e antipadrões de alinhamento de ontologias em seu referido processo. 2. Escopo da pesquisa {Delimitar os tipos de mecanismos que serão utilizados para realizar as buscas, por exemplo, bibliotecas digitais através dos seus respectivos engenhos de busca, bibliotecas, consultas a especialistas, catálogo especializado de produtos etc.} Para delinear o escopo da pesquisa foram estabelecidos critérios para garantir, de forma equilibrada, a viabilidade da execução (custo, esforço e tempo), acessibilidade aos dados e abrangência do estudo. A pesquisa dar-se-á a partir de bibliotecas digitais através dos seus respectivos engenhos de busca. Critérios adotados para seleção das fontes {Identificar os critérios que devem ser adotados para a seleção das fontes de pesquisa.} Para as bibliotecas digitais é desejado: Possuir engenho de busca que permita o uso de expressões lógicas ou mecanismo equivalente; Incluir em sua base publicações da área de exatas ou correlatas que possuam relação direta com o tema a ser pesquisado; Os engenhos de busca deverão permitir a busca por palavras-chave e a busca no resumo (abstract) das publicações. 170 Os mecanismos de busca utilizados devem garantir resultados únicos através da busca de um mesmo conjunto de palavras-chaves. Quando isto não for possível, deve-se estudar e documentar uma forma de minimizar os potenciais efeitos colaterais desta limitação. 3. Restrições {Identificar todas as restrições associadas ao estudo. Identificar o intervalo de tempo válido para as buscas. O acesso aos dados, em geral, não deve incorrer em ônus para a pesquisa.} A pesquisa está restrita à análise de publicações obtidas, exclusivamente, a partir das fontes selecionadas a partir dos critérios supracitados. O estudo englobará todos os dados disponíveis nas fontes. 4. Idiomas {Deve-se identificar os idiomas das publicações que serão aceitas para a pesquisa. Se possível, deve-se justificar essa escolha.} Para a realização desta pesquisa foram selecionados os idiomas inglês e português. A escolha do idioma inglês deve-se à sua adoção pela grande maioria das conferências e periódicos internacionais relacionados como tema de pesquisa e por ser o idioma utilizado pela maioria das editoras relacionadas com o tema listadas no Portal de Periódicos da CAPES. A escolha do idioma português deve-se à sua adoção pelas principais conferências e periódicos nacionais da área de Sistemas de Informação. 5. Métodos de Busca de Publicações {Deve-se descrever a forma de busca (manual e/ou eletrônica) além da expressão de busca: expressão lógica contendo uma combinação de palavras chaves extraída do objetivo do estudo relacionada ao objeto de estudo, características de interesse e respectivos sinônimos.} 171 As fontes digitais serão acessadas via Web, através de expressões de busca préestabelecidas. 6. Expressão de Busca Para artigos em inglês deve-se utilizar a expressão de busca abaixo: (ontology OR ontologies) AND (matching OR alignment OR mapping OR correspondence) AND (design pattern OR desing patterns OR antipattern OR antipattern OR antipatterns OR anti-patterns). Para artigos em português deve-se utilizar a expressão de busca abaixo: (ontologia OR ontologias) AND (alinhamento OR mapeamento OR correspondencia) AND (padrão OR padrões OR antipadrão OR antipadrões OR anti-padrão OR antipadrões). 7. Busca Manual A busca manual não será contemplada neste trabalho. 8. Procedimentos de Seleção e Critérios {Deve-se descrever os procedimentos para seleção das publicações, incluindo procedimentos avaliação da inclusão de publicações no escopo da pesquisa e critérios de inclusão e exclusão.} A estratégia de busca será aplicada por um pesquisador para identificar as publicações em potencial. As publicações identificadas serão selecionadas pelo mesmo pesquisador que efetuou a busca através da verificação dos critérios de inclusão e exclusão e de qualidade estabelecidos. Procedimentos de Seleção {Identificar as etapas necessárias para seleção das publicações para o estudo.} A seleção dos estudos será efetuada em 2 etapas: 172 i) Seleção e catalogação preliminar dos dados coletados. A seleção preliminar das publicações será feita a partir da aplicação da expressão de busca às fontes selecionadas. Cada publicação será catalogada em uma planilha para análise posterior; ii) Seleção dos dados relevantes. A seleção preliminar com o uso da expressão de busca não garante que todo o material coletado seja útil no contexto da pesquisa, pois a aplicação das expressões de busca é restrita ao aspecto sintático. Dessa forma, após a identificação das publicações através dos mecanismos de buscas, deve-se ler os resumos/abstracts e analisá-los seguindo os critérios de inclusão e exclusão identificados a seguir. Devem ser excluídas as publicações contidas no conjunto preliminar que (critérios de exclusão): CE 1. As palavras chave não estão presentes na publicação e não há variações destas palavras chave; CE 2. As palavras chave da busca não apareçam no título, resumo e/ou palavraschave da publicação; CE 3. O contexto da pesquisa não seja de alinhamento de ontologias. Podem ser incluídas apenas as publicações que satisfaçam os seguintes critérios (critérios de inclusão): CI 1. Publicações que tratam de ontologias no sentido computacional; CI 2. Publicações que tratam do problema de alinhamento de ontologias; CI 3. Publicações que tratem de padrões (design patterns) ou antipadrões dentro do contexto de alinhamento de ontologias; CI 4. Publicações que tratem de ferramentas ou técnicas de aplicações de padrões e/ou antipadrões no processo de alinhamento de ontologias. 9. Planejamento e Execução O protocolo descrito na seção anterior é a base para a execução do estudo baseado em revisão sistemática. Para a escolha das palavras chave foi observado 1 artigo de controle, que serviu de base para calibragem da expressão de busca. A escolha 173 dos artigos de controle levou em consideração temas e autores de grande influência na área pesquisada. Scharffe, F.; Zamazal, O.; Fensel, D. 2013, Ontology Alignment Design Patterns. Knowledge Information Systems, Springer-Verlag London. Ao final do processo de calibragem, pode-se observar uma notável diferença na indexação dos mecanismos de busca quando buscado os artigos de controle. 10. Identificação do Período de Busca Por se tratar de um assunto relativamente novo, não foram aplicados filtros sobre o período de busca, justamente para avaliá-la de forma completa e observar a evolução do tema. 11. Definição das Máquinas de Busca Durante o processo testes e calibragem da expressão de busca, verificou-se que a base de dados da Scopus (http://www.scopus.com.br) retornou maior quantidade de artigos em relação às máquinas de busca da IEEE (http://ieeexplore.ieee.org/) e DBLP (http://www.dblp.org/search/). A máquina de busca da DBLP não permite gerar expressões de busca estruturadas, no entanto por ser uma máquina de busca de alta relevância para o tema que está sendo pesquisado, foram realizadas diversas buscas individuais, de acordo com as expressões de busca definidas no item 2.5.1 e seus resultados compilados em uma planilha eletrônica. Para garantir maior cobertura dos resultados, as quatro máquinas de foram utilizadas neste trabalho. Expressão de Busca na Biblioteca Digital da IEEE Inglês: ( ( ( "Abstract":ontology OR "Abstract":ontologies ) AND ( "Abstract":matching OR "Abstract":alignment OR "Abstract":mapping OR "Abstract":correspondence) AND ( "Abstract":design pattern OR "Abstract":design patterns OR "Abstract":antidesign pattern OR "Abstract":anti-design pattern OR "Abstract":antidesign patterns OR 174 "Abstract":anti-design patterns) ) OR ( ( "Index Terms":ontology OR "Index Terms":ontologies ) AND ( "Index Terms":matching OR "Index Terms":alignment OR "Index Terms":mapping OR "Abstract":correspondence) AND ( "Index Terms":design pattern OR "Index Terms":design patterns OR "Index Terms":antidesign pattern OR "Index Terms":antidesign patterns OR "Index Terms":anti-design pattern OR "Index Terms":anti-design patterns) ) ) Português: ( ( ( "Abstract":ontologia OR "Abstract":ontologias ) AND ( "Abstract":alinhamento OR "Abstract":mapeamento OR "Abstract":correspondência) AND ( "Abstract":padrão OR "Abstract":padrões OR "Abstract":antipadrão OR "Abstract":anti-padrão OR "Abstract":antipadrões OR "Abstract":anti-padrões) ) OR ( ( "Index Terms":ontologia OR "Index Terms":ontologias ) AND ( "Index Terms":alinhamento OR "Index Terms":mapeamento OR "Abstract":correspondência) AND ( "Index Terms":padrão OR "Index Terms":padrões OR "Index Terms":antipadrão OR "Index Terms":antipadrões OR "Index Terms":anti-padrão OR "Index Terms":anti-padrões) ) ) Expressão de Busca na Biblioteca Digital da Scopus Inglês: ( ( (TITLE-ABS-KEY(ontology) OR TITLE-ABS-KEY(ontologies)) AND (TITLEABS-KEY(matching) OR KEY(mapping) TITLE-ABS-KEY(correspondence)) OR TITLE-ABS-KEY(alignment) OR TITLE-ABS- AND (TITLE-ABS- KEY(design pattern) OR TITLE-ABS-KEY(design patterns) OR TITLE-ABSKEY(anti-design pattern) OR TITLE-ABS-KEY(anti-design patterns) OR TITLE-ABSKEY(antidesign pattern) OR TITLE-ABS-KEY(antidesign patterns)) ) OR ( (INDEXTERMS(ontology) (INDEXTERMS(matching) OR INDEXTERMS(ontologies)) OR INDEXTERMS(alignment) 175 AND OR INDEXTERMS(mapping) (INDEXTERMS(design OR INDEXTERMS(correspondence)) pattern) OR INDEXTERMS(design patterns) AND OR INDEXTERMS(anti-design pattern) OR INDEXTERMS(anti-design patterns) OR INDEXTERMS(antidesign pattern) OR INDEXTERMS(antidesign patterns)) ) ) Português: ( ( (TITLE-ABS-KEY(ontologia) OR TITLE-ABS-KEY(ontologias)) AND (TITLEABS-KEY(alinhamento) OR KEY(correspondência)) AND TITLE-ABS-KEY(mapeamento) (TITLE-ABS-KEY(padrão) OR OR TITLE-ABSTITLE-ABS- KEY(padrões) OR TITLE-ABS-KEY(anti-padrão) OR TITLE-ABS-KEY(anti-padrões) OR TITLE-ABS-KEY(antipadrão) OR TITLE-ABS-KEY(antipadrões)) ) OR ( (INDEXTERMS(ontologia) (INDEXTERMS(alinhamento) OR INDEXTERMS(ontologias)) OR INDEXTERMS(correspondência)) AND INDEXTERMS(mapeamento) OR (INDEXTERMS(padrão) OR AND INDEXTERMS(padrões) OR INDEXTERMS(anti-padrão) OR INDEXTERMS(antipadrões) OR INDEXTERMS(antipadrão) OR INDEXTERMS(antipadrões)) ) ) Expressão de Busca na Biblioteca Digital da DBLP Inglês: ontolog~ alignment design.pattern~ ontolog~ matching design.pattern~ ontolog~ mapping design.pattern~ ontolog~ correspondence design.pattern~ ontolog~ alignment antipattern~ ontolog~ matching antipattern~ ontolog~ mapping antipattern~ ontolog~ correspondence antipattern~ 176 ontolog~ alignment anti-pattern~ ontolog~ matching anti-pattern~ ontolog~ mapping anti-pattern~ ontolog~ correspondence anti-pattern~ Português: ontologia~ alinhamento padr~ ontologia~ mapeamento padr~ ontologia~ correspondência padr~ ontologia~ alinhamento antipadr~ ontologia~ mapeamento antipadr~ ontologia~ correspondência antipadr~ ontologia~ alinhamento anti-padr~ ontologia~ mapeamento anti-padr~ ontologia~ correspondência anti-padr~ 12. Execução do Protocolo Total de trabalhos coletados através dos mecanismos de busca: 126. Trabalhos selecionados através dos critérios de inclusão e exclusão após a leitura dos resumos: 11 (8%) 13. Dados Coletados A seguir são apresentados os dados compilados com o título da publicação, autores e ano em que foi publicado o trabalho. A disposição dos dados está em ordem alfabética do título do trabalho. Tabela 44 - Trabalhos selecionados após a execução do protocolo de revisão. Id Título Ano Autores 1 A Pattern-based Ontology Matching Approach for Detecting Complex Correspondences [51] 2009 Dominique Ritze, Christian Meilicke, Ondrej Sváb-Zamazal, Heiner Stuckenschmidt 177 2 APIs à gogo: Automatic generation of ontology APIs [52] 2009 Parreiras, F.S.; Saathoff, C.; Walter, T.; Franz, T.; Staab, S. 3 Alignment Patterns Based on Unified Foundational Ontology [53] 2012 Natalia Fonseca Padilha, Fernanda Araujo Baião, Kate Revoredo 4 AUTOMS-F: A framework for the synthesis of ontology mapping methods [54] 2009 Valarakos A.G., Spiliopoulos V., Vouros G.A. 5 Correspondence Patterns for Ontology Alignment [55] 2008 François Scharffe, Dieter Fensel 6 Exploiting patterns in ontology mapping [56] 2007 Svab O. 7 Ontology alignment design patterns [57] 2013 Scharffe F., Zamazal O., Fensel D. 8 Ontology Fusion with Complex Mapping Patterns [58] 2006 Jinguang Gu, Yi Zhou 9 Ontology matching with semantic verification [59] 2009 Jean-Mary, Y., Shironoshita, E., Kabuka, M. 10 Towards correspondence patterns for ontology mediation [60] 2007 Scharffe F., Ding Y., Fensel D. 11 Towards design patterns for ontology alignment [61] 2008 Scharffe F., Euzenat J., Fensel D. A Tabela 45 apresenta a correlação dos trabalhos selecionados com as questões de pesquisa citadas. Tabela 45 - Correlação dos trabalhos selecionados com as questões de pesquisa. Tipo de Trabalho Grupo Selecionado Total Q1-Técnica / Aborgadem 1, 2, 3, 5, 6, 7, 8, 9, 10, 11 11 Q2-Linguagem / Formato 2, 5, 7, 10, 11 5 Q3-Ferramenta como Recurso - 0 Q4-Ferramenta Proprietária 4, 8, 9 3 A seguir a relação completa de trabalhos retornados pelas expressões de busca construídas e executadas nos motores de busca selecionados. Tabela 46 – Relação completa de trabalhos retornados pelas expressões de busca. CI CE Título do Documento Ano Resumo Autores CE2 CE3 [Front cover] 2010 The following topics are dealt with: machine intelligence; fuzzy cognitive maps; imaging method; task scheduling; man-machine software interface; aspect-oriented design patterns; virtual collaboration; ambient intelligence; intelligent control system; measuring system verification; artificial intelligence; intelligent search machine; and ontology key concept interpretation. 178 Motor de Busca IEEE CE2 CE3 [Title page i] 2012 CE2 CE3 [Title page] 2010 CE3 2006 Seventh International Baltic Conference on Databases and Information Systems, Proceedings 2nd International Conference on Engineering and Technology Innovation 2012, ICETI 2012 2006 The proceedings contain 30 papers. The topics discussed include: avoidance of deadline-violations for inter-organizational business processes [No author name available] Scopus 2013 [No author name available] Scopus A blocking strategy to improve gene selection for classification of gene expression data 2007 The proceedings contain 698 papers. The special focus in this conference is on Innovation for Applied Science and Technology. The topics include: A study on the gelation properties and rheological behavior of gellan gum Because of high dimensionality, machine learning algorithms typically rely on feature selection techniques in order to perform effective classification In microarray gene expression data sets. However, the large number of features compared to the number of samples makes the task of feature selection computationally hard and prone to errors. This paper interprets feature selection as a task of stochastic optimization, where the goal is to select among an exponential number of alternative gene subsets the one expected to return the highest generalization in classification. Blocking is an experimental design strategy which produces similar experimental conditions to compare Bontempi G. Scopus CE2 CE3 The following topics are dealt with: largescale medical image analysis; electronic health records data; dynamic task optimization; remote diabetes monitoring systems; clinical decision support; colonoscopy surveillance; natural language processing; knowledge-based biomedical word sense disambiguation; biomedical time series data; percutaneous coronary intervention; unsupervised pattern matching method; image retrieval framework; visual region-of-interest identification; visual region-of-interest classification; robust feature selection method; premicroRNA identification; nucleotide-structure triplets; enhancing twitter data analysis; simple semantic filtering; pathogenic organisms;; designing clinical data presentation cognitive task analysis methods; computational drug repositioning; RNA-seq splicing; cell type identity; mammalian transcriptomes; coronary vessels; crossinstitutional medication description patterns; integrating transcriptome; proteome information; clinical element models; tumour progression segmentation algorithms; CT scanning; temporal analysis; intrarelation reconstruction; gene expression; cloud computing; personal genome sequencing data; and gene ontology. The following topics are dealt with : hidden Markov model; support vector machines; microarray sample classification; automated knowledge engineering; medical image edge enhancement; recurrent fuzzy multilayer perceptron; self organizing maps; data mining; business intelligence tool; context ontology driven relevant search; Web search result optimization; image compression analysis; natural feature identification; optimized vertex coloring; data compression; nonlinear boundary value problems; design pattern detection; media processor performance optimization; CGSR protocol; centralized routing; integrated packet networks; MIPv6; and mobile ad hoc network routing protocol. 179 IEEE IEEE CE2 CE3 A clustering based approach for domain relevant relation extraction 2008 alternative stochastic configurations in order to be confident that observed differences in accuracy are due to actual differences rather than to fluctuations and noise effects. We propose an original blocking strategy for improving feature selection which aggregates in a paired way the validation outcomes of several learning algorithms to assess a gene subset and compare it to others. This is a novelty with respect to conventional wrappers, which commonly adopt a sole learning algorithm to evaluate the relevance of a given set of variables. The rationale of the approach is that, by increasing the amount of experimental conditions under which we validate a feature subset, we can lessen the problems related to the scarcity of samples and consequently come up with a better selection. The paper shows that the blocking strategy significantly improves the performance of a conventional forward selection for a set of 16 publicly available cancer expression data sets. The experiments involve six different classifiers and show that improvements take place independent of the classification algorithm used after the selection step. Two further validations based on available biological annotation support the claim that blocking strategies in feature selection may improve the accuracy and the quality of the solution. The first validation is based on retrieving PubMEd abstracts associated to the selected genes and matching them to regular expressions describing the biological phenomenon underlying the expression data sets. The biological validation that follows Is based on the use of the Bioconductor package GoStats in order to perform Gene Ontology statistical analysis. © 2007 IEEE. Most existing corpus based relation extraction techniques focus on predefined relations. In this paper, a clustering based method is presented for domain relevant relation extraction including both relation type discovery and relation instance extraction. Given two raw corpora, one in the general domain, one in an application domain, domain specific verbs connecting different instances are extracted based on syntactic dependency as well as a small set of domain concept instance seeds. Relation types are then discovered based on verb clustering followed by relation instance extraction. The proposed approach requires no predefined relation types, no prior training of domain knowledge, and no need for manually annotated corpora. This method is applicable to any domain corpus and it is especially useful for knowledgelimited and resource-limited domains. Evaluations conducted on Chinese football domain for relation extraction show that the approach discovers various relations with good performance. 180 Yuhang Yang; Qin Lu; Tiejun Zhao IEEE CI1 CE2 A Comparative Study: Syntactic versus Semantic Matching Systems 2009 CE1 CE2 CE3 A context dependency relation pattern based algorithm for term similarity calculation 2012 CE2 A declarative recommender system for cloud infrastructure services selection 2012 CE3 A framework for adaptive configuration of business model oriented to networks deployment 2006 Although there have been many matching systems evaluations, the need for more evaluations remains one of the most important issues in this field, because without evaluation no progress. In this paper, we propose to compare two matching systems according to the matching approaches classification which distinguishes between syntactic and semantic systems using three OWL ontologies describing the same domain: the American University Organization. In this paper, we put forward a new term similarity algorithm which automatically extracts context patterns by sentence dependency analysis, and then calculates term similarity by mapping those patterns. The algorithm provides better way to extract term context patterns with stronger context expression ability than current algorithms. Meanwhile, the length of patterns is modest, which makes it convenient to be matched. We also evaluate the algorithm on the basis of gene engineering field experiment data set. Experiment result shows that the algorithm evidently improves the calculating performance. The cloud infrastructure services landscape advances steadily leaving users in the agony of choice. Therefore, we present CloudRecommender, a new declarative approach for selecting Cloud-based infrastructure services. CloudRecommender automates the mapping of users' specified application requirements to cloud service configurations. We formally capture cloud service configurations in ontology and provide its implementation in a structured data model which can be manipulated through both regular expressions and SQL. By exploiting the power of a visual programming language (widgets), CloudRecommender further enables simplified and intuitive cloud service selection. We describe the design and a prototype implementation of CloudRecommender, and demonstrate its effectiveness and scalability through a service configuration selection experiment on most of today's prominent cloud providers including Amazon, Azure, and GoGrid. © 2012 Springer-Verlag. Facing the rising tide of modularity of production and operation organizations, the basic strategy to deal with is implementing the information and communication technology (ICT) applications, or searching the ICT solutions. There are two directions that coming to solving the dynamics organization problem. One is starting from the business process modelling (BPM), creating the views to describe the operation relationships among them. The other is to provide the advices from the cases analysis and applying the economics theory to comparing the competition status. During the two sides, could find that the transforming of management & Control patterns was not put on the heavy emphasis or was neglected. So the management problem that existing continuously is not solved satisfactorily due to the gap between management requirements and the BPM which dominate by the views. Considering the gap that existing above, the framework 181 Ghomari, L.; Ghomari, A.R. IEEE Xu Jian; Zhang Qingliang IEEE Zhang M., Ranjan R., Nepal S., Menzel M., Haller A. Gu, Yuanxun; Guo, Jingjuan Scopus IEEE CI1 CI2 CI3 CI4 CE3 A LEGO-like Metadata Architecture for Image Search & Retrieval 2009 A logical geo-ontology design pattern for quantifying over types 2012 of business model (BM) adaptive configuration (FBMAC) oriented to networks deployment is put forward which is driven by the capability and role, not process. In FBMAC, the role and capability were not regarded as the variable, but as the result that factors which constructed the adaptive configuration. From the findings of business model elements, to creating the ontology of BM, and then put forward the configurable point and configuration parameter that completed the configuration design. The FBMAC makes BM play the role of integrating the capabilities of organization cell, beyond the executive, which improving the adaptability of organization under ICT environments. FBMAC builds the mapping from management requirements to the application-design of enterprise solutions. This paper proposes a set of architectural patterns for the design of interoperable image search&retrieval systems on top of the latest standards in the area, ISO/IEC 15938-12 (MPEG Query Format) and ISO/IEC 24800 (JPSearch). The work introduces the notion of a "composable metadata model" as a means to allow the usage of multiple metadata ontologies together, along with mechanisms to specify semantic mappings among them. The paper also studies the process to choose a Core Metadata Ontology (based on the work taking place at the W3C Media Annotations Working Group), which plays the role of a minimal lingua franca among the different systems, providing a basic level of interoperability. Ontology design patterns ease the engineering of ontologies, improve their quality, foster reusability, and support the alignment of ontologies by acting as common building blocks or strategies for reoccurring modeling problems. This makes ontology design patterns key enablers of semantic interoperability and, hence, a crucial technology for representing the body of knowledge of such heterogeneous domains as the geosciences. While different types of patterns can be distinguished, existing work on geo-ontology design patterns has solely focused on content patterns, i.e., design solutions for domain classes and relationships. In this work, we propose a logical pattern that addresses a frequent modeling problem that has hampered the development of sophisticated geo-ontologies in the past, namely how to model the quantification over types. We argue for the need for such a pattern, explain why it is difficult to model, demonstrate how to implement it using the Web Ontology Language OWL, and finally show how it can be applied to modeling concepts such as biodiversity. © 2012 ACM. 182 Tous, R.; Delgado, J. Martinez D.C., Janowicz K., Hitzler P. IEEE Scopus CE3 CI1 CE3 A new matching algorithm for Chinese place names 2011 A Pattern-based Ontology Matching Approach for Detecting Complex Correspondences 2009 A practical ontology framework for static model analysis 2011 Matching algorithm for Place Names is one of the most important research topics in the construction of digital gazetteers. Taking account of the morphological characteristics of Chinese Place Names and ontology method, we first pretreat the Chinese Place Names to remove illegal characters, decompose the Chinese Place Names into special names and generic terms, and then use both the Levenshtein Distance(LD) method and the semantic distance method to calculate relationship of similarity between them. Finally, we get the comprehensive similarity for Chinese Place Names by calculating the weighted average for both similarity of special names and that of generic terms. In this study, the example shows that similarity index for special names, generic terms and the overall place names, enhance the completeness and accuracy of the place names matching theory. State of the art ontology matching techniques are limited to detect simple correspondences between atomic concepts and properties. Nevertheless, for many concepts and properties atomic counterparts will not exist, while it is possible to construct equivalent complex concept and property descriptions. We define a correspondence where at least one of the linked entities is non-atomic as complex correspondence. Further, we introduce several patterns describing complex correspondences. In particular, we focus on methods for automatically detecting complex correspondences. These methods are based on a combination of basic matching techniques. We conduct experiments with different datasets and discuss the results. In embedded software, there are many reasons to include concepts from the problem domain during design. Not only does doing so make the software more comprehensible to those with domain understanding, it also becomes possible to check that the software conforms to correctness criteria expressed in the domain of interest. Here we present a unified framework that enables users to create ontologies representing arbitrary domains of interest and analyses over those domains. These analyses may then be run against software specifications, encapsulated as models, checking that they are sound with respect to the given ontology. Our approach is general, in that the framework is agnostic to the semantic meaning of the ontologies that it uses and does not privilege the example ontologies that we present here. Where practical use-cases and principled theory exist, we provide for the expression of certain patterns of infinite ontologies. In this paper we present two patterns of infinite ontologies: those containing values, and those containing ontologies recursively. We show how these two patterns map to use cases of unit systems and structured data types, and show how these are applicable to cyber-physical systems examples drawn from automotive and avionic domains. Despite the range of ontologies and analyses that we present here, we see user-built ontologies as a key feature of our approach. 183 Gang Cheng; Fei Wang; Haiyang Lv; Yinling Zhang IEEE Dominique Ritze, Christian Meilicke, Ondrej SvábZamazal, Heiner Stuckenschmidt DBLP Lickly, B.; Shelton, C.; Latronico, E.; Lee, E.A. IEEE CI1 CI3 A Quantitative Treatment to Data from Computer-Supported Collaboration: An Ontological Approach 2008 CE3 A Sequence Similarity Technique for Mapping Alternative Features in Event-Related Potentials (ERP) Data 2010 Collaborative activity performed over specific platforms, designed for such purpose, can provide a deep knowledge about the roles, intentions and effects regarding participants and their interaction among themselves and with the knowledge objects available. This study aims at proposing a structured process for gathering the semantics of the activity hidden behind the raw data collected in log files from CSCL platforms. The proposal is based on exploring the semantic elements (activity awareness) through a social networks analysis (SNA). The main focus of our work is to match different behavioral profiles detected in the collaborative activity from CSCL with the formal profiles identified inside a complex concept-network. This network defines an ontology that describes the behavior expected when collaborating in different scenarios and types of activity. When a certain activity sequence matches with a predefined pattern, the concepts related to the pattern are then bound to the real activity sequence. In this paper, we present a method for identifying correspondences, or mappings, between alternative features of brainwave activity in event-related potentials (ERP) data. The goal is to simulate mapping across results from heterogeneous methods that might be used in different neuroscience research labs. The input to the mapping consists of two ERP datasets whose spatiotemporal characteristics are captured by alternative sets of features, that is, summary spatial and temporal measures capturing distinct neural patterns that are linked to concepts in a set of ERP ontologies, called NEMO (Neural ElectroMagnetic Ontologies) [3, 6]. The feature value vector of each summary metric is transformed into a point-sequence curve, and clustering is performed to extract similar subsequences (clusters) representing the neural patterns that can then be aligned across datasets. Finally, the similarity between measures is derived by calculating the similarity between corresponding pointsequence curves. Experiment results showed that the proposed approach is robust and has achieved significant improvement on precision than previous algorithms. 184 Casillas, L.; Daradoumis, T. IEEE Haishan Liu, Gwen A. Frishkoff, Robert M. Frank, Dejing Dou: OntologyBased Mining of Brainwaves DBLP CE3 Adaptive requirementdriven architecture for integrated healthcare systems 2010 CE1 CE2 CE3 Advanced Information Systems Engineering Workshops - CAiSE 2011 International Workshops, Proceedings Advances in Conceptual Modeling Applications and Challenges, ER 2010 Workshops ACM-L, CMLSA, CMS, DE@ER, FP-UML, SeCoGIS, WISM, Proceedings Alignment of ontology design patterns: Class as property value, value partition and normalisation 2011 CE1 CE2 CE3 CI1 CI2 CI3 In order to improve the quality of healthcare services, large-scale medical information systems should be integrated with adaptability in response to the changing medical environment. In this paper, we propose a requirement-driven architecture for healthcare information systems that will be able to respond to new requirements. The system operates through the mapping mechanism between these layers and thus can organize functions dynamically adapting to user's requirement. Furthermore, we introduce the organizational semiotics methods to capture and analyze user's requirement through ontology chart and norms. Based on these results, the structure of user's requirement pattern (URP) is established as the driving factor of our system. Finally, we propose an integration framework for data sharing amongst different hospital organizations and also present the HL7 based virtual database to realize the data integration. Our research makes a contribution to the design and implementation of the architecture of healthcare systems which can adapt to the changing medical environment. © 2010 ACADEMY PUBLISHER. The proceedings contain 57 papers. The topics discussed include: business IT alignment from business model to enterprise architecture Yang H., Liu K., Li W. Scopus [No author name available] Scopus 2010 The proceedings contain 28 papers. The topics discussed include: G-map semantic mapping approach to improve semantic interoperability of distributed geospatial web services [No author name available] Scopus 2012 Design-pattern driven ontology construction, whether manual or (partially) automated, relies on the availability of curated repositories of Ontology Design Patterns (ODPs) adequately characterized. In order to consistently apply a given ODP, not only it is important to characterize it in full, but also examine its alignment or deviation to other relevant ODPs in relation to it. Otherwise, possible inconsistencies in the application can lead to interoperability issues among the ontology models involved. In that context, this paper revisits a specific version of three different ODPs: Class as a Property Value (CPV), Value Partition (VP) and Normalisation. The review of the CPV identifies two distinct modelling problems being tangled that prompt to decouple the pattern into two variants: a strict and a coarse CPV pattern. The examination continues with a comparative analysis among the patterns that reveals key alignments and differences at the structural and semantic level. These findings extends the reusability and compositional characteristics of the strict and coarse variants of the CPV ODP in relation to the other two patterns. To illustrate our contribution existing examples in the literature are revisited. They demonstrate the alignments, differences and prototypical OWL idioms identified, which can assist Rodriguez-Castro B., Ge M., Hepp M. Scopus 185 ontology practitioners in mitigating the opportunity for inconsistencies when applying these recurrent ontology building blocks. © 2012 Springer-Verlag. CE2 Alignment of the UMLS semantic network with BioTop: Methodology and assessment 2009 Alignment Patterns Based on Unified Foundational Ontology 2012 Motivation: For many years, the Unified Medical Language System (UMLS) semantic network (SN) has been used as an upper-level semantic framework for the categorization of terms from terminological resources in biomedicine. BioTop has recently been developed as an upper-level ontology for the biomedical domain. In contrast to the SN, it is founded upon strict ontological principles, using OWL DL as a formal representation language, which has become standard in the semantic Web. In order to make logic-based reasoning available for the resources annotated or categorized with the SN, a mapping ontology was developed aligning the SN with BioTop. Methods: The theoretical foundations and the practical realization of the alignment are being described, with a focus on the design decisions taken, the problems encountered and the adaptations of BioTop that became necessary. For evaluation purposes, UMLS concept pairs obtained from MEDLINE abstracts by a named entity recognition system were tested for possible semantic relationships. Furthermore, all semantic-type combinations that occur in the UMLS Metathesaurus were checked for satisfiability. Results: The effort-intensive alignment process required major design changes and enhancements of BioTop and brought up several design errors that could be fixed. A comparison between a human curator and the ontology yielded only a low agreement. Ontology reasoning was also used to successfully identify 133 inconsistent semantic-type combinations. © 2009 The Author(s). Ontology alignment is the process of finding related entities in different ontologies. In this context, precise and explicit representation of conceptualizations is essential for reaching semantic integration to ensure that only data related to the same (or sufficiently similar) real-world entity are merged. Foundational ontologies describe general concepts independent of a domain and precisely define meta-properties so as to make the semantics of each concept in the ontology explicit. In this paper we show how the use of OntoUML, a conceptual modeling language based on Unified Foundational Ontology, allows the application of alignment patterns and exemplify how this approach may improve precision, recall and refine the type of the alignment. 186 Schulz S., Beisswanger E., van den Hoek L., Bodenreider O., van Mulligen E.M. Scopus Natalia Fonseca Padilha, Fernanda Araujo Baião, Kate Revoredo DBLP CE2 CE3 An Adaptive System for Optimal Matches between Human Needs and Offers 2012 CE3 An Algorithm for SWS Matching Based on Subsumption Relation Defined in Domain Ontology 2010 CE1 CE3 An algorithm to find the largest adjacent repeated pattern based on Suffix Tree 2012 CE2 CE3 An extended event matching approach in content-based pub/sub systems for EAI 2005 The paper presents a very general technique to represent human needs and offers along with a technology to find optimal matches. Moreover, the system is able to learn from its use by collecting user feedback and changing its parameters accordingly. This way, the system adjusts itself to the human expectations and desires and even follows the trend of these desires and expectations. Semantic Web Services (SWS) is proposed to ensure Web Service core missions automation, nevertheless, a dedicated Web Service discovery technology based on SWS is desired currently. For this reason, we propose an effective SWS matching algorithm to achieve service discovery based on semantics. In the paper, we first refine core properties and requirements to apply subsumption relation to involved SWS matching method, which is based on the semantic information of service's inputs and outputs. Then, we discuss a feasible service semantic matching algorithm in detail. Next, we implement and test it in related SWS registry. Finally, we point out its main properties. In fact, the algorithm proves to fully satisfy our expectations and be practical and feasible. This paper analyses the features of the adjacent repeated patterns with Suffix Tree, and proposes an algorithm based on Suffix Tree through constructing Suffix Tree again to find the largest adjacent repeated pattern. The comparable and analyzable experiment shows that this algorithm can find the largest repeated patterns which are effective and true. Content-based publish/subscribe offers a convenient abstraction for information producers and consumers, supporting a large-scale system design and evolution by integrating several distributed independent application systems. Unlike in the traditional address-based unicast or multicast, its core problem is how to match events by predicates on the content of events. In existing matching approaches, matching predicates are composed by the conjunction and disjunction of non-semantic constraints. But, in context of enterprise application integration, although they can match events by their contents, this traditional matching predicates are not expressive enough in manipulating the complex event matching, such as the "one-to-many" and "many-toone" matching. Therefore, traditional matching approaches should be extended to solve the complex matching problems. After analyzing information matching patterns in enterprise application integration, we propose three matching models, extend this simple matching approach to the multisemantic matching approach and further introduce the temporal constraint variable. The multi-semantic matching approach allows using different operations in accordance with different semantics; the temporal constraint variable supports processing several discrete events in temporal sequences. Then, we extend OBDD graphs into hierarchy coloured OBDD graphs and prove the equivalence of the transformation. Based on the extended OBDD graphs, the composite matching algorithm is presented and analysed. By 187 Tsuruta, S.; Tsuruta, K.; Takada, K.; Sakurai, Y.; Mizuno, Y.; Kawabe, T.; Knauf, R. IEEE Zhao Yun; Si Huayou; Qi Hengnian; Ni Yulin IEEE Xu Yuan-Chun; Tian Yuan; Zhang Yi-Lai; Guo DeXian IEEE Gang Xu; Wei Xu; Tao Huang IEEE experiments, we show the proposed algorithm is efficient. CI1 CE3 An observer designpattern detection technique 2012 CE3 An ontological approach to oracle BPM 2012 CE3 An ontological approach to support the description of nursing practice in Japan with the ICNP 2007 The paper presents an approach for design patterns recognition in legacy code by the combination of static and dynamic analysis techniques. The implement process has three steps: static parser, SWRL rules and dynamic validation. The static parser translates the input source code into the AST. The proteÌ•geÌ• tool defines programming concepts with ontology model and design pattern into SWRL rules, and these SWRL rules are defined in OWL format, and then the code instances are constructed as OWL individuals and map to the individuals of the program ontology model. Finally, subsequent dynamic analysis is employed to confirm or weaken the results from static analysis. We discuss our approach for the Observer design pattern on a Java system. A modern business process management (BPM) operates using common tenants of an underlying Service Oriented Architecture (SOA) runtime infrastructure based on the Service Component Architecture (SCA) and supports the BPMN 2.0 OMG 1 standard. Semantically-enabling all BPM artifacts, from high-level design to deployment and the runtime model of a BPM application, promotes continuous process refinement, comprehensive impact analysis, and reuse to minimize process and service proliferation. A semantic database can manage semantically-enabled BPM ontologies and models, enable machine-driven inference to discover implicit relationships in the models, and perform pattern-matching queries to find associations. This paper presents an ontology for BPM based upon BPMN 2.0, Service Component Architecture (SCA) and the Web Ontology Language (OWL 2) that can support a wide range of use cases for process analysis, governance, business intelligence and systems management. It has the potential to bring together stakeholders across an enterprise, for a truly agile, end-toend enterprise architecture. © 2012 Springer-Verlag. Background: With increasing computerization of nursing records in Japan, standardization of nursing terminology is becoming imperative. Although some efforts have been made to formalize description of nursing practice in Japan with the International Classification of Nursing Practice (ICNP), lack of effective description tools has impacted negatively on the initiatives. Purpose: To develop and evaluate an ontological approach that could be used to facilitate the description of nursing practice in Japan with the ICNP. Methodology: An ontology-based support system was developed using Protégé-2000, mainly by the following three steps: (1) representing a standard classification of nursing practice (the Nursing Master) in Japan 188 Wu Ren; Wenyun Zhao IEEE Prater J., Mueller R., Beauregard B. Scopus Jiang G., Sato H., Endoh A., Ogasawara K., Sakurai T. Scopus CE2 An Ontology-Based Method for Similarity Calculation of Concepts in the Semantic Web 2006 CE3 Analysing ontological structures through name pattern tracking 2008 CE3 AOCI: Ontology-based pointcuts 2009 In the semantic Web, evaluating the semantic similarity between concepts in a same ontology is a central component of techniques such as clustering, data-mining, semantic sense disambiguation, ontology translations, automatic database schema matching, and simple object comparison. Traditionally, the distance based approach and the information content based approach are the two major methods. In this paper, on the basis of analyzing these previous approaches, a new method based on hierarchy information content and attribute information content is provided and a similarity calculating algorithm, HIC-AIC, based on this theory is presented. In terms of theoretical analysis and experiments, the new approach obtains higher accuracy in calculating the semantic similarity between concepts Concept naming over the taxonomic structure is a useful indicator of the quality of design as well as source of information exploitable for various tasks such as ontology refactoring and mapping. We analysed collections of OWL ontologies with the aim of determining the frequency of several combined name&graph patterns potentially indicating underlying semantic structures. Such structures range from simple set-theoretic subsumption to more complex constructions such as parallel taxonomies of different entity types. The final goal is to help refactor legacy ontologies as well as to ease automatic alignment among different models. The results show that in most ontologies there is a significant number of occurrences of such patterns. Moreover, their detection even using very simple methods has precision sufficient for a semi-automated analysis scenario. © 2008 Springer-Verlag Berlin Heidelberg. In this paper, we propose ontology-based pointcuts, a novel mechanism based on the ideas of AOP, the separation of concerns and system modularization, to enhance components, thus making them more adaptable and evolvable. The core idea of ontologybased pointcuts is to specify pointcuts in terms of ontological concepts instead of patterns that are matched against source code. Components are usually considered as black boxes that can be combined to a complex system using their outer interfaces. In the context of our infrastructure, components are extended by exporting possible adaptation points, which are enriched by ontological information. This ontological metadata represents concepts from a domain model, defined by a domain expert. The ontology is implemented within an intermediate layer that decouples the matching pointcuts from the concrete source level within the components. This enables the application of AOP techniques without detailed knowledge about the component's internals, enabling dynamic and distributed adaptation and reducing the fragile pointcut problem to the component scope. This paper presents the design and the expressiveness of the ontology-based pointcuts. We show several practical examples how to use joinpoint model and the pointcut specification followed by a 189 Guo-Hua Wang; Ya-Dong Wang; Mao-Zu Guo IEEE Svab-Zamazal O., Svatek V. Scopus Soldner G., Kapitza R., Schober S. Scopus short discussion. Copyright 2009 ACM. CI1 CI2 CI3 CI4 CE3 APIs à gogo: Automatic generation of ontology APIs 2009 Approximate query approach based on ontology for multisource and heterogeneous XML data 2007 When developing application programming interfaces of ontologies that include many instances of ontology design patterns, developers of semantic web applications usually have to handle complex mappings between descriptions of information given by ontologies and object oriented representations of the same information. In current approaches, annotations on API source code handle these mappings, leading to problems with reuse and maintenance. We propose a domain-specific language to tackle these mappings in a platform independent way - agogo. Agogo provides improvements on software engineering quality attributes like usability, reusability, maintainability, and portability. An ontology-based approach to effectively process approximate query for multi-source and heterogeneous XML data is proposed, in which the traditional approximate XML query strategy using tree pattern relaxation is integrated with the idea of ontology-based XML data integration. Firstly, a mapping model (PTO) from document type definition (DTD) structure to global schema is constructed, then PTO is combined with relaxation and scoring mechanism and a novel algorithm-OAXQ is presented. Thus, user query language based on global schema becomes a simple subset of object query language instead of Xpath expressions, and relaxations are accomplished by a series of conversion of mapping rules instead of transform of query tree patterns. Experiments of intelligent design of automobile shape show that comparing with SSO algorithm the query speed and precision is increased by 20 times and 2%24% respectively by OAXQ. 190 Parreiras, F.S.; Saathoff, C.; Walter, T.; Franz, T.; Staab, S. IEEE Tian L., Qin Z., Heng X., Shao L. Scopus CI1 CI2 CI3 CI4 Associative Artificial Neural Network for Discovery of Highly Correlated Gene Groups Based on Gene Ontology and Gene Expression 2007 CI1 CI2 CI3 CI4 AUTOMS-F: A framework for the synthesis of ontology mapping methods 2009 Building Ontologies by using Re-engineering Patterns and R2RML Mappings 2012 CE3 The advance of high-throughput experimental technologies poses continuous challenges to computational data analysis in functional and comparative genomics studies. Gene ontology (GO) annotation and transcriptional profiling using gene expression array have been two of the major approaches for system-wide analysis of gene functions and gene interactions. In the literature, extensive studies have been reported in each aspect. Yet there is a lack of efficient algorithm that discover associative patterns across these two data domains. We proposed a mixture model associative artificial neural network to tackle this deficiency. The algorithm inherits the theoretical foundation of adaptive resonance associative map (ARAM), with essential redefinition of pattern similarity measures and learning functions. The proposed algorithm is capable of clustering data based on both GO semantic similarity and expressional correlation, for the purpose of systematically discovering genome-wide, highly correlated gene groups, which in turn suggest similar or closely related functions. We applied the proposed algorithm to the analysis of the Saccharomyces cerevisiae (yeast) dataset and obtained satisfactory results. Effective information integration is still one of today's emerging research goals. The explosive growth of heterogeneous information sources makes the task harder and more challenging. Although ontologies promise an effective solution towards information management and coordination, it would be a surprise if two independent parties have constructed the same ontology to manage information for the same domain. Hence, to integrate information effectively, ontology mapping methods are invaluable. This paper presents the AUTOMS-F framework, which aims to facilitate the development of synthesized methods for the efficient and effective automatic mapping of ontologies. AUTOMS-F is highly extendable and customizable, providing facilities for supporting the rapid prototyping of synthesized mapping methods, adapting some well established programming design patterns. The paper presents the AUTOMS mapping method as an evaluated case of AUTOMS-F's potential. © 2009 SpringerVerlag Berlin Heidelberg. The ontologization of non-ontological resources has led to the design of several speci c methods, techniques and tools. Among those techniques, we have the Reengineering Patterns. More speci cally, we have the Patterns for re-engineering NORs (PR-NOR) that de ne a procedure that transforms the NOR terms into ontology representational primitives. Currently, the W3C RDB2RDF Working Group is at the final stage of formalizing R2RML, a language for describing mappings among RDB elements and RDF. In this paper we claim that it is possible to combine PRNORs with R2RML mappings for building ontologies from relational database content, i.e., transforming the database content into an ontology schema by using Re-engineering Patterns and R2RML mappings. 191 Ji He; Xinbin Dai; Xuechun Zhao IEEE Valarakos A.G., Spiliopoulos V., Vouros G.A. Scopus Boris VillazónTerrazas, Freddy Priyatna DBLP CE2 CE3 CAVEman: Standardized anatomical context for biomedical data mapping 2008 CE3 Component retrieval based on ontology and graph patterns matching 2010 Correspondence Patterns for Ontology Alignment 2008 Data Integration in the Life Sciences - 5th InternationalWorkshop, DILS 2008, Proceedings 2008 The authors have created a software system called the CAVEman, for the visual integration and exploration of heterogeneous anatomical and biomedical data. The CAVEman can be applied for both education and research tasks. The main component of the system is a three-dimensional digital atlas of the adult male human anatomy, structured according to the nomenclature of Terminologia Anatomica. The underlying data-indexing mechanism uses standard ontologies to map a range of biomedical data types onto the atlas. The CAVEman system is now used to visualize genetic processes in the context of the human anatomy and to facilitate visual exploration of the data. Through the use of Java™ software, the atlas-based system is portable to virtually any computer environment, including personal computers and workstations. Existing Java tools for biomedical data analysis have been incorporated into the system. The affordability of virtual-reality installations has increased dramatically over the last several years. This creates new opportunities for educational scenarios that model important processes in a patient's body, including gene expression patterns, metabolic activity, the effects of interventions such as drug treatments, and eventually surgical simulations. © 2007 American Association of Anatomists. Recently, the Component Based Software Development has become the main direction of software development, and with the expansion of the component library, efficient retrieval is crucial for us to improve the software development, in which the trend is semantic retrieval. The component concept ontology model and component domain ontology model this paper proposes, provide common knowledge foundation for component semantic retrieval. The users retrieval content is regularized to normal retrieval pattern, and then matched with component domain ontology model in accordance with matching algorithm, and the matching results are components which meet users need. The ontology models and component retrieval algorithm based on graph patterns matching, not only make up for the lack of semantic expression, but also enhance the retrieval efficiency. © 2010 Binary Information Press. We introduce in this paper correspondence patterns as templates to model ontology alignments. Correspondence patterns capture regularities recurring when aligning ontologies. They come in complement of ontology matching algorithms and graphical mapping tools, and facilitate the task of the engineer building the alignment between a pair of ontologies. We develop an ontology mediation framework based on three ontology correspondence abstraction levels. We particularly detail the most abstract level: correspondence patterns. The proceedings contain 20 papers. The topics discussed include: ontologies and data integration in biomedicine: success stories and challenging issues 192 Turinsky A.L., Fanea E., Trinh Q., Wat S., Hallgrimsson B., Dong X., Shu X., Stromer J.N., Hill J.W., Edwards C., Grosenick B., Yajima M., Sensen C.W. Scopus Yan W., Rousselot F., Zanni-Merk C. Scopus François Scharffe, Dieter Fensel DBLP [No author name available] Scopus CE2 CE3 Describing generic expertise models as object-oriented analysis patterns: The heuristic multi-attribute decision pattern 2002 CE2 CE3 Design Issues of Semantic Service Discovery for Ubiquitous Computing 2007 CE2 CE3 Design Pattern for Object Triple Mapping 2009 We report on work concerning the use of object-oriented analysis and design (OAD) methods in the development of artificial intelligence (AI) software applications, in which we compare such techniques to software development methods more commonly used in AI, in particular CommonKADS. As a contribution to clarifying the role of OAD methods in AI, in this paper we compare the analysis models of the object-oriented methods and the CommonKADS high-level expertise model. In particular, we study the correspondences between generic tasks, methods and ontologies in methodologies such as CommonKADS and analysis patterns in object-oriented analysis. Our aim in carrying out this study is to explore to what extent, in areas of AI where the object-oriented paradigm may be the most adequate way of conceiving applications, an analysis level 'pattern language' could play the role of the libraries of generic knowledge models in the more commonly used AI software development methods. As a case study we use the decision task - its importance arising from its status as the basic task of the intelligent agent - and the associated heuristic multi-attribute decision method, for which we derive a corresponding decision pattern described in the unified modelling language, a de facto standard in OAD. Services in the ubiquitous computing are heterogeneous in nature. To be pervasive, these services should be defined in terms of their functionality and capabilities rather than the meaningless UUIDs or types of services. Thus, clients can access the proper service based on semantic requests. In this paper, we study the demand of semantic query in service discovery processes. Current discovery protocols and the concept of semantics are bringing together to construct a framework to realize the semantic service discovery for ubiquitous computing. Many issues are discussed in relation to service discovery topologies, ontology languages, and semantic query languages. Up to now, developing software for the Semantic Web is much more complex than developing software for other data representation paradigms, such as relational databases. Software development for relational databases is dramatically simplified by so-called object-relational mappers. Due to the conceptual difference between relational databases and the Semantic Web, the design patterns for object-relational mapping cannot directly be used for linked data. In this paper we show how design patterns for object-relational mapping can be used to achieve the more complex object triple mapping, which will make developing Semantic Web-enabled software much easier. 193 Manjarres A., Pickin S. Scopus Reen-Cheng Wang; YaoChung Chang; Ruay-Shiung Chang IEEE Quasthoff, M.; Meinel, C. IEEE CE3 Design resource application services based on the semantic web services 2006 Enterprise, BusinessProcess and Information Systems Modeling: 10th International Workshop, BPMDS 2009, and 14th International Conference, EMMSAD 2009 2009 Exploiting patterns in ontology mapping 2007 CE2 CE3 Exploring alternatives for representing and accessing design knowledge about enterprise integration 2007 CE2 CE3 Exploring Semantic Web Services Selection Method with Effectivity in Collaborative Environment 2007 CI1 CI2 CI3 CI4 Enterprise cooperation is an inevitable trend for business development and how to transfer and acquire knowledge quickly but effectively is becoming a bottleneck problem. To solve the problem, this paper presents a design resource application services pattern based on OWL-S. In this paper design resources service categories are constructed according to analyzing the existence form and state of design knowledge, basing on which the upper ontology of OWL-S is extended and the design resource application services are semantically described. Then, the system architecture of design resource application services is constructed in which design resource services can be discovered and invoked dynamically by semantic matching mechanism to satisfy the requirements that enterprises quickly acquire and integrate design resources. At last, this paper gives an example of a document service to describe implementation process of the design resource application services. The proceedings contain 33 papers. The topics discussed include: a conceptual framework for business process redesign Xing Y., Cheng H., Sun J., Yuan C. Scopus [No author name available] Scopus Unsatisfactory performance of ontology mapping methods on many tasks seems to indicate the need for employing some background knowledge. My PhD work focuses on exploiting pattern-like structures for this purpose. Design patterns are related to different styles of modelling ontology structure and/or naming of concepts. On the other hand, mapping patterns emerge as result of the mapping process. Preliminary results and schedule of future work are presented. © 2008 Springer-Verlag Berlin Heidelberg. Enterprise integration refers to solutions that facilitate meaningful interactions among heterogeneous legacy applications. The scale, complexity and specificity of most enterprise integration efforts mean that design knowledge for enterprise integration has resisted codification. Important exceptions to this include: use of Business Process Models (BPM) to understand integration requirements There are more and more Web services used in collaborative design, hence it is becoming important to locate proper Web services in an accurate and efficient way. In our design, we give an annexed algorithm to improve the existing semantic-based matchmaking algorithm which is focused on Web services containing single input and output. The annexed algorithm arranges the result advertisements according to the clients' convenience to execute the Web services, specially it can efficiently deal with Web services which have multiple inputs and outputs. Moreover, we implemented the matching method in semantic Web servicesbased application integration framework (SWSAIF) which is used for collaborative design. Svab O. Scopus Umapathy K., Purao S. Scopus 194 Daolin Du; Qingzhong Li; Tiangang Dong IEEE CE3 Extended models of dynamic selection using ontological elements - Application to design and image analysis problems 2003 CE3 Flexible Wireless Trust Through OntologyBased Mapping and Its Attendant Semantic Limitations 2009 Fully automatic construction of enterprise ontologies using design patterns: Initial method and first experiences 2005 In this work, we present two practical extensions about the integration of knowledge elements into ontologies and the dynamic selection of methods. First, we propose a mechanism to integrate the abstracted methods and other elements of the knowledge model developed for the given problem into an ontology, using them later via a set of adapters or bridges. Second, as we detected the recurrence of some complex patterns of selection, we propose some extensions of the basic selection mechanism, in order to simplify the notation and the treatment Trusted interaction in a wireless environment is highly challenging as possibly interacting mobile entities are not known to each other at design or deployment time. This paper proposes an architecture, and considers the inherent semantic limitations, for intelligent trust establishment and dynamic authentication and authorization between mobile entities previously unknown to each other, utilizing ontology-based mapping at a common certificate authority server. The proposed solution can assist with mapping of attributes on which to base trust decisions, in a range of instances but there are also inherent semantic limitations discussed later in the paper. The main contribution of this paper is an initial method for automatically exploiting ontology design patterns with the aim of further automating the creation of enterprise ontologies in small-scale application contexts. The focus is so far on developing a fully automated construction method, thereby somewhat reducing the requirements on ontology customization and level of detail. In this paper we present an approach how to use knowledge (patterns) from other areas, like data modeling, knowledge reuse, software analysis and software design, to create ontology patterns. These design patterns are then used within our method for automatically matching and pruning them, in accordance with information extracted from existing knowledge sources within the company in question. Though the method still needs some fine-tuning, it has already been used when creating an enterprise ontology for a supplier-company within the automotive industry. © Springer-Verlag Berlin Heidelberg 2005. 195 Bienvenido J.F., Flores-Parra I.M. Scopus Robert Steele, Kyongho Min DBLP Blomqvist E. Scopus CE2 CE3 Fuzzy modeling of metabolic maps in MetNetDB 2004 CE3 Growing applications and advancements in microarray technology and analysis tools 2005 CE3 How to reuse a faceted classification and put it on the semantic web 2010 Metabolic networks combine metabolism and regulation. These complex networks are difficult to understand and visualize due to the diverse types of information that need to be represented. FCModeler, a publicly available software package is designed to enable the biologist to visualize and model metabolic and regulatory network maps in plants. It links to an interactions database (MetNetDB) containing information on regulatory and metabolic interactions derived from a combination of web databases and input from biologists in their area of expertise. FCModeler evaluates hypotheses and provides a graph-theoretic modeling framework for assessing the large amounts of data captured by high-throughput gene expression experiments. This leads to a new method for classifying gene expression data by combining network, gene ontology, and measured expression information in a fuzzy clustering framework. In today's field of genomics, traditional gene-by-gene approach is not adequate to meet the demand of processing information generated from mapping the complex biology of the human genome. More global views of analyzing the magnitude of information are necessary, such as with microarrays. Microarray technology today is rapidly uncovering broad patterns of genetic activity and showing insight into gene functions, processes, and pathways. With the growing technology, imminent knowledge is being generated looking into transcriptional processes and biological mechanisms from many different organisms and phylogeny. Many tools are being developed to assist with the analysis of such high-throughput data, many applications are being utilized by this technology, and the field is growing and expanding rapidly to accommodate the expanding genomics era. © Copyright 2005 by Humana Press Inc. All rights of any nature whatsoever reserved. There are ontology domain concepts that can be represented according to multiple alternative classification criteria. Current ontology modeling guidelines do not explicitly consider this aspect in the representation of such concepts. To assist with this issue, we examined a domainspecific simplified model for facet analysis used in Library Science. This model produces a Faceted Classification Scheme (FCS) which accounts for the multiple alternative classification criteria of the domain concept under scrutiny. A comparative analysis between a FCS and the Normalisation Ontology Design Pattern (ODP) indicates the existence of key similarities between the elements in the generic structure of both knowledge representation models. As a result, a mapping is identified that allows to transform a FCS into an OWL DL ontology applying the Normalisation ODP. Our contribution is illustrated with an existing FCS example in the domain of Dishwashing Detergent that benefits from the outcome of this study. © 2010 Springer-Verlag. 196 Dickerson, J.A.; Pan Du; Wurtele, E.; Jie Li IEEE Peeters J.K., Van Der Spek P.J. Scopus Rodriguez-Castro B., Glaser H., Carr L. Scopus CE3 CE3 Hybrid pattern matching for complex ontology term recognition 2012 ICSOFT 2007 Proceedings of the 2nd International Conference on Software and Data Technologies Improving UML profile design practices by leveraging conceptual domain models 2007 2007 Ontology term recognition is a key task of ontology-based text mining. Previous approaches of statistical analysis and syntactic pattern matching have such limitations that they do not consider relations between words and that their handcrafted patterns are expensive and show low coverage, respectively. These limitations are critical especially when dealing with long and complex ontology terms. We propose a hybrid approach that combines the two approaches sequentially: It first uses syntactic pattern matching and, when its results are partial due to lack of required patterns, then completes them with supplementary evidence from a statistical method. Additionally, we present a novel method that automatically learns syntactic patterns from an annotated corpus. We tested the proposed approach for the tasks of recognizing Gene Ontology (GO) terms in text and also of associating the GO terms with proteins. When compared with existing systems of statistical analysis and syntactic pattern matching, it significantly improves 'relative' recall by 11%~13% and F-score by 7%. The proceedings contain 42 papers. The topics discussed include: a language for specifying informational graphics from first principles Jung-jae Kim, Anh Tuan Luu DBLP [No author name available] Scopus The profile extension mechanism has permitted a rapid growth of the use of UML as a domain-specific modeling language. However, designing profiles typically falls into ad-hoc processes that often rely on domain-inappropriate primitives. One of the fundamental reasons is that profiles are specified on the same level of abstraction as the UML abstract syntax and consequently they narrow down the design space to an implementation level. In order to improvethis situation, some profile designers start from a conceptual domain model that states the domain ontology, and only then deal with finding out the profile extensions to support it. In spite of this, building truthfulness conceptual domain models and maintaining traceable mapping with the profile view is a bit of an art. In this paper, we propose to systematize the design of UML profiles built-upon conceptual domain models, by adopting a minimal setof framing rules. As these rules are defined on the basis of regularly occurring design patterns, domain models can be afterward checked for self-consistency and interactively transformed in stereotypes, tags and constraints. Copyright 2007 ACM. Lagarde F., Espinoza H., Terrier F., Gerard S. Scopus 197 CE3 Improving Web Service Discovery by a Functional and Structural Approach 2011 CE3 Information reuse and interoperability with ontology patterns and linked data - First experiences from the ExpertFinder project 2010 Service oriented Architecture (SOA) has been widely used in service computing applications and this fact has been encouraged the publication over the Web in a Web Service format. Whereas the number of Web services published on the Web is growing up, discovery techniques must be improved so as to retrieve more desirable services. Nowadays, the most commonly used technique is semantic filters based on ontological concepts. However, such mechanisms can leave out some important Web services of the matching process, because of their structural relationship not mentioned in an ontology. In order to overcome such problems, some authors have proposed a hybrid approach to combine traditional syntactic and semantic approaches. These proposals remain restricted especially with respect to complexity, precision and time of execution, thus making such solutions in most of cases unfeasible. In this paper, we combine semantic filters based on functional properties with a structural approach, analyzing each neighbor relationship in an ontology. The results showed a considerable improvement in terms of performance and a complexity reduction with respect to other existing techniques. Furthermore, we implement a tool called OWLS-S Discovery in order to simplify the use of our approach by developers. Semantic web technologies show great promise in usage scenarios that involve information logistics. This paper is an experience report on improving the semantic web ontology underlying an application used in expert finding. We use ontology design patterns to find and correct poor design choices, and align the application ontology to commonly used semantic web ontologies in order to increase the interoperability of the ontology and application. Lessons learned and problems faced are discussed, and possible future developments of the project mapped out. © 2010 Springer-Verlag Berlin Heidelberg. 198 Amorim, R.; Claro, D.B.; Lopes, D.; Albers, P.; Andrade, A. Hammar K., Lin F., Tarasov V. IEEE Scopus CI1 CI2 CI3 CI4 CE2 Interleaving Ontology Mapping for Online Semantic Annotation on Semantic Wiki 2008 Interoperating ontologies of organizational memory through hybrid unsupervised data mining 2009 We have designed a system that automatically annotates language resources online by referring to the semantic correspondences obtained from ontology mapping methods. Every time user inputs a term, triplets are created using a predefined pattern-triplet mapping table. If an unidentifiable term has been entered (i.e., triplets could not be created from it), the system suggests alternative terms from a thesaurus. An ontology mapping task is to map the triplets into background ontologies, efficiently producing a semantic wiki page whose tag vocabularies are derived from the ontologies. In practice, collaborative editing is also available without leading to semantic inconsistency between editors, by allowing them to use their own background ontologies and aligning these different background ontologies. Purpose: The purpose of this paper is to present an automated ontology mapping and merging algorithm, namely OntoDNA, which employs data mining techniques (FCA, SOM, K-means) to resolve ontological heterogeneities among distributed data sources in organizational memory and subsequently generate a merged ontology to facilitate resource retrieval from distributed resources for organizational decision making. Design/methodology/approach: The OntoDNA employs unsupervised data mining techniques (FCA, SOM, K-means) to resolve ontological heterogeneities to integrate distributed data sources in organizational memory. Unsupervised methods are needed as an alternative in the absence of prior knowledge for managing this knowledge. Given two ontologies that are to be merged as the input, the ontologies' conceptual pattern is discovered using FCA. Then, string normalizations are applied to transform their attributes in the formal context prior to lexical similarity mapping. Mapping rules are applied to reconcile the attributes. Subsequently, SOM and K-means are applied for semantic similarity mapping based on the conceptual pattern discovered in the formal context to reduce the problem size of the SOM clusters as validated by the Davies-Bouldin index. The mapping rules are then applied to discover semantic similarity between ontological concepts in the clusters and the ontological concepts of the target ontology are updated to the source ontology based on the merging rules. Merged ontology in a concept lattice is formed. Findings: In experimental comparisons between PROMPT and OntoDNA ontology mapping and merging tool based on precision, recall and fmeasure, average mapping results for OntoDNA is 95.97 percent compared to PROMPT's 67.24 percent. In terms of recall, OntoDNA outperforms PROMPT on all the paired ontology except for one paired ontology. For the merging of one paired ontology, PROMPT fails to identify the mapping elements. OntoDNA significantly outperforms PROMPT due to the utilization of FCA in the OntoDNA to capture attributes and the inherent structural relationships among concepts. Better performance in OntoDNA is due to the 199 Jinhyun Ahn; Jung, J.J.; KeySun Choi Kiu C.-C., Lee C.S. IEEE Scopus CI CE3 Intersection-Based Matchmaking for Semantic Web Service Discovery 2007 K-CAP'09 Proceedings of the 5th International Conference on Knowledge Capture Knowledge Engineering: Practice and Patterns: 16th International Conference, EKAW 2008, Proceedings 2009 2008 following reasons. First, semantic problems such as synonymy and polysemy are resolved prior to contextual clustering. Second, unsupervised data mining techniques (SOM and K-means) have reduced problem size. Third, string matching performs better than PROMPT's linguisticsimilarity matching in addressing semantic heterogeneity, in context it also contributes to the OntoDNA results. String matching resolves concept names based on similarity between concept names in each cluster for ontology mapping. Linguistic-similarity matching resolves concept names based on concept-representation structure and relations between concepts for ontology mapping. Originality/value: The OntoDNA automates ontology mapping and merging without the need of any prior knowledge to generate a merged ontology. String matching is shown to perform better than linguisticsimilarity matching in resolving concept names. The OntoDNA will be valuable for organizations interested in merging ontologies from distributed or different organizational memories. For example, an organization might want to merge their organization-specific ontologies with community standard ontologies. © Emerald Group Publishing Limited. For semantic Web service discovery, matchmaking techniques are used to compare descriptions of semantically annotated services issued by service requesters and providers. Such semantic descriptions are typically expressed in ontology languages to capture the functionality of a service in a meaningful and machine - interpretable way. Among various other techniques proposed in the literature, intersection-based matchmaking rates two service descriptions as compatible if they agree on some concrete instantiation of service parameters. We report on an intersection-based matchmaking framework which we have applied to an industrial logistics case study. We particularly focus on the how-to of designing semantic service descriptions, providing modelling guidelines and patterns, an aspect that is often neglected in matchmaking literature. By an example from our logistics case study that involves sophisticated ontology reasoning, we show how some of the limitations of this matching technique can be overcome by an appropriate modelling. The proceedings contain 40 papers. The topics discussed include: interactively shaping agents via human reinforcement: the TAMER framework The proceedings contain 32 papers. The topics discussed include: computational semantics and knowledge engineering 200 Grimm, S. IEEE [No author name available] Scopus [No author name available] Scopus CE3 Knowledge extraction based on discourse representation theory and linguistic frames 2012 CE2 Large-scale ontologies: pattern and partitionbased alignment 2011 CE2 CE3 Making a difference through e-governance from below: An evaluation and future directions 2008 We have implemented a novel approach for robust ontology design from natural language texts by combining Discourse Representation Theory (DRT), linguistic frame semantics, and ontology design patterns. We show that DRT-based frame detection is feasible by conducting a comparative evaluation of our approach and existing tools. Furthermore, we define a mapping between DRT and RDF/OWL for the production of quality linked data and ontologies, and present FRED, an online tool for converting text into internally wellconnected and linked-data-ready ontologies in web-service-acceptable time. © 2012 Springer-Verlag. Several ontologies covering the same domain or overlapping domains have been independently built of each others. They are often a source of heterogeneity. In order to make them interoperable, the semantic links between their entities must be established. This task is called ‘ontologies alignment’. However, the proposed alignment methods meet the challenge of ‘scaling up’. To take up this challenge, we propose an alignment method with partitioning. This method consists of partitioning each ontology into blocks around the anchors. In the alignment step, each block of the first ontology is aligned with one block of the second one. The results obtained in the evaluation of our method on selected ontologies show its efficiency. This paper discusses a process evaluation of a project funded by an Australian Research Council Linkage Project with the South Australian Department of Health, Flinders University, University of South Australia and Neporendi Forum Inc, an Aboriginal NGO. The co-researchers comprising academics across a range of disciplines, service users and providers address wellbeing in terms of their lived experiences of what works, why and how. The outcome is the development of prototype software that is co-owned by the partners and has been tested out by the participants. The process has taken knowledge management beyond storage and retrieval of information to include the perceptions and meanings of the stakeholders. It has potential to enable costing the pathways in social justice terms, in order to make a case for participation both as 'a means and an end' to support wellbeing within particular contexts. The software can be updated as it is used and it has the wider potential to be applied in a range of governance contexts. The use of meaningful metaphors designed by the participants could a) tailor the software to different user and provider groups by b) enabling the participants to collect data on their areas of concern. User-centric design is based on telling narratives and exploring perceived ontologies or meanings. The next step is to analyze the discourses for patterns (Christakis and Bausch 2006 and Van Gigch 1991, 2003 on meta modelling). Making sense of perceptions is through identification of patterns and making meaning/sense of the patterns based on weighting the choices. The number of times particular themes were raised or particular service choices made equals a weighting. We used a pluralist 201 Presutti V., Draicchio F., Gangemi A. Scopus Soumaya Kasri, Fouzia Benchikha DBLP McIntyre-Mills J. Scopus approach and avoided a 'one size fits all' approach by using a) participatory action research and questioning, b) soft systems mapping, c) critique informed by Critical Systems Thinking and a Design of Inquiry System and d) social cybernetics applied to 'if then' scenarios. The approach demonstrates the ability of people to design the content of the software and thus to engage in participatory design, e-governance and e-democracy which could be used to extend democracy to the marginalized and socially excluded. In the Australian context these include Aboriginal Australians, refugees and young people without the vote who will have to live with the decisions in the future. The current research is only with Aboriginal stakeholders aged 18 and above and it needs to be extended in the next phase to include younger Australians. I will use most of the presentation time to give a practical demonstration of the software and to discuss its potential application. CE3 Matching Patient Records to Clinical Trials Using Ontologies 2007 CE2 CE3 Model-based failure management for distributed reactive systems 2007 This paper describes a large case study that explores the applicability of ontology reasoning to problems in the medical domain. We investigate whether it is possible to use such reasoning to automate common clinical tasks that are currently labor intensive and error prone, and focus our case study on improving cohort selection for clinical trials. An obstacle to automating such clinical tasks is the need to bridge the semantic gulf between raw patient data, such as laboratory tests or specific medications, and the way a clinician interprets this data. Our key insight is that matching patients to clinical trials can be formulated as a problem of semantic retrieval. We describe the technical challenges to building a realistic case study, which include problems related to scalability, the integration of large ontologies, and dealing with noisy, inconsistent data. Our solution is based on the SNOMED CT® ontology, and scales to one year of patient records (approx. 240,000 patients). Failure management is key to the development of safety-critical, distributed, reactive systems common in such applications as avionics, automotive, and sensor/actuator networks. Specific challenges to effective failure management include (i) developing an understanding of the application domain so as to define what constitutes a failure 202 Chintan Patel, James J. Cimino, Julian Dolby, Achille Fokoue, Aditya Kalyanpur, Aaron Kershenbaum, Li Ma, Edith Schonberg, Kavith a Srinivas DBLP Ermagan V., Kruger I., Menarini M. Scopus CI1 CE3 Modeling Requirement Driven Architecture of Adaptive Healthcare System Based on Semiotics 2009 CE3 Motor ontology in representing gazeobject relations 2008 CE3 Natural language-based approach for helping in the reuse of ontology design patterns 2008 In order to improve the quality of healthcare services, the integrated large-scale medical information system is needed to adapt to the changing medical environment. In this paper, we propose a requirement driven architecture of healthcare information system with hierarchical architecture. The system operates through the mapping mechanism between these layers and thus can organize functions dynamically adapting to user's requirement. Furthermore, we introduce the organizational semiotics methods to capture and analyze user's requirement through ontology chart and norms. Based on these results, the structure of user's requirement pattern(URP) is established as the driven factor of our system. Our research makes a contribution to design architecture of healthcare system which can adapt to the changing medical environment. Event-related functional magnetic resonance imaging (fMRI) was used to explore how the human brain models gaze-object relations. During scanning participants observed a human model gazing towards or away a target object presented either in isolation or flanked by a distractor object. In two further conditions the model's gaze was shifted and subsequently maintained away from the stimulus/i. These four conditions were implemented within a factorial design in which the main factors were type of observed behavior (gaze vs. gaze-away) and context (target alone vs. target flanked by a distractor). Results revealed that premotor, parietal and temporal areas, known to subserve the understanding of other people actions, were significantly more activated by the observation of the model gazing towards rather than away from the stimulus/i. In addition, a significant interaction indicated that, when the target was presented in isolation, neural activity within the inferior frontal gyrus, another key area for action understanding, was influenced by gazeobject relations. Our findings suggest that this area is important for the establishment of intentional gaze-object relations and indicate that the presence of a distractor interferes with the representation of such relations. © 2007 Elsevier Ireland Ltd. All rights reserved. Experiments in the reuse of Ontology Design Patterns (ODPs) have revealed that users with different levels of expertise in ontology modelling face difficulties when reusing ODPs. With the aim of tackling this problem we propose a method and a tool for supporting a semi-automatic reuse of ODPs that takes as input formulations in natural language (NL) of the domain aspect to be modelled, and obtains as output a set of ODPs for solving the initial ontological needs. The correspondence between ODPs and NL formulations is done through Lexico-Syntactic Patterns, linguistic constructs that convey the semantic relations present in ODPs, and which constitute the main contribution of this paper. The main benefit of the proposed approach is the use of non-restricted NL formulations in various languages for obtaining ODPs. The use of full NL poses challenges in the disambiguation of linguistic expressions that 203 Yang Hongqiao; Li Weizi IEEE Pierno A.C., Becchio C., Tubaldi F., Turella L., Castiello U. Scopus De Cea G.A., Gomez-Perez A., Montiel-Ponsoda E., SuarezFigueroa M.C. Scopus we expect to solve with user interaction, among other strategies. © 2008 SpringerVerlag Berlin Heidelberg. CE2 CE3 CI1 CI2 CI3 CI4 On-site task assistant pattern based on wearable computing 2007 Ontology alignment design patterns 2013 Traditional on-site task assistant pattern can't satisfy the dynamic and complex information requirement of mobile technicians. To tackle this problem, wearable computer and wireless sensor were introduced to the maintenance task site. Firstly, a special wearable computing system and an on-site task assistant pattern based on wearable computing was introduced. Secondly, implementation challenges of application structure constructing for this pattern were analyzed. Thirdly, for some key methods, the methods of extended Petri net and domain ontology design were proposed which was used to describe application function module. The domain structure analysis and Petri net mapping were put forward to generate layered colored Petri net. Assistant construction process of application structure based on ontology reasoning and transitions substitution was also realized. Finally, the application instance and analysis were also discussed. Interoperability between heterogeneous ontological descriptions can be performed through ontology mediation techniques. At the heart of ontology mediation lies the alignment: a specification of correspondences between ontology entities. Ontology matching can bring some automation but are limited to finding simple correspondences. Design patterns have proven themselves useful to capture experience in design problems. In this article, we introduce ontology alignment patterns as reusable templates of recurring correspondences. Based on a detailed analysis of frequent ontology mismatches, we develop a library of common patterns. Ontology alignment patterns can be used to refine correspondences, either by the alignment designer or via pattern detection algorithms. We distinguish three levels of abstraction for ontology alignment representation, going from executable transformation rules, to concrete correspondences between two ontologies, to ontology alignment patterns at the third level. We express patterns using an ontology alignment representation language, making them ready to use in practical mediation tasks. We extract mismatches from vocabularies associated with data sets 204 Xiahou S.-J., Chen D.-Y., Huang Z.-Q. Scopus Scharffe F., Zamazal O., Fensel D. Scopus published as linked open data, and we evaluate the ability of correspondence patterns to provide proper alignments for these mismatches. Finally, we describe an application of ontology alignment patterns for an ontology transformation service. CE3 Ontology based design for similarity discovery in SYMBAD project 2006 CE3 Ontology based semantic mapping architecture 2005 The SYMBAD (Similarity Based Agents for Design) system is a project developed to aid Architectural design team members to share knowledge used in Stand design. Stands play important role in promoting a Company image, projects its presence and emphasizes the corporate identity in events and Fairs. The processes and problems in stand projects are quite common and can be easily found in other design situations. From conceptual design to the construction of a final product, a stand project passes through many hands, each one adding bits and pieces until it is completed. The physical distance, difficulties in communication and cultural aspects make designers interact less than necessary, generating problems in all phases of the design activities. The SYMBAD project uses an Ontology based framework to improve process awareness in a Design activity. Based on the knowledge kept from previous projects and Similarity aspects, agents can identify possibilities for reuse and provide information to help the design team to built new Stands using past materials and ideas. Through a constructed Ontology and collaborative features agents can produce global awareness, to facilitate later steps and optimize the process as a whole. In this paper we present some of the functions and architecture aspects, as well as some of the implementations choices made for this project. © 2006 IEEE. Integrating with ontology and XML schema, taking advantage of Web service, this paper develops a service oriented information representation architecture & SOIRA to solve the semantic heterogeneity of distributed and semi-structured information. It introduces a mediated semantic schema originating from ontology to XML schema, discusses the multi-matching strategy between the mediated schema and source schemas. The implementation of SOIRA with two kinds of semantic representation services are presented at the end of this paper, which enable interoperability, translation of information, and queries across the representations as well. 205 Pinho D., Vivacqua A.S., Medeiros S., De Souza J.M. Scopus Lin Zhang; JinGuang Gu IEEE CE3 CE2 Ontology driven design of EMF metamodels and well-formedness constraints 2012 Ontology Fusion with Complex Mapping Patterns 2006 Ontology Matching Using Weighted Graphs 2007 Ontologies provide high-level means for capturing requirements of systems with precise semantics and automated meta-level reasoning techniques to identify specification flaws early in the design even if certain parts of the system is underspecified. Domain-specific modeling environments effectively support domain engineers for designing the system by providing efficient means for instance-level validation of well-formedness constraints. In the current paper, we aim at a combined use of ontologies and DSM techniques where domain requirements captured in textual ontology languages like OWL2/SWRL will drive the development of a DSM environment. More specifically, we provide (i) an automated mapping from OWL2 ontologies to metamodels defined by the industry-standard EMF platform, which is extended by a (ii) mapping of requirements and constraints (captured in OWL2 and SWRL) into a textual graph pattern language efficiently evaluated by the EMF-IncQuery incremental model query technology. © 2012 ACM. Ontology mapping plays a key role in information integration systems. This paper discusses the patterns of complex ontology mapping. It proposes the definition and properties of ontology mappings, and discusses the procedure and algorithm of ontology fusion with complex ontology mapping. In this paper, we present a new way towards ontology matching. Using the graph representation for ontologies and schemas we proceed to calculate the weights for each node of the graph using the lexical similarity of the ancestors. With the guiding intuition that, if the parent nodes match then their children are likely to match as well. This simple observation helps on to build a fast and efficient algorithm for matching different graphs (which represent ontology or schema). Since the algorithm is very fast it can be used as a quickly and dirty method to do initial matching of a large dataset and then drill down to the exact match with other algorithms. The algorithm is not dependent on the method used for calculating the lexical similarity so the best lexical analysis can be used to derive the weights. Once the weights are in place we can calculate the matching in just a single traversal of the graphs. No other algorithm that we know of can give such fast response time. 206 Izso B., Szatmari Z., Bergmann G., Horvath A., Rath I., Varro D. Scopus Jinguang Gu, Yi Zhou DBLP Sharma, A. IEEE CI1 CE3 Ontology patterns for complex topographic feature types 2011 CE3 Ontology-based pattern generator and root semantic analyser for spoken dialogue systems 2012 CE3 Ontology-driven mapping of temporal data in biomedical databases. 2006 Abstract Complex feature types are defined as integrated relations between basic features for a shared meaning or concept. The shared semantic concept is difficult to define in commonly used geographic information systems (GIS) and remote sensing technologies. The role of spatial relations between complex feature parts was recognized in early GIS literature, but had limited representation in the feature or coverage data models of GIS. Spatial relations are more explicitly specified in semantic technology. In this paper, semantics for topographic feature ontology design patterns (ODP) are developed as data models for the representation of complex features. In the context of topographic processes, component assemblages are supported by resource systems and are found on local landscapes. The topographic ontology is organized across six thematic modules that can account for basic feature types, resource systems, and landscape types. Types of complex feature attributes include location, generative processes and physical description. Node/edge networks model standard spatial relations and relations specific to topographic science to represent complex features. To demonstrate these concepts, data from The National Map of the U.S. Geological Survey was converted and assembled into ODP. This paper presents improvements in a dialogue interpreter sub-system for an application that allows the user to interact by speech with a Radio-Frequency IDentification (RFID) network working in a highly noisy environment. A new dialog framework is proposed in order to give the human operators the ability to communicate with the system in a more natural fashion. This is achieved by the implementation of the Artificial Intelligence Markup Language combined with an ontology-based pattern generation and root semantical analysis algorithms, which allows the system to respond to close-to natural language queries by means of pattern matching. Biomedical databases contain considerable amounts of time-oriented data, which are not typically in a format suitable for querying complex temporal patterns. We address this problem in implementing Synchronus, a tool for ontology-driven mapping of data from an existing relational database to a database schema with a uniform temporal representation. We discuss the design of Synchronus, which consists of a schemamapping ontology and a data-mapping algorithm that together provide general capabilities for database transformation. 207 Varanka D.E. Scopus Benahmed, Y.; Selouani, S.; O'Shaughnessy, D. IEEE Narayanan P.S., O'Connor M.J., Das A.K. Scopus CE3 OpenDMAP: An open source, ontologydriven concept analysis engine, with applications to capturing knowledge regarding protein transport, protein interactions and celltype-specific gene expression 2008 CE3 OpenFlyData: An exemplar data web integrating gene expression data on the fruit fly Drosophila melanogaster 2010 Background: Information extraction (IE) efforts are widely acknowledged to be important in harnessing the rapid advance of biomedical knowledge, particularly in areas where important factual information is published in a diverse literature. Here we report on the design, implementation and several evaluations of OpenDMAP, an ontology-driven, integrated concept analysis system. It significantly advances the state of the art in information extraction by leveraging knowledge in ontological resources, integrating diverse text processing applications, and using an expanded pattern language that allows the mixing of syntactic and semantic elements and variable ordering. Results: OpenDMAP information extraction systems were produced for extracting protein transport assertions (transport), protein-protein interaction assertions (interaction) and assertions that a gene is expressed in a cell type (expression). Evaluations were performed on each system, resulting in F-scores ranging from .26 - .72 (precision .39 - .85, recall .16 - .85). Additionally, each of these systems was run over all abstracts in MEDLINE, producing a total of 72,460 transport instances, 265,795 interaction instances and 176,153 expression instances. Conclusion: OpenDMAP advances the performance standards for extracting protein-protein interaction predications from the full texts of biomedical research articles. Furthermore, this level of performance appears to generalize to other information extraction tasks, including extracting information about predicates of more than two arguments. The output of the information extraction system is always constructed from elements of an ontology, ensuring that the knowledge representation is grounded with respect to a carefully constructed model of reality. The results of these efforts can be used to increase the efficiency of manual curation efforts and to provide additional features in systems that integrate multiple sources for information extraction. The open source OpenDMAP code library is freely available at http://bionlp.sourceforge.net/. © 2008 Hunter et al Motivation: Integrating heterogeneous data across distributed sources is a major requirement for in silico bioinformatics supporting translational research. For example, genome-scale data on patterns of gene expression in the fruit fly Drosophila melanogaster are widely used in functional genomic studies in many organisms to inform candidate gene selection and validate experimental results. However, current data integration solutions tend to be heavy weight, and require significant initial and ongoing investment of effort. Development of a common Web-based data integration infrastructure (a.k.a. data web), using Semantic Web standards, promises to alleviate these difficulties, but little is known about the feasibility, costs, risks or practical means of migrating to such an infrastructure. Results: We describe the development of OpenFlyData, a proof-of-concept system integrating gene expression data on D. melanogaster, combining Semantic Web standards with light-weight approaches to 208 Hunter L., Lu Z., Firby J., Baumgartner Jr. W.A., Johnson H.L., Ogren P.V., Cohen K.B. Scopus Miles A., Zhao J., Klyne G., WhiteCooper H., Shotton D. Scopus Web programming based on Web 2.0 design patterns. To support researchers designing and validating functional genomic studies, OpenFlyData includes user-facing search applications providing intuitive access to and comparison of gene expression data from FlyAtlas, the BDGP in situ database, and FlyTED, using data from FlyBase to expand and disambiguate gene names. OpenFlyData's services are also openly accessible, and are available for reuse by other bioinformaticians and application developers. Semi-automated methods and tools were developed to support labour- and knowledge-intensive tasks involved in deploying SPARQL services. These include methods for generating ontologies and relational-to-RDF mappings for relational databases, which we illustrate using the FlyBase Chado database schema CE3 CE2 CE3 OWL-S based service composition of threedimensional geometry modeling 2012 Pacific Symposium on Biocomputing 2009, PSB 2009 2009 Pattern Recognition with Spatial Data Mining in Web: An Infrastructure to Engineering of the Urban Cadaster 2011 This paper proposes an OWL-S framework for distributed CAD system based on the combination of semantic web service and CAD technology. Service ontology mapping mechanism is analyzed in detail and semantic model is built with the study of the correlation across the geometry modeling service. On the purpose of accommodating the design pattern of network modeling, this framework supports the service composition of three- dimensional geometry modeling and achieves further integration of service information. At last, a case study from the developed prototype system shows the feasibility and flexibility of this method under distributed CAD environment. © 2012 Academy Publisher. The proceedings contain 51 papers. The topics discussed include: stochastic transient analysis of biochemical systems and its application to the design of biochemical logic gates In recent times are constant the problems of interoperability of data, mainly due to the constant emergence of different structures CAD/GIS (Computer Aided Design/Geographic Information Systems) produced by engineers, managers and other professionals through the fast development of collaborative technologies on the web. However, structures are also detected for manipulating objects that determine the cognitive domain of a problem, especially in the construction of urban or rural properties and land management. To this end, the study presents an investigation into the relevant aspects that influence in projects of engineering. It also investigates the demands for detecting predefined structures for agile actions and the exchange of experiences. Identifying factors critical to development and assisting in the recognition of integration structures. During the discussion are also presented the results extracted with the framework, providing web mapping applications through the implementation of collaborative strategies and combining the main techniques used in geographical data mining. Finally, the article discusses priority issues in the implementation of spatial data mining and the advancement of civil engineering technology for knowledge management. 209 Yu J., Cai H., Bu F., Liu A. Scopus [No author name available] Scopus de Moraes, A.F.; Bastos, L.C. IEEE CE2 Pattern-based core word recognition to support ontology matching 2013 CE3 PeptideMine - A webserver for the design of peptides for protein-peptide binding studies derived from protein-protein interactomes 2010 Ontology matching is a crucial issue in the domain of semantic web and data interoperability. In this paper, a core word based method for measuring similarity from the semantic level of ontology entities is described. In ontology, most labels of entities are compound words rather than single meaningful words. However, the main meaning is represented usually by one word of them, which is called core word. The core word is learned by investigating certain patterns, which are defined based on part of speech (POS) and linguistics knowledge. The other information is noted as complementary information. An algorithm is given to measure the similarity between a pair of compound words and short texts. In order to support diverse situation, especially when core words cannot be recognized, non semantic based ontology matching techniques are applied from lexical and structural level of ontology. The described method is tested on real ontology and benchmarking data sets. It showed good matching ability and obtained promising results. Background: Signal transduction events often involve transient, yet specific, interactions between structurally conserved protein domains and polypeptide sequences in target proteins. The identification and validation of these associating domains is crucial to understand signal transduction pathways that modulate different cellular or developmental processes. Bioinformatics strategies to extract and integrate information from diverse sources have been shown to facilitate the experimental design to understand complex biological events. These methods, primarily based on information from high-throughput experiments, have also led to the identification of new connections thus providing hypothetical models for cellular events. Such models, in turn, provide a framework for directing experimental efforts for validating the predicted molecular rationale for complex cellular processes. In this context, it is envisaged that the rational design of peptides for protein-peptide binding studies could substantially facilitate the experimental strategies to evaluate a predicted interaction. This rational design procedure involves the integration of protein-protein interaction data, gene ontology, physico-chemical calculations, domain-domain interaction data and information on functional sites or critical residues.Results: Here we describe an integrated approach called PeptideMine for the identification of peptides based on specific functional patterns present in the sequence of an interacting protein. This approach based on sequence searches in the interacting sequence space has been developed into a webserver, which can be used for the identification and analysis of peptides, peptide homologues or functional patterns from the interacting sequence space of a protein. To further facilitate experimental validation, the PeptideMine webserver also provides a list of physicochemical parameters corresponding to the peptide to determine the feasibility of using the peptide for in vitro biochemical or 210 Fuqi Song, Gregory Zacharewicz, Dav id Chen DBLP Shameer K., Madan L.L., Veeranna S., Gopal B., Sowdhamini R. Scopus biophysical studies.Conclusions: The strategy described here involves the integration of data and tools to identify potential interacting partners for a protein and design criteria for peptides based on desired biochemical properties. Alongside the search for interacting protein sequences using three different search programs, the server also provides the biochemical characteristics of candidate peptides to prune peptide sequences based on features that are most suited for a given experiment. The PeptideMine server is available at the URL: http://caps.ncbs.res.in/peptidemine. © 2010 Khader et al CE3 CE1 CE2 CE3 Predicting gene ontology functions from protein's regional surface structures 2007 Proceedings of 6th Asia-Pacific Bioinformatics Conference, APBC 2008 Proceedings of the 2010 IEEE International Conference on Progress in Informatics and Computing, PIC 2008 2010 Background: Annotation of protein functions is an important task in the post-genomic era. Most early approaches for this task exploit only the sequence or global structure information. However, protein surfaces are believed to be crucial to protein functions because they are the main interfaces to facilitate biological interactions. Recently, several databases related to structural surfaces, such as pockets and cavities, have been constructed with a comprehensive library of identified surface structures. For example, CASTp provides identification and measurements of surface accessible pockets as well as interior inaccessible cavities. Results: A novel method was proposed to predict the Gene Ontology (GO) functions of proteins from the pocket similarity network, which is constructed according to the structure similarities of pockets. The statistics of the networks were presented to explore the relationship between the similar pockets and GO functions of proteins. Crossvalidation experiments were conducted to evaluate the performance of the proposed method. Results and codes are available at: http://zhangroup.aporc.org/bioinfo/PSN/. Conclusion: The computational results demonstrate that the proposed method based on the pocket similarity network is effective and efficient for predicting GO functions of proteins in terms of both computational complexity and prediction accuracy. The proposed method revealed strong relationship between small surface patterns (or pockets) and GO functions, which can be further used to identify active sites or functional motifs. The high quality performance of the prediction method together with the statistics also indicates that pockets play essential roles in biological interactions or the GO functions. Moreover, in addition to pockets, the proposed network framework can also be used for adopting other protein spatial surface patterns to predict the protein functions. © 2007 Liu et al The proceedings contain 37 papers. The topics discussed include: string kernels with feature selection for SVM protein classification Liu Z.-P., Wu L.Y., Wang Y., Chen L., Zhang X.-S. Scopus [No author name available] Scopus The proceedings contain 279 papers. The topics discussed include: a simple robot paths planning based on Quadtree [No author name available] Scopus 211 2010 CE1 CE2 CE3 Proceedings of the 6th International Workshop on Ontology Matching, OM-2011 - In Conjunction with the International Semantic Web Conference, ISWC 2011 2011 The proceedings contain 41 papers. The topics discussed include: AROMA results for OAEI 2011 [No author name available] Scopus CE3 Product ontology screening and its application in variant design 2010 Yan C.-P., Zhou Q.-H., Fan H.-X., Liu F. Scopus CE3 Providing universal accessibility using connecting ontologies: A holistic approach 2007 Karim S., Latif K., Tjoa A.M. Scopus CE3 Research of semantic Web service discovery in heterogeneous environment 2011 A product ontology screening method which can be used in variant design is proposed. With the support of complete ontology view of product resources, the product functional requirement and structural characteristics are converted to demand constraints, which are used to screen product ontology. For different screening hierarchies and objects, different screening rules such as pattern matching, case matching combined with manual decision and auto matching on the basis of case-based reasoning are adopted. The semi-automatic screening method with human-computer cooperation has impressive effectiveness on the improvements of the accuracy of design schemes and the flexibility and efficiency of design process. Finally, a variant design supporting system for building door and window is developed, which proves the feasibility and effectiveness of the method. Accessibility implementation efforts are generally focused towards some typical user impairments and a few interaction devices for a particular user scenario. Whereas there are numerous factors in the prevalent context which can leverage the overall accessibility to its full potential, only if those are orchestrated together. In absence of a common and unifying approach the industry has little choice in abstaining from legacy and is therefore not very successful in producing universally accessible software. Exploiting enabling technology of Semantic Web, we present an approach by developing Connecting Ontologies for these different factors. Exemplars are developed to show its correctness and practicability. © SpringerVerlag Berlin Heidelberg 2007. When semantic Web service composition involved in heterogeneous environment, Web service discovery was a key technology to users' needs. This paper stands on the application background of mine information query system, based on the best matching bipartite graph, a Web service differentiation discovery algorithm was proposed in this paper, and performed semantic matching of different services by computing different Web services parameters in heterogeneous environments, and a classification algorithm instance was discussed too. 212 Xianmin Wei IEEE CE3 Research on concept semantic similarity computation based on ontology 2011 CE3 Research on knowledge model for ontology-based knowledge base 2011 CE3 Reservoir simulation and modeling based on artificial intelligence and data mining (AI&DM) 2011 The current concept semantic similarity calculation based on ontology does not take full advantage of the concept semantic information. In this paper we will present a new concept semantic similarity algorithm deviding the concept similarity into two parts: one is concept name similarity calculation, concept name degree and concept name edit distance calculation. The other is concept property similarity calculation, concept object property and data property calculation. Thus we obtain the actual similarity of the ontology concept according to an integrated analysis. The experimental results indicate that, compared with other similarity algorithms, this method can make full use of concept semantic information, and can obtain a better match result. The robust knowledge base needs a reasonable design pattern to represent knowledge model. On the foundation of the research about relationship of knowledge model with knowledge ontology, the knowledge model defined by three categories of domain knowledge, reasoning knowledge and task knowledge is set up. Furthermore, the matching relationship mechanism of knowledge model with knowledge base is put forward. At last, according to design pattern of knowledge model, the example of knowledge base for project risk management based on ontology is implemented. © 2011 IEEE. In this paper a new class of reservoir models that are developed based on the pattern recognition technologies collectively known as Artificial Intelligence and Data Mining (AI&DM) is introduced. The workflows developed based on this new class of reservoir simulation and modeling tools break new ground in modeling fluid flow through porous media by providing a completely new and different angle on reservoir simulation and modeling. The philosophy behind this modeling approach and its major commonalities and differences with numerical and analytical models are explored and two different categories of such models are explained. Details of this technology are presented using examples of most recent applications to several prolific reservoirs in the Middle East and in the Gulf of Mexico.AI-based Reservoir Models can be developed for green or brown fields. Since these models are developed based on spatio-temporal databases that are specifically developed for this purpose, they require the existence of a basic numerical reservoir simulator for the green fields while can be developed entirely based on historical data for brown fields. The run-time of AIbased Reservoir Models that provide complete field responses is measured in seconds rather than hours and days (even for a multi-million grid block reservoir). Therefore, providing means for fast track reservoir analysis and AI-assisted history matching are intrinsic characteristics of these models. AI-based Reservoir Models can, in some cases, completely substitute numerical reservoir simulation models, work side by side but completely independent or be integrated with them in order to increase their productivity.Advantages associated 213 Wen Yu; Gao Chun-ming; Pan Hua-wei IEEE Hao C. Scopus Mohaghegh S.D. Scopus with AI-based Reservoir Models are short development time, low development cost, fast track analysis and practical capability to quantify the uncertainties associated with the static model. AI-based Reservoir Model includes a novel design tool for comprehensive analysis of the full field and design of field development strategies to meet operational targets. They have open data requirement architecture that can accommodate a wide variety of data from pressure tests to seismic. © 2011 Elsevier B.V. CE1 CE2 CE3 Review of QSAR models for Enzyme classes of drug targets: Theoretical background and applications in parasites, hosts and other organisms 2010 CE3 Semantic mapping: ontology-based vs. model-based approach Alternative or complementary approaches? 2006 The number of protein 3D structures without function annotation in Protein Data Bank (PDB) has been steadily increased. Many of these proteins are relevant for Pharmaceutical Design because they may be enzymes of different classes that could become drug targets. This fact has led in turn to an increment of demand for theoretical models to give a quick characterization of these proteins. In this work, we present a review and discussion of Alignment-Free Methods (AFMs) for fast prediction of the Enzyme Classification (EC) number from structural patterns. We referred to both methods based on linear techniques such as Linear Discriminant Analysis (LDA) and/or non-linear models like Artificial Neural Networks (ANN) or Support Vector Machine (SVM) in order to compare linear vs. nonlinear classifiers. We also detected which of these models have been implemented as Web Servers free to the public and compiled a list of some of these websites. For instance, we reviewed the servers implemented at portal Bio-AIMS (http://miaja.tic.udc.es/BioAIMS/EnzClassPred.php) and the server EzyPred (http://www.csbio.sjtu.edu.cn/bioinf/EzyPre d/). © 2010 Bentham Science Publishers Ltd. Model transformation and semantic mapping are enabling technologies for new, advanced solutions to address enterprise software interoperability. Such technlogies are nowdays tackled by two different disciplines: software architectures, with the MDA approach, and semantic interoperability, with an ontology-based approach. This paper briefly compares the model-based (MB) and the ontology-based (OB) approaches and draws some preliminary conclusions on similarities and differences, in the perspective of combining these approaches in a value-adding way. 214 Concu R., Podda G., Ubeira F.M., Gonzalez-Diaz H. Scopus K. Arnarsdóttir, Arne -Jørgen Berre, Axel Hahn, Michele Missikoff, Frances co Taglino DBLP CE3 Sequencing and analysis of the generich space of cowpea 2008 Background: Cowpea, Vigna unguiculata (L.) Walp., is one of the most important food and forage legumes in the semi-arid tropics because of its drought tolerance and ability to grow on poor quality soils. Approximately 80% of cowpea production takes place in the dry savannahs of tropical West and Central Africa, mostly by poor subsistence farmers. Despite its economic and social importance in the developing world, cowpea remains to a large extent an underexploited crop. Among the major goals of cowpea breeding and improvement programs is the stacking of desirable agronomic traits, such as disease and pest resistance and response to abiotic stresses. Implementation of marker-assisted selection and breeding programs is severely limited by a paucity of trait-linked markers and a general lack of information on gene structure and organization. With a nuclear genome size estimated at 6̃ 20 Mb, the cowpea genome is an ideal target for reduced representation sequencing. Results: We report here the sequencing and analysis of the gene-rich, hypomethylated portion of the cowpea genome selectively cloned by methylation filtration (MF) technology. Over 250,000 gene-space sequence reads (GSRs) with an average length of 610 bp were generated, yielding ̃160 Mb of sequence information. The GSRs were assembled, annotated by BLAST homology searches of four public protein annotation databases and four plant proteomes (A. thaliana, M. truncatula, O. sativa, and P. trichocarpa), and analyzed using various domain and gene modeling tools. A total of 41,260 GSR assemblies and singletons were annotated, of which 19,786 have unique GenBank accession numbers. Within the GSR dataset, 29% of the sequences were annotated using the Arabidopsis Gene Ontology (GO) with the largest categories of assigned function being catalytic activity and metabolic processes, groups that include the majority of cellular enzymes and components of amino acid, carbohydrate and lipid metabolism. A total of 5,888 GSRs had homology to genes encoding transcription factors (TFs) and transcription associated factors (TAFs) representing about 5% of the total annotated sequences in the dataset. Sixty-two (62) of the 64 well-characterized plant transcription factor (TF) gene families are represented in the cowpea GSRs, and these families are of similar size and phylogenetic organization to those characterized in other plants. The cowpea GSRs also provides a rich source of genes involved in photoperiodic control, symbiosis, and defense-related responses. Comparisons to available databases revealed that about 74% of cowpea ESTs and 70% of all legume ESTs were represented in the GSR dataset. As approximately 12% of all GSRs contain an identifiable simplesequence repeat, the dataset is a powerful resource for the design of microsatellite markers. Conclusion: The availability of extensive publicly available genomic data for cowpea, a non-model legume with significant importance in the developing world, represents a significant step forward in legume research. Not only does the gene space sequence enable the detailed analysis 215 Timko M.P., Rushton P.J., Laudeman T.W., Bokowiec M.T., Chipumuro E., Cheung F., Town C.D., Chen X. Scopus of gene structure, gene family organization and phylogenetic relationships within cowpea, but it also facilitates the characterization of syntenic relationships with other cultivated and model legumes, and will contribute to determining patterns of chromosomal evolution in the Leguminosae. The micro and macrosyntenic relationships detected between cowpea and other cultivated and model legumes should simplify the identification of informative markers for marker-assisted trait selection and map-based gene isolation necessary for cowpea improvement. © 2008 Timko et al CE2 SMC '03 Conference Proceedings: 2003 IEEE International Conference on Systems, Man and Cybernetics 2003 Social Alignment for Preprocessing UserConstructed Ontologies 2007 This Volume 3 of 5 of the conference proceedings contains 165 papers. Topics discussed include image processing, visualization and decision support, control with soft computing, agents, ontologies and markup language, image editing, robotics, systems and control, intrusion detection and security, signal processing, human and machines, pattern matching and classifications, systems and control, rule based reasoning, behavioral information security, learning systems, hybrid techniques in machine learning and knowledge based systems, modeling, tools and innovations, theory and applications, modeling optimization and design of supply chains, data analysis and mining, Petri Nets and discrete event systems, neuro-fuzzy methods, pattern matching and classification, emerging technologies in medical mechatronics, learning control and non-traditional systems. User-constructed ontologies have caused some difficulties in being discriminated from other user-constructed ontologies. For efficiently annotating resources in their own repositories, people simply append ontology fragments retrieved from standard ontologies and from other neighbors' ontologies along to social links. In this paper, we propose a preprocessing method to extract preferential concepts for comparing with social semantics. In order to prune out irrelevant concepts from user-constructed ontologies, alignment-based concept classification process is designed by checking these two main criteria; i) redundancy (e.g., if there already exist semantically identical concepts), and ii) tendency (e.g., if there exist semantically declined concepts). Finally, we want to show an application scenario to demonstrate our contributions. 216 [No author name available] Scopus Jung, J.J.; HongGee Kim IEEE CI1 CE3 Story extraction from the Web: A case study in security informatics 2010 CI1 CE3 Systemic Approach Towards Enterprise Functional Decomposition 2011 CE3 Talea: An ontologybased framework for ebusiness applications development 2005 CE3 Template-Based Adaptation of Semantic Web Services with Model-Driven Engineering 2010 CI1 Open source intelligence is becoming more and more important in security-related applications. Effective extraction of valuable information from these intelligence sources so as to understand the content of intelligence is one of the central issues in security domain. To address this key problem, this paper studies how to extract domain events and generate story representation of the events. We implement a story extraction platform (SEP) which applies pattern matching to extract events from Web news and organizes events based on theme using narrative structure. We also design extraction rules, use domain-specific features and employ ontology to facilitate story extraction in SEP. The experimental results show the effectiveness of our system in security informatics. Functional decomposition is the primary component of enterprise activities description and is often associated with business process architecture. It guides any business improvement initiative, enables to design the enterprise construction organizational structure, IT- and HRarchitectures, etc, as well as to deploy goals and strategies. The paper suggests the framework for enterprise functional decomposition, which includes the ontology for enterprise activities description, foundations and the process of functional decomposition. The suggested framework integrates the following features: alignment with goals decomposition, support for reference models and other reusable activities descriptions, recursive decomposition using a single activities pattern, value-based management and ISO 9004:2009 harmonization. The paper also describes framework implementation at Russian enterprises and IT tool to support the approach. In this paper we present Talea, a platform aimed at supporting the development of web-based e-business applications. Talea supports a flexible matching between service provision and request. The platform can be easily customized thanks to XML-based communication, Semantic Web technologies, and the exploitation of a generator/performer design pattern which greatly simplifies the task of adding new functionality. Moreover, Talea provides multidevice access to both service providers and final users. An ontological description of the application domain, expressed in RDF/RDFS format, is exploited in order to facilitate the customization and to provide personalized navigation as well as semanticbased search. The ontology-driven personalized navigation is particularly useful for limited display devices (like smartphones or PDAs), since it reduces the amount of information displayed. A first evaluation of the current prototype is planned with a restricted number of users and will be carried on by the Local Tourist Organization. Service-oriented enterprise systems, which tend to be heterogeneous, loosely coupled, long-lived, and continuously running, have to cope with frequent changes to their requirements and the environment. In order to address such changes, applications need to 217 Ansheng Ge; Wenji Mao; Daniel Zeng IEEE Kudryavtsev, D.; Grigoriev, L. IEEE Levi G., Vagliengo A., Goy A. Staikopoulos, A.; Cliffe, O.; Popescu, R.; Padget, J.; Clarke, S. Scopus IEEE CE3 Testing the Impact of Pattern-based Ontology Refactoring on Ontology Matching Results 2008 Text analysis for constructing design representations 1997 be inherently flexible and adaptive, supported by appropriate infrastructures. In this paper, we propose a model-driven approach for the dynamic adaptation of Web services based on ontology-aware service templates. Model-driven engineering raises the level of abstraction from concrete Web service implementations to high-level service models, which leads to more flexible and automated adaptations through template designs and transformations. The ontological semantics enhances the service matching capabilities required by the dynamic adaptation process. Service templates are based on OWL-S descriptions and provide the necessary means to capture and parameterize specific behavior patterns of service models. In this paper, we apply our approach in the context of the EU-funded ALIVE project and illustrate, as an example, how the proposed framework supports the adaptation of the authentication mechanism used by an interactive tourist recommendation system. We observe the impact of ontology refactoring, based on detection of name patterns in the ontology structure, on the results of ontology matching. Results of our experiment are evaluated using novel logicbased measures accompanied by an analysis of typical effects. Although the pattern detection method only covers a fraction of ontological errors, there seems to be a measurable effect on the quality of the resulting matching. An emerging model in concurrent product design and manufacturing is the federation of workgroups across traditional functional 'silos'. Along with the benefits of this concurrency comes the complexity of sharing and accessing design information. The primary challenge in sharing design information across functional workgroups lies in reducing the complex expressions of associations between design elements. Collaborative design systems have addressed this problem from the perspective of formalizing a shared ontology or product model. We share the perspective that the design model and ontology are an expression of the 'meaning' of the design and provide a means by which information sharing in design may be achieved. However, in many design cases, formalizing an ontology before the design begins, establishing the knowledge sharing agreements or mapping out the design hierarchy is potentially more expensive than the design itself. This paper introduces a technique for inducing a representation of the design based upon the syntactic patterns contained in the corpus of design documents. The association between the design and the representation for the design is captured by basing the representation on terminological patterns at the design text. In the first stage, we create a 'dictionary' of noun-phrases found in the text corpus based upon a measurement of the content carrying power of the phrase. In the 218 Ondrej SvábZamazal, Vojtech Svátek, Christian Meilicke, Heiner Stuckenschmidt DBLP Dong A., Agogino A.M. Scopus second stage, we cluster the words to discover inter-term dependencies and build a Bayesian belief network which describes a conceptual hierarchy specific to the domain of the design. We integrate the design document learning system with an agentbased collaborative design system for fetching design information based on our 'smart drawings' paradigm. © 1996 Kluwer Academic Publishers. Published by Elsevier Science Ltd. All rights reserved. CE3 The design and optimization of a storage model for distributed ontology repositories 2010 CE3 The design of computer simulation experiments of complex adaptive social systems for risk based analysis of intervention strategies 2012 Oriented to how to establish distributed ontology repositories efficiently to support semantic interaction among different users though the Internet, at the beginning, the paper reviews some semantic interoperation platforms based on ontology repositories to extract the common architecture of this kind of system, which helps to define the role of distributed ontology repositories in the whole system. A storage model for distributed ontology repositories is presented. According to the model, the method for making mapping between network ontology repositories and local repositories is discussed, and the encoding mechanism for semantic entities is explained. Then, the principles of the instruction dissemination controller and the data evolution controller are analyzed in detail. Finally, based on the experiment, it is validated that data transfer in network contributes much less to time cost than query itself in the cluster storage pattern, which presents the base for optimizing the retrieval efficiency in distributed ontologies repositories, namely, the optimization for the efficiency of data retrieval in ontologies repositories can be achieved by adopting the distributed cluster storage. The storage model has been applied to the project of the software for ambient semantic interoperable service (STASIS). Computational social science, as with all complex adaptive systems sciences, involves a great amount of uncertainty on several fronts, including intrinsic arbitrariness such as that due to path dependence, disagreement on social theory and how to capture it in software, input data of different credibility that does not exactly match the requirements of software because it was gathered for another purpose, and inexactly matching translations between models that were designed for different purposes than the study at hand. This paper presents a method of formally tracking that uncertainty, keeping the data input parameters proportionate with logical and probabilistic constraints, and capturing proportionate dynamics of the output ordered by the decision points of policy change, for the purpose of risk-based analysis. Once ordered this way, the data can be compared to other data similarly expressed, whether that data is from simulation excursions or from the real world, for objective comparison and distance scoring at the level of dynamic patterns as opposed to single outcome validation. This 219 Guo J., Fan Y., Di X. Scopus Duong D.V. Scopus CE1 CE2 CE3 The Semantic Web, ISWC 2005 - 4th International Semantic Web Conference, ISWC 2005, Proceedings The Semantic Web, ISWC 2009 - 8th International Semantic Web Conference, ISWC 2009, Proceedings The Semantic Web: 6th International Semantic Web Conference - 2nd Asian Semantic Web Conference, ISWC 2007 + ASWC 2007, Proceedings 2005 The use of Library of Congress Subject Headings in digital collections method enables wargame adjudicators to be run out with data gleaned from the wargame, enables data to be repurposed for both training and testing set, and facilitates objective validation scoring through soft matching. Artificial intelligence tools used in the method include probabilistic ontologies with crisp and Bayesian inference, game trees that are multiplayer non-zero sum and decision point based rather than turn-based, and Markov processes to represent the dynamic data and align the models for objective comparison. Copyright © 2011, Association for the Advancement of Artificial Intelligence. All rights reserved. The proceedings contain 77 papers. The topics discussed include: using the semantic web for e-science: inspiration, incubation, irritation [No author name available] Scopus 2009 The proceedings contain 66 papers. The topics discussed include: queries to hybrid MKNF knowledge bases through oracular tabling [No author name available] Scopus 2007 The proceedings contain 76 papers. The topics discussed include: enabling advanced and context-dependent access control in RDF stores [No author name available] Scopus 2011 Purpose: This paper attempts to explain the wide dissemination of Library of Congress Subject Headings (LCSH) within digital libraries and presents some of the advantages and disadvantages of using this controlled vocabulary in digital collections. The paper also presents other classifications used in digital collections for subject access and explores ways of improving search functionality in digital collections that employ LCSH. Design/methodology/approach: Unlike traditional libraries that use Library of Congress Classification for organization and retrieval, digital libraries use metadata forms for organization and retrieval. The collections exist in cyberspace of the internet which is known for containing the universe of knowledge. The use of LCSH for information retrieval has been widely criticized for its difficulty of use and its information retrieval effectiveness in online environments. The Library of Congress (LOC) has claimed the headings were not based on comprehensive principles nor ever intended to cover the universe of knowledge. Despite these claims and criticisms, LCSH is the most popular choice for subject access in digital libraries. Findings: The number of digital collections increases every year and LCSH is still the most popular choice of controlled vocabulary for subject access. Of the numerous criticisms, difficulties of use and user unfamiliarity are the greatest disadvantages of using LCSH for subject access. Average users only have a vague notion of what they are looking for when initializing a search. More work is required in automated generation of subject headings and increased usage of LCSH in faceted Walsh J. Scopus 220 CI1 CI2 CI3 CI4 Towards correspondence patterns for ontology mediation 2007 CI1 CI2 CI3 CI4 Towards design patterns for ontology alignment 2008 Towards the formalization of interaction semantics 2010 CE3 search retrieval systems. This will provide users with better access to the LCSH used in the back end of information retrieval. Originality/value: The Greek researchers who developed the Dissertation DSPace system believe this type of module will eventually replace the traditional keywordbased indexing back ends employed by many information retrieval modules within current digital library systems. The system offers the type of access and interactivity that will acquaint users with how LCSH looks and is used. Faceted search and automated pattern matching using an ontology based on LCSH have the best promise of overcoming the disadvantages that have always plagued the LOCcontrolled vocabulary. These retrieval techniques give LCSH an opportunity to finally achieve the optimal precision and recall it has so far failed to deliver. © Emerald Group Publishing Limited. We introduce in this paper correspondence patterns as a tool to design ontology alignments. Based on existing research on patterns in the fields of software and ontology engineering, we define a pattern template and use it to develop a correspondence patterns library. This library is published in RDF following a structured vocabulary. It is meant to be used in ontology alignment systems, in order to support the user or improve matching algorithms to refine ontology alignments. Aligning ontologies is a crucial and tedious task. Matching algorithms and tools provide support to facilitate the task of the user in defining correspondences between ontologies entities. However, automatic matching is actually limited to the detection of simple one to one correspondences to be further refined by the user. We propose in this paper the use of correspondence patterns as a tool to assist the design of ontology alignments. Based on existing research on patterns in the fields of software and ontology engineering, we propose a pattern template as an helper to develop a correspondence patterns library. We give ways towards the representation of patterns using an appropriate correspondence representation formalism: the Alignment Ontology. Copyright 2008 ACM. With the advent of Web 2.0 and the emergence of improved technologies to enhance UI, the importance of user experience and intuitiveness of Web interfaces led to the growth and success of Interaction Design. Web designers often turn to pre-defined and well-founded design patterns and user interaction paradigms to build novel and more effective Web interfaces. The rational behind Interaction Design patterns is based on user behavior and Web navigation studies. The semantics of user interaction is therefore a rich and interesting area that is worth exploring in association with traditional Semantic Web approaches. In this paper, we present our first attempts of an ontological formalization of interaction patterns and its implications. To prove our concept, we illustrate the mapping approach we employed to put in relation that interaction formalization with data-specific ontologies, to create Web 221 Scharffe F., Ding Y., Fensel D. Scopus Scharffe F., Euzenat J., Fensel D. Scopus Celino I., Corcoglioniti F. Scopus interfaces to browse and navigate that specialized kind of information CE3 Tree pattern matching in phylogenetic trees: automatic search for orthologs or paralogs in homologous gene sequence databases 2005 Motivation: Comparative sequence analysis is widely used to study genome function and evolution. This approach first requires the identification of homologous genes and then the interpretation of their homology relationships (orthology or paralogy). To provide help in this complex task, we developed three databases of homologous genes containing sequences, multiple alignments and phylogenetic trees: HOBACGEN, HOVERGEN and HOGENOM. In this paper, we present two new tools for automating the search for orthologs or paralogs in these databases. Results: First, we have developed and implemented an algorithm to infer speciation and duplication events by comparison of gene and species trees (tree reconciliation). Second, we have developed a general method to search in our databases the gene families for which the tree topology matches a peculiar tree pattern. This algorithm of unordered tree pattern matching has been implemented in the FamFetch graphical interface. With the help of a graphical editor, the user can specify the topology of the tree pattern, and set constraints on its nodes and leaves. Then, this pattern is compared with all the phylogenetic trees of the database, to retrieve the families in which one or several occurrences of this pattern are found. By specifying ad hoc patterns, it is therefore possible to identify orthologs in our databases. Availability: The tree reconciliation program and the FamFetch interface are available from the Pôle Bioinformatique Lyonnais Web server at the following addresses: http://pbil.univlyon1.fr/software/RAP/RAP.htm and http://pbil.univlyon1.fr/software/famfetch.html 222 Jean-François Dufayard, Laurent Duret, Simon Penel, Manolo Gouy, François Rechenmann, Guy Perrière DBLP CE3 Using ontology reasoning for reverse engineering design patterns 2010 CE3 Using restricted natural language for geometric construction 2012 CE1 CE2 CE3 Work in progress: Transitioning from novice to expert software engineers through design patterns: Is it really working? 2012 Capturing design knowledge in large software systems reduces the complexity of understanding and reusing these systems. Model Driven Engineering (MDE) is seen by many as the new trend to cope with software complexity. MDE promotes the notion of modeling and model transformations in model-driven development. In this paper, we propose an approach that utilizes ontological modeling and reasoning for recovering design pattern information from source code. We thus provide a formal representation of the conceptual knowledge found in source code and match it to similar representation of design patterns. This proper matching is the basis for applying semantic reasoning to infer design pattern instances. We have tested our approach on multiple open source application frameworks. The results we obtained are promising and show an improvement in terms of recall and precision. © Springer-Verlag Berlin Heidelberg 2010. Human-Computer Interaction is crucial for Instructional Software. It is significant to make Geometry Instructional Software understand geometric proposition described by natural language and construct geometric Figura automatically. However, it is difficult for computer to accurately understand the flexible and variable geometric proposition because of the immaturity of Natural Language Processing Technology. This paper defines a restricted geometric proposition, presents a corresponding comprehension model based on ontology, and designs a matching algorithm for geometric relation pattern, finally transforms the restricted geometric proposition to geometric construction command sequence. The experiment results suggest that the average accuracy of understanding clauses of geometric proposition is almost to 88.9%, and the percentage of constructing correct geometric Figura is to 82.5%. Since their wide adoption by the software engineering community in the mid-90's, design patterns have become an important educational component in the training of novice software engineers due to the common belief that, as distilled experience of seasoned software designers, they can transform novice software engineers into skilled professionals in a relatively short time frame. This paper questions the validity of this commonly-held belief about the educational value of conventional patterns, arguing that although there is tremendous value in capturing and disseminating software engineering experience in the form of patterns, conventional design patterns cannot deliver on this expectation to significantly shorten the experience growth curve. We report initial results from an ongoing research project that aims to not only identify the difficulties in using conventional patterns as educational means for novices, but also to use such insights to develop new forms of patterns to help educators and experts to more effectively communicate and transfer their software engineering knowledge, experience, and understanding of best practices to novices. 223 Alnusair A., Zhao T. Scopus Liu Q.-T., Huang H., Wu L.-J. Scopus Ghazarian, A. IEEE AUTOMS-F: A java framework for synthesizing ontology mapping methods 2007 Although ontologies promise an effective technology for information integration, it is often the case that two or more information providers do not share the same ontology. Several (semi)-automated ontology mapping methods have been developed towards solving this problem. This paper presents AUTOMS-F, a framework implemented as a Java API, which aims to facilitate the rapid development of tools for automatic mapping of ontologies by synthesizing several individual ontology mapping methods. Towards this goal, AUTOMS-F provides a highly extensible and customizable application programming interface. AUTOMS is a case study ontology mapping tool that has been implemented using the AUTOMS-F framework, and has been successfully evaluated in the international OAEI 2006 contest. 224 Alexandros G. Valarakos , Vassilis Spiliopoulos , Konstantinos Kotis , George Vouros Manual 225