Anais do IX Workshop de Teses e Dissertações em
Transcrição
Anais do IX Workshop de Teses e Dissertações em
XII Simpósio Brasileiro de Sistemas de Informação Anais do IX Workshop de Teses e Dissertações em Sistemas de Informação Castelmar Hotel – Florianópolis/SC – 17 a 20 de maio de 2016 Promoção Organização Patrocínio Apoio IX Workshop de Teses e Dissertações em Sistemas de Informação (WTDSI) Evento integrante do XII Simpósio Brasileiro de Sistemas de Informação De 17 a 20 de maio de 2016 Florianópolis – SC ANAIS Sociedade Brasileira de Computação – SBC Organizadores Carina Friedrich Dorneles Marco Antônio Pereira Araújo Frank Augusto Siqueira Patrícia Vilain Realização INE/UFSC – Departamento de Informática e Estatística/ Universidade Federal de Santa Catarina Promoção Sociedade Brasileira de Computação – SBC Patrocínio Institucional CAPES – Coordenação de Aperfeiçoamento de Pessoal de Nível Superior CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico FAPESC - Fundação de Amparo à Pesquisa e Inovação do Estado de Santa Catarina Catalogação na fonte pela Biblioteca Universitária da Universidade Federal de Santa Catarina W926a Workshop de Teses e Dissertações em Sistemas de Informação (9. : 2016 : Florianópolis, SC) Anais [do] IX Workshop de Teses e Dissertações em Sistemas de Informação [recurso eletrônico] / Organizadores Carina Friedrich Dorneles ...[et al.] ; realização Departamento de Informática e Estatística/UFSC ; promoção: Sociedade Brasileira de Computação. – Florianópolis : UFSC/Departamento de Informática e Estatística, 2016. 1 e-book Evento integrante do XII Simpósio Brasileiro de Sistemas de Informação Disponível em: http://sbsi2016.ufsc.br/anais/ Evento realizado em Florianópolis de 17 a 20 de maio de 2016. ISBN 978-85-7669-320-8 1. Sistemas de recuperação da informação – Congressos. 2. Tecnologia – Serviços de informação – Congressos. 3. Internet na administração pública – Congressos. I. Dorneles, Carina Friedrich. II. Universidade Federal de Santa Catarina. Departamento de Informática e Estatística. III. Sociedade Brasileira de Computação. IV. Título. CDU: 004.65 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 III WTDSI IX Workshop de Teses e Dissertações em Sistemas de Informação (WTDSI) Evento integrante do XII Simpósio Brasileiro de Sistemas de Informação (SBSI) 17 a 20 de Maio de 2016 Florianópolis, Santa Catarina, Brazil. Comitês Coordenação Geral do SBSI 2016 Frank Augusto Siqueira (UFSC) Patrícia Vilain (UFSC) Coordenação do Comitê de Programa do WTDSI 2016 Carina Friedrich Dorneles (UFSC) Marco Antônio Pereira Araújo (UFJF) Comissão Especial de Sistemas de Informação Clodis Boscarioli (UNIOESTE) Sean Siqueira (UNIRIO) Bruno Bogaz Zarpelão (UEL) Fernanda Baião (UNIRIO) Renata Araujo (UNIRIO) Sérgio T. de Carvalho (UFG) Valdemar Graciano Neto (UFG) Comitê de Programa Científico do WTDSI 2016 Alcione Oliveira (UFV) André da Silva (IFSP - Hortolândia) Andrea Magdaleno (UNIRIO) Bruno Gadelha (UFAM) Carina F. Dorneles (UFSC) Carlos Vitor de Alencar Carvalho (UEZO) Celia Ralha (UnB) Claudia Cappelli (UNIRIO) Clodis Boscarioli (Unioeste) Cristiano Cervi (UPF) Cristiano Maciel (UFMT) Daniel Kaster (UEL) Daniela Barreiro Claro (UFBA) Deise Saccol (UFSM) Eduardo Borges (FURG) Fernanda Campos (UFJF) Glauco Carneiro (UNIFACS) Gustavo Semaan (UFF) Heitor Costa (UFLA) Janaina Veiga (CEFET-RJ) José Maria David (UFJF) Marcelo Santos (IF Sudeste MG) Marcelo Schots (UERJ) Marco Antônio Araújo (UFJF/IF Sudeste MG) Regina Braga (UFJF) Renata Araújo (UNIRIO) Renata Galante (UFRGS) Rita Suzana Pitangueira Maciel (UFBA) Sandro Fernandes (IF Sudeste MG) Valéria C. Times (UFPE) Vaninha Vieira (UFBA) Victor Stroele (UFJF) Wander Gaspar (IF Sudeste MG) Revisor Rodrigo Gonçalves (UFSC) iv IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Realização INE/UFSC – Departamento de Informática e Estatística/ Universidade Federal de Santa Catarina Promoção SBC – Sociedade Brasileira de Computação Patrocínio CAPES – Coordenação de Aperfeiçoamento de Pessoal de Nível Superior CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico FAPESC - Fundação de Amparo à Pesquisa e Inovação do Estado de Santa Catarina FAPEU - Fundação de Amparo à Pesquisa e Extensão Universitária Apoio Centro Tecnológico - UFSC Pixel Empresa júnior - UFSC v IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Apresentação O Workshop de Teses e Dissertações em Sistemas de Informação (WTDSI), realizado tradicionalmente em conjunto com XII Simpósio Brasileiro de Sistemas de Informação (SBSI), é um fórum dedicado à apresentação e discussão de trabalhos de mestrado e de doutorado em Sistemas de Informação (SI) desenvolvidos nos programas de pós-graduação no Brasil. O seu objetivo é propiciar um ambiente profícuo para discussões, em que os alunos possam receber avaliações construtivas de seus trabalhos por pesquisadores experientes em SI e ter acesso a um panorama representativo da pesquisa em SI no país. Os principais objetivos deste fórum são: (i) contribuir para o enriquecimento, maturidade e lapidação dos trabalhos de estudantes de Pós-Graduação em SI; (ii) estimular a integração e cooperação de pesquisadores da área; (iii) dar maior visibilidade às pesquisas em andamento, tanto para a comunidade acadêmica quanto para institutos de pesquisa que vêm se estabelecendo no país; e (iv) estimular a identificação de oportunidades de aplicação das propostas apresentadas nas organizações. Em sua nona edição, o WTDSI teve um total de 42 submissões, sendo 16 delas aceitas para apresentação, resultando numa taxa de aceitação de 38%. Dentre as 16 submissões aceitas, foram selecionadas para apresentação 13 propostas de dissertação de mestrado. Cada submissão foi avaliada por, no mínimo, três revisores. Os trabalhos selecionados apresentam um panorama da pesquisa nos programas de pós-graduação em SI no Brasil, envolvendo temas e problemáticas atuais e relevantes, que foram divididas nas seguintes seções de apresentação: Paradigmas de Desenvolvimento de Sistemas de Informação, Sistemas de Informação para Governo, Sistemas de Informação Inteligentes, Gestão de Processos e Gerenciamento de Projetos. Dos 42 artigos submetidos, 50% são oriundos de Universidades do Sudeste do país, 35,7% são de Universidades do Nordeste do país e 14,3% do Sul do Brasil. Dentre os 16 artigos aceitos, 62,5% são do Sudeste, 31,25% do Nordeste e 6,2% do Sul do país. A coordenação agradece aos autores dos trabalhos e seus orientadores, por prestigiarem o WTDSI 2016; aos membros do comitê de programa, pelo tempo dedicado e pelas valiosas contribuições sugeridas aos autores; e à organização geral do SBSI, por todo o suporte oferecido. Que o WTDSI 2016 seja uma ótima oportunidade de colaboração, com excelentes ideias para discussões. Aproveitem! Florianópolis, Maio de 2016. Carina Friedrich Dorneles (UFSC) e Marco Antônio Pereira Araújo (UFJF) Coordenação do WTDSI 2016 vi IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Biografia dos Coordenadores do Comitê de Programa do WTDSI 2016 Carina Friedrich Dorneles é professora do Departamento de Informática e Estatística da Universidade Federal de Santa Catarina (INE/UFSC) onde atua como pesquisadora, professora e orientadora nos níveis de IC, graduação, mestrado e doutorado. Atualmente, atua como Coordenadora do Programa de Pós-Graduação em Computação da UFSC, Coordenadora do Concurso de Iniciação Científica da SBC e Coordenadora do Workshop de Teses e Dissertações de Sistemas de Informação do SBSI/SBC. Atuou no Comitê Especial de Avaliação da FAPERGS em 2016. Concluiu seu doutorado em Ciência da Computação e, 2006, e mestrado em 2000, pela Universidade Federal do Rio Grande do Sul (UFRGS). Durante o período de doutorado, realizou estágio sanduíche na University of Washington, Seattle, EUA. Seus interesses de pesquisa envolvem Gerenciamento de Dados, Recuperação de Informação e Mineração de Dados com ênfase na Web. Coordena e participa de projetos de pesquisa na área, com publicações científicas em periódicos e anais de conferência de boa qualidade. Participa também como membro de comitês técnicos de programa conferências e workshops realizados no Brasil e no exterior. Atuou como membro do Comitê de Educação da Sociedade Brasileira de Computação entre 2013-2015 e como Coordenadora de Fomento e Apoio à Pesquisa na Pró-Reitoria de Pesquisa da UFSC no período de 2012-2013. Em 2005, foi co-idealizadora da Escola Regional de Banco de Dados, e da Sessão de Demos do Simpósio de Banco de Dados. Atua como Editora da Coluna Bits, Bytes e Batom da revista eletrônica SBC Horizontes. Marco Antônio Pereira Araújo é Doutor (2009) e Mestre (1998) em Engenharia de Sistemas e Computação pela COPPE/UFRJ. Especialista em Métodos Estatísticos Computacionais (2006) e Bacharel em Matemática com Habilitação em Informática (1993) pela UFJF. Professor Adjunto da Universidade Federal de Juiz de Fora. Professor do Instituto Federal de Educação, Ciência e Tecnologia do Sudeste de Minas Gerais - Campus Juiz de Fora. Professor do curso de Bacharelado em Sistemas de Informação do CES/JF, da FMG e da USS. Professor do curso de Bacharelado em Ciência da Computação da FAGOC. Editor da Engenharia de Software Magazine e da Infra Magazine. Avaliador de cursos de graduação em Computação do INEP/MEC. vii IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Artigos Técnicos ST1 - Paradigmas de Desenvolvimento de SI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Uma abordagem para identificar erros estruturais em SOS modelados em BPMN utilizando π-ADL . . . . . . . . . . . . . . . . 1 Leila de Carvalho Costa (UFBA), Rita Suzana Pitangueira Maciel (UFBA), Adolfo Almeida Duran Towards an Approach to Foster Simplicity in Agile Software Development Projects . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Wylliams Santos (UFPE), Hermano Moura (UFPE) SMartyMetrics: um Framework de Métricas de Apoio à Avaliação de Arquiteturas de Linha de Produto de Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 André Felipe Ribeiro Cordeiro (UEM), Edson Oliveira Jr (UEM) Técnicas de Desenvolvimento Orientado a Modelos no Domínio de Robótica e Robôs Sociais . . . . . . . . . . . . . . . . . . . . . . . 11 Tiago Heineck (UFPE), Jaelson Castro (UFPE), Enyo Gonçalves (UFPE) ST2 - SI para Governo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Identificação Automática de Produtos e suas Características em Grandes Volumes de Dados Não Estruturados: Uma Proposta para Portais de Transparência Pública . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Eduardo de Paiva (UNIRIO), Kate Revoredo (UNIRIO) Jogos Digitais Para Participação Cidadã em Processos de Prestação de Serviços Públicos . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Tadeu M. de Classe (UNIRIO), Renata Araujo (UNIRIO) Um Método de Elicitação de Requisitos para Ambientes Virtuais de Participação Social . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Jonas Silva (UNIRIO), Renata Araujo (UNIRIO) Aplicando Grounded Theory para compreender as dificuldades de Planejamento de TI em Órgãos Federais . . . . . . . . 24 Plínio Antunes Garcia (UFPE), Vinicius Cardoso Garcia (UFPE) ST3 - SI Inteligentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Estudo da Representação de Dados para Segmentação das Fases do Gesto usando Aprendizado de Máquina . . . . . . . . 27 Ricardo A. Feitosa (USP), Sarajane M. Peres (USP), Clodoaldo A.M. Lima (USP) Alinhamento Interativo de Ontologias usando Anti-Padrões de Alinhamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Jomar da Silva (UNIRIO), Fernanda Araujo Baião (UNIRIO), Kate Revoredo (UNIRIO) Análise das fases do gesto: a influência do contexto na execução das fases e na indução de modelos de aprendizado de máquina supervisionado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 Jallysson M. Rocha (USP), Sarajane M. Peres (USP), Clodoaldo A.M. Lima (USP) Fusão de Face e Forma de Andar para Reconhecimento Biométrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 Edenilton L. Oliveira (USP), Clodoaldo A.M. Lima (USP), Sarajane M. Peres (USP) viii IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 ST4 - Gestão de Processos e Gerenciamento de projetos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Metas Estratégicas Organizacionais como base para Modelagem de Requisitos não Funcionais de Processos de Negócio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Adson do Carmo (USP), Marcelo Fantinato (USP) Uma Plataforma para Análise e Recomendação de Modelos de Processos Intensivos em Conhecimento . . . . . . . . . . . . . 42 Pedro Henrique Piccoli Richetti (UNIRIO), Fernanda Araujo Baião (UNIRIO) Project management best practices for cyber-physical system development . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 Filipe Palma (USP), Marcelo Fantinato (USP) A Recommendation System of Reuse Opportunities based on Lexical Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Johnatan Oliveira (UFMG), Eduardo Figueiredo (UFMG) Index of Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 ix IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Uma abordagem para identificar erros estruturais em SOS modelados em BPMN utilizando Pi-ADL Alternative Title: An approach for detecting structural errors in SOS modeled as BPMN using Pi-ADL Leila de Carvalho Costa Universidade Federal da Bahia Salvador, Bahia [email protected] Rita Suzana Pitangueira Maciel Universidade Federal da Bahia Salvador, Bahia Adolfo Almeida Duran Universidade Federal da Bahia Salvador, Bahia [email protected] [email protected] RESUMO Categories and Subject Descriptors Sistema de Sistemas (SOS) é um conjunto de sistemas independentes e interdependentes funcionando em conjunto para alcançar um objetivo comum. A Business Process Modeling Notation (BPMN) é um padrão para modelar fluxos de processos de negócio. A BPMN em SOS coordena e sincroniza processos de negócios que pertencem a este conjunto. Nos modelos escritos nessa notação podem ocorrer erros estruturais, como deadlocks e livelocks, que no decorrer da execução ocasionam o funcionamento inadequado dos processos de um SOS. A ausência de uma semântica formal desses modelos torna mais difı́cil a identificação desses erros. Neste trabalho, propomos uma abordagem baseada na Linguagem formal π-ADL para detectar erros estruturais em porcessos de um SOS modelados em BPMN. C.4 [Performance of Systems]: Modeling techniques ; D.2.11 [Software Engineering]: Software Architectures—Languages (e.g., description, interconnection, definition); F.4.3 [Mathematical Logic and Formal Languages]: Formal Languages—Algebraic language theory General Terms Software Engineering Keywords SOS, System of Systems, BPMN, Business Process Modeling, π-ADL, deadlocks, livelocks. 1. Palavras-Chave INTRODUÇÃO Um sistema de sistemas (SOS) [5, 3] pode ser considerado como uma composição de outros sistemas complexos e independentes, que interagem entre si para atingir um objetivo comum. Estes sistemas são selecionados e compostos possivelmente em tempo de execução para formar um sistema mais complexo [1]. Buscando facilitar sua utilização e entendimento, existem várias formas e notações para se modelar processos de um SOS, dentre elas está a Business Process Modeling Notation (BPMN) [10]. A BPMN em SOS é utilizada para coordenar e sincronizar processos de negócios automatizados e ajudam a descrever os sistemas, produtos, layout de serviços interno e a sua posição em relação um ao outro [4]. Business Process Modeling Notation (BPMN) surgiu como uma notação padrão para expressar os modelos de processos de negócios, mas a falta de uma semântica formal corrobora para a perpetuação de erros de sintaxe e estruturais [2] que fazem o modelo de processo de negócios parar de funcionar corretamente. Enquanto erros de sintaxe exigem menos esforços para serem verificados, os erros estruturais normalmente precisam de uma análise complexa para encontrá-los. A fim de verificar a estabilidade dos Sistemas de Sistemas modelados utilizando BPMN, temos que verificar todas as combinações possı́veis de cadeias de processo, o que nos permite revelar erros de projeto que podem deteriorar a operação. Para isso testaremos um modelo formal, baseado na linguagem formal π-ADL, que foi especialmente concebida para especificar arquiteturas dinâmicas. Neste SOS, Sistema de Sistemas, BPMN, Modelagem de Processos de Negócio, π-ADL, deadlocks, livelocks. ABSTRACT System of Systems (SOS) is a set of independents and interdependents systems working together to achieve a common goal. The Business Process Modeling Notation (BPMN) is a standard to model business process flow. The BPMN in SOS coordinates and synchronizes business processes that belongs to this set. In models written in the notation may occur structural errors such as deadlock and livelock, which causes the improper working of the processes of SOS during the execution. The absence of formal semantics of these models makes the identification of these errors more difficult. In this paper, we propose an approach based in the π-ADL formal language for detecting structural errors in SOS modeled as BPMN. Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, to republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2016, May 17th-20th, 2016, Florianópolis, Santa Catarina, Brazil Copyright SBC 2016. 1 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 trabalho, propomos uma semântica formal para verificar o modelo BPMN em tempo de design e auxiliar a identificação e a correção de livelocks e deadlocks que possam ocorrer em tempo de execução. O restante deste artigo está organizado da seguinte forma. Seção 2 apresentamos o problema e na Seção 3 a solução proposta para resolver o problema em questão. Seção 4 descreve o projeto para de avaliação da solução. Na seção 5, relatamos as atividades já realizadas. Para concluir, resumimos, na seção 6, as principais contribuições deste artigo. 2. Essas interações são feitas através de trocas de mensagens entre os processos do sistema. Apesar das diferenças citadas, o diagrama de coreografia possui as mesmas deficiências do diagrama de orquestração, como a possibilidade de ocultar erros estruturais, que podem ocorrer em tempo de execução, ocasionando o funcionamento inadequado do sistema. Nossa abordagem permitirá a modelagem visual dos processos de negócios utilizando o diagrama proposto em BPMN 2.0, e sua análise usando π-ADL. Como BPMN carece de uma semântica formal, é necessário realizar um mapeamento da arquitetura de subconjuntos modelados em BPMN para os termos de π-ADL. Permitindo assim, especificar o comportamento do sistema e fazer uso das ferramentas de validação da especificação formal e de verificação para revelar os possı́veis deadlocks e livelocks do projeto, bem como verificar outras propriedades como performance e escalabilidade. APRESENTAÇÃO DO PROBLEMA Embora a BPMN seja muito utilizada como ferramenta de modelagem de processos de negócios, os modelos criados usando essa notação não estão livres de erros, que podem ser erros de sintaxe ou erros estruturais. Os erros de sintaxe são encontrados durante o tempo de design utilizando ferramentas de modelagem, por outro lado, os erros estruturais são os que acontecem durante o tempo de execução dos processos, sendo eles os deadlocks e livelocks. Um deadlock, por exemplo, ocorre quando um processo requer processos anteriores para ser concluı́do, mas um deles nunca é realizado. Esses erros quando ocorrem ocasionam o funcionamento inadequado do sistema. Os erros estruturais são difı́ceis de serem detectados e em SOS a questão se potencializa, pois, neste cenário um processo pode ser composto por um ou vários processos distintos oriundos de diversos sistemas, tornando-se grande e complexo demais, o que inviabiliza a detecção de erros sem um apoio automatizado. 3. 4. PROJETO DE AVALIAÇÃO DA SOLUÇÃO A validação da abordagem proposta será realizada de acordo as seguintes as etapas: • Definição dos subconjuntos do BPMN a serem formalizados: Elaboração dos cenários modelados em diagramas de coreografia que apresentem deadlocks e livelocks conhecidos no contexto de SOS, para serem utilizado na experimentação. • Definição das regras de Mapeamento dos elementos BPMN para π-ADL: Consiste na descrição de cada um dos elementos de modelagem do diagrama de coreografia em termos de π-ADL e com base nesse mapeamento, descreve a arquitetura de cada cenário prédefinido. PROPOSTA DE SOLUÇÃO • Utilização de um conjunto de ferramentas de apoio a π-ADL: para validação sintática e semântica da descrição da arquitetura, mostrando erros e permitindo assim a detecção e correção dos erros e problemas potenciais. Após validação, realizar a verificação de todos os cenários para analisar se os erros presentes em cada um deles foram detectados. Este trabalho propõe investigar uma abordagem para identificar erros que ocorrem em tempo de execução, como os deadlocks e livelocks, em Sistema de Sistemas modelados utilizando a notação BPMN, a fim de garantir a ausência desses erros. Nossa análise consiste na construção de um modelo formal da arquitetura, e em seguida, na verificação desse modelo em um verificador especı́fico para a linguagem π-ADL (π-Architecture Description Language) [9, 6]. Para formalizar os modelos escolhemos utilizar π-ADL, pois é uma linguagem formal projetada para a especificação de arquiteturas dinâmicas. Além disso, possui um conjunto de ferramentas de especificação e verificação que fornece suporte para a verificação automatizada [6]. Devido ao fato de que os erros estruturais são formados em tempo de execução e os SOS serem grandes e complexos demais, faz-se necessário uma linguagem para descrição de arquiteturas dinâmicas, e que tenha o suporte de ferramentas de verificação automática. Como em [7] e [8] são descritas abordagens que mostram como diagramas de orquestração (diagrama padrão) BPMN podem ser descritos em uma linguagem formal, o nosso trabalho foca na utilização no diagrama de coreografia, que é um diagrama proposto na versão BPMN 2.0 [11], que representam mais fielmente a dinâmica da interação dos componentes de um SOS. O diagrama de coreografia difere em propósito e comportamento da representação de um diagrama de orquestração. Enquanto o diagrama de orquestração define o fluxo das atividades do processo, o diagrama de coreografia tem seu foco principal em como processos interagem uns com os outros. 5. ATIVIDADES REALIZADAS Já realizamos a revisão da literatura com objetivo de identificar os conceitos relevantes na área de BPMN e as técnicas de detecção de erros estruturais que serão usadas. Com base na revisão literária e pelo aspecto dinâmico dos SOS, escolhemos π-ADL por ser uma linguagem formal especialmente concebida para modelar arquiteturas dinâmicas. Estamos elaborando os cenários modelados em diagrama de coreografia contendo deadlocks e livelocks, para serem utilizados na validação e verificação. E alguns dos elementos de modelagem já foram mapeados tendo como base a sintaxe de π-ADL. Além disso, está sendo realizado o estudo da ferramenta de apoio a π-ADL, desenvolvida e disponibilizada pelo ArchWare Team, para validação da sintaxe dos cenários, bem como a verificação da especificação da arquitetura dos mesmos. 6. CONCLUSÃO Esse trabalho sugere uma abordagem para resolver uma questão complexa que é detectar possı́veis deadlocks e livelocks que podem ocorrer durante a execução de um SOS 2 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 modelado utilizando a notação BPMN. O método proposto pretende expressar o modelo BPMN através da linguagem formal π-ADL e em seguida, verificar os erros de projeto que podem prejudicar o sistema. Como resultado, pretendemos estabelecer uma abordagem formal que permita detecção de erros estruturais nos diagramas de coreografia do processo BPMN, facilitando sua correção. 7. REFERÊNCIAS [1] N. Karcanias and A. G. Hessami. System of systems and emergence part 1: Principles and framework. In Emerging Trends in Engineering and Technology (ICETET), 2011 4th International Conference on, pages 27–32. IEEE, November 2011. [2] O. M. Kherbouche, A. Ahmad, and H. Basson. Detecting structural errors in bpmn process models. In Multitopic Conference (INMIC), 2012 15th International, pages 425–431. IEEE, December 2012. [3] A. J. Krygiel. Behind the wizard’s curtain. an integration environment for a system of systems. Technical report, DTIC Document, 1999. [4] D. Luzeaux and J.-R. Ruault. Systems of systems. Wiley Online Library, New York, 2010. [5] M. W. Maier. Architecting principles for systems-of-systems. In INCOSE International Symposium, pages 565–573. Wiley Online Library, July 1996. [6] F. Oquendo. π-adl: an architecture description language based on the higher-order typed π-calculus for specifying dynamic and mobile software architectures. ACM SIGSOFT Software Engineering Notes, 29(3):1–14, May 2004. [7] F. Oquendo. Formal approach for the development of business processes in terms of service-oriented architectures using pi-adl. In Service-Oriented System Engineering, 2008. SOSE’08. IEEE International Symposium on, pages 154–159. IEEE, December 2008. [8] F. Oquendo. pi-adl for ws-composition: A service-oriented architecture description language for the formal development of dynamic web service compositions. In SBCARS, pages 52–66, 2008. [9] F. Oquendo, I. Alloui, S. Cimpan, and H. Verjus. The archware architecture description language: Abstract syntax and formal semantics. deliverable d1. 1b, archware european rtd project. Technical report, IST-2001-32360, December, 2002. [10] O. F. A. Specification. Business process modeling notation specification, 2006. [11] O. F. A. Specification. Business process model and notation (bpmn) version 2.0, 2010. 3 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Towards an Approach to Foster Simplicity in Agile Software Development Projects Wylliams Santos Hermano Moura Informatics Center (CIn), Federal University of Pernambuco (UFPE) Recife, Pernambuco, Brazil Informatics Center (CIn), Federal University of Pernambuco (UFPE) Recife, Pernambuco, Brazil [email protected] [email protected] ABSTRACT These practices embody the adaptability, flexibility and selforganization. Although agile software development have become essential over the years for organizations, software development is a complex endeavor [26]. Moreover, complexity has being widely acknowledged as one of the biggest barriers to agile project’s success [31]. In line with agile manifesto, agile software development has proven to be an important set of methods in promoting simplicity issues, but yet still, surprisingly, few academic studies that directly address in simplicity’s area [19] [16] [9]. Agile Software Development has proven to be an significant set of methods in boost simplicity issues, but the privation of a framework for applying simplicity may be an important factor in the lack of success for software development projects in meeting the project’s target and achieving customer’s satisfaction. Simplicity is, in itself, by far not a simple concept. To address this gap, we propose an approach towards fostering simplicity in Agile Software Development. Additionally, we present the problem statement, research goal, research question and research methodology, including the research decision-making structure. Besides, the literature review covering models related to simplicity in different areas of research are then drawn. 2. PROBLEM STATEMENT Meyer [19] takes a closer look at the concept of the official agile principle, which defines simplicity as “the art of maximizing the amount of work not done”. Meyer affirms that who has ever obtained a first solution to a problem of any kind, found it complex, and tried to simplify it. Achieving simplicity often means adding work, sometimes lots of it. From this point of view, achieving simplicity is not the same as minimizing work. Meyer [19] discusses that both are worthy goals in software engineering, but they arise in different contexts and lead to different principles: (i) proponents of rigorous, elegant programming techniques, (ii) avoiding unneeded work which leads to such principles as “Eliminate waste” and “Decide as late as possible” in Lean [23]. These two views meet, but not necessarily in the way agile authors [2] would like. Simplicity has been considered an important research topic in Information and Communications Technology (ICT). Agile Software Development has proven to be an important set of methods in promoting simplicity issues, but the lack of a framework for applying simplicity is an important factor in the lack of success for software development projects in meeting the project’s target and achieving customer’s satisfaction. Categories and Subject Descriptors k.6.3 [Management of Computing and Information Systems]: Software Management—Software Process; D.2.9 [Software Engineering]: Management—Productivity, Programming Teams, Software Process Models General Terms Agile Methods, Critical Success Factors Keywords Simplicity, Agile Software Development, Methodologies 1. INTRODUCTION Agile software development represents an alternative to the heavyweight methodologies. It pus less emphasis on upfront and strict control and relies more on informal collaboration, coordination, and learning [7]. Besides, agile software development achieves the organization business goals through the practices, principles, and values focused on people and interactions, working software, customer collaboration, responding to change; and continuous improvement [2]. 2.1 Research Question Motivated by the scenario presented previously, the research question investigated by this thesis is: (RQ) How to manage the simplicity in order to improve Agile Software Development project’s success? Based on this general question, the following specific subquestions emerge as well: (RQ1) How to foster simplicity’s management in contexts of Agile Software Development?, and (RQ2) How do simplicity concepts relate to the Critical Success Factors in the context of Agile Software Development? Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, to republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2015, May 26th-29th, 2015, Goiânia, Goiás, Brazil Copyright SBC 2015. 4 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 2.2 Research Goal The goal of this thesis can be stated as: This work proposes an approach to manage simplicity in the context of Agile Software Development in order to improve the project’s success. The approach is supported by the state-of-the-art in Agile Software Development context concerning Simplicity’s understanding. From the general goal, the following specific research goals are defined (RG1:) to understand the simplicity’s dimensions, practices and concepts from the agile team’s perspective, (RG2:) to develop an approach that integrates the chosen simplicity’s dimensions and ASD practices, and (RG3:) to evaluate the proposed approach in the industrial scenario. Figure 1: Research paths through the research decision-making structure 3. METHODOLOGY Several factors make empirical research in Software Engineering particularly challenging as it requires studying not only technology but its stakeholders’ activities while drawing concepts and theories from social science [32]. Several researchers [27] [29] [30] [8] [24] [5] have addressed the challenges in selecting an appropriate research method in empirical software engineering research in the last two decades. In this sense, this work adopts the decision-making structure containing a number of decision points, each one of them representing a specific aspect on empirical software engineering research [32]. The decision-making structure aims to support researchers by providing a foundation of knowledge about empirical software engineering research decisions, in order to ensure that researchers make well-founded and informed decisions about their research designs and the underlying research process to (i) understand the interrelationship of the main components of research; (ii) avoid confusion when discussing the logic behind the research design or assumptions that have been made (iii) be able to present the research results with confidence and being able to persuade the reader of its conclusions, (iv) be able to comply research standards (v) be able to understand and put other researchers’ work in context. Figure 1 shows the decision points outlining the structure of the decision process during study design. The decision points are logically ordered from left to right. Initially, the decision making-structure shows the starting point (bull’s eye), the identification of the research question. After this stage, the decision point involve selection of (DP1) research outcome (basic), (DP2) research logic (inductive), (DP3) research purpose (exploratory), (DP4) research approach (interpretivist), (DP5) research process (mixed approach), (DP6) research methodology (design science), (DP7) data collection methods (archival literature, interviews and expert review) and (DP8) data analysis methods (thematic analysis and statistical analysis). Finally, the research incorporates the industrial case study in order to state the validation, refine and consolidate the proposed framework. are described in the polemic paper entitled “Simplicity is Highly Overrated” by Norman [22]. Norman believes that less is better, but in the meantime, he argues that marketing experts know that purchase decisions are influenced by feature lists. Products which have an extensive list of features and are fundamentally more complex are preferred. Besides, Norman emphasizes that even if the buyers realise they will probably never use most of the features and, perhaps, these features will confuse the buyers more than helping them, they still prefer them. The findings resulted from a Systematic Literature Review and direct interaction with experts (individual interviews and focus group) in the area of ICT [9] [16] give evidence that the community of researchers and practitioners believe that the philosophy of simplicity is strategically important, yet still insufficiently understood. Based on the evolution of Project Management (PM) thinking, Moura and Skibniewski [20] [21] presented the Software Project Framework (SPF), composed of disciplines, principles and dimensions in order to verify how project management and related research have evolved over the years and to identify related trends. Simplicity is one of the 14 dimensions (directions) for advancing research proposed by the SPF. Moura and Skibniewski consider the agile methods as a promising approach to this dimension. According to Dingsøyr et al. [6], the articulation of the Agile Manifesto in 2001 has brought unprecedented changes to the software engineering field. The Agile Manifesto is a statement of values and principles that describe the various agile processes [2] [26], as follows: (i) Individuals and interactions over processes and tools, (ii) Working software over comprehensive documentation, (iii) Customer collaboration over contract negotiation, (iv) Responding to change over following a plan. In order to satisfy these values, some principles1 should be respected, among them, the principle that “Simplicity, the art of maximizing the amount of work not done – is essential”. In the available literature, various methods propose agility in their definitions, aiming to find efficient ways for developing software of quality across an agile development process. According to Jobs [12], “you have to work hard to get your thinking clean to make it simple” - simple can be harder than complex. From this point of view, achieving simplicity 4. THEORETICAL BACKGROUND Simplicity principles have been proposed in various forms by theologians, philosophers, and scientists, from ancient to modern times. There is a widespread philosophical presumption that simplicity is a theoretical virtue [1] [10]. Several works [9] [17] [18] analyze simplicity in the context of Information and Communications Technology. Some tendencies related to simplicity in the context of products 1 5 http://agilemanifesto.org/principles.html IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Figure 2: Conceptual Framework of Simplicity in Agile Software Development is not the same as minimizing work. Meyer [19] discusses that both are worthy goals in software engineering, but they arise in different contexts and lead to different principles: (i) proponents of rigorous, elegant programming techniques, (ii) avoiding unneeded work which leads to such principles as “Eliminate waste” and “Decide as late as possible” in Lean [23]. These two views meet, but not necessarily in the way agile authors [2] would like. 5. PROPOSED APPROACH AND NEXT STEPS Our approach proposes four simplicity perspectives in the context of Agile Software Development, such as agile team, product, customer and process. Conforming to Margaria [16] there are many perspectives on the concept of simplicity for example, simplicity can be related to size as in the number of components a system possesses. It can also reflect the amount of effort a user of the system has to expend to use the system or the level of effort and amount of knowledge to understand the system. In the context of the present study, we are particularly interested in proposing a coherent approach of interrelated fundamental directions fostering simplicity in the context of Agile Software Development. Initially, our framework is composed by several dimensions that leads to simplicity in the context of Agile Software Development, such as: reduction, orthogonality, time, structure, communication, organization, decomposition and so on. Figure 2 provides an overview of the conceptual framework illustrating the nature and relationships between the different components of the pyramid. The pyramid is revolving around Agile Manifesto, Dimensions of Simplicity and Critical Success Factors (CSF), as its cornerstones. The philosophical concept of simplicity is considered as the center or as the core part of the framework. It is set up and inspired by Egyptian pyramids, certainly one of the most perfect and extraordinary shapes created by humans [25]. Humbert and Price [11] argued that the regular tetrahedron, comprising only four equilateral triangles, has at least as forte a claim to simplicity and symmetry. Analogously, these are the main characteristics of our pyramid. The basis of the pyramid lists the Agile Manifesto and Dimensions of Simplicity. The Agile Manifesto unifies and establishes a common set of values and principles for all of the agile methodologies, including the tenth principle that addresses simplicity as essential “the art of maximizing the amount of work not done”. The Dimensions of Simplicity’s triangle identify the structures and aspects that lead to simplicity. On the top of the pyramid, Critical Success Factors - are the factors that must be present for the agile project to be successful. In this sense, we believe that the simplicity dimension affects and is related to some Critical Success Factors [3] [28]. The core (center) of the pyramid, extracts the essence of simplicity according to the philosophical concept. Additionally, relationships between the components of the pyramid are not stated in a linear/sequential way. Essentially, they must be present in order to keep the spirit of simplicity. Thus, if well analyzed, the simplicity dimension could lead to increasing the success rates of the Agile Project. This new way of dealing with simplicity in the context of Agile Software Development requires the capacity to rethink the underlying competences under a different image of project, demanding a new team’s mindset in order to further boost the success of the projects with focus on simplicity. As a partial result of the work presented in this thesis, the following main contributions can be highlighted: (i) an overview of the key concepts in the field of simplicity, with emphasis on the Agile Software Development aspects; (ii) a survey [14] performed with practitioners from the European and American companies, besides researchers from the Lero, the Irish Software Research Centre2 , in order to understand the aspects of Simplicity in Agile Software Development; (iii) an initial conceptual framework in underlying simplicity definition from the Agile Team’s perspective; (iv) a focus group performed with Brazilian practitioners and researchers in order to refine and evaluate the conceptual framework underlying simplicity definition from Agile Team’s perspective; As the next steps and statements of future contributions, our schedule proposes: (i) a Systematic Literature Review (SLR) [13] in order to understand the challenges and opportunities of Simplicity management, as well as to identify research gaps and the road ahead; (ii) the establishment of an approach to simplicity management in Agile Software Development; and, (iii) the evaluation of the proposed approach. 6. CONCLUDING REMARKS There are difficulties in defining simplicity and its impact on IT development and use. Moreover there are difficulties in defining what happens when simplicity is not present [15] [18]. Agile software development emerged as a popular paradigm and agile methods became the most software development in software industry. Besides, agile methods provide ways to develop software which place emphasis on people and their creativity [4], yet some theoretical concepts are still insufficiently understood by practitioners and researchers. In this context, we believe that it is important to develop an approach to support the agile team in order to foster simplicity in Agile Software Development. 2 6 http://www.lero.ie IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Acknowledgements The authors would like to acknowledge the Brazilian National Research Council (CNPq) and University of Pernambuco (UPE) for their support during this research. 7. [17] [18] REFERENCES [1] A. Baker. Simplicity. The Standard Encyclopedia of Philosophy, 2013. Accessed on February 22, 2015. [2] K. Beck, M. Fowler, and K. Schwaber. Manifesto for Agile Software Development, 2001. http://agilemanifesto.org. Accessed on February 22, 2016. [3] T. Chow and D.-B. Cao. A survey study of critical success factors in agile software projects. Journal of Systems and Software, 81(6):961–971, 2008. [4] A. Cockburn and J. Highsmith. Agile software development: The people factor. Computer, 34(11):131–133, 2001. [5] J. Creswell. Research design: qualitative, quantitative and mixed methods approach. SAGE Publications, Inc, 4th edition, 2013. [6] T. Dingsøyr, S. Nerur, V. Balijepally, and N. B. Moe. A decade of agile methodologies: Towards explaining agile software development. Journal of Systems and Software, 85(6):1213–1221, 2012. [7] T. Dybå, T. Dingsøyr, and N. B. Moe. Agile Project Management. In G. Ruhe and C. Wohlin, editors, Software Project Management in a Changing World, number SEPTEMBER, chapter 11, pages 277–300. Springer Berlin Heidelberg, London, 2014. [8] S. Easterbrook, J. Singer, M.-A. Storey, and D. Damian. Selecting Empirical Methods for Software Engineering Research. In Guide to Advanced Empirical Software Engineering, chapter Selecting Empirical Methods for Software Engineering Research, pages 285–311. Springer London, 2008. [9] B. D. Floyd and S. Bosselmann. ITSy - Simplicity Research in Information and Communication Technology. Computer, 46(11):26–32, Nov. 2013. [10] J. C. Gambrel and P. Cafaro. The Virtue of Simplicity. Journal of Agricultural and Environmental Ethics, 23 VN - r:85–108, 2009. [11] J.-M. Humbert and C. Price. Imhotep Today: Engyptianizing architecture. UCL Press - Institute of Archaeology, London, United Kingdom, 2003. [12] S. Jobs. Steven Jobs: There’s sanity returning, 1998. http://www.businessweek.com/1998/21/b3579165.htm. Accessed on February 16, 2016. [13] B. Kitchenham and S. Charters. Guidelines for performing Systematic Literature Reviews in Software Engineering. Technical report, Keele University and Durham University Joint Report, 2007. [14] B. Kitchenham and S. L. Pfleeger. Principles of survey research part 4: questionnaire evaluation. ACM SIGSOFT Software Engineering Notes, 27(3):20, 2002. [15] T. Margaria, B. D. Floyd, and B. Steffen. IT Simply Works: Simplicity and Embedded Systems Design. In Computer Software and Applications Conference Workshops (COMPSACW), 2011 IEEE 35th Annual, pages 194–199. IEEE, July 2011. [16] T. Margaria, B. D. Floyd, and B. Steffen. ITSy – 7 [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] Recommendation Document. Technical report, University of Postdam, Postdam, 2011. Accessed on February 21, 2016. T. Margaria and M. Hinchey. Simplicity in IT: The Power of Less. Computer, 46(11):23–25, Nov. 2013. T. Margaria and B. Steffen. Simplicity as a Driver for Agile Innovation. Computer, 43(6):90–92, June 2010. B. Meyer. Agile! The Good, the Hype and the Ugly. Springer, Zurich, Switzerland, 2014. H. Moura. Software Project Framework. Technical report, Federal Univerity of Pernambuco, Recife, Pernambuco, 2011. Accessed on February 21, 2015. H. Moura and M. Skibniewski. The Evolution of Management Thinking. In International Research Network on Organizing by Project (IRNOP), 2011. D. A. Norman. Simplicity is highly overrated. Interactions, 14(2):40–41, 2007. M. Poppendieck and T. Poppendieck. Leading Lean Software Development: Results Are Not the Point. Addison-Wesley Professional, 1st edition, 2009. P. Runeson and M. Höst. Guidelines for conducting and reporting case study research in software engineering. Empirical Software Engineering, 14(2):131–164, dec 2008. M. G. Schadla-Hall RT. Ancient Egypt on the Small Screen - from Fact to Fiction in the UK. In Consuming Ancient Egypt, chapter 14, pages 195–215. UCL Press - Institute of Archaeology, London, United Kingdom, 2003. K. Schwaber and M. Beedle. Agile Project Management With Scrum. Microsoft Press, Washington, 2004. C. Seaman. Qualitative methods in empirical studies of software engineering. IEEE Transactions on Software Engineering, 25(4):557–572, 1999. D. Shahane, P. Jamsandekar, and D. Shahane. Factors Influencing the Agile Methods in Practice - Literature Survey & Review. In International Conference on Computing for Sustainable Global Development (INDIACom), pages 556–560, 2014. M. Shaw. Writing good software engineering research papers. In 25th International Conference on Software Engineering, 2003. Proceedings., pages 726–736, Portland, Oregon, 2003. IEEE Computer Society. D. I. K. Sjoberg, T. Dyba, and M. Jorgensen. The Future of Empirical Methods in Software Engineering Research. Future of Software Engineering (FOSE ’07), pages 358–378, 2007. The Standish Group International. CHAOS MANIFESTO 2013. Technical report, The Standish Group International, 2013. C. Wohlin and A. Aurum. Towards a decision-making structure for selecting a research design in empirical software engineering. Empirical Software Engineering, 20(6):1427–1455, 2014. IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 SMartyMetrics: um Framework de Métricas de Apoio à Avaliação de Arquiteturas de Linha de Produto de Software Alternative Title: SMartyMetrics: a Metrics Framework for Supporting Software Product Line Architecture Evaluation André Felipe Ribeiro Cordeiro Edson OliveiraJr Departamento de Informática (DIN) Universidade Estadual de Maringá (UEM) Departamento de Informática (DIN) Universidade Estadual de Maringá (UEM) [email protected] [email protected] metrics to for such evaluation. By defining and using metrics, it is important to ensure that such metrics represent relevant characteristics for evaluation. Therefore, this work presents a proposal of a metrics framework to support the evaluation of PLAs. This framework should define a set of metrics for quality attributes, considering variability and quality models such as ISO/IEC 9126 and/or ISO/IEC 25010. RESUMO Linha de Produto de Software (LPS) é uma abordagem de reuso que considera a combinação de artefatos relacionados a um domínio de aplicação. Entre os principais artefatos está a arquitetura de LPS (Product Line Architecture - PLA), que influencia na geração dos produtos. Essa característica da PLA exige que a mesma seja avaliada de forma quantitativa e qualitativa, durante todo o ciclo de desenvolvimento/manutenção/evolução da linha. Métodos de avaliação de PLAs são apresentados na literatura. Entre todos esses métodos, existem aqueles que consideram a aplicação de métricas para avaliar a PLA. Ao definir e utilizar métricas, é importante garantir que tais métricas representem características relevantes para a avaliação. Diante disso, esse trabalho apresenta a proposta de um framework de métricas para apoiar a avaliação de PLAs. Esse framework deve definir um conjunto de métricas para determinados atributos de qualidade, considerando variabilidades e um modelo/norma de qualidade, tal como a ISO/IEC 9126 e/ou ISO/IEC 25010. Categories and Subject Descriptors D.2.8 [Metrics]: Product metrics. General Terms Management, Measurement, Experimentation, Standardization. Keywords Quality Attributes; Product Line Architecture Assessment; Software Product Line; Metrics; Quality Models. 1. INTRODUÇÃO Palavras-Chave Linha de Produto de Software (LPS) é uma abordagem de reuso sistemático e planejado de artefatos de software, em um domínio de aplicação. Os artefatos de uma LPS podem ser comuns (relacionados ao domínio) ou variáveis (não relacionados ao domínio) [4]. A variabilidade (sinônimo para artefato variável) pode ser entendida como um mecanismo que diferencia os produtos de uma LPS, sendo descrita por pontos de variação e variantes. Os pontos de variação são locais que contém decisões de projeto ainda não resolvidas e as variantes são possíveis alternativas de solução de um ponto de variação [14]. Os produtos de uma LPS são desenvolvidos por meio da instanciação de artefatos, presentes em uma infraestrutura denominada núcleo de artefatos. Um dos artefatos mais importantes de uma LPS presente nesse núcleo é a arquitetura (Product Line Architecture - PLA) [14]. A PLA permite abstrair as arquiteturas dos possíveis produtos de uma LPS, sendo fundamental para o sucesso/fracasso da abordagem. A literatura apresenta diferentes métodos de avaliação de PLAs, tais como o Holistic Product Line Architecture Assessment (HoPLAA) [11] e o Systematic Evaluation Method for UML-based Software Product Line Architectures (SystEM-PLA) [13] [14]. No SystEM-PLA por Atributos de Qualidade; Avaliação de Arquitetura de Linha de Produto; Linha de Produto de Software; Métricas; Modelos de Qualidade. ABSTRACT Software Product Line (SPL) is a reuse approach that combines artifacts related to an application domain. Amongst the key artifacts is the SPL architecture (Product Line Architecture PLA), which impacts in the generation of products. This characteristic of a PLA requires it to be evaluated quantitatively and/or qualitatively, throughout the development/ maintenance/evolution cycle of the SPL. Literature presents several PLA evaluation methods. Amongst all these methods, there are those, which take into consideration the application of Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2016, May 17–20, 2016, Florianópolis, Santa Catarina, Brazil. Copyright SBC 2016. 8 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 exemplo, a avaliação de PLAs permite a aplicação e coleta de métricas, que podem auxiliar na verificação de determinadas características da PLA [15]. Ao definir e utilizar métricas na avaliação, é importante garantir que tais métricas estejam relacionadas com os propósitos definidos. A definição do(s) propósito(s) pode ser realizada por meio da abordagem Goal Question Metric (GQM) [2]. O GQM estrutura a associação entre objetivos (goals), questões (questions) e métricas (metrics) em uma avaliação. A definição das métricas pode ser realizada considerando Modelos de Qualidade (MQ) ou Normas de Qualidade (NQ). Os modelos/normas especificam um conjunto de atributos, também conhecidos como Atributos de Qualidade (AQ). São exemplos de AQ, a Manutenibilidade [1], a Complexidade [9] e a Extensibilidade [12]. A aplicação da abordagem GQM, em conjunto com MQ/NQ, AQ e métricas pode auxiliar na avaliação de PLAs. Neste caso, a avaliação poderia considerar determinados AQ, que estejam relacionados tanto com MQ/NQ, quanto com métricas específicas. Apesar das evidências sobre esses potenciais benefícios, poucos trabalhos que consideram MQ/NQ, AQ e métricas no contexto de PLA e/ou LPS, foram encontrados na literatura. Diante disso, este trabalho apresenta a proposta de um framework de métricas para apoiar a avaliação de PLAs modeladas em Unified Modeling Language (UML). Além de considerar as variabilidades da PLA e os AQ definidos na norma ISO/IEC 9126 [7] ou ISO/IEC 25010 [8], esse framework também considera a aplicação da abordagem GQM. 3. PROPOSTA DE SOLUÇÃO O framework de métricas proposto neste trabalho deve considerar a associação entre MQ/NQ, AQ e métricas, para apoiar a avaliação de PLAs. Tal associação, em conjunto com a abordagem GQM, deve possibilitar a consideração de AQ na avaliação. Neste framework, as PLAs devem estar modeladas em UML, de acordo com a abordagem Stereotype-based Management of Variability (SMarty) [3]. SMarty é uma abordagem de gerenciamento de variabilidades para LPSs modeladas em UML, baseada em estereótipos e diretrizes. A construção do framework está relacionada com a execução das seguintes atividades: 2. APRESENTAÇÃO DO PROBLEMA Dada à importância de uma PLA para a adoção de LPS, é importante que tal artefato seja avaliado de forma quantitativa e qualitativa. As métricas auxiliam nas análises quantitativas e qualitativas, além das análises de trade-offs [14]. Um mapeamento sistemático foi realizado com o objetivo de verificar e analisar medidas, métricas e frameworks de medição/avaliação, no contexto de PLA e LPS. Deste mapeamento, extraiu-se um número extenso de medidas e métricas, entretanto, percebeu-se também um número reduzido de medidas e métricas específicas para PLA, se comparado ao total de medidas e métricas extraídas. Outra característica observada no mapeamento foi o número reduzido de trabalhos que consideram a associação entre MQ/NQ, AQ e métricas, na avaliação de PLAs e de outros artefatos de uma LPS. Dos trabalhos selecionados, destaque para o trabalho de Her et al. [6], que apresenta um framework para avaliação de ativos centrais (core assets) de uma LPS. Esse framework associa de forma parcial, AQ selecionados da norma ISO/IEC 9126, com métricas específicas para tais AQ. Apesar da associação entre MQ/NQ, AQ e métricas ser uma característica interessante do trabalho, ele não considera exclusivamente PLAs, como é o caso desse trabalho. Outros trabalhos sobre frameworks de medição/avaliação foram encontrados, porém, esses trabalhos apresentam contextos de aplicação diferentes de LPS, tais como orientação à aspectos [16] e arquitetura de software tradicional [17]. Esses trabalhos apresentam a preocupação com a inserção de AQ na medição/avaliação, entretanto, a associação entre MQ/NQ, AQ e métricas não é explícita, diferente da proposta desse trabalho. Por fim, foi observado no mapeamento diferentes propósitos que podem motivar a avaliação de uma PLA, desde a otimização [5], até a aplicação de testes de regressão [10]. Em ambos os casos, métricas auxiliaram na avaliação. seleção das métricas candidatas a compor o framework. Essas métricas serão extraídas das medidas e métricas observadas no mapeamento sistemático realizado; organização das métricas por AQ, de acordo com a norma ISO/IEC 9126 [7] ou ISO/IEC 25010 [8]; validação experimental das métricas; especificação das métricas em Structured Metrics Metamodel (SMM1), um metamodelo estruturado para especificação de métricas definido pelo Object Management Group (OMG2); estudo, construção conceitual do framework, baseado na abordagem GQM e avaliação experimental do framework; 4. PROJETO DE AVALIAÇÃO DA SOLUÇÃO As métricas serão validadas por meio de estudos experimentais quantitativos e qualitativos, considerando a estrutura adotada em [9] e [12]. A estrutura adotada em tais estudos considera AQ na avaliação de PLAs. O framework será avaliado experimentalmente considerando a realização de estudos quantitativos e qualitativos. É planejada a participação de professores/pesquisadores (especialistas) em LPS/PLA. Especificamente sobre os estudos qualitativos, planejase aplicar procedimentos de Grounded Theory, como Coding [18]. Após a validação das métricas e avaliação do framework, o mesmo será instanciado para apoiar a avaliação de PLAs. Será exigido tanto na validação, quanto na avaliação, a participação de pessoas qualificadas no contexto de LPSs e PLAs. 5. ATIVIDADES JÁ REALIZADAS Um Mapeamento Sistemático foi realizado para identificar medidas, métricas e frameworks no contexto de PLA/LPS. Métricas para avaliar a estabilidade de PLAs modeladas em UML foram propostas e validadas experimentalmente. O procedimento experimental considerou a correlação entre a avaliação da estabilidade realizada por participantes e a avaliação da estabilidade fornecida pelas métricas propostas. Os resultados experimentais iniciais apresentaram uma correlação positiva fraca. Apesar de tais evidências, novos 9 1 http://www.omg.org/spec/SMM/ 2 http://www.omg.org/ IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 and Evaluation (SQuaRE) – System and Software Quality Models. International Organization for Standardization (ISO). Disponível em: http://www.iso.org/iso/catalogue_detail.htm?csnumber=3573 3. Acessado em 05/03/2016. estudos precisam ser conduzidos a fim de avaliar mais precisamente. No momento, as métricas candidatas a serem selecionadas/definidas para o framework estão em análise. Ao final da análise, as métricas serão classificadas segundo os AQ presentes na norma ISO/IEC 9126 ou ISO/IEC 25010. Em seguida, as atividades apresentadas na seção de Proposta de Solução serão realizadas. [9] Marcolino, A. S., OliveiraJr, E., Gimenes, I. M. S., and Conte, T. U. Towards Validating Complexity-Based Metrics for Software Product Line Architectures. In: Proceedings of the Brazilian Symposium on Software Components, Architectures and Reuse (SBCARS 2013), Brasília, pp. 6979, 2013. 6. CONCLUSÃO Este trabalho apresentou a proposta de um framework de métricas de apoio à avaliação de PLAs, considerando a associação entre MQ/NQ, AQ e métricas. A princípio, considera-se os AQ presentes na ISO/IEC 9126 ou ISO/IEC 25010 como potenciais candidatos para o framework. Em conjunto com a associação mencionada, planeja-se integrar a abordagem GQM ao framework, com o propósito de considerar AQ na avaliação de PLAs, bem como suportar análises de trade-off entre AQ. A construção deste framework, denominado SMartyMetrics, avançará o estado da arte no que se refere à avaliação de PLAs considerando métricas relacionadas à AQ. [10] Neto, P. A. M. S., Machado, I. C., Cavalcanti, Y. C., Almeida, E. S., Garcia, V. C., Meira, S. R. L. An Experimental Study to Evaluate a SPL Architecture Regression Testing Approach. In: IEEE 13th International Conference on Information Reuse and Integration (IRI), Las Vegas, pp. 608-615, 2012. [11] Olumofin, F. G. and Misic, V. B. Extending the ATAM Architecture Evaluation to Product Line Architectures. In: Proceedings of the Working IEEE/IFIP Conference on Software Architecture, Washington, pp. 45-56, 2005. 7. AGRADECIMENTOS [12] OliveiraJr, E., and Gimenes, I. M. S. Empirical Validation of Product-line Architecture Extensibility Metrics. In: Proceedings of the International Conference on Enterprise Information Systems, Lisbon, pp. 111-118, 2014. Os autores agradecem à Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) pelo apoio financeiro, na realização dessa pesquisa. [13] OliveiraJr, E., Gimenes, I. M. S., Maldonado, J. C., Masiero, P. C., and Barroca, L. Systematic Evaluation of Software Product Line Architectures. Journal of Universal Computer Science (JUCS), v. 19, n. 1, pp. 25-52, 2013. 8. REFERÊNCIAS [1] Alshayeb, M. On the relationship of class stability and maintainability. Institution of Engineering and Technology (IET) Software, 2013, v. 07, p.339-347, 2013. [14] Oliveira Junior, E. A. SystEM-PLA: um Método Sistemático para Avaliação de Arquitetura de Linha de Produto de Software baseada em UML”. 2010. Tese (Doutorado em Ciências de Computação e Matemática Computacional) Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2010. [2] Basili, V., Caldiera, G., and Rombach, H. “The Goal Question Metric Approach”. Encyclopedia of Soft. Eng., vol. 2, September 1994, pp. 528-532, John Wiley & Sons, Inc. [3] Bera, M. H. G., OliveiraJr, E., and Colanzi, T. E. Evidencebased SMarty Support for Variability Identification and Representation in Component Models. In: Proceedings of the 17th International Conference on Enterprise Information Systems (ICEIS), Setúbal, pp. 295-302, 2015. [15] OliveiraJr, E., Gimenes, I. M. S., and Maldonado, J. C. A Metric Suite to Support Software Product Line Architecture Evaluation. In: XXXIV Conferência Latinoamericana de Informática (CLEI), 2008, Santa Fe. Anais da XXXIV Conferência Latinoamericana de Informática (CLEI), 2008. pp. 489-498. [4] Capilla, R., Bosch, J., and Kang, K. Systems and Software Variability Management: Concepts, Tools and Experiences. SpringerLink: Bucher. Springer, 2013. [16] Sant’anna, C. N., Garcia, A. F., Chavez, C. F. G., Lucena, C. J. P., and Staa, A. “On the Reuse and Maintenance of Aspect-Oriented Software: An Assessment Framework”. In: Proceedings of the 7th Brazilian Symposium on Software Engineering (SBES), 2003. Disponível em: http://www.lbd.dcc.ufmg.br/colecoes/sbes/2003/002.pdf. Acesso em: 07 mar. 2016. [5] Colanzi, T. E., Vergilio, S. R. A Feature-Driven Crossover Operator for Product Line Architecture Design Optimization. In: IEEE 38th Annual Computer Software and Applications Conference (COMPSAC), Vasteras, pp. 43-52, 2014 [6] Her, J. S., Kim, J. H., Oh, S. H., Rhew, S. Y., and Kim, S. D. A framework for evaluating reusability of core asset in product line engineering. Information and Software Technology (IST), v. 49, n. 1, pp. 740-760, 2007. [17] Sant’anna, C., Figueiredo, E., Garcia, A., and Lucena, C. J. P. “On the Modularity of Software Architectures: A Concern-Driven Measurement Framework”. In: Proceedings of the First European Conference on Software Architecture (ECSA´07), pp. 207-224, 2007. [7] ISO/IEC. ISO/IEC 9126, Information technology - Product Quality - Part1: Quality Model. International Organization for Standardization (ISO). Disponível em: http://www.iso.org/iso/, 2001. Acessado em 05/03/2016. [18] Strauss, A., Corbin, J. Basics of qualitative research: Techniques and procedures for developing grounded theory. 2 ed. Sage Publications, 1998. [8] ISO/IEC. ISO/IEC 25010:2011, Systems and Software Engineering – Systems and Software Quality Requirements 10 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Técnicas de Desenvolvimento Orientado a Modelos no Domínio de Robótica e Robôs Sociais Alternative Title: Model-Driven Development techniques for Robotics Domain and Social Robots Tiago Heineck Jaelson Castro Enyo Gonçalves Instituto Federal Catarinense Universidade Federal de Pernambuco Universidade Federal do Ceará Universidade Federal de Pernambuco Centro de Informática Universidade Federal de Pernambuco Cidade Universitária – Recife - PE Cidade Universitária – Recife - PE Cidade Universitária – Recife - PE [email protected] [email protected] [email protected] RESUMO Keywords Robôs são agentes complexos compostos de diversos sensores e atuadores que funcionam em conjunto com software para o atendimento de requisitos específicos. O subconjunto de robôs que tem a capacidade de interagir entre eles e até mesmo com pessoas, por meio de gestos ou fala, é conhecido como Robôs Sociais. O Desenvolvimento Orientado a Modelos é um promissor paradigma pois promove o reuso de componentes e geração rápida de código de qualidade. Portanto, neste trabalho investigaremos sua adequação para o desenvolvimento de sistemas robóticos. Propomos a realização de uma Revisão Sistemática da Literatura para analisar como Desenvolvimento Orientado a Modelos tem sido utilizado no domínio de robótica e em particular em robótica social. Model-Driven Development, Requirements Engineering. Robotics, Social Robotics, 1. INTRODUÇÃO Um robô pode ser uma máquina que executa tarefas repetitivas, sejam guiadas, predefinidas ou de maneira inteligente, sendo capaz de perceber o ambiente e realizar a tomada de decisão [12]. Um robô social é um (semi) autônomo que interage e se comunica com humanos seguindo regras sociais ligadas ao seu papel [7]. Estes robôs devem possuir características humanas como: expressar e perceber emoções, comunicação em alto nível de diálogo, aprender modelo de outros agentes, estabelecer relações sociais, exibir personalidade e caráter e aprender competências sociais [5]. Palavras-Chave O domínio da robótica tem apresentado um grande crescimento, interessando grandes empresas da tecnologia na realização de investimentos. A robótica vem sendo aplicada em diversos domínios, como o industrial, médico e em educação, além da oferta de robôs de serviço, surgem oportunidades envolvendo robôs sociais. Desenvolvimento Orientado a Modelos, Robótica, Robótica Social, Engenharia de Requisitos. ABSTRACT Robots are complex agents composed of various sensors and actuators that work together with software to meet specific requirements. The subset of robots that has the ability to interact among them and even with people, through gestures or speaking, is known as Social Robots. Model-Driven Development is a promising paradigm because it promotes the reuse of components and quick code generation with quality. Therefore, in this project we will investigate its suitability for the development of robotic systems. We propose conducting a Systematic Review of the Literature to analyze how Model-Driven Development has been used in the field of robotics and in particularly in social robotics. Decidir o paradigma no qual se baseará o modo de agir também é algo que permeia o desenvolvimento de sistemas robóticos. Em [9] os autores apresentam uma técnica de modelagem de especificação de requisitos para sistemas Teleo-Reativos (TR), que tem como principal vantagem reagir de forma robusta as mudanças em seus ambientes, apresentam um caso de estudo baseado em um projeto de futebol de robôs. Consequentemente, é importante que o software robótico seja bem especificado. É necessário que os desejos do cliente sejam identificados e analisados para que possa ser especificada uma solução sem ambiguidade [11]. Categories and Subject Descriptors I.6.5 [Simulation and Modeling]: Model Development – Modeling methodologies Assim sendo, o aumento de funcionalidades dos robôs provoca um aumento na complexidade à nível de software, atentos a este ponto, evidências apontam para o Desenvolvimento Orientado a Modelos (MDD) como uma alternativa no auxílio a este domínio, como já vem sendo realizado por [14],[4] e outros. Para [1], MDD é um paradigma de desenvolvimento que usa modelos como artefatos primários do processo desenvolvimento, onde a implementação é gerada (semi) automaticamente a partir de modelos. General Terms Design, Languages, Theory. Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2016, May 17–20, 2016, Florianópolis, Santa Catarina, Brazil. Copyright SBC 2016. O objetivo principal desta proposta é buscar evidências em estudos primários relacionados a técnicas de MDD que tem auxiliado o desenvolvimento de software no domínio de robótica. 11 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Os objetivos secundários são identificar a relação destas técnicas com a fase de especificação de requisitos (funcionais e nãofuncionais), atendimento a questões sociais e paradigmas envolvidos com questões comportamentais do robô. 4. PROPOSTA DE AVALIAÇÃO DA SOLUÇÃO Como ponto principal de apoio está o desenvolvimento de um protocolo bem definido, contendo um background para embasamento dos pesquisadores, as questões de pesquisa definidas de forma clara e objetiva e os métodos e procedimentos a serem utilizados. 2. APRESENTAÇÃO DO PROBLEMA Pesquisadores no domínio de robótica tem colocado a atenção no desenvolvimento de robôs sociais, estando inseridos em diversos contextos e ambientes, atendendo normas e interagindo de alguma maneira [5]. Para redução de viés algumas medidas foram tomadas, como a execução realizada de maneira simultânea por dois pesquisadores, com reuniões ao final de cada etapa para discussão, comparação e consolidação dos resultados. A documentação de todo o processo, desde as buscas iniciais em bases automáticas até os procedimentos finais possibilita a replicação e extensão do estudo. O desenvolvimento de software na robótica tem sido um desafio, os sistemas robóticos estão cada vez mais complexos, exigindo múltiplos sensores distribuídos no corpo do robô e assim incorporando tarefas mais complexas [2]. A medida que estes robôs ganham novos recursos a dificuldade aumenta a nível de software, tendo uma diversidade de requisitos que variam de acordo com o propósito de cada projeto. 5. ATIVIDADES REALIZADAS Os trabalhos iniciais serviram como base para o desenvolvimento do protocolo da RSL, algumas partes são apresentadas nesta seção. Buscando alternativas na Engenharia de Software para auxílio a estas questões, algumas evidências apontam para o MDD como uma alternativa de auxílio ao domínio de robótica. Sendo assim, dois estudos, [4] [14] foram escolhidos para aplicação em um projeto. Partindo do documento de especificação de requisitos, de uma revisão bibliográfica e de manuais das abordagens foram criados modelos dentro das técnicas propostas, as mesmas foram apresentadas em grupos focais com a participação de pesquisadores do domínio de robótica. Foram ressaltadas a importância da separação de conceitos e aumento da clareza para analistas de domínio e especialistas de código, buscando aumento no entendimento das necessidades e requisitos do software em todas as etapas do processo de desenvolvimento. 5.1 Questões de Pesquisa Para o auxílio na formulação da questão de pesquisa, utilizamos o método PICOC de acordo com as orientações de [8] e [10] e apresentados na Tabela 1. Tabela 1. Estrutura para questão de pesquisa População Domínio de robótica Intervenção Desenvolvimento Orientado a Modelos Comparação Não se aplica Baseado nestes estudos iniciais, identificou-se a importância de um melhor entendimento de como estas e outras técnicas de MDD tem auxiliado o desenvolvimento de software no domínio de robótica, focando em questões de engenharia de software. Principalmente em casos complexos como o de robôs sociais, que atuam em ambientes e contextos que exigem adaptação do sistema em tempo de execução. Estudos primários onde técnicas de MDD apoiam o desenvolvimento de software robótico e de robôs sociais Pesquisas científicas publicadas em Contexto periódicos da área As questões definidas são apresentadas nesta seção, com uma breve explicação. 3. PROPOSTA DE SOLUÇÃO Q1: Como técnicas de desenvolvimento orientado à modelos têm auxiliado o domínio da robótica? Resultado Um estudo sistematizado é necessário para o embasamento a respeito da utilização das técnicas, igualmente importante como guia de futuros estudos e desenvolvimento de novas abordagens de desenvolvimento orientado a modelos (MDD). Nesta questão serão analisados sob o ponto de vista da Engenharia de Software os benefícios propostos pela técnica, como por exemplo: reuso de software, separação de conceitos ou arquitetura de software. O principal objetivo desta proposta está na busca de evidências em estudos primários, utilizando como abordagem uma Revisão Sistemática da Literatura (RSL). De acordo com Zhang e Babar [16] a RSL é uma maneira de identificação, avaliação e combinação de evidências de estudos primários usando um método rigoroso e bem definido, sendo largamente utilizada em áreas como a Medicina e Sociologia. Além disso, buscam o relacionamento com a questão de pesquisa, a área tópico ou o fenômeno. Kitchenham e Charters [8] apresentam em seus estudos um guia para realização de Revisão Sistemática da Literatura na área de Engenharia de Software, separando em três grandes estágios que tratam do planejamento, condução e elaboração de relatórios. Todas estas etapas são importantes garantindo a sequência correta dos trabalhos e auxiliando na eliminação de resultados tendenciosos ou de viés de publicação. Este tipo de estudo é útil para sumarizar uma evidência concentrando em uma tecnologia, identificar pontos nos atuais trabalhos sugerindo novos estudos ou prover uma base para uma nova atividade de pesquisa. Q2: Quais as principais características das técnicas? Por características consideramos os elementos de MDD que a técnica possui, como diagramas, meta-modelo, elementos gráficos e linguagem. Q3: Como as técnicas apoiam a fase de especificação de requisitos em desenvolvimento de software robótico? Análise do ponto de vista de especificação de requisitos, extraindo os tipos de requisitos disponíveis pela técnica, classificando em Requisitos Funcionais e Não-Funcionais (atributos de qualidade). Q4: Quais os paradigmas utilizados para questão comportamental do robô? A questão comportamental do robô envolve a maneira que ele reorganiza suas tarefas de acordo com as adaptações que são feitas em tempo de execução, um exemplo de paradigma é o Teleoreativo (TR), em [13] os autores derivam especificações TR em componentes arquiteturais para auxílio no alcance de objetivos do robô. 12 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Q5: São atendidas questões sociais? Como? artefato valioso para especificação de requisitos e sendo uma alternativa para redução de complexidade envolvendo questões sociais em robótica. Questões sociais estão relacionadas a percepção e interação do robô com pessoas e ambientes sociais, a observação deste ponto é feita com base no survey de [5]. Os trabalhos realizados até o momento foram de desenvolvimento e consolidação do protocolo da pesquisa, seguidos da etapa inicial de condução, referente a busca e remoção de duplicados. Os próximos passos serão a seleção dos estudos, extração e análise dos dados, finalização do relatório e escrita da dissertação. Q6: Quais são as questões em aberto que as técnicas possuem? Identificação de pontos que os próprios pesquisadores apontam para trabalhos futuros. 5.2 Estratégias de Busca 7. REFERÊNCIAS As buscas são automáticas, nas principais bases de dados científicas utilizadas, por meio da string de busca, adaptada para os critérios de cada base, a mesma é apresentada a seguir: [1] Brambilla, M. et al. 2012. Model-Driven Software Engineering in Practice. Morgan & Claypool Publishers. [2] Bruyninckx, H. et al. 2013. The BRICS component model: a model-based development paradigm for complex robotics software systems. Proceedings of the 28th Annual ACM Symposium on Applied Computing. (2013), 1758–1764. robot* AND ("model driven" OR "domain specific language" OR "domain specific modeling" OR metamodel OR "meta-model" OR "modeling language" OR "code generation" OR "generative programming" OR MDD OR MDA OR MDE OR DSL OR DSML) [3] Cruzes, D.S. and Dyba, T. 2011. Recommended Steps for Thematic Synthesis in Software Engineering. 2011 International Symposium on Empirical Software Engineering and Measurement. 7491 (2011), 275–284. As fontes devem possuir mecanismos para operadores “AND” e “OR” e permitir a extração de dados para arquivos no formato BibTex ou CSV. As fontes utilizadas são: ScienceDirect, IEEE Xplore, ACM Digital Library, Engineering Village, Scopus e Web of Science. [4] Dhouib, S. et al. 2014. RobotML , a Domain-Specific Language to Design , Simulate and Deploy Robotic Applications. (2014). 5.3 Seleção dos estudos [5] Fong, T. et al. 2003. A survey of socially interactive robots. Robotics and Autonomous Systems. 42, 3-4 (2003), 143–166. Para fins de seleção dos estudos são considerados artigos relacionados a estudos primários, no idioma inglês e publicados a partir de 2005, da área de Engenharia ou Computação e que respondam alguma das questões de pesquisa. Foram definidas cinco etapas para o processo, sendo elas: (1) Busca por meio de string em bases científicas; (2) Remoção de duplicados utilizando a ferramenta StArt [6]; (3) Leitura do título, palavras-chave e resumo; (4) Leitura de título e conclusão e (5) Leitura completa dos artigos. Após este ciclo, serão realizados outros por meio de snowballing [15]. [6] Hernandes, E. 2012. Using GQM and TAM to evaluate StArt-a tool that supports Systematic Review. Clei Electronic Journal. 15, 1 (2012), 13. [7] Kahn, P.H., J. et al. 2004. Social and moral relationships with robotic others? RO-MAN 2004. 13th IEEE International Workshop on Robot and Human Interactive Communication. (2004), 545–550. [8] Kitchenham, B. and Charters, S. 2007. Guidelines for performing Systematic Literature Reviews in Software Engineering. Engineering. (2007). 5.4 Extração dos Dados Os dados serão extraídos em formulários de acordo com as recomendações de [3]. Além dos autores, título, ano de publicação e palavras-chave, serão extraídos dados que auxiliem na resposta das questões de pesquisa. Sendo os seguintes itens: contribuição e benefícios, elementos e artefatos, atendimento a especificação de requisitos, tipos de requisitos, tipos de questões sociais, paradigmas arquiteturais ou de programação envolvidos, classificação (MDD, MDA, MDE, DSL, DSML) e questões em aberto. [9] Morales, J.M. et al. 2015. TRiStar: An i* extension for Teleo-Reactive systems requirements specifications. 30th ACM/SIGAPP Symposium On Applied Computing (SAC 2015). (2015), 283–288. [10] Petticrew, M. and Roberts, H. 2006. Systematic Reviews in the Social Sciences: A Practical Guide. [11] Pressman, R.S. 2011. Engenharia de Software. Bookman. 5.5 Resultados iniciais [12] Romero, R.A.F. et al. 2014. Robótica Móvel. LTC. As buscas automáticas retornaram o total de 2160 estudos, exportados para o formato “bibtex” e importados na ferramenta StArt para remoção de duplicados, totalizando em 761 registros removidos, a mesma está sendo utilizada como mecanismo para condução da seleção dos 1399 estudos restantes. [13] Sánchez, P. et al. 2012. From Teleo-Reactive specifications to architectural components: A model-driven approach. Journal of Systems and Software. 85, 11 (Nov. 2012), 2504– 2518. [14] Schlegel, C. et al. 2015. Model-Driven Software Systems Engineering in Robotics: Covering the Complete Life-Cycle of a Robot. it - Information Technology. 57, 2 (2015), 85–98. 6. CONSIDERAÇÕES FINAIS O desenvolvimento de novos estudos envolvendo um domínio exigem um embasamento por parte dos pesquisadores, assim a Revisão Sistemática da Literatura foi a metodologia escolhida pela sua capacidade de sintetizar estudos reduzindo a possibilidade de viés e em apontar trabalhos futuros [8]. [15] Wohlin, C. 2014. Guidelines for Snowballing in Systematic Literature Studies and a Replication in Software Engineering. 18th International Conference on Evaluation and Assessment in Software Engineering (EASE 2014). (2014), 1–10. [16] Zhang, H. and Babar, M.A. 2011. An Empirical Investigation of Systematic Reviews in Software Engineering. 2011 International Symposium on Empirical Software Engineering and Measurement. (2011), 87–96. Os resultados esperados são importantes para o desenvolvimento de estudos ligando o desenvolvimento orientado a modelos com a robótica e robótica social, auxiliando nos aspectos de desenvolvimento de software de robôs, bem como, provendo um 13 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Identificação Automática de Produtos e suas Características em Grandes Volumes de Dados Não Estruturados: Uma Proposta para Portais de Transparência Pública Alternative Title: Automatic Identification of product and its Characteristics in Large Volumes of Unstructured Data: A Proposal to Public Transparency Portals Eduardo de Paiva Kate Revoredo Programa de Pós-graduação em Informática Universidade Federal do Estado do Rio de Janeiro Avenida Pasteur 458, Urca Rio de Janeiro, RJ, Brasil [email protected] Programa de Pós-graduação em Informática Universidade Federal do Estado do Rio de Janeiro Avenida Pasteur 458, Urca Rio de Janeiro, RJ, Brasil [email protected] RESUMO Government O governo brasileiro tem se empenhado em disponibilizar seus dados para a população através de Portais de Transparência. No entanto, nem sempre o formato apresentado é o mais apropriado. Por exemplo, a descrição de compras em formato de texto dificulta análises sistemáticas. Este trabalho apresenta uma proposta de projeto de dissertação de mestrado que visa melhorar a qualidade dessas informações. A intenção é desenvolver uma técnica que permita a identificação automática dos produtos que são descritos de forma textual nas especificações das compras apresentadas nos portais de transparência. General Terms Management, Documentation, Performance. Keywords Public transparency, Big data, text mining. 1. INTRODUÇÃO Com o desenvolvimento da Internet e das tecnologias digitais, questões de transparência eletrônica, democracia digital, governo aberto, ciberdemocracia e outros termos que associam a atuação governamental às ferramentas apoiadas pelo uso de Tecnologia da Informação vêm ganhando cada vez mais importância no cenário político. As ferramentas digitais são importantes artifícios para estimular a participação popular e consequentemente aumentar o grau de democratização dos governos. Palavras-Chave Transparência pública, Big data, Mineração de texto. ABSTRACT Brazilian Government has been engaged to make available its data to the population in transparency portals. However, the format is not always the most appropriate. For example, the purchases description in text format hampers systematics analysis. This paper presents a dissertation project proposal that aims to improve the information quality of these sites. The intention is to develop a technique that allows automatic identification of products textually described in the purchases specifications presented in the transparency portals. Acompanhando essa tendência, a área de transparência e de dados abertos tem encontrado um terreno fértil para promover o estimulo ao controle social dos gastos públicos. Nesse contexto, o Brasil tem se empenhado para disponibilizar seus dados, e duas leis podem ser consideradas como marcos no seu processo de abertura de dados. A lei complementar 131 (lei da transparência1) determina a disponibilização, em tempo real, de informações pormenorizadas sobre a execução orçamentária e financeira da União, dos Estados, e dos Municípios; e a lei 12.527 (lei de acesso à informação) permite que qualquer pessoa possa solicitar qualquer informação produzida pelo governo, desde que tal informação não esteja expressamente classificada como sigilosa. Categories and Subject Descriptors I.2.7 [Computing Methodologies]: Natural Language Processing Text analysis J.1 [Computer Applications]: Administrative Data Processing - Aliada a essas novas leis, que passaram a implantar uma nova cultura na Administração Pública, outras iniciativas foram Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2016, May 17–20, 2016, Florianópolis, Santa Catarina, Brazil. Copyright SBC 2016. 1 14 A Lei Complementar 131/2009 - lei da Transparência - altera a redação da Lei de Responsabilidade Fiscal (LRF) no que se refere à transparência da gestão fiscal. IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 descrição da compra, é preciso identificar a unidade de medida que está sendo utilizada para quantificá-lo. adotadas para aumentar a disponibilidade dos dados governamentais, como a criação da Infraestrutura Nacional de Dados Abertos [1], que é a política do governo brasileiro para dados abertos e tem como finalidade garantir e facilitar o acesso pelos cidadãos, pela sociedade e em especial pelas diversas instâncias do setor público aos dados e informações produzidas ou custodiadas pelo Poder Executivo federal. Aliado a essa diversidade de nomenclaturas e unidades de medidas, soma-se o fato de muitas vezes aparecerem termos que podem dificultar a classificação correta de uma determinada compra. Por exemplo, “impressora para folha de papel A4” pode ser erroneamente classificada como “folha de papel A4”. Porém, essas iniciativas por si só não garantem um aumento efetivo do grau de informação que a população tem das atividades governamentais. Isso acontece porque a maioria dos dados disponibilizados para a população não foram concebidos com esse propósito. Tais informações são oriundas de sistemas coorporativos cujo objetivo é propiciar o controle administrativo das contas públicas e por isso nem sempre o seu formato é o mais apropriado para a população entender o que realmente elas representam. Tabela 1. Diferentes formas de indicar um mesmo material 0000000001,00000 RESMA 500,00 FL PAPEL IMPRESSÃO, MATERIAL CELULOSE VEGETAL, TIPO A4, GRAMATURA 75 G/M2, COMPRIMENTO 297 MM, APLICAÇÃO JATO TINTA, COR BRANCA, LARGURA 210 MM MARCA: s/m 0000000400,00000 CAIXA 5.000,00 FL PAPEL A4, MATERIAL PAPEL ALCALINO, COMPRIMENTO 297 MM, LARGURA 210 MM, APLICAÇÃO IMPRESSORA JATO TINTA, GRAMATURA 75 G/M2 MARCA: 86,00000 CAIXA 10,00 RES PAPEL A4, MATERIAL PAPEL ALCALINO, GRAMATURA 75 G/M2, COR BRANCA MARCA: chamex Atualmente, ainda não existe uma solução para esse tipo de problema. As principais iniciativas no sentido de melhorar a qualidade das informações dos portais de transparência são descritas em [9] e [10], porém esses trabalhos possuem enfoques mais específicos, em que o principal objetivo é identificar qual é o preço médio pago pela Administração em um conjunto prédeterminado de produtos. 10,00000 Milheiro PAPEL Papel oficio tam A4 MARCA: CHAMEX 85,00000 RM PAPEL Papel impressão, material celulose vegetal, tipo a4, gramatura 75, comprimento297, aplicação jato tinta, cor branca, largura 210 MARCA: REPORT 4,00000 PACOTE PAPEL PAPEL, VERGE 120G A4 CREME PCT.C/50FLS. MARCA: PFFICEPAPER 50,00000 cx PAPEL PAPEL BRILHANTE PARA IMPRESSORA JATO DE TINTA GLOSSY PAPER A4 MEDINDO 210 X 297 MM CX COM 50 MARCA: OFF PAPER O objetivo desse trabalho é desenvolver e implementar uma técnica que permita a identificação de forma automatizada dos produtos e suas características a partir das especificações textuais dos gastos governamentais que são apresentadas nos diversos sites de transparência pública. O restante deste trabalho está organizado da seguinte forma: a seção 2 apresenta o problema a ser tratado; a seção 3 descreve a proposta de solução desse problema; enquanto que as seções 4 e 5 explicam a forma de avaliação da solução e os trabalhos já realizados. Finalmente a seção 6 faz a conclusão do trabalho. Resumindo, o problema descrito nessa seção refere-se à dificuldade de identificação do que está sendo comprado, bem como da unidade de medida utilizada para quantificar tais produtos. Essas limitações inviabilizam comparações entre os diversos atributos que compõem uma determina compra (tais como: valor, fornecedor, comprador, unidade da federação, data e etc.) com o produto que está sendo adquirido. 2. APRESENTAÇÃO DO PROBLEMA 3. PROPOSTA DE SOLUÇÃO Diariamente, os diversos portais de transparência pública disponibilizam centenas de milhares de registros. Só o Portal da Transparência do Governo Federal [8] apresenta cerca de 46 mil novos registros a cada dia. Na solução do problema exposto, pretende-se utilizar técnicas de mineração de texto para realizar a categorização das compras apresentadas nos portais de transparência. Ou seja, cada compra realizada pelo governo possuirá um identificador que especificará de forma clara o que está sendo comprado. Logo, uma informação que era textual e de difícil tratamento passará a apresentar as características de um dado estruturado na forma de uma variável qualitativa. No entanto, essas informações não são todas estruturadas e fáceis de serem tratadas. Algumas das informações mais relevantes na identificação de uma determinada compra vêm descritas em formato de texto, o que dificulta a comparação de compras de produtos similares. O processo de mineração de texto seguirá as fases descritas em [4], e consistirá de Preparação dos dados, Análise de dados, Processamento de dados e Pós-processamento de dados. O fato dos produtos serem descritos por campos de texto livre faz com que o mesmo tipo de produto seja designado de forma diferente e muitas vezes com unidades de medidas distintas. Em algumas situações, apesar de se utilizar a mesma unidade de medida, essas são escritas de formas diferentes, o que as tornam distintas para mecanismos de comparação automatizados. A tabela 1 ilustra essa situação através da apresentação de diferentes formas de se designar um mesmo produto. A fase de preparação será dividida em duas etapas. A primeira fará a seleção dos gastos referentes a compras de materiais (visto que, existem outros tipos de gastos que não dizem respeito à compra de produtos, como por exemplo contratação de serviços e pagamento de pessoal) e a extração de algumas informações úteis ao processo de classificação subsequente, baseadas nas técnicas enunciadas por [2] e [5]. Já a segunda etapa será composta pelas atividades clássicas de pré-processamento que antecedem a minerações de dados textuais. Na tabela, pode-se verificar que além das diferentes maneiras de se designar o mesmo produto (no caso folha de papel A4), esse produto pode ser quantificado de várias formas distintas (RESMA 500,00 FL, CAIXA 5.000,00 FL, CAIXA 10,00 RES, Milheiro, RM, Cx, PACOTE), o que torna o problema mais complexo, pois além da qualificação do produto que está sendo especificado na A pesquisa não considerará os contratos de prestação de serviços pelo fato desses apresentarem grande variabilidade de características que fazem com que cada contratação seja única. 15 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Nas fases de análise e processamento de dados, os diversos algoritmos de mineração e possíveis variações serão testados a fim de se obter a configuração que melhor se comporte com o conjunto de dados do problema que está sendo tratado. Outro trabalho também já desenvolvido foi [7]. O artigo em questão propõe uma arquitetura para a integração dos dados do Portal da Transparência do Governo Federal e serve como suporte para a utilização de informações oriundas de diferentes fontes para auxiliar na identificação dos produtos. A parte do pós-processamento será responsável pela agregação dos resultados obtidos, para que estes possam ser apresentados em formatos visualmente atrativos. 6. CONCLUSÃO O projeto de pesquisa em questão pretende desenvolver uma técnica de identificação automática de produtos a partir das descrições textuais das compras governamentais que são apresentadas nos portais de transparência pública. 4. PROJETO DE AVALIAÇÃO A avalição será feita através da aplicação da técnica desenvolvida em um conjunto de dados do Portal da Transparência do Governo Federal (www.transparencia.gov.br). Nessa fase, será utilizada uma amostra de especificações textuais de gastos apresentados no Portal da Transparência do Governo Federal, com as respectivas identificações dos produtos e suas características, feitas de forma manual. O resultado desse trabalho trará contribuições científicas e tecnológicas. Quanto a parte científica, pretende-se agregar ao corpo de conhecimento uma nova técnica que permita a extração de informações relevantes a partir de grandes volumes de dados estruturados e não estruturados. A solução proposta será empregada no conjunto de dados préselecionados, a fim de se obter o produto, bem como as suas respectivas características em cada uma das descrições textuais da amostra utilizada para a avaliação. Já com relação à contribuição tecnológica, o objetivo é que a solução proposta seja incorporada à infraestrutura de atualização do Portal da Transparência do Governo federal, permitindo uma qualificação em tempo real das compras feitas pelo Governo. Tal procedimento incrementará a transparência governamental, trazendo assim benefícios para a democracia e para a sociedade como um todo. O resultado obtido pela aplicação da técnica desenvolvida será comparado com a identificação dos produtos e suas características (feitas de forma manual), a fim de se verificar a qualidade dos resultados obtidos pela aplicação da técnica automatizada. 7. REFERÊNCIAS A avaliação utilizará uma abordagem empírica e empregará técnicas quantitativas e qualitativas. As técnicas quantitativas serão aplicadas para a verificação da precisão e da acurácia dos resultados obtidos no processo proposto. Já as técnicas qualitativas terão o objetivo de avaliar em que situações a solução proposta se comporta bem e em que situações ela não apresenta bons resultados, visto que o conjunto de dados a ser tratado é muito heterogêneo, fazendo com que a identificação seja mais fácil em algumas situações e com maiores graus de dificuldade em outras. [1] Batista, A.H., Silva, N.B. da and Miranda, C.M.C. 2013. Infraestrutura nacional de dados abertos. (2013). [2] Etzioni, O., Cafarella, M., Downey, D., Popescu, A.-M., Shaked, T., Soderland, S., Weld, D.S. and Yates, A. 2005. Unsupervised named-entity extraction from the web: An experimental study. Artificial intelligence. 165, 1 (2005). [3] Han, J., Kamber, M. and Pei, J. 2011. Data mining: concepts and techniques. Elsevier. [4] Lopes, M.C.S. 2004. Mineração de dados textuais utilizando técnicas de Clustering para o idioma português. 2004. Tese (Doutorado em Engenharia Civil)-Faculdade de Engenharia Civil, Univer-sidade Federal do Rio de Janeiro, (2004). A abordagem de avaliação também irá combinar características descritivas e explanatórias. A parte descritiva refere-se a análise quantitativa dos dados e será responsável pela verificação da acurácia e precisão da solução. Já a parte explanatória terá o objetivo de justificar as situações em que a abordagem proposta obteve bons resultados e as situações em que ela não obteve resultados satisfatórios (identificadas com o emprego das técnicas qualitativas). [5] Munková, D., Munk, M. and Vozár, M. 2013. Data preprocessing evaluation for text mining: Transaction/sequence model. Procedia Computer Science. 18, (2013), 1198–1207. [6] Paiva, E. and Revoredo, K. 2016. Big Data e Transparência: Utilizando Funções de Mapreduce para incrementar a transparência dos Gastos Públicos. (SBSI 2016). Aceito para publicação. 5. ATIVIDADES REALIZADAS Já foram feitos alguns experimentos com a base de dados em questão. Primeiramente, utilizou-se uma pequena amostra a fim de se avaliar o comportamento de alguns algoritmos de classificação e de clusterização descritos em [3]. No entanto, devido à grande quantidade de diferentes produtos (classes) que podem aparecer nos dados do portal, os resultados não foram satisfatórios. [7] Paiva, E., Revoredo, K. and Baião, F. 2016. DW-CGU: Integração dos Dados do Portal da Transparência do Governo Federal. (submetido à revista Isys, Revista Brasileira de Sistemas de Informação). [8] Portal da Transparência nos Recursos Públicos Federais: 2004. http://transparencia.gov.br/. Acessado: 12/04/2016. Paralelamente, também foi testado a aplicação de técnicas de processamento de grandes volumes de dados textuais utilizandose a base de dados do Portal da Transparência do Governo Federal, relativa ao período de um ano, para a identificação das compras realizadas, obtendo-se resultados promissores [6]. O intuito desse experimento foi testar a viabilidade da solução a ser empregada para grandes volumes de dados, pois de nada adiantaria o desenvolvimento da técnica sem a possibilidade de emprego no conjunto de dados que se pretende utilizar. [9] Rommel Carvalho, Eduardo de Paiva, Henrique da Rocha and Gilson Mendes 2014. Using Clustering and Text Mining to Create a Reference Price Database. Learning and NonLinear Models. 12, (2014), 38–52. [10] Rommel, Carvalho, de Paiva, E., da Rocha, H. and Mendes, G. 2013. Methodology for Creating the Brazilian Government Reference Price Database. (2013). 16 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Jogos Digitais Para Participação Cidadã em Processos de Prestação de Serviços Públicos Alternative Title: Digital Games For Citizen Participation in Public Service Delivery Processes Tadeu M. de Classe Renata Araujo Núcleo de Pesquisa e Inovação em Ciberdemocracia Programa de Pós-Graduação em Informática Universidade Federal do Estado do Rio de Janeiro (UNIRIO) Rio de Janeiro – Brasil [email protected] Núcleo de Pesquisa e Inovação em Ciberdemocracia Programa de Pós-Graduação em Informática Universidade Federal do Estado do Rio de Janeiro (UNIRIO) Rio de Janeiro – Brasil [email protected] possible mechanisms to support the participation of citizens and improve the delivery of services by organizations. However, to create digital games for citizen participation in public service delivery isn't an easy issue. There is the need to create a digital game engineering process, which can contribute with the creation and evaluation of these games, in order to verify improvements in citizen participation in public services. RESUMO Atualmente em um ambiente cada vez mais conectado as organizações (públicas ou não) buscam uma maior interação com seus clientes através do uso de TICs. As tecnologias sociais aplicadas a sistemas de gerenciamento de processos de negócios podem apoiar inovações e melhorias de processos organizacionais por meio de iniciativas dos próprios usuários. Várias são as propostas de iniciativas voltadas à participação eletrônica, entretanto, seu uso não acontece de maneira efetiva. Devido ao caráter motivacional existente em jogos, os mesmos são vistos como possíveis mecanismos para apoiar a participação dos cidadãos e melhorar a entrega de serviços pelas organizações. Porém, construir jogos digitais para a participação cidadã em processos de prestação de serviços públicos, não é uma tarefa trivial. Existe a necessidade de conceber processos de engenharia de jogos digitais que possam contribuir na elaboração e avaliação destes jogos, visando melhorias na participação dos cidadãos em processos públicos. Categories and Subject Descriptors K.8.0 [General]: Games. General Terms Management, Human Factors, Design. Keywords Social BPM, e-Participation, Public Service Delivery, Serious Game, Digital Games Engineering. Palavras-Chave 1. INTRODUÇÃO Social BPM, Participação Eletrônica, Prestação de Serviços Públicos, Jogos Sérios, Engenharia de Jogos Digitais. Hoje, em um ambiente cada vez mais conectado, mudanças na forma de criar e disseminar conhecimento acontecem de maneira muito rápida uma vez que Tecnologias de Informação e Comunicação (TICs) aliadas as mídias sociais influenciam diretamente no relacionamento das pessoas [1]. Neste sentido, oportunidades para que as organizações inovem em seus processos e que seus clientes possam adquirir autonomia e satisfação junto aos serviços prestados pelas instituições são muitas [2]. ABSTRACT Today with an increasing connected environment, the institutions (publics or not) are looking for a higher interaction with their clients through the use of ICTs. Once social technologies used with business process management systems can provide support to innovation and improvement of organizations process, as of own users. There are many proposals of initiatives about electronic participation, however its use do not happen effectively. Due to the existing motivational character in games, they are seen as Estas oportunidades emergentes não passam despercebidas pelas instituições, onde a interação com seus clientes é sempre um alvo a ser perseguido [6]. Tratando-se dos processos organizacionais (instituições sendo públicas ou não), as tecnologias sociais vêm sendo vistas como possibilidade de serem empregadas junto a sistemas de gerenciamento de negócios (Social BPM) na tentativa de fazer com que os indivíduos que necessitam destes processos consigam entender, aprender e contribuir na sua concepção e melhorias [3]. Entretanto este cenário de colaboração entre sociedade civil e instituições públicas não é o que acontece na prática, pois devido as questões históricas e culturais existe um afastamento entre estes dois atores [5]. Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2016, May 17–20, 2016, Florianópolis, Santa Catarina, Brazil. Copyright SBC 2016. 17 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 A literatura sugere várias pesquisas e iniciativas que foram desenvolvidas para encorajar a participação democrática do cidadão nos processos públicos [7][8]. A aplicação de técnicas de Gamificação (uso de mecânicas e elementos de jogos em contextos não jogáveis [9]) e a utilização de jogos sérios (uso de jogos em contextos sérios [16]) são apontadas como possíveis abordagens para a aproximação, motivação e engajamento do cidadão nas propostas governamentais [10]. Process Management (BPM) para a melhoria e eficiência de seus processos [18]. Abordagens sociais e participativas voltadas ao gerenciamento de processos de negócios (Social BPM) [19] vêm sendo sugeridas como estratégias organizacionais para flexibilizar a interação com seus clientes na execução de seus processos [13]. Pflanz e Vossen [2] em suas pesquisas destacam que existem desafios a serem solucionados para a Social BPM dentre eles está a compreensão dos processos por leigos e o envolvimento dos usuários com os processos. Os desafios da Social BPM se tornam maiores ao considerar os cidadãos como usuários, pois entre cada um deles existem individualidades que remetem a cultura e contexto, além da complexidade de cada serviço a ser abordado [13]. Neste sentido, este trabalho visa abordar os jogos sérios como fator motivacional para a participação e compreensão de processos de prestação de serviços públicos pelo cidadão. Mais precisamente, este trabalho visa o desenvolvimento um processo de engenharia de jogos digitais que possam evidenciar o benefício da utilização de jogos neste contexto. Segundo os estudos de Hamari e colaboradores [10] os jogos possuem grande potencial para tarefas motivacionais, possibilitando o aprendizado e engajamento das pessoas. Embora existam iniciativas voltadas à participação e engajamento dos cidadãos (Participa.br1, Dialoga Brasil2, Plataforma Brasil3, Visão Rio 5004 e Desafio Ágora Rio5), nem sempre elas ocorrem de maneira desejada [1][20]. Neste sentido, Freire e Stabile [21] desenvolveram uma pesquisa sobre o uso de plataformas sociais com cerca de 200 participantes. Como resultados eles observaram que 31,7% dos usuários nem sequer acessaram o portal para alguma discussão, ou seja, não participaram ativamente da plataforma. 2. APRESENTAÇÃO DO PROBLEMA Democracia eletrônica pode ser entendida como o conjunto de discussões, teorias e tecnologias (TICs) utilizadas para a mediação entre instituições públicas e sociedade civil [29]. As TICs podem ser utilizadas para prestação de serviços, transparência de informações e a participação dos cidadãos [4], contribuindo para a melhoria dos processos públicos, uma vez que estes processos deveriam ser pensados para os cidadãos. Desta maneira, os cidadãos poderiam debater os serviços prestados, propondo melhorias, avaliando e acompanhando as políticas públicas [11]. Tal aumento da participação popular gera um “empoderamento” dos cidadãos, onde os próprios podem influenciar nos processos públicos e políticas governamentais [12]. Sendo assim, com os dados apresentados, percebe-se que existe um problema na participação e engajamento do cidadão que necessita ser analisado, tanto no quesito da instituição não considerar o mesmo como possível parceiro útil para a melhoria de seus processos, quanto pelo lado do cidadão que não se sente motivado a participar dos processos organizacionais. O uso de jogos (jogos sérios) ou de elementos de jogos (gamificação) é apontado como possível mecanismo que auxilia na tentativa de melhorar a participação cidadã [15], atraindo-os para a resolução de problemas e motivando-os a serem mais participativos através de atividades lúdicas. Neste sentido, encontramos o problema de como desenvolver tais jogos no contexto brasileiro considerando a participação e os processos organizacionais públicos? O governo federal brasileiro, diversas representações estaduais e municipais, e diversas instituições públicas nos últimos anos têm tentado realizar melhorias significativas na prestação de serviços públicos com o ideal de aproximação com a sociedade. O Decreto 8423/2014 [14] da Presidência da República foi declarado a fim de instituir a Política Nacional de Participação Social (PNPS), no intuito de fortalecer o diálogo entre administração pública e sociedade civil. Entretanto, a participação social em assuntos governamentais ainda é uma pauta desafiadora [1]. As organizações julgam que os cidadãos são inaptos para contribuir com os seus processos, enquanto os cidadãos concordam que tais processos são demasiados burocráticos, complexos, desinteressantes e nada motivadores [6]. 3. PROPOSTA DE SOLUÇÂO Baseando-se na pesquisa de Hamari e colaboradores [10] em que os jogos são estudados como mecanismos potenciais para a motivação dos usuários, conseguindo engajá-los em tarefas diversas e promover o aprendizado e a conscientização, é pensada tal proposta de solução. Jogos são sistemas baseados em regras cujo propósito é envolver as pessoas na solução de conflitos [22]. Apesar do propósito básico de entretenimento, são utilizados com propósitos diversos, como: educação, política, treinamento, conscientização, propaganda etc. [23][24]. Esta classe de jogos recebe o nome de jogos sérios (serious games) [16], ou seja, jogos que foram desenvolvidos com propósitos e objetivos sérios. Em se tratando de instituições públicas, existe a cobrança prestação de serviços através do fornecimento de informações online sobre os serviços prestados, com o intuito de aproximar o cidadão da instituição. Os dados do último relatório sobre o uso de TICs no setor público brasileiro realizado pelo CGI.BR [17] mostram que apenas 66% dos portais governamentais prestam serviços pelos seus sites, e que dos serviços oferecidos, 69% são documentos on-line e formulários, 43% são formulários eletrônicos, 37% são geração de taxas bancárias, 29% são consultas de andamentos processuais, 22% de requisição de documentação oficial, dentre outras. Tais dados mostram o pouco ou nenhum envolvimento do cidadão com as organizações públicas. A literatura comumente sugere etapas para o desenvolvimento de jogos [25], as quais compreendem basicamente: Concepção: objetivo de concepção do jogo levando em consideração os 1 Participa.br: http://www.participa.br/ Brasil: http://dialoga.gov.br/ 3 Plataforma Brasil: https://plataformabrasil.org.br/ 4 Visão Rio 500: http://www.visaorio500.rio/ 5 Desafio Ágora Rio: https://desafioagorario.crowdicity.com/ 2Dialoga Como já mencionado, as organizações públicas possuem os mais variados processos para a prestação e entrega de serviços para a comunidade. Apesar disso, poucas fazem o uso de Business 18 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 principais aspectos do framework MDA [26], ou seja, suas Mecânicas (ações do usuário relacionado às regras do jogo), Dinâmicas (representa os temas, a ambientação e a narrativa do jogo) e Asthetics - estética - (representam as respostas emocionais do jogador ao jogar); Pré-produção: consiste na elaboração de prototipação do jogo; Produção: consiste no desenvolvimento do jogo na tecnologia selecionada; e Avaliação: consiste na avaliação da qualidade do produto e público alvo. necessários a averiguação e criação de métricas de qualidade para a proposta. Tais métricas podem ser colhidas através da observação direta do uso dos protótipos pelos seus jogadores, e além disso, os mesmos podem participar de pesquisas qualitativas que visem julgar se o comportamento pensado na concepção do jogo realmente é compatível com o sentimento psicológico gerado pelo jogo. 5. ATIVIDADES REALIZADAS A proposta de solução nesta pesquisa é a possibilidade de desenvolvimento de um processo de engenharia de jogos digitais voltados para a participação cidadã em processos de prestação de serviços públicos. Este processo de engenharia de jogos engloba a criação de modelos teóricos para a conceitualização de mecânicas, dinâmicas e estéticas (framework MDA [26]); a prototipação de jogos digitais; e métricas de qualidade visando averiguar o impacto dos jogos desenvolvidos sobre os cidadãos. Considerando a metodologia de pesquisa aqui apresentada, atividades como aquisição de conhecimento e realização de mapeamento sistemático da literatura envolvendo temas como BPM, participação eletrônica e gamificação já foram realizadas [15], foram encontrando trabalhos que utilizando jogos ou gamificação em diversos contextos, porém, não utilizando junto de propostas de organizações públicas. Até o desenvolvimento desta proposta, a pesquisa encontra-se na fase de obtenção de conhecimento e apropriação de conceitos sobre o desenvolvimento de jogos digitais e participação eletrônica dos cidadãos. A metodologia de pesquisa será baseada nas premissas do Design Science Research (DSR) [27], na qual se baseia na criação ou desenvolvimento de artefatos orientados à resolução de problemas. No DSR os artefatos são projetados com bases em conjecturas teóricas e a avaliação de tais artefatos fornece dados sobre as conjecturas contribuindo com o aumento do conhecimento científico e tecnológico [28]. Como parte do entendimento sobre os conceitos de jogos e seus elementos, e explorar o uso da DSR, foi realizado trabalho envolvendo gamificação de um portal de participação eletrônica na UNIRIO6. Neste trabalho, foi aplicado um experimento onde o objetivo era verificar indícios de que a gamificação pode ser um fator motivador para os cidadãos. Lições como, por exemplo, que elementos de jogos geraram maior participação; quais fatores desmotivaram os usuários a utilizá-la; o uso de motivações intrínseca e extrínseca podem, ao mesmo tempo motivar uns e desmotivadoras outros, foram obtidos [30]. Sendo assim, a metodologia a ser seguida é: i) entender o estado da arte (revisão da literatura); ii) identificação de processos existentes (identificar processos de desenvolvimento jogos digitais existentes); iii) propostas de artefatos para a solução do problema (propor processo que possa ser aplicado na construção de jogos digitais para a prestação de serviços voltados para a participação do cidadão); iv) projeto do artefato (projetar e entender o processo pensado); v) desenvolver o artefato (desenvolvimento do processo); vi) avaliação do artefato (desenvolvimento de protótipos e averiguação de qualidade sob o processo de engenharia de jogos desenvolvido); vii) explicitação da aprendizagem (formalização e explicitação da aprendizagem); viii) conclusões (formalização dos resultados e decisões tomadas); ix) generalização (generalizar o processo para outras instituições a fim de averiguar se o mesmo é viável para outros contextos); x) comunicação (ao longo de todo o processo, divulgação dos resultados obtidos). 6. CONCLUSÃO A proposta deste trabalho visa desenvolver um processo para o desenvolvimento de jogos digitais para a participação do cidadão em processos de prestação de serviços públicos. Com este processo se espera seja possível desenvolver protótipos de jogos digitais e avaliá-los por meio de métricas se houve impactos positivos na participação do cidadão. Para tal é sugerida uma abordagem baseada nas premissas do Design Science Research onde, será pensado um artefato (modelos de desenvolvimento de jogos) a fim de contribuir com conhecimento para a resolução do problema de participação cidadã em processos públicos (utilização dos jogos digitais). 4. AVALIAÇÃO DA SOLUÇÃO Com o intuito de avaliar a solução proposta, é sugerido que um estudo qualitativo com o público alvo (cidadãos) seja realizado a fim de averiguar qual seria o comportamento e sentimento desejado ao se executar um serviço provido por uma instituição pública. Com este trabalho é esperado que as seguintes contribuições sejam alcançadas: i) para a área de desenvolvimento de jogos digitais, modelos, ferramentas de desenvolvimento e métricas que sejam úteis para a construção, elaboração e qualidade no desenvolvimento de jogos digitais para contextos de participação social; ii) para a área de Social BPM, espera-se contribuir com conhecimentos relacionados aos desafios de participação dos usuários na interação com as organizações, uma vez que as regras de processos das instituições públicas devem ser traduzidas para as regras do jogo, ou seja, simplificadas; iii) nas área de participação eletrônica, espera-se contribuir com métodos, tecnologias de interação social e jogos que possam ser utilizadas para aproximação entre instituição pública e cidadão. De posse destes dados é esperado que o processo de engenharia de jogos digitais voltados para a participação cidadão para o processo de prestação de serviços públicos possa ser desenvolvido. De posse de tal processo será necessário a aplicação de um novo estudo de caso para o desenvolvimento de protótipos de jogos digitais. Assim, por meio dos dados colhidos com a aplicação dos protótipos, será possível obter indicativos iniciais de sua utilidade, permitindo avaliar o processo e realizar melhorias. Após isso, é pensado em aplicar os protótipos em um público alvo dentro de um contexto específico a fim de averiguar se o MDA empregado no protótipo cumpre realmente o esperado previsto no processo de engenharia do jogo. Neste momento, se tornam 6 19 https://sourceforge.net/projects/ouvidoria-social/ IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Simpósio Brasileiro de Sistemas Colaborativos (SBSC), p. 130-137. REFERÊNCIAS [1] Effing, R., Hillegersberg, J. Van and Huibers, T. 2011. Social Media and Political Participation: Are Facebook, Twitter and YouTube Democratizing Our Political Systems?.ePart 2011. April 2011 (2011), 25–35. [16] Abt, C.C. 1970. Serious Games. Viking Press, New York, NY, 1st ed. [17] CGI.BR. 2013. ICT Electronic Government 2013: Survey on the Use of Information and Communication Technologies in the Brazilian Public Sector, Comitê Gestor de Internet no Brasil, available at:http://www.cgi.br/media/docs/publicacoes/2/TIC_eGOV_ 2013_LIVRO_ELETRONICO.pdf (accessed 2016-03-18). [2] Pflanzl, N. and Vossen, G. 2014. Challenges of Social Business Process Management. 2014 47th Hawaii International Conference on System Sciences. (2014), 3868– 3877. [3] Araujo, R.M. De and Magdaleno, A.M. 2015. Social BPM: Processos de Negócio , Colaboração e Tecnologia Social. Simpósio Brasileiro de Sistemas de Informação (SBSI). 4, (2015). [18] Gespública. 2016. Modelo de Excelência em Gestão Pública. Disponível em: https://conteudo.gespublica.gov.br/pagina.2014-0606.9098653097. Acesso em: 11 de abr de 2016. [4] Araujo, R., Cappelli, C., Diirr, B., Engiel, P., Tavares, R. 2011. Democracia Eletrônica. In Pimentel, M., Fuks, H. Sistemas Colaborativos. Elsevier Brasil, 2011, 110-121. [19] Richardson, C. 2011. Social BPM: Work, Planning and Collaboration Under the Impact of Social Technology, (Fisher, L.,Ed.). Future Strategies Inc., Lighthouse Point, FL, 1st ed. [5] Magdaleno, A.M. andAraujo, R.M. De 2015. Ecossistemas Digitais para o Apoio a Sistemas de Governo Abertos e Colaborativos. SimpósioBrasileiro de Sistemas de Informação (SBSI). 1, (2015). [20] Nielsen, J. 2006. Participation inequality: Encouraging more users to contribute. Jakob Nielsen’s alertbox, 9, 2006. [6] Santos, A.C.; Zambalde, A.L.; Veronese, R.B.; Botelho, G.A.; Souza Bermejo, P.H. 2015. “Open Innovation and Social Participation: A Case Study in Public Security in Brazil.Electronic Government and the Information Systems Perspective, p. 163-173. [21] Freire, F. R., Stabile, M. 2013. As novas Tecnologias e a Participação Eletrônica: entre Promessas e Desafios. Comitê Gestor da Internet no Brasil, p. 47-56. Disponível em: <http://www.cgi.br >. Acesso em: 01 de dez. 2015. [7] ITS. 2015. Civviki - a Wiki Cívica. http://itsrio.org/civviki/index.php. Accessed: 2016-03-18. [22] Salen, K. and Zimmerman, E. 2003. Rules of Play - Game Design Fundamentals. The MIT Press, Cambridge, MA, 1st ed. Scherer, S. and Wimmer, M [8] Araujo, R.M.; Taher, Y.; Heuvel, W.V.D.; Cappelli, C. 2013. Evolving Government-Citizen Ties in Public Service Design and Delivery. IFIP EGOV Conference, p. 19-26. [23] Michael, D. and Chen, S. 2005. Serious Games - Games that Educate, Train, and Inform. Thomson Course Technology PTR, Boston, MA, 1st ed. [9] Deterding, S., Dixon, D., Khaled, R. and Nacke, L. 2011. From game design elements to gamefulness. Proceedings of the 15th International Academic MindTrek Conference on Envisioning Future Media Environments - MindTrek ’11. (2011), 9–11. [24] Thiel, S. 2015. Gamified participation: investigating the influence of game elements in civic engagement tools. Proceedings of the 2015 ACM International Joint Conference on Pervasive and Ubiquitous Computing, p. 527532. [10] Hamari, J., Koivisto, J. andSarsa, H. 2014. Does gamification work? - A literature review of empirical studies on gamification. Proceedings of the Annual Hawaii International Conference on System Sciences. (2014), 3025– 3034. [25] Mastrocola, V.M. 2012,Ludificador – Um guia de referências para o game designer brasileiro. São Paulo. Edição do Autor. [26] Hunicke, R., Leblanc, M., Zubek, R. 2004. MDA: a formal approach to game design and game research. In: Proceedings of the AAAI Workshop on Challenges in Game AI, v.4. [11] Santos, J. U. D. L., Corso, K. B., Behr, A., Farias, E. S. 2015. CIDADÃOS EM REDE: o gabinete digital do Estado do Rio Grande do Sul como instrumento de democracia digital. Revista Democracia Digital e Governo Eletrônico, v. 1(12), p. 150-182. [27] Dresch, A., Lacreada, D. P., Atunes Júnior, J. A. 2015. Design Science research: método de pesquisa para avanço da ciência e tecnologia, Porto Alegre: Bookman. [12] Sæbø, Ø., Rose, J. and Skiftenes Flak, L. 2008. The shape of eParticipation: Characterizing an emerging research area. Government Information Quarterly. 25, 3 (2008), 400–428. [28] Rocha, E. B., Pimentel, M., Diniz, M. C., Santoro, F. M. 2015. Design Science Research para o Desenvolvimento de um Modelo da Participação em Bate-papo. iSys-Revista Brasileira de Sistemas de Informação, v. 8(1), p. 18-41 [13] Araujo, R., Taher, Y. 2014. Refining IT Requirements for Government-Citizen Co-participation Support in Public Service Design and Delivery. Conference for E-Democracy and Open Governemen, v.61. [29] Silva, S. P. 2005. Graus de Participação Democrática no Uso da Internet Pelos Governos das Capitais Brasileiras. Opinião Pública, 11(2), p. 450-468. [14] Brasil, Decreto nº 8243, de 23 De Maio De 2014. http://www.planalto.gov.br/ccivil_03/_Ato20112014/2014/Decreto/D8243.htm. Accessed: 2015-03-18. [30] Classe, T.; Silva, J.; Pimentel, M.; Araujo, R. 2016. Uma Experiência de uso da Gamificação em Plataformas de Participação Social. iSys Revista Brasileira de Sistemas de Informação - Edição Especial Governo Eletrônico. [15] Classe, T., Araujo, R. .2015. Gamificação Para Participação Social Em Processos Públicos: Mapeamento Sistemático. 20 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Um Método de Elicitação de Requisitos para Ambientes Virtuais de Participação Social Alternative Title: A Elicitation Method Requirements for Virtual Environments Social Participation Jonas Silva Renata Araujo Programa de Pós-Graduação em Informática (PPGI) Sistemas de Informação de Governo Abertos e Colaborativos (SIGAC) Núcleo de Pesquisa e Inovação em Ciberdemocracia (CIBERDEM) – UNIRIO – Rio de Janeiro – RJ – Brasil Programa de Pós-Graduação em Informática (PPGI) Sistemas de Informação de Governo Abertos e Colaborativos (SIGAC) Núcleo de Pesquisa e Inovação em Ciberdemocracia (CIBERDEM) – UNIRIO – Rio de Janeiro – RJ – Brasil [email protected] [email protected] (TICs) tem gerando transformações significas na sociedade, as pessoas estão dedicando cada vez mais tempo do dia para interagir no ciberespaço, o que ocasiona mudanças em diversos hábitos sociais, entre estes, na forma com que as pessoas se comunicam, exercem suas atividades profissionais, demandam serviços públicos, tem acesso à informação e ao conhecimento. RESUMO A participação cidadã no contexto de políticas públicas e serviços públicos está sendo cada vez mais estimulada pela sociedade e por iniciativas governamentais nacional e internacionais, principalmente com o uso de tecnologias da informação e comunicação, o que pode gerar uma demanda crescente por desenvolvimento de ambientes virtuais de participação social (AVPs). Nesta pesquisa é proposto um método baseado em Design Thinking para elicitação e documentação de requisitos para AVPs com o objetivo de contribuir para o aumento do impacto social positivo destes ambientes virtuais. Os governos também são alcançados por essas transformações sociais e estão buscando alternativas para evoluir a gestão pública, como a Parceria para Governo Aberto ou OGP (Open Government Partnership), iniciativa internacional fundada por oito países, entre eles o Brasil, lançada em 2011. Esta possui o objetivo de difundir e incentivar globalmente práticas governamentais relacionados à transparência dos governos, acesso à informação pública e à participação social [2]. Palavras-chave Participação eletrônica, engenharia de requisitos, Design Thinking, ambientes virtuais de participação social. Conforme a OGP, a participação cidadã ou participação social se refere à mobilização da sociedade para debater, colaborar e propor soluções que contribuam para tornar o governo mais efetivo e responsivo, implicando na elaboração de políticas públicas mais adequadas ao seu contexto de atuação, na melhoria de serviços públicos, em maior economicidade na aplicação de recursos, entre outros desdobramentos. ABSTRACT The citizen participation in the context of public policies and public services is being increasingly encouraged by the society and national and international governmental initiatives, particularly with the use of information and communication technologies, which can lead to an increasing demand for development of virtual environments social participation (AVPs). In this research is proposed a method based on Design Thinking for elicitation and documentation requirements for AVPs in order to contribute to increasing the positive social impact of these virtual environments. Diversas experiências de participação cidadã com o uso de tecnologias estão sendo experimentadas, também denominada participação eletrônica (e-participação), que é definida como a interação mediada por TICs entre a sociedade civil e o ciclo de políticas públicas, serviços públicos e o processo político formal, possuindo como principal objetivo o aumento da capacidade de participação (empoderamento) dos cidadãos nestes espaços [10][14]. Categories and Subject Descriptors H.4.0 [Information Systems Applications]: General. Keywords Os sistemas de informação disponibilizados, principalmente, na Web e para dispositivos móveis, que viabilizam a participação cidadã, conforme a Política Nacional de Participação Social (PNPS), são denominados ambientes virtuais de participação social (AVPs) [3]. Electronic participation, requirements engineering, design thinking, virtual environments for social participation. 2. APRESENTAÇÃO DO PROBLEMA General Terms Management, Requirements, Design, Human Factors. A pesquisa TIC - Governo Eletrônico 2013, referente ao uso das TICs no setor público, indica que a adoção de mecanismos de eparticipação ainda não alcançou todo o seu potencial no governo brasileiro, pois o percentual de órgãos federais, estaduais e municipais que possuem mecanismos de participação ainda não é expressivo, conforme exposto na Figura 1 [6]. 1. INTRODUÇÃO O uso intensivo de tecnologias da informação e comunicação Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2016, May 17–20, 2016, Florianópolis, Santa Catarina, Brazil. Copyright SBC 2016. 21 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 As instituições integrantes da administração pública estão sendo constantemente incentivadas a apoiar e fortalecer a participação social, a PNPS e a Política de Governança Digital (PGD) no âmbito do governo federal são algumas evidências da relevância deste tema na gestão pública. elicitação e documentação de requisitos em projetos de AVPs e com isso contribuir para o desenvolvimento de soluções mais criativas, que promovam o aumento da participação e do engajamento dos cidadãos nestes espaços, gerando maior impacto social positivo na sociedade. A PNPS, publicada em 2014, tem objetivo de fortalecer e articular o diálogo entre a administração pública federal e a sociedade, nesta são definidos objetivas e diretrizes referentes à participação social; a PGD, publicada em 2016, apresenta entre os seus princípios a inovação, participação e controle social, considerando estes essenciais na formulação, na implementação, no monitoramento e na avaliação das políticas públicas e dos serviços públicos disponibilizados em meio digital [4]. O método será proposto a partir da investigação de atividades, a serem incluídas nas etapas de elicitação e documentação de requisitos de AVPs, que podem contribuir para que os critérios supracitados sejam alcançados. Esta investigação será realizada através da observação direta de cenários reais de projetos de eparticipação, entrevistas semiestruturadas com os seus stakeholders e a condução de um estudo de caso no contexto de desenvolvimento de um ambiente virtual de participação social em uma universidade pública do governo federal. O framework proposto por Araujo e Taher [1] para especificação de requisitos em projetos de e-participação, que associa os níveis de participação, aspectos sociotécnicos e de suporte (colaboração, transparência e memória) referentes às tecnologias que irão suportar tais projetos, também será o referencial teórico para a proposição do método, assim como outros métodos que já forma propostos em estudos científicos. O Design Thinking fornece uma metodologia para extrair as necessidades dos clientes, em vez de requisitos, incentivando a rápida construção de protótipos simples, que podem resultar em soluções inovadoras [15], este possui três fases: Imersão, Ideação e Prototipação. Na imersão é realizado o levantamento, análise e síntese dos dados referentes à solução inovadora a ser construída, na ideação é definido o perfil do público cliente e na última fase, a realidade que foi capturada é representada através de protótipos que propiciam a validação da solução [16]. Figura 1. Proporção de órgãos públicos por forma de participação cidadã pela Internet [6] Na Estratégia de Governança Digital da Administração Pública Federal (EGD) foram estabelecidos os seguintes objetivos estratégicos para participação social no quadriênio 2016-2019: fomentar a colaboração no ciclo de políticas públicas, ampliar e incentivar a participação social na criação e melhoria dos serviços públicos e aprimorar a interação direta entre governo e sociedade; sendo indicado o uso de AVPs [5]. Vetterli e colaboradores [15] suscitaram a importância do uso do Design Thinking nas atividades de engenharia de requisitos, pois este é mais adequada aos atuais sistemas disponibilizados na Web e para dispositivos móveis, que estão em constante mudança, possuem menos funcionalidades, devem atender de forma personalizada as necessidades dos clientes, entre outras características. Conclui-se, diante do exposto, que haverá aumento da demanda por desenvolvimento de AVPs na administração pública e as equipes podem não estar preparadas para absorvê-las, ter dificuldade para identificar requisitos para tais sistemas, pois eles possuem características distintas dos sistemas de informação tradicionais. Um processo para realizar a elicitação de requisitos em ambientes virtuais de aprendizagem móvel baseado em DT e técnicas criativas foi proposto por Souza [13], concluindo, após a realização de um experimento, que técnicas criativas colaboram com elicitação de requisitos e o DT pode ser usado na engenharia de requisitos durante a fase de coleta e análise de requisitos, ajudando na identificação dos problemas relacionado às principais necessidades dos stakeholders, sendo possível adaptá-lo com o acréscimo de técnicas em suas atividades para tratar melhor as informações fornecidas pelos usuários. Os AVPs possuem como critérios de qualidade, entre outros, ambientes virtuais que incentivem a participação e o engajamento dos cidadãos, demandando que sejam superados problemas relacionados a aspectos sociotécnicos para que as iniciativas produzam mudanças sociais sobre o seu contexto de atuação (impacto social), que estão associados a questões culturais, objetivos dos cidadãos e das organizações, o nível de participação planejado, entre outras questões [1]. O engajamento se refere ao envolvimento da sociedade nos assuntos que estão sendo expostos, está muito associado à apropriação dos AVPs pelos cidadãos, se estes têm uma participação contínua nestes ambientes para debater sobre assuntos de interesse público [12]. Meireles [9] investigou a interação entre governo e cidadão mediada por TICs e propôs um conjunto recomendações para a construção de consultas públicas interativas a partir dos conceitos de design de interação, uma das recomendações se refere ao envolvimento dos integrantes dos projetos no processo de desenvolvimento das tecnologias, incluindo os cidadãos que usarão os ambientes virtuais de consulta pública. Desta forma, a questão de pesquisa apresentada nesta proposta é: Um método de elicitação e documentação de requisitos baseado em Design Thinking pode contribuir para a construção de ambientes virtuais de participação social com maior impacto social positivo? 4. PROJETO SOLUÇÃO DE AVALIAÇÃO DA A metodologia de pesquisa a ser usada neste trabalho científico para propor e avaliar o método para elicitação e documentação de requisitos será a design science research (DSR), pois esta é 3. PROPOSTA DE SOLUÇÃO O objetivo inicial desta pesquisa é propor um método baseado nas atividades do Design Thinking (DT) para realizar a 22 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 adequada à construção de novos artefatos, que podem ser constructos, modelos, métodos, instanciações, e a pesquisas orientadas a resolução de problemas [8]. [2] Brasil. Governo Federal. 2016. Parceria para Governo Aberto. Disponível em: <http://www.governoaberto.cgu.gov.br >. Acessado em: 01 de abr. 2016. O método será utilizado na construção de protótipos de AVPs em uma universidade pública federal, onde a sua eficácia será avaliada através de um estudo de caso. Neste serão coletados dados por meio de diversos instrumentos, tais como observação direta, questionário e entrevista, para avaliar se o método proposto contribui para o desenvolvimento de AVPs com maior impacto social positivo, ou seja, despertam maior interesse dos cidadãos em colaborarem em assuntos de interesse público. [3] Brasil. Casa Civil. 2014. Decreto nº 8.243: Política Nacional de Participação Social - PNPS e o Sistema Nacional de Participação Social - SNPS. Brasília, DF. [4] Brasil. Casa Civil. 2016. Decreto nº 8.638: Política de Governança Digital. Brasília, DF. [5] Brasil. 2016. Estratégia de Governança Digital da Administração Pública Federal. Disponível em: <http://www.governoeletronico.gov.br/estrategia-degovernanca-digital-egd/>. Acesso em: 12 de mar. 2016. 5. ATIVIDADES JÁ REALIZADAS Foi realizada uma pesquisa fundamentada em técnicas de mapeamento sistemático, com o objetivo de encontrar na literatura sobre e-participação as metodologias que estão sendo propostas para guiar a construção de sistemas para estas iniciativas, neste foram analisados 17 artigos, contribuindo para ampliar o conhecimento sobre atividades a serem realizadas no desenvolvimento destes sistemas [11]. [6] CGI, Comitê Gestor de Internet do Brasil. 2014. TIC Governo Eletrônico 2013.Disponível em: <http://www.cgi.br/publicacao/pesquisa-sobre-o-uso-dastecnologias-de-informacao-e-comunicacao-tic-governoeletronico-2013/ >. Acesso em: 05 de dez. 2015. [7] Classe, T., Silva, J., Pimentel, M., Araujo, R. 2016. Uma Experiência de uso da Gamificação em Plataformas de Participação Social. Revista Brasileira de Sistemas de Informação (iSys) - Edição Especial Governo Eletrônico (no prelo). Os cenários reais projetos de AVPs também foram analisados através de entrevistas semiestruturadas realizadas com gerentes de projetos do Instituto de Tecnologia e Sociedade do Rio de Janeiro (ITS Rio) e do Laboratório de Participação Social da Prefeitura da Cidade do Rio de Janeiro (LAB.Rio), sendo relatados desafios e problemas a serem superados em iniciativas de participação social, assim como as especificidades destes projetos, que, em geral, são abertos, colaborativos e compostos por equipes multidisciplinares. [8] Dresch, A., Lacreada, D. P., Atunes Júnior, J. A. 2015. Design Science research: método de pesquisa para avanço da ciência e tecnologia, Porto Alegre: Bookman. [9] Meireles, A. V. 2015. Democracia 3.0: interação entre governo e cidadãos mediada por tecnologias digitais. Dissertação de Mestrado. Universidade de Brasília, Brasília, Brasil. Uma pesquisa científica foi realizada para investigar se o uso de elementos de jogos em AVPs pode contribuir para aumentar a participação dos cidadãos nestes ambientes, concluindo, através de um experimento, que o uso de gamificação em AVPs contribui para aumentar a sua audiência, mas também tem efeitos negativos, como a redução da qualidade das publicações em ambientes de reclamação sobre serviços públicos [7]. [10] Sæbø, Ø.; Rose, J.; Flak, L. S. 2008. The shape of eParticipation: Characterizing an emerging research area. Government Information Quarterly, v. 25, n. 3, p. 400-428. [11] Silva, J., Araujo, R. 2015. Metodologias para o Desenvolvimento de Sistemas para Participação Eletrônica: Mapeamento Sistemático. Relatórios Técnicos do Departamento de Informática Aplicada da UNIRIO, v. 8, n. 1, Rio de Janeiro, RJ. 6. CONCLUSÃO A proposta apresentada neste artigo consiste na elaboração de um método baseado em Design Thinking (DT) para realizar a elicitação e documentação de requisitos de AVPs, que contribua para o desenvolvimento de ambientes de participação que tenham impacto social positivo no seu contexto de uso, ou seja, ambientes criativos que incentivem os cidadãos a colaborarem continuamente. [12] Silva, C. M. C., Prado, E. P. V. 2015. Estudo sobre o engajamento de usuários de uma mídia social disponibilizada pelo governo. In: Anais do XI Simpósio Brasileiro de Sistemas de Informação (SBSI), v. 1, p. 623630, Goiânia, GO. Pretende-se como trabalhos futuros apresentar o esboço do método, com a definição de suas atividades e os artefatos que devem ser produzidos nas suas etapas durante a execução da elicitação e documentação de requisitos de AVPs, e iniciar a sua aplicação, coleta de dados e avaliação no cenário real de desenvolvimento de um ambiente virtual de participação social em uma universidade pública federal e partir de estudos de casos evoluir o método. [13] Souza, C. L. D. C. 2014. Uso do design thinking na elicitação de requisitos de ambientes virtuais de aprendizagem móvel. Dissertação de Mestrado. Universidade Federal de Pernambuco, Recife, Brasil. [14] Susha, I.; Grönlund, Å. 2012. eParticipation research: Systematizing the field. Government Information Quarterly, v. 29, n. 3, p. 373-382. [15] Vetterli, C., Brenner, W., Uebernickel, F., Petrie, C. 2013. From Palaces to Yurts: Why Requirements Engineering Needs Design Thinking. Internet Computing, IEEE, v. 17, n. 2, p. 91-94. REFERÊNCIAS [1] Araujo, R. M., Taher, Y. 2014. Refining IT Requirements for Government-Citizen Co-participation Support in Public Service Design and Delivery. In: Conference for EDemocracy and Open Government, Krems. CeDem 2014. Krems: DonauUniversität Krems, v. 1., p. 61-72. [16] Vianna, M., Vianna, Y, Adler, I. K., Lucena, B., Russo, B. 2012. Design Thinking - Inovação e Negócio. Rio de Janeiro. MJV Press. 23 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Aplicando Grounded Theory para compreender as dificuldades de Planejamento de TI em Órgãos Federais Alternative Title: Applying Grounded Theory to understand the difficulties of IT Planning in Federal Government Organs Plínio Antunes Garcia Vinicius Cardoso Garcia Universidade Federal de Pernambuco CIn - Centro de Informática Universidade Federal de Pernambuco CIn - Centro de Informática [email protected] [email protected] ABSTRACT nho dos negócios, o planejamento estratégico de SI/TI tem, cada vez mais, um papel decisivo dentro das organizações [13]. Existem diversos termos utilizados por diferentes autores que remetem ao planejamento estratégico de SI/TI, tais como plano estratégico de sistemas de informação (PESI), plano estratégico de tecnologia da informação (PETI) ou plano diretor de tecnologia da informação (PDTI) [7]. Com o objetivo de facilitar a compreensão e tornar este artigo alinhado com a terminologia usada nos documentos das instituições públicas analisadas nesta pesquisa, será adotado daqui em diante o termo PDTI. Assim como empresas privadas, os órgãos da administração pública necessitam planejar ações para atingir suas metas. A própria Constituição da República Federativa do Brasil de 1988, em seu artigo 174, declara que o Estado, como agente regulador da economia, exercerá a função de planejamento [2]. Na Administração Pública Federal (APF) o planejamento é um princı́pio fundamental estabelicido no Decreto Lei 200/1967. Desde 2008, através da Estratégia Geral de Tecnologia da Informação (EGTI)[10], os órgãos do poder executivo federal são obrigados a planejar as ações de SI/TI através do PDTI. Portanto, todas as organizações públicas, devem desenvolver processos de planejamento e de monitoramento nos nı́veis institucionais e na área de TI [11]. Neste contexto, esta pesquisa objetiva compreender os fatores que dificultam o planejamento de TI em órgãos da APF. Este artigo está organizado da seguinte forma: na seção 2 é apresentado o problema de pesquisa; a seção 3 apresenta a proposta de solução, incluindo o método de pesquisa; a seção 4 aborda a avaliação da solução e, na seção 5 são descritas as atividades realizadas. Por fim, a seção 6 apresenta as considerações finais. Context: As with private organizations, public organs should execute planning processes to achieve their goals. The brazilian government determines that federal institutions develop the IT Director Plan (PDTI), an important tool for planning of IT activities. However, government reports show worrying indexes regarding to the application of PDTI by the federal organs. Objective: This research seeks to understand the difficulties that result in unsatisfactory numbers related to the PDTI. Method: By the Grounded Theory, a qualitative research methodology, is expected to come up with a theory based on data that point to the main causes of the difficulties of drawing up the PDTI. Categories and Subject Descriptors J.1 [ Administrative Data Processing]: Government Keywords IT Strategic Planning, Grounded Theory 1. INTRODUÇÃO As organizações necessitam cada vez mais dos Sistemas de Informação (SI) e Tecnologia da Informação (TI) para apoiar a tomada de decisões [7]. As empresas que conseguem alinhar suas estratégias de negócio com as estratégias de TI atingem aumento de performance em seus negócios [3]. A importância estratégica da TI na gestão de organizações é destacada no ranking de preocupações de gestores, no qual o alinhamento estratégico de TI se encontra como preocupação principal nas publicações de 2013, 2014 e, recentemente, na pesquisa de 2015 [6], ficando à frente de temas como segurança/privacidade, produtividade e inovação. Levando em consideração a complexidade que a área de SI/TI apresenta e a necessidade de melhoria no desempe- 2. APRESENTAÇÃO DO PROBLEMA Apesar do embasamento legal, a gestão de TI dos órgãos públicos federais não tem atendido satisfatoriamente à necessidade de planejamento. Isto é evidenciado através de uma pesquisa realizada periodicamente pelo Tribunal de Contas da União (TCU), que busca apresentar um Perfil da Governança de TI (Perfil GovTI) dos entes da APF. Os números apresentados nas pesquisas de 2007, 2010, 2012 e 2014 [12] são apresentados no gráfico da Figura 1. Conforme ilustrado na Figura 1, os resultados do levantamento de 2014, relatório mais recente até a presente data, apontam que 67% dos órgãos pesquisados adotam o PDTI, Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, to republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2016 May 17th-20th, 2016, Florianópolis, Santa Catarina, Brazil Copyright SBC 2016 24 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 • Codificação Axial: nesta etapa ocorre o processo de relacionar categorias entre si e entre as propriedades e dimensões. Através destes relacionamentos é possı́vel traçar proposições acerca do fenômeno estudado; • Codificação Seletiva: etapa em que o pesquisador identifica a categoria central do fenômeno e realiza o refinamento da teoria que emerge dos dados. Portanto, nesta pesquisa a GT atua como ferramenta fundamental na proposta de identificar e compreender os fatores que dificultam o planejamento de TI em instituições públicas federais. O principal aspecto da abordagem desta pesquisa consiste na formulação de uma teoria fundamentada em dados para o problema do planejamento de TI, ou seja, ao aplicar a GT, os resultados são fieis à realidade refletida nos dados coletados com os envolvidos na temática estudada. Diante do exposto, a conclusão deste trabalho de mestrado busca ter uma visão dos principais problemas relacionados ao contexto, do ponto de vista dos envolvidos com o planejamento de TI, além de fornecer insumos para sugerir um plano de ações para melhorar os ı́ndices de planejamento de TI nas instituições pesquisadas. Figura 1: Evolução do PDTI - Perfil GovTI ou seja, 33% não cumprem as recomendações e determinações acerca da elaboração do PDTI. Ainda em 2014, apenas 54% das organizações fazem o vı́nculo das ações de TI a indicadores e metas de negócio. O nı́vel de adoção dessa prática é preocupante, haja vista que a TI deve existir para atender às necessidades do negócio e não dela própria. Desse modo, sem a vinculação das ações de TI aos indicadores e metas de negócio, fica difı́cil de avaliar a efetividade e a própria necessidade dessas ações [12]. O TCU conclui que apesar da evolução identificada, a situação ainda não pode ser considerada aceitável [12]. Portanto, não é cabı́vel que muitas organizações continuem sem PDTI, considerando a obrigatoriedade estabelecida em normativas e a importância que o planejamento de TI representa para o desempenho da organização. Diante disso, esta pesquisa tem como principal objetivo elucidar o problema da elaboração do planejamento de TI nos órgãos federais e sugerir um plano de ações. 3. 4. AVALIAÇÃO DA SOLUÇÃO O problema abordado neste trabalho exige que o pesquisador seja isento de hipóteses ou conclusões pré-concebidas, uma vez que a proposta desta pesquisa é permitir que os resultados sejam fielmente baseados nos dados coletados com os envolvidos no problema, garantindo que a conclusão seja o mais próxima possı́vel da realidade. Na GT, a coleta dos dados, análise, formulação e a validação da teoria são reciprocamente relacionadas, em um processo indutivo de interpretação e em um processo de dedução e validação de proposições [1]. Contudo, para avaliar o resultado desta pesquisa, será elaborado um questionário a ser disponibilizado aos participantes da fase de coleta de dados. Tal questionário tem o objetivo de medir a aderência, através de escala de Likert, da teoria resultante da pesquisa às dificuldades de planejamento de TI vivenciadas pelos respondentes. PROPOSTA DE SOLUÇÃO Abordagens quantitativas são muito úteis no sentido de prover indicadores. Porém, restringir a identificação das causas que levaram a obtenção destes indicadores à análise quantitativa pode omitir aspectos relevantes do comportamento dos indivı́duos cuja influência não pode ser desprezada [4]. Desta forma, métodos qualitativos são indicados quando busca-se compreender, de forma mais abrangente, todo o fenômeno em estudo ao invés de simplesmente simplificar e produzir similaridades [8]. Uma grande vantagem em utilizar métodos qualitativos de pesquisa é a necessidade de o pesquisador se aprofundar na complexidade do problema, ao invés de abstraı́-la. Isto resulta em dados mais ricos e mais informativos [9]. A proposta de solução apresentada neste trabalho consiste na utilização da metodologia de pesquisa qualitativa Grounded Theory (GT) [5], ou Teoria Fundamentada em Dados, visando elucidar o problema da elaboração de PDTI nos órgãos públicos federais. GT é um método cientı́fico que utiliza um conjunto de procedimentos sistemáticos de coleta e análise dos dados para gerar, elaborar e validar teorias substantivas sobre fenômenos essencialmente sociais, ou processos sociais abrangentes [1]. Os macroprocessos que compõem a GT são: 5. ATIVIDADES JÁ REALIZADAS A pesquisa iniciou-se com uma revisão bibliográfica sobre as temáticas: (i) planejamento de TI e (ii) Grounded Theory em pesquisas de engenharia de software. Posteriormente, definiu-se o público para coleta de dados: participantes da elaboração e/ou revisão de PDTI de universidades federais (UFs) e institutos federais de educação, ciência e tecnologia (IFs). A coleta de dados ocorreu por meio de questionário (https://goo.gl/rVPuFK ) aplicado ao público definido apresentando 52 respostas de 36 instituições diferentes, sendo 19 UFs, das 63 existentes no paı́s e 17 IFs, dos 41 existentes. Portanto, a pesquisa tem uma amostra de 34,62% das instituições federais de ensino superior e técnico. O questionário é composto de perguntas abertas (qualitativas) e objetivas. O foco desta pesquisa consiste na análise das questões qualitativas, através da GT, com o objetivo de compreender de forma abrangente as dificuldades envolvidas na elaboração do PDTI. Contudo, pode-se adiantar alguns resultados das questões objetivas: • Codificação Aberta: etapa em que o pesquisador varre o material coletado e busca extrair conceitos, categorias e suas propriedades e dimensões; • Afirmaram possuir PDTI: 80,55% (29 instituições) 25 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 6. • Afirmaram não possuir PDTI: 19,45% (7 instituições) CONCLUSÃO Com o apoio da GT é esperado obter uma teoria fundamentada em dados que evidencie as principais causas das dificuldades de planejamento de TI nas instituições. Além disso, espera-se identificar as principais motivações que levam ao não cumprimento da determinação de se estabelecer o PDTI. Há de se destacar que esta pesquisa tem um caráter multidisciplinar, pois abrange não somente a grande área de sistemas de informação, mas também aspectos da administração e sociologia, uma vez que visa compreender o comportamento dos indivı́duos envolvidos em atividades de gestão em um ambiente regido pela TI. Neste cenário a Grounded Theory se torna determinante para compreender os fatores sociotécnicos envolvidos no planejamento de TI. Por fim, o legado deste trabalho consiste não somente nos resultados da pesquisa em si, mas no fornecimento dos insumos necessários para a construção de um plano de ações efetivas que possam atacar as origens do problema da falta de planejamento de TI nas instituições públicas e, com isto, contribuir para a melhoria dos serviços prestados ao cidadão e para o melhor emprego dos orçamentos destinados às áreas de TI dos entes públicos. Este resultado se difere dos números do TCU em seu levantamento com 355 órgãos federais [12], dos quais 33% afirmaram não possuir PDTI. Esta diferença sugere que no caso especı́fico de instituições de ensino federais o nı́vel de aderência ao planejamento de TI é melhor do que o percentual geral envolvendo os demais órgãos federais. Porém, é importante ter cautela ao tirar conclusões. Um estudo focado em comparar as instituições de ensino com as demais instituições federais poderia esclarecer as razões desta diferença. 7. REFERÊNCIAS [1] R. Bandeira de Mello and C. Cunha. Operacionalizando o método da grounded theory nas pesquisas em estratégia. 2003. [2] BRASIL. Constituição da República Federativa do Brasil. Diário Oficial da União, out 1988. [3] Y. E. Chan, R. Sabherwal, and J. B. Thatcher. Antecedents and outcomes of strategic is alignment: an empirical investigation. IEEE Transactions, 2006. [4] T. Conte, R. Cabral, and G. H. Travassos. Aplicando grounded theory na análise qualitativa de um estudo de observação em engenharia de software–um relato de experiência. In V WOSES, 2009. [5] B. G. Glaser, A. L. Strauss, and E. Strutzel. The discovery of grounded theory; strategies for qualitative research. Nursing Research, 17(4):364, 1968. [6] L. Kappelman, E. McLean, and V. Johnson. The 2016 sim it key issues and trends study. Society for Information Management, 2015. [7] D. A. Rezende. Planejamento de sistemas de informação e informática: guia prático para planejar a tecnologia da informação integrada ao planejamento estratégico das organizações. Atlas, 2008. [8] C. B. Seaman. Qualitative methods in empirical studies of software engineering. IEEE Transactions, 1999. [9] C. B. Seaman. Qualitative methods. In Guide to advanced empirical software engineering. 2008. [10] SLTI. Estratégia Geral de TI, 2008. [11] TCU. Tribunal de Contas da União - manual online de legislação e jurispudência de contratação de serviços de TI, 2007. Acesso em 01 dez 2015. [12] TCU. Tribunal de Contas da União - Perfil GovTI. http://goo.gl/Q97Plh, 2014. Acesso em 02 dez 2015. [13] J. Teixeira Filho. MMPE-SI/TI (Gov)-Modelo de Maturidade para Planejamento Estratégico de SI/TI. PhD thesis, Universidade Federal de Pernambuco, Recife, 2010. Figura 2: Grau de dificuldade no levantamento Também foi possı́vel extrair uma visão prévia das dificuldades encontradas pelos respondentes que participaram da elaboração do PDTI das suas respectivas instituições. No questionário foi perguntado acerca do grau de dificuldade na realização de algumas atividades essenciais no planejamento de TI, o grau de dificuldade poderia variar de 0 (nenhuma dificuldade) a 10 (muita dificuldade). Na Figura 2 é possı́vel inferir que as maiores dificuldades na fase de levantamento de necessidades estão nas atividades de identificação das necessidades de informação e, principalmente, na definição de critérios de priorização das necessidades levantadas. Os dados coletados nas questões abertas (qualitativas) se encontram em fase de análise, na etapa de codificação aberta. Ainda é prematuro tecer hipóteses completas, porém é possı́vel perceber pelo mapeamento de conceitos realizado, até o momento, que questões atreladas à (i) falta de pessoal com competências de governança e (ii) falta da cultura de planejamento, estão entre os conceitos que mais chamam atenção no que tange a motivações para a ausência de PDTI nas instituições. Já nas instituições que possuem um PDTI, ainda que deficiente, a análise dos dados busca informações sobre as dificuldades encontradas pelos envolvidos na elaboração do plano. Os dados revelam dificuldades relacionadas ao levantamento de necessidades de sistemas de informação, serviços terceirizados e infraestrutura de TI, além das dificuldades na priorização das necessidades elicitadas. Outros dados coletados dizem respeito às dificuldades na definição de metas, gestão de riscos, recursos humanos de TI e alinhamento estratégico. Todos estes tópicos estão em análise e têm trazido à tona hipóteses importantes para a elaboração da teoria final. É previsto para os próximos dois meses a finalização da análise com GT e, de posse da teoria fundamentada em dados, será possı́vel responder à pergunta que norteia o problema desta pesquisa. 26 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Estudo da Representação de Dados para Segmentação das Fases do Gesto usando Aprendizado de Máquina Alternative Title: Study on Data Representation to Gesture Phase Segmentation using Machine Learning Ricardo A. Feitosa Universidade de São Paulo 03828-000, São Paulo – SP [email protected] Sarajane M. Peres Universidade de São Paulo 03828-000, São Paulo – SP [email protected] RESUMO Sistemas de análise de gestos vêm ganhando força por suas contribuições para a interação entre humanos, humanos e máquinas, e humanos e ambiente. Nessa interação, a gesticulação natural é vista como parte do sistema linguı́stico que suporta a comunicação, e qualquer sistema de informação que objetiva usar interação para suporte à decisão deveria ser capaz de interpretá-la. Essa interpretação pode ser realizada por meio da segmentação das fases do gesto. Para resolver essa tarefa, o estabelecimento de uma representação de dados eficiente para os gestos é um ponto crı́tico. A representação escolhida e sua associação a técnicas de análise podem ou não favorecer a solução sob implementação. Neste trabalho, formas de representação de gestos são submetidas à algoritmos de aprendizado de máquina para elaborar um ambiente propı́cio à identificação das representações mais discriminantes, quais aspectos as diferentes representações descrevem com eficiência, e como elas podem ser combinadas para melhorar a segmentação das fases do gesto. Clodoaldo A. M. Lima Universidade de São Paulo 03828-000, São Paulo – SP [email protected] a critical issue. The chosen representation as well as its combination with techniques for analysis can or can not favor the solution being developed. In this work, different forms representation for gestures are applied to machine learning algorithms to create an adequate environment to identify the more discriminative representations, which aspect the different representations describe with more efficiency, and how they can be combined in order to improve the segmentation of gesture phases. Categories and Subject Descriptors H.4.m [Information Systems Applications]: Miscellaneous; I.2.10 [Artificial Intelligence]: Vision and Scene Understanding—Representations, data structures, and transforms General Terms Experimentation Palavras-Chave Keywords Representação de Gestos, Segmentação das Fases do Gesto, Reconhecimento de Padrões, Aprendizado de Máquina Representation of Gestures, Segmentation of Gesture Phases, Pattern Recognition, Machine Learning ABSTRACT 1. Gestures analysis systems have been getting attention for their contributions to the interaction between humans, humans and machines, and humans and environments. In this interaction, natural gesticulation is seen as part of linguistic system that supports the communication, and all information system aiming at the use of such an interaction in making decisions should be able to interpret it. Such an interpretation can be carried out through the segmentation of gesture phases. In order to solve that task, the establishment of an efficient data representation for gestures is Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, to republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2016, May 17th-20th, 2016, Florianópolis, Santa Catarina, Brazil Copyright SBC 2016. 27 INTRODUÇÃO A análise de gestos é uma aplicação da área de reconhecimento de padrões, e a depender do contexto, os gestos podem ser considerados um elemento do sistema linguı́stico. No uso de gestos para comunicação ou interação entre pessoas, essa relação entre gestos e lı́ngua se estabelece de forma natural na gesticulação ou no uso de uma lı́ngua gestual (i.e. uma lı́ngua de sinais). Num contexto no qual um sistema de informação necessita mediar uma interação entre humanos, ou estabelecer uma interação entre humanos e máquinas ou ambientes, faz-se útil que a gesticulação seja considerada como elementos que carregam informação. No desenvolvimento de soluções capazes de interpretar a gesticulação, depara-se com a necessidade da escolha de uma representação computacional para os dados sob análise – o gesto. Essa é uma escolha crı́tica que também está relacionada à escolha das técnicas de análise de dados que serão usadas, pois tal combinação influencia o desempenho da solução. O domı́nio sob o qual os gestos são interpretados traz particularidades que devem estar bem representadas para que técnicas computacionais sejam capazes de tratá-las adequadamente. IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Dentro de um sistema linguı́stico a execução e interpretação de um gesto assume diferentes aspectos, sendo os mais comuns: aspectos espaciais que embutem informação sobre forma, amplitude ou direção; aspectos temporais que incorporam tanto informação sobre velocidade e aceleração, quanto informação sobre frequência e periodicidade; aspectos estruturais que carregam a informação estrutural e de relação entre os gestos e suas partes constituintes [7, 1]. O estudo de representações computacionais capazes de descrever tais aspectos, objetivando uma solução de reconhecimento de padrões, delimita o escopo de pesquisa deste trabalho. O escopo de aplicação para o trabalho é a segmentação das fases do gesto, por meio da qual estuda-se o significado dos gestos e da gesticulação dentro do discurso executado durante um perı́odo de comunicação. Mcneill [6] e Kendon [2] propuseram a segmentação do gesto em fases para permitir a análise de como o gesto está estruturado em um contexto. De acordo com a proposta, os gestos podem ser segmentados nas fases: preparation, pre-stroke hold, stroke, post-stroke hold e retraction. Focando na análise do movimento das mãos, a fase preparation compreende o momento em que as mãos se movimentam do rest, um perı́odo com ausência de gesticulação, em direção ao stroke. O pre-stroke hold representa uma pausa no movimento das mãos entre a preparation e o stroke. O stroke é o gesto em si. O poststroke hold representa uma pausa no movimento das mãos entre o stroke e a retraction. E a retraction compreende o tempo que a mão leva para voltar à posição de rest. Uma fase chamada hold é inserida nesta proposta e corresponde a um perı́odo em que há ausência de movimento, porém carrega informação e geralmente ocorre entre a preparation e a retraction. O stroke é a única fase obrigatória dentro da unidade gestual. Uma unidade gestual é o perı́odo entre a mão sair da posição de rest e retornar para a posição de rest [3]. O presente trabalho é motivado pelo estudo realizado por Madeo [4]. Nele, a autora utilizou uma representação dos aspectos temporais de um gesto, para então implementar a segmentação das suas fases usando Support Vector Machines (SVM). Outros autores exploraram o mesmo problema ou problemas similares, fazendo uso de diferentes abordagens para representar os gestos e diferentes técnicas para implementar a segmentação das fases. Uma revisão de literatura neste tópico é apresentada em [5]. 2. APRESENTAÇÃO DO PROBLEMA Madeo [4] focou seu trabalho em explorar a SVM clássica, a Echo-State e SVMs com kernels recorrentes, na segmentação das fases do gesto, concluindo que é necessário um trabalho extenso de ajuste de parâmetros dos algoritmos para que se alcance resultados satisfatórios. Porém, a autora não realizou uma exploração abrangente da representação de dados. Essa lacuna em seu estudo aliada às diferentes formas possı́veis de representar os aspectos que definem um gesto definem o problema que é tratado no presente trabalho. O objetivo da pesquisa então é a busca da representação de dados mais discriminante para os gestos, considerando que seus aspectos espaciais, temporais e estruturais precisam estar representados de forma que a informação relacionada a eles seja usada na segmentação das fases. Na literatura encontra-se tanto iniciativas que usam representação que expressa apenas algum aspecto dos gestos, quanto iniciativas que procuram combinar, de forma explı́- 28 cita ou implı́cita, a informação referente a diferentes aspectos. Contudo, tais estudos delimitam áreas de aplicação especı́ficas, com caracterı́sticas próprias, que dificultam a transferência de conhecimento entre diferentes domı́nios. O domı́nio de segmentação das fases do gesto traz desafios para a área de reconhecimento de padrões. Em uma análise simples e empı́rica poder-se-ia dizer que desde que a gesticulação se dá principalmente com mão dominante, e que entre as fases de um gesto percebe-se alterações da intensidade do movimento (stroke seria a fase de maior intensidade e o rest o perı́odo de menor intensidade), então uma representação adequada poderia ser a velocidade escalar da mão direita. Ou, imaginando que o perı́odo de rest ocorre quando as mãos estão abaixo do nı́vel da cintura e a unidade gestual ocorre acima do nı́vel da cintura, o uso da informação referente à coordenada espacial das mãos deveria fazer parte da representação. Entretanto, análises detalhadas mostram que o uso isolado dessas informações gera uma segmentação equivocada pois um hold, como o rest, possui ausência de movimento, e o rest pode ocorrer na posição de braços cruzados acima da cintura. A partir dessa análise empı́rica do problema e do estudo da literatura, pode-se adotar como hipótese que utilizar uma representação computacional que considere apenas um aspecto descritivo do gesto não é suficiente para obter bons resultados de segmentação de suas fases. Há, portanto, a necessidade de embutir informações de naturezas diferentes na representação, cobrindo a descrição dos aspectos espaciais, temporais e estruturais de um gesto. 3. PROPOSTA DE SOLUÇÃO O problema da representação dos gestos deste trabalho exige um estudo exploratório sobre as alternativas apresentadas na literatura, e a experimentação de tais alternativas no problema de segmentação das fases do gesto. A experimentação deve ser implementada a partir de técnicas de reconhecimento de padrões e executada em um contexto controlado, sobre o qual se tenha conhecimento das particularidades da gesticulação e das fases dos gestos executados. O atendimento ao primeiro requisito será realizado com o uso de algoritmos de aprendizado de máquina. Algoritmos de aprendizado supervisionado possibilitarão a compreensão da capacidade discriminativa de cada representação de dados, sob a luz da segmentação de gestos realizadas por especialistas humanos. A rede neural Multilayer Perceptron (MLP) será usada para esse propósito pois é um aproximador de funções universal e tem um treinamento relativamente rápido. Algoritmos de aprendizado não supervisionado possibilitarão tanto a verificação do poder de discriminação de cada uma das representações de uma maneira imparcial, ou seja, sem o viés da correção do erro de segmentação, quanto a identificação da necessidade de reestruturar as fases do gesto para um esquema diferente daquele apresentado por Mcneill [6] e Kendon [2]. A rede neural Self Organizing Maps (SOM) será usada para esse propósito, por conta de sua capacidade de redução de dimensionalidade, possibilitando a visualização da estrutura topológica dos grupos. O segundo requisito será atendido com o uso do conjunto de dados Gesture Phase Segmentation Data Set 1 . Esse conjunto é composto por caracterı́sticas extraı́das de vı́deos com 1 https://archive.ics.uci.edu/ml/datasets/Gesture+ Phase+Segmentation IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 pessoas gesticulando durante a atividade de contação de histórias, e está rotulado segundo a segmentação das fases do gesto realizada por quatro especialistas. Os gestos foram captados com o sensor MS Kinect e organizados em arquivos com informação sobre coordenadas espaciais de mãos, pulsos, tronco e cabeça e informações referentes à velocidade e aceleração das mãos e pulsos. Outras informações descritivas deverão ser extraı́das para compor a exploração prevista neste trabalho. Algumas possibilidades são a angulação e direção dos gestos, e a extração de informação sintática com base na gramática apresenta por [3]. 4. AVALIAÇÃO DA SOLUÇÃO A avaliação da adequabilidade das representações de dados será mediante os resultados dos algoritmos MLP e SOM. Os procedimentos de avaliação compreenderão aqueles já tradicionais para classificadores e modelos de agrupamento, e também a partir da avaliação dos resultados sob o ponto de vista dos especialistas, conforme proposto em [4]. A análise das classes geradas pelas MLPs será realizada para verificar sua aderência aos segmentos esperados. Quanto melhor for o resultado produzido, mais adequada será a representação de dados em uso. Essa avaliação se dará pela aplicação de medidas de acurácia e da análise de matrizes de confusão. Porém, faz-se útil ainda uma análise detalhada dos tipos de erros cometidos pelas MLPs, de forma que se possa entender quais são os aspectos em que cada representação de dados falha. A análise sobre os grupos formados pelo algoritmo SOM será realizada sob dois aspectos: qualidade dos agrupamentos formados, usando ı́ndices de validação internos e externos; relacionamento topológico dos grupos fornecido pelo mapa de saı́da do SOM, o qual será realizado por meio de inspeções visuais suportadas por ferramentas de visualização apropriadas. 5. à classificação do especialista. Assim há uma confirmação parcial sobre a hipótese em estudo. A figura 1 mostra um trecho do vı́deo representado pela velocidade. Na base do gráfico as linhas dizem respeito às fases obtidas e esperadas. As marcações em vermelho ilustram os erros de segmentação. ATIVIDADES REALIZADAS Para a condução deste trabalho em direção a responder a questão de pesquisa delineada e verificar a hipótese estabelecida, as seguintes atividades são previstas: revisão exploratória e sistemática da literatura; implementação dos algoritmos MLP, SOM e procedimentos de avaliação usando a ferramenta Matlab; seleção empı́rica e automática e combinação de representações de dados via experimentos computacionais; análise e documentação dos resultados. A revisão de literatura está em fase de conclusão. Foi realizada uma revisão sistemática sobre representação de dados para análise de gestos e revisões exploratórias sobre a área de aplicação. Toda a revisão bibliográfica será continuamente atualizada até o término da escrita da dissertação. Os algoritmos MLP e SOM foram implementados para testes preliminares, porém estão sendo refinados para que se adequem ao volume de execuções necessárias e ao tipo de avaliação que será realizada. As medidas e procedimentos de avaliação estão implementados. Estudos preliminares simplificados necessários para embasar à hipótese deste trabalho foram realizados usando o algoritmo K-means. A representação do gesto foi caracterizada apenas pela velocidade escalar da mão direita referente a cada frame do vı́deo. O K-means foi executado com k = 5 para verificar o quão aderente às fases do gesto rest, preparation, stroke, hold e retraction, seus resultados poderiam ser. Verificou-se uma aderência de 43% em termos de frames de vı́deos segmentados corretamente em relação 29 Figura 1: Velocidade escalar X fases do gesto 6. CONCLUSÃO Com este estudo é esperado contribuir com a expansão do conhecimento na área de análise de gestos no que diz respeito à representação de dados adequada para análise das fases do gesto. Embora existam muitos estudos correlatos, não foi encontrado nenhum que explore detalhadamente representações para dados gestuais avaliando sua adequação quanto à descrição de aspectos espaciais, temporais e estruturais. Ademais, a exploração das representações via algoritmos de aprendizado não supervisionado, ainda pouco explorados nessa área, traz a possibilidade de eliminar o viés introduzido na análise supervisionada. 7. REFERÊNCIAS [1] T. G. Dietterich. Machine learning for sequential data: A review”. In Proc. of Joint Structural, Syntactic, and Statistical Pattern Recogn. International Workshops, pages 15–30. Springer, 2002. [2] A. Kendon. Gesticulation and speech: Two aspects of the process of utterance. The Relationship of verbal and nonverbal communication, pages 207–227, 1980. [3] S. Kita, I. Gijn, and H. Hulst. Movement phases in signs and co-speech gestures, and their transcription by human coders. In Proc. of Int. Gesture Workshop Bielefeld, pages 23–35. Springer, 1998. [4] R. C. B. Madeo, S. M. Peres, and C. A. Lima. Gesture phase segmentation using support vector machines. Expert Systems with Applications, 56:100 – 115, 2016. In press. [5] R. C. B. Madeo, P. K. Wagner, and S. M. Peres. A review of temporal aspects of hand gesture analysis applied to discourse analysis and natural conversation. Int. J. of C. Sci. & Inf. Tech., 5(4), dec. 2013. [6] D. Mcneill. Hand and mind: What the hands reveal about thought. 1992. [7] N. A. Smith. Linguistic Structure Prediction. Morgan & Claypool, 2011. IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Alinhamento Interativo de Ontologias usando AntiPadrões de Alinhamento Alternative Title: Interactive Ontology Alignment using Alignment Antipatterns Jomar da Silva Fernanda Araujo Baião Kate Revoredo Departamento de Informática Aplicada - UNIRIO Av. Pasteur 458, Rio de Janeiro,Brasil [email protected] Departamento de Informática Aplicada - UNIRIO Av. Pasteur 458, Rio de Janeiro,Brasil [email protected] Departamento de Informática Aplicada - UNIRIO Av. Pasteur 458, Rio de Janeiro,Brasil [email protected] conceptually define the data stored in each repository. Among the various ontology alignment approaches that exist in the literature, interactive ontology alignment includes the participation of experts to improve the quality of the final alignment. An important issue for interactive ontology alignment proposals is to maximize the efficiency of the expert participation. According to OAEI (an evaluation initiative conducted annually), despite the advances in this field there are still recurrent errors in the final alignments obtained by the interactive ontology alignment proposals. In this paper we propose ALIN, an interactive ontology alignment approach that increases the efficiency of the expert participation through the use of alignment anti-patterns. An initial experience with ALIN strategy was evaluated, considering three anti-patterns available in the literature, and the results proved the potential of the approach. RESUMO O progresso nas tecnologias de informação e de comunicação tornou disponível uma grande quantidade de repositórios de dados, mas com uma grande heterogeneidade semântica, o que dificulta a sua integração. Um processo que tem sido utilizado para resolver este problema é o alinhamento de ontologias, que tenta descobrir as correspondências existentes entre as entidades de duas ontologias distintas, as quais por sua vez estruturam os conceitos que definem os dados armazenados em cada repositório. Existem várias abordagens na literatura para o alinhamento de ontologias, dentre as quais destaca-se a abordagem interativa, que considera a participação de especialistas para melhorar a qualidade do alinhamento final. Na abordagem interativa, uma questão importante é a eficiência da participação do especialista. Apesar dos avanços nos resultados obtidos na literatura, há ainda erros recorrentes nos alinhamentos obtidos pelas propostas de alinhamento interativo de ontologias, o que pode ser comprovado por uma iniciativa de avaliação conduzida anualmente pela comunidade científica (OAEI). Neste trabalho, é proposta uma estratégia interativa para o alinhamento de ontologias, denominada ALIN, que busca a aumentar a eficiência da participação do especialista através da utilização de anti-padrões de alinhamento. Uma experiência inicial com a estratégia ALIN foi avaliada, considerando 3 anti-padrões disponíveis na literatura, e os resultados comprovaram o potencial da abordagem. Categories and Subject Descriptors H.2.1 Logical Design - Data models General Terms Algorithms, Measurement, Design. Keywords Interactive Ontology Matching, Ontology, Correspondence Antipattern. Palavras-Chave 1. INTRODUÇÃO Alinhamento de Ontologias, Ontologia, Alinhamento interativo de Ontologias, Anti-padrão de alinhamento. O processo de alinhamento de ontologias tem como um de seus propósitos reduzir a heterogeneidade semântica entre representações distintas de um mesmo domínio. A existência de tal heterogeneidade se deve ao natural instinto humano de ter perspectivas diferentes e assim modelar situações semelhantes utilizando conceitualizações diferentes. ABSTRACT A large amount of data repositories became available due to the advances in information and communication technology. Those repositories, however, are highly semantically heterogeneous, which hinders their integration. Ontology alignment has been successfully applied to solve this problem by discovering correspondences between two distinct ontologies which, in turn, O processo de alinhamento de ontologias busca descobrir correspondências entre entidades relacionadas em ontologias [3]. Vários trabalhos já foram propostos na literatura para suportar este processo, entre eles se destacam os que seguem a abordagem interativa, que consideram a participação de um especialista no domínio que foi modelado pelas ontologias[4]. Esta abordagem tem alcançado resultados superiores às abordagens nãointerativas, mas ainda há espaço para se alcançar melhores resultados [4]. Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2016, May 17–20, 2016, Florianópolis, Santa Catarina, Brazil. Copyright SBC 2016. 30 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Uma questão importante no alinhamento interativo de ontologias é a eficiência na participação do especialista que é medida pela quantidade de correspondência corretas achadas em relação ao número de interações com o especialista. calculadas comparando-se o alinhamento gerado (do qual se quer avaliar a qualidade) com o alinhamento de referência (o conjunto de correspondências que são reconhecidamente verdadeiras). A precisão mede o quão correto é o alinhamento gerado, e é calculada como a razão entre o número de correspondências do alinhamento gerado que estão presentes no alinhamento de referência e o número total de correspondências do alinhamento gerado. A cobertura é calculada como a razão entre o número de correspondências do alinhamento gerado que estão presentes no alinhamento de referência e o número total de correspondências do alinhamento de referência. Há uma terceira medida, chamada medida-F, que é a média harmônica entre a precisão e a cobertura. Um anti-padrão de alinhamento, também chamado padrão problemático de alinhamento, é, mais precisamente, uma combinação de correspondências que geram uma insatisfabilidade de um conceito [5]. O alinhamento da Figura 1, por exemplo, é inconsistente logicamente, pois cada instância da classe o1:e1 é também instância da classe o2:e1 (pela equivalência , indicada pela seta de duas pontas), e cada instância de o1:e1 também é instância de o1:e2 (pela herança). Ainda, cada instância de o1:e2 é também instância de o2:e2 (pela equivalência) e, portanto, podemos deduzir que que as instâncias de o2:e1 são também instâncias de o2:e2, o que gera uma contradição lógica, pois o2:e1 e o2:e2 são disjuntas. 3. PROPOSTA DE SOLUÇÃO Este trabalho propõe o ALIN, uma estratégia interativa para o processo de alinhamento de ontologias que integra o uso de classificadores e clusterizadores como na abordagem Jarvis [2] com anti-padrões a cada interação com o especialista, estendendo portanto a proposta de Guedes [1]. A utilização dos anti-padrões se dá por ocasião da interação com o especialista. Caso o especialista responda “sim”, indicando que um par de entidades é uma correspondência, todos os pares incompatíveis com ele, de acordo com os anti-padrões, são classificados como “não”, indicando que estas correspondências não pertencem ao alinhamento. Isso amplifica as respostas dadas, pelo especialista, podendo-se saber a resposta para várias correspondências com somente uma pergunta ao especialista. 4. PROJETO SOLUÇÃO Figura 1. Anti-padrão de disjunção e generalização [1] Guedes [1] definiu empiricamente um conjunto de anti-padrões, escavados a partir dos resultados de ferramentas avaliadas pela OAEI [8], dentre os quais está o descrito na Figura 1, e os aplicou para melhorar a qualidade do resultado de um processo de alinhamento de forma não interativa, retirando do alinhamento correspondências que levavam a inconsistências, de acordo com os anti-padrões. DE AVALIAÇÃO DE O projeto de avaliação de solução abrange a utilização de um programa já parcialmente feito que, quando completo, implementará a proposta de solução. A abordagem ALIN está sendo implementada utilizando as seguintes APIs em Java: Weka, com rotinas estatísticas e de KDD [8]; Simmetrics, com métricas de similaridade baseadas em strings [7]; WS4J, com métricas linguísticas baseadas na Wordnet [9]; e Alignment, que contém rotinas para manipulação de ontologias escritas em OWL [10]. Neste trabalho são avaliados os benefícios de considerar antipadrões em uma abordagem interativa para o alinhamento de ontologias, denominada ALIN, com vistas a aumentar a eficiência na participação do especialista. Um primeiro experimento considerando 3 anti-padrões, definidos em Guedes [1], é descrito e seus resultados positivos mostram o potencial da abordagem ALIN. A avaliação da abordagem ALIN será realizada considerando os resultados disponibilizados pela OAEI[8]. Serão utilizadas na avaliação os datasets disponibilizados para avaliação de uma ferramenta interativa: Conference, Anatomy e Largebio. 5. ATIVIDADES JÁ REALIZADAS Este artigo está estruturado como a seguir: A seção 2 apresenta o problema, a seção 3 mostra a proposta de solução, a seção 4 o projeto de avaliação da solução, a seção 5 mostra as atividades já realizadas e a 6 a conclusão a que se chegou. Já foi construído parte do programa que implementa a abordagem ALIN, com 3 anti-padrões definidos em Guedes[1], o que permite fazer uma avaliação inicial da utilização de antipadrões no alinhamento interativo. 2. APRESENTAÇÃO DO PROBLEMA O experimento contemplou duas execuções. A primeira execução, sem a utilização dos anti-padrões, reproduziu a abordagem Jarvis [2]. A segunda execução seguiu a abordagem ALIN, incorporando os anti-padrões a cada interação com o especialista. A OAEI (Ontology Alignment Evaluation Initiative) é uma iniciativa internacional cuja meta é avaliar as ferramentas de alinhamento de ontologias existentes, publicando resultados comparativos entre elas. A OAEI disponibiliza alinhamentos de referência para diversos domínios de avaliação (datasets). Embora muitos trabalhos já tenham sido realizados na área [1][2] [5][6] os resultados expostos pela OAEI mostram que ainda há espaço para a melhoria dos alinhamentos gerados. O dataset, disponibilizado pela OAEI, escolhido para esta avaliação inicial foi no domínio de conferências acadêmicas. O conference dataset é composto por 7 ontologias. Existe um alinhamento de referência entre cada par de ontologias, totalizando 21 alinhamentos de referência. Quanto à interação, cada feedback do especialista foi implementado através de uma Para avaliar a qualidade do alinhamento gerado, duas medidas são comumente utilizadas: precisão e cobertura. Tais medidas são 31 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 consulta ao alinhamento de referência, que retorna se um par de entidades é uma correspondência ou não. padrões. Os resultados obtidos mostraram que a utilização de antipadrões aumenta tanto a precisão como a cobertura do alinhamento obtido. A cada execução, as medidas de qualidade alcançadas serão a média dos valores encontrados nos alinhamentos gerados para cada par de ontologias do conference dataset ( a média dos 21 pares ). A abordagem ALIN será avaliada segundo o impacto causado pela utilização dos anti-padroes na qualidade do alinhamento gerado, em termos de medida-F, e quanto à eficiência da participação do especialista no processo de alinhamento. Uma outra observação importante é o aumento do número de pares de entidades avaliados pela abordagem, embora o número de interações com o especialista permaneça constante. A eliminação daqueles pares que não podem estar no alinhamento permite que o especialista responda somente às perguntas de correspondências que não são incompatíveis com outros pares já escolhidos. O aumento da qualidade também parece estar relacionado a isto. Alguns pares não selecionados anteriormente para avaliação podem ser agora avaliados, e alguns desses pares podem estar no alinhamento. Em cada execução houve 5 iterações e foram definidos os parâmetros número de perguntas iniciais igual a 8 e número de perguntas por iteração igual a 3, dando um máximo de 23 interações com o especialista por par de ontologias. Foram encontrados os resultados mostrados no gráfico da figura 2. A abordagem ALIN se diferencia dos trabalhos existentes na literatura em vários aspectos. Em Guedes[1] a utilização dos antipadrões se dá somente ao final do processo de alinhamento, enquanto na abordagem ALIN proposta os anti-padrões são considerados a cada interação com o usuário. Ainda, com relação à proposta de Lopes[2], ALIN se diferenciou pela utilização de anti-padrões durante o processo e não ao final dele, eliminando das possíveis interações aquelas inconsistentes com as que foram positivadas pelo especialista. Os resultados do experimento mostraram que a sinergia entre o feedback do especialista e os anti-padrões contribuiu para aumentar a qualidade do alinhamento e melhorar a eficiência da participação do especialista. A implementação atual se baseia na hipótese de que o especialista nunca erra, o que nem sempre é verdade. Vai ser implementado na abordagem um parâmetro indicando uma margem de erro para o especialista. Será estudada, também, a utilização de outros antipadrões, assim como a utilização de anti-padrões em outras fases do processo de alinhamento. Figura 2. Valores de medida-F resultantes das execuções 7. REFERÊNCIAS: A eficiência da participação do especialista também foi avaliada. Uma característica da utilização de anti-padrões é que, quando o especialista informa à abordagem ALIN que determinado par de entidades é uma correspondência, indiretamente informa que todos os outros pares inconsistentes com esta correspondência não pertencem ao alinhamento. Isto amplifica a propagação do conhecimento do especialista a cada feedback. Por exemplo, no alinhamento entre as ontologias conference e ekaw (pertencentes ao conference dataset da OAEI), foram selecionados 52 pares de entidades para serem avaliados pelo especialista. Na primeira execução, sem considerar anti-padrões, 36 pares são avaliados, sendo 23 diretamente pelo especialista e 13 por métricas de similaridade. Na segunda execução, quando são levados em consideração anti-padrões, dos 52 selecionados, 47 pares são avaliados, sendo 23 diretamente pelo especialista,13 por métricas de similaridade e 11 pares foram classificados observando-se os antipadrões. Quando não se levou em consideração os anti-padrões, as medidas de qualidade deste alinhamento foram: precisão = 0.722, cobertura = 0.52 e medida-F = 0.604. Já utilizando anti-padrões, as medidas de qualidade foram: precisão = 0.736, cobertura = 0.56 e medida-F = 0.636. [1] Guedes, A.. Baião F., Revoredo K. On the Identification and Representation of Ontology Correspondence Antipatterns, WoMO@FOIS, CEUR Workshop Proceedings, v. 1248, CEURWS.org, 2014 [2] Lopes V. Alinhamento Interativo de Ontologias: Uma Abordagem Baseada em Query-by-Committee, Dissertação de Mestrado, UNIRIO, Rio de Janeiro, RJ, Brasil, 2014 [3] Shvaiko P., Euzenat J. Ontology matching, Springer, 2a ed., 2013 [4] Paulheim H., Hertling S., Ritze D. Towards Evaluating Interactive Ontology Matching Tools, The Semantic Web: Semantics and Big Data, LNCS 7882, pp 31-45, 2013 [5] Meilicke C. Alignment Incoherence in Ontology Matching, Tese de Doutorado, Universidade de Mannheim, Alemanha, 2011 [6] Guedes A., Baião F., Revoredo K. Digging Ontology Correspondence Antipatterns, Proceedings 5th International Conference on Ontology and Semantic Web Patterns (WOP'14), CEUR Workshop Proceedings, v. 1302, pp. 38-48, 2014 [7] Simmetrics. Disponível em www.coli.unisaarland.de/courses/LT1/2011/slides/stringmetrics.pd f. Acesso em: 11/04/2016 [8] WEKA Manual, The University of Waikato, 2015. [9] WS4J. Disponível em code.google.com/archive/p/ws4j/. Acesso em: 11/04/2016 [10] Alignment API. Disponível em alignapi.gforge.inria.fr/. Acesso em: 11/04/2016 6. CONCLUSÃO Para avaliar se a utilização de anti-padrões aumenta a qualidade de um alinhamento de ontologias gerado por uma abordagem interativa, foi proposta a abordagem ALIN. Uma implementação parcial da abordagem proposta foi avaliada sobre o conference dataset da OAEI, comparando os resultados obtidos contra os resultados da abordagem Jarvis, a qual não considera anti- 32 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Análise das fases do gesto: a influência do contexto na execução das fases e na indução de modelos de aprendizado de máquina supervisionado Alternative Title: Analysis of phases of gesture: the influence of context on implementation of phases and in the induction of supervised machine learning models Jallysson M. Rocha Universidade de São Paulo 03828-000 São Paulo, Brasil [email protected] Sarajane M. Peres Universidade de São Paulo 03828-000 São Paulo, Brasil [email protected] RESUMO Gestos são ações que fazem parte da comunicação humana. Eles ocorrem junto com a fala e se manifestam por ações propositais, como o uso das mãos para explicar uma forma, ou como padrões de comportamento, como coçar a cabeça. Há diferentes linhas de estudo que exploram essa temática e entre elas está a que analisa os gestos a partir de fases (descanso, preparação, stroke, hold e retração). Nesse contexto faz-se útil o desenvolvimento de sistemas capazes de automatizar a segmentação de um gesto em suas fases, principalmente porque a partir da compreensão das fases é possı́vel melhorar o entendimento do discurso possibilitando melhorias interessantes para sistemas que visam propiciar uma interação humano computador mais natural. Técnicas de aprendizado de máquina supervisionado já foram aplicadas a este problema e resultados promissores foram obtidos. Contudo, há uma dificuldade inerente à esta área, que se manifesta na alteração do contexto de execução dos gestos. Este é o problema abordado por esta pesquisa, a qual objetiva estudar a variabilidade do padrão inerente à cada uma das fases do gesto quando executadas por um mesmo indivı́duo, porém em diferentes contextos de produção do discurso. Palavras-Chave Análise de Gesto, Fases do Gesto, Aprendizado de Máquina, Máquina de Vetores Suporte Clodoaldo A. M. Lima Universidade de São Paulo 03828-000 São Paulo, Brasil [email protected] pattern of behavior, like scratching head. There are different line of studies that explore this theme and among them is one that analyzes the gestures from phases (rest, preparation, stroke, hold and retraction). In this context it makes useful the development of systems capable of automating the segmentation of a gesture in their phases, mainly because from the understanding on phases it is possible to improve de comprehension on discourse, supporting improvements for system that aims to offer a more natural human-computer interaction. Supervised machine learning techniques have been applied to this problem and promising results were obtained. However, there is a difficulty inherent in the analysis of the phases of gesture, which manifests itself in changing the context in which the actions are executed. This is the problem addressed by the research proposed here, which aims to study the variability inherent pattern to each phase of the gesture when they occur from the same individual, though in different contexts of production of speech. Categories and Subject Descriptors H.4.m [Information Systems Applications]: Miscellaneous; I.5.4 [Pattern Recognition]: Applications—Computer Vision General Terms Experimentation ABSTRACT Keywords Gestures are actions that are part of human communication. They occur along with speech and may manifest by a deliberate action, as the use of hands to explain a shape, or as a Analysis of Gesture, Gesture Phases, Machine Learning, Support Vector Machine 1. Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, to republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2016, May 17th-20th, 2016, Florianópolis, Santa Catarina, Brazil Copyright SBC 2016. 33 INTRODUÇÃO Dentre as diferentes possibilidades de estudo dos gestos está aquela que presume que os gestos são compostos por unidades gestuais e estas, por sua vez, compostas por fases gestuais [4]. Gestos manuais são compostos por estas fases e se constituem como o principal elemento da gesticulação natural realizada durante a comunicação. As fases do gesto estão ligadas ao que Kendon [5] chamou de “movement excursions”. Segundo o mesmo autor, uma pessoa IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 faz uma ou várias “movement excursions” durante um discurso. Estas excursões se referem a movimentos das mãos de alguma posição de descanso para uma região no espaço na qual um movimento importante ocorre, e depois, de volta para a posição de descanso. Toda a excursão do movimento é chamada de unidade gestual, enquanto as posições que as mãos assumem entre elas são chamadas de posições de descanso. Uma unidade gestual pode ser segmentada nas fases do gesto: preparação, na qual a mão se move para a posição em que o conteúdo do gesto será expressado; pré-stroke hold, a qual é uma breve pausa no fim da preparação; stroke, que contém o pico de esforço do gesto e expressa seu conteúdo semântico; pos-stroke hold, que é uma breve pausa no fim de um stroke; retração, na qual a mão retorna para a posição de descanso. Adicionalmente, Kita [6] sugere que as fases pré-stroke hold, stroke e pos-stroke hold compõem uma fase expressiva do gesto, o hold independente, isto é, uma pausa que expressa o conteúdo semântico do gesto. Diferentes autores trabalham com análise automática das fases (todas ou algumas em especı́fico) e fazem uso de algoritmos de aprendizado de máquina em seus estudos. Segundo [8], é pertinente definir “aprendizado de máquina” (AM), de maneira ampla e genérica, dizendo que AM inclui qualquer programa de computador que seja capaz de melhorar seu desempenho na resolução de alguma tarefa por meio do uso da experiência. Considerando o ponto de vista deste trabalho, o AM será implementado segundo os preceitos do paradigma de aprendizado indutivo, no qual os argumentos de raciocı́nio são baseados na extrapolação de premissas, ou seja, conclusões gerais sobre o objeto de estudo são obtidas a partir de um conjunto de premissas que representam um conjunto particular de exemplos. 2. APRESENTAÇÃO DO PROBLEMA A manifestação dos gestos durante a comunicação, geralmente, é de fácil compreensão, mas pode assumir nı́veis mais complexos de interpretação, a depender do aspecto sendo analisado. Assim pesquisadores de diversas áreas são interessados em entender como se dá a relação dos gestos com outros elementos do sistema linguı́stico, seja para suportar estudos das áreas da Linguı́stica e da Psicolinguı́stica, seja para melhorar a interação homem-máquina. Nesse contexto, se faz útil o desenvolvimento de sistemas capazes de automatizar a segmentação de um gesto em suas fases, de forma a tratar uma dessas relações, que decorrem da gesticulação natural executada durante o discurso. Porém, há uma dificuldade inerente à análise das fases do gesto que se manifesta na alteração do contexto em que ele é executado. Embora existam algumas premissas para definição do padrão de manifestação de cada fase do gesto, em contextos diferentes, elas podem sofrer variações que levam a análise automática para um nı́vel de alta complexidade. O problema estudado nesse projeto de mestrado é motivado pelos estudos de Ramakrishnan e Madeo [10, 7], que defendem que segmentar as fases do gesto é uma tarefa altamente subjetiva e dependente do contexto de produção do discurso; também, os autores modelaram o problema de segmentação de gestos como uma tarefa de classificação a ser resolvida por aprendizado de máquina supervisionado. Porém, os estudos citados fizeram estudos superficiais sobre a influência do contexto na produção dos gestos, incluindo suas fases. Assim, estabelece-se como hipótese nessa pesquisa que o padrão de gesticulação natural, embora analisado em rela- 34 ção a um mesmo executor, é dependente do contexto de execução. Variáveis como nı́vel de estresse ou de atenção, objetivo de comunicação e público alvo, interferem na construção do discurso (fala e gestos). Modelos classificadores têm um grau de sensibilidade à variabilidade de padrões, e podem fornecer mecanismos para observá-la. A variabilidade advinda da mudança de contexto será percebida pelos modelos e será medida a partir das alterações ocorridas no seu desempenho. No intuito de verificar a hipótese delineada, assume-se como principal objetivo deste projeto de mestrado a análise referente a se, e como, a segmentação das fases do gesto manual, em função do contexto de execução, influenciam o desempenho dos classificadores, e ainda a análise de se, e como, a avaliação de tal desempenho pode revelar informações que comprovem as influências dos contextos sobre a manifestação dos gestos. 3. PROPOSTA DE SOLUÇÃO Esta pesquisa se caracteriza como uma pesquisa aplicada, empı́rica, explanatória e quantitativa. Para alcançar os objetivos delineados e verificar a hipótese, estabelece-se como meio de estudo a experimentação computacional aplicada ao problema especı́fico de segmentação de fases do gesto. A modelagem computacional para as experimentações recebem como entrada uma sequência de frames de vı́deo referente à captura da gesticulação natural durante a produção de discursos em diferentes contextos. Os frames de vı́deos são manipulados computacionalmente por meio de abstrações organizadas em estruturas de dados. A saı́da de cada experimento é um modelo classificador capaz de predizer a fase do gesto que ocorre em cada um dos frames do vı́deo. Assim, as análises a serem desenvolvidos estarão baseadas na observação de um conjunto de dados referentes à gesticulação, conferindo o caráter empı́rico à pesquisa. Ainda, desta discussão conclui-se que esta pesquisa tem o intuito de identificar fatores – a variabilidade no desempenho dos modelos classificadores – que determinam a ocorrência de um fenômeno – a influência do contexto sobre a execução das fases do gesto – conferindo a ela o caráter explanatório. Ainda como parte da solução proposta está a geração de dois protocolos: (a) de aquisição de dados de forma que o ambiente de experimentação contenha sessões de gesticulação com caracterizações variadas (monólogos e diálogos; improvisação e descrição; exposição oral), obtidas a partir de diferentes pessoas executando todos os contextos definidos em diferentes locais e turno; os dados serão captados por sensores Microsoft Kinect, posicionados a uma distância controlada, de forma a não causar incômodo; os dados serão documentados para que seja possı́vel realizar a rotulação do conjunto de dados; e (b) de avaliação do desempenho quantitativo dos classificadores, no que diz respeito à avaliação de suas capacidades de segmentação das fases do gesto, e no que diz respeito à comparação de seus desempenhos para avaliação da variabilidade dos padrões que caracterizam as fases do gesto em diferentes contextos. Além disso, a análise dos dados proposta se baseia em aprendizado supervisionado, então os dados serão rotulados por pelo menos dois rotuladores, e análises de concordância [2, 1] serão realizadas. Os dados rotulados serão préprocessados e representados vetorialmente, de forma adequada para apresentação à técnica de Máquinas de Vetores de Suporte, método amplamente utilizado em diversas áreas de aplicação, incluindo análise de fases do gesto [10, 7]. IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 4. AVALIAÇÃO DA SOLUÇÃO 6. Tradicionalmente, uma medida de avaliação aplicada a classificadores é a acurácia. A acurácia de um classificador deve ser obtida em termos de seu erro de generalização. Entretanto, para o caso de classificadores binários, é também necessário analisar a matriz de confusão e as medidas de avaliação geradas a partir dela [3] e [9], com destaque para a revocação, a precisão e taxa de falsos positivos, das quais são derivadas a medida F-score a as curvas ROC. No caso especı́fico da tarefa de análise de fases de gesto, é interessante avaliar o desempenho do classificador sob o ponto de vista de um especialista que usará o resultado produzido pelo algoritmo. Assim, como a abordagem aqui adotada está pautada na análise do vı́deo frame a frame e tratase de uma abordagem baseada em aprendizado supervisionado, medidas para análise de desempenho de classificadores deveriam considerar que: (a) erros de classificação cometidos na transição entre fases devem ser analisados de forma diferenciada dos erros cometidos dentro de uma fase – gerando medidas de acurácia e matrizes de confusão ponderadas; (b) a comparação do resultado do classificador à segmentação realizada por um especialista deve ser feita de forma a considerar que a precisão da segmentação humana, assim como a sua consistência, está sujeita a imprecisões nas regiões de transições entre fases. Os autores em [10] e [7] adotaram como medida adicional de avaliação dos classificadores o número de segmentos classificados corretamente, considerando que porcentagens de frames (consecutivos e não consecutivos) corretamente classificados dentro de uma fase. 5. ATIVIDADES JÁ REALIZADAS Como parte do desenvolvimento do projeto, já foram realizados estudos exploratórios referentes à área de aplicação (segmentação das fases do gesto) e da área de aprendizado de máquina (geração e avaliação de classificadores e Máquinas de Vetores de Suporte). Atualmente, está em fase de término a realização de uma revisão sistemática focada em estudos que tratam da análise de gestos manuais considerando o contexto de execução ou a dependência ao usuário. No ponto atual de desenvolvimento da revisão sistemática já foi possı́vel verificar que não existem estudos tratando o contexto e a dependência do usuário na área de aplicação de segmentação das fases do gesto, além de [10, 7]. Porém, há um volume grande de estudos que analisam tais aspectos considerando outros tipos de análise de gestos. A transferência de conhecimento entre domı́nios, neste caso, pode ser de grande valia para o presente projeto, principalmente no que diz respeito à construção do ambiente de experimentação. Para a execução da coleta de dados para a experimentação, um protocolo foi estabelecido e formalizado em projeto que está submetido a um comitê de ética em pesquisa. Desde que a coleta de dados envolverá a participação de seres humanos, havendo necessidade de captação da imagem das pessoas e de submetê-las a um processo com risco de causar algum tipo de estresse, a aprovação por este comitê se faz necessária. Também houve um avanço no estabelecimento dos protocolos de avaliação, como resumidamente descrito no final da seção 4. Por fim, foram realizados alguns experimentos preliminares de reconhecimento do tipo de dado que será trabalhado neste projeto, usando o Gesture Phase Segmentation Data Set.1 1 https://archive.ics.uci.edu/ml/datasets/Gesture+ CONCLUSÃO Este projeto tem como objetivo principal estudar como o contexto influencia na execução das fases do gesto e, diante da análise automática de gestos, como essa influência afeta os modelos de análise. A partir da influência que tais modelos sofrem, pretende-se extrair informação que demonstre o efeito sofrido pela gesticulação quando relacionada a diferentes contextos de discurso. Espera-se verificar a hipótese delineada neste trabalho e também contribuir com a área de análise de gestos em termos de: (a) proposição de protocolos de aquisição de dados, construção de experimentação e de avaliação de resultados para a área de segmentação das fases do gesto; (b) disponibilização de um conjunto de dados como um benchmark para a área. Tais contribuições devem somar-se aos esforços de desenvolvimento de recursos computacionais capazes de prover os sistemas de informação com a capacidade de interpretar a gesticulação humana, possibilitando a construção de mecanismos mais eficientes de mediação da interação entre humanos, ou de estabelecimento da interação entre humanos e máquinas ou ambientes. Agradecimentos Os autores agradecem o apoio das empresas Quantica e SPI Sistemas e Automação Industrial. 7. REFERÊNCIAS [1] A. R. Alvares and N. T. Roman. Uma ferramenta para análise da concordância entre múltiplos anotadores. In Proc. of the 9th Brazilian Symp. in Inf. and Human Language Tech., volume 1, pages 1–10, Oct. 2013. [2] R. Artstein and M. Poesio. Inter-coder agreement for computational linguistics. Comput. Linguist., 34(4):555–596, Dec. 2008. [3] T. Fawcett. An introduction to ROC analysis. Pattern Recognition Letters, 27(8):861 – 874, 2006. ROC Analysis in Pattern Recognition. [4] A. Kendon. Gesticulation and speech: Two aspects of the process of utterance. In M. R. Key, editor, The Relationship of verbal and nonverbal communication, pages 207–227. Mounton Publishers, 1980. [5] A. Kendon. Gesture: Visible action as utterance. Critical Inquiry in Language Studies, 5(1):72–77, 2004. [6] S. Kita, I. Gijn, and H. Hulst. Gesture and Sign Language in Human-Computer Interaction: Proc. of Int. Gesture Workshop Bielefeld, chapter Movement phases in signs and co-speech gestures, and their transcription by human coders, pages 23–35. Springer, Berlin, 1998. [7] R. Madeo. Máquinas de vetores suporte e a análise de gestos: incorporando aspectos temporais. Master’s thesis, Universidade de São Paulo, Brasil, 2013. [8] T. M. Mitchell. Machine Learning. McGraw-Hill, Inc., New York, NY, USA, 1 edition, 1997. [9] D. M. W. Powers. Evaluation: From precision, recall and F-measure to ROC, informedness, markedness e correlation. J. of Machine Learning Tech., 2(1):37–63, 2011. [10] A. S. Ramakrishnan. Segmentation of hand gestures using motion capture data. Master’s thesis, University of California, 2011. Phase+Segmentation 35 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Fusão de Face e Forma de Andar para Reconhecimento Biométrico Alternative Title: Fusion of Face and Gait for Biometric Recognition Edenilton L. Oliveira Universidade de São Paulo Av. Arlindo Bettio, 1000 03828-000 São Paulo, SP, Brasil [email protected] Clodoaldo A. M. Lima Universidade de São Paulo Av. Arlindo Bettio, 1000 03828-000 São Paulo, SP, Brasil [email protected] RESUMO Recentemente, esforços têm sido realizados visando empregar diversas modalidades biométricas de forma a tornar o processo de identificação menos vulnerável a ataques. A multimodalidade é baseada no conceito de que informações obtidas a partir de diferentes modalidades se complementam. Consequentemente, uma combinação adequada dessas informações pode ser mais útil que o uso de informações obtidas a partir de qualquer uma das modalidades individualmente. Por exemplo, identificação facial é mais confiável quando a pessoa está perto da câmera. Por outro lado, a forma de andar é uma modalidade biométrica apropriada para identificação humana à distância. Portanto, as propriedades complementares destas duas modalidades de biometria sugerem sua fusão. O objetivo desta pesquisa é investigar, propor e avaliar novas técnicas para fusão de face e forma de andar usando abordagem livre de modelo para usuários não cooperativos em ambiente não controlado. Sarajane M. Peres Universidade de São Paulo Av. Arlindo Bettio, 1000 03828-000 São Paulo, SP, Brasil [email protected] two biometrics modalities suggest fusion of them. The objective of this research is to investigate, propose and evaluate new techniques for fusion of face and gait using model-free approach to non-cooperative users in non-controlled environment. Categories and Subject Descriptors H.4.m [Information Systems Applications]: Miscellaneous; I.5.4 [Pattern Recognition]: Applications—Computer Vision General Terms Documentation Keywords Multimodal biometrics, Biometric Fusion, Feature Extraction, Gait, Face Palavras-Chave 1. Biometrica Multimodal, Fusão Biométrica, Extração de Caracterı́stica, Forma de Andar, Face Identificação humana a partir de visualizações arbitrárias do usuário e a distância é um requesito importante para diferentes tarefas, tais como, interfaces perceptuais para ambientes inteligentes, sistemas de vigilância e controle de acesso, etc [5][11][3]. Além disso, esta é adequada para usuários não cooperativos em ambientes não controlados. Diferentes modalidades podem ser usadas para identificação baseada na distância entre o individuo e a câmera. Se a pessoa está longe da câmera, é difı́cil obter informação facial em alta resolução para tarefa de reconhecimento. Entretanto, quando disponı́vel, esta contém informação relevante para reconhecimento. Uma modalidade que pode ser detectada e medida quando o individuo está longe da câmera é a forma de andar. Para alcançar desempenho ótimo, o sistema deve usar todas as informações disponı́veis e combiná-las de maneira significativa. Reconhecimento biométrico facial é uma área bastante desenvolvida para ambientes controlados, nos quais há um controle sobre variáveis como ângulo de rotação da câmera e iluminação, porém para ambientes não controlados ainda é uma área de pesquisa em aberto [9]. Por outro lado, a forma de andar é mais adequada para ambientes não controlados por ser menos sensı́vel a interferências do ambiente externo. Portanto, as propriedades complementares destas duas modalidades de biometria justificam sua fusão. ABSTRACT Recently, big efforts have been undertaken aiming to employ multiple biometric modalities in order to make the identification process less vulnerable to attacks. Multimodality is based on the concept that the information obtained from different modalities complement each other. Consequently, an appropriate combination of such information can be more useful than using information from single modalities alone. For example, face identification is more reliable when the person is close to the camera. On the other hand, gait is a suitable Biometric modality for human identification at a distance. Therefore, the complementary properties of these Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, to republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2016, May 17th-20th, 2016, Florianópolis, Santa Catarina, Brazil Copyright SBC 2016. 36 INTRODUÇÃO IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Este artigo está organizado da seguinte forma: a Seção 2 apresenta o problema de fusão de face e forma de andar para o reconhecimento biométrico, a Seção 3 descreve a abordagem proposta para o problema, a Seção 4 detalha o processo de avaliação dos resultados, a Seção 5 descreve as atividade já realizadas e, por fim, a Seção 6 apresenta a conclusão. 2. APRESENTAÇÃO DO PROBLEMA Um sistema biométrico consiste de um sistema de reconhecimento de padrões que recebe como entrada uma caracterı́stica biométrica coletada do indivı́duo por meio de sensores, extrai as caracterı́sticas relevantes e as compara com as caracterı́sticas do indivı́duo previamente armazenadas em um banco de dados. Este fornece como saı́da a identidade do indivı́duo [7]. Um sistema biométrico possui quatro módulos ([10]: i) módulo sensorial - responsável pela captura das amostras biométricas; ii) módulo de extração de caracterı́sticas - responsável por extrair caracterı́sticas relevantes a fim de representar as amostras; iii) módulo de classificação responsável por mapear cada vetor do espaço de caracterı́sticas para uma variável independente (escore); iv) módulo de decisão - responsável por aplicar uma função (geralmente uma função sinal) sobre a variável escore para determinar a decisão final do sistema, isto é, a identidade do indivı́duo [2]. O problema de identificação humana a partir de uma ou mais imagens faciais surgiu por volta de 1960, quando pesquisadores de visão computacional começaram a abordar o tema. O reconhecimento biométrico é feito através do processamento de imagens da face do usuário capturada por uma ou mais câmeras, logo o desempenho do sistema depende da qualidade das imagens. Em geral, o reconhecimento facial é sensı́vel ao ângulo de rotação da câmera, à baixa resolução da imagem e a artefatos usados pelos indivı́duos [1]. A forma de andar pode ser capturada com imagens de baixa resolução e a distância, esta (quase) não sofre com as variações de iluminação. Por outro lado, pode ser afetada por uma quantidade maior de fatores que causam variações intraclasses como fundo da imagem, tipo de superfı́cie, objetos transportados e uma quantidade inumerável de fatores não previstos que podem aparecer em cenários reais [1]. Essas variações podem afetar diretamente a detecção da silhueta e indiretamente o desempenho do sistema [5]. Um sistema biométrico multimodal integra duas ou mais modalidades biométricas [7]. A integração pode ser realizada de diferentes formas e pode ser categorizada de acordo com a sua arquitetura, nı́vel de fusão e estratégia de fusão. [10]. Há diferentes decisões a serem tomadas durante a fase de modelagem de um sistema biométrico multimodal baseado em face e forma de andar. Dentre as principais, pode-se citar: a) a forma de obtenção das caracterı́sticas biométricas pode ser cooperativa ou não-cooperativa por parte dos usuários; b) o ambiente de captura das imagens pode ser controlado ou não-controlado a depender, se existe ou não, controle sobre variáveis como o ângulo de rotação da câmera, iluminação, entre outras; c) a abordagem pode ser livre de modelo ou baseada em modelo, isto é, se as caracterı́sticas são extraı́das diretamente dos pixels das imagens ou a partir de um modelo geométrico respectivamente [1]; d) a fusão pode ocorrer no nı́vel sensorial (fusão dos dados), extração de caracterı́sticas (fusão dos vetores de caracterı́sticas) [15][12], escores (fusão de escores retornadas pelos 37 modelos) [5][14][13][9] e decisão (fusão de decisões ou rótulos de classes preditos pelos subsistemas) [4]. As decisões tomadas durante a fase de modelagem formam um conjunto de configurações que o sistema terá e influencia diretamente no desempenho do sistema. 3. PROPOSTA DE SOLUÇÃO A abordagem proposta consiste em combinar cada modalidade biométrica utilizando técnicas de extração de caracterı́sticas distintas (multimodalidade intramodal) para, em seguida, realizar a fusão intermodal de face com forma de andar, visando produzir sistemas de reconhecimento com maior desempenho e robustez. A abordagem proposta baseia nos experimentos de Liu e Sarkar[9] sobre a multimodalidade intramodal para face e forma de andar com fusão no nı́vel sensorial. Liu e Sarkar concluı́ram que, com base nos modelos gerados, a combinação intermodal tem maior chance de alcançar maior desempenho. A proposta desse trabalho vai avaliar a multimodalidade intramodal e intermodal no nı́vel de extração de caracterı́sticas e decisão. As contribuições serão as seguintes: estender o trabalho de Liu e Sarkar para nı́vel de extração de caracterı́sticas e decisão; avaliar a questão de pesquisa seguindo um protocolo de experimentação claro, delimitado, livre de viés e com condições de repetibilidade para, empiricamente, induzir novos conhecimentos sobre fusão de face e forma de andar para reconhecimento biométrico para fins de se alcançar os objetivos almejados (pesquisa exploratória). 4. PROJETO DE AVALIAÇÃO DA SOLUÇÃO Serão utilizadas medidas de avaliação propostas na literatura, tais como, taxa de falsa aceitação e falsa rejeição. Os resultados dessa avaliação serão utilizados para verificar se os objetivos foram alcançados. Grupos de controle serão estabelecidos para avaliar uma variável por vez e estabelecer comparações com a variável estudada e a variável que não sofreu alteração. No contexto dessa pesquisa, os grupos de controle serão os seguintes: experimentos usando somente imagens de face, experimentos usando somente forma de andar. Estes grupos serão utilizados para avaliar os benefı́cios da fusão de face e forma de andar. O mesmo procedimento se repete para avaliar outras variáveis do sistema. 5. ATIVIDADES JÁ REALIZADAS Este projeto usa visão computacional, processamento de sinais e aprendizagem de máquina. As principais técnicas utilizadas são: transformação, rastreamento, segmentação, normalização, estimação de ciclo do passo, extração de caracterı́sticas e reconhecimento de padrões. Primeiro, o vı́deo foi transformado em frames, depois foi realizado o rastreamento da pessoa nas sequências de frames seguido da segmentação da silhueta humana. A segmentação da silhueta foi realizada pela subtração do fundo da imagem original, isto é, s(x, y) = th(If (x, y) − Ib (x, y), k) onde s é a imagem da silhueta, If é a imagem contendo a pessoa, Ib é a imagem de fundo, (x, y) são coordenadas e th(a, b) é uma função que retorna 0 se a < k e 1 caso contrário. Após a segmentação, a silhueta é recortada e normalizada para resolução 128 × 64. A Figura 1 mostra o resultado da aplicação dessas técnica. As fases do ciclo mostradas na Figura 1 foram estimadas com base em uma série temporal obtida a partir do cálculo IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Agradecimentos Os autores agradecem o apoio das empresas Quantica e SPI Sistemas e Automação Industrial. 7. Figura 1: Sequência de silhuetas humanas com uma estimativa para as fases do ciclo da forma de andar da esquerda para a direita: contato do calcanhar, pé plano, apoio médio, apoio terminal, pré-gingado, gingado médio inicial, gingado terminal. da área da silhueta no tempo t [8], calculada usando momentos estatı́sticos [6]. Um momento estatı́stico de ordem p + q é dado por: w−1 X h−1 X p q Mpq = x y s(x, y) (1) x=0 y=0 O momento de ordem 0 representa a área da forma de andar e a série é dada por Y (t) = M00 (S(t)), onde S = {s0 , s1 , s2 , · · · , sN } uma sequência de N imagens de silhuetas. A Figura 2 mostra a série temporal com a área escalonada no intervalo (0, 1), gerada a partir desse procedimento com uma estimativa dos picos da série marcados em vermelho. A partir da informação de periodicidade é possı́vel estimar as silhuetas que demarcam as sete fases do ciclo. Figura 2: Área da silhueta ao longo do tempo com picos estimados em vermelho. 6. CONCLUSÃO Este projeto tem como objetivo principal investigar, propor e avaliar novas técnicas para fusão de face e forma de andar para reconhecimento biométrico. Dentre as atividades já realizadas encontra-se o pré-processamento da forma de andar: transformação dos dados, segmentação e normalização das imagens de silhuetas, estimação das fases do ciclo via detecção de periodicidade da série temporal formada pela área da silhueta ao longo do tempo. As atividade seguintes são aplicar pré-processamento em face, implementar métodos de extração de caracterı́sticas, construção dos modelos indutivos, definição de protocolo para a experimentação, avaliação dos resultados e escrita da dissertação. Espera-se que este trabalho contribua com a área de reconhecimento biométrico multimodal em termos de: a) validação das técnicas de fusão já existentes; b) extensão e proposição de novas técnicas de fusão; c) maior desempenho e robustez a ataques. 38 REFERÊNCIAS [1] I. Buciu. Challenges and specifications for robust face and gait recognition systems for surveillance application. J. of Electrical and Electronics Engineering, 7(1):25–30, 2014. [2] M. Gavrilova, M. Monwar, and I. Global. Multimodal Biometrics and Intelligent Image Processing for Security Systems. IGI Global, 2013. [3] Y. Guan, X. Wei, C.-T. Li, and Y. Keller. People identification and tracking through fusion of facial and gait features. In V. Cantoni, D. Dimov, and M. Tistarelli, editors, Biometric Authentication, pages 209–221. Springer, 2014. [4] Y. Guan, X. Wei, C.-T. Li, G. Marcialis, F. Roli, and M. Tistarelli. Combining gait and face for tackling the elapsed time challenges. In Proc. of IEEE 6th Int. Conf. on Biometrics: Theory, App. and Sys. (BTAS), pages 1–8, Sept 2013. [5] M. Hofmann, S. Schmidt, A. Rajagopalan, and G. Rigoll. Combined face and gait recognition using alpha matte preprocessing. In Proc. of 5th IAPR Int. Conf. on Biometrics (ICB), pages 390–395, Mar. 2012. [6] Z. Huang and J. Leng. Analysis of hu’s moment invariants on image scaling and rotation. In Comp. Engineering and Technology (ICCET), 2010 2nd Int. Conf. on, volume 7, pages V7–476–V7–480, 2010. [7] A. Jain, A. Ross, and S. Prabhakar. An introduction to biometric recognition. Circuits and Sys. for Video Tech., IEEE Transactions on, 14(1):4–20, 2004. [8] J. J. Little and J. E. Boyd. Recognizing people by their gait: The shape of motion, 1996. [9] Z. Liu and S. Sarkar. Outdoor recognition at a distance by fusing gait and face. Image and Vision Comp., 25(6):817–832, 2007. [10] A. Ross and A. Jain. Information fusion in biometrics. Pattern Recognition Letters, 24(13):2115–2125, 2003. [11] G. Shakhnarovich, L. Lee, and T. Darrell. Integrated face and gait recognition from multiple views. In Proc. of IEEE Conf. on Comp. Vision and Pattern Recognition (CVPR), volume 1, pages I–439–I–446, 2001. [12] X. Xing, K. Wang, and Z. Lv. Fusion of gait and facial features using coupled projections for people identification at a distance. IEEE Signal Processing Letters, 22(12):2349–2353, Dec. 2015. [13] X. Zhou and B. Bhanu. Integrating face and gait for human recognition. In Proc. of Conf. on Comp. Vision and Pattern Recognition Workshop (CVPRW), pages 55–55, Jun. 2006. [14] X. Zhou and B. Bhanu. Integrating face and gait for human recognition at a distance in video. IEEE Trans. on Sys., Man, and Cyber., Part B: Cyber., 37(5):1119–1137, Oct. 2007. [15] X. Zhou and B. Bhanu. Feature fusion of side face and gait for video-based human identification. Pattern Recognition, 41(3):778–795, 2008. IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Metas Estratégicas Organizacionais como base para Modelagem de Requisitos não Funcionais de Processos de Negócio Alternative Title: Strategic Organizational goals as the basis for Non-Functional Requirements Modeling Business Processes Adson do Carmo Universidade de São Paulo Rua Arlindo Béttio, 1000, Ermelino Matarazzo São Paulo, Brasil [email protected] RESUMO Este projeto de pesquisa propõe estender o framework StrAliBPM com a criação de uma camada de extração de informações de metas estratégicas organizacionais a serem usadas na modelagem de requisitos não funcionais de processos de negócio. De acordo com o framework StrAli-BPM original, esses requisitos não funcionais devem ser representados no formato de Acordos em Nı́vel de Negócio (BLA – Business Level Agremment). Espera-se com este projeto contribuir para a melhoria do alinhamento estratégico entre os nı́veis estratégicos e os operacionais. Palavras-Chave Alinhamento estratégico; BPM; BPMN; KPI; BSC. Categories and Subject Descriptors K.6.1 [Management of Computing and Information System]: Project and People Management - Management techniques, Strategic information systems planning, Systems analysis and design; H.4.1 [Information Systems Applications]: Office Automation – Workflow management. General Terms Theory 1. INTRODUÇÃO Visando o alinhamento estratégico [11], é necessário compreender a importância dos requisitos não funcionais oriundos das metas estratégicas organizacionais (nomeadas neste trabalho apenas como “metas estratégicas”). Segundo Xavier et al. [12] e Florio, Salles e Fantinato [4], a identificação Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, to republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2016, May 17th-20th, 2016, Florianópolis, Santa Catarina, Brazil Copyright SBC 2016. 39 Marcelo Fantinato (orientador) Universidade de São Paulo Rua Arlindo Béttio, 1000, Ermelino Matarazzo São Paulo, Brasil [email protected] dos requisitos não funcionais depende do tratamento das metas estratégicas. Assim, tratar requisitos não funcionais se refere à busca dos interesses organizacionais. E este trabalho busca suprir a carência no tratamento desses requisitos não funcionais, pois esses requisitos podem ser encontrados nas metas estratégicas. Indicadores Chave de Desempenho (KPI – Key Performance Indicator ) estão ligados às metas estratégicas [7]. Via KPI, pode-se verificar se a organização está tomando medidas para alcançar suas metas estratégicas. A partir da comparação entre uma meta estratégica e KPIs derivados, caso os indicadores expressem valores fora da variação esperada pela meta estratégica, é necessário aplicar ações corretivas para direcionar a organização ao caminho desejado. Indicadores Balanceados de Desempenho (BSC – Balanced Scorecard ) também podem ser usados para preparar as organizações em focar e alinhar todos os setores na estratégia organizacional [6]. Assim, BSC gera uma tendência no aumento do foco e do alinhamento estratégico organizacional. Gestão de Processos de Negócio (BPM – Business Process Management) tem sido usada no alcance do alinhamento estratégico entre negócio e TI. BPM é a arte e a ciência de supervisionar como o trabalho é executado na organização em busca de resultados positivos visando adquirir vantagem competitiva [3]. BPM trata de gerenciar cadeias inteiras de eventos, atividades e decisões que trazem valor à organização e aos clientes – os chamados “processos de negócio”. Para apoiar o alinhamento estratégico, Salles [10] propõe a modelagem de processos de negócio via uma extensão da Notação e Modelo de Processos de Negócio (BPMN – Business Process Model and Notation) dentro de um framework chamado StrAli-BPM (Strategic Aligment with BPM ). Esse framework permite o uso de Acordos em Nı́vel de Negócio (BLA – Business Level Agreements) na modelagem de requisitos não funcionais. Porém, StrAli-BPM não define quais informações devem compor os requisitos não funcionais na forma de BLAs, mas apenas como estruturá-las. Há apenas a hipótese de que tais informações devem ser provenientes de metas estratégicas. De acordo com Florido, Salles e Fantinato [4], BLAs são restrições não funcionais em nı́vel de modelo de processo, similar às restrições realizadas por Acordos em Nı́vel de Serviço (SLA – Service Level Agreements) em nı́vel de implementação de processos via serviços. IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 2. APRESENTAÇÃO DO PROBLEMA Em geral, pouco se oferece à modelagem de requisitos não funcionais durante a modelagem de processos; a qual foca primordialmente em requisitos funcionais. De acordo com Py et al. [9], os requisitos não funcionais tendem a aparecer apenas em etapas mais adiantadas do ciclo de vida de BPM. Assim, a modelagem de processos de negócio ainda não oferece apoio adequado ao tratamento de requisitos não funcionais [4]. De fato, o esperado seria que houvesse esse tratamento ao longo de todo o ciclo de vida de BPM, incluindo: modelagem, implementação, execução e monitoramento de processos [1, 9]. Essa lacuna dificulta o alinhamento estratégico entre negócio e TI: se, por um lado, a implementação de processos conta com tratamento de requisitos não funcionais (por meio de SLAs); por outro lado, os implementadores de processo não possuem base sólida para a definição dos SLAs. Para o nı́vel de modelo de processos, Bratanis et al. [2], por exemplo, inspiraram-se no mundo real dos negócios para definir outro tipo de acordo – o BLA. BLA é um acordo de qualidade definido durante a modelagem do processo, a ser apoiado posteriormente por um conjunto de SLAs relacionados aos serviços usados na implementação do processo. Enquanto SLAs definem atributos de qualidade em nı́vel de serviços na implementação do processo, sendo tratado em nı́vel técnico; BLAs definem atributos de qualidade em nı́vel de modelo de processo, ou seja, tratado em nı́vel tático e estratégico. O esperado é que seja possı́vel extrair informações de BLAs para definir um conjunto associado de SLAs. O framework StrAli-BPM foi proposto visando possibilitar a obtenção do alinhamento estratégico entre as áreas de negócio e TI por meio do uso de BLAs e SLAs. Porém, StrAli-BPM não define quais informações exatamente devem compor os requisitos não funcionais na forma de BLAs, mas apenas como estruturar tais informações a serem usadas na sequência para a criação de SLAs. Assim, os analistas de processo possuem meios para a criação de BLAs associados aos processos de negócio, os quais representam os requisitos não funcionais do processo, mas não são orientados a como obter informações para definir esses requisitos não funcionais. Há apenas a hipótese de que tais informações devem ser provenientes de metas estratégicas. 3. PROPOSTA DE SOLUÇÃO A abordagem proposta busca semi-automatizar a extração de informações relevantes das metas estratégicas para a definição dos requisitos não funcionais dos processos de negócio na forma de BLA. Assim, este trabalho visa estender o framework StrAli-BPM para tratar essa sua limitação. A Figura 1 apresenta uma visão geral do framework StrAliBPM original incluindo a extensão proposta. O novo elemento proposto é apresentado na cor cinza e ilustra o template usado para definir as informações que devem ser extraı́das das metas estratégicas. Do ponto de vista de requisitos não funcionais do processo de negócio, BLAs fazem a ligação entre o nı́vel mais alto (estratégico e tático) da organização e a área de TI no nı́vel mais baixo (operacional). BLAs são, portanto, responsáveis por garantir o alinhamento estratégico não só entre TI e áreas de negócio no nı́vel operacional, mas entre o nı́vel operacional e os nı́veis estratégico e tático da organização. Neste cenário, as metas estratégicas definidas em nı́vel estratégico, são usados como fonte de informações relevantes para a composição de BLAs. Embora as 40 Figura 1: Framework StrAli-BPM estendido metas estratégicas possam ser úteis também para o levantamento dos requisitos funcionais do processo de negócio, isso não é tratado no escopo deste trabalho. As metas estratégicas são representadas no formato de KPI ou BSC. Para a elaboração de tais metas estratégicas, um template apropriado é proposto, baseado em um metamodelo que representa os atributos de KPI e BSC. A definição desse metamodelo e template associado são necessários uma vez que não existem, na literatura, estruturas padronizadas para isso. A partir da estrutura proposta desse template, o conteúdo de metas estratégicas é analisado para que informações relevantes à criação de BLAs sejam mapeadas para as áreas de negócio responsáveis pela modelagem do processo. A versão inicial da estrutura do template é apresentada na Tabela 1. Essa versão é um esboço do template que deve dar suporte as informações do KPI e BSC. O tratamento das informações de metas estratégicas organizacionais para modelagem dos requisitos não funcionais pode ocorrer de duas formas: (i) o nı́vel estratégico já modela os requisitos não funcionais das metas estratégicas usando a estrutura proposta, se considerá-la apropriada para seus propósitos; ou (ii) assumindo que os requisitos não funcionais das metas estratégicas são criadas usando outra estrutura, é necessário identificá-las e mapeá-las para a estrutura proposta. Para apoiar a abordagem sendo proposta, pretende-se desenvolver um protótipo de ferramenta que apoie – de forma semi-automatizada – tanto a definição das metas estratégicas na estrutura proposta (ou o mapeamento de metas estratégicas definidas em outra estrutura para a estrutura proposta) quanto a extração de informações relevantes e seu mapeamento para os BLAs a serem criados. Para isso, o apoio semi-automatizado deve ser dividido em etapas. Caso as metas estratégicas não tenham sido definidas na estrutura proposta, primeiramente, é necessário identificar a fonte de dados de tais metas estratégicas, que pode estar em diferentes formas, tais como: banco de dados, planilhas eletrônicas, documentos texto, etc. Em seguida, é necessário definir a forma de consumo desses dados para o mapea- IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Atributo Identificador Contexto corporativo Meta estratégica – Aspecto a ser medido – Métrica a ser atingida Tabela 1: Template proposto para metas estratégicas Descrição Nome definido para o artefato O cenário que levou a exploração da necessidade em questão Detalhamento da meta (considerando o aspecto a ser medido e monitorado) Descrição do aspecto que se deseja medir e acompanhar como meta estratégica Valor ou percentual que deve ser cumprido para a meta estratégica em questão mento para a estrutura proposta, o que pode ser realizado, por exemplo, via stored procedures, queries, scripts, etc. Independentemente da forma em que se encontram os dados das metras estratégicas, é necessário que os “atributos” que compõem tais métricas sejam identificados. Por fim, as informações extraı́das devem ser convertidas para a estrutura de template proposta para a representação de metas estratégicas. Essa última etapa deve ser realizada com o apoio de um especialista, que deve usar o apoio computacional para fazer a ligação entre dois esquemas diferentes de dados (por exemplo, por meio do relacionamento entre atributos de ambos os esquemas), mas que devem possuir conteúdo equivalente. Se a organização optar por usar diretamente tal estrutura, então esse conjunto de passos é ignorado. Considerando as metas estratégicas na estrutura proposta, a segunda etapa é realizada, também com o apoio de um especialista. Para isso, é necessário localizar as informações relevantes das metas estratégicas, exportá-las e oferecer para o especialista como fonte de dados para a criação de BLAs associados ao modelo de processo de negócio, que já deve estar criado. O apoio computacional deve oferecer um esboço de BLA que pode ser confirmado ou alterado pelo especialista. Informações não possı́veis de serem extraı́das a partir das metas estratégicas, mas ainda necessárias para a criação de BLAs, deverão ser definidas pelo próprio especialista. 4. AVALIAÇÃO DA SOLUÇÃO Planeja-se avaliar a abordagem proposta por meio de sua aplicação em um cenário organizacional real. Para isso, alguma meta estratégica especı́fica da organização deve ser identificada. Com base em tal meta, um especialista deve usar a abordagem proposta para a criação de BLAs; enquanto outro especialista deve posteriormente validar se os BLAs gerados refletem corretamente a meta estratégica usada. Espera-se poder realizar esse procedimento com pelo menos cinco metas estratégicas diferentes. 5. CONCLUSÃO BPM tornou-se essencial às organizações na busca de vantagem competitiva por meio da melhoria de seus processos de negócio. BPM pode favorecer o alinhamento estratégico entre áreas de negócio e TI, sendo a TI um dos responsáveis finais pelo alcance de metas estratégicas [5]. Dentro desse contexto, requisitos não funcionais precisam ser tratados corretamente para facilitar a obtenção tanto de alinhamento estratégico quanto de vantagem competitiva [8]. Este projeto de pesquisa de mestrado busca propor uma abordagem que possa auxiliar neste contexto, por meio da extensão do framework StrAli-BPM. A extensão aqui proposta visa apresentar mecanismos para que informações relevantes de metas estratégicas possam ser usadas para o levantamento de requisitos não funcionais a comporem os mo- 41 Qtde. 1 1 1...n 1 1 delos de processo de negócio, na forma de BLAs. Assim, os BLAs criados poderão ser mapeados para SLAs ligados à implementação do processo de forma a garantir o alinhamento estratégico completo dentro dos diferentes nı́veis organizacionais: estratégico, tático e operacional. 6. REFERÊNCIAS [1] P. Bocciarelli and A. D’Ambrogio. A BPMN extension for modeling non functional properties of business processes. In 2011 Symp. on Theory of Modeling & Simulation: DEVS Integrative M&S Symp., pages 160–168. Society for Comp. Simul. Int., 2011. [2] K. Bratanis, D. Dranidis, and A. J. Simons. Towards run-time monitoring of web services conformance to business-level agreements. In 5th Int. Academic and Ind. Conf. on Testing–Practice and Research Techniques, pages 203–206. Springer, 2010. [3] M. Dumas, M. La Rosa, J. Mendling, and H. A. Reijers. Fundamentals of business process management. Springer, 2013. [4] L. Florio, G. B. Salles, and M. Fantinato. Apoiando alinhamento estratégico em organizações usando contratos eletrônicos estendidos com BLA. In VIII Simp. Bras. de Sist. de Inf.–Trilhas Técnicas, pages 348–359. Sociedade Brasileira de Computação, 2012. [5] E. S. Galas and V. M. R. Ponte. O balanced scorecard e o alinhamento estratégico da tecnologia da informação: Um estudo de casos múltiplos. Revista Contabilidade & Finanças, 17(40):37–51, 2006. [6] R. S. Kaplan and D. P. Norton. Organização orientada para a estratégia: Como as empresas que adotam o balanced scorecard prosperam no novo ambiente de negócios. Gulf Professional Publishing, 2000. [7] R. Levin. The importance of key performance indicators. J. of the American Dental Assoc., 2012. [8] R. S. Pressman. Engenharia de software: Uma abordagem profissional. 7a Edição. Ed: McGraw Hill, Reading, Massachusetts, 2011. [9] H. Py, L. Castro, F. A. Baião, and A. K. Tanaka. A service-based approach for data integration based on business process models. In 11th Int. Conf. on Enterp. Inf. Sys., pages 222–227, 2009. [10] G. B. M. Salles. Tratamento de acordos em processos de negócio: Em busca de alinhamento estratégico. Master’s thesis, Univ. de São Paulo, SP – Brasil, 2014. [11] H. P. Sousa and J. C. S. do Prado Leite. Modeling organizational alignment. In 33rd Int. Conf. on Conceptual Modeling, pages 407–414. Springer, 2014. [12] C. P. Xavier, Alencar. Integração de requisitos não funcionais a processos de negócios: Integrando BPMN e NFR. In 13th Work. em Eng. de Requisitos, pages 29–40. Sociedade Brasileira de Computação, 2010. IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Uma Plataforma para Análise e Recomendação de Modelos de Processos Intensivos em Conhecimento Alternative Title: A Platform for Analysis and Recommendation of Knowledge Intensive Process Models Pedro Henrique Piccoli Richetti Fernanda Araujo Baião Departamento de Informática Aplicada, UNIRIO Av. Pasteur, 458 - Urca, CEP 22290-240 Rio de Janeiro – RJ – Brasil [email protected] Departamento de Informática Aplicada, UNIRIO Av. Pasteur, 458 - Urca, CEP 22290-240 Rio de Janeiro – RJ – Brasil [email protected] RESUMO INTRODUÇÃO A introdução de novas tecnologias impulsionou a maneira como processos de negócios podem ser modelados, implementados e analisados. Há um interesse crescente pela manipulação de grandes volumes de informação e a necessidade de novas técnicas para análise e gestão de processos intensivos em conhecimento. Neste trabalho é proposta a criação de uma plataforma de análise de processos com o objetivo de descobrir modelos de processos intensivos em conhecimento, sob diferentes perspectivas e orientados à qualidade, que possam subsidiar e aprimorar a tomada de decisão com base em informações de processos. A gestão de processos de negócios (BPM) é cada vez mais utilizada em organizações e em diversas plataformas em rede que incluem, além dos tradicionais sistemas de suporte ao negócio, mídias sociais e serviços móveis. A execução de fluxos de trabalho em sistemas de suporte ao negócio pode deixar registros da execução de instâncias de processos, e estes registros podem ser analisados sob múltiplas perspectivas. Uma das possibilidades é a de realizar a descoberta de como os processos de negócio são executados, quais são os atores envolvidos e como melhorar a eficiência do processo por meio da análise dos dados nestes registros de execução do processo [1]. Os resultados desta análise podem ser avaliados à luz da estratégia do negócio de forma a subsidiar tomadas de decisão, que podem implicar em ações de melhoria de processo e na criação de novos serviços e produtos, gerando valor para a organização. É importante considerar que a influência dos dados disponíveis para o gerenciamento de um processo pode ser mais impactante que o poder normativo da visão estratégica do negócio, e que as pessoas e suas interações sociais podem interferir na dinâmica e na ordem estratégica de um processo, criando variantes que vão além do processo previamente planejado [2]. Palavras-chave Processos Intensivos em Conhecimento; Qualidade de Modelos; Tomada de Decisão. ABSTRACT The introduction of new technologies propelled the way business processes are modeled, implemented and analyzed. There is a growing interest in handling large volumes of information and the need for new techniques for knowledge-intensive process management and analysis. This work proposes to create a platform for process analysis which aims to discover models from knowledge-intensive processes, from different perspectives and quality-driven, which can support and enhance decision making based on processes information. Mesmo com o advento dos chamados sistemas orientados a processos, é sabido que para descrever de forma completa um processo de negócio, outros elementos precisam ser considerados, como por exemplo, documentos e informações contextuais do processo e da organização e o conhecimento tácito das pessoas envolvidas no processo. Neste cenário, o desafio é integrar diferentes fontes de informação e um grande volume de dados, que podem estar dispersos em ambientes distribuídos, para gerar informações assertivas que criem valor para o negócio, principalmente nos processos com altos níveis de colaboração, flexibilidade e tomadas de decisão, chamados de processos intensivos em conhecimento (PIC) [3]. Tradicionalmente modelos de processos de negócio utilizam uma representação do fluxo do trabalho a ser realizado, com a identificação das atividades, eventos, desvios e papéis envolvidos nos processos. No entanto, para uma abordagem mais completa que represente todos os aspectos de um processo, principalmente nos PICs, outras perspectivas precisam ser explicitadas, requerendo linguagens e notações de modelagem adicionais. Categories and Subject Descriptors H.3.1 [Information Storage and Retrieval]: Content Analysis and Indexing – Abstracting methods, Linguistic processing. H.5.0 [Information Interfaces and Presentation]: General General Terms Management, Performance, Design, Languages. Keywords Knowledge Intensive Processes; Model Quality; Decision Making Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2016, May 17–20, 2016, Florianópolis, Santa Catarina, Brazil. Copyright SBC 2016. A relevância desta pesquisa se justifica pelo interesse crescente pela manipulação de grandes volumes de informação e na necessidade de novas técnicas para análise e gestão de processos intensivos em conhecimento. Como exemplo, recentemente foi criada a iniciativa RISE-BPM [2] que tem por objetivo desenvolver novos horizontes 42 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 para gestão de processos de negócios, por meio de um consórcio entre organizações de referência na área, com intuito de (a) impulsionar a pesquisa em BPM para a era da computação social, dos dispositivos inteligentes, computação em tempo real e big data; (b) habilitar companhias a desenvolver novos produtos e serviços para a modelagem e análise de processos de negócio. Um dos elementos chave para estes objetivos é identificar áreas intensivas em conhecimento em processos de forma a proporcionar a aplicação de técnicas de gestão adequadas, tais como modelagem de processos e indicadores de desempenho. para que possam ser compreendidos e analisados pelas partes interessadas de forma a suportar a tomada de decisão. 2. PROPOSTA DE SOLUÇÃO 2.1 Referencial Teórico Modelos são necessários para a tomada de decisão em tarefas de desenho, alteração e melhoria de processos de negócio [8]. Rosemann et al. [9] definem que sistemas inteligentes, capazes de lidar com as diferentes facetas da organização e seus processos podem servir como uma ferramenta poderosa para suportar os gestores na tomada de decisão e em ações em ambientes complexos e em constantes mudanças. Um exemplo é apresentado em Conforti et al. [10] onde é proposta uma abordagem de suporte a decisão para a redução de riscos na execução de processos. Esta proposta visa estender a pesquisa realizada em [4], que teve por objetivo tratar a complexidade da representação de modelos de processos declarativos. Modelos declarativos podem ser utilizados para representar a perspectiva de relacionamento entre as atividades de PIC, permitindo modelar cenários pouco estruturados e com elevada flexibilidade. No entanto, a abordagem em [4] não é capaz de representar outras perspectivas de PIC, como socialização e tomadas de decisão. A proposta corrente visa considerar aspectos mais abrangentes, permitindo a criação de modelos com diferentes perspectivas de modelagem, orientadas às demais características de processos intensivos em conhecimento. Di Ciccio et al. [3] realizaram um levantamento das principais características e requisitos das abordagens atuais que podem lidar com processos intensivos em conhecimento, e como resultado foi constatado que nenhuma das abordagens avaliadas é capaz de prover suporte a todos os requisitos para representação de processos intensivos em conhecimento. A Ontologia de Processos Intensivos em Conhecimento (KIPO) [6] se propõe a consolidar os elementos que caracterizam este tipo de processo, tais como: relacionamentos, fatores motivacionais, regras do negócio, interações sociais, sentimentos, intenções relacionadas à execução de uma ação do processo, e características de decisões tomadas. A KIPO é capaz de explicitar um processo intensivo em conhecimento, porém não oferece uma notação visual para a construção de modelos. Neste contexto, foi proposta a Notação de Processos Intensivos em Conhecimento (KIPN) [11], uma notação para representar os conceitos inerentes aos processos definidos na ontologia KIPO de forma cognitivamente eficaz. No entanto, a existência de uma notação adequada ainda não é suficiente, pois deixa a cargo do modelador ou gestor a tarefa crucial de selecionar, de forma dinâmica, quais as perspectivas mais relevantes para a análise em questão, levando em conta também as características dos dados disponíveis e o potencial de valor agregado que uma determinada visão ou diagrama de dados pode fornecer. 1. APRESENTAÇÃO DO PROBLEMA A pesquisa e a prática discutiram a gestão de processos de negócio de forma abrangente e foi identificado que o desalinhamento entre as iniciativas relacionadas à processos e a estratégia organizacional como a principal causa de insucesso na aplicação da gestão de processos de negócios [2]. Nas organizações modernas, sistemas de informação orientados a processos são responsáveis por uma grande parcela de execução de processos de negócios. Tipicamente, estes sistemas rastreiam e registram dados de eventos relativos a instâncias de processos e de atividades com detalhes. No entanto, em muitos casos, processos são executados através de várias aplicações e ferramentas que são capazes de armazenar registros de execução, mas que não são orientados a processos, ou ainda partes da execução de processos não são registradas. Devido à grande quantidade de informações estruturadas e não estruturadas sendo criadas e distribuídas em diferentes redes e comunidades atualmente, é preciso buscar novas formas de coletar informações das diversas fontes distribuídas no ambiente organizacional, armazená-las, transformá-las e representá-las através de modelos analíticos [5] para proporcionar a análise de desempenho e conformidade do processo executado, possibilitando tomada de decisões efetivas. A mineração de processos é considerada uma disciplina situada entre a inteligência computacional e a mineração de dados e também entre a modelagem e análise de processos [1]. Seu objetivo é prover conhecimento baseado em fatos e proporcionar suporte à tomada de decisão, e sua base é a existência de um registro de eventos. A adequação de um modelo de processo descoberto depende dos parâmetros e algoritmos utilizados e do julgamento do analista do processo [12]. Processos intensivos em conhecimento envolvem conceitos complexos e subjetivos, tipicamente presentes no conhecimento tácito das partes interessadas no processo [6]. Um PIC compreende atividades baseadas na aquisição, compartilhamento, armazenamento e reuso de conhecimento e colaboração entre participantes, de forma que o valor agregado à organização depende do conhecimento dos agentes do processo. Estes processos tratam de decisões imprevisíveis, tarefas orientadas à criatividade e execução dinâmica que evolui com base na experiência adquirida pelos agentes do processo. Todas essas características são obstáculos para a representação deste tipo de processo e os tornam sujeitos a diferentes interpretações. Abstrações são vistas como uma abordagem efetiva para representar modelos legíveis, mostrando atividades agregadas e omitindo detalhes irrelevantes [13]. O ajuste da granularidade de um modelo depende da parte interessada na análise. Os gestores em nível executivo tendem a apreciar modelos que descrevam um processo em alto nível, permitindo tomar decisão rápidas e corretas. Por outro lado, empregados que atuam na execução do processo são interessados em especificações detalhadas do processo [14]. Baier et al. [15] apresentaram um método para construir camadas de abstração através do alinhamento de atividades e eventos de um processo. O seu objetivo é abstrair um registro de eventos para o mesmo nível de abstração desejado pelo negócio, utilizando conhecimento do domínio presente na documentação do processo. Eshuis et al. [16] propuseram a construção de visões de processo. Uma visão de processo pode, por exemplo, omitir detalhes de um processo interno que são transparentes para o cliente. Richetti et al. [17] propuseram uma metodologia para criação de abstrações em Uma das principais vantagens associadas à utilização de modelos é facilitar o entendimento comum de domínio e processos entre usuários e especialistas [7]. Uma vez que se disponham de dados para representar um PIC, o problema em questão é como tratar e contextualizar de forma automática essas informações para produzir modelos em quantidade e com características suficientes 43 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Figura 1. Processo proposto para análise e recomendação de modelos. modelos de processos declarativos baseados na semântica dos nomes das atividades. utilizando processamento de linguagem natural e para cada questão, identificar os objetivos relacionados (gargalos, ineficiências e outros problemas que possam influenciar os resultados do processo). Uma vez interpretada a questão, devem ser definidas quais são as fontes de dados necessárias para apresentar modelos de interesse recomendados que permitam à parte interessada obter uma resposta. São exemplos de fontes de dados: registros de eventos, bases de dados, modelos de processos existentes, regras de negócios, dados externos (e.g. mídias sociais) e outros documentos relacionados ao processo. A qualidade em modelos de processo foi discutida por Reijers et al. [18] onde foi apresentado um framework de gestão de qualidade que visa produzir modelos melhores, utilizando uma coletânea de métodos, técnicas e ferramentas existentes na literatura. São citados três aspectos de qualidade: a sintática, a semântica e a pragmática. A qualidade sintática trata da conformidade do modelo às regras e vocabulário da linguagem de modelagem utilizada. A qualidade semântica se refere a produzir modelos que façam afirmações verdadeiras sobre o fenômeno a que se propõem representar. A qualidade pragmática está relacionada a produzir modelos que sejam compreendidos pelas pessoas. É importante considerar que os dados selecionados podem estar armazenados em ambientes distribuídos e necessitarão de integração para que seja possível processar e apresentar evidências para a resposta, assim será possível construir modelos baseados na KIPO com qualidade suficiente para comunicar os resultados à parte interessada, que poderá interagir com a plataforma até satisfazer a sua necessidade em questão. Durante a atividade de geração serão empregadas técnicas para aumentar a qualidade dos modelos, e.g. a utilização de ontologias de fundamentação para melhoria da qualidade semântica. Caso existam mais questões, o processo se repetirá, caso contrário a análise será encerrada. A Figura 1 apresenta o fluxo proposto para este processo. A plataforma a ser construída deverá ser apropriadamente avaliada sob perspectivas técnicas e de usuário. Ribeiro et al. [19] propuseram um sistema de recomendação para descoberta de processos. Esta abordagem limitou-se à seleção de algoritmos de mineração de processos estruturados que resultam em modelos orientados a controle de fluxo de atividades. 2.2 Enfoque de Solução Dada a problematização descrita na seção 2 e a hipótese: se forem utilizadas técnicas para avaliar a qualidade de informações históricas sobre processos intensivos em conhecimento e de seu contexto então será possível descobrir e apresentar modelos em quantidade e qualidade necessárias para a tomada de decisão de uma parte interessada no processo, as seguintes questões de pesquisa nortearão a criação e avaliação da solução proposta: 3. PROJETO DE AVALIAÇÃO DA SOLUÇÃO Q1) Quais informações são necessárias para entender e aprimorar um processo intensivo em conhecimento? Para as atividades de pesquisa desta proposta será utilizado o paradigma de design-science [20]. O foco principal do design não é descobrir como as coisas são, mas sim como devem ser construídas para atender a determinados objetivos ou funções [21]. Um objeto construído na disciplina de BPM é um artefato de tecnologia de informação composto por: construtos, modelos, métodos e implementações de software. Construtos são as linguagens e conceitos necessários para caracterizar um fenômeno. Modelos são utilizados para descrever tarefas, situações ou artefatos. Métodos são formas de executar atividades orientadas a objetivos. Implementações são necessárias para instanciar os outros tipos supracitados de forma a permitir a execução de tarefas específicas [22]. No caso de um artefato de tecnologia de informação, criado por meio desse processo, ser considerado inadequado, ele pode ser revisado de forma a aprimorar seu desempenho através de ciclos de design, de forma que nenhum Q2) Quais visões ou perspectivas do processo são necessárias? Q3) Quão representativo é um modelo em relação às informações históricas disponíveis? Estas questões levam a necessidade de considerar aspectos tais como: abstrações em modelos de processo, critérios de qualidade de modelos (sintáticos, semânticos, estruturais e também pragmáticos) e granularidade de informação desejada pela parte interessada na análise. Será realizado um levantamento dos aspectos de qualidade existentes e a possível proposta de novos critérios que permitirão avaliar a qualidade e recomendar os melhores modelos em um dado cenário. A ideia principal da solução consiste em uma plataforma de análise do processo intensivo em conhecimento orientada a questões propostas por uma parte interessada. Deve ser realizada análise da sentença da questão 44 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 problema conceitual possa interromper o processo de pesquisa subsequente. À luz deste paradigma, a pesquisa será conduzida e avaliada através dos seguintes estágios: [4] Richetti, P.H.P. 2015. Complexity Reduction of Declarative Process Models Using a Semantic Abstraction Criterion. Dissertação de Mestrado, UNIRIO. (2) Pesquisa empírica por meio de estudos de caso, baseada em coleta, triangulação e teorização a partir de dados qualitativos e quantitativos obtidos em campo, de forma a analisar os fatores e o ambiente organizacional (contexto) que descrevem o fenômeno. [6] França, J. 2012. Uma Ontologia Para Definição de Processos Intensivos Em Conhecimento. Dissertação de Mestrado, UNIRIO, Rio de Janeiro, RJ. (1) Análise da literatura e pesquisa conceitual a fim de identificar o estado da arte, trabalhos relacionados, os facilitadores tecnológicos existentes e os fatores de impacto social. [5] Chen, H., Chiang, R. H., Storey, V. C. 2012. Business Intelligence and Analytics: From Big Data to Big Impact. MIS quarterly, 36(4), 1165-1188. [7] Moody, D. L. 2007. What makes a good diagram? Improving the cognitive effectiveness of diagrams in is development. Em: Advances in Information Systems Development, p. 481492, Springer US. (3) Com os resultados da análise anterior, um conjunto de princípios de design para reutilização de artefatos existentes de tecnologia da informação aplicada a BPM será definido. Artefatos adicionais serão criados para permitir a criação de uma plataforma integrada para análise de processo. [8] Aguilar-Saven, R. S. 2004. Business process modelling: Review and framework. International Journal of production economics 90.2. p. 129-149. (4) Avaliações serão realizadas para demonstrar a capacidade da plataforma em resolver o problema em questão. Serão realizados experimentos e estudos de caso com dados reais de um sistema de gerenciamento de serviços disponibilizados por uma empresa de suporte de tecnologia de informação, cujas atividades caracterizam um PIC. A avaliação qualitativa será baseada em entrevistas estruturadas e aplicação de questionários. A análise quantitativa consistirá na avaliação de métricas de qualidade aplicada aos modelos descobertos em diferentes cenários de modo a comparar os modelos e recomendar os de maior qualidade. Após cada avaliação um novo ciclo de ajustes na plataforma será realizado até que a hipótese seja confirmada ou definitivamente refutada. A hipótese será válida se as recomendações automáticas, baseadas em critérios de qualidade, forem similares ou superiores a julgamento humano prévio. Caso as recomendações realizadas apresentem qualidade inferior ao julgamento humano, a hipótese será refutada. [9] Rosemann, M., vom Brocke, J. 2015. The six core elements of business process management. Handbook on Business Process Management 1. Springer Heidelberg, p. 105-122. [10] Conforti, R., et al. 2013. Supporting risk-informed decisions during business process execution. Advanced Information Systems Engineering. Springer Heidelberg, p. 116-132. [11] Manhães Netto, J. 2013. KIPN: uma notação visual para modelagem de processos intensivos em conhecimento. Dissertação de Mestrado, UNIRIO. [12] Van der Aalst, W.M.P. 2011. Discovery, Conformance and Enhancement of Business Processes. Springer, Heidelberg. [13] Smirnov, S., Reijers, H.A., Weske, M. 2011. A Semantic Approach For Business Process Model Abstraction. Advanced Information Systems Engineering. Springer, p. 497-511. 4. ATIVIDADES JÁ REALIZADAS O projeto de pesquisa está em fase inicial e estão em andamento a análise de literatura e a realização da pesquisa conceitual. [14] Polyvyanyy, A., Smirnov, S., Weske, M. 2015. Business Process Model Abstraction. Em: Handbook on Business Process Management 1. Springer, p. 147-165. 5. CONSIDERAÇÕES FINAIS [15] Baier, T. Mendling, J. 2013. Bridging abstraction layers in process mining by automated matching of events and activities. Business Process Management, p. 17–32. O objetivo final da solução é prover uma plataforma que torne a análise de PIC mais simples e intuitiva para usuários não especialistas em BPM. Esta plataforma deverá ser orientada à conteúdo e ser capaz de identificar que tipo de informação pode ser recuperada com os dados disponíveis, interagir com os usuários e guiá-los através das melhores opções disponíveis, entre algoritmos, parâmetros e tipos de modelos, para ao final apresentar resultados que os auxiliem na tomada de decisões. [16] Eshuis, R., Grefen, P. 2008. Constructing Customized Process Views. Data & Knowledge Engineering, p. 419-438. [17] Richetti, P.H.P., Baião, F.A, Santoro, F.M. 2014. Declarative Process Mining: Reducing Discovered Models Complexity by Pre-Processing Event Logs. Business Process Management. Springer, p. 400-407. 6. FINANCIAMENTO Esta pesquisa é realizada no contexto do Projeto RISE-BPM (www.rise-bpm.eu). A 2ª autora conta com financiamento parcial do CNPq, sob o projeto 309069/2013-0. [18] Reijers, H. A., Mendling, J., Recker, J. 2015. Business process quality management. Em: Handbook on Business Process Management 1, Springer, p. 167-185. 7. REFERÊNCIAS [19] Ribeiro, J., Carmona, J., Mısır, M., Sebag, M. 2014. A recommender system for process discovery. Em: Business Process Management. Springer, p. 67-83. [1] Van der Aalst, W.M.P et al. 2012. Process mining manifesto. In: BPM workshops. Springer, p.169-194. [20] March, S.T., Smith, G.F. 1995. Design and natural science research on information technology. Decision Support Systems 15, 4, p. 251–266. [2] Becker, J. et al. 2015. Propelling Business Process Management by Research and Innovation Staff Exchange, http://www.rise-bpm.eu/. Último acesso em 03/2016. [21] Simon, H. 1969. The sciences of the artificial. Cambridge, 1, 3rd, p. 123. [3] Di Ciccio, C., Marrella, A., Russo, A. 2012. Knowledgeintensive overview of contemporary approaches. Knowledgeintensive Business Processes, p. 33. [22] Hevner, A.R., March, S.T., Park, J., Ram, S. 2004. Design Science in Information Systems Research. MIS Quarterly 28, 1, P. 75–10 45 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Project management best practices for cyber-physical system development Filipe Palma Marcelo Fantinato (Orientador) Escola de Artes, Ciências e Humanidades Rua Arlindo Béttio, 1000 Sao Paulo – SP, Brasil Escola de Artes, Ciências e Humanidades Rua Arlindo Béttio, 1000 Sao Paulo – SP, Brasil [email protected] [email protected] ABSTRACT Cyber-Physical Systems (CPS) represent the convergence of physical processes and computational platforms into technological solutions composed by sensors, actuators and software. Such as for other types of projects, Project Management (PM) practices can benefit a CPS development project. Due to some particularities of CPS, such as multidisciplinary team (the development of a CPS depends on the cooperation of many professionals of very different areas) and high innovation aspect (mixing different areas with computing requires most new technologies), generic PM practices may not be enough to enhance project success. Therefore, specific practices are proposed for better managing CPS projects, called CPS-PMBOK approach. CPS-PMBOK is based on the Project Management Institute’s PMBOK body of knowledge. It is focused on the scope, human resources and stakeholder management areas; which were chosen considering a systematic literature review conducted to identify the main CPS challenges. Categories and Subject Descriptors C.3 [Special Purpose and Application-Based Systems]: Real-time and embedded systems; K.6.1 [Management of Computing and Information Systems]: Project and People Management—Management Techniques General Terms Management Keywords Project management; Cyber-physical systems; PMBOK 1. INTRODUCTION Computing systems aiming to reproduce and understand the real world led to a new technological system field, called Cyber-Physical Systems (CPS) [12, 13]. Merging areas from Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, to republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2016, May 17th-20th, 2016, Florianópolis, Santa Catarina, Brazil Copyright SBC 2016. 46 embedded systems, mechanical engineering, software, among others [7], CPS gained remarkable advances in science, such as medical surgery, autonomous vehicles, energy harvesting and smart buildings [11]. CPS are composed of: sensors, which read environmental signs such as light, electrical current, humidity, etc.; computing platforms, which process the sensors’ information according to environment needs; and actuators, which send processed information to other sensors and stimulate the environment [6]. Many CPS present network elements, since several computing platforms may communicate reliably itself, often far apart. CPS projects tend to be large, complex and groundbreaking, with innovative algorithms and technologies [2, 12, 13]. An important CPS feature is multidisciplinarity since CPS merge computing and physic world concepts. A CPS project may be considered software engineering, civil engineering, experimental physics or natural sciences projects [2, 7]. Project Management practices aim to enhance the probability of success during a product or service development [8]. The Project Management Institute (PMI) gathers best practices in a body of knowledge – called PMBOK [10], which presents tools and techniques for a better management. PMBOK also presents concepts for the project organization through “process groups” and “knowledge areas”. Although PMBOK is a general purpose guide, specific areas may benefit from adapted or focused project management practices, better driving project activities and preventing common weaknesses [8]. Assaf and Al-Hejji [1] and Pandi-Perumal et al. [9] propose new techniques for stakeholder management, respectively, for construction projects and for clinical research environments. For globally distributed projects, Deshpande, Beecham and Richardson [3] and Golini and Landoni [4] address concerns on, respectively, stakeholders, scope and human resources, and communications. 2. PROBLEM STATEMENT CPS projects presents two main characteristics: multidisciplinary team working together and technically innovative. According to Baheti and Gill [2], for instance, heterogeneous teams may face communication difficulties, requiring abstracted models for software and hardware development. The innovative aspect offers some challenges due the uncertainty of new technologies used, such as computational platforms, programming languages and even novel natural effects that can be recently discovered. In order to evidence CPS-related project management challenges, a systematic literature review was conducted to search research IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 papers describing project management practices adopted in CPS projects. For this review, we considered the number of times that specific keywords related to each knowledge area have been used as an importance degree of each area, resulting in a relevance score. The review results indicated that three knowledge areas are major concerns for authors: scope (score: 608), human resources (score: 437) and stakeholder (score: 222). Therefore, we concluded that these three knowledge areas may represent the biggest part of the CPS challenges, although most authors described solutions only for their own issues. The results showed that many authors use agile methodologies, formalisms and project management practices not necessarily related to PMBOK. Moreover, most of the issues found were solved with specific solutions, mainly related to technology, localization and culture. Many challenges related to technical comprehension and communication were found, which resulted in abstracted models and techniques for indicator traceability. All issues found are aligned with the raised CPS features: innovation and multidisciplinarity. 3. PROPOSED SOLUTION Based on practices found in general literature, results from the systematic review, PMBOK experience, and professional skills, a set of best practices to manage CPS projects is being created – called CPS-PMBOK. This approach is split in two main views: characterization model, and knowledge areas adaptation. Both views may be used for project managers and aim to benefit the whole project team. 3.1 Characterization model The characterization model aims to enhance comprehension of the project, application field, necessary technologies and involved environment. The model is split in two characterizations: environment and complexity (see Figure 1). The environment characterization defines how much the CPS environment is surrounded by formalized processes; or how chaotic and unpredictable is the environment. Four situations are given to help this definition, considering that CPS environment requires: limited tasks; communication with known group of devices; interaction with known group of people; and following industrial standards or norms. The manager may choose among:“little”, “medium” and “much”. The more “much“ points, more well-defined the CPS environment is. The complexity characterization is an evaluation of the technologies usually found in CPS. It classifies the relevant integration of CPS with elements in eight areas: mechanical structures; network; sensors; actuators; data storage; user interaction; legacy systems integration; and power energy system. Supported by experts in each area, managers may define among “few”, “average” and “many” for each area. 3.2 Knowledge areas adaptations Focused on the three most addressed knowledge areas, according to the systematic review conducted, the CPSPMBOK adapts some practices found in PMBOK and adds new techniques, based on authors’ experience. Such adaptations are described in this subsection. The best practices described in PMBOK may be enough for managing the remaining knowledge areas, even in a CPS context. 3.2.1 Scope management The innovative aspect of CPS demands many revisions and redefinitions of scope [5]. Since this is an usual practice in CPS projects, an additional process is proposed for scope management, aiming to reduce the impacts of requirements constant changing. This new process is called “review requirements”. Following principles of agile methodologies, its purpose is to predict requirements changes. Moreover, in order to support requirements gathering, “pre-elaborated lists” should be applied [14]. The purpose of such lists is to create reusable assets through gathering common requirements found in CPS projects. It should aid to estimate project size and avoid missing requirements. 3.2.2 Human resources management Due to many different areas involved in a CPS project, different specialists, with rather different technical background may be part of the same team. As a consequence, two additional techniques are proposed in CPS-PMBOK for human resources management: “cross training” and “team split”. Cross training is a technique already briefly quoted in PMBOK, proposed to reduce impacts when a team member leaves the project. Specifically for CPS projects, a cross training should be always used to enable team members to act as a communication bridge for different sub-teams. The “team split” technique is included in CPS-PMBOK in order to improve the development performance and avoid inappropriate assignment of tasks. According to this technique, the project team should be split in sub-teams considering different application areas or project deliverables, such as: mechanical design team, information system development team, and power bank development team. 3.2.3 Stakeholder management CPS projects tend to involve academic researchers as well as specialists, who are technical stakeholders with comprehension of the application area and engineering. As a consequence, an additional technique is proposed in CPS-PMBOK for stakeholder management: “establish technical trust”. According to this technique, an internal specialist or an external consultant should be put in charge of following up the project manager activities. This action is necessary to allow stakeholders be more comfortable with the project progress. Based on the different levels of demand and satisfaction of stakeholders, “follow-up strategies” should be added in CPSPMBOK. For the project’s initiating stage, regular face-to- Figure 1: CPS projects’ characterization model 47 IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 face meetings should be adopted. For the subsequent stages (planning, executing, and monitoring and controlling), sporadic participations of stakeholders should included during planning and technical meetings. For the project’s closing stage, the stakeholders should be able to follow up the final results through workshops with live CPS demonstrations. 4. EVALUATION A research and development organization accepted to collaborate with the CPS-PMBOK evaluation, through the participation of three project managers. The planned evaluation is to have such project managers using CPS-PMBOK in real projects. However, whereas projects are in different development stages, the project managers may find limitations to apply some of the proposed practices. For example, a team split cannot be carried out for a project at final stages. For such projects, the evaluation of the proposed practices should be carried out in view of previous experiences. The managers should evaluate if the proposed practices are feasible and would bring benefits to a CPS project. They should be also encouraged to contribute with improvements based on their organization’s practices and their own professional opinions. A questionnaire should be applied at the end of the five-month evaluation time. So far, CPS-PMBOK was presented and explained to the project managers and two follow-up meetings took place. The follow-up meetings were requested by the managers, who believe to be more useful to present feedbacks rather than only answering a questionnaire at the evaluation end. 5. CONDUCTED ACTIVITIES This research project was presented in a qualifying exam on September 2015, with an examining board composed of the advisor and two other professors (one internal and one external to the graduate program). The remarks made by the board have been addressed during the last five months and research project is currently at the evaluation stage. In terms of the approach evaluation, an initial presentation of CPS-PMBOK was made, followed by two meetings to help project choice and additional explanation. The first project managers’ feedbacks were already received and registered, and an additional follow-up meeting is planned before the questionnaire application. Moreover, the research project was presented at the “2nd workshop of master dissertations in information systems” at the University of Sao Paulo on October 2015. Finally, the results of the systematic review conducted to define research priorities was submitted to the ACM Computing Surveys journal on January of 2016. The research project is expected to be finished on June 2016. 6. CONCLUSIONS The CPS field is in constant change raising a research challenge. Different terms are used to define very similar systems converged with the CPS context, such as: “system of systems”, “hybrid systems”, “embedded Systems” and “internet of things”. The occurrence of several similar terms brings difficulties to find similar and relevant works. On the another hand, project management has been focused on traditional software development, neglecting other application areas. Therefore, there is a demand for upgrading PMBOK’s best practices to current types of systems such as CPS. 48 The CPS-PMBOK approach has already been revealed useful for project managers, mainly for allowing them to: rethink their own concepts in terms of current projects; improve comprehension of team member capacities; and review the organization’s project management best practices. The feedbacks collected so far from the project managers show insights regarding the dependency on the: project’s life cycle adoption; development methodologies; project goals (e.g. new product, new service, new technology, proof of concept, preliminary study, etc.); and organizational policies. 7. REFERENCES [1] S. A. Assaf and S. Al-Hejji. Causes of delay in large construction projects. Int. J. of Proj. Manag., 24(4):349–357, 2006. [2] R. Baheti and H. Gill. Cyber–physical systems. The impact of control technology, 12:161–166, 2011. [3] S. Deshpande, S. Beecham, and I. Richardson. Using the pmbok guide to frame gsd coordination strategies. In IEEE 8th Int. Conf. on Global Soft. Engin. (ICGSE 2013), pages 188–196. IEEE, 2013. [4] R. Golini and P. Landoni. International development projects by non–governmental organizations: An evaluation of the need for specific project management and appraisal tools. Impact Assess. and Proj. Appr., 32(2):121–135, 2014. [5] P. M. Huang, A. G. Darrin, and A. Knuth. Agile hardware and software system engineering for innovation. In IEEE Aerosp. Conf., pages 1–10. IEEE, 2012. [6] E. A. Lee. Cyber physical systems: Design challenges. In 11th IEEE Int. Symp. on Object Oriented Real–Time Distributed Computing (ISORC 2008), pages 363–369. IEEE, 2008. [7] E. A. Lee and S. A. Seshia. Introduction to embedded systems: A cyber–physical systems approach. 2011. [8] A. Lester. Project management, planning and control: Managing engineering, construction and manufacturing projects to PMI, APM and BSI standards. Butterworth–Heinemann, 2006. [9] S. R. Pandi-Perumal, S. Akhter, F. Zizi, G. Jean-Louis, C. Ramasubramanian, R. E. Freeman, and M. Narasimhan. Project stakeholder management in the clinical research environment: How to do it right. Frontiers in psychiatry, 6, 2015. [10] Project Management Institute. Guide to the project management body of knowledge. PMI, 2013. [11] R. Rajkumar. A cyber–physical future. Proc. of the IEEE, 100:1309–1312, 2012. [12] R. R. Rajkumar, I. Lee, L. Sha, and J. Stankovic. Cyber–physical systems: The next computing revolution. In 47th Design Autom. Conf., pages 731–736. ACM, 2010. [13] L. Sha, S. Gopalakrishnan, X. Liu, and Q. Wang. Cyber–physical systems: A new frontier. In J. Tsai and P. Yu, editors, Machine Learning in Cyber Trust: Security, Privacy, and Reliability, pages 3–13. 2009. [14] C. M. B. d. Silva, D. S. Loubach, and A. M. d. Cunha. An estimation model to measure computer systems development based on hardware and software. In IEEE/AIAA 28th Digital Avionics Systems Conf. (DASC 2009), pages 6.C.2–1–6.C.2–12. IEEE, 2009. IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 A Recommendation System of Reuse Opportunities based on Lexical Analysis Johnatan Oliveira, Eduardo Figueiredo Software Engineering Laboratory (LabSoft), Department of Computer Science Federal University of Minas Gerais (UFMG) Belo Horizonte, Brazil {johnatan-si, figueiredo}@dcc.ufmg.br ABSTRACT Software reuse is a development strategy in which existing software components, called reusable assets, are used in the development of new software systems. Extraction methods may be used in different contexts including derivation of software product lines. However, few methods have been proposed in literature for reusable asset extraction and recommendation of these reuse opportunities. In this paper, we propose a method for extraction of reuse opportunities based on naming similarity of three types of object-oriented entities: classes, methods, and attributes. These entities compose a repository with reuse opportunities. The proposed method should be integrated into a recommendation system that aims to assist developers by: (i) recommending a general partial design for a specific domain and (ii) indicating reuse opportunities. At the moment, we have a prototype tool to support our method in extracting reuse opportunities. We evaluate the method and tool with 38 e-commerce information systems mined from GitHub. As a result, we observe that our method is able to identify classes and methods that are relevant in the e-commerce domain. 1. INTRODUCTION Software reuse is a development strategy in which existing software components, called reusable assets, are used in the development of new software systems [6]. It has been studied and pointed as an alternative to traditional development aiming to increase software quality and decrease development efforts by using previously developed, and sometimes already tested, software components [9, 11]. One of the many techniques to support software reuse is Software Product Line (SPL). An SPL is a set of software systems that share a common set of features, then new software may be developed using these commonalities [8]. Considering the continuous software development in companies, the increasing number of developed artifacts may prevent the identification of reusable assets to support a SPL derivation. Therefore, methods to provide recommen- Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, to republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2016, May 17th-20th, 2016, Florianópolis, Santa Catarina, Brazil Copyright SBC 2016. 49 dations of reusable assets are desirable to assist developers. In this context, a recommendation system could automatically identify reusable assets and suggest these artifacts for developers, helping to increase the capacity and effectiveness of the nominating process and manipulation of large volumes of data [12] In general, recommendation systems are based on content filtering given a data requested. In this study, we propose a recommendation system that aims to retrieve reuse opportunities. Therefore, a method for extraction of these reuse opportunities is required to provide inputs for the recommendation system. Some methods have been proposed to support the extraction of reuse opportunities from software systems [7, 12]. In literature, many different approaches are used for identification of reuse opportunities, such as natural language processing [10], formal specifications [1], machine learning [3], and other Information Retrieval (IR) approaches [6]. However, to the best of our knowledge, we did not find a method for extraction of reuse opportunities and recommendation of such opportunities considering most frequent elements, such as classes, methods, and attributes, from systems of the same domain. In this paper, we present the first stage for development of a recommendation system to support software reuse. This stage consists of developing a method for extraction of reuse opportunities, called JReuse. Given a set of software systems, JReuse aims to identify methods named with the same token in lexical similarly named classes from different systems. The main goal of JReuse is to identify classes, methods, and eventually attributes, that may be recommended as reuse opportunities. We also present a prototype tool that implements our method. We conduct an evaluation of our method through an experiment with 38 Java information systems in the e-commerce domain mined from GitHub. As a result, we observe that our method is able to identify reuse opportunities using naming similarity analysis. We also observe that JReuse provides meaningful classes and methods in the analyzed domain that may be indicated as reuse opportunities to developers of new e-commerce systems. The remainder of this paper is organized as follows. Section 2 presents the proposed approach. Section 3 presents a preliminary evaluation. Section 4 discusses related work. Finally, Section 5 concludes this paper. IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 2. THE PROPOSED APPROACH We proposed a research methodology divided in seven study steps as presented in Figure 1. The steps colored in green have been completed. The yellow step is ongoing. The red step describes how we intend to evaluate the recommendation system that we aim to develop. We designed all steps to provide us background about the research topic, related work, recommendation systems, and other concepts that are relevant to our research. We discuss each study step as follows. effectiveness of the proposed method for reuse opportunities extraction using a data set composed of 38 information systems from the e-commerce domain. We mined these systems from GitHub. Section 3 describes the results of our preliminary evaluation. Step 6: A recommendation system is under development to implement the approach previously described. We designed this system to identify reuse opportunities using the method proposed in Step 4, to provide a partial design of information systems, and to recommend source code for developers. Figure 2 illustrates the proposed recommendation system. The recommendation system receives different systems as input. Then, the extraction method applies a similarity function to compute similarity between entities. We defined a threshold according to empirical studies: similarity must be equal or greater than 80% for all entities. In Figure 2, the part in dashed line is a task that we have to do. Figure 1: Study Steps Step 1: In this step, we conducted a Systematic Literature Review [4] to know about the topic of research, strategies for reusable assets identification, and available tools to provide the appropriate structure for reuse of software artifacts. This step provided us related work and a comparison of researches that explores reuse opportunities in software systems. Step 2: We performed a comparison of code clone detection tools to assess whether these tools are able to identify similar source code in different software systems. We also evaluated plagiarism detection tools from systems of the same domain. In this step, we observed some desirable points in methods for extraction of reusable assets. Once none of the tools we found fitted to our purpose [2], we considered the desirable points to propose a method for extraction and recommendation of reuse opportunities. Step 3: In this step, we defined a strategy for the recommendation system we aim to develop. We investigated the required input, source code processing, target programming language, and the reuse opportunities repository to support the development of a recommendation system for software reuse. Step 4: After Step 3, we were able to understand the main requirements of a method for reusable assets extraction. We used the e-commerce information system domain as reference to a preliminary study on the frequency of similarly named entities in source code: classes, methods, and attributes. The extraction method that we propose in this Step 4 receives as input a set of information systems. Then, the method processes names of classes to identify similarly named classes in different system. Considering classes with similar names, our strategy identities similarly named methods and attributes. The results of this analysis are persisted in database. Step 5: We conducted an experiment in order to assess the 50 Figure 2: Recommendation System Step 7: After the development of our recommendation system in Step 6, we are able to conduct experiments to evaluate the quality of the recommendations. We systematically designed and conducted Steps 1 to 7 to achieve success in our research. Through this study, we are developing solutions to the problems identified in both literature and industry. The forecast for getting the Master’s in Computer Science is December 2016, and we planned our study activities according to this schedule. 3. PRELIMINARY EVALUATION In this study, we evaluate our method for extraction of reuse opportunities from systems of the same domain. The identification of attributes is under development. Therefore, let us consider, for this preliminary evaluation, only the identification of classes and methods through lexical similarity analysis. We are interested in whether JReuse is able to identify recurrent classes and methods in a specific software domain. We are also interested in assessing the relevance of results provided by our method. For this purpose, we chose the e-commerce domain for evaluation. We analyzed the frequency of similarly named classes in the 38 e-commerce information systems from our data set. Initially, JReuse identified 38 classes as reuse opportunities. To summarize data, we adopted the following exclusion criteria for classes to be considered in this evaluation: the class should occur in at least three different systems. Since our IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 method compares classes in pairs, two occurrences may not be significant to a reuse recommendation. We discarded 22 classes based on this minimum threshold. We concluded that the top-five most frequent classes for ecommerce domain, with more than five occurrences, are User, Product, Order, Category, and Customer. In fact, according to the viewpoint of four independent software engineers – these classes are meaningful and relevant to the e-commerce domain. For instance, classes such as Product, Order, Category, and Customer are elementary entities to be expected in an e-commerce system. In turn, User is the most frequent class identified in this preliminary study by the tool and, although it is not specific of e-commerce domain, Costumer is an expected class in information systems in general. Therefore, we conclude that our method is able to identify relevant classes for software reuse in 60% of the evaluated e-commerce systems (23 of the 38 systems collected from GitHub). The other less frequent classes (e.g., Item, Payment, and Cart) are also relevant to the e-commerce domain. Regarding frequent methods through systems, we filtered methods by the following inclusion criteria: it should appear in at least two classes from different systems. From 56 similarly named methods extracted, we discarded 34 according to the defined criteria, remaining 22 methods. Consider a pair (C, M) in which C is a class name, and M is a method name. For instance, the pairs (Product, getPrice) and (Product, getPrice) are the most frequent among the systems of our data set. Considering the domain under analysis, it is meaningful, since the product abstraction requires a monetary value for the product. Moreover, the method getPassword occurs 8 times in User and 5 times in Costumer classes. This scenario is comprehensible considering that these classes intuitively represent entities that have access to the e-commerce system for purchase and payment, for instance. Therefore, in the viewpoint of the authors, the identified methods are relevant and consistent for the domain under analysis. 4. RELATED WORK Many approaches have been proposed in literature to support the extraction of reusable assets. For instance, Kawaguchi et al. [5] propose an algorithm to categorize software projects automatically. This method aims to identify similar software systems using duplicated code detection. Oliveira et al. [11] propose a tool for recommendation of reusable assets. Their tool applies a technique to support software reuse and extraction of reusable assets called Automatic Identification of Software Components. In turn, our reusable asset extraction method and supporting tool aim to identify candidates for reuse from software systems from a specific domain, using lexical analysis. Our method also ranks software components identified as reusable assets by frequency in which components appear in different systems from the same domain. We expect that this approach is helpful in reuse recommendation by suggesting classes, methods, and attributes that are the most recurrent in information systems given a specific domain. 5. CONCLUSION In this paper, we present the proposed Master’s study and the steps needed to achieve success. As a preliminary 51 study, we present in detail the method to extract reusable assets from software systems. We also present a prototype tool that implements the proposed method. Finally, we present the preliminary idea of a recommendation tool to suggest software reusable assets in a class diagram-based vision. Through our study, we were able to identify the main issues of software reuse and the reusable assets extraction process. We evaluate our extraction prototype tool through an experiment with 38 information systems from e-commerce domain extracted from GitHub. Our findings point that the proposed method is able to suggest methods and classes that appear in different systems from the selected data set. We also observe that the most frequent methods and classes pointed by the tool as candidates to software reuse are relevant to most of the information systems from the e-commerce domain. 6. ACKNOWLEDGMENTS This work was partially supported by CAPES, CNPq, and FAPEMIG. 7. REFERENCES [1] G. Caldiera and V. Basili. Identifying and qualifying reusable soft. components. Computer, 24(2):61–70, 1991. [2] J. A. de Oliveira, E. M. Fernandes, and E. Figueiredo. Evaluation of duplicated code detection tools in cross-project context, 2015. [3] S. Kawaguchi, P. Garg, M. Matsushita, and K. Inoue. Mudablue: an automatic categorization system for open source repositories, 2004. [4] S. Keele. Guidelines for performing systematic literature reviews in software engineering. In Technical report, Ver. 2.3 EBSE Technical Report. EBSE. 2007. [5] C. Krueger. Soft. reuse. Computing Surveys (CSUR), 24(2):131–183, 1992. [6] A. Kuhn, S. Ducasse, and T. Gı́rba. Semantic clustering: Identifying topics in source code. Info. and Soft. Tech., 49(3):230–243, 2007. [7] J. Lee, K. Kang, and S. Kim. A feature-based approach to product line production planning. In Soft. Product Lines, pages 183–196. Springer, 2004. [8] Y. Maarek, D. Berry, and G. Kaiser. An info. retrieval approach for automatically constructing soft. libraries. Transactions on Soft. ENG. (TSE), 17(8):800–813, 1991. [9] P. Mohagheghi and R. Conradi. Quality, productivity and economic benefits of soft. reuse: a review of industrial studies. Empirical Soft. ENG. (ESE), 12(5):471–516, 2007. [10] P. Mohagheghi, R. Conradi, O. Killi, and H. Schwarz. An empirical study of soft. reuse vs. defect-density and stability, 2004. [11] M. Oliveira, E. Goncalves, and K. Bacili. Automatic identification of reusable soft. development assets: Methodology and tool, 2007. [12] O. Zoeter. Recommendations in travel, 2015. IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016 Índice Remissivo A Araujo, Renata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17, 21 B Baião, Fernanda A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30, 42 H Heineck, Tiago . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 L Lima, Clodoaldo A.M. . . . . . . . . . . . . . . . . . . . . . . . . . 27, 33, 36 M Maciel, Rita S.P. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Moura, Hermano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 C Carmo, Adson do . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Castro, Jaelson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 O Classe, Tadeu M. de . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Oliveira Jr, Edson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Cordeiro, André F.R.C. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Oliveira, Edenilton L. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 Costa, Leila de C. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Oliveira, Johnatan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 D P Duran, Adolfo A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Paiva, Eduardo de . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Palma, Filipe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 F Peres, Sarajane M. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27, 33, 36 Fantinato, Marcelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39, 46 Feitosa, Ricardo A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 R Figueiredo, Eduardo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Revoredo, Kate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14, 30 Richetti, Pedro H.P. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 G Rocha, Jallysson M. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 Garcia, Plínio A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Garcia, Vinicius C. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 S Gonçalves, Enyo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Santos, Wylliams . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Silva, Jomar da . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Silva, Jonas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 52