Anais do IX Workshop de Teses e Dissertações em

Transcrição

Anais do IX Workshop de Teses e Dissertações em
XII Simpósio Brasileiro de Sistemas de Informação
Anais do IX Workshop de Teses e
Dissertações em Sistemas de Informação
Castelmar Hotel – Florianópolis/SC – 17 a 20 de maio de 2016
Promoção
Organização
Patrocínio
Apoio
IX Workshop de Teses e Dissertações em
Sistemas de Informação (WTDSI)
Evento integrante do XII Simpósio Brasileiro de
Sistemas de Informação
De 17 a 20 de maio de 2016
Florianópolis – SC
ANAIS
Sociedade Brasileira de Computação – SBC
Organizadores
Carina Friedrich Dorneles
Marco Antônio Pereira Araújo
Frank Augusto Siqueira
Patrícia Vilain
Realização
INE/UFSC – Departamento de Informática e Estatística/
Universidade Federal de Santa Catarina
Promoção
Sociedade Brasileira de Computação – SBC
Patrocínio Institucional
CAPES – Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico
FAPESC - Fundação de Amparo à Pesquisa e Inovação do Estado de Santa Catarina
Catalogação na fonte pela Biblioteca Universitária
da
Universidade Federal de Santa Catarina
W926a Workshop de Teses e Dissertações em Sistemas de Informação
(9. : 2016 : Florianópolis, SC)
Anais [do] IX Workshop de Teses e Dissertações em Sistemas de
Informação [recurso eletrônico] / Organizadores Carina Friedrich Dorneles
...[et al.] ; realização Departamento de Informática e Estatística/UFSC ;
promoção: Sociedade Brasileira de Computação. – Florianópolis :
UFSC/Departamento de Informática e Estatística, 2016.
1 e-book
Evento integrante do XII Simpósio Brasileiro de Sistemas de Informação
Disponível em: http://sbsi2016.ufsc.br/anais/
Evento realizado em Florianópolis de 17 a 20 de maio de 2016.
ISBN 978-85-7669-320-8
1. Sistemas de recuperação da informação – Congressos. 2. Tecnologia
– Serviços de informação – Congressos. 3. Internet na administração pública
– Congressos. I. Dorneles, Carina Friedrich. II. Universidade Federal de
Santa Catarina. Departamento de Informática e Estatística. III. Sociedade
Brasileira de Computação. IV. Título.
CDU: 004.65
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
III WTDSI
IX Workshop de Teses e Dissertações em Sistemas de Informação (WTDSI)
Evento integrante do XII Simpósio Brasileiro de Sistemas de Informação (SBSI)
17 a 20 de Maio de 2016
Florianópolis, Santa Catarina, Brazil.
Comitês
Coordenação Geral do SBSI 2016
Frank Augusto Siqueira (UFSC)
Patrícia Vilain (UFSC)
Coordenação do Comitê de Programa do WTDSI 2016
Carina Friedrich Dorneles (UFSC)
Marco Antônio Pereira Araújo (UFJF)
Comissão Especial de Sistemas de Informação
Clodis Boscarioli (UNIOESTE)
Sean Siqueira (UNIRIO)
Bruno Bogaz Zarpelão (UEL)
Fernanda Baião (UNIRIO)
Renata Araujo (UNIRIO)
Sérgio T. de Carvalho (UFG)
Valdemar Graciano Neto (UFG)
Comitê de Programa Científico do WTDSI 2016
Alcione Oliveira (UFV)
André da Silva (IFSP - Hortolândia)
Andrea Magdaleno (UNIRIO)
Bruno Gadelha (UFAM)
Carina F. Dorneles (UFSC)
Carlos Vitor de Alencar Carvalho (UEZO)
Celia Ralha (UnB)
Claudia Cappelli (UNIRIO)
Clodis Boscarioli (Unioeste)
Cristiano Cervi (UPF)
Cristiano Maciel (UFMT)
Daniel Kaster (UEL)
Daniela Barreiro Claro (UFBA)
Deise Saccol (UFSM)
Eduardo Borges (FURG)
Fernanda Campos (UFJF)
Glauco Carneiro (UNIFACS)
Gustavo Semaan (UFF)
Heitor Costa (UFLA)
Janaina Veiga (CEFET-RJ)
José Maria David (UFJF)
Marcelo Santos (IF Sudeste MG)
Marcelo Schots (UERJ)
Marco Antônio Araújo (UFJF/IF Sudeste MG)
Regina Braga (UFJF)
Renata Araújo (UNIRIO)
Renata Galante (UFRGS)
Rita Suzana Pitangueira Maciel (UFBA)
Sandro Fernandes (IF Sudeste MG)
Valéria C. Times (UFPE)
Vaninha Vieira (UFBA)
Victor Stroele (UFJF)
Wander Gaspar (IF Sudeste MG)
Revisor
Rodrigo Gonçalves (UFSC)
iv
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Realização
INE/UFSC – Departamento de Informática e Estatística/ Universidade Federal de Santa Catarina
Promoção
SBC – Sociedade Brasileira de Computação
Patrocínio
CAPES – Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico
FAPESC - Fundação de Amparo à Pesquisa e Inovação do Estado de Santa Catarina
FAPEU - Fundação de Amparo à Pesquisa e Extensão Universitária
Apoio
Centro Tecnológico - UFSC
Pixel Empresa júnior - UFSC
v
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Apresentação
O Workshop de Teses e Dissertações em Sistemas de Informação (WTDSI), realizado tradicionalmente em conjunto com XII
Simpósio Brasileiro de Sistemas de Informação (SBSI), é um fórum dedicado à apresentação e discussão de trabalhos de
mestrado e de doutorado em Sistemas de Informação (SI) desenvolvidos nos programas de pós-graduação no Brasil. O seu
objetivo é propiciar um ambiente profícuo para discussões, em que os alunos possam receber avaliações construtivas de seus
trabalhos por pesquisadores experientes em SI e ter acesso a um panorama representativo da pesquisa em SI no país.
Os principais objetivos deste fórum são: (i) contribuir para o enriquecimento, maturidade e lapidação dos trabalhos de estudantes de Pós-Graduação em SI; (ii) estimular a integração e cooperação de pesquisadores da área; (iii) dar maior visibilidade
às pesquisas em andamento, tanto para a comunidade acadêmica quanto para institutos de pesquisa que vêm se estabelecendo
no país; e (iv) estimular a identificação de oportunidades de aplicação das propostas apresentadas nas organizações.
Em sua nona edição, o WTDSI teve um total de 42 submissões, sendo 16 delas aceitas para apresentação, resultando numa
taxa de aceitação de 38%. Dentre as 16 submissões aceitas, foram selecionadas para apresentação 13 propostas de dissertação
de mestrado. Cada submissão foi avaliada por, no mínimo, três revisores. Os trabalhos selecionados apresentam um panorama
da pesquisa nos programas de pós-graduação em SI no Brasil, envolvendo temas e problemáticas atuais e relevantes, que foram
divididas nas seguintes seções de apresentação: Paradigmas de Desenvolvimento de Sistemas de Informação, Sistemas de
Informação para Governo, Sistemas de Informação Inteligentes, Gestão de Processos e Gerenciamento de Projetos. Dos 42
artigos submetidos, 50% são oriundos de Universidades do Sudeste do país, 35,7% são de Universidades do Nordeste do país e
14,3% do Sul do Brasil. Dentre os 16 artigos aceitos, 62,5% são do Sudeste, 31,25% do Nordeste e 6,2% do Sul do país.
A coordenação agradece aos autores dos trabalhos e seus orientadores, por prestigiarem o WTDSI 2016; aos membros do
comitê de programa, pelo tempo dedicado e pelas valiosas contribuições sugeridas aos autores; e à organização geral do SBSI,
por todo o suporte oferecido. Que o WTDSI 2016 seja uma ótima oportunidade de colaboração, com excelentes ideias para
discussões. Aproveitem!
Florianópolis, Maio de 2016.
Carina Friedrich Dorneles (UFSC) e Marco Antônio Pereira Araújo (UFJF)
Coordenação do WTDSI 2016
vi
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Biografia dos Coordenadores do Comitê de Programa do WTDSI 2016
Carina Friedrich Dorneles é professora do Departamento de Informática e Estatística da Universidade Federal de Santa Catarina (INE/UFSC) onde atua como pesquisadora, professora e
orientadora nos níveis de IC, graduação, mestrado e doutorado. Atualmente, atua como Coordenadora do Programa de Pós-Graduação em Computação da UFSC, Coordenadora do Concurso
de Iniciação Científica da SBC e Coordenadora do Workshop de Teses e Dissertações de Sistemas de Informação do SBSI/SBC. Atuou no Comitê Especial de Avaliação da FAPERGS em
2016. Concluiu seu doutorado em Ciência da Computação e, 2006, e mestrado em 2000, pela
Universidade Federal do Rio Grande do Sul (UFRGS). Durante o período de doutorado, realizou estágio sanduíche na University of Washington, Seattle, EUA. Seus interesses de pesquisa
envolvem Gerenciamento de Dados, Recuperação de Informação e Mineração de Dados com
ênfase na Web. Coordena e participa de projetos de pesquisa na área, com publicações científicas em periódicos e anais de conferência de boa qualidade. Participa também como membro de
comitês técnicos de programa conferências e workshops realizados no Brasil e no exterior. Atuou
como membro do Comitê de Educação da Sociedade Brasileira de Computação entre 2013-2015
e como Coordenadora de Fomento e Apoio à Pesquisa na Pró-Reitoria de Pesquisa da UFSC no
período de 2012-2013. Em 2005, foi co-idealizadora da Escola Regional de Banco de Dados, e
da Sessão de Demos do Simpósio de Banco de Dados. Atua como Editora da Coluna Bits, Bytes
e Batom da revista eletrônica SBC Horizontes.
Marco Antônio Pereira Araújo é Doutor (2009) e Mestre (1998) em Engenharia de Sistemas e
Computação pela COPPE/UFRJ. Especialista em Métodos Estatísticos Computacionais (2006) e
Bacharel em Matemática com Habilitação em Informática (1993) pela UFJF. Professor Adjunto
da Universidade Federal de Juiz de Fora. Professor do Instituto Federal de Educação, Ciência e
Tecnologia do Sudeste de Minas Gerais - Campus Juiz de Fora. Professor do curso de Bacharelado em Sistemas de Informação do CES/JF, da FMG e da USS. Professor do curso de Bacharelado em Ciência da Computação da FAGOC. Editor da Engenharia de Software Magazine e da
Infra Magazine. Avaliador de cursos de graduação em Computação do INEP/MEC.
vii
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Artigos Técnicos
ST1 - Paradigmas de Desenvolvimento de SI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Uma abordagem para identificar erros estruturais em SOS modelados em BPMN utilizando π-ADL . . . . . . . . . . . . . . . . 1
Leila de Carvalho Costa (UFBA), Rita Suzana Pitangueira Maciel (UFBA), Adolfo Almeida Duran
Towards an Approach to Foster Simplicity in Agile Software Development Projects . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Wylliams Santos (UFPE), Hermano Moura (UFPE)
SMartyMetrics: um Framework de Métricas de Apoio à Avaliação de Arquiteturas de Linha de Produto de
Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
André Felipe Ribeiro Cordeiro (UEM), Edson Oliveira Jr (UEM)
Técnicas de Desenvolvimento Orientado a Modelos no Domínio de Robótica e Robôs Sociais . . . . . . . . . . . . . . . . . . . . . . . 11
Tiago Heineck (UFPE), Jaelson Castro (UFPE), Enyo Gonçalves (UFPE)
ST2 - SI para Governo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Identificação Automática de Produtos e suas Características em Grandes Volumes de Dados Não Estruturados:
Uma Proposta para Portais de Transparência Pública . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Eduardo de Paiva (UNIRIO), Kate Revoredo (UNIRIO)
Jogos Digitais Para Participação Cidadã em Processos de Prestação de Serviços Públicos . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Tadeu M. de Classe (UNIRIO), Renata Araujo (UNIRIO)
Um Método de Elicitação de Requisitos para Ambientes Virtuais de Participação Social . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Jonas Silva (UNIRIO), Renata Araujo (UNIRIO)
Aplicando Grounded Theory para compreender as dificuldades de Planejamento de TI em Órgãos Federais . . . . . . . . 24
Plínio Antunes Garcia (UFPE), Vinicius Cardoso Garcia (UFPE)
ST3 - SI Inteligentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Estudo da Representação de Dados para Segmentação das Fases do Gesto usando Aprendizado de Máquina . . . . . . . . 27
Ricardo A. Feitosa (USP), Sarajane M. Peres (USP), Clodoaldo A.M. Lima (USP)
Alinhamento Interativo de Ontologias usando Anti-Padrões de Alinhamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Jomar da Silva (UNIRIO), Fernanda Araujo Baião (UNIRIO), Kate Revoredo (UNIRIO)
Análise das fases do gesto: a influência do contexto na execução das fases e na indução de modelos de
aprendizado de máquina supervisionado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Jallysson M. Rocha (USP), Sarajane M. Peres (USP), Clodoaldo A.M. Lima (USP)
Fusão de Face e Forma de Andar para Reconhecimento Biométrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Edenilton L. Oliveira (USP), Clodoaldo A.M. Lima (USP), Sarajane M. Peres (USP)
viii
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
ST4 - Gestão de Processos e Gerenciamento de projetos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Metas Estratégicas Organizacionais como base para Modelagem de Requisitos não Funcionais de
Processos de Negócio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Adson do Carmo (USP), Marcelo Fantinato (USP)
Uma Plataforma para Análise e Recomendação de Modelos de Processos Intensivos em Conhecimento . . . . . . . . . . . . . 42
Pedro Henrique Piccoli Richetti (UNIRIO), Fernanda Araujo Baião (UNIRIO)
Project management best practices for cyber-physical system development . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
Filipe Palma (USP), Marcelo Fantinato (USP)
A Recommendation System of Reuse Opportunities based on Lexical Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Johnatan Oliveira (UFMG), Eduardo Figueiredo (UFMG)
Index of Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
ix
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Uma abordagem para identificar erros estruturais em SOS
modelados em BPMN utilizando Pi-ADL
Alternative Title: An approach for detecting structural errors in SOS modeled as
BPMN using Pi-ADL
Leila de Carvalho Costa
Universidade Federal da Bahia
Salvador, Bahia
[email protected]
Rita Suzana Pitangueira
Maciel
Universidade Federal da Bahia
Salvador, Bahia
Adolfo Almeida Duran
Universidade Federal da Bahia
Salvador, Bahia
[email protected]
[email protected]
RESUMO
Categories and Subject Descriptors
Sistema de Sistemas (SOS) é um conjunto de sistemas independentes e interdependentes funcionando em conjunto para
alcançar um objetivo comum. A Business Process Modeling
Notation (BPMN) é um padrão para modelar fluxos de processos de negócio. A BPMN em SOS coordena e sincroniza
processos de negócios que pertencem a este conjunto. Nos
modelos escritos nessa notação podem ocorrer erros estruturais, como deadlocks e livelocks, que no decorrer da execução ocasionam o funcionamento inadequado dos processos de
um SOS. A ausência de uma semântica formal desses modelos torna mais difı́cil a identificação desses erros. Neste
trabalho, propomos uma abordagem baseada na Linguagem
formal π-ADL para detectar erros estruturais em porcessos
de um SOS modelados em BPMN.
C.4 [Performance of Systems]: Modeling techniques
; D.2.11 [Software Engineering]: Software Architectures—Languages (e.g., description, interconnection, definition); F.4.3 [Mathematical Logic and Formal Languages]: Formal Languages—Algebraic language theory
General Terms
Software Engineering
Keywords
SOS, System of Systems, BPMN, Business Process Modeling, π-ADL, deadlocks, livelocks.
1.
Palavras-Chave
INTRODUÇÃO
Um sistema de sistemas (SOS) [5, 3] pode ser considerado
como uma composição de outros sistemas complexos e independentes, que interagem entre si para atingir um objetivo
comum. Estes sistemas são selecionados e compostos possivelmente em tempo de execução para formar um sistema
mais complexo [1]. Buscando facilitar sua utilização e entendimento, existem várias formas e notações para se modelar
processos de um SOS, dentre elas está a Business Process
Modeling Notation (BPMN) [10]. A BPMN em SOS é utilizada para coordenar e sincronizar processos de negócios
automatizados e ajudam a descrever os sistemas, produtos,
layout de serviços interno e a sua posição em relação um ao
outro [4].
Business Process Modeling Notation (BPMN) surgiu como
uma notação padrão para expressar os modelos de processos
de negócios, mas a falta de uma semântica formal corrobora
para a perpetuação de erros de sintaxe e estruturais [2] que
fazem o modelo de processo de negócios parar de funcionar corretamente. Enquanto erros de sintaxe exigem menos
esforços para serem verificados, os erros estruturais normalmente precisam de uma análise complexa para encontrá-los.
A fim de verificar a estabilidade dos Sistemas de Sistemas modelados utilizando BPMN, temos que verificar todas as combinações possı́veis de cadeias de processo, o que
nos permite revelar erros de projeto que podem deteriorar
a operação. Para isso testaremos um modelo formal, baseado na linguagem formal π-ADL, que foi especialmente
concebida para especificar arquiteturas dinâmicas. Neste
SOS, Sistema de Sistemas, BPMN, Modelagem de Processos
de Negócio, π-ADL, deadlocks, livelocks.
ABSTRACT
System of Systems (SOS) is a set of independents and interdependents systems working together to achieve a common
goal. The Business Process Modeling Notation (BPMN) is
a standard to model business process flow. The BPMN in
SOS coordinates and synchronizes business processes that
belongs to this set. In models written in the notation may
occur structural errors such as deadlock and livelock, which
causes the improper working of the processes of SOS during
the execution. The absence of formal semantics of these models makes the identification of these errors more difficult.
In this paper, we propose an approach based in the π-ADL
formal language for detecting structural errors in SOS modeled as BPMN.
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise, to
republish, to post on servers or to redistribute to lists, requires prior specific
permission and/or a fee.
SBSI 2016, May 17th-20th, 2016, Florianópolis, Santa Catarina, Brazil
Copyright SBC 2016.
1
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
trabalho, propomos uma semântica formal para verificar o
modelo BPMN em tempo de design e auxiliar a identificação
e a correção de livelocks e deadlocks que possam ocorrer em
tempo de execução.
O restante deste artigo está organizado da seguinte forma.
Seção 2 apresentamos o problema e na Seção 3 a solução proposta para resolver o problema em questão. Seção 4 descreve
o projeto para de avaliação da solução. Na seção 5, relatamos as atividades já realizadas. Para concluir, resumimos,
na seção 6, as principais contribuições deste artigo.
2.
Essas interações são feitas através de trocas de mensagens
entre os processos do sistema. Apesar das diferenças citadas,
o diagrama de coreografia possui as mesmas deficiências do
diagrama de orquestração, como a possibilidade de ocultar
erros estruturais, que podem ocorrer em tempo de execução,
ocasionando o funcionamento inadequado do sistema.
Nossa abordagem permitirá a modelagem visual dos processos de negócios utilizando o diagrama proposto em BPMN
2.0, e sua análise usando π-ADL. Como BPMN carece de
uma semântica formal, é necessário realizar um mapeamento
da arquitetura de subconjuntos modelados em BPMN para
os termos de π-ADL. Permitindo assim, especificar o comportamento do sistema e fazer uso das ferramentas de validação da especificação formal e de verificação para revelar os
possı́veis deadlocks e livelocks do projeto, bem como verificar outras propriedades como performance e escalabilidade.
APRESENTAÇÃO DO PROBLEMA
Embora a BPMN seja muito utilizada como ferramenta
de modelagem de processos de negócios, os modelos criados
usando essa notação não estão livres de erros, que podem
ser erros de sintaxe ou erros estruturais. Os erros de sintaxe
são encontrados durante o tempo de design utilizando ferramentas de modelagem, por outro lado, os erros estruturais
são os que acontecem durante o tempo de execução dos processos, sendo eles os deadlocks e livelocks. Um deadlock, por
exemplo, ocorre quando um processo requer processos anteriores para ser concluı́do, mas um deles nunca é realizado.
Esses erros quando ocorrem ocasionam o funcionamento inadequado do sistema.
Os erros estruturais são difı́ceis de serem detectados e em
SOS a questão se potencializa, pois, neste cenário um processo pode ser composto por um ou vários processos distintos oriundos de diversos sistemas, tornando-se grande e
complexo demais, o que inviabiliza a detecção de erros sem
um apoio automatizado.
3.
4.
PROJETO DE AVALIAÇÃO DA SOLUÇÃO
A validação da abordagem proposta será realizada de acordo
as seguintes as etapas:
• Definição dos subconjuntos do BPMN a serem formalizados: Elaboração dos cenários modelados em diagramas de coreografia que apresentem deadlocks e livelocks conhecidos no contexto de SOS, para serem
utilizado na experimentação.
• Definição das regras de Mapeamento dos elementos
BPMN para π-ADL: Consiste na descrição de cada
um dos elementos de modelagem do diagrama de coreografia em termos de π-ADL e com base nesse mapeamento, descreve a arquitetura de cada cenário prédefinido.
PROPOSTA DE SOLUÇÃO
• Utilização de um conjunto de ferramentas de apoio a
π-ADL: para validação sintática e semântica da descrição da arquitetura, mostrando erros e permitindo
assim a detecção e correção dos erros e problemas potenciais. Após validação, realizar a verificação de todos
os cenários para analisar se os erros presentes em cada
um deles foram detectados.
Este trabalho propõe investigar uma abordagem para identificar erros que ocorrem em tempo de execução, como os
deadlocks e livelocks, em Sistema de Sistemas modelados
utilizando a notação BPMN, a fim de garantir a ausência
desses erros. Nossa análise consiste na construção de um
modelo formal da arquitetura, e em seguida, na verificação
desse modelo em um verificador especı́fico para a linguagem
π-ADL (π-Architecture Description Language) [9, 6].
Para formalizar os modelos escolhemos utilizar π-ADL,
pois é uma linguagem formal projetada para a especificação
de arquiteturas dinâmicas. Além disso, possui um conjunto
de ferramentas de especificação e verificação que fornece suporte para a verificação automatizada [6]. Devido ao fato de
que os erros estruturais são formados em tempo de execução
e os SOS serem grandes e complexos demais, faz-se necessário uma linguagem para descrição de arquiteturas dinâmicas,
e que tenha o suporte de ferramentas de verificação automática.
Como em [7] e [8] são descritas abordagens que mostram
como diagramas de orquestração (diagrama padrão) BPMN
podem ser descritos em uma linguagem formal, o nosso trabalho foca na utilização no diagrama de coreografia, que é
um diagrama proposto na versão BPMN 2.0 [11], que representam mais fielmente a dinâmica da interação dos componentes de um SOS.
O diagrama de coreografia difere em propósito e comportamento da representação de um diagrama de orquestração.
Enquanto o diagrama de orquestração define o fluxo das atividades do processo, o diagrama de coreografia tem seu foco
principal em como processos interagem uns com os outros.
5.
ATIVIDADES REALIZADAS
Já realizamos a revisão da literatura com objetivo de identificar os conceitos relevantes na área de BPMN e as técnicas
de detecção de erros estruturais que serão usadas. Com base
na revisão literária e pelo aspecto dinâmico dos SOS, escolhemos π-ADL por ser uma linguagem formal especialmente
concebida para modelar arquiteturas dinâmicas.
Estamos elaborando os cenários modelados em diagrama
de coreografia contendo deadlocks e livelocks, para serem
utilizados na validação e verificação. E alguns dos elementos
de modelagem já foram mapeados tendo como base a sintaxe
de π-ADL.
Além disso, está sendo realizado o estudo da ferramenta
de apoio a π-ADL, desenvolvida e disponibilizada pelo ArchWare Team, para validação da sintaxe dos cenários, bem
como a verificação da especificação da arquitetura dos mesmos.
6.
CONCLUSÃO
Esse trabalho sugere uma abordagem para resolver uma
questão complexa que é detectar possı́veis deadlocks e livelocks que podem ocorrer durante a execução de um SOS
2
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
modelado utilizando a notação BPMN. O método proposto
pretende expressar o modelo BPMN através da linguagem
formal π-ADL e em seguida, verificar os erros de projeto que
podem prejudicar o sistema. Como resultado, pretendemos
estabelecer uma abordagem formal que permita detecção de
erros estruturais nos diagramas de coreografia do processo
BPMN, facilitando sua correção.
7. REFERÊNCIAS
[1] N. Karcanias and A. G. Hessami. System of systems
and emergence part 1: Principles and framework. In
Emerging Trends in Engineering and Technology
(ICETET), 2011 4th International Conference on,
pages 27–32. IEEE, November 2011.
[2] O. M. Kherbouche, A. Ahmad, and H. Basson.
Detecting structural errors in bpmn process models. In
Multitopic Conference (INMIC), 2012 15th
International, pages 425–431. IEEE, December 2012.
[3] A. J. Krygiel. Behind the wizard’s curtain. an
integration environment for a system of systems.
Technical report, DTIC Document, 1999.
[4] D. Luzeaux and J.-R. Ruault. Systems of systems.
Wiley Online Library, New York, 2010.
[5] M. W. Maier. Architecting principles for
systems-of-systems. In INCOSE International
Symposium, pages 565–573. Wiley Online Library,
July 1996.
[6] F. Oquendo. π-adl: an architecture description
language based on the higher-order typed π-calculus
for specifying dynamic and mobile software
architectures. ACM SIGSOFT Software Engineering
Notes, 29(3):1–14, May 2004.
[7] F. Oquendo. Formal approach for the development of
business processes in terms of service-oriented
architectures using pi-adl. In Service-Oriented System
Engineering, 2008. SOSE’08. IEEE International
Symposium on, pages 154–159. IEEE, December 2008.
[8] F. Oquendo. pi-adl for ws-composition: A
service-oriented architecture description language for
the formal development of dynamic web service
compositions. In SBCARS, pages 52–66, 2008.
[9] F. Oquendo, I. Alloui, S. Cimpan, and H. Verjus. The
archware architecture description language: Abstract
syntax and formal semantics. deliverable d1. 1b,
archware european rtd project. Technical report,
IST-2001-32360, December, 2002.
[10] O. F. A. Specification. Business process modeling
notation specification, 2006.
[11] O. F. A. Specification. Business process model and
notation (bpmn) version 2.0, 2010.
3
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Towards an Approach to Foster Simplicity in Agile
Software Development Projects
Wylliams Santos
Hermano Moura
Informatics Center (CIn), Federal University of
Pernambuco (UFPE)
Recife, Pernambuco, Brazil
Informatics Center (CIn), Federal University of
Pernambuco (UFPE)
Recife, Pernambuco, Brazil
[email protected]
[email protected]
ABSTRACT
These practices embody the adaptability, flexibility and selforganization.
Although agile software development have become essential over the years for organizations, software development
is a complex endeavor [26]. Moreover, complexity has being
widely acknowledged as one of the biggest barriers to agile
project’s success [31].
In line with agile manifesto, agile software development
has proven to be an important set of methods in promoting
simplicity issues, but yet still, surprisingly, few academic
studies that directly address in simplicity’s area [19] [16] [9].
Agile Software Development has proven to be an significant
set of methods in boost simplicity issues, but the privation
of a framework for applying simplicity may be an important factor in the lack of success for software development
projects in meeting the project’s target and achieving customer’s satisfaction. Simplicity is, in itself, by far not a simple concept. To address this gap, we propose an approach
towards fostering simplicity in Agile Software Development.
Additionally, we present the problem statement, research
goal, research question and research methodology, including
the research decision-making structure. Besides, the literature review covering models related to simplicity in different
areas of research are then drawn.
2.
PROBLEM STATEMENT
Meyer [19] takes a closer look at the concept of the official
agile principle, which defines simplicity as “the art of maximizing the amount of work not done”. Meyer affirms that
who has ever obtained a first solution to a problem of any
kind, found it complex, and tried to simplify it. Achieving
simplicity often means adding work, sometimes lots of it.
From this point of view, achieving simplicity is not the
same as minimizing work. Meyer [19] discusses that both
are worthy goals in software engineering, but they arise in
different contexts and lead to different principles: (i) proponents of rigorous, elegant programming techniques, (ii)
avoiding unneeded work which leads to such principles as
“Eliminate waste” and “Decide as late as possible” in Lean
[23]. These two views meet, but not necessarily in the way
agile authors [2] would like.
Simplicity has been considered an important research topic
in Information and Communications Technology (ICT). Agile Software Development has proven to be an important set
of methods in promoting simplicity issues, but the lack of
a framework for applying simplicity is an important factor
in the lack of success for software development projects in
meeting the project’s target and achieving customer’s satisfaction.
Categories and Subject Descriptors
k.6.3 [Management of Computing and Information
Systems]: Software Management—Software Process; D.2.9
[Software Engineering]: Management—Productivity, Programming Teams, Software Process Models
General Terms
Agile Methods, Critical Success Factors
Keywords
Simplicity, Agile Software Development, Methodologies
1. INTRODUCTION
Agile software development represents an alternative to
the heavyweight methodologies. It pus less emphasis on upfront and strict control and relies more on informal collaboration, coordination, and learning [7]. Besides, agile software development achieves the organization business goals
through the practices, principles, and values focused on people and interactions, working software, customer collaboration, responding to change; and continuous improvement [2].
2.1 Research Question
Motivated by the scenario presented previously, the research question investigated by this thesis is: (RQ) How to
manage the simplicity in order to improve Agile Software
Development project’s success?
Based on this general question, the following specific subquestions emerge as well: (RQ1) How to foster simplicity’s
management in contexts of Agile Software Development?,
and (RQ2) How do simplicity concepts relate to the Critical
Success Factors in the context of Agile Software Development?
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise, to
republish, to post on servers or to redistribute to lists, requires prior specific
permission and/or a fee.
SBSI 2015, May 26th-29th, 2015, Goiânia, Goiás, Brazil
Copyright SBC 2015.
4
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
2.2
Research Goal
The goal of this thesis can be stated as: This work proposes an approach to manage simplicity in the context of Agile Software Development in order to improve the project’s
success. The approach is supported by the state-of-the-art in
Agile Software Development context concerning Simplicity’s
understanding.
From the general goal, the following specific research goals
are defined (RG1:) to understand the simplicity’s dimensions, practices and concepts from the agile team’s perspective, (RG2:) to develop an approach that integrates the chosen simplicity’s dimensions and ASD practices, and (RG3:)
to evaluate the proposed approach in the industrial scenario.
Figure 1: Research paths through the research
decision-making structure
3. METHODOLOGY
Several factors make empirical research in Software Engineering particularly challenging as it requires studying not
only technology but its stakeholders’ activities while drawing concepts and theories from social science [32]. Several
researchers [27] [29] [30] [8] [24] [5] have addressed the challenges in selecting an appropriate research method in empirical software engineering research in the last two decades.
In this sense, this work adopts the decision-making structure containing a number of decision points, each one of
them representing a specific aspect on empirical software
engineering research [32]. The decision-making structure
aims to support researchers by providing a foundation of
knowledge about empirical software engineering research decisions, in order to ensure that researchers make well-founded
and informed decisions about their research designs and the
underlying research process to (i) understand the interrelationship of the main components of research; (ii) avoid confusion when discussing the logic behind the research design
or assumptions that have been made (iii) be able to present
the research results with confidence and being able to persuade the reader of its conclusions, (iv) be able to comply
research standards (v) be able to understand and put other
researchers’ work in context.
Figure 1 shows the decision points outlining the structure
of the decision process during study design. The decision
points are logically ordered from left to right. Initially, the
decision making-structure shows the starting point (bull’s
eye), the identification of the research question. After this
stage, the decision point involve selection of (DP1) research
outcome (basic), (DP2) research logic (inductive), (DP3)
research purpose (exploratory), (DP4) research approach
(interpretivist), (DP5) research process (mixed approach),
(DP6) research methodology (design science), (DP7) data
collection methods (archival literature, interviews and expert review) and (DP8) data analysis methods (thematic
analysis and statistical analysis). Finally, the research incorporates the industrial case study in order to state the
validation, refine and consolidate the proposed framework.
are described in the polemic paper entitled “Simplicity is
Highly Overrated” by Norman [22]. Norman believes that
less is better, but in the meantime, he argues that marketing
experts know that purchase decisions are influenced by feature lists. Products which have an extensive list of features
and are fundamentally more complex are preferred. Besides,
Norman emphasizes that even if the buyers realise they will
probably never use most of the features and, perhaps, these
features will confuse the buyers more than helping them,
they still prefer them.
The findings resulted from a Systematic Literature Review
and direct interaction with experts (individual interviews
and focus group) in the area of ICT [9] [16] give evidence
that the community of researchers and practitioners believe
that the philosophy of simplicity is strategically important,
yet still insufficiently understood.
Based on the evolution of Project Management (PM) thinking, Moura and Skibniewski [20] [21] presented the Software
Project Framework (SPF), composed of disciplines, principles and dimensions in order to verify how project management and related research have evolved over the years and
to identify related trends. Simplicity is one of the 14 dimensions (directions) for advancing research proposed by the
SPF. Moura and Skibniewski consider the agile methods as
a promising approach to this dimension.
According to Dingsøyr et al. [6], the articulation of the
Agile Manifesto in 2001 has brought unprecedented changes
to the software engineering field. The Agile Manifesto is a
statement of values and principles that describe the various
agile processes [2] [26], as follows: (i) Individuals and interactions over processes and tools, (ii) Working software over
comprehensive documentation, (iii) Customer collaboration
over contract negotiation, (iv) Responding to change over
following a plan.
In order to satisfy these values, some principles1 should be
respected, among them, the principle that “Simplicity, the
art of maximizing the amount of work not done – is essential”. In the available literature, various methods propose
agility in their definitions, aiming to find efficient ways for
developing software of quality across an agile development
process.
According to Jobs [12], “you have to work hard to get your
thinking clean to make it simple” - simple can be harder
than complex. From this point of view, achieving simplicity
4. THEORETICAL BACKGROUND
Simplicity principles have been proposed in various forms
by theologians, philosophers, and scientists, from ancient
to modern times. There is a widespread philosophical presumption that simplicity is a theoretical virtue [1] [10].
Several works [9] [17] [18] analyze simplicity in the context of Information and Communications Technology. Some
tendencies related to simplicity in the context of products
1
5
http://agilemanifesto.org/principles.html
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Figure 2: Conceptual Framework of Simplicity in
Agile Software Development
is not the same as minimizing work. Meyer [19] discusses
that both are worthy goals in software engineering, but they
arise in different contexts and lead to different principles:
(i) proponents of rigorous, elegant programming techniques,
(ii) avoiding unneeded work which leads to such principles
as “Eliminate waste” and “Decide as late as possible” in Lean
[23]. These two views meet, but not necessarily in the way
agile authors [2] would like.
5.
PROPOSED APPROACH AND NEXT STEPS
Our approach proposes four simplicity perspectives in the
context of Agile Software Development, such as agile team,
product, customer and process. Conforming to Margaria
[16] there are many perspectives on the concept of simplicity for example, simplicity can be related to size as in the
number of components a system possesses. It can also reflect
the amount of effort a user of the system has to expend to
use the system or the level of effort and amount of knowledge
to understand the system.
In the context of the present study, we are particularly
interested in proposing a coherent approach of interrelated
fundamental directions fostering simplicity in the context
of Agile Software Development. Initially, our framework is
composed by several dimensions that leads to simplicity in
the context of Agile Software Development, such as: reduction, orthogonality, time, structure, communication, organization, decomposition and so on.
Figure 2 provides an overview of the conceptual framework illustrating the nature and relationships between the
different components of the pyramid. The pyramid is revolving around Agile Manifesto, Dimensions of Simplicity
and Critical Success Factors (CSF), as its cornerstones. The
philosophical concept of simplicity is considered as the center or as the core part of the framework. It is set up and
inspired by Egyptian pyramids, certainly one of the most
perfect and extraordinary shapes created by humans [25].
Humbert and Price [11] argued that the regular tetrahedron, comprising only four equilateral triangles, has at least
as forte a claim to simplicity and symmetry. Analogously,
these are the main characteristics of our pyramid.
The basis of the pyramid lists the Agile Manifesto and
Dimensions of Simplicity. The Agile Manifesto unifies and
establishes a common set of values and principles for all of
the agile methodologies, including the tenth principle that
addresses simplicity as essential “the art of maximizing the
amount of work not done”. The Dimensions of Simplicity’s
triangle identify the structures and aspects that lead to simplicity.
On the top of the pyramid, Critical Success Factors - are
the factors that must be present for the agile project to be
successful. In this sense, we believe that the simplicity dimension affects and is related to some Critical Success Factors [3] [28]. The core (center) of the pyramid, extracts the
essence of simplicity according to the philosophical concept.
Additionally, relationships between the components of the
pyramid are not stated in a linear/sequential way. Essentially, they must be present in order to keep the spirit of
simplicity.
Thus, if well analyzed, the simplicity dimension could lead
to increasing the success rates of the Agile Project. This
new way of dealing with simplicity in the context of Agile
Software Development requires the capacity to rethink the
underlying competences under a different image of project,
demanding a new team’s mindset in order to further boost
the success of the projects with focus on simplicity.
As a partial result of the work presented in this thesis,
the following main contributions can be highlighted: (i) an
overview of the key concepts in the field of simplicity, with
emphasis on the Agile Software Development aspects; (ii) a
survey [14] performed with practitioners from the European
and American companies, besides researchers from the Lero,
the Irish Software Research Centre2 , in order to understand
the aspects of Simplicity in Agile Software Development; (iii)
an initial conceptual framework in underlying simplicity definition from the Agile Team’s perspective; (iv) a focus group
performed with Brazilian practitioners and researchers in order to refine and evaluate the conceptual framework underlying simplicity definition from Agile Team’s perspective;
As the next steps and statements of future contributions,
our schedule proposes: (i) a Systematic Literature Review
(SLR) [13] in order to understand the challenges and opportunities of Simplicity management, as well as to identify
research gaps and the road ahead; (ii) the establishment
of an approach to simplicity management in Agile Software
Development; and, (iii) the evaluation of the proposed approach.
6. CONCLUDING REMARKS
There are difficulties in defining simplicity and its impact
on IT development and use. Moreover there are difficulties
in defining what happens when simplicity is not present [15]
[18].
Agile software development emerged as a popular paradigm
and agile methods became the most software development
in software industry. Besides, agile methods provide ways to
develop software which place emphasis on people and their
creativity [4], yet some theoretical concepts are still insufficiently understood by practitioners and researchers. In this
context, we believe that it is important to develop an approach to support the agile team in order to foster simplicity
in Agile Software Development.
2
6
http://www.lero.ie
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Acknowledgements
The authors would like to acknowledge the Brazilian National Research Council (CNPq) and University of Pernambuco (UPE) for their support during this research.
7.
[17]
[18]
REFERENCES
[1] A. Baker. Simplicity. The Standard Encyclopedia of
Philosophy, 2013. Accessed on February 22, 2015.
[2] K. Beck, M. Fowler, and K. Schwaber. Manifesto for
Agile Software Development, 2001.
http://agilemanifesto.org. Accessed on February 22,
2016.
[3] T. Chow and D.-B. Cao. A survey study of critical
success factors in agile software projects. Journal of
Systems and Software, 81(6):961–971, 2008.
[4] A. Cockburn and J. Highsmith. Agile software
development: The people factor. Computer,
34(11):131–133, 2001.
[5] J. Creswell. Research design: qualitative, quantitative
and mixed methods approach. SAGE Publications, Inc,
4th edition, 2013.
[6] T. Dingsøyr, S. Nerur, V. Balijepally, and N. B. Moe.
A decade of agile methodologies: Towards explaining
agile software development. Journal of Systems and
Software, 85(6):1213–1221, 2012.
[7] T. Dybå, T. Dingsøyr, and N. B. Moe. Agile Project
Management. In G. Ruhe and C. Wohlin, editors,
Software Project Management in a Changing World,
number SEPTEMBER, chapter 11, pages 277–300.
Springer Berlin Heidelberg, London, 2014.
[8] S. Easterbrook, J. Singer, M.-A. Storey, and
D. Damian. Selecting Empirical Methods for Software
Engineering Research. In Guide to Advanced Empirical
Software Engineering, chapter Selecting Empirical
Methods for Software Engineering Research, pages
285–311. Springer London, 2008.
[9] B. D. Floyd and S. Bosselmann. ITSy - Simplicity
Research in Information and Communication
Technology. Computer, 46(11):26–32, Nov. 2013.
[10] J. C. Gambrel and P. Cafaro. The Virtue of
Simplicity. Journal of Agricultural and Environmental
Ethics, 23 VN - r:85–108, 2009.
[11] J.-M. Humbert and C. Price. Imhotep Today:
Engyptianizing architecture. UCL Press - Institute of
Archaeology, London, United Kingdom, 2003.
[12] S. Jobs. Steven Jobs: There’s sanity returning, 1998.
http://www.businessweek.com/1998/21/b3579165.htm.
Accessed on February 16, 2016.
[13] B. Kitchenham and S. Charters. Guidelines for
performing Systematic Literature Reviews in Software
Engineering. Technical report, Keele University and
Durham University Joint Report, 2007.
[14] B. Kitchenham and S. L. Pfleeger. Principles of survey
research part 4: questionnaire evaluation. ACM
SIGSOFT Software Engineering Notes, 27(3):20, 2002.
[15] T. Margaria, B. D. Floyd, and B. Steffen. IT Simply
Works: Simplicity and Embedded Systems Design. In
Computer Software and Applications Conference
Workshops (COMPSACW), 2011 IEEE 35th Annual,
pages 194–199. IEEE, July 2011.
[16] T. Margaria, B. D. Floyd, and B. Steffen. ITSy –
7
[19]
[20]
[21]
[22]
[23]
[24]
[25]
[26]
[27]
[28]
[29]
[30]
[31]
[32]
Recommendation Document. Technical report,
University of Postdam, Postdam, 2011. Accessed on
February 21, 2016.
T. Margaria and M. Hinchey. Simplicity in IT: The
Power of Less. Computer, 46(11):23–25, Nov. 2013.
T. Margaria and B. Steffen. Simplicity as a Driver for
Agile Innovation. Computer, 43(6):90–92, June 2010.
B. Meyer. Agile! The Good, the Hype and the Ugly.
Springer, Zurich, Switzerland, 2014.
H. Moura. Software Project Framework. Technical
report, Federal Univerity of Pernambuco, Recife,
Pernambuco, 2011. Accessed on February 21, 2015.
H. Moura and M. Skibniewski. The Evolution of
Management Thinking. In International Research
Network on Organizing by Project (IRNOP), 2011.
D. A. Norman. Simplicity is highly overrated.
Interactions, 14(2):40–41, 2007.
M. Poppendieck and T. Poppendieck. Leading Lean
Software Development: Results Are Not the Point.
Addison-Wesley Professional, 1st edition, 2009.
P. Runeson and M. Höst. Guidelines for conducting
and reporting case study research in software
engineering. Empirical Software Engineering,
14(2):131–164, dec 2008.
M. G. Schadla-Hall RT. Ancient Egypt on the Small
Screen - from Fact to Fiction in the UK. In
Consuming Ancient Egypt, chapter 14, pages 195–215.
UCL Press - Institute of Archaeology, London, United
Kingdom, 2003.
K. Schwaber and M. Beedle. Agile Project
Management With Scrum. Microsoft Press,
Washington, 2004.
C. Seaman. Qualitative methods in empirical studies
of software engineering. IEEE Transactions on
Software Engineering, 25(4):557–572, 1999.
D. Shahane, P. Jamsandekar, and D. Shahane. Factors
Influencing the Agile Methods in Practice - Literature
Survey & Review. In International Conference on
Computing for Sustainable Global Development
(INDIACom), pages 556–560, 2014.
M. Shaw. Writing good software engineering research
papers. In 25th International Conference on Software
Engineering, 2003. Proceedings., pages 726–736,
Portland, Oregon, 2003. IEEE Computer Society.
D. I. K. Sjoberg, T. Dyba, and M. Jorgensen. The
Future of Empirical Methods in Software Engineering
Research. Future of Software Engineering (FOSE ’07),
pages 358–378, 2007.
The Standish Group International. CHAOS
MANIFESTO 2013. Technical report, The Standish
Group International, 2013.
C. Wohlin and A. Aurum. Towards a decision-making
structure for selecting a research design in empirical
software engineering. Empirical Software Engineering,
20(6):1427–1455, 2014.
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
SMartyMetrics: um Framework de Métricas de Apoio à
Avaliação de Arquiteturas de Linha de Produto de Software
Alternative Title: SMartyMetrics: a Metrics Framework for
Supporting Software Product Line Architecture Evaluation
André Felipe Ribeiro Cordeiro
Edson OliveiraJr
Departamento de Informática (DIN)
Universidade Estadual de Maringá
(UEM)
Departamento de Informática (DIN)
Universidade Estadual de Maringá
(UEM)
[email protected]
[email protected]
metrics to for such evaluation. By defining and using metrics, it is
important to ensure that such metrics represent relevant
characteristics for evaluation. Therefore, this work presents a
proposal of a metrics framework to support the evaluation of
PLAs. This framework should define a set of metrics for quality
attributes, considering variability and quality models such as
ISO/IEC 9126 and/or ISO/IEC 25010.
RESUMO
Linha de Produto de Software (LPS) é uma abordagem de reuso
que considera a combinação de artefatos relacionados a um
domínio de aplicação. Entre os principais artefatos está a
arquitetura de LPS (Product Line Architecture - PLA), que
influencia na geração dos produtos. Essa característica da PLA
exige que a mesma seja avaliada de forma quantitativa e
qualitativa,
durante
todo
o
ciclo
de
desenvolvimento/manutenção/evolução da linha. Métodos de
avaliação de PLAs são apresentados na literatura. Entre todos
esses métodos, existem aqueles que consideram a aplicação de
métricas para avaliar a PLA. Ao definir e utilizar métricas, é
importante garantir que tais métricas representem características
relevantes para a avaliação. Diante disso, esse trabalho apresenta
a proposta de um framework de métricas para apoiar a avaliação
de PLAs. Esse framework deve definir um conjunto de métricas
para determinados atributos de qualidade, considerando
variabilidades e um modelo/norma de qualidade, tal como a
ISO/IEC 9126 e/ou ISO/IEC 25010.
Categories and Subject Descriptors
D.2.8 [Metrics]: Product metrics.
General Terms
Management, Measurement, Experimentation, Standardization.
Keywords
Quality Attributes; Product Line Architecture Assessment;
Software Product Line; Metrics; Quality Models.
1. INTRODUÇÃO
Palavras-Chave
Linha de Produto de Software (LPS) é uma abordagem de
reuso sistemático e planejado de artefatos de software, em um
domínio de aplicação. Os artefatos de uma LPS podem ser
comuns (relacionados ao domínio) ou variáveis (não relacionados
ao domínio) [4].
A variabilidade (sinônimo para artefato variável) pode ser
entendida como um mecanismo que diferencia os produtos de
uma LPS, sendo descrita por pontos de variação e variantes. Os
pontos de variação são locais que contém decisões de projeto
ainda não resolvidas e as variantes são possíveis alternativas de
solução de um ponto de variação [14].
Os produtos de uma LPS são desenvolvidos por meio da
instanciação de artefatos, presentes em uma infraestrutura
denominada núcleo de artefatos. Um dos artefatos mais
importantes de uma LPS presente nesse núcleo é a arquitetura
(Product Line Architecture - PLA) [14].
A PLA permite abstrair as arquiteturas dos possíveis
produtos de uma LPS, sendo fundamental para o sucesso/fracasso
da abordagem. A literatura apresenta diferentes métodos de
avaliação de PLAs, tais como o Holistic Product Line
Architecture Assessment (HoPLAA) [11] e o Systematic
Evaluation Method for UML-based Software Product Line
Architectures (SystEM-PLA) [13] [14]. No SystEM-PLA por
Atributos de Qualidade; Avaliação de Arquitetura de Linha de
Produto; Linha de Produto de Software; Métricas; Modelos de
Qualidade.
ABSTRACT
Software Product Line (SPL) is a reuse approach that combines
artifacts related to an application domain. Amongst the key
artifacts is the SPL architecture (Product Line Architecture PLA), which impacts in the generation of products. This
characteristic of a PLA requires it to be evaluated quantitatively
and/or
qualitatively,
throughout
the
development/
maintenance/evolution cycle of the SPL. Literature presents
several PLA evaluation methods. Amongst all these methods,
there are those, which take into consideration the application of
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee.
SBSI 2016, May 17–20, 2016, Florianópolis, Santa Catarina, Brazil.
Copyright SBC 2016.
8
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
exemplo, a avaliação de PLAs permite a aplicação e coleta de
métricas, que podem auxiliar na verificação de determinadas
características da PLA [15].
Ao definir e utilizar métricas na avaliação, é importante
garantir que tais métricas estejam relacionadas com os propósitos
definidos. A definição do(s) propósito(s) pode ser realizada por
meio da abordagem Goal Question Metric (GQM) [2]. O GQM
estrutura a associação entre objetivos (goals), questões (questions)
e métricas (metrics) em uma avaliação.
A definição das métricas pode ser realizada considerando
Modelos de Qualidade (MQ) ou Normas de Qualidade (NQ). Os
modelos/normas especificam um conjunto de atributos, também
conhecidos como Atributos de Qualidade (AQ). São exemplos de
AQ, a Manutenibilidade [1], a Complexidade [9] e a
Extensibilidade [12].
A aplicação da abordagem GQM, em conjunto com MQ/NQ,
AQ e métricas pode auxiliar na avaliação de PLAs. Neste caso, a
avaliação poderia considerar determinados AQ, que estejam
relacionados tanto com MQ/NQ, quanto com métricas específicas.
Apesar das evidências sobre esses potenciais benefícios, poucos
trabalhos que consideram MQ/NQ, AQ e métricas no contexto de
PLA e/ou LPS, foram encontrados na literatura.
Diante disso, este trabalho apresenta a proposta de um
framework de métricas para apoiar a avaliação de PLAs
modeladas em Unified Modeling Language (UML). Além de
considerar as variabilidades da PLA e os AQ definidos na norma
ISO/IEC 9126 [7] ou ISO/IEC 25010 [8], esse framework também
considera a aplicação da abordagem GQM.
3. PROPOSTA DE SOLUÇÃO
O framework de métricas proposto neste trabalho deve
considerar a associação entre MQ/NQ, AQ e métricas, para apoiar
a avaliação de PLAs. Tal associação, em conjunto com a
abordagem GQM, deve possibilitar a consideração de AQ na
avaliação. Neste framework, as PLAs devem estar modeladas em
UML, de acordo com a abordagem Stereotype-based Management
of Variability (SMarty) [3]. SMarty é uma abordagem de
gerenciamento de variabilidades para LPSs modeladas em UML,
baseada em estereótipos e diretrizes.
A construção do framework está relacionada com a execução
das seguintes atividades:
2. APRESENTAÇÃO DO PROBLEMA
Dada à importância de uma PLA para a adoção de LPS, é
importante que tal artefato seja avaliado de forma quantitativa e
qualitativa. As métricas auxiliam nas análises quantitativas e
qualitativas, além das análises de trade-offs [14].
Um mapeamento sistemático foi realizado com o objetivo de
verificar e analisar medidas, métricas e frameworks de
medição/avaliação, no contexto de PLA e LPS. Deste
mapeamento, extraiu-se um número extenso de medidas e
métricas, entretanto, percebeu-se também um número reduzido de
medidas e métricas específicas para PLA, se comparado ao total
de medidas e métricas extraídas.
Outra característica observada no mapeamento foi o número
reduzido de trabalhos que consideram a associação entre MQ/NQ,
AQ e métricas, na avaliação de PLAs e de outros artefatos de uma
LPS. Dos trabalhos selecionados, destaque para o trabalho de Her
et al. [6], que apresenta um framework para avaliação de ativos
centrais (core assets) de uma LPS. Esse framework associa de
forma parcial, AQ selecionados da norma ISO/IEC 9126, com
métricas específicas para tais AQ. Apesar da associação entre
MQ/NQ, AQ e métricas ser uma característica interessante do
trabalho, ele não considera exclusivamente PLAs, como é o caso
desse trabalho.
Outros trabalhos sobre frameworks de medição/avaliação
foram encontrados, porém, esses trabalhos apresentam contextos
de aplicação diferentes de LPS, tais como orientação à aspectos
[16] e arquitetura de software tradicional [17]. Esses trabalhos
apresentam a preocupação com a inserção de AQ na
medição/avaliação, entretanto, a associação entre MQ/NQ, AQ e
métricas não é explícita, diferente da proposta desse trabalho.
Por fim, foi observado no mapeamento diferentes propósitos
que podem motivar a avaliação de uma PLA, desde a otimização
[5], até a aplicação de testes de regressão [10]. Em ambos os
casos, métricas auxiliaram na avaliação.

seleção das métricas candidatas a compor o framework.
Essas métricas serão extraídas das medidas e métricas
observadas no mapeamento sistemático realizado;

organização das métricas por AQ, de acordo com a
norma ISO/IEC 9126 [7] ou ISO/IEC 25010 [8];

validação experimental das métricas;

especificação das métricas em Structured Metrics Metamodel (SMM1), um metamodelo estruturado para
especificação de métricas definido pelo Object
Management Group (OMG2);

estudo, construção conceitual do framework, baseado na
abordagem GQM e avaliação experimental do
framework;
4. PROJETO DE AVALIAÇÃO DA
SOLUÇÃO
As métricas serão validadas por meio de estudos
experimentais quantitativos e qualitativos, considerando a
estrutura adotada em [9] e [12]. A estrutura adotada em tais
estudos considera AQ na avaliação de PLAs.
O framework será avaliado experimentalmente considerando
a realização de estudos quantitativos e qualitativos. É planejada a
participação de professores/pesquisadores (especialistas) em
LPS/PLA. Especificamente sobre os estudos qualitativos, planejase aplicar procedimentos de Grounded Theory, como Coding [18].
Após a validação das métricas e avaliação do framework, o
mesmo será instanciado para apoiar a avaliação de PLAs. Será
exigido tanto na validação, quanto na avaliação, a participação de
pessoas qualificadas no contexto de LPSs e PLAs.
5. ATIVIDADES JÁ REALIZADAS
Um Mapeamento Sistemático foi realizado para identificar
medidas, métricas e frameworks no contexto de PLA/LPS.
Métricas para avaliar a estabilidade de PLAs modeladas em UML
foram propostas e validadas experimentalmente. O procedimento
experimental considerou a correlação entre a avaliação da
estabilidade realizada por participantes e a avaliação da
estabilidade fornecida pelas métricas propostas.
Os resultados experimentais iniciais apresentaram uma
correlação positiva fraca. Apesar de tais evidências, novos
9
1
http://www.omg.org/spec/SMM/
2
http://www.omg.org/
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
and Evaluation (SQuaRE) – System and Software Quality
Models. International Organization for Standardization
(ISO).
Disponível
em:
http://www.iso.org/iso/catalogue_detail.htm?csnumber=3573
3. Acessado em 05/03/2016.
estudos precisam ser conduzidos a fim de avaliar mais
precisamente.
No momento, as métricas candidatas a serem
selecionadas/definidas para o framework estão em análise. Ao
final da análise, as métricas serão classificadas segundo os AQ
presentes na norma ISO/IEC 9126 ou ISO/IEC 25010. Em
seguida, as atividades apresentadas na seção de Proposta de
Solução serão realizadas.
[9] Marcolino, A. S., OliveiraJr, E., Gimenes, I. M. S., and
Conte, T. U. Towards Validating Complexity-Based Metrics
for Software Product Line Architectures. In: Proceedings of
the Brazilian Symposium on Software Components,
Architectures and Reuse (SBCARS 2013), Brasília, pp. 6979, 2013.
6. CONCLUSÃO
Este trabalho apresentou a proposta de um framework de
métricas de apoio à avaliação de PLAs, considerando a associação
entre MQ/NQ, AQ e métricas. A princípio, considera-se os AQ
presentes na ISO/IEC 9126 ou ISO/IEC 25010 como potenciais
candidatos para o framework.
Em conjunto com a associação mencionada, planeja-se
integrar a abordagem GQM ao framework, com o propósito de
considerar AQ na avaliação de PLAs, bem como suportar análises
de trade-off entre AQ.
A construção deste framework, denominado SMartyMetrics,
avançará o estado da arte no que se refere à avaliação de PLAs
considerando métricas relacionadas à AQ.
[10] Neto, P. A. M. S., Machado, I. C., Cavalcanti, Y. C.,
Almeida, E. S., Garcia, V. C., Meira, S. R. L. An
Experimental Study to Evaluate a SPL Architecture
Regression Testing Approach. In: IEEE 13th International
Conference on Information Reuse and Integration (IRI), Las
Vegas, pp. 608-615, 2012.
[11] Olumofin, F. G. and Misic, V. B. Extending the ATAM
Architecture Evaluation to Product Line Architectures. In:
Proceedings of the Working IEEE/IFIP Conference on
Software Architecture, Washington, pp. 45-56, 2005.
7. AGRADECIMENTOS
[12] OliveiraJr, E., and Gimenes, I. M. S. Empirical Validation of
Product-line Architecture Extensibility Metrics. In:
Proceedings of the International Conference on Enterprise
Information Systems, Lisbon, pp. 111-118, 2014.
Os autores agradecem à Coordenação de Aperfeiçoamento de
Pessoal de Nível Superior (CAPES) pelo apoio financeiro, na
realização dessa pesquisa.
[13] OliveiraJr, E., Gimenes, I. M. S., Maldonado, J. C., Masiero,
P. C., and Barroca, L. Systematic Evaluation of Software
Product Line Architectures. Journal of Universal Computer
Science (JUCS), v. 19, n. 1, pp. 25-52, 2013.
8. REFERÊNCIAS
[1] Alshayeb, M. On the relationship of class stability and
maintainability. Institution of Engineering and Technology
(IET) Software, 2013, v. 07, p.339-347, 2013.
[14] Oliveira Junior, E. A. SystEM-PLA: um Método Sistemático
para Avaliação de Arquitetura de Linha de Produto de
Software baseada em UML”. 2010. Tese (Doutorado em
Ciências de Computação e Matemática Computacional) Instituto de Ciências Matemáticas e de Computação,
Universidade de São Paulo, São Carlos, 2010.
[2] Basili, V., Caldiera, G., and Rombach, H. “The Goal
Question Metric Approach”. Encyclopedia of Soft. Eng., vol.
2, September 1994, pp. 528-532, John Wiley & Sons, Inc.
[3] Bera, M. H. G., OliveiraJr, E., and Colanzi, T. E. Evidencebased SMarty Support for Variability Identification and
Representation in Component Models. In: Proceedings of the
17th International Conference on Enterprise Information
Systems (ICEIS), Setúbal, pp. 295-302, 2015.
[15] OliveiraJr, E., Gimenes, I. M. S., and Maldonado, J. C. A
Metric Suite to Support Software Product Line Architecture
Evaluation. In: XXXIV Conferência Latinoamericana de
Informática (CLEI), 2008, Santa Fe. Anais da XXXIV
Conferência Latinoamericana de Informática (CLEI), 2008.
pp. 489-498.
[4] Capilla, R., Bosch, J., and Kang, K. Systems and Software
Variability Management: Concepts, Tools and Experiences.
SpringerLink: Bucher. Springer, 2013.
[16] Sant’anna, C. N., Garcia, A. F., Chavez, C. F. G., Lucena, C.
J. P., and Staa, A. “On the Reuse and Maintenance of
Aspect-Oriented Software: An Assessment Framework”. In:
Proceedings of the 7th Brazilian Symposium on Software
Engineering
(SBES),
2003.
Disponível
em:
http://www.lbd.dcc.ufmg.br/colecoes/sbes/2003/002.pdf.
Acesso em: 07 mar. 2016.
[5] Colanzi, T. E., Vergilio, S. R. A Feature-Driven Crossover
Operator for Product Line Architecture Design Optimization.
In: IEEE 38th Annual Computer Software and Applications
Conference (COMPSAC), Vasteras, pp. 43-52, 2014
[6] Her, J. S., Kim, J. H., Oh, S. H., Rhew, S. Y., and Kim, S. D.
A framework for evaluating reusability of core asset in
product line engineering. Information and Software
Technology (IST), v. 49, n. 1, pp. 740-760, 2007.
[17] Sant’anna, C., Figueiredo, E., Garcia, A., and Lucena, C. J.
P. “On the Modularity of Software Architectures: A
Concern-Driven Measurement Framework”. In: Proceedings
of the First European Conference on Software Architecture
(ECSA´07), pp. 207-224, 2007.
[7] ISO/IEC. ISO/IEC 9126, Information technology - Product
Quality - Part1: Quality Model. International Organization
for
Standardization
(ISO).
Disponível
em:
http://www.iso.org/iso/, 2001. Acessado em 05/03/2016.
[18] Strauss, A., Corbin, J. Basics of qualitative research:
Techniques and procedures for developing grounded theory.
2
ed.
Sage
Publications,
1998.
[8] ISO/IEC. ISO/IEC 25010:2011, Systems and Software
Engineering – Systems and Software Quality Requirements
10
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Técnicas de Desenvolvimento Orientado a Modelos no
Domínio de Robótica e Robôs Sociais
Alternative Title: Model-Driven Development techniques for
Robotics Domain and Social Robots
Tiago Heineck
Jaelson Castro
Enyo Gonçalves
Instituto Federal Catarinense
Universidade Federal de Pernambuco
Universidade Federal do Ceará
Universidade Federal de Pernambuco
Centro de Informática
Universidade Federal de Pernambuco
Cidade Universitária – Recife - PE
Cidade Universitária – Recife - PE
Cidade Universitária – Recife - PE
[email protected]
[email protected]
[email protected]
RESUMO
Keywords
Robôs são agentes complexos compostos de diversos sensores e
atuadores que funcionam em conjunto com software para o
atendimento de requisitos específicos. O subconjunto de robôs
que tem a capacidade de interagir entre eles e até mesmo com
pessoas, por meio de gestos ou fala, é conhecido como Robôs
Sociais. O Desenvolvimento Orientado a Modelos é um promissor
paradigma pois promove o reuso de componentes e geração rápida
de código de qualidade. Portanto, neste trabalho investigaremos
sua adequação para o desenvolvimento de sistemas robóticos.
Propomos a realização de uma Revisão Sistemática da Literatura
para analisar como Desenvolvimento Orientado a Modelos tem
sido utilizado no domínio de robótica e em particular em robótica
social.
Model-Driven Development,
Requirements Engineering.
Robotics,
Social
Robotics,
1. INTRODUÇÃO
Um robô pode ser uma máquina que executa tarefas repetitivas,
sejam guiadas, predefinidas ou de maneira inteligente, sendo
capaz de perceber o ambiente e realizar a tomada de decisão [12].
Um robô social é um (semi) autônomo que interage e se comunica
com humanos seguindo regras sociais ligadas ao seu papel [7].
Estes robôs devem possuir características humanas como:
expressar e perceber emoções, comunicação em alto nível de
diálogo, aprender modelo de outros agentes, estabelecer relações
sociais, exibir personalidade e caráter e aprender competências
sociais [5].
Palavras-Chave
O domínio da robótica tem apresentado um grande crescimento,
interessando grandes empresas da tecnologia na realização de
investimentos. A robótica vem sendo aplicada em diversos
domínios, como o industrial, médico e em educação, além da
oferta de robôs de serviço, surgem oportunidades envolvendo
robôs sociais.
Desenvolvimento Orientado a Modelos, Robótica, Robótica
Social, Engenharia de Requisitos.
ABSTRACT
Robots are complex agents composed of various sensors and
actuators that work together with software to meet specific
requirements. The subset of robots that has the ability to interact
among them and even with people, through gestures or speaking,
is known as Social Robots. Model-Driven Development is a
promising paradigm because it promotes the reuse of components
and quick code generation with quality. Therefore, in this project
we will investigate its suitability for the development of robotic
systems. We propose conducting a Systematic Review of the
Literature to analyze how Model-Driven Development has been
used in the field of robotics and in particularly in social robotics.
Decidir o paradigma no qual se baseará o modo de agir também é
algo que permeia o desenvolvimento de sistemas robóticos. Em
[9] os autores apresentam uma técnica de modelagem de
especificação de requisitos para sistemas Teleo-Reativos (TR),
que tem como principal vantagem reagir de forma robusta as
mudanças em seus ambientes, apresentam um caso de estudo
baseado em um projeto de futebol de robôs.
Consequentemente, é importante que o software robótico seja bem
especificado. É necessário que os desejos do cliente sejam
identificados e analisados para que possa ser especificada uma
solução sem ambiguidade [11].
Categories and Subject Descriptors
I.6.5 [Simulation and Modeling]: Model Development –
Modeling methodologies
Assim sendo, o aumento de funcionalidades dos robôs provoca
um aumento na complexidade à nível de software, atentos a este
ponto, evidências apontam para o Desenvolvimento Orientado a
Modelos (MDD) como uma alternativa no auxílio a este domínio,
como já vem sendo realizado por [14],[4] e outros. Para [1], MDD
é um paradigma de desenvolvimento que usa modelos como
artefatos primários do processo desenvolvimento, onde a
implementação é gerada (semi) automaticamente a partir de
modelos.
General Terms
Design, Languages, Theory.
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee.
SBSI 2016, May 17–20, 2016, Florianópolis, Santa Catarina, Brazil.
Copyright SBC 2016.
O objetivo principal desta proposta é buscar evidências em
estudos primários relacionados a técnicas de MDD que tem
auxiliado o desenvolvimento de software no domínio de robótica.
11
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Os objetivos secundários são identificar a relação destas técnicas
com a fase de especificação de requisitos (funcionais e nãofuncionais), atendimento a questões sociais e paradigmas
envolvidos com questões comportamentais do robô.
4. PROPOSTA DE AVALIAÇÃO DA
SOLUÇÃO
Como ponto principal de apoio está o desenvolvimento de um
protocolo bem definido, contendo um background para
embasamento dos pesquisadores, as questões de pesquisa
definidas de forma clara e objetiva e os métodos e procedimentos
a serem utilizados.
2. APRESENTAÇÃO DO PROBLEMA
Pesquisadores no domínio de robótica tem colocado a atenção no
desenvolvimento de robôs sociais, estando inseridos em diversos
contextos e ambientes, atendendo normas e interagindo de alguma
maneira [5].
Para redução de viés algumas medidas foram tomadas, como a
execução realizada de maneira simultânea por dois pesquisadores,
com reuniões ao final de cada etapa para discussão, comparação e
consolidação dos resultados. A documentação de todo o processo,
desde as buscas iniciais em bases automáticas até os
procedimentos finais possibilita a replicação e extensão do estudo.
O desenvolvimento de software na robótica tem sido um desafio,
os sistemas robóticos estão cada vez mais complexos, exigindo
múltiplos sensores distribuídos no corpo do robô e assim
incorporando tarefas mais complexas [2]. A medida que estes
robôs ganham novos recursos a dificuldade aumenta a nível de
software, tendo uma diversidade de requisitos que variam de
acordo com o propósito de cada projeto.
5. ATIVIDADES REALIZADAS
Os trabalhos iniciais serviram como base para o desenvolvimento
do protocolo da RSL, algumas partes são apresentadas nesta
seção.
Buscando alternativas na Engenharia de Software para auxílio a
estas questões, algumas evidências apontam para o MDD como
uma alternativa de auxílio ao domínio de robótica. Sendo assim,
dois estudos, [4] [14] foram escolhidos para aplicação em um
projeto. Partindo do documento de especificação de requisitos, de
uma revisão bibliográfica e de manuais das abordagens foram
criados modelos dentro das técnicas propostas, as mesmas foram
apresentadas em grupos focais com a participação de
pesquisadores do domínio de robótica. Foram ressaltadas a
importância da separação de conceitos e aumento da clareza para
analistas de domínio e especialistas de código, buscando aumento
no entendimento das necessidades e requisitos do software em
todas as etapas do processo de desenvolvimento.
5.1 Questões de Pesquisa
Para o auxílio na formulação da questão de pesquisa, utilizamos o
método PICOC de acordo com as orientações de [8] e [10] e
apresentados na Tabela 1.
Tabela 1. Estrutura para questão de pesquisa
População
Domínio de robótica
Intervenção
Desenvolvimento Orientado a Modelos
Comparação
Não se aplica
Baseado nestes estudos iniciais, identificou-se a importância de
um melhor entendimento de como estas e outras técnicas de MDD
tem auxiliado o desenvolvimento de software no domínio de
robótica, focando em questões de engenharia de software.
Principalmente em casos complexos como o de robôs sociais, que
atuam em ambientes e contextos que exigem adaptação do sistema
em tempo de execução.
Estudos primários onde técnicas de MDD
apoiam o desenvolvimento de software
robótico e de robôs sociais
Pesquisas científicas publicadas em
Contexto
periódicos da área
As questões definidas são apresentadas nesta seção, com uma
breve explicação.
3. PROPOSTA DE SOLUÇÃO
Q1: Como técnicas de desenvolvimento orientado à modelos têm
auxiliado o domínio da robótica?
Resultado
Um estudo sistematizado é necessário para o embasamento a
respeito da utilização das técnicas, igualmente importante como
guia de futuros estudos e desenvolvimento de novas abordagens
de desenvolvimento orientado a modelos (MDD).
Nesta questão serão analisados sob o ponto de vista da Engenharia
de Software os benefícios propostos pela técnica, como por
exemplo: reuso de software, separação de conceitos ou arquitetura
de software.
O principal objetivo desta proposta está na busca de evidências
em estudos primários, utilizando como abordagem uma Revisão
Sistemática da Literatura (RSL). De acordo com Zhang e Babar
[16] a RSL é uma maneira de identificação, avaliação e
combinação de evidências de estudos primários usando um
método rigoroso e bem definido, sendo largamente utilizada em
áreas como a Medicina e Sociologia. Além disso, buscam o
relacionamento com a questão de pesquisa, a área tópico ou o
fenômeno. Kitchenham e Charters [8] apresentam em seus estudos
um guia para realização de Revisão Sistemática da Literatura na
área de Engenharia de Software, separando em três grandes
estágios que tratam do planejamento, condução e elaboração de
relatórios. Todas estas etapas são importantes garantindo a
sequência correta dos trabalhos e auxiliando na eliminação de
resultados tendenciosos ou de viés de publicação. Este tipo de
estudo é útil para sumarizar uma evidência concentrando em uma
tecnologia, identificar pontos nos atuais trabalhos sugerindo novos
estudos ou prover uma base para uma nova atividade de pesquisa.
Q2: Quais as principais características das técnicas?
Por características consideramos os elementos de MDD que a
técnica possui, como diagramas, meta-modelo, elementos gráficos
e linguagem.
Q3: Como as técnicas apoiam a fase de especificação de
requisitos em desenvolvimento de software robótico?
Análise do ponto de vista de especificação de requisitos, extraindo
os tipos de requisitos disponíveis pela técnica, classificando em
Requisitos Funcionais e Não-Funcionais (atributos de qualidade).
Q4: Quais os paradigmas utilizados para questão comportamental
do robô?
A questão comportamental do robô envolve a maneira que ele
reorganiza suas tarefas de acordo com as adaptações que são feitas
em tempo de execução, um exemplo de paradigma é o Teleoreativo (TR), em [13] os autores derivam especificações TR em
componentes arquiteturais para auxílio no alcance de objetivos do
robô.
12
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Q5: São atendidas questões sociais? Como?
artefato valioso para especificação de requisitos e sendo uma
alternativa para redução de complexidade envolvendo questões
sociais em robótica.
Questões sociais estão relacionadas a percepção e interação do
robô com pessoas e ambientes sociais, a observação deste ponto é
feita com base no survey de [5].
Os trabalhos realizados até o momento foram de desenvolvimento
e consolidação do protocolo da pesquisa, seguidos da etapa inicial
de condução, referente a busca e remoção de duplicados. Os
próximos passos serão a seleção dos estudos, extração e análise
dos dados, finalização do relatório e escrita da dissertação.
Q6: Quais são as questões em aberto que as técnicas possuem?
Identificação de pontos que os próprios pesquisadores apontam
para trabalhos futuros.
5.2 Estratégias de Busca
7. REFERÊNCIAS
As buscas são automáticas, nas principais bases de dados
científicas utilizadas, por meio da string de busca, adaptada para
os critérios de cada base, a mesma é apresentada a seguir:
[1] Brambilla, M. et al. 2012. Model-Driven Software
Engineering in Practice. Morgan & Claypool Publishers.
[2] Bruyninckx, H. et al. 2013. The BRICS component model: a
model-based development paradigm for complex robotics
software systems. Proceedings of the 28th Annual ACM
Symposium on Applied Computing. (2013), 1758–1764.
robot* AND ("model driven" OR "domain specific language" OR
"domain specific modeling" OR metamodel OR "meta-model" OR
"modeling language" OR "code generation" OR "generative
programming" OR MDD OR MDA OR MDE OR DSL OR
DSML)
[3] Cruzes, D.S. and Dyba, T. 2011. Recommended Steps for
Thematic Synthesis in Software Engineering. 2011
International Symposium on Empirical Software Engineering
and Measurement. 7491 (2011), 275–284.
As fontes devem possuir mecanismos para operadores “AND” e
“OR” e permitir a extração de dados para arquivos no formato
BibTex ou CSV. As fontes utilizadas são: ScienceDirect, IEEE
Xplore, ACM Digital Library, Engineering Village, Scopus e Web
of Science.
[4] Dhouib, S. et al. 2014. RobotML , a Domain-Specific
Language to Design , Simulate and Deploy Robotic
Applications. (2014).
5.3 Seleção dos estudos
[5] Fong, T. et al. 2003. A survey of socially interactive robots.
Robotics and Autonomous Systems. 42, 3-4 (2003), 143–166.
Para fins de seleção dos estudos são considerados artigos
relacionados a estudos primários, no idioma inglês e publicados a
partir de 2005, da área de Engenharia ou Computação e que
respondam alguma das questões de pesquisa. Foram definidas
cinco etapas para o processo, sendo elas: (1) Busca por meio de
string em bases científicas; (2) Remoção de duplicados utilizando
a ferramenta StArt [6]; (3) Leitura do título, palavras-chave e
resumo; (4) Leitura de título e conclusão e (5) Leitura completa
dos artigos. Após este ciclo, serão realizados outros por meio de
snowballing [15].
[6] Hernandes, E. 2012. Using GQM and TAM to evaluate
StArt-a tool that supports Systematic Review. Clei Electronic
Journal. 15, 1 (2012), 13.
[7] Kahn, P.H., J. et al. 2004. Social and moral relationships with
robotic others? RO-MAN 2004. 13th IEEE International
Workshop on Robot and Human Interactive Communication.
(2004), 545–550.
[8] Kitchenham, B. and Charters, S. 2007. Guidelines for
performing Systematic Literature Reviews in Software
Engineering. Engineering. (2007).
5.4 Extração dos Dados
Os dados serão extraídos em formulários de acordo com as
recomendações de [3]. Além dos autores, título, ano de publicação
e palavras-chave, serão extraídos dados que auxiliem na resposta
das questões de pesquisa. Sendo os seguintes itens: contribuição e
benefícios, elementos e artefatos, atendimento a especificação de
requisitos, tipos de requisitos, tipos de questões sociais,
paradigmas arquiteturais ou de programação envolvidos,
classificação (MDD, MDA, MDE, DSL, DSML) e questões em
aberto.
[9] Morales, J.M. et al. 2015. TRiStar: An i* extension for
Teleo-Reactive systems requirements specifications. 30th
ACM/SIGAPP Symposium On Applied Computing (SAC
2015). (2015), 283–288.
[10] Petticrew, M. and Roberts, H. 2006. Systematic Reviews in
the Social Sciences: A Practical Guide.
[11] Pressman, R.S. 2011. Engenharia de Software. Bookman.
5.5 Resultados iniciais
[12] Romero, R.A.F. et al. 2014. Robótica Móvel. LTC.
As buscas automáticas retornaram o total de 2160 estudos,
exportados para o formato “bibtex” e importados na ferramenta
StArt para remoção de duplicados, totalizando em 761 registros
removidos, a mesma está sendo utilizada como mecanismo para
condução da seleção dos 1399 estudos restantes.
[13] Sánchez, P. et al. 2012. From Teleo-Reactive specifications
to architectural components: A model-driven approach.
Journal of Systems and Software. 85, 11 (Nov. 2012), 2504–
2518.
[14] Schlegel, C. et al. 2015. Model-Driven Software Systems
Engineering in Robotics: Covering the Complete Life-Cycle
of a Robot. it - Information Technology. 57, 2 (2015), 85–98.
6. CONSIDERAÇÕES FINAIS
O desenvolvimento de novos estudos envolvendo um domínio
exigem um embasamento por parte dos pesquisadores, assim a
Revisão Sistemática da Literatura foi a metodologia escolhida
pela sua capacidade de sintetizar estudos reduzindo a
possibilidade de viés e em apontar trabalhos futuros [8].
[15] Wohlin, C. 2014. Guidelines for Snowballing in Systematic
Literature Studies and a Replication in Software Engineering.
18th International Conference on Evaluation and Assessment
in Software Engineering (EASE 2014). (2014), 1–10.
[16] Zhang, H. and Babar, M.A. 2011. An Empirical Investigation
of Systematic Reviews in Software Engineering. 2011
International Symposium on Empirical Software Engineering
and Measurement. (2011), 87–96.
Os resultados esperados são importantes para o desenvolvimento
de estudos ligando o desenvolvimento orientado a modelos com a
robótica e robótica social, auxiliando nos aspectos de
desenvolvimento de software de robôs, bem como, provendo um
13
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Identificação Automática de Produtos e suas
Características em Grandes Volumes de Dados Não
Estruturados: Uma Proposta para Portais de
Transparência Pública
Alternative Title: Automatic Identification of product and its
Characteristics in Large Volumes of Unstructured Data: A
Proposal to Public Transparency Portals
Eduardo de Paiva
Kate Revoredo
Programa de Pós-graduação em Informática
Universidade Federal do Estado do Rio de Janeiro
Avenida Pasteur 458, Urca
Rio de Janeiro, RJ, Brasil
[email protected]
Programa de Pós-graduação em Informática
Universidade Federal do Estado do Rio de Janeiro
Avenida Pasteur 458, Urca
Rio de Janeiro, RJ, Brasil
[email protected]
RESUMO
Government
O governo brasileiro tem se empenhado em disponibilizar seus
dados para a população através de Portais de Transparência. No
entanto, nem sempre o formato apresentado é o mais apropriado.
Por exemplo, a descrição de compras em formato de texto
dificulta análises sistemáticas. Este trabalho apresenta uma
proposta de projeto de dissertação de mestrado que visa melhorar
a qualidade dessas informações. A intenção é desenvolver uma
técnica que permita a identificação automática dos produtos que
são descritos de forma textual nas especificações das compras
apresentadas nos portais de transparência.
General Terms
Management, Documentation, Performance.
Keywords
Public transparency, Big data, text mining.
1. INTRODUÇÃO
Com o desenvolvimento da Internet e das tecnologias digitais,
questões de transparência eletrônica, democracia digital, governo
aberto, ciberdemocracia e outros termos que associam a atuação
governamental às ferramentas apoiadas pelo uso de Tecnologia da
Informação vêm ganhando cada vez mais importância no cenário
político. As ferramentas digitais são importantes artifícios para
estimular a participação popular e consequentemente aumentar o
grau de democratização dos governos.
Palavras-Chave
Transparência pública, Big data, Mineração de texto.
ABSTRACT
Brazilian Government has been engaged to make available its data
to the population in transparency portals. However, the format is
not always the most appropriate. For example, the purchases
description in text format hampers systematics analysis. This
paper presents a dissertation project proposal that aims to improve
the information quality of these sites. The intention is to develop a
technique that allows automatic identification of products
textually described in the purchases specifications presented in the
transparency portals.
Acompanhando essa tendência, a área de transparência e de dados
abertos tem encontrado um terreno fértil para promover o
estimulo ao controle social dos gastos públicos.
Nesse contexto, o Brasil tem se empenhado para disponibilizar
seus dados, e duas leis podem ser consideradas como marcos no
seu processo de abertura de dados. A lei complementar 131 (lei da
transparência1) determina a disponibilização, em tempo real, de
informações pormenorizadas sobre a execução orçamentária e
financeira da União, dos Estados, e dos Municípios; e a lei 12.527
(lei de acesso à informação) permite que qualquer pessoa possa
solicitar qualquer informação produzida pelo governo, desde que
tal informação não esteja expressamente classificada como
sigilosa.
Categories and Subject Descriptors
I.2.7 [Computing Methodologies]: Natural Language Processing Text analysis
J.1 [Computer Applications]: Administrative Data Processing -
Aliada a essas novas leis, que passaram a implantar uma nova
cultura na Administração Pública, outras iniciativas foram
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee.
SBSI 2016, May 17–20, 2016, Florianópolis, Santa Catarina, Brazil.
Copyright SBC 2016.
1
14
A Lei Complementar 131/2009 - lei da Transparência - altera a
redação da Lei de Responsabilidade Fiscal (LRF) no que se
refere à transparência da gestão fiscal.
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
descrição da compra, é preciso identificar a unidade de medida
que está sendo utilizada para quantificá-lo.
adotadas para aumentar a disponibilidade dos dados
governamentais, como a criação da Infraestrutura Nacional de
Dados Abertos [1], que é a política do governo brasileiro para
dados abertos e tem como finalidade garantir e facilitar o acesso
pelos cidadãos, pela sociedade e em especial pelas diversas
instâncias do setor público aos dados e informações produzidas ou
custodiadas pelo Poder Executivo federal.
Aliado a essa diversidade de nomenclaturas e unidades de
medidas, soma-se o fato de muitas vezes aparecerem termos que
podem dificultar a classificação correta de uma determinada
compra. Por exemplo, “impressora para folha de papel A4” pode
ser erroneamente classificada como “folha de papel A4”.
Porém, essas iniciativas por si só não garantem um aumento
efetivo do grau de informação que a população tem das atividades
governamentais. Isso acontece porque a maioria dos dados
disponibilizados para a população não foram concebidos com esse
propósito. Tais informações são oriundas de sistemas
coorporativos cujo objetivo é propiciar o controle administrativo
das contas públicas e por isso nem sempre o seu formato é o mais
apropriado para a população entender o que realmente elas
representam.
Tabela 1. Diferentes formas de indicar um mesmo material
0000000001,00000 RESMA 500,00 FL PAPEL IMPRESSÃO, MATERIAL
CELULOSE VEGETAL, TIPO A4, GRAMATURA 75 G/M2, COMPRIMENTO
297 MM, APLICAÇÃO JATO TINTA, COR BRANCA, LARGURA 210 MM
MARCA: s/m
0000000400,00000 CAIXA 5.000,00 FL PAPEL A4, MATERIAL PAPEL
ALCALINO, COMPRIMENTO 297 MM, LARGURA 210 MM, APLICAÇÃO
IMPRESSORA JATO TINTA, GRAMATURA 75 G/M2 MARCA:
86,00000 CAIXA 10,00 RES PAPEL A4, MATERIAL PAPEL ALCALINO,
GRAMATURA 75 G/M2, COR BRANCA MARCA: chamex
Atualmente, ainda não existe uma solução para esse tipo de
problema. As principais iniciativas no sentido de melhorar a
qualidade das informações dos portais de transparência são
descritas em [9] e [10], porém esses trabalhos possuem enfoques
mais específicos, em que o principal objetivo é identificar qual é o
preço médio pago pela Administração em um conjunto prédeterminado de produtos.
10,00000 Milheiro PAPEL Papel oficio tam A4 MARCA: CHAMEX
85,00000 RM
PAPEL
Papel impressão, material celulose vegetal, tipo a4,
gramatura 75, comprimento297, aplicação jato tinta, cor branca, largura 210
MARCA: REPORT
4,00000 PACOTE PAPEL PAPEL, VERGE 120G A4 CREME PCT.C/50FLS.
MARCA: PFFICEPAPER
50,00000 cx PAPEL PAPEL BRILHANTE PARA IMPRESSORA JATO DE TINTA
GLOSSY PAPER A4 MEDINDO 210 X 297 MM CX COM 50
MARCA: OFF PAPER
O objetivo desse trabalho é desenvolver e implementar uma
técnica que permita a identificação de forma automatizada dos
produtos e suas características a partir das especificações textuais
dos gastos governamentais que são apresentadas nos diversos sites
de transparência pública.
O restante deste trabalho está organizado da seguinte forma: a
seção 2 apresenta o problema a ser tratado; a seção 3 descreve a
proposta de solução desse problema; enquanto que as seções 4 e 5
explicam a forma de avaliação da solução e os trabalhos já
realizados. Finalmente a seção 6 faz a conclusão do trabalho.
Resumindo, o problema descrito nessa seção refere-se à
dificuldade de identificação do que está sendo comprado, bem
como da unidade de medida utilizada para quantificar tais
produtos. Essas limitações inviabilizam comparações entre os
diversos atributos que compõem uma determina compra (tais
como: valor, fornecedor, comprador, unidade da federação, data e
etc.) com o produto que está sendo adquirido.
2. APRESENTAÇÃO DO PROBLEMA
3. PROPOSTA DE SOLUÇÃO
Diariamente, os diversos portais de transparência pública
disponibilizam centenas de milhares de registros. Só o Portal da
Transparência do Governo Federal [8] apresenta cerca de 46 mil
novos registros a cada dia.
Na solução do problema exposto, pretende-se utilizar técnicas de
mineração de texto para realizar a categorização das compras
apresentadas nos portais de transparência. Ou seja, cada compra
realizada pelo governo possuirá um identificador que especificará
de forma clara o que está sendo comprado. Logo, uma informação
que era textual e de difícil tratamento passará a apresentar as
características de um dado estruturado na forma de uma variável
qualitativa.
No entanto, essas informações não são todas estruturadas e fáceis
de serem tratadas. Algumas das informações mais relevantes na
identificação de uma determinada compra vêm descritas em
formato de texto, o que dificulta a comparação de compras de
produtos similares.
O processo de mineração de texto seguirá as fases descritas em
[4], e consistirá de Preparação dos dados, Análise de dados,
Processamento de dados e Pós-processamento de dados.
O fato dos produtos serem descritos por campos de texto livre faz
com que o mesmo tipo de produto seja designado de forma
diferente e muitas vezes com unidades de medidas distintas. Em
algumas situações, apesar de se utilizar a mesma unidade de
medida, essas são escritas de formas diferentes, o que as tornam
distintas para mecanismos de comparação automatizados. A tabela
1 ilustra essa situação através da apresentação de diferentes
formas de se designar um mesmo produto.
A fase de preparação será dividida em duas etapas. A primeira
fará a seleção dos gastos referentes a compras de materiais (visto
que, existem outros tipos de gastos que não dizem respeito à
compra de produtos, como por exemplo contratação de serviços e
pagamento de pessoal) e a extração de algumas informações úteis
ao processo de classificação subsequente, baseadas nas técnicas
enunciadas por [2] e [5]. Já a segunda etapa será composta pelas
atividades clássicas de pré-processamento que antecedem a
minerações de dados textuais.
Na tabela, pode-se verificar que além das diferentes maneiras de
se designar o mesmo produto (no caso folha de papel A4), esse
produto pode ser quantificado de várias formas distintas (RESMA
500,00 FL, CAIXA 5.000,00 FL, CAIXA 10,00 RES, Milheiro,
RM, Cx, PACOTE), o que torna o problema mais complexo, pois
além da qualificação do produto que está sendo especificado na
A pesquisa não considerará os contratos de prestação de serviços
pelo fato desses apresentarem grande variabilidade de
características que fazem com que cada contratação seja única.
15
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Nas fases de análise e processamento de dados, os diversos
algoritmos de mineração e possíveis variações serão testados a fim
de se obter a configuração que melhor se comporte com o
conjunto de dados do problema que está sendo tratado.
Outro trabalho também já desenvolvido foi [7]. O artigo em
questão propõe uma arquitetura para a integração dos dados do
Portal da Transparência do Governo Federal e serve como suporte
para a utilização de informações oriundas de diferentes fontes
para auxiliar na identificação dos produtos.
A parte do pós-processamento será responsável pela agregação
dos resultados obtidos, para que estes possam ser apresentados em
formatos visualmente atrativos.
6. CONCLUSÃO
O projeto de pesquisa em questão pretende desenvolver uma
técnica de identificação automática de produtos a partir das
descrições textuais das compras governamentais que são
apresentadas nos portais de transparência pública.
4. PROJETO DE AVALIAÇÃO
A avalição será feita através da aplicação da técnica desenvolvida
em um conjunto de dados do Portal da Transparência do Governo
Federal (www.transparencia.gov.br). Nessa fase, será utilizada
uma amostra de especificações textuais de gastos apresentados no
Portal da Transparência do Governo Federal, com as respectivas
identificações dos produtos e suas características, feitas de forma
manual.
O resultado desse trabalho trará contribuições científicas e
tecnológicas. Quanto a parte científica, pretende-se agregar ao
corpo de conhecimento uma nova técnica que permita a extração
de informações relevantes a partir de grandes volumes de dados
estruturados e não estruturados.
A solução proposta será empregada no conjunto de dados préselecionados, a fim de se obter o produto, bem como as suas
respectivas características em cada uma das descrições textuais da
amostra utilizada para a avaliação.
Já com relação à contribuição tecnológica, o objetivo é que a
solução proposta seja incorporada à infraestrutura de atualização
do Portal da Transparência do Governo federal, permitindo uma
qualificação em tempo real das compras feitas pelo Governo. Tal
procedimento incrementará a transparência governamental,
trazendo assim benefícios para a democracia e para a sociedade
como um todo.
O resultado obtido pela aplicação da técnica desenvolvida será
comparado com a identificação dos produtos e suas características
(feitas de forma manual), a fim de se verificar a qualidade dos
resultados obtidos pela aplicação da técnica automatizada.
7. REFERÊNCIAS
A avaliação utilizará uma abordagem empírica e empregará
técnicas quantitativas e qualitativas. As técnicas quantitativas
serão aplicadas para a verificação da precisão e da acurácia dos
resultados obtidos no processo proposto. Já as técnicas
qualitativas terão o objetivo de avaliar em que situações a solução
proposta se comporta bem e em que situações ela não apresenta
bons resultados, visto que o conjunto de dados a ser tratado é
muito heterogêneo, fazendo com que a identificação seja mais
fácil em algumas situações e com maiores graus de dificuldade em
outras.
[1] Batista, A.H., Silva, N.B. da and Miranda, C.M.C. 2013.
Infraestrutura nacional de dados abertos. (2013).
[2] Etzioni, O., Cafarella, M., Downey, D., Popescu, A.-M.,
Shaked, T., Soderland, S., Weld, D.S. and Yates, A. 2005.
Unsupervised named-entity extraction from the web: An
experimental study. Artificial intelligence. 165, 1 (2005).
[3] Han, J., Kamber, M. and Pei, J. 2011. Data mining: concepts
and techniques. Elsevier.
[4] Lopes, M.C.S. 2004. Mineração de dados textuais utilizando
técnicas de Clustering para o idioma português. 2004. Tese
(Doutorado em Engenharia Civil)-Faculdade de Engenharia
Civil, Univer-sidade Federal do Rio de Janeiro, (2004).
A abordagem de avaliação também irá combinar características
descritivas e explanatórias. A parte descritiva refere-se a análise
quantitativa dos dados e será responsável pela verificação da
acurácia e precisão da solução. Já a parte explanatória terá o
objetivo de justificar as situações em que a abordagem proposta
obteve bons resultados e as situações em que ela não obteve
resultados satisfatórios (identificadas com o emprego das técnicas
qualitativas).
[5] Munková, D., Munk, M. and Vozár, M. 2013. Data preprocessing evaluation for text mining: Transaction/sequence
model. Procedia Computer Science. 18, (2013), 1198–1207.
[6] Paiva, E. and Revoredo, K. 2016. Big Data e Transparência:
Utilizando Funções de Mapreduce para incrementar a
transparência dos Gastos Públicos. (SBSI 2016). Aceito para
publicação.
5. ATIVIDADES REALIZADAS
Já foram feitos alguns experimentos com a base de dados em
questão. Primeiramente, utilizou-se uma pequena amostra a fim de
se avaliar o comportamento de alguns algoritmos de classificação
e de clusterização descritos em [3]. No entanto, devido à grande
quantidade de diferentes produtos (classes) que podem aparecer
nos dados do portal, os resultados não foram satisfatórios.
[7] Paiva, E., Revoredo, K. and Baião, F. 2016. DW-CGU:
Integração dos Dados do Portal da Transparência do
Governo Federal. (submetido à revista Isys, Revista
Brasileira de Sistemas de Informação).
[8] Portal da Transparência nos Recursos Públicos Federais:
2004. http://transparencia.gov.br/. Acessado: 12/04/2016.
Paralelamente, também foi testado a aplicação de técnicas de
processamento de grandes volumes de dados textuais utilizandose a base de dados do Portal da Transparência do Governo
Federal, relativa ao período de um ano, para a identificação das
compras realizadas, obtendo-se resultados promissores [6]. O
intuito desse experimento foi testar a viabilidade da solução a ser
empregada para grandes volumes de dados, pois de nada
adiantaria o desenvolvimento da técnica sem a possibilidade de
emprego no conjunto de dados que se pretende utilizar.
[9] Rommel Carvalho, Eduardo de Paiva, Henrique da Rocha
and Gilson Mendes 2014. Using Clustering and Text Mining
to Create a Reference Price Database. Learning and
NonLinear Models. 12, (2014), 38–52.
[10] Rommel, Carvalho, de Paiva, E., da Rocha, H. and Mendes,
G. 2013. Methodology for Creating the Brazilian
Government Reference Price Database. (2013).
16
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Jogos Digitais Para Participação Cidadã em Processos de
Prestação de Serviços Públicos
Alternative Title: Digital Games For Citizen Participation in Public
Service Delivery Processes
Tadeu M. de Classe
Renata Araujo
Núcleo de Pesquisa e Inovação em
Ciberdemocracia
Programa de Pós-Graduação em
Informática Universidade Federal do
Estado do Rio de Janeiro (UNIRIO)
Rio de Janeiro – Brasil
[email protected]
Núcleo de Pesquisa e Inovação em
Ciberdemocracia
Programa de Pós-Graduação em
Informática Universidade Federal do
Estado do Rio de Janeiro (UNIRIO)
Rio de Janeiro – Brasil
[email protected]
possible mechanisms to support the participation of citizens and
improve the delivery of services by organizations. However, to
create digital games for citizen participation in public service
delivery isn't an easy issue. There is the need to create a digital
game engineering process, which can contribute with the creation
and evaluation of these games, in order to verify improvements in
citizen participation in public services.
RESUMO
Atualmente em um ambiente cada vez mais conectado as
organizações (públicas ou não) buscam uma maior interação com
seus clientes através do uso de TICs. As tecnologias sociais
aplicadas a sistemas de gerenciamento de processos de negócios
podem apoiar inovações e melhorias de processos organizacionais
por meio de iniciativas dos próprios usuários. Várias são as
propostas de iniciativas voltadas à participação eletrônica,
entretanto, seu uso não acontece de maneira efetiva. Devido ao
caráter motivacional existente em jogos, os mesmos são vistos
como possíveis mecanismos para apoiar a participação dos
cidadãos e melhorar a entrega de serviços pelas organizações.
Porém, construir jogos digitais para a participação cidadã em
processos de prestação de serviços públicos, não é uma tarefa
trivial. Existe a necessidade de conceber processos de engenharia
de jogos digitais que possam contribuir na elaboração e avaliação
destes jogos, visando melhorias na participação dos cidadãos em
processos públicos.
Categories and Subject Descriptors
K.8.0 [General]: Games.
General Terms
Management, Human Factors, Design.
Keywords
Social BPM, e-Participation, Public Service Delivery, Serious
Game, Digital Games Engineering.
Palavras-Chave
1. INTRODUÇÃO
Social BPM, Participação Eletrônica, Prestação de Serviços
Públicos, Jogos Sérios, Engenharia de Jogos Digitais.
Hoje, em um ambiente cada vez mais conectado, mudanças na
forma de criar e disseminar conhecimento acontecem de maneira
muito rápida uma vez que Tecnologias de Informação e
Comunicação (TICs) aliadas as mídias sociais influenciam
diretamente no relacionamento das pessoas [1]. Neste sentido,
oportunidades para que as organizações inovem em seus
processos e que seus clientes possam adquirir autonomia e
satisfação junto aos serviços prestados pelas instituições são
muitas [2].
ABSTRACT
Today with an increasing connected environment, the institutions
(publics or not) are looking for a higher interaction with their
clients through the use of ICTs. Once social technologies used
with business process management systems can provide support to
innovation and improvement of organizations process, as of own
users. There are many proposals of initiatives about electronic
participation, however its use do not happen effectively. Due to
the existing motivational character in games, they are seen as
Estas oportunidades emergentes não passam despercebidas
pelas instituições, onde a interação com seus clientes é sempre um
alvo a ser perseguido [6]. Tratando-se dos processos
organizacionais (instituições sendo públicas ou não), as
tecnologias sociais vêm sendo vistas como possibilidade de serem
empregadas junto a sistemas de gerenciamento de negócios
(Social BPM) na tentativa de fazer com que os indivíduos que
necessitam destes processos consigam entender, aprender e
contribuir na sua concepção e melhorias [3]. Entretanto este
cenário de colaboração entre sociedade civil e instituições
públicas não é o que acontece na prática, pois devido as questões
históricas e culturais existe um afastamento entre estes dois atores
[5].
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee.
SBSI 2016, May 17–20, 2016, Florianópolis, Santa Catarina, Brazil.
Copyright SBC 2016.
17
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
A literatura sugere várias pesquisas e iniciativas que foram
desenvolvidas para encorajar a participação democrática do
cidadão nos processos públicos [7][8]. A aplicação de técnicas de
Gamificação (uso de mecânicas e elementos de jogos em
contextos não jogáveis [9]) e a utilização de jogos sérios (uso de
jogos em contextos sérios [16]) são apontadas como possíveis
abordagens para a aproximação, motivação e engajamento do
cidadão nas propostas governamentais [10].
Process Management (BPM) para a melhoria e eficiência de seus
processos [18]. Abordagens sociais e participativas voltadas ao
gerenciamento de processos de negócios (Social BPM) [19] vêm
sendo sugeridas como estratégias organizacionais para flexibilizar
a interação com seus clientes na execução de seus processos [13].
Pflanz e Vossen [2] em suas pesquisas destacam que existem
desafios a serem solucionados para a Social BPM dentre eles está
a compreensão dos processos por leigos e o envolvimento dos
usuários com os processos. Os desafios da Social BPM se tornam
maiores ao considerar os cidadãos como usuários, pois entre cada
um deles existem individualidades que remetem a cultura e
contexto, além da complexidade de cada serviço a ser abordado
[13].
Neste sentido, este trabalho visa abordar os jogos sérios como
fator motivacional para a participação e compreensão de
processos de prestação de serviços públicos pelo cidadão. Mais
precisamente, este trabalho visa o desenvolvimento um processo
de engenharia de jogos digitais que possam evidenciar o benefício
da utilização de jogos neste contexto. Segundo os estudos de
Hamari e colaboradores [10] os jogos possuem grande potencial
para tarefas motivacionais, possibilitando o aprendizado e
engajamento das pessoas.
Embora existam iniciativas voltadas à participação e engajamento
dos cidadãos (Participa.br1, Dialoga Brasil2, Plataforma Brasil3,
Visão Rio 5004 e Desafio Ágora Rio5), nem sempre elas ocorrem
de maneira desejada [1][20]. Neste sentido, Freire e Stabile [21]
desenvolveram uma pesquisa sobre o uso de plataformas sociais
com cerca de 200 participantes. Como resultados eles observaram
que 31,7% dos usuários nem sequer acessaram o portal para
alguma discussão, ou seja, não participaram ativamente da
plataforma.
2. APRESENTAÇÃO DO PROBLEMA
Democracia eletrônica pode ser entendida como o conjunto de
discussões, teorias e tecnologias (TICs) utilizadas para a mediação
entre instituições públicas e sociedade civil [29]. As TICs podem
ser utilizadas para prestação de serviços, transparência de
informações e a participação dos cidadãos [4], contribuindo para a
melhoria dos processos públicos, uma vez que estes processos
deveriam ser pensados para os cidadãos. Desta maneira, os
cidadãos poderiam debater os serviços prestados, propondo
melhorias, avaliando e acompanhando as políticas públicas [11].
Tal aumento da participação popular gera um “empoderamento”
dos cidadãos, onde os próprios podem influenciar nos processos
públicos e políticas governamentais [12].
Sendo assim, com os dados apresentados, percebe-se que existe
um problema na participação e engajamento do cidadão que
necessita ser analisado, tanto no quesito da instituição não
considerar o mesmo como possível parceiro útil para a melhoria
de seus processos, quanto pelo lado do cidadão que não se sente
motivado a participar dos processos organizacionais.
O uso de jogos (jogos sérios) ou de elementos de jogos
(gamificação) é apontado como possível mecanismo que auxilia
na tentativa de melhorar a participação cidadã [15], atraindo-os
para a resolução de problemas e motivando-os a serem mais
participativos através de atividades lúdicas. Neste sentido,
encontramos o problema de como desenvolver tais jogos no
contexto brasileiro considerando a participação e os processos
organizacionais públicos?
O governo federal brasileiro, diversas representações estaduais e
municipais, e diversas instituições públicas nos últimos anos têm
tentado realizar melhorias significativas na prestação de serviços
públicos com o ideal de aproximação com a sociedade. O Decreto
8423/2014 [14] da Presidência da República foi declarado a fim
de instituir a Política Nacional de Participação Social (PNPS), no
intuito de fortalecer o diálogo entre administração pública e
sociedade civil. Entretanto, a participação social em assuntos
governamentais ainda é uma pauta desafiadora [1]. As
organizações julgam que os cidadãos são inaptos para contribuir
com os seus processos, enquanto os cidadãos concordam que tais
processos
são
demasiados
burocráticos,
complexos,
desinteressantes e nada motivadores [6].
3. PROPOSTA DE SOLUÇÂO
Baseando-se na pesquisa de Hamari e colaboradores [10] em que
os jogos são estudados como mecanismos potenciais para a
motivação dos usuários, conseguindo engajá-los em tarefas
diversas e promover o aprendizado e a conscientização, é pensada
tal proposta de solução.
Jogos são sistemas baseados em regras cujo propósito é envolver
as pessoas na solução de conflitos [22]. Apesar do propósito
básico de entretenimento, são utilizados com propósitos diversos,
como: educação, política, treinamento, conscientização,
propaganda etc. [23][24]. Esta classe de jogos recebe o nome de
jogos sérios (serious games) [16], ou seja, jogos que foram
desenvolvidos com propósitos e objetivos sérios.
Em se tratando de instituições públicas, existe a cobrança
prestação de serviços através do fornecimento de informações online sobre os serviços prestados, com o intuito de aproximar o
cidadão da instituição. Os dados do último relatório sobre o uso
de TICs no setor público brasileiro realizado pelo CGI.BR [17]
mostram que apenas 66% dos portais governamentais prestam
serviços pelos seus sites, e que dos serviços oferecidos, 69% são
documentos on-line e formulários, 43% são formulários
eletrônicos, 37% são geração de taxas bancárias, 29% são
consultas de andamentos processuais, 22% de requisição de
documentação oficial, dentre outras. Tais dados mostram o pouco
ou nenhum envolvimento do cidadão com as organizações
públicas.
A literatura comumente sugere etapas para o desenvolvimento de
jogos [25], as quais compreendem basicamente: Concepção:
objetivo de concepção do jogo levando em consideração os
1
Participa.br: http://www.participa.br/
Brasil: http://dialoga.gov.br/
3
Plataforma Brasil: https://plataformabrasil.org.br/
4 Visão Rio 500: http://www.visaorio500.rio/
5 Desafio Ágora Rio: https://desafioagorario.crowdicity.com/
2Dialoga
Como já mencionado, as organizações públicas possuem os mais
variados processos para a prestação e entrega de serviços para a
comunidade. Apesar disso, poucas fazem o uso de Business
18
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
principais aspectos do framework MDA [26], ou seja, suas
Mecânicas (ações do usuário relacionado às regras do jogo),
Dinâmicas (representa os temas, a ambientação e a narrativa do
jogo) e Asthetics - estética - (representam as respostas emocionais
do jogador ao jogar); Pré-produção: consiste na elaboração de
prototipação do jogo; Produção: consiste no desenvolvimento do
jogo na tecnologia selecionada; e Avaliação: consiste na
avaliação da qualidade do produto e público alvo.
necessários a averiguação e criação de métricas de qualidade para
a proposta. Tais métricas podem ser colhidas através da
observação direta do uso dos protótipos pelos seus jogadores, e
além disso, os mesmos podem participar de pesquisas qualitativas
que visem julgar se o comportamento pensado na concepção do
jogo realmente é compatível com o sentimento psicológico gerado
pelo jogo.
5. ATIVIDADES REALIZADAS
A proposta de solução nesta pesquisa é a possibilidade de
desenvolvimento de um processo de engenharia de jogos digitais
voltados para a participação cidadã em processos de prestação de
serviços públicos. Este processo de engenharia de jogos engloba a
criação de modelos teóricos para a conceitualização de mecânicas,
dinâmicas e estéticas (framework MDA [26]); a prototipação de
jogos digitais; e métricas de qualidade visando averiguar o
impacto dos jogos desenvolvidos sobre os cidadãos.
Considerando a metodologia de pesquisa aqui apresentada,
atividades como aquisição de conhecimento e realização de
mapeamento sistemático da literatura envolvendo temas como
BPM, participação eletrônica e gamificação já foram realizadas
[15], foram encontrando trabalhos que utilizando jogos ou
gamificação em diversos contextos, porém, não utilizando junto
de propostas de organizações públicas. Até o desenvolvimento
desta proposta, a pesquisa encontra-se na fase de obtenção de
conhecimento e apropriação de conceitos sobre o
desenvolvimento de jogos digitais e participação eletrônica dos
cidadãos.
A metodologia de pesquisa será baseada nas premissas do Design
Science Research (DSR) [27], na qual se baseia na criação ou
desenvolvimento de artefatos orientados à resolução de
problemas. No DSR os artefatos são projetados com bases em
conjecturas teóricas e a avaliação de tais artefatos fornece dados
sobre as conjecturas contribuindo com o aumento do
conhecimento científico e tecnológico [28].
Como parte do entendimento sobre os conceitos de jogos e seus
elementos, e explorar o uso da DSR, foi realizado trabalho
envolvendo gamificação de um portal de participação eletrônica
na UNIRIO6. Neste trabalho, foi aplicado um experimento onde o
objetivo era verificar indícios de que a gamificação pode ser um
fator motivador para os cidadãos. Lições como, por exemplo, que
elementos de jogos geraram maior participação; quais fatores
desmotivaram os usuários a utilizá-la; o uso de motivações
intrínseca e extrínseca podem, ao mesmo tempo motivar uns e
desmotivadoras outros, foram obtidos [30].
Sendo assim, a metodologia a ser seguida é: i) entender o estado
da arte (revisão da literatura); ii) identificação de processos
existentes (identificar processos de desenvolvimento jogos digitais
existentes); iii) propostas de artefatos para a solução do problema
(propor processo que possa ser aplicado na construção de jogos
digitais para a prestação de serviços voltados para a participação
do cidadão); iv) projeto do artefato (projetar e entender o processo
pensado); v) desenvolver o artefato (desenvolvimento do
processo); vi) avaliação do artefato (desenvolvimento de
protótipos e averiguação de qualidade sob o processo de
engenharia de jogos desenvolvido); vii) explicitação da
aprendizagem (formalização e explicitação da aprendizagem);
viii) conclusões (formalização dos resultados e decisões tomadas);
ix) generalização (generalizar o processo para outras instituições a
fim de averiguar se o mesmo é viável para outros contextos); x)
comunicação (ao longo de todo o processo, divulgação dos
resultados obtidos).
6. CONCLUSÃO
A proposta deste trabalho visa desenvolver um processo para o
desenvolvimento de jogos digitais para a participação do cidadão
em processos de prestação de serviços públicos. Com este
processo se espera seja possível desenvolver protótipos de jogos
digitais e avaliá-los por meio de métricas se houve impactos
positivos na participação do cidadão.
Para tal é sugerida uma abordagem baseada nas premissas do
Design Science Research onde, será pensado um artefato
(modelos de desenvolvimento de jogos) a fim de contribuir com
conhecimento para a resolução do problema de participação
cidadã em processos públicos (utilização dos jogos digitais).
4. AVALIAÇÃO DA SOLUÇÃO
Com o intuito de avaliar a solução proposta, é sugerido que um
estudo qualitativo com o público alvo (cidadãos) seja realizado a
fim de averiguar qual seria o comportamento e sentimento
desejado ao se executar um serviço provido por uma instituição
pública.
Com este trabalho é esperado que as seguintes contribuições
sejam alcançadas: i) para a área de desenvolvimento de jogos
digitais, modelos, ferramentas de desenvolvimento e métricas que
sejam úteis para a construção, elaboração e qualidade no
desenvolvimento de jogos digitais para contextos de participação
social; ii) para a área de Social BPM, espera-se contribuir com
conhecimentos relacionados aos desafios de participação dos
usuários na interação com as organizações, uma vez que as regras
de processos das instituições públicas devem ser traduzidas para
as regras do jogo, ou seja, simplificadas; iii) nas área de
participação eletrônica, espera-se contribuir com métodos,
tecnologias de interação social e jogos que possam ser utilizadas
para aproximação entre instituição pública e cidadão.
De posse destes dados é esperado que o processo de engenharia
de jogos digitais voltados para a participação cidadão para o
processo de prestação de serviços públicos possa ser
desenvolvido. De posse de tal processo será necessário a
aplicação de um novo estudo de caso para o desenvolvimento de
protótipos de jogos digitais. Assim, por meio dos dados colhidos
com a aplicação dos protótipos, será possível obter indicativos
iniciais de sua utilidade, permitindo avaliar o processo e realizar
melhorias.
Após isso, é pensado em aplicar os protótipos em um público alvo
dentro de um contexto específico a fim de averiguar se o MDA
empregado no protótipo cumpre realmente o esperado previsto no
processo de engenharia do jogo. Neste momento, se tornam
6
19
https://sourceforge.net/projects/ouvidoria-social/
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Simpósio Brasileiro de Sistemas Colaborativos (SBSC), p.
130-137.
REFERÊNCIAS
[1] Effing, R., Hillegersberg, J. Van and Huibers, T. 2011.
Social Media and Political Participation: Are Facebook,
Twitter and YouTube Democratizing Our Political
Systems?.ePart 2011. April 2011 (2011), 25–35.
[16] Abt, C.C. 1970. Serious Games. Viking Press, New York,
NY, 1st ed.
[17] CGI.BR. 2013. ICT Electronic Government 2013: Survey on
the Use of Information and Communication Technologies in
the Brazilian Public Sector, Comitê Gestor de Internet no
Brasil, available
at:http://www.cgi.br/media/docs/publicacoes/2/TIC_eGOV_
2013_LIVRO_ELETRONICO.pdf (accessed 2016-03-18).
[2] Pflanzl, N. and Vossen, G. 2014. Challenges of Social
Business Process Management. 2014 47th Hawaii
International Conference on System Sciences. (2014), 3868–
3877.
[3] Araujo, R.M. De and Magdaleno, A.M. 2015. Social BPM:
Processos de Negócio , Colaboração e Tecnologia Social.
Simpósio Brasileiro de Sistemas de Informação (SBSI). 4,
(2015).
[18] Gespública. 2016. Modelo de Excelência em Gestão Pública.
Disponível em:
https://conteudo.gespublica.gov.br/pagina.2014-0606.9098653097. Acesso em: 11 de abr de 2016.
[4] Araujo, R., Cappelli, C., Diirr, B., Engiel, P., Tavares, R.
2011. Democracia Eletrônica. In Pimentel, M., Fuks, H.
Sistemas Colaborativos. Elsevier Brasil, 2011, 110-121.
[19] Richardson, C. 2011. Social BPM: Work, Planning and
Collaboration Under the Impact of Social Technology,
(Fisher, L.,Ed.). Future Strategies Inc., Lighthouse Point,
FL, 1st ed.
[5] Magdaleno, A.M. andAraujo, R.M. De 2015. Ecossistemas
Digitais para o Apoio a Sistemas de Governo Abertos e
Colaborativos. SimpósioBrasileiro de Sistemas de
Informação (SBSI). 1, (2015).
[20] Nielsen, J. 2006. Participation inequality: Encouraging more
users to contribute. Jakob Nielsen’s alertbox, 9, 2006.
[6] Santos, A.C.; Zambalde, A.L.; Veronese, R.B.; Botelho,
G.A.; Souza Bermejo, P.H. 2015. “Open Innovation and
Social Participation: A Case Study in Public Security in
Brazil.Electronic Government and the Information Systems
Perspective, p. 163-173.
[21] Freire, F. R., Stabile, M. 2013. As novas Tecnologias e a
Participação Eletrônica: entre Promessas e Desafios. Comitê
Gestor da Internet no Brasil, p. 47-56. Disponível em:
<http://www.cgi.br >. Acesso em: 01 de dez. 2015.
[7] ITS. 2015. Civviki - a Wiki Cívica.
http://itsrio.org/civviki/index.php. Accessed: 2016-03-18.
[22] Salen, K. and Zimmerman, E. 2003. Rules of Play - Game
Design Fundamentals. The MIT Press, Cambridge, MA, 1st
ed. Scherer, S. and Wimmer, M
[8] Araujo, R.M.; Taher, Y.; Heuvel, W.V.D.; Cappelli, C. 2013.
Evolving Government-Citizen Ties in Public Service Design
and Delivery. IFIP EGOV Conference, p. 19-26.
[23] Michael, D. and Chen, S. 2005. Serious Games - Games that
Educate, Train, and Inform. Thomson Course Technology
PTR, Boston, MA, 1st ed.
[9] Deterding, S., Dixon, D., Khaled, R. and Nacke, L. 2011.
From game design elements to gamefulness. Proceedings of
the 15th International Academic MindTrek Conference on
Envisioning Future Media Environments - MindTrek ’11.
(2011), 9–11.
[24] Thiel, S. 2015. Gamified participation: investigating the
influence of game elements in civic engagement tools.
Proceedings of the 2015 ACM International Joint
Conference on Pervasive and Ubiquitous Computing, p. 527532.
[10] Hamari, J., Koivisto, J. andSarsa, H. 2014. Does
gamification work? - A literature review of empirical studies
on gamification. Proceedings of the Annual Hawaii
International Conference on System Sciences. (2014), 3025–
3034.
[25] Mastrocola, V.M. 2012,Ludificador – Um guia de
referências para o game designer brasileiro. São Paulo.
Edição do Autor.
[26] Hunicke, R., Leblanc, M., Zubek, R. 2004. MDA: a formal
approach to game design and game research. In: Proceedings
of the AAAI Workshop on Challenges in Game AI, v.4.
[11] Santos, J. U. D. L., Corso, K. B., Behr, A., Farias, E. S.
2015. CIDADÃOS EM REDE: o gabinete digital do Estado
do Rio Grande do Sul como instrumento de democracia
digital. Revista Democracia Digital e Governo Eletrônico, v.
1(12), p. 150-182.
[27] Dresch, A., Lacreada, D. P., Atunes Júnior, J. A. 2015.
Design Science research: método de pesquisa para avanço
da ciência e tecnologia, Porto Alegre: Bookman.
[12] Sæbø, Ø., Rose, J. and Skiftenes Flak, L. 2008. The shape of
eParticipation: Characterizing an emerging research area.
Government Information Quarterly. 25, 3 (2008), 400–428.
[28] Rocha, E. B., Pimentel, M., Diniz, M. C., Santoro, F. M.
2015. Design Science Research para o Desenvolvimento de
um Modelo da Participação em Bate-papo. iSys-Revista
Brasileira de Sistemas de Informação, v. 8(1), p. 18-41
[13] Araujo, R., Taher, Y. 2014. Refining IT Requirements for
Government-Citizen Co-participation Support in Public
Service Design and Delivery. Conference for E-Democracy
and Open Governemen, v.61.
[29] Silva, S. P. 2005. Graus de Participação Democrática no Uso
da Internet Pelos Governos das Capitais Brasileiras. Opinião
Pública, 11(2), p. 450-468.
[14] Brasil, Decreto nº 8243, de 23 De Maio De 2014.
http://www.planalto.gov.br/ccivil_03/_Ato20112014/2014/Decreto/D8243.htm. Accessed: 2015-03-18.
[30] Classe, T.; Silva, J.; Pimentel, M.; Araujo, R. 2016. Uma
Experiência de uso da Gamificação em Plataformas de
Participação Social. iSys Revista Brasileira de Sistemas de
Informação - Edição Especial Governo Eletrônico.
[15] Classe, T., Araujo, R. .2015. Gamificação Para Participação
Social Em Processos Públicos: Mapeamento Sistemático.
20
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Um Método de Elicitação de Requisitos para Ambientes
Virtuais de Participação Social
Alternative Title: A Elicitation Method Requirements for Virtual
Environments Social Participation
Jonas Silva
Renata Araujo
Programa de Pós-Graduação em Informática (PPGI)
Sistemas de Informação de Governo Abertos e
Colaborativos (SIGAC)
Núcleo de Pesquisa e Inovação em
Ciberdemocracia (CIBERDEM) – UNIRIO – Rio de
Janeiro – RJ – Brasil
Programa de Pós-Graduação em Informática (PPGI)
Sistemas de Informação de Governo Abertos e
Colaborativos (SIGAC)
Núcleo de Pesquisa e Inovação em
Ciberdemocracia (CIBERDEM) – UNIRIO – Rio de
Janeiro – RJ – Brasil
[email protected]
[email protected]
(TICs) tem gerando transformações significas na sociedade, as
pessoas estão dedicando cada vez mais tempo do dia para
interagir no ciberespaço, o que ocasiona mudanças em diversos
hábitos sociais, entre estes, na forma com que as pessoas se
comunicam, exercem suas atividades profissionais, demandam
serviços públicos, tem acesso à informação e ao conhecimento.
RESUMO
A participação cidadã no contexto de políticas públicas e
serviços públicos está sendo cada vez mais estimulada pela
sociedade e por iniciativas governamentais nacional e
internacionais, principalmente com o uso de tecnologias da
informação e comunicação, o que pode gerar uma demanda
crescente por desenvolvimento de ambientes virtuais de
participação social (AVPs). Nesta pesquisa é proposto um
método baseado em Design Thinking para elicitação e
documentação de requisitos para AVPs com o objetivo de
contribuir para o aumento do impacto social positivo destes
ambientes virtuais.
Os governos também são alcançados por essas transformações
sociais e estão buscando alternativas para evoluir a gestão
pública, como a Parceria para Governo Aberto ou OGP (Open
Government Partnership), iniciativa internacional fundada por
oito países, entre eles o Brasil, lançada em 2011. Esta possui o
objetivo de difundir e incentivar globalmente práticas
governamentais relacionados à transparência dos governos,
acesso à informação pública e à participação social [2].
Palavras-chave
Participação eletrônica, engenharia de requisitos, Design
Thinking, ambientes virtuais de participação social.
Conforme a OGP, a participação cidadã ou participação social se
refere à mobilização da sociedade para debater, colaborar e
propor soluções que contribuam para tornar o governo mais
efetivo e responsivo, implicando na elaboração de políticas
públicas mais adequadas ao seu contexto de atuação, na
melhoria de serviços públicos, em maior economicidade na
aplicação de recursos, entre outros desdobramentos.
ABSTRACT
The citizen participation in the context of public policies and
public services is being increasingly encouraged by the society
and national and international governmental initiatives,
particularly with the use of information and communication
technologies, which can lead to an increasing demand for
development of virtual environments social participation
(AVPs). In this research is proposed a method based on Design
Thinking for elicitation and documentation requirements for
AVPs in order to contribute to increasing the positive social
impact of these virtual environments.
Diversas experiências de participação cidadã com o uso de
tecnologias estão sendo experimentadas, também denominada
participação eletrônica (e-participação), que é definida como a
interação mediada por TICs entre a sociedade civil e o ciclo de
políticas públicas, serviços públicos e o processo político
formal, possuindo como principal objetivo o aumento da
capacidade de participação (empoderamento) dos cidadãos
nestes espaços [10][14].
Categories and Subject Descriptors
H.4.0 [Information Systems Applications]: General.
Keywords
Os sistemas de informação disponibilizados, principalmente, na
Web e para dispositivos móveis, que viabilizam a participação
cidadã, conforme a Política Nacional de Participação Social
(PNPS), são denominados ambientes virtuais de participação
social (AVPs) [3].
Electronic participation, requirements engineering, design
thinking, virtual environments for social participation.
2. APRESENTAÇÃO DO PROBLEMA
General Terms
Management, Requirements, Design, Human Factors.
A pesquisa TIC - Governo Eletrônico 2013, referente ao uso das
TICs no setor público, indica que a adoção de mecanismos de eparticipação ainda não alcançou todo o seu potencial no governo
brasileiro, pois o percentual de órgãos federais, estaduais e
municipais que possuem mecanismos de participação ainda não
é expressivo, conforme exposto na Figura 1 [6].
1. INTRODUÇÃO
O uso intensivo de tecnologias da informação e comunicação
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee.
SBSI 2016, May 17–20, 2016, Florianópolis, Santa Catarina, Brazil.
Copyright SBC 2016.
21
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
As instituições integrantes da administração pública estão sendo
constantemente incentivadas a apoiar e fortalecer a participação
social, a PNPS e a Política de Governança Digital (PGD) no
âmbito do governo federal são algumas evidências da relevância
deste tema na gestão pública.
elicitação e documentação de requisitos em projetos de AVPs e
com isso contribuir para o desenvolvimento de soluções mais
criativas, que promovam o aumento da participação e do
engajamento dos cidadãos nestes espaços, gerando maior
impacto social positivo na sociedade.
A PNPS, publicada em 2014, tem objetivo de fortalecer e
articular o diálogo entre a administração pública federal e a
sociedade, nesta são definidos objetivas e diretrizes referentes à
participação social; a PGD, publicada em 2016, apresenta entre
os seus princípios a inovação, participação e controle social,
considerando estes essenciais na formulação, na implementação,
no monitoramento e na avaliação das políticas públicas e dos
serviços públicos disponibilizados em meio digital [4].
O método será proposto a partir da investigação de atividades, a
serem incluídas nas etapas de elicitação e documentação de
requisitos de AVPs, que podem contribuir para que os critérios
supracitados sejam alcançados. Esta investigação será realizada
através da observação direta de cenários reais de projetos de eparticipação, entrevistas semiestruturadas com os seus
stakeholders e a condução de um estudo de caso no contexto de
desenvolvimento de um ambiente virtual de participação social
em uma universidade pública do governo federal.
O framework proposto por Araujo e Taher [1] para especificação
de requisitos em projetos de e-participação, que associa os níveis
de participação, aspectos sociotécnicos e de suporte
(colaboração, transparência e memória) referentes às tecnologias
que irão suportar tais projetos, também será o referencial teórico
para a proposição do método, assim como outros métodos que já
forma propostos em estudos científicos.
O Design Thinking fornece uma metodologia para extrair as
necessidades dos clientes, em vez de requisitos, incentivando a
rápida construção de protótipos simples, que podem resultar em
soluções inovadoras [15], este possui três fases: Imersão,
Ideação e Prototipação. Na imersão é realizado o levantamento,
análise e síntese dos dados referentes à solução inovadora a ser
construída, na ideação é definido o perfil do público cliente e na
última fase, a realidade que foi capturada é representada através
de protótipos que propiciam a validação da solução [16].
Figura 1. Proporção de órgãos públicos por forma de
participação cidadã pela Internet [6]
Na Estratégia de Governança Digital da Administração Pública
Federal (EGD) foram estabelecidos os seguintes objetivos
estratégicos para participação social no quadriênio 2016-2019:
fomentar a colaboração no ciclo de políticas públicas, ampliar e
incentivar a participação social na criação e melhoria dos
serviços públicos e aprimorar a interação direta entre governo e
sociedade; sendo indicado o uso de AVPs [5].
Vetterli e colaboradores [15] suscitaram a importância do uso do
Design Thinking nas atividades de engenharia de requisitos, pois
este é mais adequada aos atuais sistemas disponibilizados na
Web e para dispositivos móveis, que estão em constante
mudança, possuem menos funcionalidades, devem atender de
forma personalizada as necessidades dos clientes, entre outras
características.
Conclui-se, diante do exposto, que haverá aumento da demanda
por desenvolvimento de AVPs na administração pública e as
equipes podem não estar preparadas para absorvê-las, ter
dificuldade para identificar requisitos para tais sistemas, pois
eles possuem características distintas dos sistemas de
informação tradicionais.
Um processo para realizar a elicitação de requisitos em
ambientes virtuais de aprendizagem móvel baseado em DT e
técnicas criativas foi proposto por Souza [13], concluindo, após
a realização de um experimento, que técnicas criativas
colaboram com elicitação de requisitos e o DT pode ser usado na
engenharia de requisitos durante a fase de coleta e análise de
requisitos, ajudando na identificação dos problemas relacionado
às principais necessidades dos stakeholders, sendo possível
adaptá-lo com o acréscimo de técnicas em suas atividades para
tratar melhor as informações fornecidas pelos usuários.
Os AVPs possuem como critérios de qualidade, entre outros,
ambientes virtuais que incentivem a participação e o
engajamento dos cidadãos, demandando que sejam superados
problemas relacionados a aspectos sociotécnicos para que as
iniciativas produzam mudanças sociais sobre o seu contexto de
atuação (impacto social), que estão associados a questões
culturais, objetivos dos cidadãos e das organizações, o nível de
participação planejado, entre outras questões [1].
O engajamento se refere ao envolvimento da sociedade nos
assuntos que estão sendo expostos, está muito associado à
apropriação dos AVPs pelos cidadãos, se estes têm uma
participação contínua nestes ambientes para debater sobre
assuntos de interesse público [12].
Meireles [9] investigou a interação entre governo e cidadão
mediada por TICs e propôs um conjunto recomendações para a
construção de consultas públicas interativas a partir dos
conceitos de design de interação, uma das recomendações se
refere ao envolvimento dos integrantes dos projetos no processo
de desenvolvimento das tecnologias, incluindo os cidadãos que
usarão os ambientes virtuais de consulta pública.
Desta forma, a questão de pesquisa apresentada nesta proposta é:
Um método de elicitação e documentação de requisitos baseado
em Design Thinking pode contribuir para a construção de
ambientes virtuais de participação social com maior impacto
social positivo?
4. PROJETO
SOLUÇÃO
DE
AVALIAÇÃO
DA
A metodologia de pesquisa a ser usada neste trabalho científico
para propor e avaliar o método para elicitação e documentação
de requisitos será a design science research (DSR), pois esta é
3. PROPOSTA DE SOLUÇÃO
O objetivo inicial desta pesquisa é propor um método baseado
nas atividades do Design Thinking (DT) para realizar a
22
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
adequada à construção de novos artefatos, que podem ser
constructos, modelos, métodos, instanciações, e a pesquisas
orientadas a resolução de problemas [8].
[2] Brasil. Governo Federal. 2016. Parceria para Governo
Aberto. Disponível em:
<http://www.governoaberto.cgu.gov.br >. Acessado em: 01
de abr. 2016.
O método será utilizado na construção de protótipos de AVPs
em uma universidade pública federal, onde a sua eficácia será
avaliada através de um estudo de caso. Neste serão coletados
dados por meio de diversos instrumentos, tais como observação
direta, questionário e entrevista, para avaliar se o método
proposto contribui para o desenvolvimento de AVPs com maior
impacto social positivo, ou seja, despertam maior interesse dos
cidadãos em colaborarem em assuntos de interesse público.
[3] Brasil. Casa Civil. 2014. Decreto nº 8.243: Política
Nacional de Participação Social - PNPS e o Sistema
Nacional de Participação Social - SNPS. Brasília, DF.
[4] Brasil. Casa Civil. 2016. Decreto nº 8.638: Política de
Governança Digital. Brasília, DF.
[5] Brasil. 2016. Estratégia de Governança Digital da
Administração Pública Federal. Disponível em:
<http://www.governoeletronico.gov.br/estrategia-degovernanca-digital-egd/>. Acesso em: 12 de mar. 2016.
5. ATIVIDADES JÁ REALIZADAS
Foi realizada uma pesquisa fundamentada em técnicas de
mapeamento sistemático, com o objetivo de encontrar na
literatura sobre e-participação as metodologias que estão sendo
propostas para guiar a construção de sistemas para estas
iniciativas, neste foram analisados 17 artigos, contribuindo para
ampliar o conhecimento sobre atividades a serem realizadas no
desenvolvimento destes sistemas [11].
[6] CGI, Comitê Gestor de Internet do Brasil. 2014. TIC
Governo Eletrônico 2013.Disponível em:
<http://www.cgi.br/publicacao/pesquisa-sobre-o-uso-dastecnologias-de-informacao-e-comunicacao-tic-governoeletronico-2013/ >. Acesso em: 05 de dez. 2015.
[7] Classe, T., Silva, J., Pimentel, M., Araujo, R. 2016. Uma
Experiência de uso da Gamificação em Plataformas de
Participação Social. Revista Brasileira de Sistemas de
Informação (iSys) - Edição Especial Governo Eletrônico
(no prelo).
Os cenários reais projetos de AVPs também foram analisados
através de entrevistas semiestruturadas realizadas com gerentes
de projetos do Instituto de Tecnologia e Sociedade do Rio de
Janeiro (ITS Rio) e do Laboratório de Participação Social da
Prefeitura da Cidade do Rio de Janeiro (LAB.Rio), sendo
relatados desafios e problemas a serem superados em iniciativas
de participação social, assim como as especificidades destes
projetos, que, em geral, são abertos, colaborativos e compostos
por equipes multidisciplinares.
[8] Dresch, A., Lacreada, D. P., Atunes Júnior, J. A. 2015.
Design Science research: método de pesquisa para avanço
da ciência e tecnologia, Porto Alegre: Bookman.
[9] Meireles, A. V. 2015. Democracia 3.0: interação entre
governo e cidadãos mediada por tecnologias digitais.
Dissertação de Mestrado. Universidade de Brasília,
Brasília, Brasil.
Uma pesquisa científica foi realizada para investigar se o uso de
elementos de jogos em AVPs pode contribuir para aumentar a
participação dos cidadãos nestes ambientes, concluindo, através
de um experimento, que o uso de gamificação em AVPs
contribui para aumentar a sua audiência, mas também tem
efeitos negativos, como a redução da qualidade das publicações
em ambientes de reclamação sobre serviços públicos [7].
[10] Sæbø, Ø.; Rose, J.; Flak, L. S. 2008. The shape of
eParticipation: Characterizing an emerging research area.
Government Information Quarterly, v. 25, n. 3, p. 400-428.
[11] Silva, J., Araujo, R. 2015. Metodologias para o
Desenvolvimento de Sistemas para Participação Eletrônica:
Mapeamento Sistemático. Relatórios Técnicos do
Departamento de Informática Aplicada da UNIRIO, v. 8, n.
1, Rio de Janeiro, RJ.
6. CONCLUSÃO
A proposta apresentada neste artigo consiste na elaboração de
um método baseado em Design Thinking (DT) para realizar a
elicitação e documentação de requisitos de AVPs, que contribua
para o desenvolvimento de ambientes de participação que
tenham impacto social positivo no seu contexto de uso, ou seja,
ambientes criativos que incentivem os cidadãos a colaborarem
continuamente.
[12] Silva, C. M. C., Prado, E. P. V. 2015. Estudo sobre o
engajamento de usuários de uma mídia social
disponibilizada pelo governo. In: Anais do XI Simpósio
Brasileiro de Sistemas de Informação (SBSI), v. 1, p. 623630, Goiânia, GO.
Pretende-se como trabalhos futuros apresentar o esboço do
método, com a definição de suas atividades e os artefatos que
devem ser produzidos nas suas etapas durante a execução da
elicitação e documentação de requisitos de AVPs, e iniciar a sua
aplicação, coleta de dados e avaliação no cenário real de
desenvolvimento de um ambiente virtual de participação social
em uma universidade pública federal e partir de estudos de casos
evoluir o método.
[13] Souza, C. L. D. C. 2014. Uso do design thinking na
elicitação de requisitos de ambientes virtuais de
aprendizagem móvel. Dissertação de Mestrado.
Universidade Federal de Pernambuco, Recife, Brasil.
[14] Susha, I.; Grönlund, Å. 2012. eParticipation research:
Systematizing the field. Government Information
Quarterly, v. 29, n. 3, p. 373-382.
[15] Vetterli, C., Brenner, W., Uebernickel, F., Petrie, C. 2013.
From Palaces to Yurts: Why Requirements Engineering
Needs Design Thinking. Internet Computing, IEEE, v. 17,
n. 2, p. 91-94.
REFERÊNCIAS
[1] Araujo, R. M., Taher, Y. 2014. Refining IT Requirements
for Government-Citizen Co-participation Support in Public
Service Design and Delivery. In: Conference for EDemocracy and Open Government, Krems. CeDem 2014.
Krems: DonauUniversität Krems, v. 1., p. 61-72.
[16] Vianna, M., Vianna, Y, Adler, I. K., Lucena, B., Russo, B.
2012. Design Thinking - Inovação e Negócio. Rio de
Janeiro. MJV Press.
23
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Aplicando Grounded Theory para compreender as
dificuldades de Planejamento de TI em Órgãos Federais
Alternative Title: Applying Grounded Theory to understand the difficulties of IT
Planning in Federal Government Organs
Plínio Antunes Garcia
Vinicius Cardoso Garcia
Universidade Federal de Pernambuco
CIn - Centro de Informática
Universidade Federal de Pernambuco
CIn - Centro de Informática
[email protected]
[email protected]
ABSTRACT
nho dos negócios, o planejamento estratégico de SI/TI tem,
cada vez mais, um papel decisivo dentro das organizações
[13]. Existem diversos termos utilizados por diferentes autores que remetem ao planejamento estratégico de SI/TI, tais
como plano estratégico de sistemas de informação (PESI),
plano estratégico de tecnologia da informação (PETI) ou
plano diretor de tecnologia da informação (PDTI) [7]. Com
o objetivo de facilitar a compreensão e tornar este artigo
alinhado com a terminologia usada nos documentos das instituições públicas analisadas nesta pesquisa, será adotado
daqui em diante o termo PDTI.
Assim como empresas privadas, os órgãos da administração pública necessitam planejar ações para atingir suas metas. A própria Constituição da República Federativa do
Brasil de 1988, em seu artigo 174, declara que o Estado,
como agente regulador da economia, exercerá a função de
planejamento [2]. Na Administração Pública Federal (APF)
o planejamento é um princı́pio fundamental estabelicido no
Decreto Lei 200/1967. Desde 2008, através da Estratégia
Geral de Tecnologia da Informação (EGTI)[10], os órgãos
do poder executivo federal são obrigados a planejar as ações
de SI/TI através do PDTI. Portanto, todas as organizações
públicas, devem desenvolver processos de planejamento e de
monitoramento nos nı́veis institucionais e na área de TI [11].
Neste contexto, esta pesquisa objetiva compreender os fatores que dificultam o planejamento de TI em órgãos da
APF. Este artigo está organizado da seguinte forma: na
seção 2 é apresentado o problema de pesquisa; a seção 3
apresenta a proposta de solução, incluindo o método de pesquisa; a seção 4 aborda a avaliação da solução e, na seção
5 são descritas as atividades realizadas. Por fim, a seção 6
apresenta as considerações finais.
Context: As with private organizations, public organs should
execute planning processes to achieve their goals. The brazilian government determines that federal institutions develop
the IT Director Plan (PDTI), an important tool for planning
of IT activities. However, government reports show worrying
indexes regarding to the application of PDTI by the federal
organs. Objective: This research seeks to understand the
difficulties that result in unsatisfactory numbers related to
the PDTI. Method: By the Grounded Theory, a qualitative
research methodology, is expected to come up with a theory
based on data that point to the main causes of the difficulties
of drawing up the PDTI.
Categories and Subject Descriptors
J.1 [ Administrative Data Processing]: Government
Keywords
IT Strategic Planning, Grounded Theory
1. INTRODUÇÃO
As organizações necessitam cada vez mais dos Sistemas
de Informação (SI) e Tecnologia da Informação (TI) para
apoiar a tomada de decisões [7]. As empresas que conseguem alinhar suas estratégias de negócio com as estratégias
de TI atingem aumento de performance em seus negócios [3].
A importância estratégica da TI na gestão de organizações é
destacada no ranking de preocupações de gestores, no qual
o alinhamento estratégico de TI se encontra como preocupação principal nas publicações de 2013, 2014 e, recentemente,
na pesquisa de 2015 [6], ficando à frente de temas como segurança/privacidade, produtividade e inovação.
Levando em consideração a complexidade que a área de
SI/TI apresenta e a necessidade de melhoria no desempe-
2.
APRESENTAÇÃO DO PROBLEMA
Apesar do embasamento legal, a gestão de TI dos órgãos públicos federais não tem atendido satisfatoriamente
à necessidade de planejamento. Isto é evidenciado através
de uma pesquisa realizada periodicamente pelo Tribunal de
Contas da União (TCU), que busca apresentar um Perfil da
Governança de TI (Perfil GovTI) dos entes da APF. Os números apresentados nas pesquisas de 2007, 2010, 2012 e 2014
[12] são apresentados no gráfico da Figura 1.
Conforme ilustrado na Figura 1, os resultados do levantamento de 2014, relatório mais recente até a presente data,
apontam que 67% dos órgãos pesquisados adotam o PDTI,
Permission to make digital or hard copies of all or part of this work for personal or
classroom use is granted without fee provided that copies are not made or distributed
for profit or commercial advantage and that copies bear this notice and the full citation
on the first page. To copy otherwise, to republish, to post on servers or to redistribute
to lists, requires prior specific permission and/or a fee.
SBSI 2016 May 17th-20th, 2016, Florianópolis, Santa Catarina, Brazil
Copyright SBC 2016
24
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
• Codificação Axial: nesta etapa ocorre o processo de
relacionar categorias entre si e entre as propriedades e
dimensões. Através destes relacionamentos é possı́vel
traçar proposições acerca do fenômeno estudado;
• Codificação Seletiva: etapa em que o pesquisador identifica a categoria central do fenômeno e realiza o refinamento da teoria que emerge dos dados.
Portanto, nesta pesquisa a GT atua como ferramenta fundamental na proposta de identificar e compreender os fatores
que dificultam o planejamento de TI em instituições públicas
federais. O principal aspecto da abordagem desta pesquisa
consiste na formulação de uma teoria fundamentada em dados para o problema do planejamento de TI, ou seja, ao
aplicar a GT, os resultados são fieis à realidade refletida nos
dados coletados com os envolvidos na temática estudada.
Diante do exposto, a conclusão deste trabalho de mestrado
busca ter uma visão dos principais problemas relacionados
ao contexto, do ponto de vista dos envolvidos com o planejamento de TI, além de fornecer insumos para sugerir um
plano de ações para melhorar os ı́ndices de planejamento de
TI nas instituições pesquisadas.
Figura 1: Evolução do PDTI - Perfil GovTI
ou seja, 33% não cumprem as recomendações e determinações acerca da elaboração do PDTI. Ainda em 2014, apenas
54% das organizações fazem o vı́nculo das ações de TI a indicadores e metas de negócio. O nı́vel de adoção dessa prática
é preocupante, haja vista que a TI deve existir para atender
às necessidades do negócio e não dela própria. Desse modo,
sem a vinculação das ações de TI aos indicadores e metas
de negócio, fica difı́cil de avaliar a efetividade e a própria
necessidade dessas ações [12].
O TCU conclui que apesar da evolução identificada, a situação ainda não pode ser considerada aceitável [12]. Portanto, não é cabı́vel que muitas organizações continuem sem
PDTI, considerando a obrigatoriedade estabelecida em normativas e a importância que o planejamento de TI representa para o desempenho da organização. Diante disso, esta
pesquisa tem como principal objetivo elucidar o problema
da elaboração do planejamento de TI nos órgãos federais e
sugerir um plano de ações.
3.
4.
AVALIAÇÃO DA SOLUÇÃO
O problema abordado neste trabalho exige que o pesquisador seja isento de hipóteses ou conclusões pré-concebidas,
uma vez que a proposta desta pesquisa é permitir que os resultados sejam fielmente baseados nos dados coletados com
os envolvidos no problema, garantindo que a conclusão seja
o mais próxima possı́vel da realidade. Na GT, a coleta dos
dados, análise, formulação e a validação da teoria são reciprocamente relacionadas, em um processo indutivo de interpretação e em um processo de dedução e validação de
proposições [1].
Contudo, para avaliar o resultado desta pesquisa, será
elaborado um questionário a ser disponibilizado aos participantes da fase de coleta de dados. Tal questionário tem o
objetivo de medir a aderência, através de escala de Likert,
da teoria resultante da pesquisa às dificuldades de planejamento de TI vivenciadas pelos respondentes.
PROPOSTA DE SOLUÇÃO
Abordagens quantitativas são muito úteis no sentido de
prover indicadores. Porém, restringir a identificação das
causas que levaram a obtenção destes indicadores à análise
quantitativa pode omitir aspectos relevantes do comportamento dos indivı́duos cuja influência não pode ser desprezada [4]. Desta forma, métodos qualitativos são indicados
quando busca-se compreender, de forma mais abrangente,
todo o fenômeno em estudo ao invés de simplesmente simplificar e produzir similaridades [8]. Uma grande vantagem em
utilizar métodos qualitativos de pesquisa é a necessidade de
o pesquisador se aprofundar na complexidade do problema,
ao invés de abstraı́-la. Isto resulta em dados mais ricos e
mais informativos [9].
A proposta de solução apresentada neste trabalho consiste na utilização da metodologia de pesquisa qualitativa
Grounded Theory (GT) [5], ou Teoria Fundamentada em
Dados, visando elucidar o problema da elaboração de PDTI
nos órgãos públicos federais. GT é um método cientı́fico
que utiliza um conjunto de procedimentos sistemáticos de
coleta e análise dos dados para gerar, elaborar e validar teorias substantivas sobre fenômenos essencialmente sociais,
ou processos sociais abrangentes [1]. Os macroprocessos que
compõem a GT são:
5.
ATIVIDADES JÁ REALIZADAS
A pesquisa iniciou-se com uma revisão bibliográfica sobre
as temáticas: (i) planejamento de TI e (ii) Grounded Theory
em pesquisas de engenharia de software. Posteriormente,
definiu-se o público para coleta de dados: participantes da
elaboração e/ou revisão de PDTI de universidades federais
(UFs) e institutos federais de educação, ciência e tecnologia
(IFs). A coleta de dados ocorreu por meio de questionário
(https://goo.gl/rVPuFK ) aplicado ao público definido apresentando 52 respostas de 36 instituições diferentes, sendo 19
UFs, das 63 existentes no paı́s e 17 IFs, dos 41 existentes.
Portanto, a pesquisa tem uma amostra de 34,62% das instituições federais de ensino superior e técnico. O questionário
é composto de perguntas abertas (qualitativas) e objetivas.
O foco desta pesquisa consiste na análise das questões qualitativas, através da GT, com o objetivo de compreender de
forma abrangente as dificuldades envolvidas na elaboração
do PDTI. Contudo, pode-se adiantar alguns resultados das
questões objetivas:
• Codificação Aberta: etapa em que o pesquisador varre
o material coletado e busca extrair conceitos, categorias e suas propriedades e dimensões;
• Afirmaram possuir PDTI: 80,55% (29 instituições)
25
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
6.
• Afirmaram não possuir PDTI: 19,45% (7 instituições)
CONCLUSÃO
Com o apoio da GT é esperado obter uma teoria fundamentada em dados que evidencie as principais causas das
dificuldades de planejamento de TI nas instituições. Além
disso, espera-se identificar as principais motivações que levam ao não cumprimento da determinação de se estabelecer
o PDTI.
Há de se destacar que esta pesquisa tem um caráter multidisciplinar, pois abrange não somente a grande área de
sistemas de informação, mas também aspectos da administração e sociologia, uma vez que visa compreender o comportamento dos indivı́duos envolvidos em atividades de gestão
em um ambiente regido pela TI. Neste cenário a Grounded
Theory se torna determinante para compreender os fatores
sociotécnicos envolvidos no planejamento de TI.
Por fim, o legado deste trabalho consiste não somente nos
resultados da pesquisa em si, mas no fornecimento dos insumos necessários para a construção de um plano de ações
efetivas que possam atacar as origens do problema da falta
de planejamento de TI nas instituições públicas e, com isto,
contribuir para a melhoria dos serviços prestados ao cidadão
e para o melhor emprego dos orçamentos destinados às áreas
de TI dos entes públicos.
Este resultado se difere dos números do TCU em seu levantamento com 355 órgãos federais [12], dos quais 33% afirmaram não possuir PDTI. Esta diferença sugere que no caso
especı́fico de instituições de ensino federais o nı́vel de aderência ao planejamento de TI é melhor do que o percentual
geral envolvendo os demais órgãos federais. Porém, é importante ter cautela ao tirar conclusões. Um estudo focado
em comparar as instituições de ensino com as demais instituições federais poderia esclarecer as razões desta diferença.
7.
REFERÊNCIAS
[1] R. Bandeira de Mello and C. Cunha.
Operacionalizando o método da grounded theory nas
pesquisas em estratégia. 2003.
[2] BRASIL. Constituição da República Federativa do
Brasil. Diário Oficial da União, out 1988.
[3] Y. E. Chan, R. Sabherwal, and J. B. Thatcher.
Antecedents and outcomes of strategic is alignment:
an empirical investigation. IEEE Transactions, 2006.
[4] T. Conte, R. Cabral, and G. H. Travassos. Aplicando
grounded theory na análise qualitativa de um estudo
de observação em engenharia de software–um relato de
experiência. In V WOSES, 2009.
[5] B. G. Glaser, A. L. Strauss, and E. Strutzel. The
discovery of grounded theory; strategies for qualitative
research. Nursing Research, 17(4):364, 1968.
[6] L. Kappelman, E. McLean, and V. Johnson. The 2016
sim it key issues and trends study. Society for
Information Management, 2015.
[7] D. A. Rezende. Planejamento de sistemas de
informação e informática: guia prático para planejar a
tecnologia da informação integrada ao planejamento
estratégico das organizações. Atlas, 2008.
[8] C. B. Seaman. Qualitative methods in empirical
studies of software engineering. IEEE Transactions,
1999.
[9] C. B. Seaman. Qualitative methods. In Guide to
advanced empirical software engineering. 2008.
[10] SLTI. Estratégia Geral de TI, 2008.
[11] TCU. Tribunal de Contas da União - manual online
de legislação e jurispudência de contratação de
serviços de TI, 2007. Acesso em 01 dez 2015.
[12] TCU. Tribunal de Contas da União - Perfil GovTI.
http://goo.gl/Q97Plh, 2014. Acesso em 02 dez 2015.
[13] J. Teixeira Filho. MMPE-SI/TI (Gov)-Modelo de
Maturidade para Planejamento Estratégico de SI/TI.
PhD thesis, Universidade Federal de Pernambuco,
Recife, 2010.
Figura 2: Grau de dificuldade no levantamento
Também foi possı́vel extrair uma visão prévia das dificuldades encontradas pelos respondentes que participaram
da elaboração do PDTI das suas respectivas instituições. No
questionário foi perguntado acerca do grau de dificuldade na
realização de algumas atividades essenciais no planejamento
de TI, o grau de dificuldade poderia variar de 0 (nenhuma
dificuldade) a 10 (muita dificuldade). Na Figura 2 é possı́vel
inferir que as maiores dificuldades na fase de levantamento
de necessidades estão nas atividades de identificação das necessidades de informação e, principalmente, na definição de
critérios de priorização das necessidades levantadas.
Os dados coletados nas questões abertas (qualitativas)
se encontram em fase de análise, na etapa de codificação
aberta. Ainda é prematuro tecer hipóteses completas, porém é possı́vel perceber pelo mapeamento de conceitos realizado, até o momento, que questões atreladas à (i) falta
de pessoal com competências de governança e (ii) falta da
cultura de planejamento, estão entre os conceitos que mais
chamam atenção no que tange a motivações para a ausência
de PDTI nas instituições.
Já nas instituições que possuem um PDTI, ainda que
deficiente, a análise dos dados busca informações sobre as
dificuldades encontradas pelos envolvidos na elaboração do
plano. Os dados revelam dificuldades relacionadas ao levantamento de necessidades de sistemas de informação, serviços
terceirizados e infraestrutura de TI, além das dificuldades na
priorização das necessidades elicitadas. Outros dados coletados dizem respeito às dificuldades na definição de metas,
gestão de riscos, recursos humanos de TI e alinhamento estratégico. Todos estes tópicos estão em análise e têm trazido
à tona hipóteses importantes para a elaboração da teoria final. É previsto para os próximos dois meses a finalização
da análise com GT e, de posse da teoria fundamentada em
dados, será possı́vel responder à pergunta que norteia o problema desta pesquisa.
26
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Estudo da Representação de Dados para Segmentação
das Fases do Gesto usando Aprendizado de Máquina
Alternative Title: Study on Data Representation to Gesture Phase Segmentation
using Machine Learning
Ricardo A. Feitosa
Universidade de São Paulo
03828-000, São Paulo – SP
[email protected]
Sarajane M. Peres
Universidade de São Paulo
03828-000, São Paulo – SP
[email protected]
RESUMO
Sistemas de análise de gestos vêm ganhando força por suas
contribuições para a interação entre humanos, humanos e
máquinas, e humanos e ambiente. Nessa interação, a gesticulação natural é vista como parte do sistema linguı́stico
que suporta a comunicação, e qualquer sistema de informação que objetiva usar interação para suporte à decisão deveria ser capaz de interpretá-la. Essa interpretação pode ser
realizada por meio da segmentação das fases do gesto. Para
resolver essa tarefa, o estabelecimento de uma representação
de dados eficiente para os gestos é um ponto crı́tico. A representação escolhida e sua associação a técnicas de análise
podem ou não favorecer a solução sob implementação. Neste
trabalho, formas de representação de gestos são submetidas
à algoritmos de aprendizado de máquina para elaborar um
ambiente propı́cio à identificação das representações mais
discriminantes, quais aspectos as diferentes representações
descrevem com eficiência, e como elas podem ser combinadas para melhorar a segmentação das fases do gesto.
Clodoaldo A. M. Lima
Universidade de São Paulo
03828-000, São Paulo – SP
[email protected]
a critical issue. The chosen representation as well as its combination with techniques for analysis can or can not favor
the solution being developed. In this work, different forms
representation for gestures are applied to machine learning
algorithms to create an adequate environment to identify the
more discriminative representations, which aspect the different representations describe with more efficiency, and how
they can be combined in order to improve the segmentation
of gesture phases.
Categories and Subject Descriptors
H.4.m [Information Systems Applications]: Miscellaneous; I.2.10 [Artificial Intelligence]: Vision and Scene Understanding—Representations, data structures, and transforms
General Terms
Experimentation
Palavras-Chave
Keywords
Representação de Gestos, Segmentação das Fases do Gesto,
Reconhecimento de Padrões, Aprendizado de Máquina
Representation of Gestures, Segmentation of Gesture Phases, Pattern Recognition, Machine Learning
ABSTRACT
1.
Gestures analysis systems have been getting attention for
their contributions to the interaction between humans, humans and machines, and humans and environments. In this
interaction, natural gesticulation is seen as part of linguistic system that supports the communication, and all information system aiming at the use of such an interaction in
making decisions should be able to interpret it. Such an
interpretation can be carried out through the segmentation
of gesture phases. In order to solve that task, the establishment of an efficient data representation for gestures is
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise, to
republish, to post on servers or to redistribute to lists, requires prior specific
permission and/or a fee.
SBSI 2016, May 17th-20th, 2016, Florianópolis, Santa Catarina, Brazil
Copyright SBC 2016.
27
INTRODUÇÃO
A análise de gestos é uma aplicação da área de reconhecimento de padrões, e a depender do contexto, os gestos
podem ser considerados um elemento do sistema linguı́stico.
No uso de gestos para comunicação ou interação entre pessoas, essa relação entre gestos e lı́ngua se estabelece de forma
natural na gesticulação ou no uso de uma lı́ngua gestual (i.e.
uma lı́ngua de sinais). Num contexto no qual um sistema de
informação necessita mediar uma interação entre humanos,
ou estabelecer uma interação entre humanos e máquinas ou
ambientes, faz-se útil que a gesticulação seja considerada
como elementos que carregam informação. No desenvolvimento de soluções capazes de interpretar a gesticulação,
depara-se com a necessidade da escolha de uma representação computacional para os dados sob análise – o gesto. Essa
é uma escolha crı́tica que também está relacionada à escolha
das técnicas de análise de dados que serão usadas, pois tal
combinação influencia o desempenho da solução. O domı́nio
sob o qual os gestos são interpretados traz particularidades
que devem estar bem representadas para que técnicas computacionais sejam capazes de tratá-las adequadamente.
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Dentro de um sistema linguı́stico a execução e interpretação de um gesto assume diferentes aspectos, sendo os mais
comuns: aspectos espaciais que embutem informação sobre
forma, amplitude ou direção; aspectos temporais que incorporam tanto informação sobre velocidade e aceleração,
quanto informação sobre frequência e periodicidade; aspectos estruturais que carregam a informação estrutural e de relação entre os gestos e suas partes constituintes [7, 1]. O estudo de representações computacionais capazes de descrever
tais aspectos, objetivando uma solução de reconhecimento
de padrões, delimita o escopo de pesquisa deste trabalho.
O escopo de aplicação para o trabalho é a segmentação
das fases do gesto, por meio da qual estuda-se o significado
dos gestos e da gesticulação dentro do discurso executado
durante um perı́odo de comunicação. Mcneill [6] e Kendon [2] propuseram a segmentação do gesto em fases para
permitir a análise de como o gesto está estruturado em um
contexto. De acordo com a proposta, os gestos podem ser
segmentados nas fases: preparation, pre-stroke hold, stroke,
post-stroke hold e retraction. Focando na análise do movimento das mãos, a fase preparation compreende o momento
em que as mãos se movimentam do rest, um perı́odo com
ausência de gesticulação, em direção ao stroke. O pre-stroke
hold representa uma pausa no movimento das mãos entre a
preparation e o stroke. O stroke é o gesto em si. O poststroke hold representa uma pausa no movimento das mãos
entre o stroke e a retraction. E a retraction compreende o
tempo que a mão leva para voltar à posição de rest. Uma
fase chamada hold é inserida nesta proposta e corresponde a
um perı́odo em que há ausência de movimento, porém carrega informação e geralmente ocorre entre a preparation e
a retraction. O stroke é a única fase obrigatória dentro da
unidade gestual. Uma unidade gestual é o perı́odo entre a
mão sair da posição de rest e retornar para a posição de rest
[3].
O presente trabalho é motivado pelo estudo realizado por
Madeo [4]. Nele, a autora utilizou uma representação dos
aspectos temporais de um gesto, para então implementar a
segmentação das suas fases usando Support Vector Machines
(SVM). Outros autores exploraram o mesmo problema ou
problemas similares, fazendo uso de diferentes abordagens
para representar os gestos e diferentes técnicas para implementar a segmentação das fases. Uma revisão de literatura
neste tópico é apresentada em [5].
2. APRESENTAÇÃO DO PROBLEMA
Madeo [4] focou seu trabalho em explorar a SVM clássica,
a Echo-State e SVMs com kernels recorrentes, na segmentação das fases do gesto, concluindo que é necessário um trabalho extenso de ajuste de parâmetros dos algoritmos para
que se alcance resultados satisfatórios. Porém, a autora não
realizou uma exploração abrangente da representação de dados. Essa lacuna em seu estudo aliada às diferentes formas
possı́veis de representar os aspectos que definem um gesto
definem o problema que é tratado no presente trabalho. O
objetivo da pesquisa então é a busca da representação de
dados mais discriminante para os gestos, considerando que
seus aspectos espaciais, temporais e estruturais precisam estar representados de forma que a informação relacionada a
eles seja usada na segmentação das fases.
Na literatura encontra-se tanto iniciativas que usam representação que expressa apenas algum aspecto dos gestos,
quanto iniciativas que procuram combinar, de forma explı́-
28
cita ou implı́cita, a informação referente a diferentes aspectos. Contudo, tais estudos delimitam áreas de aplicação
especı́ficas, com caracterı́sticas próprias, que dificultam a
transferência de conhecimento entre diferentes domı́nios.
O domı́nio de segmentação das fases do gesto traz desafios
para a área de reconhecimento de padrões. Em uma análise
simples e empı́rica poder-se-ia dizer que desde que a gesticulação se dá principalmente com mão dominante, e que
entre as fases de um gesto percebe-se alterações da intensidade do movimento (stroke seria a fase de maior intensidade
e o rest o perı́odo de menor intensidade), então uma representação adequada poderia ser a velocidade escalar da mão
direita. Ou, imaginando que o perı́odo de rest ocorre quando
as mãos estão abaixo do nı́vel da cintura e a unidade gestual
ocorre acima do nı́vel da cintura, o uso da informação referente à coordenada espacial das mãos deveria fazer parte
da representação. Entretanto, análises detalhadas mostram
que o uso isolado dessas informações gera uma segmentação equivocada pois um hold, como o rest, possui ausência
de movimento, e o rest pode ocorrer na posição de braços
cruzados acima da cintura.
A partir dessa análise empı́rica do problema e do estudo
da literatura, pode-se adotar como hipótese que utilizar uma
representação computacional que considere apenas um aspecto descritivo do gesto não é suficiente para obter bons
resultados de segmentação de suas fases. Há, portanto, a
necessidade de embutir informações de naturezas diferentes
na representação, cobrindo a descrição dos aspectos espaciais, temporais e estruturais de um gesto.
3.
PROPOSTA DE SOLUÇÃO
O problema da representação dos gestos deste trabalho
exige um estudo exploratório sobre as alternativas apresentadas na literatura, e a experimentação de tais alternativas
no problema de segmentação das fases do gesto. A experimentação deve ser implementada a partir de técnicas de
reconhecimento de padrões e executada em um contexto controlado, sobre o qual se tenha conhecimento das particularidades da gesticulação e das fases dos gestos executados.
O atendimento ao primeiro requisito será realizado com o
uso de algoritmos de aprendizado de máquina. Algoritmos
de aprendizado supervisionado possibilitarão a compreensão da capacidade discriminativa de cada representação de
dados, sob a luz da segmentação de gestos realizadas por
especialistas humanos. A rede neural Multilayer Perceptron
(MLP) será usada para esse propósito pois é um aproximador de funções universal e tem um treinamento relativamente
rápido. Algoritmos de aprendizado não supervisionado possibilitarão tanto a verificação do poder de discriminação de
cada uma das representações de uma maneira imparcial, ou
seja, sem o viés da correção do erro de segmentação, quanto
a identificação da necessidade de reestruturar as fases do
gesto para um esquema diferente daquele apresentado por
Mcneill [6] e Kendon [2]. A rede neural Self Organizing Maps
(SOM) será usada para esse propósito, por conta de sua capacidade de redução de dimensionalidade, possibilitando a
visualização da estrutura topológica dos grupos.
O segundo requisito será atendido com o uso do conjunto
de dados Gesture Phase Segmentation Data Set 1 . Esse conjunto é composto por caracterı́sticas extraı́das de vı́deos com
1
https://archive.ics.uci.edu/ml/datasets/Gesture+
Phase+Segmentation
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
pessoas gesticulando durante a atividade de contação de histórias, e está rotulado segundo a segmentação das fases do
gesto realizada por quatro especialistas. Os gestos foram
captados com o sensor MS Kinect e organizados em arquivos
com informação sobre coordenadas espaciais de mãos, pulsos, tronco e cabeça e informações referentes à velocidade e
aceleração das mãos e pulsos. Outras informações descritivas deverão ser extraı́das para compor a exploração prevista
neste trabalho. Algumas possibilidades são a angulação e
direção dos gestos, e a extração de informação sintática com
base na gramática apresenta por [3].
4.
AVALIAÇÃO DA SOLUÇÃO
A avaliação da adequabilidade das representações de dados será mediante os resultados dos algoritmos MLP e SOM.
Os procedimentos de avaliação compreenderão aqueles já
tradicionais para classificadores e modelos de agrupamento,
e também a partir da avaliação dos resultados sob o ponto
de vista dos especialistas, conforme proposto em [4].
A análise das classes geradas pelas MLPs será realizada
para verificar sua aderência aos segmentos esperados. Quanto
melhor for o resultado produzido, mais adequada será a representação de dados em uso. Essa avaliação se dará pela
aplicação de medidas de acurácia e da análise de matrizes
de confusão. Porém, faz-se útil ainda uma análise detalhada dos tipos de erros cometidos pelas MLPs, de forma
que se possa entender quais são os aspectos em que cada
representação de dados falha. A análise sobre os grupos
formados pelo algoritmo SOM será realizada sob dois aspectos: qualidade dos agrupamentos formados, usando ı́ndices
de validação internos e externos; relacionamento topológico
dos grupos fornecido pelo mapa de saı́da do SOM, o qual
será realizado por meio de inspeções visuais suportadas por
ferramentas de visualização apropriadas.
5.
à classificação do especialista. Assim há uma confirmação
parcial sobre a hipótese em estudo. A figura 1 mostra um
trecho do vı́deo representado pela velocidade. Na base do
gráfico as linhas dizem respeito às fases obtidas e esperadas.
As marcações em vermelho ilustram os erros de segmentação.
ATIVIDADES REALIZADAS
Para a condução deste trabalho em direção a responder a
questão de pesquisa delineada e verificar a hipótese estabelecida, as seguintes atividades são previstas: revisão exploratória e sistemática da literatura; implementação dos algoritmos MLP, SOM e procedimentos de avaliação usando a
ferramenta Matlab; seleção empı́rica e automática e combinação de representações de dados via experimentos computacionais; análise e documentação dos resultados. A revisão
de literatura está em fase de conclusão. Foi realizada uma revisão sistemática sobre representação de dados para análise
de gestos e revisões exploratórias sobre a área de aplicação.
Toda a revisão bibliográfica será continuamente atualizada
até o término da escrita da dissertação. Os algoritmos MLP
e SOM foram implementados para testes preliminares, porém estão sendo refinados para que se adequem ao volume
de execuções necessárias e ao tipo de avaliação que será
realizada. As medidas e procedimentos de avaliação estão
implementados. Estudos preliminares simplificados necessários para embasar à hipótese deste trabalho foram realizados
usando o algoritmo K-means. A representação do gesto foi
caracterizada apenas pela velocidade escalar da mão direita
referente a cada frame do vı́deo. O K-means foi executado
com k = 5 para verificar o quão aderente às fases do gesto
rest, preparation, stroke, hold e retraction, seus resultados
poderiam ser. Verificou-se uma aderência de 43% em termos
de frames de vı́deos segmentados corretamente em relação
29
Figura 1: Velocidade escalar X fases do gesto
6.
CONCLUSÃO
Com este estudo é esperado contribuir com a expansão do
conhecimento na área de análise de gestos no que diz respeito à representação de dados adequada para análise das
fases do gesto. Embora existam muitos estudos correlatos,
não foi encontrado nenhum que explore detalhadamente representações para dados gestuais avaliando sua adequação
quanto à descrição de aspectos espaciais, temporais e estruturais. Ademais, a exploração das representações via algoritmos de aprendizado não supervisionado, ainda pouco explorados nessa área, traz a possibilidade de eliminar o viés
introduzido na análise supervisionada.
7.
REFERÊNCIAS
[1] T. G. Dietterich. Machine learning for sequential data:
A review”. In Proc. of Joint Structural, Syntactic, and
Statistical Pattern Recogn. International Workshops,
pages 15–30. Springer, 2002.
[2] A. Kendon. Gesticulation and speech: Two aspects of
the process of utterance. The Relationship of verbal and
nonverbal communication, pages 207–227, 1980.
[3] S. Kita, I. Gijn, and H. Hulst. Movement phases in
signs and co-speech gestures, and their transcription by
human coders. In Proc. of Int. Gesture Workshop
Bielefeld, pages 23–35. Springer, 1998.
[4] R. C. B. Madeo, S. M. Peres, and C. A. Lima. Gesture
phase segmentation using support vector machines.
Expert Systems with Applications, 56:100 – 115, 2016.
In press.
[5] R. C. B. Madeo, P. K. Wagner, and S. M. Peres. A
review of temporal aspects of hand gesture analysis
applied to discourse analysis and natural conversation.
Int. J. of C. Sci. & Inf. Tech., 5(4), dec. 2013.
[6] D. Mcneill. Hand and mind: What the hands reveal
about thought. 1992.
[7] N. A. Smith. Linguistic Structure Prediction. Morgan &
Claypool, 2011.
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Alinhamento Interativo de Ontologias usando AntiPadrões de Alinhamento
Alternative Title: Interactive Ontology Alignment using Alignment
Antipatterns
Jomar da Silva
Fernanda Araujo Baião
Kate Revoredo
Departamento de Informática
Aplicada - UNIRIO
Av. Pasteur 458,
Rio de Janeiro,Brasil
[email protected]
Departamento de Informática
Aplicada - UNIRIO
Av. Pasteur 458,
Rio de Janeiro,Brasil
[email protected]
Departamento de Informática
Aplicada - UNIRIO
Av. Pasteur 458,
Rio de Janeiro,Brasil
[email protected]
conceptually define the data stored in each repository. Among the
various ontology alignment approaches that exist in the literature,
interactive ontology alignment includes the participation of
experts to improve the quality of the final alignment. An
important issue for interactive ontology alignment proposals is to
maximize the efficiency of the expert participation. According to
OAEI (an evaluation initiative conducted annually), despite the
advances in this field there are still recurrent errors in the final
alignments obtained by the interactive ontology alignment
proposals. In this paper we propose ALIN, an interactive ontology
alignment approach that increases the efficiency of the expert
participation through the use of alignment anti-patterns. An initial
experience with ALIN strategy was evaluated, considering three
anti-patterns available in the literature, and the results proved the
potential of the approach.
RESUMO
O progresso nas tecnologias de informação e de comunicação
tornou disponível uma grande quantidade de repositórios de
dados, mas com uma grande heterogeneidade semântica, o que
dificulta a sua integração. Um processo que tem sido utilizado
para resolver este problema é o alinhamento de ontologias, que
tenta descobrir as correspondências existentes entre as entidades
de duas ontologias distintas, as quais por sua vez estruturam os
conceitos que definem os dados armazenados em cada repositório.
Existem várias abordagens na literatura para o alinhamento de
ontologias, dentre as quais destaca-se a abordagem interativa, que
considera a participação de especialistas para melhorar a
qualidade do alinhamento final. Na abordagem interativa, uma
questão importante é a eficiência da participação do especialista.
Apesar dos avanços nos resultados obtidos na literatura, há ainda
erros recorrentes nos alinhamentos obtidos pelas propostas de
alinhamento interativo de ontologias, o que pode ser comprovado
por uma iniciativa de avaliação conduzida anualmente pela
comunidade científica (OAEI). Neste trabalho, é proposta uma
estratégia interativa para o alinhamento de ontologias,
denominada ALIN, que busca a aumentar a eficiência da
participação do especialista através da utilização de anti-padrões
de alinhamento. Uma experiência inicial com a estratégia ALIN
foi avaliada, considerando 3 anti-padrões disponíveis na literatura,
e os resultados comprovaram o potencial da abordagem.
Categories and Subject Descriptors
H.2.1 Logical Design - Data models
General Terms
Algorithms, Measurement, Design.
Keywords
Interactive Ontology Matching, Ontology, Correspondence Antipattern.
Palavras-Chave
1. INTRODUÇÃO
Alinhamento de Ontologias, Ontologia, Alinhamento interativo de
Ontologias, Anti-padrão de alinhamento.
O processo de alinhamento de ontologias tem como um de seus
propósitos reduzir a heterogeneidade semântica entre
representações distintas de um mesmo domínio. A existência de
tal heterogeneidade se deve ao natural instinto humano de ter
perspectivas diferentes e assim modelar situações semelhantes
utilizando conceitualizações diferentes.
ABSTRACT
A large amount of data repositories became available due to the
advances in information and communication technology. Those
repositories, however, are highly semantically heterogeneous,
which hinders their integration. Ontology alignment has been
successfully applied to solve this problem by discovering
correspondences between two distinct ontologies which, in turn,
O processo de alinhamento de ontologias busca descobrir
correspondências entre entidades relacionadas em ontologias [3].
Vários trabalhos já foram propostos na literatura para suportar
este processo, entre eles se destacam os que seguem a abordagem
interativa, que consideram a participação de um especialista no
domínio que foi modelado pelas ontologias[4]. Esta abordagem
tem alcançado resultados superiores às abordagens nãointerativas, mas ainda há espaço para se alcançar melhores
resultados [4].
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that
copies bear this notice and the full citation on the first page. To copy
otherwise, or republish, to post on servers or to redistribute to lists,
requires prior specific permission and/or a fee.
SBSI 2016, May 17–20, 2016, Florianópolis, Santa Catarina, Brazil.
Copyright SBC 2016.
30
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Uma questão importante no alinhamento interativo de ontologias
é a eficiência na participação do especialista que é medida pela
quantidade de correspondência corretas achadas em relação ao
número de interações com o especialista.
calculadas comparando-se o alinhamento gerado (do qual se quer
avaliar a qualidade) com o alinhamento de referência (o conjunto de
correspondências que são reconhecidamente verdadeiras). A
precisão mede o quão correto é o alinhamento gerado, e é calculada
como a razão entre o número de correspondências do alinhamento
gerado que estão presentes no alinhamento de referência e o
número total de correspondências do alinhamento gerado. A
cobertura é calculada como a razão entre o número de
correspondências do alinhamento gerado que estão presentes no
alinhamento de referência e o número total de correspondências do
alinhamento de referência. Há uma terceira medida, chamada
medida-F, que é a média harmônica entre a precisão e a cobertura.
Um anti-padrão de alinhamento, também chamado padrão
problemático de alinhamento, é, mais precisamente, uma
combinação de correspondências que geram uma insatisfabilidade
de um conceito [5]. O alinhamento da Figura 1, por exemplo, é
inconsistente logicamente, pois cada instância da classe o1:e1 é
também instância da classe o2:e1 (pela equivalência , indicada
pela seta de duas pontas), e cada instância de o1:e1 também é
instância de o1:e2 (pela herança). Ainda, cada instância de o1:e2
é também instância de o2:e2 (pela equivalência) e, portanto,
podemos deduzir que que as instâncias de o2:e1 são também
instâncias de o2:e2, o que gera uma contradição lógica, pois o2:e1
e o2:e2 são disjuntas.
3. PROPOSTA DE SOLUÇÃO
Este trabalho propõe o ALIN, uma estratégia interativa para o
processo de alinhamento de ontologias que integra o uso de
classificadores e clusterizadores como na abordagem Jarvis [2] com
anti-padrões a cada interação com o especialista, estendendo
portanto a proposta de Guedes [1].
A utilização dos anti-padrões se dá por ocasião da interação com o
especialista. Caso o especialista responda “sim”, indicando que um
par de entidades é uma correspondência, todos os pares
incompatíveis com ele, de acordo com os anti-padrões, são
classificados como “não”, indicando que estas correspondências
não pertencem ao alinhamento. Isso amplifica as respostas dadas,
pelo especialista, podendo-se saber a resposta para várias
correspondências com somente uma pergunta ao especialista.
4.
PROJETO
SOLUÇÃO
Figura 1. Anti-padrão de disjunção e generalização [1]
Guedes [1] definiu empiricamente um conjunto de anti-padrões,
escavados a partir dos resultados de ferramentas avaliadas pela
OAEI [8], dentre os quais está o descrito na Figura 1, e os aplicou
para melhorar a qualidade do resultado de um processo de
alinhamento de forma não interativa, retirando do alinhamento
correspondências que levavam a inconsistências, de acordo com
os anti-padrões.
DE
AVALIAÇÃO
DE
O projeto de avaliação de solução abrange a utilização de um
programa já parcialmente feito que, quando completo,
implementará a proposta de solução. A abordagem ALIN está sendo
implementada utilizando as seguintes APIs em Java: Weka, com
rotinas estatísticas e de KDD [8]; Simmetrics, com métricas de
similaridade baseadas em strings [7]; WS4J, com métricas
linguísticas baseadas na Wordnet [9]; e Alignment, que contém
rotinas para manipulação de ontologias escritas em OWL [10].
Neste trabalho são avaliados os benefícios de considerar antipadrões em uma abordagem interativa para o alinhamento de
ontologias, denominada ALIN, com vistas a aumentar a eficiência
na participação do especialista. Um primeiro experimento
considerando 3 anti-padrões, definidos em Guedes [1], é descrito
e seus resultados positivos mostram o potencial da abordagem
ALIN.
A avaliação da abordagem ALIN será realizada considerando os
resultados disponibilizados pela OAEI[8]. Serão utilizadas na
avaliação os datasets disponibilizados para avaliação de uma
ferramenta interativa: Conference, Anatomy e Largebio.
5. ATIVIDADES JÁ REALIZADAS
Este artigo está estruturado como a seguir: A seção 2 apresenta o
problema, a seção 3 mostra a proposta de solução, a seção 4 o
projeto de avaliação da solução, a seção 5 mostra as atividades já
realizadas e a 6 a conclusão a que se chegou.
Já foi construído parte do programa que implementa a
abordagem ALIN, com 3 anti-padrões definidos em Guedes[1], o
que permite fazer uma avaliação inicial da utilização de antipadrões no alinhamento interativo.
2. APRESENTAÇÃO DO PROBLEMA
O experimento contemplou duas execuções. A primeira
execução, sem a utilização dos anti-padrões, reproduziu a
abordagem Jarvis [2]. A segunda execução seguiu a abordagem
ALIN, incorporando os anti-padrões a cada interação com o
especialista.
A OAEI (Ontology Alignment Evaluation Initiative) é uma
iniciativa internacional cuja meta é avaliar as ferramentas de
alinhamento de ontologias existentes, publicando resultados
comparativos entre elas. A OAEI disponibiliza alinhamentos de
referência para diversos domínios de avaliação (datasets).
Embora muitos trabalhos já tenham sido realizados na área [1][2]
[5][6] os resultados expostos pela OAEI mostram que ainda há
espaço para a melhoria dos alinhamentos gerados.
O dataset, disponibilizado pela OAEI, escolhido para esta
avaliação inicial foi no domínio de conferências acadêmicas. O
conference dataset é composto por 7 ontologias. Existe um
alinhamento de referência entre cada par de ontologias,
totalizando 21 alinhamentos de referência. Quanto à interação,
cada feedback do especialista foi implementado através de uma
Para avaliar a qualidade do alinhamento gerado, duas medidas são
comumente utilizadas: precisão e cobertura. Tais medidas são
31
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
consulta ao alinhamento de referência, que retorna se um par de
entidades é uma correspondência ou não.
padrões. Os resultados obtidos mostraram que a utilização de antipadrões aumenta tanto a precisão como a cobertura do
alinhamento obtido.
A cada execução, as medidas de qualidade alcançadas serão a
média dos valores encontrados nos alinhamentos gerados para
cada par de ontologias do conference dataset ( a média dos 21
pares ). A abordagem ALIN será avaliada segundo o impacto
causado pela utilização dos anti-padroes na qualidade do
alinhamento gerado, em termos de medida-F, e quanto à eficiência
da participação do especialista no processo de alinhamento.
Uma outra observação importante é o aumento do número de
pares de entidades avaliados pela abordagem, embora o número de
interações com o especialista permaneça constante. A eliminação
daqueles pares que não podem estar no alinhamento permite que o
especialista responda somente às perguntas de correspondências
que não são incompatíveis com outros pares já escolhidos. O
aumento da qualidade também parece estar relacionado a isto.
Alguns pares não selecionados anteriormente para avaliação
podem ser agora avaliados, e alguns desses pares podem estar no
alinhamento.
Em cada execução houve 5 iterações e foram definidos os
parâmetros número de perguntas iniciais igual a 8 e número de
perguntas por iteração igual a 3, dando um máximo de 23
interações com o especialista por par de ontologias. Foram
encontrados os resultados mostrados no gráfico da figura 2.
A abordagem ALIN se diferencia dos trabalhos existentes na
literatura em vários aspectos. Em Guedes[1] a utilização dos antipadrões se dá somente ao final do processo de alinhamento,
enquanto na abordagem ALIN proposta os anti-padrões são
considerados a cada interação com o usuário. Ainda, com relação
à proposta de Lopes[2], ALIN se diferenciou pela utilização de
anti-padrões durante o processo e não ao final dele, eliminando
das possíveis interações aquelas inconsistentes com as que foram
positivadas pelo especialista. Os resultados do experimento
mostraram que a sinergia entre o feedback do especialista e os
anti-padrões contribuiu para aumentar a qualidade do alinhamento
e melhorar a eficiência da participação do especialista.
A implementação atual se baseia na hipótese de que o especialista
nunca erra, o que nem sempre é verdade. Vai ser implementado na
abordagem um parâmetro indicando uma margem de erro para o
especialista. Será estudada, também, a utilização de outros antipadrões, assim como a utilização de anti-padrões em outras fases
do processo de alinhamento.
Figura 2. Valores de medida-F resultantes das execuções
7. REFERÊNCIAS:
A eficiência da participação do especialista também foi avaliada.
Uma característica da utilização de anti-padrões é que, quando o
especialista informa à abordagem ALIN que determinado par de
entidades é uma correspondência, indiretamente informa que
todos os outros pares inconsistentes com esta correspondência não
pertencem ao alinhamento. Isto amplifica a propagação do
conhecimento do especialista a cada feedback. Por exemplo, no
alinhamento entre as ontologias conference e ekaw (pertencentes
ao conference dataset da OAEI), foram selecionados 52 pares de
entidades para serem avaliados pelo especialista. Na primeira
execução, sem considerar anti-padrões, 36 pares são avaliados,
sendo 23 diretamente pelo especialista e 13 por métricas de
similaridade. Na segunda execução, quando são levados em
consideração anti-padrões, dos 52 selecionados, 47 pares são
avaliados, sendo 23 diretamente pelo especialista,13 por métricas de
similaridade e 11 pares foram classificados observando-se os antipadrões. Quando não se levou em consideração os anti-padrões, as
medidas de qualidade deste alinhamento foram: precisão = 0.722,
cobertura = 0.52 e medida-F = 0.604. Já utilizando anti-padrões, as
medidas de qualidade foram: precisão = 0.736, cobertura = 0.56 e
medida-F = 0.636.
[1] Guedes, A.. Baião F., Revoredo K. On the Identification and
Representation of Ontology Correspondence Antipatterns,
WoMO@FOIS, CEUR Workshop Proceedings, v. 1248, CEURWS.org, 2014
[2] Lopes V. Alinhamento Interativo de Ontologias: Uma
Abordagem Baseada em Query-by-Committee, Dissertação de
Mestrado, UNIRIO, Rio de Janeiro, RJ, Brasil, 2014
[3] Shvaiko P., Euzenat J. Ontology matching, Springer, 2a ed.,
2013
[4] Paulheim H., Hertling S., Ritze D. Towards Evaluating
Interactive Ontology Matching Tools, The Semantic Web:
Semantics and Big Data, LNCS 7882, pp 31-45, 2013
[5] Meilicke C. Alignment Incoherence in Ontology Matching,
Tese de Doutorado, Universidade de Mannheim, Alemanha, 2011
[6] Guedes A., Baião F., Revoredo K. Digging Ontology
Correspondence Antipatterns, Proceedings 5th International
Conference on Ontology and Semantic Web Patterns (WOP'14),
CEUR Workshop Proceedings, v. 1302, pp. 38-48, 2014
[7]
Simmetrics.
Disponível
em
www.coli.unisaarland.de/courses/LT1/2011/slides/stringmetrics.pd
f.
Acesso
em:
11/04/2016
[8] WEKA Manual, The University of Waikato, 2015.
[9] WS4J. Disponível em code.google.com/archive/p/ws4j/.
Acesso em: 11/04/2016
[10] Alignment API. Disponível em alignapi.gforge.inria.fr/.
Acesso em: 11/04/2016
6. CONCLUSÃO
Para avaliar se a utilização de anti-padrões aumenta a qualidade
de um alinhamento de ontologias gerado por uma abordagem
interativa, foi proposta a abordagem ALIN. Uma implementação
parcial da abordagem proposta foi avaliada sobre o conference
dataset da OAEI, comparando os resultados obtidos contra os
resultados da abordagem Jarvis, a qual não considera anti-
32
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Análise das fases do gesto: a influência do contexto na
execução das fases e na indução de modelos de
aprendizado de máquina supervisionado
Alternative Title: Analysis of phases of gesture: the influence of context on
implementation of phases and in the induction of supervised machine learning
models
Jallysson M. Rocha
Universidade de São Paulo
03828-000 São Paulo, Brasil
[email protected]
Sarajane M. Peres
Universidade de São Paulo
03828-000 São Paulo, Brasil
[email protected]
RESUMO
Gestos são ações que fazem parte da comunicação humana.
Eles ocorrem junto com a fala e se manifestam por ações
propositais, como o uso das mãos para explicar uma forma,
ou como padrões de comportamento, como coçar a cabeça.
Há diferentes linhas de estudo que exploram essa temática
e entre elas está a que analisa os gestos a partir de fases (descanso, preparação, stroke, hold e retração). Nesse
contexto faz-se útil o desenvolvimento de sistemas capazes
de automatizar a segmentação de um gesto em suas fases,
principalmente porque a partir da compreensão das fases é
possı́vel melhorar o entendimento do discurso possibilitando
melhorias interessantes para sistemas que visam propiciar
uma interação humano computador mais natural. Técnicas
de aprendizado de máquina supervisionado já foram aplicadas a este problema e resultados promissores foram obtidos.
Contudo, há uma dificuldade inerente à esta área, que se
manifesta na alteração do contexto de execução dos gestos.
Este é o problema abordado por esta pesquisa, a qual objetiva estudar a variabilidade do padrão inerente à cada uma
das fases do gesto quando executadas por um mesmo indivı́duo, porém em diferentes contextos de produção do discurso.
Palavras-Chave
Análise de Gesto, Fases do Gesto, Aprendizado de Máquina,
Máquina de Vetores Suporte
Clodoaldo A. M. Lima
Universidade de São Paulo
03828-000 São Paulo, Brasil
[email protected]
pattern of behavior, like scratching head. There are different
line of studies that explore this theme and among them is one
that analyzes the gestures from phases (rest, preparation,
stroke, hold and retraction). In this context it makes useful
the development of systems capable of automating the segmentation of a gesture in their phases, mainly because from
the understanding on phases it is possible to improve de
comprehension on discourse, supporting improvements for
system that aims to offer a more natural human-computer
interaction. Supervised machine learning techniques have
been applied to this problem and promising results were obtained. However, there is a difficulty inherent in the analysis of the phases of gesture, which manifests itself in changing the context in which the actions are executed. This is
the problem addressed by the research proposed here, which
aims to study the variability inherent pattern to each phase
of the gesture when they occur from the same individual,
though in different contexts of production of speech.
Categories and Subject Descriptors
H.4.m [Information Systems Applications]: Miscellaneous; I.5.4 [Pattern Recognition]: Applications—Computer Vision
General Terms
Experimentation
ABSTRACT
Keywords
Gestures are actions that are part of human communication.
They occur along with speech and may manifest by a deliberate action, as the use of hands to explain a shape, or as a
Analysis of Gesture, Gesture Phases, Machine Learning,
Support Vector Machine
1.
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise, to
republish, to post on servers or to redistribute to lists, requires prior specific
permission and/or a fee.
SBSI 2016, May 17th-20th, 2016, Florianópolis, Santa Catarina, Brazil
Copyright SBC 2016.
33
INTRODUÇÃO
Dentre as diferentes possibilidades de estudo dos gestos
está aquela que presume que os gestos são compostos por
unidades gestuais e estas, por sua vez, compostas por fases gestuais [4]. Gestos manuais são compostos por estas
fases e se constituem como o principal elemento da gesticulação natural realizada durante a comunicação. As fases
do gesto estão ligadas ao que Kendon [5] chamou de “movement excursions”. Segundo o mesmo autor, uma pessoa
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
faz uma ou várias “movement excursions” durante um discurso. Estas excursões se referem a movimentos das mãos
de alguma posição de descanso para uma região no espaço
na qual um movimento importante ocorre, e depois, de volta
para a posição de descanso. Toda a excursão do movimento
é chamada de unidade gestual, enquanto as posições que as
mãos assumem entre elas são chamadas de posições de descanso. Uma unidade gestual pode ser segmentada nas fases
do gesto: preparação, na qual a mão se move para a posição
em que o conteúdo do gesto será expressado; pré-stroke hold,
a qual é uma breve pausa no fim da preparação; stroke, que
contém o pico de esforço do gesto e expressa seu conteúdo
semântico; pos-stroke hold, que é uma breve pausa no fim de
um stroke; retração, na qual a mão retorna para a posição
de descanso. Adicionalmente, Kita [6] sugere que as fases
pré-stroke hold, stroke e pos-stroke hold compõem uma fase
expressiva do gesto, o hold independente, isto é, uma pausa
que expressa o conteúdo semântico do gesto.
Diferentes autores trabalham com análise automática das
fases (todas ou algumas em especı́fico) e fazem uso de algoritmos de aprendizado de máquina em seus estudos. Segundo [8], é pertinente definir “aprendizado de máquina”
(AM), de maneira ampla e genérica, dizendo que AM inclui
qualquer programa de computador que seja capaz de melhorar seu desempenho na resolução de alguma tarefa por meio
do uso da experiência. Considerando o ponto de vista deste
trabalho, o AM será implementado segundo os preceitos do
paradigma de aprendizado indutivo, no qual os argumentos
de raciocı́nio são baseados na extrapolação de premissas, ou
seja, conclusões gerais sobre o objeto de estudo são obtidas
a partir de um conjunto de premissas que representam um
conjunto particular de exemplos.
2.
APRESENTAÇÃO DO PROBLEMA
A manifestação dos gestos durante a comunicação, geralmente, é de fácil compreensão, mas pode assumir nı́veis mais
complexos de interpretação, a depender do aspecto sendo
analisado. Assim pesquisadores de diversas áreas são interessados em entender como se dá a relação dos gestos com
outros elementos do sistema linguı́stico, seja para suportar
estudos das áreas da Linguı́stica e da Psicolinguı́stica, seja
para melhorar a interação homem-máquina. Nesse contexto,
se faz útil o desenvolvimento de sistemas capazes de automatizar a segmentação de um gesto em suas fases, de forma
a tratar uma dessas relações, que decorrem da gesticulação
natural executada durante o discurso.
Porém, há uma dificuldade inerente à análise das fases do
gesto que se manifesta na alteração do contexto em que ele
é executado. Embora existam algumas premissas para definição do padrão de manifestação de cada fase do gesto, em
contextos diferentes, elas podem sofrer variações que levam
a análise automática para um nı́vel de alta complexidade.
O problema estudado nesse projeto de mestrado é motivado
pelos estudos de Ramakrishnan e Madeo [10, 7], que defendem que segmentar as fases do gesto é uma tarefa altamente
subjetiva e dependente do contexto de produção do discurso;
também, os autores modelaram o problema de segmentação
de gestos como uma tarefa de classificação a ser resolvida
por aprendizado de máquina supervisionado. Porém, os estudos citados fizeram estudos superficiais sobre a influência
do contexto na produção dos gestos, incluindo suas fases.
Assim, estabelece-se como hipótese nessa pesquisa que o
padrão de gesticulação natural, embora analisado em rela-
34
ção a um mesmo executor, é dependente do contexto de
execução. Variáveis como nı́vel de estresse ou de atenção,
objetivo de comunicação e público alvo, interferem na construção do discurso (fala e gestos). Modelos classificadores
têm um grau de sensibilidade à variabilidade de padrões, e
podem fornecer mecanismos para observá-la. A variabilidade advinda da mudança de contexto será percebida pelos
modelos e será medida a partir das alterações ocorridas no
seu desempenho. No intuito de verificar a hipótese delineada, assume-se como principal objetivo deste projeto de
mestrado a análise referente a se, e como, a segmentação
das fases do gesto manual, em função do contexto de execução, influenciam o desempenho dos classificadores, e ainda
a análise de se, e como, a avaliação de tal desempenho pode
revelar informações que comprovem as influências dos contextos sobre a manifestação dos gestos.
3.
PROPOSTA DE SOLUÇÃO
Esta pesquisa se caracteriza como uma pesquisa aplicada,
empı́rica, explanatória e quantitativa. Para alcançar os objetivos delineados e verificar a hipótese, estabelece-se como
meio de estudo a experimentação computacional aplicada
ao problema especı́fico de segmentação de fases do gesto.
A modelagem computacional para as experimentações recebem como entrada uma sequência de frames de vı́deo referente à captura da gesticulação natural durante a produção
de discursos em diferentes contextos. Os frames de vı́deos
são manipulados computacionalmente por meio de abstrações organizadas em estruturas de dados. A saı́da de cada
experimento é um modelo classificador capaz de predizer a
fase do gesto que ocorre em cada um dos frames do vı́deo.
Assim, as análises a serem desenvolvidos estarão baseadas
na observação de um conjunto de dados referentes à gesticulação, conferindo o caráter empı́rico à pesquisa. Ainda,
desta discussão conclui-se que esta pesquisa tem o intuito
de identificar fatores – a variabilidade no desempenho dos
modelos classificadores – que determinam a ocorrência de
um fenômeno – a influência do contexto sobre a execução
das fases do gesto – conferindo a ela o caráter explanatório.
Ainda como parte da solução proposta está a geração de
dois protocolos: (a) de aquisição de dados de forma que
o ambiente de experimentação contenha sessões de gesticulação com caracterizações variadas (monólogos e diálogos;
improvisação e descrição; exposição oral), obtidas a partir
de diferentes pessoas executando todos os contextos definidos em diferentes locais e turno; os dados serão captados
por sensores Microsoft Kinect, posicionados a uma distância
controlada, de forma a não causar incômodo; os dados serão
documentados para que seja possı́vel realizar a rotulação do
conjunto de dados; e (b) de avaliação do desempenho quantitativo dos classificadores, no que diz respeito à avaliação
de suas capacidades de segmentação das fases do gesto, e
no que diz respeito à comparação de seus desempenhos para
avaliação da variabilidade dos padrões que caracterizam as
fases do gesto em diferentes contextos.
Além disso, a análise dos dados proposta se baseia em
aprendizado supervisionado, então os dados serão rotulados
por pelo menos dois rotuladores, e análises de concordância [2, 1] serão realizadas. Os dados rotulados serão préprocessados e representados vetorialmente, de forma adequada para apresentação à técnica de Máquinas de Vetores
de Suporte, método amplamente utilizado em diversas áreas
de aplicação, incluindo análise de fases do gesto [10, 7].
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
4.
AVALIAÇÃO DA SOLUÇÃO
6.
Tradicionalmente, uma medida de avaliação aplicada a
classificadores é a acurácia. A acurácia de um classificador deve ser obtida em termos de seu erro de generalização.
Entretanto, para o caso de classificadores binários, é também necessário analisar a matriz de confusão e as medidas
de avaliação geradas a partir dela [3] e [9], com destaque
para a revocação, a precisão e taxa de falsos positivos, das
quais são derivadas a medida F-score a as curvas ROC.
No caso especı́fico da tarefa de análise de fases de gesto,
é interessante avaliar o desempenho do classificador sob o
ponto de vista de um especialista que usará o resultado produzido pelo algoritmo. Assim, como a abordagem aqui adotada está pautada na análise do vı́deo frame a frame e tratase de uma abordagem baseada em aprendizado supervisionado, medidas para análise de desempenho de classificadores
deveriam considerar que: (a) erros de classificação cometidos
na transição entre fases devem ser analisados de forma diferenciada dos erros cometidos dentro de uma fase – gerando
medidas de acurácia e matrizes de confusão ponderadas; (b)
a comparação do resultado do classificador à segmentação
realizada por um especialista deve ser feita de forma a considerar que a precisão da segmentação humana, assim como
a sua consistência, está sujeita a imprecisões nas regiões de
transições entre fases. Os autores em [10] e [7] adotaram
como medida adicional de avaliação dos classificadores o número de segmentos classificados corretamente, considerando
que porcentagens de frames (consecutivos e não consecutivos) corretamente classificados dentro de uma fase.
5.
ATIVIDADES JÁ REALIZADAS
Como parte do desenvolvimento do projeto, já foram realizados estudos exploratórios referentes à área de aplicação
(segmentação das fases do gesto) e da área de aprendizado
de máquina (geração e avaliação de classificadores e Máquinas de Vetores de Suporte). Atualmente, está em fase de
término a realização de uma revisão sistemática focada em
estudos que tratam da análise de gestos manuais considerando o contexto de execução ou a dependência ao usuário.
No ponto atual de desenvolvimento da revisão sistemática
já foi possı́vel verificar que não existem estudos tratando o
contexto e a dependência do usuário na área de aplicação
de segmentação das fases do gesto, além de [10, 7]. Porém,
há um volume grande de estudos que analisam tais aspectos
considerando outros tipos de análise de gestos. A transferência de conhecimento entre domı́nios, neste caso, pode ser de
grande valia para o presente projeto, principalmente no que
diz respeito à construção do ambiente de experimentação.
Para a execução da coleta de dados para a experimentação, um protocolo foi estabelecido e formalizado em projeto que está submetido a um comitê de ética em pesquisa.
Desde que a coleta de dados envolverá a participação de seres humanos, havendo necessidade de captação da imagem
das pessoas e de submetê-las a um processo com risco de
causar algum tipo de estresse, a aprovação por este comitê
se faz necessária. Também houve um avanço no estabelecimento dos protocolos de avaliação, como resumidamente
descrito no final da seção 4. Por fim, foram realizados alguns experimentos preliminares de reconhecimento do tipo
de dado que será trabalhado neste projeto, usando o Gesture
Phase Segmentation Data Set.1
1
https://archive.ics.uci.edu/ml/datasets/Gesture+
CONCLUSÃO
Este projeto tem como objetivo principal estudar como o
contexto influencia na execução das fases do gesto e, diante
da análise automática de gestos, como essa influência afeta
os modelos de análise. A partir da influência que tais modelos sofrem, pretende-se extrair informação que demonstre
o efeito sofrido pela gesticulação quando relacionada a diferentes contextos de discurso. Espera-se verificar a hipótese
delineada neste trabalho e também contribuir com a área de
análise de gestos em termos de: (a) proposição de protocolos de aquisição de dados, construção de experimentação e
de avaliação de resultados para a área de segmentação das
fases do gesto; (b) disponibilização de um conjunto de dados como um benchmark para a área. Tais contribuições
devem somar-se aos esforços de desenvolvimento de recursos
computacionais capazes de prover os sistemas de informação com a capacidade de interpretar a gesticulação humana,
possibilitando a construção de mecanismos mais eficientes
de mediação da interação entre humanos, ou de estabelecimento da interação entre humanos e máquinas ou ambientes.
Agradecimentos
Os autores agradecem o apoio das empresas Quantica e SPI
Sistemas e Automação Industrial.
7.
REFERÊNCIAS
[1] A. R. Alvares and N. T. Roman. Uma ferramenta para
análise da concordância entre múltiplos anotadores. In
Proc. of the 9th Brazilian Symp. in Inf. and Human
Language Tech., volume 1, pages 1–10, Oct. 2013.
[2] R. Artstein and M. Poesio. Inter-coder agreement for
computational linguistics. Comput. Linguist.,
34(4):555–596, Dec. 2008.
[3] T. Fawcett. An introduction to ROC analysis. Pattern
Recognition Letters, 27(8):861 – 874, 2006. ROC
Analysis in Pattern Recognition.
[4] A. Kendon. Gesticulation and speech: Two aspects of
the process of utterance. In M. R. Key, editor, The
Relationship of verbal and nonverbal communication,
pages 207–227. Mounton Publishers, 1980.
[5] A. Kendon. Gesture: Visible action as utterance.
Critical Inquiry in Language Studies, 5(1):72–77, 2004.
[6] S. Kita, I. Gijn, and H. Hulst. Gesture and Sign
Language in Human-Computer Interaction: Proc. of
Int. Gesture Workshop Bielefeld, chapter Movement
phases in signs and co-speech gestures, and their
transcription by human coders, pages 23–35. Springer,
Berlin, 1998.
[7] R. Madeo. Máquinas de vetores suporte e a análise de
gestos: incorporando aspectos temporais. Master’s
thesis, Universidade de São Paulo, Brasil, 2013.
[8] T. M. Mitchell. Machine Learning. McGraw-Hill, Inc.,
New York, NY, USA, 1 edition, 1997.
[9] D. M. W. Powers. Evaluation: From precision, recall
and F-measure to ROC, informedness, markedness e
correlation. J. of Machine Learning Tech., 2(1):37–63,
2011.
[10] A. S. Ramakrishnan. Segmentation of hand gestures
using motion capture data. Master’s thesis, University
of California, 2011.
Phase+Segmentation
35
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Fusão de Face e Forma de Andar para Reconhecimento
Biométrico
Alternative Title: Fusion of Face and Gait for Biometric Recognition
Edenilton L. Oliveira
Universidade de São Paulo
Av. Arlindo Bettio, 1000
03828-000 São Paulo, SP,
Brasil
[email protected]
Clodoaldo A. M. Lima
Universidade de São Paulo
Av. Arlindo Bettio, 1000
03828-000 São Paulo, SP,
Brasil
[email protected]
RESUMO
Recentemente, esforços têm sido realizados visando empregar diversas modalidades biométricas de forma a tornar o
processo de identificação menos vulnerável a ataques. A
multimodalidade é baseada no conceito de que informações
obtidas a partir de diferentes modalidades se complementam. Consequentemente, uma combinação adequada dessas
informações pode ser mais útil que o uso de informações
obtidas a partir de qualquer uma das modalidades individualmente. Por exemplo, identificação facial é mais confiável quando a pessoa está perto da câmera. Por outro
lado, a forma de andar é uma modalidade biométrica apropriada para identificação humana à distância. Portanto, as
propriedades complementares destas duas modalidades de
biometria sugerem sua fusão. O objetivo desta pesquisa é
investigar, propor e avaliar novas técnicas para fusão de face
e forma de andar usando abordagem livre de modelo para
usuários não cooperativos em ambiente não controlado.
Sarajane M. Peres
Universidade de São Paulo
Av. Arlindo Bettio, 1000
03828-000 São Paulo, SP,
Brasil
[email protected]
two biometrics modalities suggest fusion of them. The objective of this research is to investigate, propose and evaluate
new techniques for fusion of face and gait using model-free
approach to non-cooperative users in non-controlled environment.
Categories and Subject Descriptors
H.4.m [Information Systems Applications]: Miscellaneous; I.5.4 [Pattern Recognition]: Applications—Computer Vision
General Terms
Documentation
Keywords
Multimodal biometrics, Biometric Fusion, Feature Extraction, Gait, Face
Palavras-Chave
1.
Biometrica Multimodal, Fusão Biométrica, Extração de Caracterı́stica, Forma de Andar, Face
Identificação humana a partir de visualizações arbitrárias
do usuário e a distância é um requesito importante para diferentes tarefas, tais como, interfaces perceptuais para ambientes inteligentes, sistemas de vigilância e controle de acesso,
etc [5][11][3]. Além disso, esta é adequada para usuários não
cooperativos em ambientes não controlados. Diferentes modalidades podem ser usadas para identificação baseada na
distância entre o individuo e a câmera. Se a pessoa está
longe da câmera, é difı́cil obter informação facial em alta resolução para tarefa de reconhecimento. Entretanto, quando
disponı́vel, esta contém informação relevante para reconhecimento. Uma modalidade que pode ser detectada e medida
quando o individuo está longe da câmera é a forma de andar. Para alcançar desempenho ótimo, o sistema deve usar
todas as informações disponı́veis e combiná-las de maneira
significativa.
Reconhecimento biométrico facial é uma área bastante desenvolvida para ambientes controlados, nos quais há um controle sobre variáveis como ângulo de rotação da câmera e
iluminação, porém para ambientes não controlados ainda é
uma área de pesquisa em aberto [9]. Por outro lado, a forma
de andar é mais adequada para ambientes não controlados
por ser menos sensı́vel a interferências do ambiente externo.
Portanto, as propriedades complementares destas duas modalidades de biometria justificam sua fusão.
ABSTRACT
Recently, big efforts have been undertaken aiming to employ
multiple biometric modalities in order to make the identification process less vulnerable to attacks. Multimodality
is based on the concept that the information obtained from
different modalities complement each other. Consequently,
an appropriate combination of such information can be more
useful than using information from single modalities alone.
For example, face identification is more reliable when the
person is close to the camera. On the other hand, gait is
a suitable Biometric modality for human identification at a
distance. Therefore, the complementary properties of these
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise, to
republish, to post on servers or to redistribute to lists, requires prior specific
permission and/or a fee.
SBSI 2016, May 17th-20th, 2016, Florianópolis, Santa Catarina, Brazil
Copyright SBC 2016.
36
INTRODUÇÃO
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Este artigo está organizado da seguinte forma: a Seção 2
apresenta o problema de fusão de face e forma de andar para
o reconhecimento biométrico, a Seção 3 descreve a abordagem proposta para o problema, a Seção 4 detalha o processo
de avaliação dos resultados, a Seção 5 descreve as atividade
já realizadas e, por fim, a Seção 6 apresenta a conclusão.
2.
APRESENTAÇÃO DO PROBLEMA
Um sistema biométrico consiste de um sistema de reconhecimento de padrões que recebe como entrada uma caracterı́stica biométrica coletada do indivı́duo por meio de sensores,
extrai as caracterı́sticas relevantes e as compara com as caracterı́sticas do indivı́duo previamente armazenadas em um
banco de dados. Este fornece como saı́da a identidade do
indivı́duo [7]. Um sistema biométrico possui quatro módulos ([10]: i) módulo sensorial - responsável pela captura das
amostras biométricas; ii) módulo de extração de caracterı́sticas - responsável por extrair caracterı́sticas relevantes a
fim de representar as amostras; iii) módulo de classificação responsável por mapear cada vetor do espaço de caracterı́sticas para uma variável independente (escore); iv) módulo
de decisão - responsável por aplicar uma função (geralmente
uma função sinal) sobre a variável escore para determinar
a decisão final do sistema, isto é, a identidade do indivı́duo
[2].
O problema de identificação humana a partir de uma ou
mais imagens faciais surgiu por volta de 1960, quando pesquisadores de visão computacional começaram a abordar o
tema. O reconhecimento biométrico é feito através do processamento de imagens da face do usuário capturada por
uma ou mais câmeras, logo o desempenho do sistema depende da qualidade das imagens. Em geral, o reconhecimento facial é sensı́vel ao ângulo de rotação da câmera, à
baixa resolução da imagem e a artefatos usados pelos indivı́duos [1].
A forma de andar pode ser capturada com imagens de
baixa resolução e a distância, esta (quase) não sofre com as
variações de iluminação. Por outro lado, pode ser afetada
por uma quantidade maior de fatores que causam variações
intraclasses como fundo da imagem, tipo de superfı́cie, objetos transportados e uma quantidade inumerável de fatores
não previstos que podem aparecer em cenários reais [1]. Essas variações podem afetar diretamente a detecção da silhueta e indiretamente o desempenho do sistema [5].
Um sistema biométrico multimodal integra duas ou mais
modalidades biométricas [7]. A integração pode ser realizada de diferentes formas e pode ser categorizada de acordo
com a sua arquitetura, nı́vel de fusão e estratégia de fusão.
[10]. Há diferentes decisões a serem tomadas durante a fase
de modelagem de um sistema biométrico multimodal baseado em face e forma de andar. Dentre as principais, pode-se
citar: a) a forma de obtenção das caracterı́sticas biométricas pode ser cooperativa ou não-cooperativa por parte dos
usuários; b) o ambiente de captura das imagens pode ser
controlado ou não-controlado a depender, se existe ou não,
controle sobre variáveis como o ângulo de rotação da câmera, iluminação, entre outras; c) a abordagem pode ser
livre de modelo ou baseada em modelo, isto é, se as caracterı́sticas são extraı́das diretamente dos pixels das imagens
ou a partir de um modelo geométrico respectivamente [1];
d) a fusão pode ocorrer no nı́vel sensorial (fusão dos dados),
extração de caracterı́sticas (fusão dos vetores de caracterı́sticas) [15][12], escores (fusão de escores retornadas pelos
37
modelos) [5][14][13][9] e decisão (fusão de decisões ou rótulos de classes preditos pelos subsistemas) [4]. As decisões
tomadas durante a fase de modelagem formam um conjunto
de configurações que o sistema terá e influencia diretamente
no desempenho do sistema.
3.
PROPOSTA DE SOLUÇÃO
A abordagem proposta consiste em combinar cada modalidade biométrica utilizando técnicas de extração de caracterı́sticas distintas (multimodalidade intramodal) para, em
seguida, realizar a fusão intermodal de face com forma de andar, visando produzir sistemas de reconhecimento com maior
desempenho e robustez. A abordagem proposta baseia nos
experimentos de Liu e Sarkar[9] sobre a multimodalidade
intramodal para face e forma de andar com fusão no nı́vel
sensorial. Liu e Sarkar concluı́ram que, com base nos modelos gerados, a combinação intermodal tem maior chance de
alcançar maior desempenho. A proposta desse trabalho vai
avaliar a multimodalidade intramodal e intermodal no nı́vel
de extração de caracterı́sticas e decisão. As contribuições
serão as seguintes: estender o trabalho de Liu e Sarkar para
nı́vel de extração de caracterı́sticas e decisão; avaliar a questão de pesquisa seguindo um protocolo de experimentação
claro, delimitado, livre de viés e com condições de repetibilidade para, empiricamente, induzir novos conhecimentos
sobre fusão de face e forma de andar para reconhecimento
biométrico para fins de se alcançar os objetivos almejados
(pesquisa exploratória).
4.
PROJETO DE AVALIAÇÃO DA SOLUÇÃO
Serão utilizadas medidas de avaliação propostas na literatura, tais como, taxa de falsa aceitação e falsa rejeição.
Os resultados dessa avaliação serão utilizados para verificar
se os objetivos foram alcançados. Grupos de controle serão
estabelecidos para avaliar uma variável por vez e estabelecer comparações com a variável estudada e a variável que
não sofreu alteração. No contexto dessa pesquisa, os grupos
de controle serão os seguintes: experimentos usando somente
imagens de face, experimentos usando somente forma de andar. Estes grupos serão utilizados para avaliar os benefı́cios
da fusão de face e forma de andar. O mesmo procedimento
se repete para avaliar outras variáveis do sistema.
5.
ATIVIDADES JÁ REALIZADAS
Este projeto usa visão computacional, processamento de
sinais e aprendizagem de máquina. As principais técnicas
utilizadas são: transformação, rastreamento, segmentação,
normalização, estimação de ciclo do passo, extração de caracterı́sticas e reconhecimento de padrões.
Primeiro, o vı́deo foi transformado em frames, depois foi
realizado o rastreamento da pessoa nas sequências de frames
seguido da segmentação da silhueta humana. A segmentação
da silhueta foi realizada pela subtração do fundo da imagem
original, isto é, s(x, y) = th(If (x, y) − Ib (x, y), k) onde s é
a imagem da silhueta, If é a imagem contendo a pessoa,
Ib é a imagem de fundo, (x, y) são coordenadas e th(a, b)
é uma função que retorna 0 se a < k e 1 caso contrário.
Após a segmentação, a silhueta é recortada e normalizada
para resolução 128 × 64. A Figura 1 mostra o resultado da
aplicação dessas técnica.
As fases do ciclo mostradas na Figura 1 foram estimadas
com base em uma série temporal obtida a partir do cálculo
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Agradecimentos
Os autores agradecem o apoio das empresas Quantica e SPI
Sistemas e Automação Industrial.
7.
Figura 1: Sequência de silhuetas humanas com uma
estimativa para as fases do ciclo da forma de andar
da esquerda para a direita: contato do calcanhar,
pé plano, apoio médio, apoio terminal, pré-gingado,
gingado médio inicial, gingado terminal.
da área da silhueta no tempo t [8], calculada usando momentos estatı́sticos [6]. Um momento estatı́stico de ordem
p + q é dado por:
w−1
X h−1
X p q
Mpq =
x y s(x, y)
(1)
x=0 y=0
O momento de ordem 0 representa a área da forma de andar e a série é dada por Y (t) = M00 (S(t)), onde S =
{s0 , s1 , s2 , · · · , sN } uma sequência de N imagens de silhuetas. A Figura 2 mostra a série temporal com a área escalonada no intervalo (0, 1), gerada a partir desse procedimento
com uma estimativa dos picos da série marcados em vermelho. A partir da informação de periodicidade é possı́vel
estimar as silhuetas que demarcam as sete fases do ciclo.
Figura 2: Área da silhueta ao longo do tempo com
picos estimados em vermelho.
6. CONCLUSÃO
Este projeto tem como objetivo principal investigar, propor e avaliar novas técnicas para fusão de face e forma de andar para reconhecimento biométrico. Dentre as atividades já
realizadas encontra-se o pré-processamento da forma de andar: transformação dos dados, segmentação e normalização
das imagens de silhuetas, estimação das fases do ciclo via detecção de periodicidade da série temporal formada pela área
da silhueta ao longo do tempo. As atividade seguintes são
aplicar pré-processamento em face, implementar métodos de
extração de caracterı́sticas, construção dos modelos indutivos, definição de protocolo para a experimentação, avaliação
dos resultados e escrita da dissertação. Espera-se que este
trabalho contribua com a área de reconhecimento biométrico
multimodal em termos de: a) validação das técnicas de fusão
já existentes; b) extensão e proposição de novas técnicas de
fusão; c) maior desempenho e robustez a ataques.
38
REFERÊNCIAS
[1] I. Buciu. Challenges and specifications for robust face
and gait recognition systems for surveillance
application. J. of Electrical and Electronics
Engineering, 7(1):25–30, 2014.
[2] M. Gavrilova, M. Monwar, and I. Global. Multimodal
Biometrics and Intelligent Image Processing for
Security Systems. IGI Global, 2013.
[3] Y. Guan, X. Wei, C.-T. Li, and Y. Keller. People
identification and tracking through fusion of facial and
gait features. In V. Cantoni, D. Dimov, and
M. Tistarelli, editors, Biometric Authentication, pages
209–221. Springer, 2014.
[4] Y. Guan, X. Wei, C.-T. Li, G. Marcialis, F. Roli, and
M. Tistarelli. Combining gait and face for tackling the
elapsed time challenges. In Proc. of IEEE 6th Int.
Conf. on Biometrics: Theory, App. and Sys. (BTAS),
pages 1–8, Sept 2013.
[5] M. Hofmann, S. Schmidt, A. Rajagopalan, and
G. Rigoll. Combined face and gait recognition using
alpha matte preprocessing. In Proc. of 5th IAPR Int.
Conf. on Biometrics (ICB), pages 390–395, Mar. 2012.
[6] Z. Huang and J. Leng. Analysis of hu’s moment
invariants on image scaling and rotation. In Comp.
Engineering and Technology (ICCET), 2010 2nd Int.
Conf. on, volume 7, pages V7–476–V7–480, 2010.
[7] A. Jain, A. Ross, and S. Prabhakar. An introduction
to biometric recognition. Circuits and Sys. for Video
Tech., IEEE Transactions on, 14(1):4–20, 2004.
[8] J. J. Little and J. E. Boyd. Recognizing people by
their gait: The shape of motion, 1996.
[9] Z. Liu and S. Sarkar. Outdoor recognition at a
distance by fusing gait and face. Image and Vision
Comp., 25(6):817–832, 2007.
[10] A. Ross and A. Jain. Information fusion in biometrics.
Pattern Recognition Letters, 24(13):2115–2125, 2003.
[11] G. Shakhnarovich, L. Lee, and T. Darrell. Integrated
face and gait recognition from multiple views. In Proc.
of IEEE Conf. on Comp. Vision and Pattern
Recognition (CVPR), volume 1, pages I–439–I–446,
2001.
[12] X. Xing, K. Wang, and Z. Lv. Fusion of gait and facial
features using coupled projections for people
identification at a distance. IEEE Signal Processing
Letters, 22(12):2349–2353, Dec. 2015.
[13] X. Zhou and B. Bhanu. Integrating face and gait for
human recognition. In Proc. of Conf. on Comp. Vision
and Pattern Recognition Workshop (CVPRW), pages
55–55, Jun. 2006.
[14] X. Zhou and B. Bhanu. Integrating face and gait for
human recognition at a distance in video. IEEE Trans.
on Sys., Man, and Cyber., Part B: Cyber.,
37(5):1119–1137, Oct. 2007.
[15] X. Zhou and B. Bhanu. Feature fusion of side face and
gait for video-based human identification. Pattern
Recognition, 41(3):778–795, 2008.
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Metas Estratégicas Organizacionais como base para
Modelagem de Requisitos não Funcionais de Processos
de Negócio
Alternative Title: Strategic Organizational goals as the basis for Non-Functional
Requirements Modeling Business Processes
Adson do Carmo
Universidade de São Paulo
Rua Arlindo Béttio, 1000, Ermelino Matarazzo
São Paulo, Brasil
[email protected]
RESUMO
Este projeto de pesquisa propõe estender o framework StrAliBPM com a criação de uma camada de extração de informações de metas estratégicas organizacionais a serem usadas
na modelagem de requisitos não funcionais de processos de
negócio. De acordo com o framework StrAli-BPM original,
esses requisitos não funcionais devem ser representados no
formato de Acordos em Nı́vel de Negócio (BLA – Business
Level Agremment). Espera-se com este projeto contribuir
para a melhoria do alinhamento estratégico entre os nı́veis
estratégicos e os operacionais.
Palavras-Chave
Alinhamento estratégico; BPM; BPMN; KPI; BSC.
Categories and Subject Descriptors
K.6.1 [Management of Computing and Information
System]: Project and People Management - Management
techniques, Strategic information systems planning, Systems
analysis and design; H.4.1 [Information Systems Applications]: Office Automation – Workflow management.
General Terms
Theory
1. INTRODUÇÃO
Visando o alinhamento estratégico [11], é necessário compreender a importância dos requisitos não funcionais oriundos das metas estratégicas organizacionais (nomeadas neste
trabalho apenas como “metas estratégicas”). Segundo Xavier et al. [12] e Florio, Salles e Fantinato [4], a identificação
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise, to
republish, to post on servers or to redistribute to lists, requires prior specific
permission and/or a fee.
SBSI 2016, May 17th-20th, 2016, Florianópolis, Santa Catarina, Brazil
Copyright SBC 2016.
39
Marcelo Fantinato (orientador)
Universidade de São Paulo
Rua Arlindo Béttio, 1000, Ermelino Matarazzo
São Paulo, Brasil
[email protected]
dos requisitos não funcionais depende do tratamento das metas estratégicas. Assim, tratar requisitos não funcionais se
refere à busca dos interesses organizacionais. E este trabalho busca suprir a carência no tratamento desses requisitos
não funcionais, pois esses requisitos podem ser encontrados
nas metas estratégicas.
Indicadores Chave de Desempenho (KPI – Key Performance Indicator ) estão ligados às metas estratégicas [7].
Via KPI, pode-se verificar se a organização está tomando
medidas para alcançar suas metas estratégicas. A partir da
comparação entre uma meta estratégica e KPIs derivados,
caso os indicadores expressem valores fora da variação esperada pela meta estratégica, é necessário aplicar ações corretivas para direcionar a organização ao caminho desejado.
Indicadores Balanceados de Desempenho (BSC – Balanced
Scorecard ) também podem ser usados para preparar as organizações em focar e alinhar todos os setores na estratégia
organizacional [6]. Assim, BSC gera uma tendência no aumento do foco e do alinhamento estratégico organizacional.
Gestão de Processos de Negócio (BPM – Business Process
Management) tem sido usada no alcance do alinhamento
estratégico entre negócio e TI. BPM é a arte e a ciência de
supervisionar como o trabalho é executado na organização
em busca de resultados positivos visando adquirir vantagem
competitiva [3]. BPM trata de gerenciar cadeias inteiras de
eventos, atividades e decisões que trazem valor à organização
e aos clientes – os chamados “processos de negócio”.
Para apoiar o alinhamento estratégico, Salles [10] propõe
a modelagem de processos de negócio via uma extensão da
Notação e Modelo de Processos de Negócio (BPMN – Business Process Model and Notation) dentro de um framework
chamado StrAli-BPM (Strategic Aligment with BPM ). Esse
framework permite o uso de Acordos em Nı́vel de Negócio
(BLA – Business Level Agreements) na modelagem de requisitos não funcionais. Porém, StrAli-BPM não define quais
informações devem compor os requisitos não funcionais na
forma de BLAs, mas apenas como estruturá-las. Há apenas
a hipótese de que tais informações devem ser provenientes de
metas estratégicas. De acordo com Florido, Salles e Fantinato [4], BLAs são restrições não funcionais em nı́vel de modelo de processo, similar às restrições realizadas por Acordos
em Nı́vel de Serviço (SLA – Service Level Agreements) em
nı́vel de implementação de processos via serviços.
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
2.
APRESENTAÇÃO DO PROBLEMA
Em geral, pouco se oferece à modelagem de requisitos não
funcionais durante a modelagem de processos; a qual foca
primordialmente em requisitos funcionais. De acordo com
Py et al. [9], os requisitos não funcionais tendem a aparecer
apenas em etapas mais adiantadas do ciclo de vida de BPM.
Assim, a modelagem de processos de negócio ainda não
oferece apoio adequado ao tratamento de requisitos não funcionais [4]. De fato, o esperado seria que houvesse esse tratamento ao longo de todo o ciclo de vida de BPM, incluindo:
modelagem, implementação, execução e monitoramento de
processos [1, 9]. Essa lacuna dificulta o alinhamento estratégico entre negócio e TI: se, por um lado, a implementação de
processos conta com tratamento de requisitos não funcionais
(por meio de SLAs); por outro lado, os implementadores de
processo não possuem base sólida para a definição dos SLAs.
Para o nı́vel de modelo de processos, Bratanis et al. [2],
por exemplo, inspiraram-se no mundo real dos negócios para
definir outro tipo de acordo – o BLA. BLA é um acordo de
qualidade definido durante a modelagem do processo, a ser
apoiado posteriormente por um conjunto de SLAs relacionados aos serviços usados na implementação do processo.
Enquanto SLAs definem atributos de qualidade em nı́vel
de serviços na implementação do processo, sendo tratado em
nı́vel técnico; BLAs definem atributos de qualidade em nı́vel
de modelo de processo, ou seja, tratado em nı́vel tático e estratégico. O esperado é que seja possı́vel extrair informações
de BLAs para definir um conjunto associado de SLAs.
O framework StrAli-BPM foi proposto visando possibilitar a obtenção do alinhamento estratégico entre as áreas
de negócio e TI por meio do uso de BLAs e SLAs. Porém,
StrAli-BPM não define quais informações exatamente devem
compor os requisitos não funcionais na forma de BLAs, mas
apenas como estruturar tais informações a serem usadas na
sequência para a criação de SLAs. Assim, os analistas de
processo possuem meios para a criação de BLAs associados
aos processos de negócio, os quais representam os requisitos
não funcionais do processo, mas não são orientados a como
obter informações para definir esses requisitos não funcionais. Há apenas a hipótese de que tais informações devem
ser provenientes de metas estratégicas.
3. PROPOSTA DE SOLUÇÃO
A abordagem proposta busca semi-automatizar a extração de informações relevantes das metas estratégicas para a
definição dos requisitos não funcionais dos processos de negócio na forma de BLA. Assim, este trabalho visa estender
o framework StrAli-BPM para tratar essa sua limitação.
A Figura 1 apresenta uma visão geral do framework StrAliBPM original incluindo a extensão proposta. O novo elemento proposto é apresentado na cor cinza e ilustra o template usado para definir as informações que devem ser extraı́das das metas estratégicas. Do ponto de vista de requisitos
não funcionais do processo de negócio, BLAs fazem a ligação
entre o nı́vel mais alto (estratégico e tático) da organização
e a área de TI no nı́vel mais baixo (operacional). BLAs são,
portanto, responsáveis por garantir o alinhamento estratégico não só entre TI e áreas de negócio no nı́vel operacional,
mas entre o nı́vel operacional e os nı́veis estratégico e tático
da organização. Neste cenário, as metas estratégicas definidas em nı́vel estratégico, são usados como fonte de informações relevantes para a composição de BLAs. Embora as
40
Figura 1: Framework StrAli-BPM estendido
metas estratégicas possam ser úteis também para o levantamento dos requisitos funcionais do processo de negócio, isso
não é tratado no escopo deste trabalho.
As metas estratégicas são representadas no formato de
KPI ou BSC. Para a elaboração de tais metas estratégicas,
um template apropriado é proposto, baseado em um metamodelo que representa os atributos de KPI e BSC. A definição desse metamodelo e template associado são necessários
uma vez que não existem, na literatura, estruturas padronizadas para isso. A partir da estrutura proposta desse template, o conteúdo de metas estratégicas é analisado para que
informações relevantes à criação de BLAs sejam mapeadas
para as áreas de negócio responsáveis pela modelagem do
processo. A versão inicial da estrutura do template é apresentada na Tabela 1. Essa versão é um esboço do template
que deve dar suporte as informações do KPI e BSC.
O tratamento das informações de metas estratégicas organizacionais para modelagem dos requisitos não funcionais pode ocorrer de duas formas: (i) o nı́vel estratégico
já modela os requisitos não funcionais das metas estratégicas usando a estrutura proposta, se considerá-la apropriada
para seus propósitos; ou (ii) assumindo que os requisitos não
funcionais das metas estratégicas são criadas usando outra
estrutura, é necessário identificá-las e mapeá-las para a estrutura proposta.
Para apoiar a abordagem sendo proposta, pretende-se desenvolver um protótipo de ferramenta que apoie – de forma
semi-automatizada – tanto a definição das metas estratégicas na estrutura proposta (ou o mapeamento de metas
estratégicas definidas em outra estrutura para a estrutura
proposta) quanto a extração de informações relevantes e seu
mapeamento para os BLAs a serem criados. Para isso, o
apoio semi-automatizado deve ser dividido em etapas.
Caso as metas estratégicas não tenham sido definidas na
estrutura proposta, primeiramente, é necessário identificar
a fonte de dados de tais metas estratégicas, que pode estar
em diferentes formas, tais como: banco de dados, planilhas
eletrônicas, documentos texto, etc. Em seguida, é necessário definir a forma de consumo desses dados para o mapea-
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Atributo
Identificador
Contexto corporativo
Meta estratégica
– Aspecto a ser medido
– Métrica a ser atingida
Tabela 1: Template proposto para metas estratégicas
Descrição
Nome definido para o artefato
O cenário que levou a exploração da necessidade em questão
Detalhamento da meta (considerando o aspecto a ser medido e monitorado)
Descrição do aspecto que se deseja medir e acompanhar como meta estratégica
Valor ou percentual que deve ser cumprido para a meta estratégica em questão
mento para a estrutura proposta, o que pode ser realizado,
por exemplo, via stored procedures, queries, scripts, etc. Independentemente da forma em que se encontram os dados
das metras estratégicas, é necessário que os “atributos” que
compõem tais métricas sejam identificados. Por fim, as informações extraı́das devem ser convertidas para a estrutura
de template proposta para a representação de metas estratégicas. Essa última etapa deve ser realizada com o apoio
de um especialista, que deve usar o apoio computacional
para fazer a ligação entre dois esquemas diferentes de dados
(por exemplo, por meio do relacionamento entre atributos
de ambos os esquemas), mas que devem possuir conteúdo
equivalente. Se a organização optar por usar diretamente
tal estrutura, então esse conjunto de passos é ignorado.
Considerando as metas estratégicas na estrutura proposta,
a segunda etapa é realizada, também com o apoio de um
especialista. Para isso, é necessário localizar as informações
relevantes das metas estratégicas, exportá-las e oferecer para
o especialista como fonte de dados para a criação de BLAs
associados ao modelo de processo de negócio, que já deve estar criado. O apoio computacional deve oferecer um esboço
de BLA que pode ser confirmado ou alterado pelo especialista. Informações não possı́veis de serem extraı́das a partir
das metas estratégicas, mas ainda necessárias para a criação
de BLAs, deverão ser definidas pelo próprio especialista.
4. AVALIAÇÃO DA SOLUÇÃO
Planeja-se avaliar a abordagem proposta por meio de sua
aplicação em um cenário organizacional real. Para isso, alguma meta estratégica especı́fica da organização deve ser
identificada. Com base em tal meta, um especialista deve
usar a abordagem proposta para a criação de BLAs; enquanto outro especialista deve posteriormente validar se os
BLAs gerados refletem corretamente a meta estratégica usada.
Espera-se poder realizar esse procedimento com pelo menos
cinco metas estratégicas diferentes.
5. CONCLUSÃO
BPM tornou-se essencial às organizações na busca de vantagem competitiva por meio da melhoria de seus processos
de negócio. BPM pode favorecer o alinhamento estratégico
entre áreas de negócio e TI, sendo a TI um dos responsáveis finais pelo alcance de metas estratégicas [5]. Dentro
desse contexto, requisitos não funcionais precisam ser tratados corretamente para facilitar a obtenção tanto de alinhamento estratégico quanto de vantagem competitiva [8].
Este projeto de pesquisa de mestrado busca propor uma
abordagem que possa auxiliar neste contexto, por meio da
extensão do framework StrAli-BPM. A extensão aqui proposta visa apresentar mecanismos para que informações relevantes de metas estratégicas possam ser usadas para o levantamento de requisitos não funcionais a comporem os mo-
41
Qtde.
1
1
1...n
1
1
delos de processo de negócio, na forma de BLAs. Assim, os
BLAs criados poderão ser mapeados para SLAs ligados à implementação do processo de forma a garantir o alinhamento
estratégico completo dentro dos diferentes nı́veis organizacionais: estratégico, tático e operacional.
6.
REFERÊNCIAS
[1] P. Bocciarelli and A. D’Ambrogio. A BPMN extension
for modeling non functional properties of business
processes. In 2011 Symp. on Theory of Modeling &
Simulation: DEVS Integrative M&S Symp., pages
160–168. Society for Comp. Simul. Int., 2011.
[2] K. Bratanis, D. Dranidis, and A. J. Simons. Towards
run-time monitoring of web services conformance to
business-level agreements. In 5th Int. Academic and
Ind. Conf. on Testing–Practice and Research
Techniques, pages 203–206. Springer, 2010.
[3] M. Dumas, M. La Rosa, J. Mendling, and H. A.
Reijers. Fundamentals of business process
management. Springer, 2013.
[4] L. Florio, G. B. Salles, and M. Fantinato. Apoiando
alinhamento estratégico em organizações usando
contratos eletrônicos estendidos com BLA. In VIII
Simp. Bras. de Sist. de Inf.–Trilhas Técnicas, pages
348–359. Sociedade Brasileira de Computação, 2012.
[5] E. S. Galas and V. M. R. Ponte. O balanced scorecard
e o alinhamento estratégico da tecnologia da
informação: Um estudo de casos múltiplos. Revista
Contabilidade & Finanças, 17(40):37–51, 2006.
[6] R. S. Kaplan and D. P. Norton. Organização orientada
para a estratégia: Como as empresas que adotam o
balanced scorecard prosperam no novo ambiente de
negócios. Gulf Professional Publishing, 2000.
[7] R. Levin. The importance of key performance
indicators. J. of the American Dental Assoc., 2012.
[8] R. S. Pressman. Engenharia de software: Uma
abordagem profissional. 7a Edição. Ed: McGraw Hill,
Reading, Massachusetts, 2011.
[9] H. Py, L. Castro, F. A. Baião, and A. K. Tanaka. A
service-based approach for data integration based on
business process models. In 11th Int. Conf. on Enterp.
Inf. Sys., pages 222–227, 2009.
[10] G. B. M. Salles. Tratamento de acordos em processos
de negócio: Em busca de alinhamento estratégico.
Master’s thesis, Univ. de São Paulo, SP – Brasil, 2014.
[11] H. P. Sousa and J. C. S. do Prado Leite. Modeling
organizational alignment. In 33rd Int. Conf. on
Conceptual Modeling, pages 407–414. Springer, 2014.
[12] C. P. Xavier, Alencar. Integração de requisitos não
funcionais a processos de negócios: Integrando BPMN
e NFR. In 13th Work. em Eng. de Requisitos, pages
29–40. Sociedade Brasileira de Computação, 2010.
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Uma Plataforma para Análise e Recomendação de
Modelos de Processos Intensivos em Conhecimento
Alternative Title: A Platform for Analysis and Recommendation of
Knowledge Intensive Process Models
Pedro Henrique Piccoli Richetti
Fernanda Araujo Baião
Departamento de Informática Aplicada, UNIRIO
Av. Pasteur, 458 - Urca, CEP 22290-240
Rio de Janeiro – RJ – Brasil
[email protected]
Departamento de Informática Aplicada, UNIRIO
Av. Pasteur, 458 - Urca, CEP 22290-240
Rio de Janeiro – RJ – Brasil
[email protected]
RESUMO
INTRODUÇÃO
A introdução de novas tecnologias impulsionou a maneira como
processos de negócios podem ser modelados, implementados e
analisados. Há um interesse crescente pela manipulação de grandes
volumes de informação e a necessidade de novas técnicas para
análise e gestão de processos intensivos em conhecimento. Neste
trabalho é proposta a criação de uma plataforma de análise de
processos com o objetivo de descobrir modelos de processos
intensivos em conhecimento, sob diferentes perspectivas e
orientados à qualidade, que possam subsidiar e aprimorar a tomada
de decisão com base em informações de processos.
A gestão de processos de negócios (BPM) é cada vez mais utilizada
em organizações e em diversas plataformas em rede que incluem,
além dos tradicionais sistemas de suporte ao negócio, mídias
sociais e serviços móveis. A execução de fluxos de trabalho em
sistemas de suporte ao negócio pode deixar registros da execução
de instâncias de processos, e estes registros podem ser analisados
sob múltiplas perspectivas. Uma das possibilidades é a de realizar
a descoberta de como os processos de negócio são executados,
quais são os atores envolvidos e como melhorar a eficiência do
processo por meio da análise dos dados nestes registros de
execução do processo [1]. Os resultados desta análise podem ser
avaliados à luz da estratégia do negócio de forma a subsidiar
tomadas de decisão, que podem implicar em ações de melhoria de
processo e na criação de novos serviços e produtos, gerando valor
para a organização. É importante considerar que a influência dos
dados disponíveis para o gerenciamento de um processo pode ser
mais impactante que o poder normativo da visão estratégica do
negócio, e que as pessoas e suas interações sociais podem interferir
na dinâmica e na ordem estratégica de um processo, criando
variantes que vão além do processo previamente planejado [2].
Palavras-chave
Processos Intensivos em Conhecimento; Qualidade de Modelos;
Tomada de Decisão.
ABSTRACT
The introduction of new technologies propelled the way business
processes are modeled, implemented and analyzed. There is a
growing interest in handling large volumes of information and the
need for new techniques for knowledge-intensive process
management and analysis. This work proposes to create a platform
for process analysis which aims to discover models from
knowledge-intensive processes, from different perspectives and
quality-driven, which can support and enhance decision making
based on processes information.
Mesmo com o advento dos chamados sistemas orientados a
processos, é sabido que para descrever de forma completa um
processo de negócio, outros elementos precisam ser considerados,
como por exemplo, documentos e informações contextuais do
processo e da organização e o conhecimento tácito das pessoas
envolvidas no processo. Neste cenário, o desafio é integrar
diferentes fontes de informação e um grande volume de dados, que
podem estar dispersos em ambientes distribuídos, para gerar
informações assertivas que criem valor para o negócio,
principalmente nos processos com altos níveis de colaboração,
flexibilidade e tomadas de decisão, chamados de processos
intensivos em conhecimento (PIC) [3]. Tradicionalmente modelos
de processos de negócio utilizam uma representação do fluxo do
trabalho a ser realizado, com a identificação das atividades,
eventos, desvios e papéis envolvidos nos processos. No entanto,
para uma abordagem mais completa que represente todos os
aspectos de um processo, principalmente nos PICs, outras
perspectivas precisam ser explicitadas, requerendo linguagens e
notações de modelagem adicionais.
Categories and Subject Descriptors
H.3.1 [Information Storage and Retrieval]: Content Analysis and
Indexing – Abstracting methods, Linguistic processing.
H.5.0 [Information Interfaces and Presentation]: General
General Terms
Management, Performance, Design, Languages.
Keywords
Knowledge Intensive Processes; Model Quality; Decision Making
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise,
or republish, to post on servers or to redistribute to lists, requires prior
specific permission and/or a fee.
SBSI 2016, May 17–20, 2016, Florianópolis, Santa Catarina, Brazil.
Copyright SBC 2016.
A relevância desta pesquisa se justifica pelo interesse crescente pela
manipulação de grandes volumes de informação e na necessidade
de novas técnicas para análise e gestão de processos intensivos em
conhecimento. Como exemplo, recentemente foi criada a iniciativa
RISE-BPM [2] que tem por objetivo desenvolver novos horizontes
42
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
para gestão de processos de negócios, por meio de um consórcio
entre organizações de referência na área, com intuito de (a)
impulsionar a pesquisa em BPM para a era da computação social,
dos dispositivos inteligentes, computação em tempo real e big data;
(b) habilitar companhias a desenvolver novos produtos e serviços
para a modelagem e análise de processos de negócio. Um dos
elementos chave para estes objetivos é identificar áreas intensivas
em conhecimento em processos de forma a proporcionar a
aplicação de técnicas de gestão adequadas, tais como modelagem
de processos e indicadores de desempenho.
para que possam ser compreendidos e analisados pelas partes
interessadas de forma a suportar a tomada de decisão.
2. PROPOSTA DE SOLUÇÃO
2.1 Referencial Teórico
Modelos são necessários para a tomada de decisão em tarefas de
desenho, alteração e melhoria de processos de negócio [8].
Rosemann et al. [9] definem que sistemas inteligentes, capazes de
lidar com as diferentes facetas da organização e seus processos
podem servir como uma ferramenta poderosa para suportar os
gestores na tomada de decisão e em ações em ambientes complexos
e em constantes mudanças. Um exemplo é apresentado em Conforti
et al. [10] onde é proposta uma abordagem de suporte a decisão
para a redução de riscos na execução de processos.
Esta proposta visa estender a pesquisa realizada em [4], que teve
por objetivo tratar a complexidade da representação de modelos de
processos declarativos. Modelos declarativos podem ser utilizados
para representar a perspectiva de relacionamento entre as atividades
de PIC, permitindo modelar cenários pouco estruturados e com
elevada flexibilidade. No entanto, a abordagem em [4] não é capaz
de representar outras perspectivas de PIC, como socialização e
tomadas de decisão. A proposta corrente visa considerar aspectos
mais abrangentes, permitindo a criação de modelos com diferentes
perspectivas de modelagem, orientadas às demais características de
processos intensivos em conhecimento.
Di Ciccio et al. [3] realizaram um levantamento das principais
características e requisitos das abordagens atuais que podem lidar
com processos intensivos em conhecimento, e como resultado foi
constatado que nenhuma das abordagens avaliadas é capaz de
prover suporte a todos os requisitos para representação de
processos intensivos em conhecimento. A Ontologia de Processos
Intensivos em Conhecimento (KIPO) [6] se propõe a consolidar os
elementos que caracterizam este tipo de processo, tais como:
relacionamentos, fatores motivacionais, regras do negócio,
interações sociais, sentimentos, intenções relacionadas à execução
de uma ação do processo, e características de decisões tomadas. A
KIPO é capaz de explicitar um processo intensivo em
conhecimento, porém não oferece uma notação visual para a
construção de modelos. Neste contexto, foi proposta a Notação de
Processos Intensivos em Conhecimento (KIPN) [11], uma notação
para representar os conceitos inerentes aos processos definidos na
ontologia KIPO de forma cognitivamente eficaz. No entanto, a
existência de uma notação adequada ainda não é suficiente, pois
deixa a cargo do modelador ou gestor a tarefa crucial de selecionar,
de forma dinâmica, quais as perspectivas mais relevantes para a
análise em questão, levando em conta também as características dos
dados disponíveis e o potencial de valor agregado que uma
determinada visão ou diagrama de dados pode fornecer.
1. APRESENTAÇÃO DO PROBLEMA
A pesquisa e a prática discutiram a gestão de processos de negócio
de forma abrangente e foi identificado que o desalinhamento entre
as iniciativas relacionadas à processos e a estratégia organizacional
como a principal causa de insucesso na aplicação da gestão de
processos de negócios [2]. Nas organizações modernas, sistemas de
informação orientados a processos são responsáveis por uma
grande parcela de execução de processos de negócios. Tipicamente,
estes sistemas rastreiam e registram dados de eventos relativos a
instâncias de processos e de atividades com detalhes. No entanto,
em muitos casos, processos são executados através de várias
aplicações e ferramentas que são capazes de armazenar registros de
execução, mas que não são orientados a processos, ou ainda partes
da execução de processos não são registradas. Devido à grande
quantidade de informações estruturadas e não estruturadas sendo
criadas e distribuídas em diferentes redes e comunidades
atualmente, é preciso buscar novas formas de coletar informações
das diversas fontes distribuídas no ambiente organizacional,
armazená-las, transformá-las e representá-las através de modelos
analíticos [5] para proporcionar a análise de desempenho e
conformidade do processo executado, possibilitando tomada de
decisões efetivas.
A mineração de processos é considerada uma disciplina situada
entre a inteligência computacional e a mineração de dados e
também entre a modelagem e análise de processos [1]. Seu objetivo
é prover conhecimento baseado em fatos e proporcionar suporte à
tomada de decisão, e sua base é a existência de um registro de
eventos. A adequação de um modelo de processo descoberto
depende dos parâmetros e algoritmos utilizados e do julgamento do
analista do processo [12].
Processos intensivos em conhecimento envolvem conceitos
complexos e subjetivos, tipicamente presentes no conhecimento
tácito das partes interessadas no processo [6]. Um PIC compreende
atividades
baseadas
na
aquisição,
compartilhamento,
armazenamento e reuso de conhecimento e colaboração entre
participantes, de forma que o valor agregado à organização depende
do conhecimento dos agentes do processo. Estes processos tratam
de decisões imprevisíveis, tarefas orientadas à criatividade e
execução dinâmica que evolui com base na experiência adquirida
pelos agentes do processo. Todas essas características são
obstáculos para a representação deste tipo de processo e os tornam
sujeitos a diferentes interpretações.
Abstrações são vistas como uma abordagem efetiva para
representar modelos legíveis, mostrando atividades agregadas e
omitindo detalhes irrelevantes [13]. O ajuste da granularidade de
um modelo depende da parte interessada na análise. Os gestores em
nível executivo tendem a apreciar modelos que descrevam um
processo em alto nível, permitindo tomar decisão rápidas e corretas.
Por outro lado, empregados que atuam na execução do processo são
interessados em especificações detalhadas do processo [14]. Baier
et al. [15] apresentaram um método para construir camadas de
abstração através do alinhamento de atividades e eventos de um
processo. O seu objetivo é abstrair um registro de eventos para o
mesmo nível de abstração desejado pelo negócio, utilizando
conhecimento do domínio presente na documentação do processo.
Eshuis et al. [16] propuseram a construção de visões de processo.
Uma visão de processo pode, por exemplo, omitir detalhes de um
processo interno que são transparentes para o cliente. Richetti et al.
[17] propuseram uma metodologia para criação de abstrações em
Uma das principais vantagens associadas à utilização de modelos é
facilitar o entendimento comum de domínio e processos entre
usuários e especialistas [7]. Uma vez que se disponham de dados
para representar um PIC, o problema em questão é como tratar e
contextualizar de forma automática essas informações para
produzir modelos em quantidade e com características suficientes
43
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Figura 1. Processo proposto para análise e recomendação de modelos.
modelos de processos declarativos baseados na semântica dos
nomes das atividades.
utilizando processamento de linguagem natural e para cada
questão, identificar os objetivos relacionados (gargalos,
ineficiências e outros problemas que possam influenciar os
resultados do processo). Uma vez interpretada a questão, devem ser
definidas quais são as fontes de dados necessárias para apresentar
modelos de interesse recomendados que permitam à parte
interessada obter uma resposta. São exemplos de fontes de dados:
registros de eventos, bases de dados, modelos de processos
existentes, regras de negócios, dados externos (e.g. mídias sociais)
e outros documentos relacionados ao processo.
A qualidade em modelos de processo foi discutida por Reijers et al.
[18] onde foi apresentado um framework de gestão de qualidade
que visa produzir modelos melhores, utilizando uma coletânea de
métodos, técnicas e ferramentas existentes na literatura. São citados
três aspectos de qualidade: a sintática, a semântica e a pragmática.
A qualidade sintática trata da conformidade do modelo às regras e
vocabulário da linguagem de modelagem utilizada. A qualidade
semântica se refere a produzir modelos que façam afirmações
verdadeiras sobre o fenômeno a que se propõem representar. A
qualidade pragmática está relacionada a produzir modelos que
sejam compreendidos pelas pessoas.
É importante considerar que os dados selecionados podem estar
armazenados em ambientes distribuídos e necessitarão de
integração para que seja possível processar e apresentar evidências
para a resposta, assim será possível construir modelos baseados na
KIPO com qualidade suficiente para comunicar os resultados à
parte interessada, que poderá interagir com a plataforma até
satisfazer a sua necessidade em questão. Durante a atividade de
geração serão empregadas técnicas para aumentar a qualidade dos
modelos, e.g. a utilização de ontologias de fundamentação para
melhoria da qualidade semântica. Caso existam mais questões, o
processo se repetirá, caso contrário a análise será encerrada. A
Figura 1 apresenta o fluxo proposto para este processo. A
plataforma a ser construída deverá ser apropriadamente avaliada
sob perspectivas técnicas e de usuário.
Ribeiro et al. [19] propuseram um sistema de recomendação para
descoberta de processos. Esta abordagem limitou-se à seleção de
algoritmos de mineração de processos estruturados que resultam
em modelos orientados a controle de fluxo de atividades.
2.2 Enfoque de Solução
Dada a problematização descrita na seção 2 e a hipótese: se forem
utilizadas técnicas para avaliar a qualidade de informações
históricas sobre processos intensivos em conhecimento e de seu
contexto então será possível descobrir e apresentar modelos em
quantidade e qualidade necessárias para a tomada de decisão de
uma parte interessada no processo, as seguintes questões de
pesquisa nortearão a criação e avaliação da solução proposta:
3. PROJETO DE AVALIAÇÃO DA
SOLUÇÃO
Q1) Quais informações são necessárias para entender e aprimorar
um processo intensivo em conhecimento?
Para as atividades de pesquisa desta proposta será utilizado o
paradigma de design-science [20]. O foco principal do design não
é descobrir como as coisas são, mas sim como devem ser
construídas para atender a determinados objetivos ou funções [21].
Um objeto construído na disciplina de BPM é um artefato de
tecnologia de informação composto por: construtos, modelos,
métodos e implementações de software. Construtos são as
linguagens e conceitos necessários para caracterizar um fenômeno.
Modelos são utilizados para descrever tarefas, situações ou
artefatos. Métodos são formas de executar atividades orientadas a
objetivos. Implementações são necessárias para instanciar os outros
tipos supracitados de forma a permitir a execução de tarefas
específicas [22]. No caso de um artefato de tecnologia de
informação, criado por meio desse processo, ser considerado
inadequado, ele pode ser revisado de forma a aprimorar seu
desempenho através de ciclos de design, de forma que nenhum
Q2) Quais visões ou perspectivas do processo são necessárias?
Q3) Quão representativo é um modelo em relação às informações
históricas disponíveis?
Estas questões levam a necessidade de considerar aspectos tais
como: abstrações em modelos de processo, critérios de qualidade
de modelos (sintáticos, semânticos, estruturais e também
pragmáticos) e granularidade de informação desejada pela parte
interessada na análise. Será realizado um levantamento dos
aspectos de qualidade existentes e a possível proposta de novos
critérios que permitirão avaliar a qualidade e recomendar os
melhores modelos em um dado cenário. A ideia principal da
solução consiste em uma plataforma de análise do processo
intensivo em conhecimento orientada a questões propostas por uma
parte interessada. Deve ser realizada análise da sentença da questão
44
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
problema conceitual possa interromper o processo de pesquisa
subsequente. À luz deste paradigma, a pesquisa será conduzida e
avaliada através dos seguintes estágios:
[4] Richetti, P.H.P. 2015. Complexity Reduction of Declarative
Process Models Using a Semantic Abstraction Criterion.
Dissertação de Mestrado, UNIRIO.
(2) Pesquisa empírica por meio de estudos de caso, baseada em
coleta, triangulação e teorização a partir de dados qualitativos e
quantitativos obtidos em campo, de forma a analisar os fatores e o
ambiente organizacional (contexto) que descrevem o fenômeno.
[6] França, J. 2012. Uma Ontologia Para Definição de
Processos Intensivos Em Conhecimento. Dissertação de
Mestrado, UNIRIO, Rio de Janeiro, RJ.
(1) Análise da literatura e pesquisa conceitual a fim de identificar o
estado da arte, trabalhos relacionados, os facilitadores tecnológicos
existentes e os fatores de impacto social.
[5] Chen, H., Chiang, R. H., Storey, V. C. 2012. Business
Intelligence and Analytics: From Big Data to Big Impact.
MIS quarterly, 36(4), 1165-1188.
[7] Moody, D. L. 2007. What makes a good diagram? Improving
the cognitive effectiveness of diagrams in is development.
Em: Advances in Information Systems Development, p. 481492, Springer US.
(3) Com os resultados da análise anterior, um conjunto de
princípios de design para reutilização de artefatos existentes de
tecnologia da informação aplicada a BPM será definido. Artefatos
adicionais serão criados para permitir a criação de uma plataforma
integrada para análise de processo.
[8] Aguilar-Saven, R. S. 2004. Business process modelling:
Review and framework. International Journal of production
economics 90.2. p. 129-149.
(4) Avaliações serão realizadas para demonstrar a capacidade da
plataforma em resolver o problema em questão. Serão realizados
experimentos e estudos de caso com dados reais de um sistema de
gerenciamento de serviços disponibilizados por uma empresa de
suporte de tecnologia de informação, cujas atividades caracterizam
um PIC. A avaliação qualitativa será baseada em entrevistas
estruturadas e aplicação de questionários. A análise quantitativa
consistirá na avaliação de métricas de qualidade aplicada aos
modelos descobertos em diferentes cenários de modo a comparar
os modelos e recomendar os de maior qualidade. Após cada
avaliação um novo ciclo de ajustes na plataforma será realizado até
que a hipótese seja confirmada ou definitivamente refutada. A
hipótese será válida se as recomendações automáticas, baseadas em
critérios de qualidade, forem similares ou superiores a julgamento
humano prévio. Caso as recomendações realizadas apresentem
qualidade inferior ao julgamento humano, a hipótese será refutada.
[9] Rosemann, M., vom Brocke, J. 2015. The six core elements
of business process management. Handbook on Business
Process Management 1. Springer Heidelberg, p. 105-122.
[10] Conforti, R., et al. 2013. Supporting risk-informed decisions
during business process execution. Advanced Information
Systems Engineering. Springer Heidelberg, p. 116-132.
[11] Manhães Netto, J. 2013. KIPN: uma notação visual para
modelagem de processos intensivos em conhecimento.
Dissertação de Mestrado, UNIRIO.
[12] Van der Aalst, W.M.P. 2011. Discovery, Conformance and
Enhancement of Business Processes. Springer, Heidelberg.
[13] Smirnov, S., Reijers, H.A., Weske, M. 2011. A Semantic
Approach For Business Process Model Abstraction.
Advanced Information Systems Engineering. Springer, p.
497-511.
4. ATIVIDADES JÁ REALIZADAS
O projeto de pesquisa está em fase inicial e estão em andamento a
análise de literatura e a realização da pesquisa conceitual.
[14] Polyvyanyy, A., Smirnov, S., Weske, M. 2015. Business
Process Model Abstraction. Em: Handbook on Business
Process Management 1. Springer, p. 147-165.
5. CONSIDERAÇÕES FINAIS
[15] Baier, T. Mendling, J. 2013. Bridging abstraction layers in
process mining by automated matching of events and
activities. Business Process Management, p. 17–32.
O objetivo final da solução é prover uma plataforma que torne a
análise de PIC mais simples e intuitiva para usuários não
especialistas em BPM. Esta plataforma deverá ser orientada à
conteúdo e ser capaz de identificar que tipo de informação pode ser
recuperada com os dados disponíveis, interagir com os usuários e
guiá-los através das melhores opções disponíveis, entre algoritmos,
parâmetros e tipos de modelos, para ao final apresentar resultados
que os auxiliem na tomada de decisões.
[16] Eshuis, R., Grefen, P. 2008. Constructing Customized
Process Views. Data & Knowledge Engineering, p. 419-438.
[17] Richetti, P.H.P., Baião, F.A, Santoro, F.M. 2014. Declarative
Process Mining: Reducing Discovered Models Complexity by
Pre-Processing Event Logs. Business Process Management.
Springer, p. 400-407.
6. FINANCIAMENTO
Esta pesquisa é realizada no contexto do Projeto RISE-BPM
(www.rise-bpm.eu). A 2ª autora conta com financiamento parcial
do CNPq, sob o projeto 309069/2013-0.
[18] Reijers, H. A., Mendling, J., Recker, J. 2015. Business
process quality management. Em: Handbook on Business
Process Management 1, Springer, p. 167-185.
7. REFERÊNCIAS
[19] Ribeiro, J., Carmona, J., Mısır, M., Sebag, M. 2014. A
recommender system for process discovery. Em: Business
Process Management. Springer, p. 67-83.
[1] Van der Aalst, W.M.P et al. 2012. Process mining manifesto.
In: BPM workshops. Springer, p.169-194.
[20] March, S.T., Smith, G.F. 1995. Design and natural science
research on information technology. Decision Support
Systems 15, 4, p. 251–266.
[2] Becker, J. et al. 2015. Propelling Business Process
Management by Research and Innovation Staff Exchange,
http://www.rise-bpm.eu/. Último acesso em 03/2016.
[21] Simon, H. 1969. The sciences of the artificial. Cambridge, 1,
3rd, p. 123.
[3] Di Ciccio, C., Marrella, A., Russo, A. 2012. Knowledgeintensive overview of contemporary approaches. Knowledgeintensive Business Processes, p. 33.
[22] Hevner, A.R., March, S.T., Park, J., Ram, S. 2004. Design
Science in Information Systems Research. MIS Quarterly 28,
1, P. 75–10
45
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Project management best practices for cyber-physical
system development
Filipe Palma
Marcelo Fantinato (Orientador)
Escola de Artes, Ciências e Humanidades
Rua Arlindo Béttio, 1000
Sao Paulo – SP, Brasil
Escola de Artes, Ciências e Humanidades
Rua Arlindo Béttio, 1000
Sao Paulo – SP, Brasil
[email protected]
[email protected]
ABSTRACT
Cyber-Physical Systems (CPS) represent the convergence of
physical processes and computational platforms into technological solutions composed by sensors, actuators and software. Such as for other types of projects, Project Management (PM) practices can benefit a CPS development project.
Due to some particularities of CPS, such as multidisciplinary
team (the development of a CPS depends on the cooperation of many professionals of very different areas) and high
innovation aspect (mixing different areas with computing requires most new technologies), generic PM practices may not
be enough to enhance project success. Therefore, specific
practices are proposed for better managing CPS projects,
called CPS-PMBOK approach. CPS-PMBOK is based on
the Project Management Institute’s PMBOK body of knowledge. It is focused on the scope, human resources and stakeholder management areas; which were chosen considering a
systematic literature review conducted to identify the main
CPS challenges.
Categories and Subject Descriptors
C.3 [Special Purpose and Application-Based Systems]:
Real-time and embedded systems; K.6.1 [Management of
Computing and Information Systems]: Project and
People Management—Management Techniques
General Terms
Management
Keywords
Project management; Cyber-physical systems; PMBOK
1. INTRODUCTION
Computing systems aiming to reproduce and understand
the real world led to a new technological system field, called
Cyber-Physical Systems (CPS) [12, 13]. Merging areas from
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise, to
republish, to post on servers or to redistribute to lists, requires prior specific
permission and/or a fee.
SBSI 2016, May 17th-20th, 2016, Florianópolis, Santa Catarina, Brazil
Copyright SBC 2016.
46
embedded systems, mechanical engineering, software, among
others [7], CPS gained remarkable advances in science, such
as medical surgery, autonomous vehicles, energy harvesting
and smart buildings [11]. CPS are composed of: sensors,
which read environmental signs such as light, electrical current, humidity, etc.; computing platforms, which process the
sensors’ information according to environment needs; and
actuators, which send processed information to other sensors and stimulate the environment [6]. Many CPS present
network elements, since several computing platforms may
communicate reliably itself, often far apart.
CPS projects tend to be large, complex and groundbreaking, with innovative algorithms and technologies [2, 12, 13].
An important CPS feature is multidisciplinarity since CPS
merge computing and physic world concepts. A CPS project
may be considered software engineering, civil engineering,
experimental physics or natural sciences projects [2, 7].
Project Management practices aim to enhance the probability of success during a product or service development [8].
The Project Management Institute (PMI) gathers best practices in a body of knowledge – called PMBOK [10], which
presents tools and techniques for a better management. PMBOK also presents concepts for the project organization
through “process groups” and “knowledge areas”.
Although PMBOK is a general purpose guide, specific
areas may benefit from adapted or focused project management practices, better driving project activities and preventing common weaknesses [8]. Assaf and Al-Hejji [1] and
Pandi-Perumal et al. [9] propose new techniques for stakeholder management, respectively, for construction projects
and for clinical research environments. For globally distributed projects, Deshpande, Beecham and Richardson [3]
and Golini and Landoni [4] address concerns on, respectively,
stakeholders, scope and human resources, and communications.
2.
PROBLEM STATEMENT
CPS projects presents two main characteristics: multidisciplinary team working together and technically innovative. According to Baheti and Gill [2], for instance, heterogeneous teams may face communication difficulties, requiring abstracted models for software and hardware development. The innovative aspect offers some challenges due
the uncertainty of new technologies used, such as computational platforms, programming languages and even novel
natural effects that can be recently discovered. In order to
evidence CPS-related project management challenges, a systematic literature review was conducted to search research
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
papers describing project management practices adopted in
CPS projects. For this review, we considered the number
of times that specific keywords related to each knowledge
area have been used as an importance degree of each area,
resulting in a relevance score. The review results indicated
that three knowledge areas are major concerns for authors:
scope (score: 608), human resources (score: 437) and stakeholder (score: 222). Therefore, we concluded that these
three knowledge areas may represent the biggest part of the
CPS challenges, although most authors described solutions
only for their own issues.
The results showed that many authors use agile methodologies, formalisms and project management practices not
necessarily related to PMBOK. Moreover, most of the issues
found were solved with specific solutions, mainly related to
technology, localization and culture. Many challenges related to technical comprehension and communication were
found, which resulted in abstracted models and techniques
for indicator traceability. All issues found are aligned with
the raised CPS features: innovation and multidisciplinarity.
3.
PROPOSED SOLUTION
Based on practices found in general literature, results from
the systematic review, PMBOK experience, and professional
skills, a set of best practices to manage CPS projects is being
created – called CPS-PMBOK. This approach is split in two
main views: characterization model, and knowledge areas
adaptation. Both views may be used for project managers
and aim to benefit the whole project team.
3.1
Characterization model
The characterization model aims to enhance comprehension of the project, application field, necessary technologies
and involved environment. The model is split in two characterizations: environment and complexity (see Figure 1).
The environment characterization defines how much the
CPS environment is surrounded by formalized processes; or
how chaotic and unpredictable is the environment. Four situations are given to help this definition, considering that
CPS environment requires: limited tasks; communication
with known group of devices; interaction with known group
of people; and following industrial standards or norms. The
manager may choose among:“little”, “medium” and “much”.
The more “much“ points, more well-defined the CPS environment is.
The complexity characterization is an evaluation of the
technologies usually found in CPS. It classifies the relevant
integration of CPS with elements in eight areas: mechanical
structures; network; sensors; actuators; data storage; user
interaction; legacy systems integration; and power energy
system. Supported by experts in each area, managers may
define among “few”, “average” and “many” for each area.
3.2 Knowledge areas adaptations
Focused on the three most addressed knowledge areas,
according to the systematic review conducted, the CPSPMBOK adapts some practices found in PMBOK and adds
new techniques, based on authors’ experience. Such adaptations are described in this subsection. The best practices
described in PMBOK may be enough for managing the remaining knowledge areas, even in a CPS context.
3.2.1
Scope management
The innovative aspect of CPS demands many revisions
and redefinitions of scope [5]. Since this is an usual practice
in CPS projects, an additional process is proposed for scope
management, aiming to reduce the impacts of requirements
constant changing. This new process is called “review requirements”. Following principles of agile methodologies, its
purpose is to predict requirements changes.
Moreover, in order to support requirements gathering,
“pre-elaborated lists” should be applied [14]. The purpose
of such lists is to create reusable assets through gathering
common requirements found in CPS projects. It should aid
to estimate project size and avoid missing requirements.
3.2.2
Human resources management
Due to many different areas involved in a CPS project, different specialists, with rather different technical background
may be part of the same team. As a consequence, two additional techniques are proposed in CPS-PMBOK for human
resources management: “cross training” and “team split”.
Cross training is a technique already briefly quoted in
PMBOK, proposed to reduce impacts when a team member leaves the project. Specifically for CPS projects, a cross
training should be always used to enable team members to
act as a communication bridge for different sub-teams.
The “team split” technique is included in CPS-PMBOK
in order to improve the development performance and avoid
inappropriate assignment of tasks. According to this technique, the project team should be split in sub-teams considering different application areas or project deliverables,
such as: mechanical design team, information system development team, and power bank development team.
3.2.3
Stakeholder management
CPS projects tend to involve academic researchers as well
as specialists, who are technical stakeholders with comprehension of the application area and engineering. As a consequence, an additional technique is proposed in CPS-PMBOK
for stakeholder management: “establish technical trust”. According to this technique, an internal specialist or an external consultant should be put in charge of following up the
project manager activities. This action is necessary to allow
stakeholders be more comfortable with the project progress.
Based on the different levels of demand and satisfaction of
stakeholders, “follow-up strategies” should be added in CPSPMBOK. For the project’s initiating stage, regular face-to-
Figure 1: CPS projects’ characterization model
47
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
face meetings should be adopted. For the subsequent stages
(planning, executing, and monitoring and controlling), sporadic participations of stakeholders should included during
planning and technical meetings. For the project’s closing
stage, the stakeholders should be able to follow up the final
results through workshops with live CPS demonstrations.
4.
EVALUATION
A research and development organization accepted to collaborate with the CPS-PMBOK evaluation, through the participation of three project managers. The planned evaluation is to have such project managers using CPS-PMBOK
in real projects. However, whereas projects are in different
development stages, the project managers may find limitations to apply some of the proposed practices. For example,
a team split cannot be carried out for a project at final
stages. For such projects, the evaluation of the proposed
practices should be carried out in view of previous experiences.
The managers should evaluate if the proposed practices
are feasible and would bring benefits to a CPS project. They
should be also encouraged to contribute with improvements
based on their organization’s practices and their own professional opinions. A questionnaire should be applied at the
end of the five-month evaluation time. So far, CPS-PMBOK
was presented and explained to the project managers and
two follow-up meetings took place. The follow-up meetings
were requested by the managers, who believe to be more
useful to present feedbacks rather than only answering a
questionnaire at the evaluation end.
5.
CONDUCTED ACTIVITIES
This research project was presented in a qualifying exam
on September 2015, with an examining board composed of
the advisor and two other professors (one internal and one
external to the graduate program). The remarks made by
the board have been addressed during the last five months
and research project is currently at the evaluation stage. In
terms of the approach evaluation, an initial presentation of
CPS-PMBOK was made, followed by two meetings to help
project choice and additional explanation. The first project
managers’ feedbacks were already received and registered,
and an additional follow-up meeting is planned before the
questionnaire application. Moreover, the research project
was presented at the “2nd workshop of master dissertations
in information systems” at the University of Sao Paulo on
October 2015. Finally, the results of the systematic review
conducted to define research priorities was submitted to the
ACM Computing Surveys journal on January of 2016. The
research project is expected to be finished on June 2016.
6.
CONCLUSIONS
The CPS field is in constant change raising a research
challenge. Different terms are used to define very similar
systems converged with the CPS context, such as: “system
of systems”, “hybrid systems”, “embedded Systems” and “internet of things”. The occurrence of several similar terms
brings difficulties to find similar and relevant works. On the
another hand, project management has been focused on traditional software development, neglecting other application
areas. Therefore, there is a demand for upgrading PMBOK’s
best practices to current types of systems such as CPS.
48
The CPS-PMBOK approach has already been revealed
useful for project managers, mainly for allowing them to:
rethink their own concepts in terms of current projects; improve comprehension of team member capacities; and review
the organization’s project management best practices. The
feedbacks collected so far from the project managers show
insights regarding the dependency on the: project’s life cycle adoption; development methodologies; project goals (e.g.
new product, new service, new technology, proof of concept,
preliminary study, etc.); and organizational policies.
7.
REFERENCES
[1] S. A. Assaf and S. Al-Hejji. Causes of delay in large
construction projects. Int. J. of Proj. Manag.,
24(4):349–357, 2006.
[2] R. Baheti and H. Gill. Cyber–physical systems. The
impact of control technology, 12:161–166, 2011.
[3] S. Deshpande, S. Beecham, and I. Richardson. Using
the pmbok guide to frame gsd coordination strategies.
In IEEE 8th Int. Conf. on Global Soft. Engin. (ICGSE
2013), pages 188–196. IEEE, 2013.
[4] R. Golini and P. Landoni. International development
projects by non–governmental organizations: An
evaluation of the need for specific project management
and appraisal tools. Impact Assess. and Proj. Appr.,
32(2):121–135, 2014.
[5] P. M. Huang, A. G. Darrin, and A. Knuth. Agile
hardware and software system engineering for
innovation. In IEEE Aerosp. Conf., pages 1–10. IEEE,
2012.
[6] E. A. Lee. Cyber physical systems: Design challenges.
In 11th IEEE Int. Symp. on Object Oriented
Real–Time Distributed Computing (ISORC 2008),
pages 363–369. IEEE, 2008.
[7] E. A. Lee and S. A. Seshia. Introduction to embedded
systems: A cyber–physical systems approach. 2011.
[8] A. Lester. Project management, planning and control:
Managing engineering, construction and
manufacturing projects to PMI, APM and BSI
standards. Butterworth–Heinemann, 2006.
[9] S. R. Pandi-Perumal, S. Akhter, F. Zizi,
G. Jean-Louis, C. Ramasubramanian, R. E. Freeman,
and M. Narasimhan. Project stakeholder management
in the clinical research environment: How to do it
right. Frontiers in psychiatry, 6, 2015.
[10] Project Management Institute. Guide to the project
management body of knowledge. PMI, 2013.
[11] R. Rajkumar. A cyber–physical future. Proc. of the
IEEE, 100:1309–1312, 2012.
[12] R. R. Rajkumar, I. Lee, L. Sha, and J. Stankovic.
Cyber–physical systems: The next computing
revolution. In 47th Design Autom. Conf., pages
731–736. ACM, 2010.
[13] L. Sha, S. Gopalakrishnan, X. Liu, and Q. Wang.
Cyber–physical systems: A new frontier. In J. Tsai
and P. Yu, editors, Machine Learning in Cyber Trust:
Security, Privacy, and Reliability, pages 3–13. 2009.
[14] C. M. B. d. Silva, D. S. Loubach, and A. M. d. Cunha.
An estimation model to measure computer systems
development based on hardware and software. In
IEEE/AIAA 28th Digital Avionics Systems Conf.
(DASC 2009), pages 6.C.2–1–6.C.2–12. IEEE, 2009.
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
A Recommendation System of Reuse Opportunities based
on Lexical Analysis
Johnatan Oliveira, Eduardo Figueiredo
Software Engineering Laboratory (LabSoft), Department of Computer Science
Federal University of Minas Gerais (UFMG)
Belo Horizonte, Brazil
{johnatan-si, figueiredo}@dcc.ufmg.br
ABSTRACT
Software reuse is a development strategy in which existing
software components, called reusable assets, are used in the
development of new software systems. Extraction methods
may be used in different contexts including derivation of
software product lines. However, few methods have been
proposed in literature for reusable asset extraction and recommendation of these reuse opportunities. In this paper,
we propose a method for extraction of reuse opportunities
based on naming similarity of three types of object-oriented
entities: classes, methods, and attributes. These entities
compose a repository with reuse opportunities. The proposed method should be integrated into a recommendation
system that aims to assist developers by: (i) recommending a general partial design for a specific domain and (ii)
indicating reuse opportunities. At the moment, we have a
prototype tool to support our method in extracting reuse
opportunities. We evaluate the method and tool with 38
e-commerce information systems mined from GitHub. As a
result, we observe that our method is able to identify classes
and methods that are relevant in the e-commerce domain.
1. INTRODUCTION
Software reuse is a development strategy in which existing software components, called reusable assets, are used in
the development of new software systems [6]. It has been
studied and pointed as an alternative to traditional development aiming to increase software quality and decrease development efforts by using previously developed, and sometimes already tested, software components [9, 11]. One of
the many techniques to support software reuse is Software
Product Line (SPL). An SPL is a set of software systems
that share a common set of features, then new software may
be developed using these commonalities [8].
Considering the continuous software development in companies, the increasing number of developed artifacts may
prevent the identification of reusable assets to support a
SPL derivation. Therefore, methods to provide recommen-
Permission to make digital or hard copies of all or part of this work for
personal or classroom use is granted without fee provided that copies are
not made or distributed for profit or commercial advantage and that copies
bear this notice and the full citation on the first page. To copy otherwise, to
republish, to post on servers or to redistribute to lists, requires prior specific
permission and/or a fee.
SBSI 2016, May 17th-20th, 2016, Florianópolis, Santa Catarina, Brazil
Copyright SBC 2016.
49
dations of reusable assets are desirable to assist developers.
In this context, a recommendation system could automatically identify reusable assets and suggest these artifacts for
developers, helping to increase the capacity and effectiveness of the nominating process and manipulation of large
volumes of data [12]
In general, recommendation systems are based on content
filtering given a data requested. In this study, we propose a
recommendation system that aims to retrieve reuse opportunities. Therefore, a method for extraction of these reuse
opportunities is required to provide inputs for the recommendation system. Some methods have been proposed to
support the extraction of reuse opportunities from software
systems [7, 12].
In literature, many different approaches are used for identification of reuse opportunities, such as natural language
processing [10], formal specifications [1], machine learning [3], and other Information Retrieval (IR) approaches
[6]. However, to the best of our knowledge, we did not find
a method for extraction of reuse opportunities and recommendation of such opportunities considering most frequent
elements, such as classes, methods, and attributes, from systems of the same domain.
In this paper, we present the first stage for development of
a recommendation system to support software reuse. This
stage consists of developing a method for extraction of reuse
opportunities, called JReuse. Given a set of software systems, JReuse aims to identify methods named with the same
token in lexical similarly named classes from different systems. The main goal of JReuse is to identify classes, methods, and eventually attributes, that may be recommended as
reuse opportunities. We also present a prototype tool that
implements our method.
We conduct an evaluation of our method through an experiment with 38 Java information systems in the e-commerce
domain mined from GitHub. As a result, we observe that our
method is able to identify reuse opportunities using naming
similarity analysis. We also observe that JReuse provides
meaningful classes and methods in the analyzed domain that
may be indicated as reuse opportunities to developers of new
e-commerce systems.
The remainder of this paper is organized as follows. Section 2 presents the proposed approach. Section 3 presents
a preliminary evaluation. Section 4 discusses related work.
Finally, Section 5 concludes this paper.
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
2.
THE PROPOSED APPROACH
We proposed a research methodology divided in seven
study steps as presented in Figure 1. The steps colored
in green have been completed. The yellow step is ongoing.
The red step describes how we intend to evaluate the recommendation system that we aim to develop. We designed
all steps to provide us background about the research topic,
related work, recommendation systems, and other concepts
that are relevant to our research. We discuss each study step
as follows.
effectiveness of the proposed method for reuse opportunities
extraction using a data set composed of 38 information systems from the e-commerce domain. We mined these systems
from GitHub. Section 3 describes the results of our preliminary evaluation.
Step 6: A recommendation system is under development to
implement the approach previously described. We designed
this system to identify reuse opportunities using the method
proposed in Step 4, to provide a partial design of information
systems, and to recommend source code for developers. Figure 2 illustrates the proposed recommendation system. The
recommendation system receives different systems as input.
Then, the extraction method applies a similarity function to
compute similarity between entities. We defined a threshold
according to empirical studies: similarity must be equal or
greater than 80% for all entities. In Figure 2, the part in
dashed line is a task that we have to do.
Figure 1: Study Steps
Step 1: In this step, we conducted a Systematic Literature
Review [4] to know about the topic of research, strategies
for reusable assets identification, and available tools to provide the appropriate structure for reuse of software artifacts.
This step provided us related work and a comparison of researches that explores reuse opportunities in software systems.
Step 2: We performed a comparison of code clone detection
tools to assess whether these tools are able to identify similar
source code in different software systems. We also evaluated
plagiarism detection tools from systems of the same domain.
In this step, we observed some desirable points in methods
for extraction of reusable assets. Once none of the tools we
found fitted to our purpose [2], we considered the desirable
points to propose a method for extraction and recommendation of reuse opportunities.
Step 3: In this step, we defined a strategy for the recommendation system we aim to develop. We investigated the
required input, source code processing, target programming
language, and the reuse opportunities repository to support
the development of a recommendation system for software
reuse.
Step 4: After Step 3, we were able to understand the main
requirements of a method for reusable assets extraction. We
used the e-commerce information system domain as reference to a preliminary study on the frequency of similarly
named entities in source code: classes, methods, and attributes. The extraction method that we propose in this
Step 4 receives as input a set of information systems. Then,
the method processes names of classes to identify similarly
named classes in different system. Considering classes with
similar names, our strategy identities similarly named methods and attributes. The results of this analysis are persisted
in database.
Step 5: We conducted an experiment in order to assess the
50
Figure 2: Recommendation System
Step 7: After the development of our recommendation system in Step 6, we are able to conduct experiments to evaluate the quality of the recommendations.
We systematically designed and conducted Steps 1 to 7
to achieve success in our research. Through this study, we
are developing solutions to the problems identified in both
literature and industry. The forecast for getting the Master’s
in Computer Science is December 2016, and we planned our
study activities according to this schedule.
3.
PRELIMINARY EVALUATION
In this study, we evaluate our method for extraction of
reuse opportunities from systems of the same domain. The
identification of attributes is under development. Therefore,
let us consider, for this preliminary evaluation, only the identification of classes and methods through lexical similarity
analysis. We are interested in whether JReuse is able to
identify recurrent classes and methods in a specific software
domain. We are also interested in assessing the relevance of
results provided by our method. For this purpose, we chose
the e-commerce domain for evaluation.
We analyzed the frequency of similarly named classes in
the 38 e-commerce information systems from our data set.
Initially, JReuse identified 38 classes as reuse opportunities.
To summarize data, we adopted the following exclusion criteria for classes to be considered in this evaluation: the class
should occur in at least three different systems. Since our
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
method compares classes in pairs, two occurrences may not
be significant to a reuse recommendation. We discarded 22
classes based on this minimum threshold.
We concluded that the top-five most frequent classes for
ecommerce domain, with more than five occurrences, are
User, Product, Order, Category, and Customer. In fact,
according to the viewpoint of four independent software engineers – these classes are meaningful and relevant to the
e-commerce domain. For instance, classes such as Product,
Order, Category, and Customer are elementary entities to
be expected in an e-commerce system. In turn, User is the
most frequent class identified in this preliminary study by
the tool and, although it is not specific of e-commerce domain, Costumer is an expected class in information systems
in general.
Therefore, we conclude that our method is able to identify relevant classes for software reuse in 60% of the evaluated e-commerce systems (23 of the 38 systems collected
from GitHub). The other less frequent classes (e.g., Item,
Payment, and Cart) are also relevant to the e-commerce
domain. Regarding frequent methods through systems, we
filtered methods by the following inclusion criteria: it should
appear in at least two classes from different systems. From
56 similarly named methods extracted, we discarded 34 according to the defined criteria, remaining 22 methods. Consider a pair (C, M) in which C is a class name, and M is a
method name. For instance, the pairs (Product, getPrice)
and (Product, getPrice) are the most frequent among the
systems of our data set.
Considering the domain under analysis, it is meaningful,
since the product abstraction requires a monetary value for
the product. Moreover, the method getPassword occurs 8
times in User and 5 times in Costumer classes. This scenario
is comprehensible considering that these classes intuitively
represent entities that have access to the e-commerce system
for purchase and payment, for instance. Therefore, in the
viewpoint of the authors, the identified methods are relevant
and consistent for the domain under analysis.
4.
RELATED WORK
Many approaches have been proposed in literature to support the extraction of reusable assets. For instance, Kawaguchi
et al. [5] propose an algorithm to categorize software projects
automatically. This method aims to identify similar software
systems using duplicated code detection.
Oliveira et al. [11] propose a tool for recommendation
of reusable assets. Their tool applies a technique to support software reuse and extraction of reusable assets called
Automatic Identification of Software Components.
In turn, our reusable asset extraction method and supporting tool aim to identify candidates for reuse from software systems from a specific domain, using lexical analysis.
Our method also ranks software components identified as
reusable assets by frequency in which components appear in
different systems from the same domain. We expect that
this approach is helpful in reuse recommendation by suggesting classes, methods, and attributes that are the most
recurrent in information systems given a specific domain.
5.
CONCLUSION
In this paper, we present the proposed Master’s study
and the steps needed to achieve success. As a preliminary
51
study, we present in detail the method to extract reusable
assets from software systems. We also present a prototype
tool that implements the proposed method. Finally, we
present the preliminary idea of a recommendation tool to
suggest software reusable assets in a class diagram-based vision. Through our study, we were able to identify the main
issues of software reuse and the reusable assets extraction
process.
We evaluate our extraction prototype tool through an experiment with 38 information systems from e-commerce domain extracted from GitHub. Our findings point that the
proposed method is able to suggest methods and classes that
appear in different systems from the selected data set. We
also observe that the most frequent methods and classes
pointed by the tool as candidates to software reuse are relevant to most of the information systems from the e-commerce
domain.
6.
ACKNOWLEDGMENTS
This work was partially supported by CAPES, CNPq, and
FAPEMIG.
7.
REFERENCES
[1] G. Caldiera and V. Basili. Identifying and qualifying
reusable soft. components. Computer, 24(2):61–70,
1991.
[2] J. A. de Oliveira, E. M. Fernandes, and E. Figueiredo.
Evaluation of duplicated code detection tools in
cross-project context, 2015.
[3] S. Kawaguchi, P. Garg, M. Matsushita, and K. Inoue.
Mudablue: an automatic categorization system for
open source repositories, 2004.
[4] S. Keele. Guidelines for performing systematic
literature reviews in software engineering. In Technical
report, Ver. 2.3 EBSE Technical Report. EBSE. 2007.
[5] C. Krueger. Soft. reuse. Computing Surveys (CSUR),
24(2):131–183, 1992.
[6] A. Kuhn, S. Ducasse, and T. Gı́rba. Semantic
clustering: Identifying topics in source code. Info. and
Soft. Tech., 49(3):230–243, 2007.
[7] J. Lee, K. Kang, and S. Kim. A feature-based
approach to product line production planning. In Soft.
Product Lines, pages 183–196. Springer, 2004.
[8] Y. Maarek, D. Berry, and G. Kaiser. An info. retrieval
approach for automatically constructing soft. libraries.
Transactions on Soft. ENG. (TSE), 17(8):800–813,
1991.
[9] P. Mohagheghi and R. Conradi. Quality, productivity
and economic benefits of soft. reuse: a review of
industrial studies. Empirical Soft. ENG. (ESE),
12(5):471–516, 2007.
[10] P. Mohagheghi, R. Conradi, O. Killi, and H. Schwarz.
An empirical study of soft. reuse vs. defect-density
and stability, 2004.
[11] M. Oliveira, E. Goncalves, and K. Bacili. Automatic
identification of reusable soft. development assets:
Methodology and tool, 2007.
[12] O. Zoeter. Recommendations in travel, 2015.
IX Workshop de Teses e Dissetações em Sistemas de Informação, Florianópolis, SC, 17 a 20 de Maio de 2016
Índice Remissivo
A
Araujo, Renata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17, 21
B
Baião, Fernanda A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30, 42
H
Heineck, Tiago . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
L
Lima, Clodoaldo A.M. . . . . . . . . . . . . . . . . . . . . . . . . . 27, 33, 36
M
Maciel, Rita S.P. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Moura, Hermano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
C
Carmo, Adson do . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Castro, Jaelson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
O
Classe, Tadeu M. de . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Oliveira Jr, Edson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Cordeiro, André F.R.C. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Oliveira, Edenilton L. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Costa, Leila de C. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Oliveira, Johnatan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
D
P
Duran, Adolfo A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Paiva, Eduardo de . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Palma, Filipe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
F
Peres, Sarajane M. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27, 33, 36
Fantinato, Marcelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39, 46
Feitosa, Ricardo A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
R
Figueiredo, Eduardo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Revoredo, Kate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14, 30
Richetti, Pedro H.P. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
G
Rocha, Jallysson M. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Garcia, Plínio A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Garcia, Vinicius C. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
S
Gonçalves, Enyo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Santos, Wylliams . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Silva, Jomar da . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Silva, Jonas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
52