Proposta de um Módulo de Data Mining para um Sistema de Scout

Transcrição

Proposta de um Módulo de Data Mining para um Sistema de Scout
Anais do VII Simpósio de Informática da Região Centro do RS - SIRC/RS 2008 - ISBN 978-85-88667-89-1
Santa Maria - RS, junho de 2008.
Proposta de um Módulo de Data Mining para um Sistema
de Scout no Voleibol
Émerson Butzen Marques1, Luis Henrique Raimann1, Alexandre de Oliveira
Zamberlam1, Alexandre José Hoher2
1
2
Instituto de Ciências Exatas e Tecnológicas (ICET) – Centro Universitário Feevale
(FEEVALE) - RS-239, 2755 – 93.352-000 – Novo Hamburgo – RS – Brasil
Instituto de Ciências da Saúde (ICS) – Centro Universitário Feevale (FEEVALE) - RS239, 2755 – 93.352-000 – Novo Hamburgo – RS – Brasil
{butzen, alexz, alexandreh}@feevale.br, [email protected]
Abstract. This paper aims to demonstrate the importance of data mining in the
decision support system, in this case, the athlete’s performance evaluation
systems (Scout). Many of these systems are statistical and bring unnecessary
data and information. Therefore, data mining aims to get true information and
information previously unknown, helping most accurately the staff technical of
the teams of volleyball. Finally, it is described an idea of data mining module
to scout system.
Resumo. Este artigo visa demonstrar a importância da mineração de dados
nos sistemas de apoio à tomada de decisão, neste caso, os sistemas de
avaliação de desempenho de atletas (Scout). Muitos desses sistemas são
estatísticos e acabam por trazer informações desnecessárias. Portanto, a
mineração de dados visa buscar informações mais confiáveis e informações
até então desconhecidas, auxiliando de maneira mais precisa as comissões
técnicas das equipes de voleibol. Finalmente, é apresentada a idéia de um
módulo de mineração de dados para o sistema de scout.
Introdução
A gestão administrativa, comumente, aplicada em empresas, no processo de tomada de
decisão, também ocorre em equipes de voleibol e/ou em outros esportes, com a
finalidade de gerar melhores resultados. Dentro desse universo de equipes esportivas,
foram elaborados sistemas estatísticos de monitoramento de desempenho de atletas e de
equipes, também conhecidos como sistemas de scout. Esses sistemas permitem às
comissões técnicas decidir onde um jogador deve sacar, qual sua posição na quadra
oferece maior rendimento, qual jogador substituir e por quem, que tipo de treinamento
deve ser realizado para apurar um atleta e/ou a equipe toda (treino de fundamentos de
voleibol, posicionamento, jogadas, saque, etc). Enfim, permitem qual a melhor
estratégia ou quais táticas utilizarem, são situações as quais uma comissão técnica de
voleibol deve estar atenta (ZAMBERLAM, 2005). Contudo, a quantia de informações
(precisas/desnecessárias) é mesmo assim enorme, deixando o processo de decidir
bastante empírico, ou seja, dependente da experiência do técnico ou de algum integrante
da comissão técnica.
Anais do VII Simpósio de Informática da Região Centro do RS - SIRC/RS 2008 - ISBN 978-85-88667-89-1
Santa Maria - RS, junho de 2008.
A mineração de dados (data mining) entra nesse campo com o intuito de
descobrir informações mais precisas, evitando assim informações desnecessárias. Dessa
forma, o objetivo deste trabalho é apresentar uma proposta de um módulo de data
mining para o sistema de scout do projeto de pesquisa “A IA entrando na quadra de
vôlei: Scout Inteligente” (ZAMBERLAM, 2005).
Nos EUA, a mineração de dados já está sendo usada em um sistema de scout, o
Advanced Scout (BHANDARI et al.,1997), que auxilia as comissões técnicas de
basquete somente após os jogos e apenas uma técnica de mineração é aplicada.
O texto é dividido em cinco seções. A primeira seção trata sobre Mineração de
Dados, mostrando as principais técnicas e aplicações. A seção 2 aborda o Scout
Voleibol, ou seja, o sistema de avaliação de desempenho de atletas. Nessa seção, são
apresentados noções de funcionamento e uso desse sistema. A seção 3 apresenta uma
proposta de módulo de data mining em um sistema de scout. Na seção 4, é descrito um
trabalho correlato realizado na NBA (liga norte-americana de basquete). Finalmente, as
considerações e as referências bibliográficas.
1. Data Mining
Segundo Wives (2004) apud (FELDENS et al., 1998) Data Mining ou Mineração de
Dados é uma etapa, a mais importante, do processo de descoberta do conhecimento em
banco de dados (Knowledge Discovery in Databases - KDD). Gonchoroski (2007) apud
(CABENA et al., 1997) aponta que a mineração de dados é o processo de extrair
informações válidas antes desconhecidas, de grandes bases de dados, auxiliando em
decisões cruciais no mundo dos negócios. Para isso, data mining utiliza-se de técnicas
ou algoritmos de áreas como Aprendizado de Máquinas, Estatística, Redes Neurais,
Algoritmos Genéricos, etc (ELMASRI; NAVATHE, 2005). O mesmo autor aponta que
a mineração de dados apóia o conhecimento indutivo, descobrindo novas regras e
padrões nos dados minerados. Para Kantardzic (2003), os dois primeiros objetivos da
mineração de dados são: a predição e a descrição. A predição utiliza algumas variáveis
ou campos de um conjunto de dados para prever valores desconhecidos ou futuros de
outras variáveis de interesse. A descrição concentra-se em encontrar padrões nos dados
que possam ser interpretados por humanos.
Como a mineração de dados é uma parte do processo de descoberta do
conhecimento, etapas (Figura 1) devem ser cumpridas antes de aplicar-se alguma técnica
de data mining. Conforme Bramer (2007), os dados possivelmente vêm a partir de
muitas fontes, estes dados devem ser integrados e armazenados em lugar comum. O
próximo passo é a preparação dos dados, então é aplicada alguma técnica de mineração
de dados, que produz uma saída na forma de regras ou em algum tipo de padrão.
Figura 1. Etapas até a Data Mining (adaptação dos autores)
Anais do VII Simpósio de Informática da Região Centro do RS - SIRC/RS 2008 - ISBN 978-85-88667-89-1
Santa Maria - RS, junho de 2008.
Essas regras ou padrões são também conhecidos como modos de descoberta, os
modos mais conhecidos são descridos abaixo.
Regras de Associação (Association Rules) – Cujo objetivo é encontrar qualquer
relação existente entre os valores das variáveis (BRAMER, 2007). Para Kantardzic
(2003), regras de associação é uma das principais técnicas de mineração de dados,
através dela é possível recuperar todos os padrões interessantes em uma base de dados.
Como, por exemplo, jogadas de uma equipe de vôlei em um set (parte de um jogo), com
base na análise de jogadas de um jogo completo;
Agrupamento (Clustering) – Uma dada população de eventos ou novos itens
podem ser particionados (segmentados) em conjuntos de elementos ‘padrões’
(ELMASRI; NAVATHE, 2005). Bramer (2007) confirma que os algoritmos de
agrupamento analisam os dados para encontrar grupos de itens que são semelhantes. Um
exemplo no vôlei é o agrupamento de dados dos fundamentos de saque e bloqueio,
coletados em jogos de uma equipe, e organizados em faixas de desempenho.
Padrões seqüenciais (Sequential Patterns) – Elmasri e Navathe (2005) apontam
que a técnica de padrões seqüenciais é a investigação de seqüências de ações ou eventos.
Han e Kamber (2006) escrevem que é uma técnica desafiadora, pois pode gerar e/ou
testar um número combinatório explosivo de seqüências intermediárias. Por exemplo, a
seqüência de uma jogada (comportamento da defesa e/ou do ataque) da equipe de vôlei
adversária após um saque da outra equipe.
Padrões com séries temporais (Time-Series Data) – Para Elmasri e Navathe
(2005) esses padrões podem ser encontrados em posições de uma série temporal de
dados, que é uma seqüência de dados capturada a intervalos regulares. Han e Kamber
(2006) confirmam dizendo que séries temporais consistem em seqüências de valores ou
medidas repetidas, excessivamente, em intervalos de tempos. Pode ser exemplificado
como padrões de comportamentos de equipes de voleibol após determinada faixa de
pontuação (aspecto emocional dos atletas).
Cada modo de descoberta de conhecimento corresponde a técnicas diferentes,
não existe uma técnica que seja melhor que outra. Através da sua aplicação aos
problemas, é que se terá uma avaliação de qual se adequou melhor. No caso de um
sistema de scout, não será diferente, terão que ser aplicadas técnicas, a fim de analisar os
resultados, para definir a melhor técnica.
2. Scout
Scout ou sistema de avaliação de desempenho de atletas são sistemas que capturam e
processam informações estatísticas de desempenho dos atletas da equipe e da adversária.
Porém, eles não levam em consideração o histórico do jogador de toda uma temporada
(comportamento do atleta em outros jogos) e o contexto de uma partida de vôlei, ou
seja, o comportamento do atleta nos diferentes níveis da partida. Um set (parte de uma
partida) de vôlei possui basicamente três níveis. O terceiro nível, próximo do final, é o
de maior tensão em que o físico e o emocional do atleta devem estar ajustados. Dessa
forma, os sistemas atuais, simplesmente, repassam dados para a comissão, que avalia
essa gama diversificada referente aos fundamentos básicos do vôlei e/ou jogadas
realizadas pela equipe adversária, num tempo extremamente reduzido e toma decisões
Anais do VII Simpósio de Informática da Região Centro do RS - SIRC/RS 2008 - ISBN 978-85-88667-89-1
Santa Maria - RS, junho de 2008.
relacionadas com aqueles dados relatados. Decisões muitas vezes baseadas mais no
conhecimento empírico do técnico ou da comissão do que no fator racional real daquela
situação (ZAMBERLAM et al., 2005).
Bizzocchi (2004) aponta que nos jogos olímpicos de 1984, os norte-americanos
foram os responsáveis pela inclusão do computador na quadra de voleibol, tornando-se
obrigatório também para treinamentos e elaboração de planos táticos e técnicos.
A seleção brasileira de vôlei, comandada pelo técnico Bernardo Rezende
(Bernardinho), utiliza-se dos dois scouts: tático e técnico. O tático faz um mapeamento
da quantidade, do percentual e do tipo de jogadas do time adversário; analisa tendências
dos atletas (direções, preferências e posicionamentos). O scout técnico analisa o próprio
time, como cada atleta se comporta em cada fundamento, qual seu aproveitamento final.
Isso possibilita, por exemplo, elaborar quadros evolutivos de saque de um determinado
atleta (BERNARDINHO, 2006). A planilha, encontrada na Figura 2, foi apresentada
pelo técnico da seleção brasileira, com o objetivo de exemplificar a utilização da análise
estatística nos jogos da seleção. Essa planilha apresenta os dados coletados durante os
Jogos Olímpicos, realizado na Grécia, na data do dia 29 de agosto de 2004. O jogo em
questão foi à final dos Jogos Olímpicos, realizado entre Brasil e Itália.
Assim, após a descrição do que é e qual a finalidade de um sistema scout, segue
na próxima seção a apresentação da proposta de um módulo com mineração de dados
para o um sistema de scout inteligente.
Figura 2. Planilha para análise estatística dos fundamentos de voleibol
(BERNARDINHO, 2006)
3. Proposta
Um sistema scout, como já escrito, é um sistema estatístico de monitoramento de
atletas, auxiliando em decisões importantes na gestão de equipes. Entretanto, a
quantidade de informações continua muito grande, deixando o processo de decidir
dependente da experiência do técnico ou de algum integrante da comissão técnica.
Por isso, surge a idéia deste trabalho: desenvolver um módulo de mineração de
dados para o sistema: “Scout: Sistema de Monitoramento em Equipes de Voleibol”
desenvolvido por Raimann (2007), parte integrante do projeto de pesquisa “A IA
entrando na quadra de vôlei: Scout Inteligente”. Para facilitar a visualização, a Figura 3
ilustra o que está sendo realizado e como o módulo de mineração faria parte do sistema
scout.
Anais do VII Simpósio de Informática da Região Centro do RS - SIRC/RS 2008 - ISBN 978-85-88667-89-1
Santa Maria - RS, junho de 2008.
O módulo de mineração irá interagir com a base de dados, fornecendo
informações mais precisas à comissão técnica, evitando assim o uso de complicadas
planilhas, pois existem grandes dificuldades nas leituras das planilhas, os dados que são
inseridos não passam por nenhuma filtragem, não ressaltando aos olhos os problemas ou
as vantagens das equipes na partida.
Figura 3. Esquema geral do scout inteligente (ZAMBERLAM, 2005)
Na Figura 4 é possível visualizar a estrutura do banco de dados do sistema de
scout desenvolvido por Raimann (2007), a fim de ilustrar em quais dados a mineração
deverá atuar.
Figura 4. Modelagem do banco de dados do sistema scout (RAIMANN, 2007).
Anais do VII Simpósio de Informática da Região Centro do RS - SIRC/RS 2008 - ISBN 978-85-88667-89-1
Santa Maria - RS, junho de 2008.
Através dessa estrutura dá para perceber a quantidade de dados que uma partida
de voleibol pode gerar. O processo se inicia a partir do cadastro das equipes e seus
atletas. Depois de cadastradas, são informados os jogadores que entram em quadra para
a partida (duas equipes por partida). Por meio desses dados será controlada a rotação do
jogo, que será realizada automaticamente pelo sistema. A partir desse ponto, dar-se-á a
entrada de dados pelos scouters (pessoas que ficam na quadra cadastrando cada jogada e
substituições ocorridas durante a partida). Após a partida ou set (para maiores detalhes
sobre a dinâmica do voleibol, consulte (BIZZOCCHI, 2004)) é que o módulo de
mineração de dados entrará em ação, através de uma das técnicas de mineração de
dados, o módulo irá gerar relatórios para a comissão técnica, assim podendo tomar
decisões para melhorar o desempenho ou corrigirem falhas de sua equipe. Por exemplo:
Relatório de jogadas de uma equipe de vôlei em um set, com base na análise
de jogadas de um jogo completo pressupondo o uso da técnica de regras de
associação;
Relatório com agrupamento de dados dos fundamentos de saque e bloqueio,
coletados em jogos de uma equipe, e organizados em faixas de
aproveitamento, técnica de agrupamento;
Visualização de um comportamento padrão (seqüência de jogadas) da defesa
de uma equipe de vôlei adversária após um saque da outra equipe. Técnica
de padrões seqüências.
Visualização de padrões de comportamentos de equipes de voleibol após
determinada faixa de pontuação (aspecto emocional dos atletas), técnica de
padrões com séries temporais;
Esses exemplos mostram informações importantes para uma comissão técnica de
uma equipe de vôlei, pois são resultados que podem ser percebidos durante a partida,
não após a partida como acontece geralmente nos sistemas de scout, em alguns sistemas,
essas informações são levantadas manualmente, após isso, apresentadas às suas
comissões técnicas.
Com esse sistema e esse módulo de data mining, espera-se que equipes que não
tenham condições de adquirir um sistema de scout pago tenham melhores condições de
desenvolver os fundamentos ineficientes de cada atleta, e obter estratégias de jogo num
menor tempo, auxiliando a comissão técnica na sua tomada de decisão, elevando assim
a qualidade do voleibol praticado pelas equipes. A seguir, um trabalho que realizou a
integração entre processo de decisão e mineração de dados em um sistema de avaliação
de desempenho.
4. Trabalho correlato - Advanced Scout: Data Mining and Knowledge
Discovery in NBA Data
Em (BHANDARI et al.,1997), é apresentado o software Advanced Scout (AS). Esse
software procura e descobre padrões interessantes em dados de jogos da NBA (liga
norte-americana de basquete). Sua primeira utilização se deu na temporada 1995-1996,
onde dezesseis das vinte e nove equipes o receberam para avaliação. As comissões
técnicas o avaliaram positivamente, afirmando ser uma valiosa ferramenta. Esse
Anais do VII Simpósio de Informática da Região Centro do RS - SIRC/RS 2008 - ISBN 978-85-88667-89-1
Santa Maria - RS, junho de 2008.
software trabalha em quatro etapas: coleta de dados, pré-processamento, mineração de
dados e interpretação do conhecimento descoberto.
A coleta de dados é feita por um software especialmente desenhado para o
registro de dados de basquete. Esses dados são armazenados em uma base de dados
comum a todas as equipes de basquete. Posteriormente, as equipes realizam o download
dessa base de dados e a manipulam de forma independente e sigilosa.
O pré-processamento é feito após o download da base de dados. O AS permite
realizar uma série de consistências na base de dados, visto que informações errôneas
permitiriam interpretações erradas dos dados, assim os dados errados são corrigidos por
meio de regras base ou através de alguém que tenha domínio do assunto. Após a
consistência, os dados são transformados e reformatados. Os dados brutos são
reformatados na forma de fichas de jogo, que são familiares para as comissões técnicas
que, assim, analisam os eventos discretos (padrões) de um jogo. Nessa fase os dados são
enriquecidos através da verificação das regras ou da entrada de dados adicionais.
A mineração de dados no AS ocorre quando um membro da comissão técnica
inicia uma consulta geral. Automaticamente a mineração de dados procura por padrões
interessantes na equipe da casa ou na visitante, em busca dos arremessos à cesta de
basquete (um dos fundamentos do basquete, por exemplo), detectando o percentual
padrão de desempenho (aproveitamento). As análises posteriores podem incluir
consultas mais específicas em torno de atributos (como por exemplo, o jogador, a
função do jogador, lado da quadra, etc.) ou fundamentos particulares (rebote, arremesso,
etc.). A técnica de mineração de dados utilizada no AS é conhecida como Attribute
Focusing (AF) (BHANDARI, 1995).
A interpretação do conhecimento descoberto é a forma como o resultado da
mineração de dados é mostrada. No AS, os resultado são vistos de duas formas: através
de uma descrição textual ou gráfica. O objetivo é que os resultados sejam
compreendidos facilmente pela comissão técnica. O processo de interpretação de
padrões representa a descoberta de conhecimento e exige, normalmente, alguém que
tenha domínio do assunto. Essa interpretação é facilitada pela possibilidade do usuário
ter várias formas de aprofundar a análise interativamente para obter informações
adicionais ao resultado.
5. Considerações Finais
A pesquisa apresentada neste artigo visa o estudo e o desenvolvimento de um módulo
de mineração de dados para o sistema: “Scout: Sistema de Monitoramento em Equipes
de Voleibol” desenvolvido por Raimann (2007).
Para a validação dessa proposta, serão coletados dados de partidas de vôlei de
diversas equipes. Esses dados serão submetidos ao módulo de data mining, e os
resultados serão analisados por comissões técnicas de equipes de voleibol.
Espera-se que novos trabalhos sejam desenvolvidos, como a adaptação desse
módulo a outras plataformas de sistemas de scout.
Referências
BERNARDINHO. (2006) Transformando suor em ouro. Rio de Janeiro, RJ: Sextante.
Anais do VII Simpósio de Informática da Região Centro do RS - SIRC/RS 2008 - ISBN 978-85-88667-89-1
Santa Maria - RS, junho de 2008.
BHANDARI, Inderpal. (1995). “Attribute Focusing: Data mining for the layman”
(Research Report RC 20136). IBM T.J. Watson Research Center.
BHANDARI, Inderpal; COLET, Edward; PARKER, Jennifer; PINES, Zachary;
PRATAP, Rajiv; RAMANUJAM, Krishnakumar. (1997) Advanced Scout: Data
Mining and Knowledge Discovery in NBA Data. Data Mining and Knowledge
Discovery, Data Mining and Knowledge Discovery, Kluwer Academic Publishers,
Vol. 1, No. 1, p. 121-125.
BINDER, Fábio Vinícius. (1994) Sistemas de apoio à decisão. São Paulo, SP: Érica.
BIZZOCCHI, Carlos “Cacá”. (2004) O voleibol de alto nível: da iniciação à
competição. Barueri, SP: Ed. Manole.
BRAMER, Max. (2007) Principles of Data Mining (Undergraduate Topics in Computer
Science). Londres, Inglaterra: Springer-Verlag London Ltd.
ELMASRI, Ramez; NAVATHE, Shamkant B. (2005) Sistemas de banco de dados. 4.
ed. São Paulo, SP: Pearson Addison Wesley.
FREITAS, Henrique; BECKER, Joao Luiz; KLADIS, Constantin Metaxa; HOPPEN,
Norberto. (1997) Informação e decisão: sistemas de apoio e seu impacto. Porto
Alegre, RS: Ortiz.
GIUDICI, Paolo. (2003) Applied Data Mining: Statistical Methods for Business and
Industry. Chichester, West Sussex, Inglaterra: John Wiley & Sons Ltd.
GONCHOROSKI, Sidinei Pereira. (2007) Utilização de técnicas de KDD em um call
center ativo. Novo Hamburgo, RS. Trabalho de Conclusão de Curso (Bacharelado em
Ciência da Computação) – Instituto de Ciências Exatas e Tecnológicas, Feevale.
HAN, Jiawei; KAMBER, Micheline, (2006) Data Mining Concepts and Techniques.
São Francisco, Califórnia, EUA: Morgan Kaufman Publishers.
KANTARDZIC, Mehmed. (2003) Data Mining: Conceps, Models, Methods, and
Algotithms. Hoboken, Nova Jersey, EUA: John Wiley & Sons Inc.
MARTIN, James. (1984) An information systems manifesto. Englewood Cliffs, Nova
Jersey, EUA: Prentice-Hall.
RAIMANN, Luís Henrique, (2007) Scout: Sistema de monitoração em equipes de
voleibol. Novo Hamburgo, RS. Trabalho de Conclusão de Curso (Bacharelado em
Sistemas de Informação) – Instituto de Ciências Exatas e Tecnológicas, Feevale.
ZAMBERLAM, Alexandre de Oliveira; WIVES, Leandro Krug; GOULART, Rodrigo
Rafael Villarreal; SILVEIRA, Roni Gilberto. (2005) A IA entrando na quadra de
vôlei: scout inteligente. Hífen, Uruguaiana, RS , v.29, n.55/56.
WIVES, Leandro Krug. (2004) Utilizando Conceitos como descritores de Textos para o
processo de identificação de conglomerados (clustering) de documentos. Porto
Alegre, RS. Tese (Doutorado em Ciência da Computação). Instituto de Informática,
UFRGS.
WAGNER, Eduardo Antonio. (2007) Utilizando data mining em pesquisa de clima
organizacional. Novo Hamburgo, RS. Trabalho de Conclusão de Curso (Bacharelado
em Sistemas de Informação) – Instituto de Ciências Exatas e Tecnológicas, Feevale.