Thesis defense presentation
Transcrição
Thesis defense presentation
Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta New methodologies towards an automatic optical recognition of handwritten music scores Segmentação Processo de segmentação Resultados Ana Maria Rebelo Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão Projecto de final de curso para obtenção do grau de Mestre pela FCUP em Engenharia Matemática com a colaboração do INESC Porto Prof. Dr. Jaime S. Cardoso (INESC Porto, FEUP) Prof. Dr. Joaquim F. Pinto da Costa (FCUP, DMA) Outubro 2008 1 / 48 Resumo 1 Introdução Processo do OMR Objectivos 2 Detecção das linhas de pauta Caminhos Estáveis Testes Remoção das linhas de pauta 3 Segmentação dos sı́mbolos musicais Processo de segmentação Resultados Classificação dos sı́mbolos musicais Modelos de Markov Escondidos Rede Neuronal Máquinas de vectores de suporte Vizinho mais próximo Modelação elástica Resultados Conclusão Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação 4 HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 5 2 / 48 Motivação. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados • Música: presente em todas as civilizações e na cultura de qualquer sociedade. • Portugal: não existe nenhum repositório de informação musical. • Risco de perda irreversı́vel da herança musical portuguesa. • Digitalização como uma possı́vel ferramenta para essa preservação. • O estado actual da arte apresenta diversos problemas em aberto. Conclusão 3 / 48 Motivação. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados • Música: presente em todas as civilizações e na cultura de qualquer sociedade. • Portugal: não existe nenhum repositório de informação musical. • Risco de perda irreversı́vel da herança musical portuguesa. • Digitalização como uma possı́vel ferramenta para essa preservação. • O estado actual da arte apresenta diversos problemas em aberto. Conclusão 3 / 48 Motivação. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados • Música: presente em todas as civilizações e na cultura de qualquer sociedade. • Portugal: não existe nenhum repositório de informação musical. • Risco de perda irreversı́vel da herança musical portuguesa. • Digitalização como uma possı́vel ferramenta para essa preservação. • O estado actual da arte apresenta diversos problemas em aberto. Conclusão 3 / 48 Motivação. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados • Música: presente em todas as civilizações e na cultura de qualquer sociedade. • Portugal: não existe nenhum repositório de informação musical. • Risco de perda irreversı́vel da herança musical portuguesa. • Digitalização como uma possı́vel ferramenta para essa preservação. • O estado actual da arte apresenta diversos problemas em aberto. Conclusão 3 / 48 Motivação. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados • Música: presente em todas as civilizações e na cultura de qualquer sociedade. • Portugal: não existe nenhum repositório de informação musical. • Risco de perda irreversı́vel da herança musical portuguesa. • Digitalização como uma possı́vel ferramenta para essa preservação. • O estado actual da arte apresenta diversos problemas em aberto. Conclusão 3 / 48 Arquitectura genérica do sistema. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • Repositório: onde são armazenadas as partituras impressas, o respectivo código em MusicXML, e os dados descritivos inseridos pelo utilizador. • Web Server: ponto de acesso do sistema, contém os motores de pesquisa e de reconhecimento óptico. • Web Browser: interface entre o utilizador e o sistema. 4 / 48 Processo do OMR. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 5 / 48 Objectivos da dissertação. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Detecção das linhas de pauta: • Propor, desenvolver e testar exaustivamente um algoritmo para detectar as linhas de pauta usando uma base de dados e métricas de erro apropriadas comparando com outros do estado da arte. • Criar uma nova base de dados aplicando distorções às partituras ideais. • Usar o algoritmo proposto como primeiro passo de alguns algoritmos de remoção de linhas. Segmentação e classificação dos sı́mbolos musicais: • Pesquisar e desenvolver um algoritmo para extrair os sı́mbolos musicais. • Simular variabilidade nos sı́mbolos musicais com modelação elástica. • Combinar o método de modelação elástica com outros classificadores: estudo comparativo. Conclusão 6 / 48 Objectivos da dissertação. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Detecção das linhas de pauta: • Propor, desenvolver e testar exaustivamente um algoritmo para detectar as linhas de pauta usando uma base de dados e métricas de erro apropriadas comparando com outros do estado da arte. • Criar uma nova base de dados aplicando distorções às partituras ideais. • Usar o algoritmo proposto como primeiro passo de alguns algoritmos de remoção de linhas. Segmentação e classificação dos sı́mbolos musicais: • Pesquisar e desenvolver um algoritmo para extrair os sı́mbolos musicais. • Simular variabilidade nos sı́mbolos musicais com modelação elástica. • Combinar o método de modelação elástica com outros classificadores: estudo comparativo. Conclusão 6 / 48 Esboço do algoritmo. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados (a) Sı́mbolos musicais com as linhas de pauta inclinadas. (b) Os 11 primeiros caminhos mais curtos entre a margem esquerda e a margem direita. Conclusão 7 / 48 Caminhos Estáveis num grafo I. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão Definição Um caminho Ps,t é um caminho estável entre as regiões Ω1 e Ω2 se Ps,t é o caminho mais curto entre s ∈ Ω1 se toda a região Ω2 , e Ps,t é o caminho mais curto entre t ∈ Ω2 e toda a região Ω1 . 8 / 48 Caminhos Estáveis num grafo I. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão Definição Um caminho Ps,t é um caminho estável entre as regiões Ω1 e Ω2 se Ps,t é o caminho mais curto entre s ∈ Ω1 se toda a região Ω2 , e Ps,t é o caminho mais curto entre t ∈ Ω2 e toda a região Ω1 . 8 / 48 Caminhos Estáveis num grafo II. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados (c) Caminhos Estáveis entre cada (d) Caminhos Estáveis entre cada pixel da coluna da esquerda e toda pixel da coluna da direita e toda a a coluna da direita. coluna da esquerda. Conclusão 9 / 48 Algoritmo proposto 1 Pré-processamento: cálculo das medidas de referência Ana Maria Rebelo Introdução staffspaceheight e stafflineheight e atribuição dos pesos ao grafo. Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 2 Cálculo sucessivo dos caminhos estáveis entre as margens esquerda e direita; critérios de paragem: 10 / 48 Algoritmo proposto Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 1 Pré-processamento: cálculo das medidas de referência staffspaceheight e stafflineheight e atribuição dos pesos ao grafo. 2 Cálculo sucessivo dos caminhos estáveis entre as margens esquerda e direita; critérios de paragem: • Se um caminho não tiver uma % de pixeis pretos acima de um limite fixo, então é eliminado (80% do valor mediano dos pretos de todas as linhas encontradas na primeira iteração). • Se a forma de um caminho difere muito da forma da linha com a mediana de pixeis pretos é eliminado. 3 Pós-processamento: remoção de intersecções, agrupar as linhas em conjuntos/sistemas de linhas, remover linhas falsas, cortar as linhas no inı́cio e fim, e suavizar as linhas. 10 / 48 Algoritmo proposto Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 1 Pré-processamento: cálculo das medidas de referência staffspaceheight e stafflineheight e atribuição dos pesos ao grafo. 2 Cálculo sucessivo dos caminhos estáveis entre as margens esquerda e direita; critérios de paragem: • Se um caminho não tiver uma % de pixeis pretos acima de um limite fixo, então é eliminado (80% do valor mediano dos pretos de todas as linhas encontradas na primeira iteração). • Se a forma de um caminho difere muito da forma da linha com a mediana de pixeis pretos é eliminado. 3 Pós-processamento: remoção de intersecções, agrupar as linhas em conjuntos/sistemas de linhas, remover linhas falsas, cortar as linhas no inı́cio e fim, e suavizar as linhas. 10 / 48 Função de peso Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta • Atribuir custo baixo a pixeis pretos adjacentes; caso contrário atribuir a aresta valor elevado. • Distinguir pixeis pretos de linhas de pauta de pixeis pretos de sı́mbolos musicais: • Segmentação Processo de segmentação Resultados Classificação • Se um pixel preto pertencer a uma sequência vertical curta de pixeis pretos, então é mais provável que pertença a uma linha de pauta em vez de um sı́mbolo musical: incluir na função de peso um termo que beneficia essas arestas. Se a sequência vertical de pixeis pretos mais próxima na mesma coluna for excessivamente afastada da sequência vertical de pixeis pretos contendo o pixel preto actual, então este pixel muito provavelmente pertence a um sı́mbolo e não a uma linha: termo penalizante é incorporado na função de peso. HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 11 / 48 Função de peso Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta • Atribuir custo baixo a pixeis pretos adjacentes; caso contrário atribuir a aresta valor elevado. • Distinguir pixeis pretos de linhas de pauta de pixeis pretos de sı́mbolos musicais: • Segmentação Processo de segmentação Resultados Classificação • Se um pixel preto pertencer a uma sequência vertical curta de pixeis pretos, então é mais provável que pertença a uma linha de pauta em vez de um sı́mbolo musical: incluir na função de peso um termo que beneficia essas arestas. Se a sequência vertical de pixeis pretos mais próxima na mesma coluna for excessivamente afastada da sequência vertical de pixeis pretos contendo o pixel preto actual, então este pixel muito provavelmente pertence a um sı́mbolo e não a uma linha: termo penalizante é incorporado na função de peso. HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 11 / 48 Função de peso Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta • • Atribuir custo baixo a pixeis pretos adjacentes; caso contrário atribuir a aresta valor elevado. Distinguir pixeis pretos de linhas de pauta de pixeis pretos de sı́mbolos musicais: • • Se um pixel preto pertencer a uma sequência vertical curta de pixeis pretos, então é mais provável que pertença a uma linha de pauta em vez de um sı́mbolo musical: incluir na função de peso um termo que beneficia essas arestas. Se a sequência vertical de pixeis pretos mais próxima na mesma coluna for excessivamente afastada da sequência vertical de pixeis pretos contendo o pixel preto actual, então este pixel muito provavelmente pertence a um sı́mbolo e não a uma linha: termo penalizante é incorporado na função de peso. Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 11 / 48 Base de dados Reais – 50 pautas. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 12 / 48 Base de dados Sintéticas – 32 pautas. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 13 / 48 Deformações nas partituras sintéticas. Ana Maria Rebelo Introdução Processo Objectivos Detecção (e) (f) Original. (g) Curvatura. Kanungo. Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação (h) Variação da es- pessura da linha. (i) Variação y da li- (j) Typeset emulation. nha. HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão (k) Rotação. (l) White Speckles. (m) Interrupções da linha. 14 / 48 Resultados I – taxa de erro média (desvio padrão) em %. Ana Maria Rebelo Introdução Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Erro Segmentação Erro Caminhos Estáveis Testes Remoção das linhas de pauta Razão dos pixeis brancos Stable path Sortest Path Dalitz Erro Detecção Ângulo Stable path Sortest Path Dalitz Desvio máximo, n Stable path Sortest Path Dalitz Erro Processo Objectivos Largura do espassamento, ngap Stable path Sortest Path Dalitz rotação 2.5 5 0.7 (3.5); 0.7 (3.5) 1.2 (4.0); 1.2 (4.0) 0.7 (3.5); 0.7 (3.5) 1.2 (4.0); 1.2 (4.0) 4.2 (19.6); 9.8 (29.0) 5.5 (9.3); 37.5 (41.9) white speckle 0.07 0.09 0.11 0.9 (3.7); 0.9 (3.7) 1.2 (3.8); 1.2 (3.8) 2.1 (4.6); 2.3 (4.8) 0.9 (3.7); 0.9 (3.7) 1.7 (4.0); 1.9 (4.3) 5.3 (7.4); 7.0 (9.6) 26.7 (25.3); 29.9 (27.2) 89.3 (54.6); 86.9 (25.6) 54.5 (55.9); 95.2 (17.0) line y-variation 4 5 6 0.7 (3.5); 0.7 (3.5) 0.8 (3.6); 0.8 (3.6) 1.1 (3.8); 1.1 (3.8) 0.7 (3.5); 0.7 (3.5) 0.8 (3.6); 0.8 (3.6) 1.1 (3.8); 1.1 (3.8) 15.7 (27.2); 33.7 (45.0) 13.0 (20.1); 33.7 (45.0) 12.8 (18.6); 34.2 (44.7) typeset emulation I 7 10 13 0.6 (3.5); 0.6 (3.5) 0.6 (3.5); 0.6 (3.5) 0.6 (3.5); 0.6 (3.5) 0.6 (3.5); 0.6 (3.5) 0.6 (3.5); 0.6 (3.5) 0.6 (3.5); 0.6 (3.5) 22.3 (30.0); 17.4 (19.0) 24.2 (38.9); 16.7 (22.0) 31.4 (42.3); 19.2 (20.3) -2.5 0.7 (3.5); 0.7 (3.5) 0.7 (3.5); 0.7 (3.5) 8.6 (14.0); 15.5 (28.7) Runtime 858 seg. 6006 seg. 612 seg. Runtime 809 seg. 5122 seg. 872 seg. Runtime 767 seg. 5122 seg. 768 seg. Runtime 739 seg. 5085 seg. 703 seg. Conclusão 15 / 48 Resultados II – taxa de erro média (desvio padrão) em %. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Dalitz Shortest path Stable path Razão dos falsos positivos 5.2% (10.4) 1.4% (3.5) 1.3% (5.7) Razão dos falsos negativos 5.9% (11.3) 2.5% (7.3) 1.4% (6.4) Runtime 112 seg. 612 seg. 115 seg. Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 16 / 48 Remoção das linhas de pauta. Ana Maria Rebelo Introdução Processo Objectivos Algoritmos de remoção : • Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados • • • LineTrack Height: as linhas detectadas são percorridas e eliminadas quando um sequência vertical de pixeis pretos é inferior a 2xstaf f lineheight. LineTrack Chord: remoção de linhas através dos picos dos ângulos dos comprimentos dos acordes; dois ângulos distintos dependendo se os pixeis pertencem a linhas de pauta ou a sı́mbolos musicais. Roach/Tatem: transformação da imagem original num campo de vectores através do ângulo e do acorde maior para cada pixel preto; pixeis das linhas de pauta têm um comprimento de acorde elevado e um ângulo zero. Skeleton: recorre aos pontos de ramificação e de canto, aos ângulos, à espessura do segmento e do desvio médio quadrático a partir dos mı́nimos quadrados da melhor linha obtida. Métricas de erro: pixeis, regiões segmentos de pauta e localização de interrupções de pauta Conclusão 17 / 48 Resultados I – taxa de erro média (desvio padrão) em %. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Ângulo Stable path + LTH Dalitz + LTH Skeleton -5 1.7 (0.7) 19.4 (18.4) 1.9 (0.9) Amplitude Stable path + LTH Dalitz + LTH Skeleton 0.02 1.4 (0.7) 3.8 (5.8) 2.6 (2.4) Razão dos pixeis brancos Stable path + LTH Dalitz + LTH Skeleton 0.03 11.9 (3.1) 11.5 (3.2) 14.6 (3.2) Desvio máximo, n Stable path + LTH Dalitz + LTH Skeleton 2 1.2 (0.7) 9.0 (13.2) 1.5 (0.8) Largura do espassamento, ngap Stable path + LTH Dalitz + LTH Skeleton 1 1.4 (0.7) 2.6 (1.8) 26.4 (9.8) Deslocamento máx. vert., nshift Stable path + LTH Dalitz + LTH Skeleton 1 1.4 (0.7) 1.5 (0.8) 7.9 (8.9) Conclusão rotação 0 2.5 1.4 (0.7) 1.4 (0.7) 1.4 (0.8) 4.4 (8.8) 1.5 (0.7) 1.6 (0.7) curvatura 0.04 0.06 0.08 1.4 (0.7) 1.4 (0.7) 1.5 (0.7) 14.0 (12.2) 22.8 (13.7) 31.1 (11.0) 5.2 (5.1) 8.1 (7.2) 11.9 (8.6) white speckle 0.05 0.07 0.09 17.2 (4.9) 21.1 (5.9) 24.0 (6.7) 16.8 (4.9) 26.7 (8.0) 53.3 (14.9) 21.5 (4.6) 27.1 (5.6) 35.2 (12.8) line y-variation 3 4 5 1.3 (0.7) 1.3 (0.6) 1.4 (0.6) 10.4 (14.1) 10.9 (14.5) 10.9 (14.5) 1.7 (0.8) 2.2 (0.9) 3.7 (1.7) typeset emulation I 4 7 10 1.4 (0.7) 1.4 (0.7) 1.4 (0.7) 2.9 (2.0) 3.2 (1.7) 2.9 (1.7) 27.3 (10.1) 27.2 (11.3) 25.5 (9.8) typeset emulation II 4 7 10 1.4 (0.7) 1.4 (0.7) 1.5 (0.7) 2.8 (1.6) 3.3 (2.5) 3.8 (2.4) 24.1 (9.1) 26.7 (11.0) 26.1 (9.6) -2.5 1.5 (0.7) 5.2 (8.7) 1.7 (0.8) 5 1.6 (0.7) 17.5 (18.9) 1.7 (0.8) 0.10 1.6 (0.7) 35.0 (10.6) 15.4 (10.4) 0.11 26.1 (7.2) 73.3 (14.6) 46.9 (18.7) 6 1.4 (0.6) 11.0 (14.6) 5.2 (2.2) 13 1.4 (0.7) 3.0 (1.8) 26.4 (10.3) 13 1.6 (0.7) 4.7 (3.7) 29.1 (10.7) 18 / 48 Resultados II – taxa de erro média (desvio padrão) em %. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Taxa de erro Pixeis Segmentação Interrupção das linhas Stable path + LTH 2.8 (1.2) 0.3 (0.1) 0.3 (0.1) Dalitz + LTH 3.8 (2.6) 0.3 (0.1) 0.3 (0.1) Skeleton 6.5 (8.2) 0.3 (0.1) 0.3 (0.1) Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 19 / 48 Resultados III. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 20 / 48 Sı́mbolos musicais. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados 1 Os sı́mbolos que estão caracterizados por um segmento vertical com altura superior a um dado limite – por exemplo, notas “fechadas” (e.g. semı́nimas – ), notas com colchete (e.g. colcheias – ( ) e notas “abertas” (e.g. mı́nimas ). == == 2 Os sı́mbolos que ligam as notas – (e.g. ligaduras entre colchetes ). 3 Os restantes sı́mbolos ligados às linhas de pauta – claves, pausas, (e.g. @ ), acidentes ([, ], \) e métrica (e.g. R ). 4 Os sı́mbolos acima e abaixo das linhas de pauta – notas, ligaduras (e.g. a) e acentos (e.g. >). Conclusão 21 / 48 Processo de segmentação. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 22 / 48 Detecção das ligaduras entre colchetes. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 23 / 48 Detecção das notas fechadas, notas abertas e colchetes. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 24 / 48 Detecção de acidentes, pausas, acentos e indicação de compasso. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 25 / 48 Detecção de claves, ligaduras de duração e ligaduras de expressão. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 26 / 48 Resultados. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 27 / 48 Sı́mbolos musicais I. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 28 / 48 Sı́mbolos musicais II. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados • Sı́mbolos retirados de várias partituras. • Redimensionar cada imagem do sı́mbolo para 20 × 20 ou 150 × 30 pixeis. • Converter para um vector de 400 valores binários ou matriz de caracterı́sticas. • Vector das classes nas redes neuronais: valor 1 na classe correcta; 0 no caso contrário. • Vector das classes nos outros classificadores: números entre 1 e 14, correspondendo a cada classe. Conclusão 29 / 48 Processo de treino e cálculo do erro esperado. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • Dividir o conjunto dos dados: conjuntos de treino (75%), validação (25%) e teste (10%). • Validação cruzada para obter: no de neurónios, γ e C, k, no de estados. • Aprendizagem foi feita alterando, p.e. o no de neurónios na camada escondida, usando o conjunto de treino. • Avaliação do desempenho com os dados de validação. • Cálculo do erro esperado com a rede em que se obteve melhor desempenho: diferença entre os valores esperados e os valores obtidos, usando os dados de teste. 30 / 48 Processo de treino e cálculo do erro esperado. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • Dividir o conjunto dos dados: conjuntos de treino (75%), validação (25%) e teste (10%). • Validação cruzada para obter: no de neurónios, γ e C, k, no de estados. • Aprendizagem foi feita alterando, p.e. o no de neurónios na camada escondida, usando o conjunto de treino. • Avaliação do desempenho com os dados de validação. • Cálculo do erro esperado com a rede em que se obteve melhor desempenho: diferença entre os valores esperados e os valores obtidos, usando os dados de teste. 30 / 48 Processo de treino e cálculo do erro esperado. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • Dividir o conjunto dos dados: conjuntos de treino (75%), validação (25%) e teste (10%). • Validação cruzada para obter: no de neurónios, γ e C, k, no de estados. • Aprendizagem foi feita alterando, p.e. o no de neurónios na camada escondida, usando o conjunto de treino. • Avaliação do desempenho com os dados de validação. • Cálculo do erro esperado com a rede em que se obteve melhor desempenho: diferença entre os valores esperados e os valores obtidos, usando os dados de teste. 30 / 48 Processo de treino e cálculo do erro esperado. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • Dividir o conjunto dos dados: conjuntos de treino (75%), validação (25%) e teste (10%). • Validação cruzada para obter: no de neurónios, γ e C, k, no de estados. • Aprendizagem foi feita alterando, p.e. o no de neurónios na camada escondida, usando o conjunto de treino. • Avaliação do desempenho com os dados de validação. • Cálculo do erro esperado com a rede em que se obteve melhor desempenho: diferença entre os valores esperados e os valores obtidos, usando os dados de teste. 30 / 48 Modelos de Markov Escondidos – Exemplo. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 31 / 48 Modelos de Markov Escondidos. λ = (A; B; π) Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta • A = {aij }: Probabilidade de transição de um estado i para outro estado j, onde aij = P [qt+1 = Sj |qt = Si ] , 1 ≤ i, j ≤ N . • B = bj (k): O conjunto de probabilidades de observação, onde bj (k) = P [ot = xk |qt = Sj ], 1 ≤ k ≤ M , j = 1, 2, ..., N ; bj (k): Probabilidade de observar xk no estado Sj ; oj : Observação no tempo t; qt : O estado no tempo t. • π: Conjunto de probabilidades iniciais dos estados. Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 32 / 48 Rede Neuronal. Ana Maria Rebelo Noção Introdução Modelo neuronal: conjunto de ligações multiplicadas por um peso, uma soma e uma função de activação. Processo Objectivos Detecção yk = ϕ( Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão m X ωkj xj + bk ) (1) j=1 onde x1 ,x2 ,. . .,xm são as camadas de entrada, ω são os pesos do neurónio k, bk é o viés e ϕ(.) é a função de activação. Treino • O treino de uma rede tem como finalidade ajustar os pesos para que os valores de saı́da se assemelhem com os valores pretendidos. • Aprendizagem supervisionada com recurso ao método da retropropagação do erro com a utilização da técnica do gradiente descendente. 33 / 48 Rede Neuronal. Ana Maria Rebelo Noção Introdução Modelo neuronal: conjunto de ligações multiplicadas por um peso, uma soma e uma função de activação. Processo Objectivos Detecção yk = ϕ( Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão m X ωkj xj + bk ) (1) j=1 onde x1 ,x2 ,. . .,xm são as camadas de entrada, ω são os pesos do neurónio k, bk é o viés e ϕ(.) é a função de activação. Treino • O treino de uma rede tem como finalidade ajustar os pesos para que os valores de saı́da se assemelhem com os valores pretendidos. • Aprendizagem supervisionada com recurso ao método da retropropagação do erro com a utilização da técnica do gradiente descendente. 33 / 48 Topologia da rede neuronal. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 34 / 48 Máquinas de vectores de suporte. Ana Maria Rebelo Introdução Processo Objectivos Noção Tratam o problema de classificação como um problema de optimização quadrática. Esta técnica tem como base a construção de um hiperplano como superfı́cie de decisão de modo a maximizar a margem de separação entre amostras positivas e negativas. Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão (n) Um exemplo de duas classes linearmente separáveis com a possibilidade de múltiplos classificadores lineares. (o) Opção da SVM: maximizar a margem de separação. 35 / 48 Formulação do problema para classificadores lineares. Ana Maria Rebelo Prob. primal para uma amostra de treino não separável Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta min N X 1 T w w+C ξi 2 i=1 s.a di (wT xi + b) ≥ 1 − ξi w,b,ξi i = 1, 2, ..., N Segmentação Processo de segmentação Resultados Prob. dual para uma amostra de treino não separável Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão max α N X αi − i=1 N N 1 XX αi αj di dj xT i xj 2 i=1 j=1 PN s.a i=1 αi di = 0 0 ≤ αi ≤ C i = 1, 2, ..., N 36 / 48 Formulação do problema para classificadores lineares. Ana Maria Rebelo Prob. primal para uma amostra de treino não separável Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta min N X 1 T w w+C ξi 2 i=1 s.a di (wT xi + b) ≥ 1 − ξi w,b,ξi i = 1, 2, ..., N Segmentação Processo de segmentação Resultados Prob. dual para uma amostra de treino não separável Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão max α N X αi − i=1 N N 1 XX αi αj di dj xT i xj 2 i=1 j=1 PN s.a i=1 αi di = 0 0 ≤ αi ≤ C i = 1, 2, ..., N 36 / 48 Múltiplas classes. Estratégia de um-contra-um: comparação de pares entre classes. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados min wij ,bij ,ξij s.a X ij 1 ij T ij (w ) w + C ξt (wij )T 2 t (wij )T ϕ(xt ) + bij ≥ 1 − ξtij se xt está na classe i-ésima (wij )T ϕ(xt ) + bij ≤ −1 + ξtij se xt está na classe j-ésima ξtij ≥ 0 Estratégia de voto: se sign((wij )T ϕ(x) + bij ) colocar x na classe i-ésima então o voto para a classe i-ésima é de 1; senão a classe j-ésima é aumentada 1. Classificação k(x, xi ) = exp(−γ||x − xi ||2 ), γ ≥ 0 HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão Handwritten symbols (2) Printed symbols C γ C γ With EM C = 23.5 = 11.3137 γ = 2−7 = 0.0078 C = 21.25 = 2.3784 γ = 2−5.75 = 0.0186 Without EM C = 24.5 = 22.6274 γ = 2−6 = 0.0156 C = 21.25 = 2.3784 γ = 2−5.75 = 0.0186 37 / 48 Múltiplas classes. Estratégia de um-contra-um: comparação de pares entre classes. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados min wij ,bij ,ξij s.a X ij 1 ij T ij (w ) w + C ξt (wij )T 2 t (wij )T ϕ(xt ) + bij ≥ 1 − ξtij se xt está na classe i-ésima (wij )T ϕ(xt ) + bij ≤ −1 + ξtij se xt está na classe j-ésima ξtij ≥ 0 Estratégia de voto: se sign((wij )T ϕ(x) + bij ) colocar x na classe i-ésima então o voto para a classe i-ésima é de 1; senão a classe j-ésima é aumentada 1. Classificação k(x, xi ) = exp(−γ||x − xi ||2 ), γ ≥ 0 HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão Handwritten symbols (2) Printed symbols C γ C γ With EM C = 23.5 = 11.3137 γ = 2−7 = 0.0078 C = 21.25 = 2.3784 γ = 2−5.75 = 0.0186 Without EM C = 24.5 = 22.6274 γ = 2−6 = 0.0156 C = 21.25 = 2.3784 γ = 2−5.75 = 0.0186 37 / 48 Vizinho mais próximo I. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 38 / 48 Vizinho mais próximo II. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 39 / 48 Vizinho mais próximo III. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 40 / 48 Modelação elástica – transformações de deformação. Ana Maria Rebelo Introdução Processo Objectivos Os modelos deformados são obtidos aplicando transformações paramétricas aos protótipos. A variabilidade da forma é imposta por uma distribuição de probabilidade. • • • Detecção Imagem modelada num quadrado unitário S = [0, 1]2 (x, y) 7→ (x, y) + D(x, y) O espaço das funções de deslocamento é extendido pelas bases ortogonais: x emn (x, y) = (2sin(πnx)cos(πmy), 0) Caminhos Estáveis Testes Remoção das linhas de pauta y emn (x, y) = (0, 2sin(πny)cos(πmx)) Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • x ex +ξy ey P∞ P∞ ξmn mn mn mn D(x, y) = , onde m=1 n=1 λ mn x y ξ = (ξmn , ξmn ), m, n = 1, 2, . . . são as projecções da função de deslocamento nas bases ortogonais. Como D(x, y) pode representar deformações complexas dependendo da escolha de ξmn e de M e N , impõe-se uma densidade de probabilidade em D(x, y) ⇒ ξmn são independentes uns dos outros, independentes ao longo de x e y e têm uma distribuição gaussiana com média 0 e variância σ 2 : M X N X 1 1 2 2 exp − ((ξmn ) + (ξmn ) ) P (ξ) = 2σ 2 (2πσ 2 )M N m=1 n=1 41 / 48 Modelação elástica – transformações de deformação. Ana Maria Rebelo Introdução Processo Objectivos Os modelos deformados são obtidos aplicando transformações paramétricas aos protótipos. A variabilidade da forma é imposta por uma distribuição de probabilidade. • • • Detecção Imagem modelada num quadrado unitário S = [0, 1]2 (x, y) 7→ (x, y) + D(x, y) O espaço das funções de deslocamento é extendido pelas bases ortogonais: x emn (x, y) = (2sin(πnx)cos(πmy), 0) Caminhos Estáveis Testes Remoção das linhas de pauta y emn (x, y) = (0, 2sin(πny)cos(πmx)) Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • x ex +ξy ey P∞ P∞ ξmn mn mn mn D(x, y) = , onde m=1 n=1 λ mn x y ξ = (ξmn , ξmn ), m, n = 1, 2, . . . são as projecções da função de deslocamento nas bases ortogonais. Como D(x, y) pode representar deformações complexas dependendo da escolha de ξmn e de M e N , impõe-se uma densidade de probabilidade em D(x, y) ⇒ ξmn são independentes uns dos outros, independentes ao longo de x e y e têm uma distribuição gaussiana com média 0 e variância σ 2 : M X N X 1 1 2 2 exp − ((ξmn ) + (ξmn ) ) P (ξ) = 2σ 2 (2πσ 2 )M N m=1 n=1 41 / 48 Modelação elástica – transformações de deformação. Ana Maria Rebelo Introdução Processo Objectivos Os modelos deformados são obtidos aplicando transformações paramétricas aos protótipos. A variabilidade da forma é imposta por uma distribuição de probabilidade. • • • Detecção Imagem modelada num quadrado unitário S = [0, 1]2 (x, y) 7→ (x, y) + D(x, y) O espaço das funções de deslocamento é extendido pelas bases ortogonais: x emn (x, y) = (2sin(πnx)cos(πmy), 0) Caminhos Estáveis Testes Remoção das linhas de pauta y emn (x, y) = (0, 2sin(πny)cos(πmx)) Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • x ex +ξy ey P∞ P∞ ξmn mn mn mn D(x, y) = , onde m=1 n=1 λ mn x y ξ = (ξmn , ξmn ), m, n = 1, 2, . . . são as projecções da função de deslocamento nas bases ortogonais. Como D(x, y) pode representar deformações complexas dependendo da escolha de ξmn e de M e N , impõe-se uma densidade de probabilidade em D(x, y) ⇒ ξmn são independentes uns dos outros, independentes ao longo de x e y e têm uma distribuição gaussiana com média 0 e variância σ 2 : M X N X 1 1 2 2 exp − ((ξmn ) + (ξmn ) ) P (ξ) = 2σ 2 (2πσ 2 )M N m=1 n=1 41 / 48 Modelação elástica – exemplo. Ana Maria Rebelo Introdução Processo Objectivos D(x, y) = M X N y y x ex X ξmn mn + ξmn emn λmn m=1 n=1 Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 42 / 48 Resultados I. 14 classes; 2521 imagens sintéticas; 3222 imagens reais. Ana Maria Rebelo Introdução Processo Objectivos Sintéticas NN Detecção Caminhos Estáveis Testes Remoção das linhas de pauta SVM Segmentação Processo de segmentação Resultados Método KNN HMM Reais KNN Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão NN SVM HMM Desempenho (%) [95.93 96.74] [95.34 96.01] [87.60 88.97] [77.66 82.11] [97.30; 98.29] [96.50; 97.50] [84.17; 86.71] [73.00 88.71] ME 7 3 7 3 7 3 7 3 [93.41 94.53] [92.24 93.29] [78.85 82.88] [74.88 77.67] [94.59; 96.90] [93.10; 95.05] [76.58; 81.04] [70.89; 76.17] 7 3 7 3 7 3 7 3 43 / 48 Resultados II. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Vizinho Mais Próximo Máquinas Vectores Suporte Com ME Redes Neuronais Sem ME Com ME Sem ME Com ME Bequadro \ 89.87% 83.54% 100% 100% 100% 100% Sustenido ] 88.37% 79.07% 98.84% 96.51% 100% 98.84% Sem ME Tabela: Desempenho obtido para os sı́mbolos bequadro e sustenido pelas matrizes de confusão dos dados de teste. Conclusão 44 / 48 Resumo. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • Proposta de um novo algoritmo para a detecção de linhas de pauta baseado nos caminhos estáveis: nova e promissora metodologia para a detecção de linhas de pauta. • Técnica adaptável a um vasto limite de condições de imagens: robustez em imagens com inclinação, linhas com descontinuidades, curvaturas e diferentes espessuras. • Aplicação de métricas para testar o desempenho do algoritmo proposto e compará-lo com outros já existentes. • Incorporação do algoritmo com algoritmos de remoção de linhas: métricas de erro, estudos comparativos. • Detecção dos sı́mbolos musicais. • Diferentes métodos para classificar os sı́mbolos musicais: redes neuronais, o vizinho mais próximo, máquinas de vectores de suporte e modelos de Markov escondidos. • Aplicação da técnica modelação elástica para simular a variabilidade nos sı́mbolos. • Estudo comparativo entre os diversos classificadores. 45 / 48 Resumo. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • Proposta de um novo algoritmo para a detecção de linhas de pauta baseado nos caminhos estáveis: nova e promissora metodologia para a detecção de linhas de pauta. • Técnica adaptável a um vasto limite de condições de imagens: robustez em imagens com inclinação, linhas com descontinuidades, curvaturas e diferentes espessuras. • Aplicação de métricas para testar o desempenho do algoritmo proposto e compará-lo com outros já existentes. • Incorporação do algoritmo com algoritmos de remoção de linhas: métricas de erro, estudos comparativos. • Detecção dos sı́mbolos musicais. • Diferentes métodos para classificar os sı́mbolos musicais: redes neuronais, o vizinho mais próximo, máquinas de vectores de suporte e modelos de Markov escondidos. • Aplicação da técnica modelação elástica para simular a variabilidade nos sı́mbolos. • Estudo comparativo entre os diversos classificadores. 45 / 48 Resumo. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • Proposta de um novo algoritmo para a detecção de linhas de pauta baseado nos caminhos estáveis: nova e promissora metodologia para a detecção de linhas de pauta. • Técnica adaptável a um vasto limite de condições de imagens: robustez em imagens com inclinação, linhas com descontinuidades, curvaturas e diferentes espessuras. • Aplicação de métricas para testar o desempenho do algoritmo proposto e compará-lo com outros já existentes. • Incorporação do algoritmo com algoritmos de remoção de linhas: métricas de erro, estudos comparativos. • Detecção dos sı́mbolos musicais. • Diferentes métodos para classificar os sı́mbolos musicais: redes neuronais, o vizinho mais próximo, máquinas de vectores de suporte e modelos de Markov escondidos. • Aplicação da técnica modelação elástica para simular a variabilidade nos sı́mbolos. • Estudo comparativo entre os diversos classificadores. 45 / 48 Resumo. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • Proposta de um novo algoritmo para a detecção de linhas de pauta baseado nos caminhos estáveis: nova e promissora metodologia para a detecção de linhas de pauta. • Técnica adaptável a um vasto limite de condições de imagens: robustez em imagens com inclinação, linhas com descontinuidades, curvaturas e diferentes espessuras. • Aplicação de métricas para testar o desempenho do algoritmo proposto e compará-lo com outros já existentes. • Incorporação do algoritmo com algoritmos de remoção de linhas: métricas de erro, estudos comparativos. • Detecção dos sı́mbolos musicais. • Diferentes métodos para classificar os sı́mbolos musicais: redes neuronais, o vizinho mais próximo, máquinas de vectores de suporte e modelos de Markov escondidos. • Aplicação da técnica modelação elástica para simular a variabilidade nos sı́mbolos. • Estudo comparativo entre os diversos classificadores. 45 / 48 Resumo. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • Proposta de um novo algoritmo para a detecção de linhas de pauta baseado nos caminhos estáveis: nova e promissora metodologia para a detecção de linhas de pauta. • Técnica adaptável a um vasto limite de condições de imagens: robustez em imagens com inclinação, linhas com descontinuidades, curvaturas e diferentes espessuras. • Aplicação de métricas para testar o desempenho do algoritmo proposto e compará-lo com outros já existentes. • Incorporação do algoritmo com algoritmos de remoção de linhas: métricas de erro, estudos comparativos. • Detecção dos sı́mbolos musicais. • Diferentes métodos para classificar os sı́mbolos musicais: redes neuronais, o vizinho mais próximo, máquinas de vectores de suporte e modelos de Markov escondidos. • Aplicação da técnica modelação elástica para simular a variabilidade nos sı́mbolos. • Estudo comparativo entre os diversos classificadores. 45 / 48 Resumo. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • Proposta de um novo algoritmo para a detecção de linhas de pauta baseado nos caminhos estáveis: nova e promissora metodologia para a detecção de linhas de pauta. • Técnica adaptável a um vasto limite de condições de imagens: robustez em imagens com inclinação, linhas com descontinuidades, curvaturas e diferentes espessuras. • Aplicação de métricas para testar o desempenho do algoritmo proposto e compará-lo com outros já existentes. • Incorporação do algoritmo com algoritmos de remoção de linhas: métricas de erro, estudos comparativos. • Detecção dos sı́mbolos musicais. • Diferentes métodos para classificar os sı́mbolos musicais: redes neuronais, o vizinho mais próximo, máquinas de vectores de suporte e modelos de Markov escondidos. • Aplicação da técnica modelação elástica para simular a variabilidade nos sı́mbolos. • Estudo comparativo entre os diversos classificadores. 45 / 48 Resumo. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • Proposta de um novo algoritmo para a detecção de linhas de pauta baseado nos caminhos estáveis: nova e promissora metodologia para a detecção de linhas de pauta. • Técnica adaptável a um vasto limite de condições de imagens: robustez em imagens com inclinação, linhas com descontinuidades, curvaturas e diferentes espessuras. • Aplicação de métricas para testar o desempenho do algoritmo proposto e compará-lo com outros já existentes. • Incorporação do algoritmo com algoritmos de remoção de linhas: métricas de erro, estudos comparativos. • Detecção dos sı́mbolos musicais. • Diferentes métodos para classificar os sı́mbolos musicais: redes neuronais, o vizinho mais próximo, máquinas de vectores de suporte e modelos de Markov escondidos. • Aplicação da técnica modelação elástica para simular a variabilidade nos sı́mbolos. • Estudo comparativo entre os diversos classificadores. 45 / 48 Resumo. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • Proposta de um novo algoritmo para a detecção de linhas de pauta baseado nos caminhos estáveis: nova e promissora metodologia para a detecção de linhas de pauta. • Técnica adaptável a um vasto limite de condições de imagens: robustez em imagens com inclinação, linhas com descontinuidades, curvaturas e diferentes espessuras. • Aplicação de métricas para testar o desempenho do algoritmo proposto e compará-lo com outros já existentes. • Incorporação do algoritmo com algoritmos de remoção de linhas: métricas de erro, estudos comparativos. • Detecção dos sı́mbolos musicais. • Diferentes métodos para classificar os sı́mbolos musicais: redes neuronais, o vizinho mais próximo, máquinas de vectores de suporte e modelos de Markov escondidos. • Aplicação da técnica modelação elástica para simular a variabilidade nos sı́mbolos. • Estudo comparativo entre os diversos classificadores. 45 / 48 Resumo. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão • Proposta de um novo algoritmo para a detecção de linhas de pauta baseado nos caminhos estáveis: nova e promissora metodologia para a detecção de linhas de pauta. • Técnica adaptável a um vasto limite de condições de imagens: robustez em imagens com inclinação, linhas com descontinuidades, curvaturas e diferentes espessuras. • Aplicação de métricas para testar o desempenho do algoritmo proposto e compará-lo com outros já existentes. • Incorporação do algoritmo com algoritmos de remoção de linhas: métricas de erro, estudos comparativos. • Detecção dos sı́mbolos musicais. • Diferentes métodos para classificar os sı́mbolos musicais: redes neuronais, o vizinho mais próximo, máquinas de vectores de suporte e modelos de Markov escondidos. • Aplicação da técnica modelação elástica para simular a variabilidade nos sı́mbolos. • Estudo comparativo entre os diversos classificadores. 45 / 48 Trabalho futuro. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados • Continuar a investigar novas metodologias de reconhecimento óptico musical para partituras manuscritas e diferentes notações musicais. • Estudo e compreensão aprofundada das mais recentes técnicas de reconhecimento de padrões, aprendizagem automática e programação lógica indutiva. • Fusão de regras e técnicas de diversas áreas para superar as lacunas dos algoritmos actuais. • Integração dos algoritmos desenvolvidos num sistema com acesso web aos acervos, permitindo adicionar, anotar e converter partituras, bem como pesquisar, navegar e analisar o repositório associado. Conclusão 46 / 48 Trabalho futuro. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados • Continuar a investigar novas metodologias de reconhecimento óptico musical para partituras manuscritas e diferentes notações musicais. • Estudo e compreensão aprofundada das mais recentes técnicas de reconhecimento de padrões, aprendizagem automática e programação lógica indutiva. • Fusão de regras e técnicas de diversas áreas para superar as lacunas dos algoritmos actuais. • Integração dos algoritmos desenvolvidos num sistema com acesso web aos acervos, permitindo adicionar, anotar e converter partituras, bem como pesquisar, navegar e analisar o repositório associado. Conclusão 46 / 48 Trabalho futuro. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados • Continuar a investigar novas metodologias de reconhecimento óptico musical para partituras manuscritas e diferentes notações musicais. • Estudo e compreensão aprofundada das mais recentes técnicas de reconhecimento de padrões, aprendizagem automática e programação lógica indutiva. • Fusão de regras e técnicas de diversas áreas para superar as lacunas dos algoritmos actuais. • Integração dos algoritmos desenvolvidos num sistema com acesso web aos acervos, permitindo adicionar, anotar e converter partituras, bem como pesquisar, navegar e analisar o repositório associado. Conclusão 46 / 48 Trabalho futuro. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados • Continuar a investigar novas metodologias de reconhecimento óptico musical para partituras manuscritas e diferentes notações musicais. • Estudo e compreensão aprofundada das mais recentes técnicas de reconhecimento de padrões, aprendizagem automática e programação lógica indutiva. • Fusão de regras e técnicas de diversas áreas para superar as lacunas dos algoritmos actuais. • Integração dos algoritmos desenvolvidos num sistema com acesso web aos acervos, permitindo adicionar, anotar e converter partituras, bem como pesquisar, navegar e analisar o repositório associado. Conclusão 46 / 48 Trabalho futuro. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados • Continuar a investigar novas metodologias de reconhecimento óptico musical para partituras manuscritas e diferentes notações musicais. • Estudo e compreensão aprofundada das mais recentes técnicas de reconhecimento de padrões, aprendizagem automática e programação lógica indutiva. • Fusão de regras e técnicas de diversas áreas para superar as lacunas dos algoritmos actuais. • Integração dos algoritmos desenvolvidos num sistema com acesso web aos acervos, permitindo adicionar, anotar e converter partituras, bem como pesquisar, navegar e analisar o repositório associado. Conclusão 46 / 48 Contribuições e publicações relacionadas. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta • • • • • • Conclusão Novos algoritmos para a detecção e classificação de partituras manuscritas. Integração dos novos algoritmos num sistema web. “Optical Recognition of Music Symbols: a comparative study”, Ana Rebelo, Artur Capela and Jaime S. Cardoso, na International Journal of Document Analysis and Recognition (IJDAR 2008). “Staff Detection with Stable Paths”, Jaime S. Cardoso, Artur Capela, Ana Rebelo, Carlos Guedes, Joaquim Pinto da Costa, na IEEE Transaction on Pattern Analysis and Machine Intelligence (TPAMI 2008). Artigos publicados: • Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Criação de uma base de dados de partituras reais: referências de detecção e remoção. Submissão dos artigos para publicação: Segmentação Processo de segmentação Resultados Introdução de um novo algoritmo para detectar linhas de pautas baseado nos Caminhos Estáveis. • • • “A Connected Path Approach for Staff Detection on a Music Score”, Jaime S. Cardoso, Artur Capela, Ana Rebelo, Carlos Guedes, na IEEE International Conference on Image Processing (ICIP 2008). “Staff Line Detection and Removal with Stable Paths”, Artur Capela, Ana Rebelo, Jaime S. Cardoso, Carlos Guedes, na International Conference on Signal Processing and Multimedia Applications (SIGMAP 2008). “Integrated Recognition System for Music Scores”, Artur Capela, Jaime S. Cardoso, Ana Rebelo, Carlos Guedes, na International Computer Music Conference (ICMC 2008). “A Shortest Path Approach for Staff Line Detection”, Ana Rebelo, Artur Capela, Joaquim F. Pinto da Costa, Carlos Guedes, Eurico Carrapatoso, Jaime S. Cardoso, na International Conference on Automated Production of Cross Media Content for Multi-channel Distribution (AxMedis 2007). 47 / 48 Contribuições e publicações relacionadas. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta • • • • • • Conclusão Novos algoritmos para a detecção e classificação de partituras manuscritas. Integração dos novos algoritmos num sistema web. “Optical Recognition of Music Symbols: a comparative study”, Ana Rebelo, Artur Capela and Jaime S. Cardoso, na International Journal of Document Analysis and Recognition (IJDAR 2008). “Staff Detection with Stable Paths”, Jaime S. Cardoso, Artur Capela, Ana Rebelo, Carlos Guedes, Joaquim Pinto da Costa, na IEEE Transaction on Pattern Analysis and Machine Intelligence (TPAMI 2008). Artigos publicados: • Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Criação de uma base de dados de partituras reais: referências de detecção e remoção. Submissão dos artigos para publicação: Segmentação Processo de segmentação Resultados Introdução de um novo algoritmo para detectar linhas de pautas baseado nos Caminhos Estáveis. • • • “A Connected Path Approach for Staff Detection on a Music Score”, Jaime S. Cardoso, Artur Capela, Ana Rebelo, Carlos Guedes, na IEEE International Conference on Image Processing (ICIP 2008). “Staff Line Detection and Removal with Stable Paths”, Artur Capela, Ana Rebelo, Jaime S. Cardoso, Carlos Guedes, na International Conference on Signal Processing and Multimedia Applications (SIGMAP 2008). “Integrated Recognition System for Music Scores”, Artur Capela, Jaime S. Cardoso, Ana Rebelo, Carlos Guedes, na International Computer Music Conference (ICMC 2008). “A Shortest Path Approach for Staff Line Detection”, Ana Rebelo, Artur Capela, Joaquim F. Pinto da Costa, Carlos Guedes, Eurico Carrapatoso, Jaime S. Cardoso, na International Conference on Automated Production of Cross Media Content for Multi-channel Distribution (AxMedis 2007). 47 / 48 Contribuições e publicações relacionadas. Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta • • • • • • Conclusão Novos algoritmos para a detecção e classificação de partituras manuscritas. Integração dos novos algoritmos num sistema web. “Optical Recognition of Music Symbols: a comparative study”, Ana Rebelo, Artur Capela and Jaime S. Cardoso, na International Journal of Document Analysis and Recognition (IJDAR 2008). “Staff Detection with Stable Paths”, Jaime S. Cardoso, Artur Capela, Ana Rebelo, Carlos Guedes, Joaquim Pinto da Costa, na IEEE Transaction on Pattern Analysis and Machine Intelligence (TPAMI 2008). Artigos publicados: • Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Criação de uma base de dados de partituras reais: referências de detecção e remoção. Submissão dos artigos para publicação: Segmentação Processo de segmentação Resultados Introdução de um novo algoritmo para detectar linhas de pautas baseado nos Caminhos Estáveis. • • • “A Connected Path Approach for Staff Detection on a Music Score”, Jaime S. Cardoso, Artur Capela, Ana Rebelo, Carlos Guedes, na IEEE International Conference on Image Processing (ICIP 2008). “Staff Line Detection and Removal with Stable Paths”, Artur Capela, Ana Rebelo, Jaime S. Cardoso, Carlos Guedes, na International Conference on Signal Processing and Multimedia Applications (SIGMAP 2008). “Integrated Recognition System for Music Scores”, Artur Capela, Jaime S. Cardoso, Ana Rebelo, Carlos Guedes, na International Computer Music Conference (ICMC 2008). “A Shortest Path Approach for Staff Line Detection”, Ana Rebelo, Artur Capela, Joaquim F. Pinto da Costa, Carlos Guedes, Eurico Carrapatoso, Jaime S. Cardoso, na International Conference on Automated Production of Cross Media Content for Multi-channel Distribution (AxMedis 2007). 47 / 48 Ana Maria Rebelo Introdução Processo Objectivos Detecção Caminhos Estáveis Testes Remoção das linhas de pauta Segmentação Processo de segmentação Resultados FIM Classificação HMM Rede Neuronal SVM Vizinho mais próximo Modelação elástica Resultados Conclusão 48 / 48