Apresentação - RECOD — Reasoning for Complex Data

Transcrição

Apresentação - RECOD — Reasoning for Complex Data
Classificação Semi-Supervisionada em Grafos
Candidato: Felipe Andrade Holanda
Orientador: Jacques Wainer
Instituto de Computação - Unicamp
21/09/2011
Agenda
1
Detecção de Comunidades
Definição
Exemplos
Estado da Arte
2
Classificação
Definição
Exemplos
Estado da Arte
3
Comparação
4
Objetivo
5
Cronograma
6
Agradecimentos
7
Referências
Detecção de Comunidades
Definição
Definição
Definição intuitiva
Determinar os grupos de vértices que tem mais conexões entre si do que
com o resto do grafo.
3
Detecção de Comunidades
Definição
Detecção de Comunidades
Figura: Grafo simples com três comunidades
4
Detecção de Comunidades
Exemplos
Rede de interações de proteı́nas
Numa rede de interações de proteı́nas, acredita-se que as comunidades
representam grupos funcionais (grupo de proteı́nas envolvidas num mesmo
processo.
Entrada: um grafo de interações de proteı́nas
Saı́da: os agrupamentos de proteı́nas, que geralmente correspondem
aos grupos funcionais.
5
Detecção de Comunidades
Exemplos
Rede de interações de proteı́nas
Figura: Grafo das interações entre as proteı́nas do fungo S. cerevisiae
(Palla et al., 2005)
6
Detecção de Comunidades
Exemplos
Rede de colaboração cientı́fica
Numa rede de colaboração cientı́fica, construı́da a partir de citações,
artigos tendem a citar outros semelhantes
Entrada: um grafo colaboração
Saı́da: Os agrupamentos dos artigos, que geralmente correspondem a
áreas ou subáreas.
8
Detecção de Comunidades
Exemplos
Rede de colaboração cientı́fica
Figura: Mapa da ciência baseado em citações. Contruı́do a partir da análise de
6.128 revistas cientı́ficos conectados por 6.434.916 de citações
(Rosvall and Bergstrom, 2008)
9
Detecção de Comunidades
Estado da Arte
Estado da Arte
OSLOM (Lancichinetti et al., 2011)
Baseado na significância estatı́stica das comunidades em relação a um
grafo aleatório
Caracterı́sticas
Grafos orientados
Arestas com pesos
Comunidades sobrepostas
Comunidades hierárquicas
11
Detecção de Comunidades
Estado da Arte
Estado da Arte
Figura: OSLOM
12
Classificação
Definição
Classificação semi-supervisionada
Definição
É possı́vel inferir os atributos de um vértice em uma rede baseado nos
atributos dos outros vértices da rede?
Entrada: um grafo com alguns vértices previamente classificados
Saı́da: a classe dos outros vértices
Objetivo: inferir atributos
Permite classificar a mesma rede usando diferentes critérios
13
Classificação
Exemplos
Redes sociais
Figura: Grafo das interações sociais entre os alunos da Zachary’s karate club
14
Classificação
Exemplos
Redes sociais
Figura: Vértices previamente classificados
15
Classificação
Exemplos
Redes sociais
Figura: Classificação dos demais vértices
16
Classificação
Exemplos
Redes sociais
Figura: Grafo de amigos do Facebook mostrando a classe Unicamp
17
Classificação
Exemplos
Redes sociais
Figura: Grafo de amigos do Facebook classificados por cidade
18
Classificação
Estado da Arte
Estado da Arte
Mislove et al.
Analisou 3 redes:
Estudantes da graduação da Universidade de Rice
Estudantes de pós-graduação da Universidade de Rice
Moradores de New Orleans
Cada rede foi agrupada segundo diferentes critérios.
Escola anteriormente frequentada
Ano de ingresso na Universidade
Curso da graduação
19
Classificação
Estado da Arte
Afinidade
Representa o grau de homofilia da rede em relação a um certo atributo a
Aa =
fração das arestas ligando vértices com o mesmo atributo a
fração esperada se os atributos fossem aleatórios
Users
Rice undergrads
Attribute
college
major
year
(1)
Affinity
4.49
2.33
1.97
Tabela: Dados retirados de Mislove et al. (2010)
20
Classificação
Estado da Arte
Figura: Informação Mútua Normalizada versus fração de usuários previamente
classificados da rede social dos alunos de graduação da Universidade de Rice
agrupados segundo 3 critérios.
21
Comparação
Deteção de comunidades
Problema de agrupamento
Apenas dados não catalogados
Existem algoritmos bastante elaborados e eficientes como o OSLOM
Detecta as comunidades mais fortes
Classificação semi-supervisionada
Problema de classificação
Dados não catalogados
Alguns dados catalogados
Mislove et al. utilizou um algoritmo guloso simples
22
Objetivo
Objetivo
Adaptar diferentes algoritmos de detecção de comunidades para
solucionar o problema da classificação
Desenvolver novos algoritmos de classificação que usem as
informações das comunidades
23
Cronograma
Cronograma
1
2
3
4
5
6
7
8
9
Leitura de Artigos
Cursar Disciplinas
Preparação para o EQM
EQM
Coleta de dados de redes sociais
Desenvolvimento dos Algoritmos
Validação dos Resultados
Escrita da Dissertação
Defesa
24
Agradecimentos
Agradecimentos
Agradeço ao RECOD, ao IC, à Unicamp e ao CNPq
25
Perguntas?
26
Referências
Referências
Lancichinetti, A., Radicchi, F., Ramasco, J. J., and Fortunato, S. (2011).
Finding statistically significant communities in networks. PLoS ONE,
6(4):e18961.
Mislove, A., Viswanath, B., Gummadi, K. P., and Druschel, P. (2010).
You are who you know: inferring user profiles in online social networks.
In Proceedings of the third ACM international conference on Web
search and data mining, WSDM ’10, pages 251–260, New York, NY,
USA. ACM.
Palla, G., Derényi, I., Farkas, I., and Vicsek, T. (2005). Uncovering the
overlapping community structure of complex networks in nature and
society. Nature, 435(7043):814–818.
Rosvall, M. and Bergstrom, C. T. (2008). Maps of random walks on
complex networks reveal community structure. Proceedings of the
National Academy of Sciences, 105(4):1118–1123.
27