Das BibSonomy

Transcrição

Das BibSonomy
BibSonomy
Lesezeichen und Literatur verwalten in
sozialen Systemen
Dr. Andreas Hotho
Miranda Grahl, Robert Jäschke, Christoph Schmitz, Gerd Stumme
Soziale Bookmark-Systeme:
Kollaboratives Annotieren von Web-Resourcen
mit frei wählbaren Wörtern
Einfach zu benutzen, offen für jedermann
Ergänzt/überholt Semantic-Web-Ansatz
Gemeinsames Benutzen führt zu konvergierendem
Sprachgebrauch und emergenter Semantik.
Hier: http://www.bibsonomy.org/
BibSonomy@Kassel
2
Ausblick: Folksonomies & Co.
Das populärste System
dieser Art ist Flickr,
ein öffentliches
Fotoalbum.
IBM denkt an, sein
Intranet ähnlich zu
strukturieren, da
leichter zu warten.
Microsofts neues
Betriebssystem soll(te)
ähnlich werden.
BibSonomy@Kassel
3
Übersicht
Motivation
BibSonomy (Demo)
Soziale Bookmark-Systeme
und Folksonomies
Suche in Folksonomies
Trends entdecken
Lernen von Beziehungen
BibSonomy@Kassel
4
Bibsonomy
Bibsonomy ist ein Bookmark-Server:
Benutzer können ihre Bookmarks hochladen,
mit frei wählbaren “Tags” versehen,
und bei sich und anderen danach suchen.
Online unter: http://www.bibsonomy.org
BibSonomy@Kassel
5
Folksonomies
• Eine Folksonomy erlaubt es
Nutzern
mit Hilfe von Tags
Ressourcen
wie Bookmarks, Photos,
… zu beschreiben und zu
verwalten
• Leichtgewichtiges
Wissensmanagement
wenig Overhead
gut integriert in die tägliche
Arbeit
Gerd Stumme
28/09/06
6
Bibsonomy
Bibsonomy ist auch ein Literatur-Server:
Benutzer können Referenzen hochladen,
mit frei wählbaren “Tags” versehen,
und bei sich und anderen danach suchen.
BibSonomy@Kassel
7
Relationen in BibSonomy
BibSonomy@Kassel
8
Typische Tag-Wolke
BibSonomy@Kassel
9
Übersicht
Motivation
BibSonomy (Demo)
Soziale Bookmark-Systeme
und Folksonomies
Suche in Folksonomies
Trends entdecken
Lernen von Beziehungen
BibSonomy@Kassel
10
Folksonomy-Typen
Tagging von Objekten durch die
Gemeinschaft (z.B. Webseiten)
http://del.icio.us/
BibSonomy@Kassel
Tagging von Objekten die sonst
schwer suchbar sind (z.B. Bilder)
http://www.flickr.com
Thomas Vander Wal (http://www.personalinfocloud.com/2005/02/explaining_and_.html)
11
Def.: Folksonomy
Eine Folksonomy ist ein Tupel F := (U, T, R, Y, ≺) wobei
•
U, T, und R endliche Mengen sind, deren Elemente users, tags und
resources, heißen.
• Y ist eine dreistellige Relation zwischen ihnen, d.h. Y ⊆ U × T × R,
dessen Elemente tag assignments (TAS) heissen und
•
≺ ist eine benutzerspezifische Unter-/Obertag-Relation,
d.h. ≺ ⊆ U × T × T.
Die Personomy Pu von Benutzer u ist die Einschränkung von F auf u.
BibSonomy@Kassel
12
Evaluierung auf del.icio.us-Daten
Wir crawlten del.icio.us vom 27. bis 30.7.2005
und erhielten
•
•
•
•
|U| = 75,242 Nutzer,
|T| = 533,191 Tags,
|R| = 3,158,297 Resourcen, und
|Y| = 17,362,212 Tag-Zuordnungen.
BibSonomy@Kassel
13
Ergebnisse: Power-Law-Verteilung
BibSonomy@Kassel
14
Übersicht
Motivation
BibSonomy (Demo)
Soziale Bookmark-Systeme
und Folksonomies
Suche in Folksonomies
Trends entdecken
Lernen von Beziehungen
BibSonomy@Kassel
15
Suche in Folksonomies
PageRank-Ansatz ist sehr erfolgreich im Web (s. Google):
Autoritätswerte werden entlang der Hyperlinks propagiert.
Folksonomies haben eine andere Struktur als der Web-Graph:
Tag 12
User
3
User23
Tag
4
User34
Tag
User 1
3
2
User 2
4
3
User 3
4
User 4
Res 1
Res 2
Res 3
Web-Graph
Folksonomies
Wie kann ein Ranking-Verfahren für diese neue Struktur
aussehen?
BibSonomy@Kassel
16
Erster Ansatz: Adaptierter PageRank
Hyperkanten aufspalten in ungerichtete Kanten
V=U∪T∪R
E = {{u,t} | ∃ r ∈ R : (u,t,r) ∈ Y} ∪
{{t,r} | ∃ u ∈ U : (u,t,r) ∈ Y} ∪
{{u,r} | ∃ t ∈ T : (u,t,r) ∈ Y}
Iterative Gewichts-Propagation gemäß
x ← d Ax + (1-d) p
wobei A
x
p
d
BibSonomy@Kassel
die Adjazenzmatrix des Graphen ist,
der Rankvektor,
ein Präferenzvektor,
ein Gewichtungsfaktor.
17
Ergebnisse: Adaptierter PageRank
BibSonomy@Kassel
18
Ergebnisse: Adaptierter PageRank
http://slashdot.org/
0,0002613
http://pchere.blogspot.com/2005/02/absolutely-delicious-complete-tool.html
0,0002320
http://script.aculo.us/
0,0001770
http://www.adaptivepath.com/publications/essay s/archives/000385.php
0,0001654
http://johnvey .com/features/deliciousdirector/
0,0001593
http://en.wikipedia.org/wiki/Main_Page
0,0001407
http://www.flickr.com/
0,000137 6
http://www.goodfonts.org/
0,0001349
http://www.43folders.com/
0,0001160
http://www.csszengarden.com/
0,0001149
http://wellstyled.com/tools/colorscheme2/index -en.html
0,0001108
http://pro.html.it/esempio/nifty/
0,000107 0
http://www.alistapart.com/
0,0001059
http://postsecret.blogspot.com/
0,0001058
http://www.beelerspace.com/index .php?p=890
0,0001035
http://www.techsupportalert.com/best_46_free_utilities.htm
0,0001034
http://www.alv it.de/web-dev/
0,0001020
http://www.technorati.com/
0,0001015
BibSonomy@Kassel
http://www lifehacker com/
0 0001009
19
FolkRank: Thematisches Ranking
Durch Zuordnung von Gewicht zu nur einem Eintrag in
Präferenzvektor p in
x ← d Ax + (1-d) p
können relevante Seiten zu einem Thema gefunden werden.
Problem: In Folksonomies ist die globale Struktur zu dominant.
FolkRank-Lösung:
Berechne ausserdem iterativ den Fixpunkt von
x0 ← Ax0
und bilde den Vektor x - x0 .
BibSonomy@Kassel
20
Ergebnis für das tag: boomerang
PageRank ohne Präferenz
BibSonomy@Kassel
PageRank mit Präferenz
FolkRank mit Präferenz
21
Ergebnisse: Suche nach “Semantic Web”
PageRank ohne Präferenz
BibSonomy@Kassel
PageRank mit Präferenz
FolkRank mit Präferenzz
22
Ergebnisse: Suche nach “Semantic Web”
http:// www .semanticweb .org /
0,3761957
http://flink. semanticweb .org /
0,0005566
http:// simile .mit.edu/piggy -bank /
0,0003828
http://www.w3.org/2001/ sw/
0,0003216
http:// infomesh .net/2001/ swintro /
0,0002162
http://del. icio.us/register
0,0001745
http:// mspace .ecs .soton .ac.uk/
0,0001712
http:// www .adaptivepath .com/publications /essays /archives /000385.php
0,0001637
http:// www .ontoweb .org /
0,0001617
http:// www .aaai.org /AITopics /html /ontol .html
0,0001613
http:// simile .mit.edu/
0,0001395
http:// itip.evcc.jp/itipwiki/
0,0001256
http:// www .google .be/
0,0001224
http:// www .letterjames .de/index.html
0,0001224
http:// www .daml .org /
0,0001216
http:// shirky .com/writings /ontology _overrated .html
0,0001195
http:// jena.sourceforge .net/
0,0001167
http:// www .alistapart .com /
0,0001102
http:// www .federalconcierge .com/WritingBusinessCases .html
0,0001060
http:// pchere .blogspot .com/2005/02/ absolutely -delicious -complete -tool.html
0,0001059
http:// www .shirky.com/writings /semantic _syllogism .html
0,0001052
BibSonomy@Kassel
23
FolkRank: Zusammenfassung
Folkrank basiert nur auf der Folksonomy,
nicht auf dem Inhalt der Dokumente.
Geeignet für
Multimedia-Suche
Suche im Intranet
Empfiehlt dem Benutzer
andere Benutzer mit verwandten Interessen
andere Tags zum selben Thema
interessante Ressourcen
BibSonomy@Kassel
24
Übersicht
Motivation
BibSonomy (Demo)
Soziale Bookmark-Systeme
und Folksonomies
Suche in Folksonomies
Trends entdecken
Lernen von Beziehungen
BibSonomy@Kassel
25
Trend Detection in Folksonomies
• Wie kann man interessante Ressourcen, aufkommende Trends
oder Themen, an denen man interessiert ist, ausfindig
machen?
Menge an Ressourcen im WWW ist sehr groß
Nutzen des Wissens und der Erfahrung von Folksonomynutzern
Nutze FolkRank um den „popularity change“ zu berechnen
Fokussierung auf spezifische Themen möglich
Unabhängig von der Art der Ressource oder des Inhaltes
Del.icio.us posts zwischen 15. Juni 2004 und 15. Juli 2005
BibSonomy@Kassel
26
Trends in Delicious
Popularity Change:
BibSonomy@Kassel
27
Baseline mit Empty-tag
1
"empty_tag"
"blog"
"css"
"design"
"linux"
"music"
"news"
"programming"
"software"
"web"
0.9
0.8
0.7
rank
0.6
0.5
0.4
0.3
0.2
0.1
0
0
2
4
6
8
10
12
14
month
BibSonomy@Kassel
28
Entwicklung von Tags in Verbindung zum Tag “politics”
0.01
funny
religion
politics
bushco
bush
economics
usa
humor
activism
war
society
media
us
iraq
news
election
culture
0.008
rank
0.006
0.004
0.002
0
0
2
4
6
8
10
12
14
month
BibSonomy@Kassel
29
Globale Entwicklung der Ressourcen
1
http://www.intersmash.com/300images/
http://www.musicplasma.com/
http://www.pixy.cz/apps/barvy/index-en.html
http://bugmenot.com/
http://pchere.blogspot.com/2005/02/absolutely-delicious-complete-tool.html
http://www.ficml.org/jemimap/style/color/wheel.html
http://script.aculo.us/
http://www.flickr.com/
http://slashdot.org/
http://www.adaptivepath.com/publications/essays/archives/000385.php
0.8
rank
0.6
0.4
0.2
0
0
2
4
6
8
10
12
14
month
BibSonomy@Kassel
30
Änderung der Popularität von Ressourcen 15. Mai vs. 15. Juni 2005
Tags: ‘semantic web’, ‘semantic’, ‘web’, and ‘semanticweb’
BibSonomy@Kassel
31
Übersicht
Motivation
BibSonomy (Demo)
Soziale Bookmark-Systeme
und Folksonomies
Suche in Folksonomies
Trends entdecken
Lernen von Beziehungen
BibSonomy@Kassel
32
Mining Association Rules in Folksonomies
• Wir wenden Rule-Mining-Techniken an, um
Recommender zu erstellen
Tags vorzuschlagen
Communities zu finden
• Standard Rule-Mining arbeitet auf binären Relation:
z.B. contains(shopping transaction, item)
• Wir wenden Rule-Mining auf Folksonomies an
Ternäre Relation
verschiedene Projektionen
Apriori-Algorithmus
BibSonomy@Kassel
33
Mining Association Rules
• Betrachte Kontext K = (G, M, I)
• Untersuche Transaktionen g ∈ G bestehend aus Items m ∈ M
{{a,b,c,d}, {a,d,f,h}, {d,f,g,h}, ...}
Z. B. Warenkörbe
• Kann aufgefasst werden als Matrix der Inzidenzrelation I ⊆ G × M
t1
t2
t3
a
1
1
0
b
1
0
0
BibSonomy@Kassel
c
1
0
0
d
1
1
1
e
0
0
0
f
0
1
1
g
0
0
1
h
0
1
1
34
Mining Association Rules
Finde alle Regeln der Form
IF a basket contains items I = {i1,..., ik} ⊆ M
THEN it also contains item J = {j1,..., jl} ⊆ M
mit einer hohen confidence
( |(I ∪ J)´| / |I´| ≥ minconf for some given minconf ∈[0,1]. )
und mit einem hohen support.
( |(I ∪ J)´| / G ≥ minsupp for some given minsupp ∈[0,1]. )
Standard-Algorithmus: Apriori (Agrawal 1994)
BibSonomy@Kassel
35
Von Folksonomies zu Association Rules
Folksonomies haben eine triadische Natur:
Würfel Y anstelle der Matrix I
Tripartiter Hypergraph anstelle des bipartiten Graphen
Einfache Lösung:
ternäre Relation → Projektion auf dyadischen Kontext
→ Apriori-Algorithmus
Dimensionsreduktion:
konvertiere F = (U, T, R, Y) in ein K = (G, M, I) indem
man entlang einer Dimension eine Scheibe abschneidet
man projiziert und aggregiert
BibSonomy@Kassel
36
Zwei Beispielprojektionen
• K1 = (U x R, T, I1)
Wenn ein Nutzer Ressources mit Tags ti verschlagwortet, dann nutzt
er auch tj
Anwendung:
Tag-Empfehlungen
Lernen von Implikationen (subsumption)
• K2 = (T x U, R, I2)
Wenn Nutzer die Ressourcen ri mit einem speziellen Tag taggen,
dann Nutzen sie es auch, um rj zu taggen
Anwendung:
Entdecken von Communities
Empfehlen von Resource
BibSonomy@Kassel
37
Sample Projections
• K1 = (U x R, T, I1)
Wenn ein Nutzer Ressourcen mit Tags ti verschlagwortet,
dann nutzt er auch tj
Anwendung:
Tag-Empfehlungen
Lernen von Implikationen (subsumption)
BibSonomy@Kassel
38
Association Rules
• K2 = (T x U, R, I2)
Wenn Nutzer die Ressourcen ri mit einem speziellen Tag taggen,
dann Nutzen sie es auch, um rj zu taggen
Anwendung:
Entdecken von Communities
Empfehlen von Ressourcen
BibSonomy@Kassel
39
Association Rules
• K2 = (T x U, R, I2)
Wenn Nutzer die Ressourcen ri mit einem speziellen Tag taggen,
dann Nutzen sie es auch, um rj zu taggen
Anwendung:
Entdecken von Communities
Empfehlen von Ressourcen
BibSonomy@Kassel
40
Zusammenfassung: Folksonomies
Folksonomien überwinden den Wissensakquisitions-Flaschenhals
durch einfache Bedienung
und schnell wachsende Benutzerzahlen.
Unser FolkRank-Algorithmus unterstützt die Suche in
Folksonomies.
FolkRank bildet die Basis für die Methoden zur Trendentdeckung
Assoziationsregeln dienen der weiteren Strukturierung.
BibSonomy@Kassel
41
Ausblick
Spamerkennung
Entdecken von Communities
Skalierung des Rankingverfahrens
Recommender
Geotagging
…
BibSonomy@Kassel
42
Ausblick: Folksonomies & Co.
Zu guter Letzt:
Folksonomies werden
uns bei allen
relevanten Dingen
des täglichen Lebens
begleiten. ☺
BibSonomy@Kassel
43
Übersicht
http://www.kde.cs.uni-kassel.de/
Motivation
BibSonomy (Demo)
Soziale Bookmark-Systeme
und Folksonomies
Suche in Folksonomies
Trends entdecken
http://www.bibsonomy.org/
Lernen von Beziehungen
Ende
BibSonomy@Kassel
44

Documentos relacionados