17.12.2008

Transcrição

17.12.2008
Gastvortrag
g im Rahmen der
Vorlesung Datenorganisation
Thema des Vortrages:
Suchmaschinen Suchmaschinen Marketing und Web
Suchmaschinen,
Mining
17. Dezember 2008
Karsten Sohns
sohns@iwi uni-hannover
[email protected]
hannover.de
de
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
#1
Zur Person
„ Dipl. Ök. Karsten Sohns
Wissenschaftlicher Mitarbeiter und Doktorand am Institut für
Wirtschaftsinformatik der Leibniz Universität Hannover seit Mai
2007
Studium in Hannover
Arbeitsschwerpunkte:
E-Learning
Wissensmanagement
Web 2.0 Anwendungen
Informationsmanagement
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
#2
Agenda (1)
„ Suchmaschinen
Einführung und Typen
Funktionsweise
Google als Marktführer
„ Suchmaschinen Marketing
Search Engine
g
Optimization
p
(SEO)
(
)
Search Engine Marketing (SEM)
Strategische Umsetzung
Abrechnungsmodelle
Anwendungsbeispiel: Google Analytics
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
#3
Agenda (2)
„ Web Mining
W b Usage
Web
U
Mining
Mi i
Web Structure Mining
W b Content
Web
C
Mining
Mi i
Text Mining und NLP
Clusterung
Klassifikation
Beispielanwendungen
p
g und betriebswirtschaftliche
Anwendungsfelder
„ Ausblick und Fragen
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
#4
Agenda (1)
„ Suchmaschinen
Einführung und Typen
Funktionsweise
Google als Marktführer
„ Suchmaschinen Marketing
Grundkonzepte
p
Search Engine Optimization (SEO)
Search Engine Marketing (SEM)
Abrechnungsmodelle
Anwendungsbeispiel: Google Analytics
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
#5
Suchmaschinen
Einführung und Typen
„ Das Suchen und Finden von Informationen im Internet wird
nur durch die Nutzung möglichst ausgereifter Suchmaschinen
Technologien möglich.
g gibt
g es eine Vielzahl anderer Anbieter,, wie z. B.
„ Neben Google
Yahoo, Altavista, MSN Live Search usw. und verschiedene
Typen von Suchmaschinen (Volltextsuchmaschinen, Verzeichnisse und
Metasuchmaschinen)
„ Zur Zeit gibt es ungefähr 1 Billion URLs im „Internet“*
g
, deren zentrale Funktion die Suche
„ Definition: „ … Web-Angebote,
nach externen Internet-Inhalten ist Internet-Inhalten ist. Eine
Suchmaschine enthält auf der Startseite ein … Eingabefeld, in dem
Nutzer gesuchte Begriffe eingeben können
können. Die Ausgabe der
Suchergebnisse erfolgt in einer sortierten Trefferliste… “**
*Quelle:
Quelle: http://googleblog.blogspot.com/2008/07/we-knew-web-was-big.html
http://googleblog blogspot com/2008/07/we-knew-web-was-big html
**Quelle: Machill, Wegweiser 2004, S. 52.
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
#6
Suchmaschinen
Einführung und Typen
„ Verzeichnisse
Verzeichnisse sind redaktionell betreute Web Kataloge.
Kataloge
Die enthaltenen Pages sind somit einer gewissen menschlichen
Kontrolle unterworfen und somit qualitativ hochwertiger.
Die Darstellung erfolgt nicht alphabtisch
alphabtisch, sondern nach
Themengebieten.
Mit Hilfe eines Verzeichnisses ist die explorative Suche in den
einzelnen Kategorien möglich.
möglich
Das bekannteste Verzeichnis ist Yahoo Directory, das größte
Verzeichnisse ist das Open Directory Project, welches von
Freiwilligen angelegt wurde
wurde. (4
(4.5
5 Mio
Mio. Seiten und 590
590.000
000
Kategorien)
Die Sortierung innerhalb des Verzeichnisses erfolgt im
Allgemeinen auf Grundlage einer vom Redakteur vorgenommen
Gewichtung. Um so höher die Relevanz der Quelle für die
gesamte Kategorie ist um so höher ist sie gewichtet und wird
somit weiter „vorne“ bzw. „oben“ angezeigt.
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
#7
Suchmaschinen
Einführung und Typen
„ Suchmaschinen
Ziel ist die Erfassung RELEVANTER Inhalte
Google als Markführer - dazu später mehr
Volltextsuche in allen indizierten Webseiten mit Hilfe von
Spidern, Crawlern oder Robots
Einsatz von ausgefeilten Suchalgorithmen
Zur Funktionsweise
k
später mehr
h
Vielzahl von Anbietern wie Yahoo, Altavista, Seekport, MSN oder
netluchs.de
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
#8
Suchmaschinen
Einführung und Typen
„ Meta Suchmaschinen
Der Begriff „Meta“
Meta“ entstammt dem Griechischen und bedeutet
„auf einer höheren Stufe befindlich“.
Meta Suchmaschinen aggregieren
gg g
die Suchergebnisse
g
einzelner
Suchmaschinen zu einer gemeinsamen Trefferliste.
Im Allgemeinen ist es möglich einzelne Suchdienste an- oder
abzuwählen um zz. B
abzuwählen,
B. die Suchzeit zu verkürzen
verkürzen.
Im Gegensatz zu konventionellen Suchmaschinen haben
Metasuchen keinen eigenen Datenbestand.
Problem – unterschiedliche Operatoren oder unterschiedliche
Notation der Operatoren (UND, ODER, NICHT)
Ergebnisse sind zum Teil nur der „kleinste
kleinste
Gemeinsame Nenner“
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
#9
Suchmaschinen
Einführung und Typen
„ Beispiel MetaGer http://meta.rrzn.uni-hannover.de/
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 10
Suchmaschinen
Einführung und Typen
„ Spezielle Suchdienste
Google Maps/Local Æ Verknüpfung von geografischen
Informationen mit Internetseiten
Das Örtliche Æ Telefonbuch
GoYellow Æ Branchenbuch
Yasnin www.yasni.de Æ Personensuchmaschine
G
Google
l S
Scholar
h l Æ Suche
S h für
fü wissenschaftliche
i
h f li h Publikationen
blik i
Wissenschaftliche Suchmaschinen ETOC, TIP Order
Produktsuche Æ „Preisroboter
Preisroboter“
Location Based Services für Mobiltelefone „Restaurant Suche“
uvm.
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 11
Suchmaschinen
Funktionsweise
„ Exemplarischer Aufbau einer Suchmaschine
erfasse Daten Web‐Robot sortiere Daten
IR‐System
IR
System Index
Index auszuschlies‐
sende URLs relevante Suchtreffer Inhalte von Websites
Query Prozessor
User
WEB
Veröffentlichung Veröffentlichung
von Websites Such‐
begriffe sortierte Suchtreffer Such‐
anfrage Suchanfrage Suchmaske / Interface
Suchergebnisse
Suchmaschine
Yvonne von Bischopinck & Michael Ceyp, Suchmaschinen‐Marketing Konzepte, Umsetzung und Controlling, Seite 32
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 12
Suchmaschinen
Funktionsweise
„ Erfassung durch Robots
Synonyme Benutzung der Begriffe Robot
Robot, Spider
Spider, Crawler
Der Robot flogt dabei der Linkstruktur des Internets, erfasst neue oder
veränderte Ressourcen.
Alle erfassten Seiten werden lokal im Datenbestand der Suchmaschine
gespeichert Æ Performance Gründe
Ein Robot besteht im Westlichen aus vier Komponenten:
URL Datenbank: Speichert die zu erfassenden URLs und letzte
bzw. nächste Erfassung
Loader: Verteilt und Koordiniert den Erfassungsprozess
Gatherer: Sammelt die Daten und übergibt sie an den Checker
Checker: Übergibt die Daten zum IR System und aktualisiert die
URL Datenbank (z.
(z B.
B tote Links)
Der Checker übernimmt die „Filterfunktion“ und sortiert doppelte
Datenbestände aus und aktualisiert außerdem die „Blacklist“ (Verstöße
gegen die Suchmaschinenordnung)
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 13
Suchmaschinen
Funktionsweise
„ Datenaufbereitung- und Analyse
Der durch den Robot erfasse Datenbestand
liegt unstrukturiert vor. Die Aufbereitung und
Analyse übernimmt ein Information Retrieval
System (IR System).
Ziel: Das Heraussuchen bestimmter
Informationen aus einer umfangreichen Datenoder Wissensbasis,, die anhand von
Bewertungskriterien das Bilden einer Rangfolge
bezüglich einer Suchanfrage ermöglichen.
Problem: Sehr schwache Strukturierung der
Daten im Internet (HTML Problem) und viele
unterschiedliche Datenformate (HTML, XML,
pdf, doc, usw.)
Lösung: Filterung und Erfassung von
Schlüsselwörtern und Erstellung eines Indexes.
Index Æ Liste aller Schlüsselwörter
Yvonne von Bischopinck & Michael Ceyp, Suchmaschinen‐Marketing Konzepte, Umsetzung und Controlling, Seite 38
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 14
Suchmaschinen
Funktionsweise
„ Ranking (1)
Zur Beantwortung einer Suchanfrage vergleicht der Query
Processor die vom Benutzer eingegeben Suchwörter mit den
Schlüsselwörtern im Index.
Zu jedem Keyword liegt eine Datei vor, in der alle Dokumente
erfasst sind, die das Schlüsselwort enthalten.
Je „besser
besser“ die gefundenen Treffer zur Suchanfrage passen,
passen
desto höher ist die Positionierung in der Trefferliste.
Der Abgleich zwischen Suchanfrage und relevanten
S hl
Schlüsselwörtern
l
ist sehr
h schwierig
h
und
d erfolgt
f l mit der
d Hilfe
lf von
Vektoren.
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 15
Suchmaschinen
Funktionsweise
„ Ranking (2)
Der Vergleich zwischen Suchanfrage und gefundenen Dokumenten
erfolgt mit Hilfe von Vektoren.
Jedes Dokument wird durch einen n-dimensionalen Vektor repräsentiert,
wobei
obei n die An
Anzahl
ahl der
de identifizierten
identifi ie ten Keywords
Ke o ds eines Dok
Dokumentes
mentes ist
und der zugewiesene Wert der Gewichtung des Keywords entspricht.
Analog dazu wird jedes Wort der Suchanfrage als Dimension des
V kt
Vektors
d
dargestellt,
t llt so dass
d
eine
i Suche
S h mit
it m Wörtern
Wö t
in
i einem
i
mdimensionalen Vektor resultiert.
Die einzelnen Werte der Dimension werden automatisch von der
S h
Suchmaschine
hi vergeben,
b
wobei
b i Kriterien
i i wie
i z.B. die
di Position
i i des
d
Wortes in der Suchanfrage mit einbezogen werden.
Bei der Auswertung der Suchanfrage werden die Vektoren der
Trefferdokumente mit dem Anfrage-Vektor korreliert, so dass die
Ähnlichkeit der Vektoren den Rang der Dokumente in der Ergebnisliste
bestimmt
Yvonne von Bischopinck & Michael Ceyp, Suchmaschinen‐Marketing Konzepte, Umsetzung und Controlling, Seite 42
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 16
Suchmaschinen
Funktionsweise
„ Natural- vs. Paid Listings
Natural Listings folgen dem oben beschriebenen Mechanismus,
Mechanismus
die Trefferliste wird durch die Relevanz der Inhalte bezüglich der
Suchanfrage gebildet, der Prozess erfolgt in der Regel
vollautomatisch und führt zu den bekannten Datenausgaben:
Dem Titel des Dokumentes (Link), dem Beschreibungstext und
der URL
Paid Listings sind Trefferlisten, die auf die Schlüsselwörter
passende Werbeanzeigen (Sponsored Links, AdWords, usw.)
ausgeben.
ausgeben
Die Werbeanzeigen werden im allgemeinen in einem separierten
Bereich angezeigt. Früher gab es auch Suchmaschinen, die
N
Natural
l und
d Paid
P id Listings
Li i
gemischt
i h haben
h b (Paid
(P id Inclusion).
I l i )
Die Rangfolge der Werbeeinblendungen wird mit Hilfe eines
Aktionsverfahrens ermittelt. (später mehr)
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 17
Suchmaschinen
Funktionsweise
„ Natural- und Paid Listings
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 18
Suchmaschinen
Google als Marktführer
„ „Das Ziel von Google besteht darin, die auf der Welt vorhandenen Informationen zu
organisieren und allgemein zugänglich und nutzbar zu machen“
Æ Auszug aus der Google Philosophie
„ PageRank-Technologie
PageRank nimmt eine objektive Bewertung der Wichtigkeit von Websites vor … Anstatt
die direkten Links zu zählen, interpretiert PageRank einen Link von Seite A auf Seite B als
Votum für Seite B durch Seite A. Anschließend bewertet PageRank die Wichtigkeit einer
Seite anhand der erzielten Voten. PageRank berücksichtigt auch die Wichtigkeit jeder
Seite, die ein Votum abgibt, da die Voten von einigen Seiten einen höheren Wert haben
und
d deshalb
d h lb auch
h der
d Seite,
S it auff die
di der
d Link
Li k verweist,
i t einen
i
höheren
höh
Wert
W t geben.
b
Wichtige Seiten werden von PageRank höher eingestuft und demnach auch in den
Suchergebnissen an einer vorderen Position aufgeführt.
„ Analyse von Hypertextübereinstimmung
Die Suchmaschine von Google analysiert auch den Inhalt von Seiten. Anstatt nur den
seitenbasierten Text einzulesen (der über Metatags von Website-Publishern manipuliert
werden kann), wird aber der gesamte Inhalt einer Seite unter Berücksichtigung von
Faktoren wie Schriftarten, Unterteilungen und der genauen Position aller Begriffe
analysiert. Google analysiert außerdem den Inhalt der benachbarten Websites, um
sicherzustellen, dass die ausgegebenen Ergebnisse die Suchanfrage des Nutzers am
t ff d t b
treffendsten
beantworten.
t
t
Quelle: http://www.google.de/intl/de/corporate/tech.html
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 19
Suchmaschinen
Google als Marktführer
„ Aktuelle Zahlen über Google
Google Inc. Umsatz
und Gewinn*
Quelle: http://www.webhits.de/
http://www webhits de/
*http://www.heise.de/newsticke
r/Googles-Zahlen-naehren-dieSkeptiker--/meldung/102837
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 20
Agenda (1)
„ Suchmaschinen
Einführung und Typen
Funktionsweise
Google als Marktführer
„ Suchmaschinen Marketing
Grundkonzepte
p
Search Engine Optimization (SEO)
Search Engine Marketing (SEM)
Abrechnungsmodelle
Anwendungsbeispiel: Google Analytics
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 21
Suchmaschinen Marketing
Grundkonzepte
„ Einführung
Einsatz von Suchmaschinen als Marketing Instrument
Ziel: (Hohe) Positionierung einer Website und deren Inhalten in
den Suchergebnissen
g
einer Suchmaschine
Zwei grundlegende Herangehensweisen
Search Engine Optimization (SEO)
Maßnahmen zum Erhalt einer möglichst hohen Position in den
Natural Listings (siehe oben) einer Suchmaschine.
Bezogen auf die Gestaltung und Konzeption der eigenen
I t
Internetpräsenz.
t ä
Search Engine Marketing (SEM)
Bewerbung der eigenen Internetpräsenz in Suchmaschinen
durch bezahlte Sucheinträge und bezahlten Werbeflächen (Paid
Placements oder Keyword-Anzeige)
Bezahlte Aufnahme in den Index ((Paid Inclusions)) ohne die
Kennzeichnung als Paid Listing vs. Natural Listing
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 22
Suchmaschinen Marketing
Grundkonzepte
„ Kreislauf des Suchmaschinen Marketing
Zielfestlegung
Strategische
Entscheidung
Web-Controlling
Operative
Durchführung
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
Yvonne von Bischopinck & Michael Ceyp
Suchmaschinen-Marketing
K
Konzepte,
t Umsetzung
U
t
und
dC
Controlling
t lli
Seite 100
17.12.2008
# 23
Suchmaschinen Marketing
Grundkonzepte
„ 1. Zielfestlegung
In der ersten Phase wird das mit Suchmaschinen-Marketing
Suchmaschinen Marketing verfolgte
Marketing-Ziel festgelegt. Hierbei geht es nicht etwa um Ziele der Art „Platz
1 bei Google“ oder „Mehr Besucher auf der Website“, sondern um
g
, konkrete Ziele wie „„In den nächsten fünf Monaten
unternehmensgerichtete,
die Besucherquote auf der Website um 30% erhöhen“ oder „In drei
Monaten den Abverkauf im Internet von Produkt X um 20% erhöhen“.
„ 2. Strategische Entscheidungen
Nach der Festlegung des Ziels müssen strategische Entscheidungen
getroffen werden, auf welche Art dieses Ziel am besten zu erreichen ist:
Einzusetzende Suchmaschinen
Suchmaschinen-Marketing-Instrumente
Marketing Instrumente
Zu bewerbende Angebote und Zielseiten des Keyword-Advertisings
Zu berücksichtigende Netzwerke bzw. Zielsuchmaschinen
Budgetierung
den Ressourcen (Zeit, Inhouse/extern)
Wettbewerbsverhalten
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 24
Suchmaschinen Marketing
Grundkonzepte
„ 3. Operative Durchführung
Eine umfangreiche
g
Keyword-Analyse
y
y stellt die Grundlage
g für alle weiteren
operativen Maßnahmen dar. Dabei werden auch technische und inhaltliche
Änderungen an der eigenen Website vorgenommen und unter Berücksichtigung
der strategischen Entscheidungen die konkreten Kampagnenparameter
(
(Keywords,
d Anzeigentext, Zielseiten,
l
Bietstrategie, Anzeigenposition)) umgesetzt.
„ 4. Web-Controlling
Hier werden kontinuierlich und (nahezu) in Echtzeit qualitative, quantitative und
wirtschaftlich relevante Erfolgsgrößen erfasst, die sich durch detaillierte
Zugriffstatistiken der Website ergeben. Diese automatisch per TrackingSoftware aufgezeichneten Kunden- und Nutzungsdaten werden daraufhin
ausgewertet
t t und
d analysiert.
l i t Di
Dies ermöglicht
ö li ht einerseits
i
it einen
i
I t/S ll Ab l i h
Ist/Soll-Abgleich
(aktueller Stand / festgelegtes Marketing-Ziel), sowie andererseits die
Identifikation von Optimierungsfaktoren. Letztere können daraufhin gezielt zur
Variation und Optimierung der Kampagnenparameter und Website sowie zur
Kostenreduktion verwendet werden. Wie die Phase des Web-Controllings nahe
legt, resultiert die Erfolgskontrolle in einem neuen Durchlauf der vier Phasen.
Quelle: Yvonne von Bischopinck & Michael Ceyp Suchmaschinen-Marketing
Suchmaschinen Marketing Konzepte, Umsetzung
und Controlling Seite 100 ff.
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 25
Suchmaschinen Marketing
Grundkonzepte
User
Suchmaschine
Paid Links
Natural Links
W b it
Website
Keyword‐Advertising (Paid Placements))
Paid Inclusion
SSEM
SEO
Suchmaschinen Marketing Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
Yvonne von Bischopinck & Michael Ceyp
Suchmaschinen-Marketing
K
Konzepte,
t Umsetzung
U
t
und
dC
Controlling
t lli
Seite 79
17.12.2008
# 26
Suchmaschinen Marketing
Search Engine Optimization (SEO)
„ Die Search Enigine Optimization nutzt die OnPage und
OnSite Optimierung
ƒ Mit Hilfe der Suchmaschinen Optimierung wird die eigene
Internetseite unter den Aspekten
p
Design,
g Struktur, Navigation
g
aber
vor allem Inhalt aufbereitet und optimiert. (OnPage
Optimierung)
ƒ Hauptaugenmerk ist die Einbindung von Schlüsselwörtern an den
entscheidenden Stellen im HTML Dokument (Titel Tag,
Überschriften h1, h2
ƒ Diese Optimierung
O
sollll die
d die
d Indexierung
d
der
d Internetseite durch
d h
die Suchmaschine ermöglichen oder verbessern und vor allem eine
höhere Positionierung in der Trefferliste ermöglichen.
ƒ Sehr aufwendiger Prozess, da die Website auf Suchverhalten und
die Suchbegriffe der Zielgruppe angepasst werden muss.
Ziel: Verbesserung der Natural Listings
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 27
Suchmaschinen Marketing
Search Engine Optimization (SEO)
Neben der Optimierung der Webseiteninhalte gibt es Maßnahmen
zur verbesserten der Domain allgemein (OnSite Optimierung)
Möglichst gute Lesbarkeit der Webseite durch die Suchmaschinen
Robots.
Verwendung lesbarer Technologien auf der Website
Website, z.
z B.
B Flash
ist „lesbar“, Java ist nicht „lesbar“.
Ein sehr wichtiges Merkmal ist die interne und externe Verlinkung
der Website (siehe Anwendungsbeispiel Google)
Externe Links
Wichtigstes Instrument der SEO da viele und qualitativ hochwertige externe
Links für
fü die Q
Qualität
alität der
de eigenen Website sprechen.
sp echen Dabei kann zusätzlich
sät lich
noch die Qualität und Beliebtheit der Ursprungsseite einbezogen werden.
Interne Links
Jede Seite solle von vier anderen themenverwanden internen Seiten verlinkt
sein. Jede Seite sollte in drei „Klicks“ erreichbar sein. Auch die Linktexte
sollten „selbstsprechend sein z. B. „Firma Produkt“
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 28
Suchmaschinen Marketing
Search Engine Marketing (SEM)
„ Das Search-Engine-Marketing beschäftigt sich mit dem gezielten
Einsatz von bezahlten Einträgen in Suchmaschinen und der
Einblendung von Schlüsselwort abhängigen Webetexten in
Suchmaschinen sogenanntem Keyword Advertising -bei Google
AdWords genannt.
„ Webetreibende wählen Keywords für ihre Produkte aus, bei Abfrage
der Keywords erfolgt eine Webeeinblendung.
„ In der Regel wird mit Hilfe eines Auktionsmechanismus die
Reihenfolge der Werbeinblendungen festgelegt, Angebote mit einem
zu niedrigen Klickpreis (Cost per Click) kommen nicht zum Zug.
( i h Abrechnungsmodelle)
(siehe
Ab h
d ll )
„ Beispiel: Für das Top-Keyword „Krankenversicherung Vergleich“ war
im Jahr
a 2005
005 der
d derzeit
d
höchste
ö
Klickpreis
p
von
o 12 Euro
u o für
ü Position
o o
1 zu zahlen.*
„ Zur Erstellung und zum Monitoring der Anzeigen kommen spezielle
*Yvonne von Bischopinck & Michael Ceyp, Suchmaschinen-Marketing
Anwendungen zum Einsatz.
Einsatz
Konzepte, Umsetzung und Controlling, Seite 120
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 29
Suchmaschinen Marketing
Search Engine Marketing (SEM)
„ Werbeprogramme der Google Inc.
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 30
Suchmaschinen Marketing
Abrechnungsmodelle
„ Pay per View (PPV)
Bezahlt wird beim PPV jeweils für die Einblendung der Werbemaßnahme
(AdImpression) Æ Bannerwerbung
„ Pay per Click (PPC)
D W
Der
Werbetreibende
b t ib d zahlt
hlt nur, wenn der
d Empfänger
E fä
einen
i
Kli k auff die
Klick
di
Werbemaßnahme tätigt. Die Kostenpro Klick (Cost per Click, kurz CPC)
beschreiben den Preis, der vom Werbetreibenden für einen Klick auf die
Anzeige zu zahlen ist.
ist
„ Pay per Lead (PPL)
Es wird der Erfolg
g der Werbemaßnahme mit berücksichtigt.
g Kosten
fallen an, wen es zu einem „qualifizierten“ Kundenkontakt kommt, z. B.
Kataloganforderung, hiterlassen der Kontaktdaten.
„ Pay per Order (PPO)
„ Beim PPA-Verfahren wird nur dann bezahlt, wenn der Klick zur
Umsatzgenerierung oder Anmeldung zu einem bestimmten Dienst führt.
Eine Anbindung an die E
E-Commerce
Commerce Systeme ist erforderlich
erforderlich.
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 31
Suchmaschinen Marketing
Anwendungsbeispiel: Google Analytics
„ Startseite der Google Analytics Anwendung
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 32
Suchmaschinen Marketing
Anwendungsbeispiel: Google Analytics
„ Geschaltete Adwords (Anzeigen)
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 33
Suchmaschinen Marketing
Google Analytics
„ Maßnahmen gegen die Erfassung durch Tracking
Software
Regelmäßiges Löschen von Cookies
PlugIns zum erkennen und Anzeigen von Analyse Tools, z. B.
Counterpixel https://addons.mozilla.org/de/firefox/addon/5414
Einschränken oder Abschalten von JavaScript
Was ist JavaScript?
„ Mit … JavaScript können Inhalte generiert werden, deren Erscheinungsbild
sich bei Nutzerinteraktion ändert – beispielsweise die Farbe eines Hyperlinks,
während
äh d sich
i h der
d Mauszeiger
M
i
über
üb dem
d
Link
Li k befindet.
b fi d t Dadurch
D d h lassen
l
sich
i h
Webseiten realisieren, die herkömmlichen Desktop-Applikationen in
Funktionalität und Bedienungskomfort nicht nachstehen.“ Quelle:
p //de
ped a o g/
/ a aSc p
http://de.wikipedia.org/wiki/JavaScript
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 34
Agenda (2)
„ Web Mining
W b Usage
Web
U
Mi i
Mining
Web Structure Mining
W b Content
Web
C
Mining
Mi i
Text Mining und NLP
Clusterung
Klassifikation
Beispielanwendungen
p
g und betriebswirtschaftliche
Anwendungsfelder
„ Ausblick und Fragen
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 35
Web Mining
Einführung und Grundlagen
„ Was ist Web Mining?
Unter Web Mining versteht man die Nutzung von Data Mining
Techniken zur (teil)automatischen Erfassung und Extraktion von
Daten aus dem Internet.
Data Mining Techniken sind eine Vielzahl von mathematischen
Verfahren zur Erkennung von Mustern in Datenbeständen. Ziel ist
die effektive Erfassung und Auswertung von großen
Datenbeständen.
Web Mining lässt sich in drei Teildisziplinen aufteilen:
Web
W
b Usage
U
Mining
Mi i
Web Structure Mining
Web Content Mining
g
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 36
Web Mining
Web Usage Mining
„ Was ist Web Usage Mining?
Das Web Usage Mining dient der Verhaltensanalyse von
Webseitenbesuchern.
Betreiber von Webshops
p können damit beispielsweise
p
das
Kaufverhalten untersuchen um ihren Internetauftritt besser an
den Bedürfnissen ihrer Kunden ausrichten zu können. (Vgl.
Google Analytics)
Die Analyse erfolgt auf drei Ebenen:
Web Server Ebene (Server Log Files)
Proxyserver Ebene (Auslesen der Weiterleitungsdaten)
Client Ebene (Betriebssystem, Browser, IP, Cookies, Browser
mit Datenschnittstelle (Google Chrome)
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 37
Web Mining
Web Structure Mining
„ Was ist Web Structure Mining?
Das Web Structure Mining
g kommt zum Einsatz,, um Informationen über
die Struktur von Webseiten und ihren Verbindung untereinander zu
gewinnen.
Intra-Page
Intra
Page Structure Mining
Anordnung von Objekten innerhalb einer Webseite
Inter-Page Structure Mining
A d
Anordnung
mehrerer
h
Webseiten
W b it zueinander
i
d
Quelle: DA Ne
euhaus 2008,
S. 15
ƒ Ein besonderes Augenmerk liegt auf der Analyse von Linkstrukturen
vgl. „Google Algorithmus“
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 38
Web Mining
Web Content Mining
„ Was ist Web Content Mining?
Kollmann definiert Web Content Mining als eine „Anwendung
Anwendung von Data
Mining-Verfahren, die das Ziel hat die Informationssuche im Internet,
durch Strukturierung und Systematisierung von Dokumenten-Inhalten zu
vereinfachen. Die Dokumente müssen beim anschließenden
Informationsscreening leichter und besser erkannt werden können.“
Kollmann 2007, S. 201
„ Was für Verfahren kommen dazu zum Einsatz?
Text Mining und Natural Language Processing (NLP)
Clusterung
Klassifikation
„ Was für Anwendungsscenarios gibt es?
Generierung von Kunden- und Produktinformationen (siehe unten)
Marktforschung und Wettbewerbsanalyse
Wissensextraktion aus sozialen Netzwerken (siehe unten)
Generierung von Wissensvorteilen auf Handelsmärkten
Innovative Schutz- und Sicherheitskonzepte (siehe unten)
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
17.12.2008
# 39
Datenorganisation
Karsten Sohns
Web Mining
Web Content Mining
„ Möglicher Ablauf des Web Content Mining
Information Retrieval
Web Agent
Groups Agent
Mail Agent
Blog Agent
Forum Agent
…
Sematic
Statistical
Structural
NLP
Keywords
…
HTML
Network
structures
PDF
XML
Excel
…
Data Extraction
Proce
ess flow
Content Analysis
Structured
Presentation
TNS-INFRATEST, WebLedge™, Available from: http://www.tns-infratest.com/marketing_tools/webledge.asp.
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 40
Web Mining
Web Content Mining
„ Beispielanwendungen, Surf3D Pro von Navagent
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 41
Web Mining
Web Content Mining
„ Beispielanwendungen, Opinion Observer, Liu et al.
LIU ET AL.,
AL Opinion Observer: Analyzing and Comparing Opinions on the Web,
Web in: Proceedings of the 14th
international conference on World Wide Web, Chiba 2005.
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 42
Web Mining
Web Content Mining
„ Betriebswirtschaftliche Anwendungsfelder
Kunden und Produktinformationen
Klassische Methoden der Markt- und Meinungsforschung
beschränken sich in der Regel
g auf Befragungen,
g g
Beobachtungen
g
und Interviews.
Automatische Erfassung und Analyse von produkt- oder
marktenrelevanten Informationen aus Internetquellen erweitert
das Spektrum.
Kunden Analyse (Kaufgewohnheiten,
Kommunikationsgewohnheiten,
k
h h
biografische
b
f h Daten, usw.))
Wettberber Analyse (Image, Produkte, Marken, Kundenprofil)
Daten aus sozialen Netzwerken (Meinungsführer Forschung,
Forschung
Erkennen von Trends, Kundenwahrnehmung von Produkten und
Marken)
h
http://studivz.irgendwo.org/
// di i
d
/
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 43
Web Mining
Web Content Mining
„ Betriebswirtschaftliche Anwendungsfelder
„ Kunden und Produktinformationen
Beispiel Hotel und Kreuzfahren Reviews
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 44
Web Mining
Web Content Mining
„ Beispieldaten aus StudiVZ (Stand 2006)
Quelle: http://studivz.irgendwo.org/
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 45
Web Mining
Web Content Mining
„ Betriebswirtschaftliche Anwendungsfelder
Kunden und Produktinformationen
Beispiel Beschwerdemanagement im Hotelgewerbe
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 46
Web Mining
Web Content Mining
„ Betriebswirtschaftliche Anwendungsfelder
Schutz und Sicherheitskonzepte
Kinder- und Jugendschutz
Schutz vor Websites mit pornografischen sowie gewalt- und
d ogen e he li henden Inhalten
Inh lten
drogenverherrlichenden
Intelligente Systeme analysieren und klassifizieren die verfügbare
Webinhalte automatisch und blockieren den Aufruf.
Suche nach gefälschten Konsumgütern im Internet
Objekterkennende Verfahren des Image Mining können z. B. nach
g Webseiten
allen Bildern eines konkreten Produkts auf verdächtigen
oder Plattformen suchen.
Quelle: DA Neuhaus 2008, S. 55
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 47
Agenda (2)
„ Web Mining
W b Usage
Web
U
Mi i
Mining
Web Structure Mining
W b Content
Web
C
Mining
Mi i
Text Mining und NLP
Clusterung
Klassifikation
Beispielanwendungen
p
g und betriebswirtschaftliche
Anwendungsfelder
„ Ausblick und Fragen
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 48
Ausblick
„ Wie wird das Semantic Web das Suchverhalten und die
Suchmaschinentechnik verändern?
„ Privacy Problematik?
„ Menschenrechtsproblematik zz. B
B. Google in China oder
Internetfilter in Saudi Arabien http://cyber.law.harvard.edu/filtering/saudiarabia/
„ Reifegrad der Technologien
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 49
Datenorganisation
Karsten Sohns
17.12.2008
# 50
Fragen
„ ????
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Kontaktdaten
„
„
„
„
http://www.iwi.uni-hannover.de/
[email protected]
h @i i i h
d
Raum I/429
S
Sprechstunde
h
d Mittwoch
Mi
h 14:00
14 00 – 16:00
16 00 Uhr
Uh
Institut für Wirtschaftsinformatik
Leibniz Universität Hannover
Datenorganisation
Karsten Sohns
17.12.2008
# 51