17.12.2008
Transcrição
17.12.2008
Gastvortrag g im Rahmen der Vorlesung Datenorganisation Thema des Vortrages: Suchmaschinen Suchmaschinen Marketing und Web Suchmaschinen, Mining 17. Dezember 2008 Karsten Sohns sohns@iwi uni-hannover [email protected] hannover.de de Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 #1 Zur Person Dipl. Ök. Karsten Sohns Wissenschaftlicher Mitarbeiter und Doktorand am Institut für Wirtschaftsinformatik der Leibniz Universität Hannover seit Mai 2007 Studium in Hannover Arbeitsschwerpunkte: E-Learning Wissensmanagement Web 2.0 Anwendungen Informationsmanagement Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 #2 Agenda (1) Suchmaschinen Einführung und Typen Funktionsweise Google als Marktführer Suchmaschinen Marketing Search Engine g Optimization p (SEO) ( ) Search Engine Marketing (SEM) Strategische Umsetzung Abrechnungsmodelle Anwendungsbeispiel: Google Analytics Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 #3 Agenda (2) Web Mining W b Usage Web U Mining Mi i Web Structure Mining W b Content Web C Mining Mi i Text Mining und NLP Clusterung Klassifikation Beispielanwendungen p g und betriebswirtschaftliche Anwendungsfelder Ausblick und Fragen Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 #4 Agenda (1) Suchmaschinen Einführung und Typen Funktionsweise Google als Marktführer Suchmaschinen Marketing Grundkonzepte p Search Engine Optimization (SEO) Search Engine Marketing (SEM) Abrechnungsmodelle Anwendungsbeispiel: Google Analytics Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 #5 Suchmaschinen Einführung und Typen Das Suchen und Finden von Informationen im Internet wird nur durch die Nutzung möglichst ausgereifter Suchmaschinen Technologien möglich. g gibt g es eine Vielzahl anderer Anbieter,, wie z. B. Neben Google Yahoo, Altavista, MSN Live Search usw. und verschiedene Typen von Suchmaschinen (Volltextsuchmaschinen, Verzeichnisse und Metasuchmaschinen) Zur Zeit gibt es ungefähr 1 Billion URLs im „Internet“* g , deren zentrale Funktion die Suche Definition: „ … Web-Angebote, nach externen Internet-Inhalten ist Internet-Inhalten ist. Eine Suchmaschine enthält auf der Startseite ein … Eingabefeld, in dem Nutzer gesuchte Begriffe eingeben können können. Die Ausgabe der Suchergebnisse erfolgt in einer sortierten Trefferliste… “** *Quelle: Quelle: http://googleblog.blogspot.com/2008/07/we-knew-web-was-big.html http://googleblog blogspot com/2008/07/we-knew-web-was-big html **Quelle: Machill, Wegweiser 2004, S. 52. Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 #6 Suchmaschinen Einführung und Typen Verzeichnisse Verzeichnisse sind redaktionell betreute Web Kataloge. Kataloge Die enthaltenen Pages sind somit einer gewissen menschlichen Kontrolle unterworfen und somit qualitativ hochwertiger. Die Darstellung erfolgt nicht alphabtisch alphabtisch, sondern nach Themengebieten. Mit Hilfe eines Verzeichnisses ist die explorative Suche in den einzelnen Kategorien möglich. möglich Das bekannteste Verzeichnis ist Yahoo Directory, das größte Verzeichnisse ist das Open Directory Project, welches von Freiwilligen angelegt wurde wurde. (4 (4.5 5 Mio Mio. Seiten und 590 590.000 000 Kategorien) Die Sortierung innerhalb des Verzeichnisses erfolgt im Allgemeinen auf Grundlage einer vom Redakteur vorgenommen Gewichtung. Um so höher die Relevanz der Quelle für die gesamte Kategorie ist um so höher ist sie gewichtet und wird somit weiter „vorne“ bzw. „oben“ angezeigt. Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 #7 Suchmaschinen Einführung und Typen Suchmaschinen Ziel ist die Erfassung RELEVANTER Inhalte Google als Markführer - dazu später mehr Volltextsuche in allen indizierten Webseiten mit Hilfe von Spidern, Crawlern oder Robots Einsatz von ausgefeilten Suchalgorithmen Zur Funktionsweise k später mehr h Vielzahl von Anbietern wie Yahoo, Altavista, Seekport, MSN oder netluchs.de Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 #8 Suchmaschinen Einführung und Typen Meta Suchmaschinen Der Begriff „Meta“ Meta“ entstammt dem Griechischen und bedeutet „auf einer höheren Stufe befindlich“. Meta Suchmaschinen aggregieren gg g die Suchergebnisse g einzelner Suchmaschinen zu einer gemeinsamen Trefferliste. Im Allgemeinen ist es möglich einzelne Suchdienste an- oder abzuwählen um zz. B abzuwählen, B. die Suchzeit zu verkürzen verkürzen. Im Gegensatz zu konventionellen Suchmaschinen haben Metasuchen keinen eigenen Datenbestand. Problem – unterschiedliche Operatoren oder unterschiedliche Notation der Operatoren (UND, ODER, NICHT) Ergebnisse sind zum Teil nur der „kleinste kleinste Gemeinsame Nenner“ Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 #9 Suchmaschinen Einführung und Typen Beispiel MetaGer http://meta.rrzn.uni-hannover.de/ Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 10 Suchmaschinen Einführung und Typen Spezielle Suchdienste Google Maps/Local Æ Verknüpfung von geografischen Informationen mit Internetseiten Das Örtliche Æ Telefonbuch GoYellow Æ Branchenbuch Yasnin www.yasni.de Æ Personensuchmaschine G Google l S Scholar h l Æ Suche S h für fü wissenschaftliche i h f li h Publikationen blik i Wissenschaftliche Suchmaschinen ETOC, TIP Order Produktsuche Æ „Preisroboter Preisroboter“ Location Based Services für Mobiltelefone „Restaurant Suche“ uvm. Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 11 Suchmaschinen Funktionsweise Exemplarischer Aufbau einer Suchmaschine erfasse Daten Web‐Robot sortiere Daten IR‐System IR System Index Index auszuschlies‐ sende URLs relevante Suchtreffer Inhalte von Websites Query Prozessor User WEB Veröffentlichung Veröffentlichung von Websites Such‐ begriffe sortierte Suchtreffer Such‐ anfrage Suchanfrage Suchmaske / Interface Suchergebnisse Suchmaschine Yvonne von Bischopinck & Michael Ceyp, Suchmaschinen‐Marketing Konzepte, Umsetzung und Controlling, Seite 32 Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 12 Suchmaschinen Funktionsweise Erfassung durch Robots Synonyme Benutzung der Begriffe Robot Robot, Spider Spider, Crawler Der Robot flogt dabei der Linkstruktur des Internets, erfasst neue oder veränderte Ressourcen. Alle erfassten Seiten werden lokal im Datenbestand der Suchmaschine gespeichert Æ Performance Gründe Ein Robot besteht im Westlichen aus vier Komponenten: URL Datenbank: Speichert die zu erfassenden URLs und letzte bzw. nächste Erfassung Loader: Verteilt und Koordiniert den Erfassungsprozess Gatherer: Sammelt die Daten und übergibt sie an den Checker Checker: Übergibt die Daten zum IR System und aktualisiert die URL Datenbank (z. (z B. B tote Links) Der Checker übernimmt die „Filterfunktion“ und sortiert doppelte Datenbestände aus und aktualisiert außerdem die „Blacklist“ (Verstöße gegen die Suchmaschinenordnung) Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 13 Suchmaschinen Funktionsweise Datenaufbereitung- und Analyse Der durch den Robot erfasse Datenbestand liegt unstrukturiert vor. Die Aufbereitung und Analyse übernimmt ein Information Retrieval System (IR System). Ziel: Das Heraussuchen bestimmter Informationen aus einer umfangreichen Datenoder Wissensbasis,, die anhand von Bewertungskriterien das Bilden einer Rangfolge bezüglich einer Suchanfrage ermöglichen. Problem: Sehr schwache Strukturierung der Daten im Internet (HTML Problem) und viele unterschiedliche Datenformate (HTML, XML, pdf, doc, usw.) Lösung: Filterung und Erfassung von Schlüsselwörtern und Erstellung eines Indexes. Index Æ Liste aller Schlüsselwörter Yvonne von Bischopinck & Michael Ceyp, Suchmaschinen‐Marketing Konzepte, Umsetzung und Controlling, Seite 38 Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 14 Suchmaschinen Funktionsweise Ranking (1) Zur Beantwortung einer Suchanfrage vergleicht der Query Processor die vom Benutzer eingegeben Suchwörter mit den Schlüsselwörtern im Index. Zu jedem Keyword liegt eine Datei vor, in der alle Dokumente erfasst sind, die das Schlüsselwort enthalten. Je „besser besser“ die gefundenen Treffer zur Suchanfrage passen, passen desto höher ist die Positionierung in der Trefferliste. Der Abgleich zwischen Suchanfrage und relevanten S hl Schlüsselwörtern l ist sehr h schwierig h und d erfolgt f l mit der d Hilfe lf von Vektoren. Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 15 Suchmaschinen Funktionsweise Ranking (2) Der Vergleich zwischen Suchanfrage und gefundenen Dokumenten erfolgt mit Hilfe von Vektoren. Jedes Dokument wird durch einen n-dimensionalen Vektor repräsentiert, wobei obei n die An Anzahl ahl der de identifizierten identifi ie ten Keywords Ke o ds eines Dok Dokumentes mentes ist und der zugewiesene Wert der Gewichtung des Keywords entspricht. Analog dazu wird jedes Wort der Suchanfrage als Dimension des V kt Vektors d dargestellt, t llt so dass d eine i Suche S h mit it m Wörtern Wö t in i einem i mdimensionalen Vektor resultiert. Die einzelnen Werte der Dimension werden automatisch von der S h Suchmaschine hi vergeben, b wobei b i Kriterien i i wie i z.B. die di Position i i des d Wortes in der Suchanfrage mit einbezogen werden. Bei der Auswertung der Suchanfrage werden die Vektoren der Trefferdokumente mit dem Anfrage-Vektor korreliert, so dass die Ähnlichkeit der Vektoren den Rang der Dokumente in der Ergebnisliste bestimmt Yvonne von Bischopinck & Michael Ceyp, Suchmaschinen‐Marketing Konzepte, Umsetzung und Controlling, Seite 42 Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 16 Suchmaschinen Funktionsweise Natural- vs. Paid Listings Natural Listings folgen dem oben beschriebenen Mechanismus, Mechanismus die Trefferliste wird durch die Relevanz der Inhalte bezüglich der Suchanfrage gebildet, der Prozess erfolgt in der Regel vollautomatisch und führt zu den bekannten Datenausgaben: Dem Titel des Dokumentes (Link), dem Beschreibungstext und der URL Paid Listings sind Trefferlisten, die auf die Schlüsselwörter passende Werbeanzeigen (Sponsored Links, AdWords, usw.) ausgeben. ausgeben Die Werbeanzeigen werden im allgemeinen in einem separierten Bereich angezeigt. Früher gab es auch Suchmaschinen, die N Natural l und d Paid P id Listings Li i gemischt i h haben h b (Paid (P id Inclusion). I l i ) Die Rangfolge der Werbeeinblendungen wird mit Hilfe eines Aktionsverfahrens ermittelt. (später mehr) Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 17 Suchmaschinen Funktionsweise Natural- und Paid Listings Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 18 Suchmaschinen Google als Marktführer „Das Ziel von Google besteht darin, die auf der Welt vorhandenen Informationen zu organisieren und allgemein zugänglich und nutzbar zu machen“ Æ Auszug aus der Google Philosophie PageRank-Technologie PageRank nimmt eine objektive Bewertung der Wichtigkeit von Websites vor … Anstatt die direkten Links zu zählen, interpretiert PageRank einen Link von Seite A auf Seite B als Votum für Seite B durch Seite A. Anschließend bewertet PageRank die Wichtigkeit einer Seite anhand der erzielten Voten. PageRank berücksichtigt auch die Wichtigkeit jeder Seite, die ein Votum abgibt, da die Voten von einigen Seiten einen höheren Wert haben und d deshalb d h lb auch h der d Seite, S it auff die di der d Link Li k verweist, i t einen i höheren höh Wert W t geben. b Wichtige Seiten werden von PageRank höher eingestuft und demnach auch in den Suchergebnissen an einer vorderen Position aufgeführt. Analyse von Hypertextübereinstimmung Die Suchmaschine von Google analysiert auch den Inhalt von Seiten. Anstatt nur den seitenbasierten Text einzulesen (der über Metatags von Website-Publishern manipuliert werden kann), wird aber der gesamte Inhalt einer Seite unter Berücksichtigung von Faktoren wie Schriftarten, Unterteilungen und der genauen Position aller Begriffe analysiert. Google analysiert außerdem den Inhalt der benachbarten Websites, um sicherzustellen, dass die ausgegebenen Ergebnisse die Suchanfrage des Nutzers am t ff d t b treffendsten beantworten. t t Quelle: http://www.google.de/intl/de/corporate/tech.html Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 19 Suchmaschinen Google als Marktführer Aktuelle Zahlen über Google Google Inc. Umsatz und Gewinn* Quelle: http://www.webhits.de/ http://www webhits de/ *http://www.heise.de/newsticke r/Googles-Zahlen-naehren-dieSkeptiker--/meldung/102837 Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 20 Agenda (1) Suchmaschinen Einführung und Typen Funktionsweise Google als Marktführer Suchmaschinen Marketing Grundkonzepte p Search Engine Optimization (SEO) Search Engine Marketing (SEM) Abrechnungsmodelle Anwendungsbeispiel: Google Analytics Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 21 Suchmaschinen Marketing Grundkonzepte Einführung Einsatz von Suchmaschinen als Marketing Instrument Ziel: (Hohe) Positionierung einer Website und deren Inhalten in den Suchergebnissen g einer Suchmaschine Zwei grundlegende Herangehensweisen Search Engine Optimization (SEO) Maßnahmen zum Erhalt einer möglichst hohen Position in den Natural Listings (siehe oben) einer Suchmaschine. Bezogen auf die Gestaltung und Konzeption der eigenen I t Internetpräsenz. t ä Search Engine Marketing (SEM) Bewerbung der eigenen Internetpräsenz in Suchmaschinen durch bezahlte Sucheinträge und bezahlten Werbeflächen (Paid Placements oder Keyword-Anzeige) Bezahlte Aufnahme in den Index ((Paid Inclusions)) ohne die Kennzeichnung als Paid Listing vs. Natural Listing Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 22 Suchmaschinen Marketing Grundkonzepte Kreislauf des Suchmaschinen Marketing Zielfestlegung Strategische Entscheidung Web-Controlling Operative Durchführung Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns Yvonne von Bischopinck & Michael Ceyp Suchmaschinen-Marketing K Konzepte, t Umsetzung U t und dC Controlling t lli Seite 100 17.12.2008 # 23 Suchmaschinen Marketing Grundkonzepte 1. Zielfestlegung In der ersten Phase wird das mit Suchmaschinen-Marketing Suchmaschinen Marketing verfolgte Marketing-Ziel festgelegt. Hierbei geht es nicht etwa um Ziele der Art „Platz 1 bei Google“ oder „Mehr Besucher auf der Website“, sondern um g , konkrete Ziele wie „„In den nächsten fünf Monaten unternehmensgerichtete, die Besucherquote auf der Website um 30% erhöhen“ oder „In drei Monaten den Abverkauf im Internet von Produkt X um 20% erhöhen“. 2. Strategische Entscheidungen Nach der Festlegung des Ziels müssen strategische Entscheidungen getroffen werden, auf welche Art dieses Ziel am besten zu erreichen ist: Einzusetzende Suchmaschinen Suchmaschinen-Marketing-Instrumente Marketing Instrumente Zu bewerbende Angebote und Zielseiten des Keyword-Advertisings Zu berücksichtigende Netzwerke bzw. Zielsuchmaschinen Budgetierung den Ressourcen (Zeit, Inhouse/extern) Wettbewerbsverhalten Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 24 Suchmaschinen Marketing Grundkonzepte 3. Operative Durchführung Eine umfangreiche g Keyword-Analyse y y stellt die Grundlage g für alle weiteren operativen Maßnahmen dar. Dabei werden auch technische und inhaltliche Änderungen an der eigenen Website vorgenommen und unter Berücksichtigung der strategischen Entscheidungen die konkreten Kampagnenparameter ( (Keywords, d Anzeigentext, Zielseiten, l Bietstrategie, Anzeigenposition)) umgesetzt. 4. Web-Controlling Hier werden kontinuierlich und (nahezu) in Echtzeit qualitative, quantitative und wirtschaftlich relevante Erfolgsgrößen erfasst, die sich durch detaillierte Zugriffstatistiken der Website ergeben. Diese automatisch per TrackingSoftware aufgezeichneten Kunden- und Nutzungsdaten werden daraufhin ausgewertet t t und d analysiert. l i t Di Dies ermöglicht ö li ht einerseits i it einen i I t/S ll Ab l i h Ist/Soll-Abgleich (aktueller Stand / festgelegtes Marketing-Ziel), sowie andererseits die Identifikation von Optimierungsfaktoren. Letztere können daraufhin gezielt zur Variation und Optimierung der Kampagnenparameter und Website sowie zur Kostenreduktion verwendet werden. Wie die Phase des Web-Controllings nahe legt, resultiert die Erfolgskontrolle in einem neuen Durchlauf der vier Phasen. Quelle: Yvonne von Bischopinck & Michael Ceyp Suchmaschinen-Marketing Suchmaschinen Marketing Konzepte, Umsetzung und Controlling Seite 100 ff. Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 25 Suchmaschinen Marketing Grundkonzepte User Suchmaschine Paid Links Natural Links W b it Website Keyword‐Advertising (Paid Placements)) Paid Inclusion SSEM SEO Suchmaschinen Marketing Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns Yvonne von Bischopinck & Michael Ceyp Suchmaschinen-Marketing K Konzepte, t Umsetzung U t und dC Controlling t lli Seite 79 17.12.2008 # 26 Suchmaschinen Marketing Search Engine Optimization (SEO) Die Search Enigine Optimization nutzt die OnPage und OnSite Optimierung Mit Hilfe der Suchmaschinen Optimierung wird die eigene Internetseite unter den Aspekten p Design, g Struktur, Navigation g aber vor allem Inhalt aufbereitet und optimiert. (OnPage Optimierung) Hauptaugenmerk ist die Einbindung von Schlüsselwörtern an den entscheidenden Stellen im HTML Dokument (Titel Tag, Überschriften h1, h2 Diese Optimierung O sollll die d die d Indexierung d der d Internetseite durch d h die Suchmaschine ermöglichen oder verbessern und vor allem eine höhere Positionierung in der Trefferliste ermöglichen. Sehr aufwendiger Prozess, da die Website auf Suchverhalten und die Suchbegriffe der Zielgruppe angepasst werden muss. Ziel: Verbesserung der Natural Listings Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 27 Suchmaschinen Marketing Search Engine Optimization (SEO) Neben der Optimierung der Webseiteninhalte gibt es Maßnahmen zur verbesserten der Domain allgemein (OnSite Optimierung) Möglichst gute Lesbarkeit der Webseite durch die Suchmaschinen Robots. Verwendung lesbarer Technologien auf der Website Website, z. z B. B Flash ist „lesbar“, Java ist nicht „lesbar“. Ein sehr wichtiges Merkmal ist die interne und externe Verlinkung der Website (siehe Anwendungsbeispiel Google) Externe Links Wichtigstes Instrument der SEO da viele und qualitativ hochwertige externe Links für fü die Q Qualität alität der de eigenen Website sprechen. sp echen Dabei kann zusätzlich sät lich noch die Qualität und Beliebtheit der Ursprungsseite einbezogen werden. Interne Links Jede Seite solle von vier anderen themenverwanden internen Seiten verlinkt sein. Jede Seite sollte in drei „Klicks“ erreichbar sein. Auch die Linktexte sollten „selbstsprechend sein z. B. „Firma Produkt“ Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 28 Suchmaschinen Marketing Search Engine Marketing (SEM) Das Search-Engine-Marketing beschäftigt sich mit dem gezielten Einsatz von bezahlten Einträgen in Suchmaschinen und der Einblendung von Schlüsselwort abhängigen Webetexten in Suchmaschinen sogenanntem Keyword Advertising -bei Google AdWords genannt. Webetreibende wählen Keywords für ihre Produkte aus, bei Abfrage der Keywords erfolgt eine Webeeinblendung. In der Regel wird mit Hilfe eines Auktionsmechanismus die Reihenfolge der Werbeinblendungen festgelegt, Angebote mit einem zu niedrigen Klickpreis (Cost per Click) kommen nicht zum Zug. ( i h Abrechnungsmodelle) (siehe Ab h d ll ) Beispiel: Für das Top-Keyword „Krankenversicherung Vergleich“ war im Jahr a 2005 005 der d derzeit d höchste ö Klickpreis p von o 12 Euro u o für ü Position o o 1 zu zahlen.* Zur Erstellung und zum Monitoring der Anzeigen kommen spezielle *Yvonne von Bischopinck & Michael Ceyp, Suchmaschinen-Marketing Anwendungen zum Einsatz. Einsatz Konzepte, Umsetzung und Controlling, Seite 120 Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 29 Suchmaschinen Marketing Search Engine Marketing (SEM) Werbeprogramme der Google Inc. Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 30 Suchmaschinen Marketing Abrechnungsmodelle Pay per View (PPV) Bezahlt wird beim PPV jeweils für die Einblendung der Werbemaßnahme (AdImpression) Æ Bannerwerbung Pay per Click (PPC) D W Der Werbetreibende b t ib d zahlt hlt nur, wenn der d Empfänger E fä einen i Kli k auff die Klick di Werbemaßnahme tätigt. Die Kostenpro Klick (Cost per Click, kurz CPC) beschreiben den Preis, der vom Werbetreibenden für einen Klick auf die Anzeige zu zahlen ist. ist Pay per Lead (PPL) Es wird der Erfolg g der Werbemaßnahme mit berücksichtigt. g Kosten fallen an, wen es zu einem „qualifizierten“ Kundenkontakt kommt, z. B. Kataloganforderung, hiterlassen der Kontaktdaten. Pay per Order (PPO) Beim PPA-Verfahren wird nur dann bezahlt, wenn der Klick zur Umsatzgenerierung oder Anmeldung zu einem bestimmten Dienst führt. Eine Anbindung an die E E-Commerce Commerce Systeme ist erforderlich erforderlich. Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 31 Suchmaschinen Marketing Anwendungsbeispiel: Google Analytics Startseite der Google Analytics Anwendung Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 32 Suchmaschinen Marketing Anwendungsbeispiel: Google Analytics Geschaltete Adwords (Anzeigen) Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 33 Suchmaschinen Marketing Google Analytics Maßnahmen gegen die Erfassung durch Tracking Software Regelmäßiges Löschen von Cookies PlugIns zum erkennen und Anzeigen von Analyse Tools, z. B. Counterpixel https://addons.mozilla.org/de/firefox/addon/5414 Einschränken oder Abschalten von JavaScript Was ist JavaScript? „ Mit … JavaScript können Inhalte generiert werden, deren Erscheinungsbild sich bei Nutzerinteraktion ändert – beispielsweise die Farbe eines Hyperlinks, während äh d sich i h der d Mauszeiger M i über üb dem d Link Li k befindet. b fi d t Dadurch D d h lassen l sich i h Webseiten realisieren, die herkömmlichen Desktop-Applikationen in Funktionalität und Bedienungskomfort nicht nachstehen.“ Quelle: p //de ped a o g/ / a aSc p http://de.wikipedia.org/wiki/JavaScript Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 34 Agenda (2) Web Mining W b Usage Web U Mi i Mining Web Structure Mining W b Content Web C Mining Mi i Text Mining und NLP Clusterung Klassifikation Beispielanwendungen p g und betriebswirtschaftliche Anwendungsfelder Ausblick und Fragen Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 35 Web Mining Einführung und Grundlagen Was ist Web Mining? Unter Web Mining versteht man die Nutzung von Data Mining Techniken zur (teil)automatischen Erfassung und Extraktion von Daten aus dem Internet. Data Mining Techniken sind eine Vielzahl von mathematischen Verfahren zur Erkennung von Mustern in Datenbeständen. Ziel ist die effektive Erfassung und Auswertung von großen Datenbeständen. Web Mining lässt sich in drei Teildisziplinen aufteilen: Web W b Usage U Mining Mi i Web Structure Mining Web Content Mining g Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 36 Web Mining Web Usage Mining Was ist Web Usage Mining? Das Web Usage Mining dient der Verhaltensanalyse von Webseitenbesuchern. Betreiber von Webshops p können damit beispielsweise p das Kaufverhalten untersuchen um ihren Internetauftritt besser an den Bedürfnissen ihrer Kunden ausrichten zu können. (Vgl. Google Analytics) Die Analyse erfolgt auf drei Ebenen: Web Server Ebene (Server Log Files) Proxyserver Ebene (Auslesen der Weiterleitungsdaten) Client Ebene (Betriebssystem, Browser, IP, Cookies, Browser mit Datenschnittstelle (Google Chrome) Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 37 Web Mining Web Structure Mining Was ist Web Structure Mining? Das Web Structure Mining g kommt zum Einsatz,, um Informationen über die Struktur von Webseiten und ihren Verbindung untereinander zu gewinnen. Intra-Page Intra Page Structure Mining Anordnung von Objekten innerhalb einer Webseite Inter-Page Structure Mining A d Anordnung mehrerer h Webseiten W b it zueinander i d Quelle: DA Ne euhaus 2008, S. 15 Ein besonderes Augenmerk liegt auf der Analyse von Linkstrukturen vgl. „Google Algorithmus“ Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 38 Web Mining Web Content Mining Was ist Web Content Mining? Kollmann definiert Web Content Mining als eine „Anwendung Anwendung von Data Mining-Verfahren, die das Ziel hat die Informationssuche im Internet, durch Strukturierung und Systematisierung von Dokumenten-Inhalten zu vereinfachen. Die Dokumente müssen beim anschließenden Informationsscreening leichter und besser erkannt werden können.“ Kollmann 2007, S. 201 Was für Verfahren kommen dazu zum Einsatz? Text Mining und Natural Language Processing (NLP) Clusterung Klassifikation Was für Anwendungsscenarios gibt es? Generierung von Kunden- und Produktinformationen (siehe unten) Marktforschung und Wettbewerbsanalyse Wissensextraktion aus sozialen Netzwerken (siehe unten) Generierung von Wissensvorteilen auf Handelsmärkten Innovative Schutz- und Sicherheitskonzepte (siehe unten) Institut für Wirtschaftsinformatik Leibniz Universität Hannover 17.12.2008 # 39 Datenorganisation Karsten Sohns Web Mining Web Content Mining Möglicher Ablauf des Web Content Mining Information Retrieval Web Agent Groups Agent Mail Agent Blog Agent Forum Agent … Sematic Statistical Structural NLP Keywords … HTML Network structures PDF XML Excel … Data Extraction Proce ess flow Content Analysis Structured Presentation TNS-INFRATEST, WebLedge™, Available from: http://www.tns-infratest.com/marketing_tools/webledge.asp. Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 40 Web Mining Web Content Mining Beispielanwendungen, Surf3D Pro von Navagent Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 41 Web Mining Web Content Mining Beispielanwendungen, Opinion Observer, Liu et al. LIU ET AL., AL Opinion Observer: Analyzing and Comparing Opinions on the Web, Web in: Proceedings of the 14th international conference on World Wide Web, Chiba 2005. Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 42 Web Mining Web Content Mining Betriebswirtschaftliche Anwendungsfelder Kunden und Produktinformationen Klassische Methoden der Markt- und Meinungsforschung beschränken sich in der Regel g auf Befragungen, g g Beobachtungen g und Interviews. Automatische Erfassung und Analyse von produkt- oder marktenrelevanten Informationen aus Internetquellen erweitert das Spektrum. Kunden Analyse (Kaufgewohnheiten, Kommunikationsgewohnheiten, k h h biografische b f h Daten, usw.)) Wettberber Analyse (Image, Produkte, Marken, Kundenprofil) Daten aus sozialen Netzwerken (Meinungsführer Forschung, Forschung Erkennen von Trends, Kundenwahrnehmung von Produkten und Marken) h http://studivz.irgendwo.org/ // di i d / Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 43 Web Mining Web Content Mining Betriebswirtschaftliche Anwendungsfelder Kunden und Produktinformationen Beispiel Hotel und Kreuzfahren Reviews Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 44 Web Mining Web Content Mining Beispieldaten aus StudiVZ (Stand 2006) Quelle: http://studivz.irgendwo.org/ Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 45 Web Mining Web Content Mining Betriebswirtschaftliche Anwendungsfelder Kunden und Produktinformationen Beispiel Beschwerdemanagement im Hotelgewerbe Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 46 Web Mining Web Content Mining Betriebswirtschaftliche Anwendungsfelder Schutz und Sicherheitskonzepte Kinder- und Jugendschutz Schutz vor Websites mit pornografischen sowie gewalt- und d ogen e he li henden Inhalten Inh lten drogenverherrlichenden Intelligente Systeme analysieren und klassifizieren die verfügbare Webinhalte automatisch und blockieren den Aufruf. Suche nach gefälschten Konsumgütern im Internet Objekterkennende Verfahren des Image Mining können z. B. nach g Webseiten allen Bildern eines konkreten Produkts auf verdächtigen oder Plattformen suchen. Quelle: DA Neuhaus 2008, S. 55 Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 47 Agenda (2) Web Mining W b Usage Web U Mi i Mining Web Structure Mining W b Content Web C Mining Mi i Text Mining und NLP Clusterung Klassifikation Beispielanwendungen p g und betriebswirtschaftliche Anwendungsfelder Ausblick und Fragen Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 48 Ausblick Wie wird das Semantic Web das Suchverhalten und die Suchmaschinentechnik verändern? Privacy Problematik? Menschenrechtsproblematik zz. B B. Google in China oder Internetfilter in Saudi Arabien http://cyber.law.harvard.edu/filtering/saudiarabia/ Reifegrad der Technologien Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 49 Datenorganisation Karsten Sohns 17.12.2008 # 50 Fragen ???? Institut für Wirtschaftsinformatik Leibniz Universität Hannover Kontaktdaten http://www.iwi.uni-hannover.de/ [email protected] h @i i i h d Raum I/429 S Sprechstunde h d Mittwoch Mi h 14:00 14 00 – 16:00 16 00 Uhr Uh Institut für Wirtschaftsinformatik Leibniz Universität Hannover Datenorganisation Karsten Sohns 17.12.2008 # 51