- KnowTech

Transcrição

- KnowTech
S
Semantic
i Business Intelligence
B i
I lli
Business Intelligence im Web 3.0
Jürgen Lütkehellweg, Dr. Hans‐Josef Hesse,
Dr Mohammad Abuosba
Dr. Mohammad Abuosba
Jörn Lehmann
KnowTech 2010
16 09 2010
16.09.2010
1 l 12.09.2010 l 34% aller Blogger posten Meinungen über gg p
g
Produkte & Marken
25% der Suchergebnisse für die Top 20 Marken
weltweit verlinken auf benutzergenerierte Inhalte
weltweit verlinken auf benutzergenerierte Inhalte.
Benötigte Jahre, um 50 Millionen Nutzer zu erreichen: Radio (38 Jahre), TV (13 Jahre), Internet (4 Jahre), iPod (3 Jahre)
100 Millionen Nutzer in weniger als 9 Monaten –
100 Millionen Facebook gewann iPhone Apps 1 Milliarde in 9 Monaten.
E ibt üb
Es gibt über 80% der Firmen nutzen Li k dI
LinkedIn
als primäres Tool, um Mitarbeiter zu finden.
2 l 12.09.2010 l 200.000.000 Blogs
13 Millionen Artikel… Studien Wikipedia hat über zeigen, dass es präziser ist als die Encyclopedia Britannica.
247 Milliarden Über EE‐Mails
Mails werden täglich versendet.
werden täglich versendet
20%
Über aller Tweets
beziehen sich auf Produkte und Marken.
15.000 tweets werden pro Minute versendet.
Über 100.000
Über Vorschläge, Tipps und Ti k
Tricks werden täglich in Expertenforen gepostet.
d tä li h i E
t f
t t
Millionen Es gibt von Kundendatensätzen in einer durchschnittlich großen Firma.
3 l 12.09.2010 l Die Möglichkeiten
In den letzten zwei Jahren wurden mehr digitale Daten generiert
als in der gesamten bisherigen Geschichte der Menschheit. Das Internet ist zu einem Schatz voller Informationen über Kunden, Produkte, Wettbewerber,
über Kunden, Produkte, Wettbewerber, Forschungsinhalten und Märkten angewachsen. Informationen über Markttrends, Risiken und Chancen warten nur darauf, erschlossen zu werden.
„Im Jahre 2010 wird die Menge an digitalen Informationen, die erstellt, gespeichert und reproduziert werden, 986 Exabyte
ep odu e t e de , 986 abyte ode
oder 986 986
Mrd. Gigabyte betragen.“ (Quelle: IDC)
(Gestapelte Bücher bis zum Pluto und zur Erde zurück)
4 l 12.09.2010 l Open Enterprise
Ermöglicht wichtige Geschäftsentscheidungen basierend auf Informationen innerhalb und außerhalb des Unternehmens.
1990er
“Enterprise Information” wird
hinter einer Firewall aufgefunden
2000‐2008
Online Information ist für ein
Unternehmen offen verfügbar, wird aber nur selten genutzt
Die Entwicklung des Open Enterprise
g
p
p
5 l 12.09.2010 l 2009 & Zukunft
Die Attensity Group ermöglicht
Unternehmen sich gesichert den Schätzen im sozialen Netz zu öffnen um dabei Einblicke zu gewinnen die für
die für
Unternehmensentscheidungen kritisch
und gewinnbringend sind.
Die Herausforderung
Die Herausforderung
80 %
%
20 %
Strukturierte Informationen
Strukturierte Informationen
6 l 12.09.2010 l Unstrukturierte Informationen
Probleme, Markttrends, Ideen, Anforderungen
Das THESEUS Projekt
Konsortialführer
G ß
Großunternehmen
h
Mittelständische Firmen, Verbände, kulturelle Einrichtungen
Forschungspartner
7 l 12.09.2010 l Diverse Universitäten
Sechs Anwendungsszenarien entwickeln neue Ansätze
Sechs Anwendungsszenarien entwickeln neue Ansätze.
THESEUS Programm
Programm Koordination
Use Case
Use Case
Use Case
Use Case
Use Case
Use Case
ALEXANDRIA
CONTENTUS
MEDICO
ORDO
PROCESSUS
TEXO
Intelligente
Recherche in
Medizindaten
-banken
Ordnung
für die
digitale Welt
Wissen in
Unternehmen
besser nutzen
Infrastruktur für
internetbasierte
Dienste
Wissensplattform Technologien für
im
die Mediathek
Internet
der Zukunft
Core Technology Cluster (CTC)
Quelle: THESEUS Programm
8 l 12.09.2010 l 8
THESEUS sichert Deutschland weiterhin diese THESEUS
sichert Deutschland weiterhin diese
Spitzenposition
Wissenschaftliche Exzellenz
» Entwicklung semantischer
Technologien
» Schaffung neuer Standards
» Zusammenarbeit von
Z
b it
Wissenschaft und Wirtschaft
» Impulse für die deutsche Forschungslandschaft
g
» Nachwuchsförderung, Verbesserung der Ausbildung
Quelle: THESEUS Programm
9 l 12.09.2010 l Wirtschaftliches Potential
» Entwicklung neuer Geschäftsmodelle und Dienstleistungen
» Zusammenarbeit von Z
b it
Wissenschaft und Wirtschaft
» Einbeziehung von (spezialisierten) KMU
» Schaffung von Arbeitsplätzen
Schaffung von Arbeitsplätzen
in Zukunftsbereichen
PROCESSUS Vision
PROCESSUS‐Vision
» Proaktive
Proaktive Bereitstellung von Bereitstellung von
Informationen und Daten passend zu dem aktuellen Prozessschritt
» Finden relevanter Informationen auch ohne exaktes Wissen des notwendigen Schlüsselwortes
PROCESSUS
» Aktionen können Änderungen in nachfolgenden Prozessschritten nach sich ziehen
sich ziehen
» Erkennung und Bereitstellung impliziter Informationen aus den vorhandenen Daten
h d
10 l 12.09.2010 l Business Prozess
Recherche nach vergleichbaren Lösungen
Angebots‐
erstellungsprozeß
initiieren
Erarbeitung substituierender
Lösungen
Nutzung vorhandener Komponenten
...
Kalkulation
Aggregation
PROCESSUS…
…das Anwendungsszenario für die
Wirtschaft im Rahmen von THESEUS
Die Vision von PROCESSUS ist das semantische
Die Vision von PROCESSUS ist
das semantische Unternehmen
Es soll eine Plattform geschaffen werden, die Geschäftsprozesse mit
semantischem
i h
Wi
Wissen
k bi i
kombiniert. Ziel ist es: alle innerhalb und außerhalb (Web oder Partnerunternehmen) eines
Unternehmens verfügbaren Informationen aufgrund ihres Kontextes in Geschäftsprozesse zu integrieren und diese so zu optimieren.
PROCESSUS = semantische Business Integrations‐Plattform
11 l 12.09.2010 l PROCESSUS…
…das Anwendungsszenario für die
Wirtschaft im Rahmen von THESEUS
1. Anwendungspartner (Mitglieder des THESEUS‐Konsotiums)
2 Technologiepartner
2.
T h l i
t
(R&D als Teil von THESEUS)
3. Kooperationspartner (Testdaten, Geschäftsprozesse, …)
12 l 12.09.2010 l 34% aller Blogger posten Meinungen über gg p
g
Produkte & Marken
25% der Suchergebnisse für die Top 20 Marken
weltweit verlinken auf benutzergenerierte Inhalte
weltweit verlinken auf benutzergenerierte Inhalte.
Benötigte Jahre, um 50 Millionen Nutzer zu erreichen: Radio (38 Jahre), TV (13 Jahre), Internet (4 Jahre), iPod (3 Jahre)
100 Millionen Nutzer in weniger als 9 Monaten –
100 Millionen Facebook gewann iPhone Apps 1 Milliarde in 9 Monaten.
E ibt üb
Es gibt über 80% der Firmen nutzen Li k dI
LinkedIn
als primäres Tool, um Mitarbeiter zu finden.
13 l 12.09.2010 l 200.000.000 Blogs
13 Millionen Artikel… Studien Wikipedia hat über zeigen, dass es präziser ist als die Encyclopedia Britannica.
Die Herausforderung
Die Herausforderung
14 l 12.09.2010 l Business Intelligence heute
Business Intelligence heute
Veränderung des ETL‐Prozesses
Unstrukturierte Informationen müssen verwertet werden
Manuelle Recherchen und Verdichtungen sind in Anbetracht der Datenmenge unzumutbar
A l
Analysemöglichkeiten
ö li hk it
das gesamte „Social Media“ beobachten
den relevanten Konversationen zuhören
„Themenkarrieren“ analysieren
Th
k i
“
l i
tiefer vorstoßen zu den Bewertungen der Nutzer (Drilldown)
handlungsrelevante Einsichten gewinnen
handlungsrelevante Einsichten gewinnen
auf kritische Themen früh reagieren
Pro‐aktiv kommunizieren
g
g
den Dialog mit Kunden und Partnern frühzeitig
(präventiv) initiieren
15 l 12.09.2010 l Text Analysis –
l
Basics
„
language identification
In multilingual environments
„
layout analysis
sentences and clause barriers
titles, tables, styles
titles, tables, styles
tokenization
complexity depends on the language
compound analysis and disambiguation
„ Kinderkrankenpflegerinnen ->
>
Kind+Krank+Pfleger
„ Rindfleischetikettierungsüberwachungsaufgabenübertragungsgesetz
16 l 12.09.2010 l stemming
Gläser Æ Glas
Putins Æ Putin
abgeflogen Æ abfliegen
l
Text Analysis –
Syntax
POS identification
the 2008 US presidential campaign
DET NUM PROP ADJ
DET NUM PROP ADJ NOUN
NOUN
phrase grouping
phrase grouping
Fruit flies like a banana
Fruit flies like a banana
coreference analysis
Hans mag
g Angela
g
nicht.
Sie hat ihn entlassen.
Kant is geboren in Königsberg,
und dort auch gestorben.
17 l 12.09.2010 l syntactic function assignment
Subject, Objects, MainVerb, Predicate Subject Objects MainVerb Predicate
[Sabine Sub] hat schon wieder
[ein UFO Dir] [gesehen
MV].
g
Text Analysis –
l
Semantics
Entity Tagging
Linguistic Development:
Linguistic Development:
Lexicon
Hilton : COMPANY;
Hilton : PERSON_FAM;
Paris
: CITY;
Paris
: PERSON_GIV, gender=fem;
Regex Rules
{
<stem=Herr|Frau> $PERSON_GIV? <von>? <pos=“Noun”|“Proper”> } => PERSON;
18 l 12.09.2010 l Text Analysis –
l
Semantics
Entity Tagging
SAP acquires French Business Objects for 4,8 billion Euro.
COMPANY:
SAP
COUNTRY:
France
COMPANY:
Business Objects
CURRENCY:
4.800M Euro
19 l 12.09.2010 l Text Analysis –
l
Semantics
Fact Tagging
Li
Linguistic Development:
i ti D l
t
{
{ $COMPANY }
=> BUYER
<..> $BUY <..>
{ $COMPANY@(fun=“Obj”)}
$COMPANY@(fun= Obj )} => TARGET
}
=> ACQUISITION;
DE:
{ <stem = kaufen|übernehmen|ankaufen|erwerben, pos=Verb> } => BUY;
EN:
{ <stem = buy|purchase|take over|swallow
over|swallow, pos
pos=Verb>
Verb> } =>
> BUY;
SAP is reportedly considering to take over Business Objects.
SAP hat gestern Business Objects gekauft.
20 l 12.09.2010 l Ergebnis
SAP acquires French Business Objects for 4,8 billion Euro.
BUYER:
SAP
COMPANY
TAKEOVER
TARGET:
BO
COUNTRY:
France
PRICE (EurM)
4.800
21 l 12.09.2010 l Text Mining / NLP /
Unstructured Text
Entities
Facts
Relationships
Decision Support
Decision Support
22 l 12.09.2010 l 22
Text Mining / NLP /
Unstructured Text
Entities
Facts
Relationships
Decision Support
Decision Support
23 l 12.09.2010 l 23
Text Mining / NLP /
Unstructured Text
Entities
Facts
Relationships
Decision Support
Decision Support
BUYER:
SAP
COMPANY
TAKEOVER
TARGET:
BO
COUNTRY:
France
PRICE (€)
4.8m
24 l 12.09.2010 l 24
Text Mining / NLP /
Unstructured Text
Entities
Facts
Customers
& Market
Relationships
Decision Support
Decision Support
SAP
Technology
BO
Technology
25 l 12.09.2010 l Takeover
Shareholders
25
Extraktion von detaillierten Nutzer‐Statements
Ursachenanalyse
Aufbereitung von handlungsleitender Information
Beispiel: Auswertung von Hotelbewertungen aus Foren und internem Kundenfeedback. 26 l 12.09.2010 l 27 l 12.09.2010 l 28 l 12.09.2010 l 29 l 12.09.2010 l 30 l 12.09.2010 l Was halten Sie vom iPad?
Analyse von 50.000 Tweets einen Tag nach Beginn des iPad Vertriebs in den USA
73% Zustimmung (67%+6%)
31 l 12.09.2010 l Was mag der Nutzer am iPad ?
Drill‐Down in die positiven Kommentare
Mit 38% überwiegen die verfügbaren Applikationen
32 l 12.09.2010 l Favorite iPad Applications
Drill‐Down die Applikationen
3 dominierende Applikationen
iBook Reader
Entertainment (Streaming)
iW k
iWork
33 l 12.09.2010 l Customer Experience Management ‐ LARA
ACT
by engaging with
customers through
response, with relevant content and across any
channel
RELATE
newly uncovered
information with
structured data that
already exists (ERP, CRM, BI data, warehouse data)
34 l 12.09.2010 l LISTEN
to your customers – gain
customer expectation
insight across any and all channels (e‐mail, phone, documents, Web 2.0, SMS, chat, self‐service)
SMS, chat, self
service)
ANALYZE
customer information to
detect potential problems. In the field, refine messaging, uncover new product
opportunities, improve
your service center
responsiveness.
KNOW. RIGHT. NOW.
35 l 12.09.2010 l KNOW. RIGHT. NOW.
Vielen Dank
Vielen Dank
36 l 12.09.2010 l