high-performance analytics - Urz

Transcrição

high-performance analytics - Urz
HIGH-PERFORMANCE ANALYTICS
SAS TREFF – UNIVERSITÄT HEIDELBERG
24.10.2013, MARTIN SCHÜTZ, SAS INSTITUTE GMBH
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
AGENDA
High-Performance Analytics Produktbündel
1 Warum High-Performance Analytics
2 SAS In-Memory Analytics: Technologie
3 6 neue HP Analytics Produktbündel
4 Demo – Einfach Beispiele
5 Zusammenfassung / Ausblick
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
LIZENZSITUATION
•
„Mit SAS 9.4 ist die High-Performance Analytics Suite mit Grid, In-Database,
In-Memory Bestandteil der Campuslizenz“
•
JMP Genomics
• SAS Education Analysis Suite
•
•
•
BASE SAS, SAS Bridge to ESRI, SAS Enterprise Guide, SAS Integration Technologies, SAS
Online Tutor,
SAS/ACCESS to {AS/400, CA-Openingres, DB2, HP Neoview, INFORMIX, MySQL, Netezza}
ODBC, OLE DB, ORACLE, RdB, PC File Formats, SYBASE, Teradata
SAS/AF, SAS/ASSIST, SAS/CONNTECT, SAS/EIS, SAS/ETS, SAS/FSP, SAS/IML,
SAS/INSIGHT, SAS/LAB, SAS/OR, SAS/QC, SAS/SECURE, SAS/SHARE, SAS/STAT
Beim Umstieg auf eine 9.4 Server-Lizenz stehen die neuen High-Performance
Funktionalitäten innerhalb von SAS/STAT, SAS/ETS und SAS/OR zur
Verfügung.
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
BIG DATA – Worauf es ankommt
VOLUME
DATA SIZE
VARIETY
VELOCITY
VALUE
TODAY
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
THE FUTURE
BIG DATA GROßER DATENMENGEN, KUNDENANFORDERUNGEN
ANALYTICS UND DER ANALYTIS LIFECYCLE
Operationalisierung
Modellausführung (Scoring)
In-Database
Near Real-Time
….
PRODUKTIVSETZUNG
DATEN VORVERARBEITUNG
Alle Daten, keine Stichproben
Viele (abgeleitete) Variablen
Neue Ereignisse
Unstrukturierte Daten
…..
Wettbewerbsvorteil
EXPLORATION
Komplexe, präzisere Modelle
Anzahl an Iterationen
Ensemble-Modelle
Viele Modelle, viele Updates
(Analytics Factory)
….
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
MODELLIERUNG
Schnell
Interaktiv
Visuell
Analytisch
….
BIG DATA GROßER DATENMENGEN, KUNDENANFORDERUNGEN
ANALYTICS UND DER ANALYTIS LIFECYCLE
• Große Datenmengen
• Viele Rechenoperationen
• Wenig Zeit
Schnell komplexe
Entscheidungen treffen!
Wettbewerbsvorteil durch
Parallelisierung
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HIGHPERFORMANCE HAUPTKOMPONENTEN
ANALYTICS
SAS® High-Performance
Analytics Products
SAS® Visual Analytics
SAS® HP Solutions
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® GRID
KERNFUNKTIONALITÄTEN
COMPUTING
•
Multi-User Lastausgleich
•
Parallelisierung und Lastausgleich
•
Verteilte, unternehmensweite Planung
•
Hochverfügbarkeit
•
Skalierbarkeit
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® IN-DATABASE REDUKTION VON DATENBEWEGUNGEN
Traditionelle Architektur
In-Database Architektur
Analytic Modeling
Analytic Modeling
SAS
Scoring
Data
Preparation
Data
Preparation
SAS
Modeling
SAS C & PMML
Scoring
Data Warehouse /
Database
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS
Scoring
Data
Preparation
Data Warehouse /
Database
SAS® IN-MEMORY COMPUTING
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® In-Memory
Aufbau und Überblick
Analytics
SAS Metadaten Management
SAS Analytics
SAS Visual Analytics
In-Memory
SAS In-Memory
Data Store
Data
SAS LASR
SAS HPA
In-Memory Engine
Server
Server
Hadoop (HDFS) oder
Distributed Storage
Storage Appliance
SAS Information Management
SAS Data Access Engines
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HIGHPERFORMANCE
ANALYTICS
IN-MEMORY (ALONGSIDE MODUS)
Controller
SAS® ANALYTICS
Client
Teradata oder Oracle oder
Pivotal (Greenplum) Database oder
Hadoop auf Commodity Hardware
C op yr i g h t © 2 0 1 3 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HIGHPERFORMANCE
ANALYTICS
IN-MEMORY (ASYMMETRISCHER MODUS)
Controller
Controller
SAS® ANALYTICS
Client
Compute
Appliance
C op yr i g h t © 2 0 1 3 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
Existing Teradata oder Oracle oder
Pivotal (Greenplum) Database oder
Hadoop
SAS® HIGHPERFORMANCE MÖGLICHE SAS COMPUTE APPLIANCE ARCHITEKTUR
ANALYTICS
CLIENT
GREENPLUM
HADOOP
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
TERADATA
ORACLE
SAS® HIGHPERFORMANCE MÖGLICHE SAS COMPUTE APPLIANCE ARCHITEKTUR
ANALYTICS
CLIENT
GREENPLUM
TERADATA
ORACLE
High-Performance Prozeduren
ab SAS 9.4 / Analytics 12.3
im verteilten & „Single-Machine“
Modus verfügbar
HADOOP
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HIGHPERFORMANCE MÖGLICHE SAS COMPUTE APPLIANCE ARCHITEKTUR
ANALYTICS
CLIENT
SAP HANA
GREENPLUM
ORACLE
High-Performance
Prozeduren
22.10.2013: SAP
TechEd
ab Strategische
SAS 9.4 / Analytics
12.3
Partnerschaft
im SAP
verteilten
& „Single-Machine“
(HANA)
& SAS (HPA)
Modus verfügbar
HADOOP
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
TERADATA
SAS® VISUAL ANALYTICS
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® VISUAL
ANALYTICS
DELIVERS A SINGLE SOLUTION FOR FASTER, SMARTER DECISIONS
Central Entry Point
Integration
Role-based Views
DATA BUILDER
ADMINISTRATOR
EXPLORER
DESIGNER
MOBILE BI
• Join data from
multiple sources
• Create calculated and
derived columns
• Load data
• Monitor SAS® LASR™
Analytic server
• Load/unload data
• Manage security
• Perform ad-hoc
analysis and data
discovery
• Apply advanced
analytics
• Create dashboard
style reports for web
or mobile
• Native iOS and
Android applications
that delivers
interactive reports
SAS® LASR™ ANALYTIC SERVER
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® Visual
SAS Visual Analytics Szenario-Analyse
Analytics
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® Visual
Berechnung von Entscheidungsbäumen
Analytics
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS VISUAL
NEU Q1/2014
STATISTICS
Highly Interactive visual
statistical modeling environment
• Analytics running in LASR
• Simple VA-like User interface
Key Features
• Multiple User Concurrency
• Classical Statistics (Regression,
ANOVA, Clustering)
• Modern Statistics (Decision Trees,
Random Forest, & Naïve Bayes).
• Parallel Group BY Processing
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HIGH-PERFORMANCE
ANALYTICS PRODUCTS
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HIGHPERFORMANCE 6 NEUE, DOMAINSPEZIFISCHE PRODUKTBÜNDEL
ANALYTICS
High-Performance
Statistics
High-Performance
Data Mining1
High-Performance
Text Mining
High-Performance
Optimization
High-Performance
Econometrics
High-Performance
Forecasting2*
•
HPLOGISTIC
•
HPREDUCE
•
HPTMINE
•
OPTLSO
•
HPCOUNTREG
•
•
HPREG
HPLMIXED
HPNLMOD
HPSPLIT
HPGENSELECT
•
HPNEURAL
• HPFOREST
• HP4SCORE
• HPDECIDE
•
HPTMSCORE
•
Select features in
• OPTMILP
• OPTLP
• OPTMODEL
•
HPSEVERITY
HPQLIM
•
•
•
•
•
HPFORECAST
Gemeinsame Prozeduren (HPDS2, HPDMDB, HPSAMPLE, HPSUMMARY, HPIMPUTE, HPBIN, HPCORR) #
• #Gemeinsame
Prozeduren sind in jedem einzelnen HP Analytics Produkt enthalten
• 1Beinhaltet SAS High-Performance Statistics, 2Beinhaltet High-Performance Econometrics
• SMP Architektur: HP Prozeduren unter SAS 9.4 in Analytics 12.3 enthalten
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HIGHPERFORMANCE
STATISTICS 12.3
HPLOGISTIC
HPREG
HPSPLIT
HPGENSELECT
HPLMIXED
HPNLMOD
HIGHLIGHTS
•
Bestmögliche Performance für Modellvorhersage
und Variablenselektion auf großen Datenmengen
•
Produktivitätserhöhung durch Vereinigung
klassischer SAS/STAT Funktionalitäten, z.B.
HPREG = REG  GLM  GLMSELECT
• HPGENSELECT = GENOMD + Variablenselektion
•
•
Neue Funktionalitäten
•
C op yr i g h t © 2 0 1 3 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
Entscheidungsbäume
SAS® HIGHPERFORMANCE
DATA MINING 12.3
HP Data Partition
HP Explore
HP Transform
HP Impute
HP Variable Selection
HP Regression
HP Neural
HP Forest
HP Tree
HIGHLIGHTS
•
HP Data Mining beinhaltet HP Statistics
• 9 Knoten bündeln die Funktionalität von HP Statistics
und zusätzlicher HP Data Mining Prozeduren
•
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
HPREDUCE, HPFOREST, HPNEURAL, HPDECIDE
SAS® HIGH
PERFORMANCE
TEXT MINING 12.3
HPTMINE
TGPARSE
TMUTIL
SPSVD
HPTMSCORE
TGSCORE
SPSVD
HIGHLIGHTS
•
•
Natural Language Processing
• Term-Filterung & -Gewichtung
• Dimensionsreduktion
•
Starke Prozessbeschleunigung durch
•
Integration von Funktionalitäten
• Multi-Threading und verteiltes Rechnen
• Weniger I/O durch In-Memory Technologie
•
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
Schnelles Parsing großer Textsammlungen
Prozeduren auch im Enterprise Miner™ nutzbar
SAS® HIGHPERFORMANCE
OPTIMIZATION 12.3
HIGHLIGHTS
•
High-Performance Optimization zur
•
Lösung großer, strukturell komplizierter Fragestellungen
• Beschleunigung diverser Solver (LP, MILP, QP, NLP)
OPTLSO
Features in
OPTMILP
OPTLP
OPTMODEL
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
•
Neu: High-Performance Local Search Optimization
für ableitungsfreie, gemischt-ganzzahlige Probleme
•
Neu: Ausgewählte Features
•
Multistart Option für nicht-lineare Zielfunktionen
• Parametertuning für gemischten-ganzzahligen Solver
• Dekompositionsalgorithmus für große, LP & MILP mit
speziellen Constraint-Strukturen
SAS® HIGHPERFORMANCE
ECONOMETRICS 12.3
HIGHLIGHTS
•
Ökonometrische Regressionsmodelle wichtig zur
Abschätzung von Kosten- und Risikostrukturen
•
Count Regression
Regressionsmodelle für abhängige „Zähl“-Variablen
• Verteilungen: Poisson & Zero-Inflated, Negative Binomial
•
HPCOUNTREG
HPSEVERITY
HPQLIM
•
Severity Regression
•
Regression mit komplexerer, univariater Verteilung der
Zielgröße, sowie gestutzten und zensierten Daten
• Automatische Verteilungsanpassung (z.B. Tweedie)
•
“Qualitative And Limited Independent Variables”
•
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
Lineare Modelle für gestutzte & zensierte Daten mit
Heteroskedastizität
SAS® HIGHPERFORMANCE
FORECASTING 12.3*
HPFORECAST
Smoothing Modelle
- Simple
- Linear
- Damped Trend
- Seasonal
* Additiv
* Multiplikativ
- Winters
* Additiv
* Multiplikativ
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
HIGHLIGHTS
•
Statistische Zeitreihenmodelle wichtig für
Einzelhandel, Telekom, Banken, IT, …
•
High-Performance Forecasting ermöglicht schnelle
•
Aufbereitung großen Mengen hierarchisch strukturierter,
mit Zeitstempeln versehener Daten
•
automatische Erzeugung extrem vieler, optimal
angepasster Smoothing Zeitreihenmodelle
•
Erzeugung von hierarchisch konsolidierten Prognosen
unterschiedlicher Detaillierungsgrade & zeitlicher Auflösungen
*SAS High-Performance Forecasting 12.3 ist kein Produktions-Release
LIVE DEMO
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HP ANALYTICS
DEMO: AIRLINE DATEN (SFD 2012)
PRODUCTS
Vorhersage von Flugverspätungen
• ~120 Mio. kommerzielle Flüge USA (10/87 – 04/08)
• 1 abhängige binäre, 11 unabhängige Variablen
Referenzbeispiel: Churn, Response, Credit, Fraud, …
SMP
MPP Faktor
Cores
6
768
128
Memory
48 GB
3 TB
64
Technologie NON-HPA HPA
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HP ANALYTICS
DEMO: AIRLINE DATEN (SFD 2013)
PRODUCTS
Vorhersage von Flugverspätungen
• 1 abhängige binäre Variable
• 20% der Flüge aus 2008 ≈ 1,4 Mio.
•
Prozeduren:
• Enterprise Miner:
11 unabhängige Variablen
27 unabhängige Variablen
Vergleich NON-HPA vs. HPA Funktionalitäten
im Single-Maschine Mode
• Genutzte Hardware entspricht NICHT den
Empfehlungen für ein operatives System
• ≥ 16 Cores empfiehlt sich ein MPP System
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
4 Cores
16 GB
SSD
SAS® HPA PRODUCTS AUSFÜHRUNGSMODI
option set=GRIDHOST="hpa.sas.com";
option set=GRIDINSTALLLOC="/opt/TKGrid";
option set=GRIDMODE=„asym“ /* sym */
libname local base compress=yes "c:\local_data";
•
Client oder lokale Daten: Verteilung der
Daten auf die Appliance / HDFS zur Laufzeit
libname applianc {greenplm, teradata, oracle, hadoop}
server ="hpa.sas.com" user =XXXXXX password=YYYYY
database=mydb;
•
Alongside the Database: Die Daten liegen
verteilt im DBMS vor und werden zur Laufzeit
parallel in den Speicher geladen
data applianc.simData;
set local.simData;
run;
Alongside HDFS: Die Daten liegen verteilt im
HDFS (SAS, Apache, Cloudera 4) und werden
zur Laufzeit parallel in den Speicher geladen
data myhdoop.simData (replace = yes);
set local.simData;
run;
•
•
•
Alongside LASR: Die Daten liegen verteilt im
LASR Server (in-Memory). Zur Laufzeit werden
in-Memory Kopien genutzt
Mögliche Modi abhängig von Lizenz
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
libname myhdoop sashdat hdfs_path="/hdfs";
proc lasr port=12345
data=simData path="/tmp/";
run;
libname mylasr sasiola port=12345;
proc hplogistic
data={local, applianc, myhdoop, mylasr}.simData;
class a b c;
model y = a b c x1 x2 x3;
run;
SAS® HPA PRODUCTS AUSFÜHRUNGSMODI
option set=GRIDHOST="hpa.sas.com";
option set=GRIDINSTALLLOC="/opt/TKGrid";
option set=GRIDMODE=„asym“ /* sym */
libname local base compress=yes "c:\local_data";
libname applianc {greenplm, teradata, oracle, hadoop}
server ="hpa.sas.com" user =XXXXXX password=YYYYY
database=mydb;
Single Machine Mode
libname local base compress=yes "c:\local_data";
data applianc.simData;
set local.simData;
run;
libname myhdoop sashdat hdfs_path="/hdfs";
proc hplogistic
data=local.simData;
class a b c;
model y = a b c x1 x2 x3;
run;
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
data myhdoop.simData (replace = yes);
set local.simData;
run;
proc lasr port=12345
data=simData path="/tmp/";
run;
libname mylasr sasiola port=12345;
proc hplogistic
data={local, applianc, myhdoop, mylasr}.simData;
class a b c;
model y = a b c x1 x2 x3;
run;
SAS® HPA PRODUCTS HP STATISTICS PROZEDUREN DEMO - ZUSAMMENFASSUNG
•
Logistische Regression auf den Airline Daten
1 abhängige Variable – Verspätet JA/NEIN
• 11 unabhängige Variablen
• 1,4 Mio. Beobachtungen
•
Prozedur
PROC HPLOGISTIC
PROC LOGISTIC
Real Time
01:02.38
01:01.94
CPU Time
00:19.54
01:11.13
Beschleunigung um Faktor ~3!
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – RESULTATE I
Configuration
Enterprise Miner
Classic
Workflow Step
Real Runtime
Explore
00:06:52.92
Partition
00:03:27.04
Impute
00:00:02.49
Transform
00:01:09.30
Model (Tree)
00:05:27.46
Total
00:15:59.21
Explore
00:00:29.09
Impute
00:00:02.42
Transform
00:00:12.50
Model (Tree)
00:03:03.91
Total
00:04:18.69
Beschleunigung
um Faktor
Partition
00:00:30.77 ~4!
High-Performance
Data Mining
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – RESULTATE II
Configuration
Enterprise Miner
Classic
Workflow Step
Real Runtime
Explore
00:06:52.92
Partition
00:03:27.04
Impute
00:00:02.49
Transform
00:01:09.30
Model (Reg)
04:04:47.61
Total
04:16:19.36
Explore
00:00:29.09
Impute
00:00:02.42
Transform
00:00:12.50
Model (Reg)
00:03:49.64
Total
00:05:04.42
Beschleunigung
um Faktor
Partition
00:00:30.77 ~50!
High-Performance
Data Mining
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS LIVE DEMO – ZUSAMMENFASSUNG
Beschleunigungen um Faktor 4 - 50
im Single Maschine Mode!
> 11% bessere Klassifikationsrate
bei schnellerer Laufzeit!
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS PROC LOGISTIC AUF 20% DER DATEN VON 2008
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS PROC HPLOGISTIC AUF 20% DER DATEN VON 2008
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS PROC HPLOGISTIC AUF 20% DER DATEN VON 2008
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS HP STATISTICS PROZEDUREN DEMO - ZUSAMMENFASSUNG
•
Logistische Regression auf den Airline Daten
1 abhängige Variable – Verspätet JA/NEIN
• 11 unabhängige Variablen
• 1,4 Mio. Beobachtungen
•
Prozedur
PROC LOGISTIC
PROC HPLOGISTIC
Real Time
01:02.38
01:01.94
CPU Time
00:19.54
01:11.13
Beschleunigung um Faktor ~3!
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO
•
SAS® Enterprise Miner Workflow – Vorhersage von Flugverspätungen
•
1 abhängige Variable
• 27 unabhängige Variablen
• ~1,4 Mio. Beobachtungen
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – LAUFZEITEN
Partition
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – LAUFZEITEN
Explore
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – LAUFZEITEN
Impute
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – LAUFZEITEN
Transform
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – LAUFZEITEN
Neural
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – LAUFZEITEN
Regression
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – LAUFZEITEN
Tree
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – RESULTATE I
Configuration
Enterprise Miner
Classic
High-Performance
Data Mining
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
Workflow Step
Real Runtime
Explore
00:06:52.92
Partition
00:03:27.04
Impute
00:00:02.49
Transform
00:01:09.30
Model (Tree)
00:05:27.46
Total
00:15:59.21
Explore
00:00:29.09
Partition
00:00:30.77
Impute
00:00:02.42
Transform
00:00:12.50
Model (Tree)
00:03:03.91
Total
00:04:18.69
SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – RESULTATE I
Configuration
Enterprise Miner
Classic
Workflow Step
Real Runtime
Explore
00:06:52.92
Partition
00:03:27.04
Impute
00:00:02.49
Transform
00:01:09.30
Model (Tree)
00:05:27.46
Total
00:15:59.21
Explore
00:00:29.09
Impute
00:00:02.42
Transform
00:00:12.50
Model (Tree)
00:03:03.91
Total
00:04:18.69
Beschleunigung
um Faktor
Partition
00:00:30.77 ~4!
High-Performance
Data Mining
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – RESULTATE II
Configuration
Enterprise Miner
Classic
High-Performance
Data Mining
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
Workflow Step
Real Runtime
Explore
00:06:52.92
Partition
00:03:27.04
Impute
00:00:02.49
Transform
00:01:09.30
Model (Reg)
04:04:47.61
Total
04:16:19.36
Explore
00:00:29.09
Partition
00:00:30.77
Impute
00:00:02.42
Transform
00:00:12.50
Model (Reg)
00:03:49.64
Total
00:05:04.42
SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – RESULTATE II
Configuration
Enterprise Miner
Classic
Workflow Step
Real Runtime
Explore
00:06:52.92
Partition
00:03:27.04
Impute
00:00:02.49
Transform
00:01:09.30
Model (Reg)
04:04:47.61
Total
04:16:19.36
Explore
00:00:29.09
Impute
00:00:02.42
Transform
00:00:12.50
Model (Reg)
00:03:49.64
Total
00:05:04.42
Beschleunigung
um Faktor
Partition
00:00:30.77 ~50!
High-Performance
Data Mining
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HPA PRODUCTS LIVE DEMO – ZUSAMMENFASSUNG
Beschleunigungen um Faktor 4 - 50
im Single Maschine Mode!
> 11% bessere Klassifikationsrate
bei schnellerer Laufzeit!
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
SAS® HP ANALYTICS
PRODUCTS
MEHRWERTE
Verlässliche, skalierbare
Infrastruktur zur Beseitigung
analytischer Beschränkungen
Genauere Erkenntnisse durch
bessere Modellierungswerkezuge
INSIGHTS
FLEXIBLE
Wettbewerbsvorteil durch
kürze Zeit bis zur fundierteren
Entscheidung
PRECISION
SPEED
Komplett veränderte
Arbeitsweise
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
Eruierung neuer Möglichkeiten
Etablierung als „Analytic Company“
VIELEN DANK!
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
www.SAS.com

Documentos relacionados