high-performance analytics - Urz
Transcrição
high-performance analytics - Urz
HIGH-PERFORMANCE ANALYTICS SAS TREFF – UNIVERSITÄT HEIDELBERG 24.10.2013, MARTIN SCHÜTZ, SAS INSTITUTE GMBH C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . AGENDA High-Performance Analytics Produktbündel 1 Warum High-Performance Analytics 2 SAS In-Memory Analytics: Technologie 3 6 neue HP Analytics Produktbündel 4 Demo – Einfach Beispiele 5 Zusammenfassung / Ausblick C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . LIZENZSITUATION • „Mit SAS 9.4 ist die High-Performance Analytics Suite mit Grid, In-Database, In-Memory Bestandteil der Campuslizenz“ • JMP Genomics • SAS Education Analysis Suite • • • BASE SAS, SAS Bridge to ESRI, SAS Enterprise Guide, SAS Integration Technologies, SAS Online Tutor, SAS/ACCESS to {AS/400, CA-Openingres, DB2, HP Neoview, INFORMIX, MySQL, Netezza} ODBC, OLE DB, ORACLE, RdB, PC File Formats, SYBASE, Teradata SAS/AF, SAS/ASSIST, SAS/CONNTECT, SAS/EIS, SAS/ETS, SAS/FSP, SAS/IML, SAS/INSIGHT, SAS/LAB, SAS/OR, SAS/QC, SAS/SECURE, SAS/SHARE, SAS/STAT Beim Umstieg auf eine 9.4 Server-Lizenz stehen die neuen High-Performance Funktionalitäten innerhalb von SAS/STAT, SAS/ETS und SAS/OR zur Verfügung. C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . BIG DATA – Worauf es ankommt VOLUME DATA SIZE VARIETY VELOCITY VALUE TODAY C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . THE FUTURE BIG DATA GROßER DATENMENGEN, KUNDENANFORDERUNGEN ANALYTICS UND DER ANALYTIS LIFECYCLE Operationalisierung Modellausführung (Scoring) In-Database Near Real-Time …. PRODUKTIVSETZUNG DATEN VORVERARBEITUNG Alle Daten, keine Stichproben Viele (abgeleitete) Variablen Neue Ereignisse Unstrukturierte Daten ….. Wettbewerbsvorteil EXPLORATION Komplexe, präzisere Modelle Anzahl an Iterationen Ensemble-Modelle Viele Modelle, viele Updates (Analytics Factory) …. C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . MODELLIERUNG Schnell Interaktiv Visuell Analytisch …. BIG DATA GROßER DATENMENGEN, KUNDENANFORDERUNGEN ANALYTICS UND DER ANALYTIS LIFECYCLE • Große Datenmengen • Viele Rechenoperationen • Wenig Zeit Schnell komplexe Entscheidungen treffen! Wettbewerbsvorteil durch Parallelisierung C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HIGHPERFORMANCE HAUPTKOMPONENTEN ANALYTICS SAS® High-Performance Analytics Products SAS® Visual Analytics SAS® HP Solutions C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® GRID KERNFUNKTIONALITÄTEN COMPUTING • Multi-User Lastausgleich • Parallelisierung und Lastausgleich • Verteilte, unternehmensweite Planung • Hochverfügbarkeit • Skalierbarkeit C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® IN-DATABASE REDUKTION VON DATENBEWEGUNGEN Traditionelle Architektur In-Database Architektur Analytic Modeling Analytic Modeling SAS Scoring Data Preparation Data Preparation SAS Modeling SAS C & PMML Scoring Data Warehouse / Database C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS Scoring Data Preparation Data Warehouse / Database SAS® IN-MEMORY COMPUTING C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® In-Memory Aufbau und Überblick Analytics SAS Metadaten Management SAS Analytics SAS Visual Analytics In-Memory SAS In-Memory Data Store Data SAS LASR SAS HPA In-Memory Engine Server Server Hadoop (HDFS) oder Distributed Storage Storage Appliance SAS Information Management SAS Data Access Engines C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HIGHPERFORMANCE ANALYTICS IN-MEMORY (ALONGSIDE MODUS) Controller SAS® ANALYTICS Client Teradata oder Oracle oder Pivotal (Greenplum) Database oder Hadoop auf Commodity Hardware C op yr i g h t © 2 0 1 3 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HIGHPERFORMANCE ANALYTICS IN-MEMORY (ASYMMETRISCHER MODUS) Controller Controller SAS® ANALYTICS Client Compute Appliance C op yr i g h t © 2 0 1 3 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . Existing Teradata oder Oracle oder Pivotal (Greenplum) Database oder Hadoop SAS® HIGHPERFORMANCE MÖGLICHE SAS COMPUTE APPLIANCE ARCHITEKTUR ANALYTICS CLIENT GREENPLUM HADOOP C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . TERADATA ORACLE SAS® HIGHPERFORMANCE MÖGLICHE SAS COMPUTE APPLIANCE ARCHITEKTUR ANALYTICS CLIENT GREENPLUM TERADATA ORACLE High-Performance Prozeduren ab SAS 9.4 / Analytics 12.3 im verteilten & „Single-Machine“ Modus verfügbar HADOOP C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HIGHPERFORMANCE MÖGLICHE SAS COMPUTE APPLIANCE ARCHITEKTUR ANALYTICS CLIENT SAP HANA GREENPLUM ORACLE High-Performance Prozeduren 22.10.2013: SAP TechEd ab Strategische SAS 9.4 / Analytics 12.3 Partnerschaft im SAP verteilten & „Single-Machine“ (HANA) & SAS (HPA) Modus verfügbar HADOOP C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . TERADATA SAS® VISUAL ANALYTICS C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® VISUAL ANALYTICS DELIVERS A SINGLE SOLUTION FOR FASTER, SMARTER DECISIONS Central Entry Point Integration Role-based Views DATA BUILDER ADMINISTRATOR EXPLORER DESIGNER MOBILE BI • Join data from multiple sources • Create calculated and derived columns • Load data • Monitor SAS® LASR™ Analytic server • Load/unload data • Manage security • Perform ad-hoc analysis and data discovery • Apply advanced analytics • Create dashboard style reports for web or mobile • Native iOS and Android applications that delivers interactive reports SAS® LASR™ ANALYTIC SERVER C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® Visual SAS Visual Analytics Szenario-Analyse Analytics C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® Visual Berechnung von Entscheidungsbäumen Analytics C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS VISUAL NEU Q1/2014 STATISTICS Highly Interactive visual statistical modeling environment • Analytics running in LASR • Simple VA-like User interface Key Features • Multiple User Concurrency • Classical Statistics (Regression, ANOVA, Clustering) • Modern Statistics (Decision Trees, Random Forest, & Naïve Bayes). • Parallel Group BY Processing C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HIGH-PERFORMANCE ANALYTICS PRODUCTS C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HIGHPERFORMANCE 6 NEUE, DOMAINSPEZIFISCHE PRODUKTBÜNDEL ANALYTICS High-Performance Statistics High-Performance Data Mining1 High-Performance Text Mining High-Performance Optimization High-Performance Econometrics High-Performance Forecasting2* • HPLOGISTIC • HPREDUCE • HPTMINE • OPTLSO • HPCOUNTREG • • HPREG HPLMIXED HPNLMOD HPSPLIT HPGENSELECT • HPNEURAL • HPFOREST • HP4SCORE • HPDECIDE • HPTMSCORE • Select features in • OPTMILP • OPTLP • OPTMODEL • HPSEVERITY HPQLIM • • • • • HPFORECAST Gemeinsame Prozeduren (HPDS2, HPDMDB, HPSAMPLE, HPSUMMARY, HPIMPUTE, HPBIN, HPCORR) # • #Gemeinsame Prozeduren sind in jedem einzelnen HP Analytics Produkt enthalten • 1Beinhaltet SAS High-Performance Statistics, 2Beinhaltet High-Performance Econometrics • SMP Architektur: HP Prozeduren unter SAS 9.4 in Analytics 12.3 enthalten C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HIGHPERFORMANCE STATISTICS 12.3 HPLOGISTIC HPREG HPSPLIT HPGENSELECT HPLMIXED HPNLMOD HIGHLIGHTS • Bestmögliche Performance für Modellvorhersage und Variablenselektion auf großen Datenmengen • Produktivitätserhöhung durch Vereinigung klassischer SAS/STAT Funktionalitäten, z.B. HPREG = REG GLM GLMSELECT • HPGENSELECT = GENOMD + Variablenselektion • • Neue Funktionalitäten • C op yr i g h t © 2 0 1 3 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . Entscheidungsbäume SAS® HIGHPERFORMANCE DATA MINING 12.3 HP Data Partition HP Explore HP Transform HP Impute HP Variable Selection HP Regression HP Neural HP Forest HP Tree HIGHLIGHTS • HP Data Mining beinhaltet HP Statistics • 9 Knoten bündeln die Funktionalität von HP Statistics und zusätzlicher HP Data Mining Prozeduren • C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . HPREDUCE, HPFOREST, HPNEURAL, HPDECIDE SAS® HIGH PERFORMANCE TEXT MINING 12.3 HPTMINE TGPARSE TMUTIL SPSVD HPTMSCORE TGSCORE SPSVD HIGHLIGHTS • • Natural Language Processing • Term-Filterung & -Gewichtung • Dimensionsreduktion • Starke Prozessbeschleunigung durch • Integration von Funktionalitäten • Multi-Threading und verteiltes Rechnen • Weniger I/O durch In-Memory Technologie • C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . Schnelles Parsing großer Textsammlungen Prozeduren auch im Enterprise Miner™ nutzbar SAS® HIGHPERFORMANCE OPTIMIZATION 12.3 HIGHLIGHTS • High-Performance Optimization zur • Lösung großer, strukturell komplizierter Fragestellungen • Beschleunigung diverser Solver (LP, MILP, QP, NLP) OPTLSO Features in OPTMILP OPTLP OPTMODEL C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . • Neu: High-Performance Local Search Optimization für ableitungsfreie, gemischt-ganzzahlige Probleme • Neu: Ausgewählte Features • Multistart Option für nicht-lineare Zielfunktionen • Parametertuning für gemischten-ganzzahligen Solver • Dekompositionsalgorithmus für große, LP & MILP mit speziellen Constraint-Strukturen SAS® HIGHPERFORMANCE ECONOMETRICS 12.3 HIGHLIGHTS • Ökonometrische Regressionsmodelle wichtig zur Abschätzung von Kosten- und Risikostrukturen • Count Regression Regressionsmodelle für abhängige „Zähl“-Variablen • Verteilungen: Poisson & Zero-Inflated, Negative Binomial • HPCOUNTREG HPSEVERITY HPQLIM • Severity Regression • Regression mit komplexerer, univariater Verteilung der Zielgröße, sowie gestutzten und zensierten Daten • Automatische Verteilungsanpassung (z.B. Tweedie) • “Qualitative And Limited Independent Variables” • C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . Lineare Modelle für gestutzte & zensierte Daten mit Heteroskedastizität SAS® HIGHPERFORMANCE FORECASTING 12.3* HPFORECAST Smoothing Modelle - Simple - Linear - Damped Trend - Seasonal * Additiv * Multiplikativ - Winters * Additiv * Multiplikativ C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . HIGHLIGHTS • Statistische Zeitreihenmodelle wichtig für Einzelhandel, Telekom, Banken, IT, … • High-Performance Forecasting ermöglicht schnelle • Aufbereitung großen Mengen hierarchisch strukturierter, mit Zeitstempeln versehener Daten • automatische Erzeugung extrem vieler, optimal angepasster Smoothing Zeitreihenmodelle • Erzeugung von hierarchisch konsolidierten Prognosen unterschiedlicher Detaillierungsgrade & zeitlicher Auflösungen *SAS High-Performance Forecasting 12.3 ist kein Produktions-Release LIVE DEMO C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HP ANALYTICS DEMO: AIRLINE DATEN (SFD 2012) PRODUCTS Vorhersage von Flugverspätungen • ~120 Mio. kommerzielle Flüge USA (10/87 – 04/08) • 1 abhängige binäre, 11 unabhängige Variablen Referenzbeispiel: Churn, Response, Credit, Fraud, … SMP MPP Faktor Cores 6 768 128 Memory 48 GB 3 TB 64 Technologie NON-HPA HPA C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HP ANALYTICS DEMO: AIRLINE DATEN (SFD 2013) PRODUCTS Vorhersage von Flugverspätungen • 1 abhängige binäre Variable • 20% der Flüge aus 2008 ≈ 1,4 Mio. • Prozeduren: • Enterprise Miner: 11 unabhängige Variablen 27 unabhängige Variablen Vergleich NON-HPA vs. HPA Funktionalitäten im Single-Maschine Mode • Genutzte Hardware entspricht NICHT den Empfehlungen für ein operatives System • ≥ 16 Cores empfiehlt sich ein MPP System C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . 4 Cores 16 GB SSD SAS® HPA PRODUCTS AUSFÜHRUNGSMODI option set=GRIDHOST="hpa.sas.com"; option set=GRIDINSTALLLOC="/opt/TKGrid"; option set=GRIDMODE=„asym“ /* sym */ libname local base compress=yes "c:\local_data"; • Client oder lokale Daten: Verteilung der Daten auf die Appliance / HDFS zur Laufzeit libname applianc {greenplm, teradata, oracle, hadoop} server ="hpa.sas.com" user =XXXXXX password=YYYYY database=mydb; • Alongside the Database: Die Daten liegen verteilt im DBMS vor und werden zur Laufzeit parallel in den Speicher geladen data applianc.simData; set local.simData; run; Alongside HDFS: Die Daten liegen verteilt im HDFS (SAS, Apache, Cloudera 4) und werden zur Laufzeit parallel in den Speicher geladen data myhdoop.simData (replace = yes); set local.simData; run; • • • Alongside LASR: Die Daten liegen verteilt im LASR Server (in-Memory). Zur Laufzeit werden in-Memory Kopien genutzt Mögliche Modi abhängig von Lizenz C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . libname myhdoop sashdat hdfs_path="/hdfs"; proc lasr port=12345 data=simData path="/tmp/"; run; libname mylasr sasiola port=12345; proc hplogistic data={local, applianc, myhdoop, mylasr}.simData; class a b c; model y = a b c x1 x2 x3; run; SAS® HPA PRODUCTS AUSFÜHRUNGSMODI option set=GRIDHOST="hpa.sas.com"; option set=GRIDINSTALLLOC="/opt/TKGrid"; option set=GRIDMODE=„asym“ /* sym */ libname local base compress=yes "c:\local_data"; libname applianc {greenplm, teradata, oracle, hadoop} server ="hpa.sas.com" user =XXXXXX password=YYYYY database=mydb; Single Machine Mode libname local base compress=yes "c:\local_data"; data applianc.simData; set local.simData; run; libname myhdoop sashdat hdfs_path="/hdfs"; proc hplogistic data=local.simData; class a b c; model y = a b c x1 x2 x3; run; C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . data myhdoop.simData (replace = yes); set local.simData; run; proc lasr port=12345 data=simData path="/tmp/"; run; libname mylasr sasiola port=12345; proc hplogistic data={local, applianc, myhdoop, mylasr}.simData; class a b c; model y = a b c x1 x2 x3; run; SAS® HPA PRODUCTS HP STATISTICS PROZEDUREN DEMO - ZUSAMMENFASSUNG • Logistische Regression auf den Airline Daten 1 abhängige Variable – Verspätet JA/NEIN • 11 unabhängige Variablen • 1,4 Mio. Beobachtungen • Prozedur PROC HPLOGISTIC PROC LOGISTIC Real Time 01:02.38 01:01.94 CPU Time 00:19.54 01:11.13 Beschleunigung um Faktor ~3! C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – RESULTATE I Configuration Enterprise Miner Classic Workflow Step Real Runtime Explore 00:06:52.92 Partition 00:03:27.04 Impute 00:00:02.49 Transform 00:01:09.30 Model (Tree) 00:05:27.46 Total 00:15:59.21 Explore 00:00:29.09 Impute 00:00:02.42 Transform 00:00:12.50 Model (Tree) 00:03:03.91 Total 00:04:18.69 Beschleunigung um Faktor Partition 00:00:30.77 ~4! High-Performance Data Mining C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – RESULTATE II Configuration Enterprise Miner Classic Workflow Step Real Runtime Explore 00:06:52.92 Partition 00:03:27.04 Impute 00:00:02.49 Transform 00:01:09.30 Model (Reg) 04:04:47.61 Total 04:16:19.36 Explore 00:00:29.09 Impute 00:00:02.42 Transform 00:00:12.50 Model (Reg) 00:03:49.64 Total 00:05:04.42 Beschleunigung um Faktor Partition 00:00:30.77 ~50! High-Performance Data Mining C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS LIVE DEMO – ZUSAMMENFASSUNG Beschleunigungen um Faktor 4 - 50 im Single Maschine Mode! > 11% bessere Klassifikationsrate bei schnellerer Laufzeit! C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS PROC LOGISTIC AUF 20% DER DATEN VON 2008 C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS PROC HPLOGISTIC AUF 20% DER DATEN VON 2008 C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS PROC HPLOGISTIC AUF 20% DER DATEN VON 2008 C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS HP STATISTICS PROZEDUREN DEMO - ZUSAMMENFASSUNG • Logistische Regression auf den Airline Daten 1 abhängige Variable – Verspätet JA/NEIN • 11 unabhängige Variablen • 1,4 Mio. Beobachtungen • Prozedur PROC LOGISTIC PROC HPLOGISTIC Real Time 01:02.38 01:01.94 CPU Time 00:19.54 01:11.13 Beschleunigung um Faktor ~3! C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO • SAS® Enterprise Miner Workflow – Vorhersage von Flugverspätungen • 1 abhängige Variable • 27 unabhängige Variablen • ~1,4 Mio. Beobachtungen C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – LAUFZEITEN Partition C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – LAUFZEITEN Explore C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – LAUFZEITEN Impute C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – LAUFZEITEN Transform C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – LAUFZEITEN Neural C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – LAUFZEITEN Regression C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – LAUFZEITEN Tree C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – RESULTATE I Configuration Enterprise Miner Classic High-Performance Data Mining C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . Workflow Step Real Runtime Explore 00:06:52.92 Partition 00:03:27.04 Impute 00:00:02.49 Transform 00:01:09.30 Model (Tree) 00:05:27.46 Total 00:15:59.21 Explore 00:00:29.09 Partition 00:00:30.77 Impute 00:00:02.42 Transform 00:00:12.50 Model (Tree) 00:03:03.91 Total 00:04:18.69 SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – RESULTATE I Configuration Enterprise Miner Classic Workflow Step Real Runtime Explore 00:06:52.92 Partition 00:03:27.04 Impute 00:00:02.49 Transform 00:01:09.30 Model (Tree) 00:05:27.46 Total 00:15:59.21 Explore 00:00:29.09 Impute 00:00:02.42 Transform 00:00:12.50 Model (Tree) 00:03:03.91 Total 00:04:18.69 Beschleunigung um Faktor Partition 00:00:30.77 ~4! High-Performance Data Mining C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – RESULTATE II Configuration Enterprise Miner Classic High-Performance Data Mining C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . Workflow Step Real Runtime Explore 00:06:52.92 Partition 00:03:27.04 Impute 00:00:02.49 Transform 00:01:09.30 Model (Reg) 04:04:47.61 Total 04:16:19.36 Explore 00:00:29.09 Partition 00:00:30.77 Impute 00:00:02.42 Transform 00:00:12.50 Model (Reg) 00:03:49.64 Total 00:05:04.42 SAS® HPA PRODUCTS SAS® ENTERPRISE MINER DEMO – RESULTATE II Configuration Enterprise Miner Classic Workflow Step Real Runtime Explore 00:06:52.92 Partition 00:03:27.04 Impute 00:00:02.49 Transform 00:01:09.30 Model (Reg) 04:04:47.61 Total 04:16:19.36 Explore 00:00:29.09 Impute 00:00:02.42 Transform 00:00:12.50 Model (Reg) 00:03:49.64 Total 00:05:04.42 Beschleunigung um Faktor Partition 00:00:30.77 ~50! High-Performance Data Mining C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HPA PRODUCTS LIVE DEMO – ZUSAMMENFASSUNG Beschleunigungen um Faktor 4 - 50 im Single Maschine Mode! > 11% bessere Klassifikationsrate bei schnellerer Laufzeit! C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® HP ANALYTICS PRODUCTS MEHRWERTE Verlässliche, skalierbare Infrastruktur zur Beseitigung analytischer Beschränkungen Genauere Erkenntnisse durch bessere Modellierungswerkezuge INSIGHTS FLEXIBLE Wettbewerbsvorteil durch kürze Zeit bis zur fundierteren Entscheidung PRECISION SPEED Komplett veränderte Arbeitsweise C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . Eruierung neuer Möglichkeiten Etablierung als „Analytic Company“ VIELEN DANK! C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . www.SAS.com