Erfassung von Internetfragebögen mit SAS - SAS-Wiki
Transcrição
Erfassung von Internetfragebögen mit SAS - SAS-Wiki
Erfassung von Internetfragebögen mit SAS Wolf F. Lesener Humboldt-Universität zu Berlin Rechenzentrum 6. KSFE 28.2.-1.3.2002 an der Universität Dortmund 1 Potenziale von Datenerhebungen in Netzen1 • • • • 1) Zeit- und Kostenersparnis Mehrfachverwendung Teilnehmerrekrutierung Einbindung in weitere Abläufe D. Janetzko „Statistische Anwendungen im Internet“ Addison-Wesley 1999 6. KSFE 28.2.-1.3.2002 an der Universität Dortmund 2 Probleme bei Datenerhebungen in Netzen1 • Fehlende Repräsentativität • Als Selbstselektion und Selbstrekrutierung, repräsentativ wird eine Stichprobe angesehen, wenn jede Teilnehmermotivation Beobachtungseinheit der Grundgesamtheit die gleiche Chance in dieKontrolle Stichprobe situativer einzugehenMerkmale (Zufallsstichprobe) oder • hatte, Fehlende wenn in Abhängigkeit von der Zusammensetzung der Grundgesamtheit die Stichprobe entsprechend anteilig zusammengesetzt wird.1 S. 141 1) D. Janetzko „Statistische Anwendungen im Internet“ Addison-Wesley 1999 6. KSFE 28.2.-1.3.2002 an der Universität Dortmund 3 Voraussetzung Es ist gründlich zu prüfen, ob eine Umfrage über das Internet das geeignete Arbeitsmittel ist. 6. KSFE 28.2.-1.3.2002 an der Universität Dortmund 4 Informationsfluß Client Client Client Client Mail User Agent: FormMail (Perl) 1. HTML vom Auftraggeber - Verfahren auf FormMail fixiert 2. Validation - Freeware Modifikationen - arbeitet3.formularunabhängig Umfragetechniken - bestimmta)u.a. das Format des Mail-Bodys b) verfahrensspezifisch open etc send1 Fragebogen Mailbox MailTool Eudora Browser: Internet Explorer Opera Netscape Navigator save as eMails Textfile check mail http WWW Server 1 CGI-Programm MailTransferAgent formmail sendmail SMTP Server im Zusammenhang mit Datenerfassung von Internetfragebögen nebensächlich 6. KSFE 28.2.-1.3.2002 an der Universität Dortmund POP3 Server Teilnehmer, Probanden Auftraggeber, Interviewer Provider, Rechenzentrum 5 Erforderliche Kenntnisse Computer-Sprachen HTML Auftrag- Entwickler Proband geber (RZ) gut JavaScript sehr gut gut Cascaded Style Sheets gut Perl gut gering Base SAS Language gering sehr gut sehr gut = selbständig kreativ; gut = an Beispielen orientiert; gering = black-box-Anwendung 6. KSFE 28.2.-1.3.2002 an der Universität Dortmund 6 Der Kern: HTML Formular • • • • • FORM INPUT SELECT OPTION TEXTAREA - Formular - Eingabefeld gemäß TYPE= - Auswahlliste - Optionen zu SELECT - mehrzeiliger Text • Script Programmierung (JavaScript, VB, ...) zur Auswertung von Ereignisattributen 6. KSFE 28.2.-1.3.2002 an der Universität Dortmund 7 Umfragetechniken2 • • • • • • 2) Zufallsauswahl der Stichprobe (nth viz) Kontrolle des Non-Response Plausibilitäts- und Konsistenzkontrollen One-Screen-One-Question Filterführung Fortschrittsanzeige http://www.demotopia.de „Methoden der Online-Befragung“ 6. KSFE 28.2.-1.3.2002 an der Universität Dortmund 8 Die Testumgebung Entwickler open etc Mailbox Browser: Internet Explorer Opera Netscape Navigator send1 Fragebogen MailTool Eudora save as eMails Textfile check mail http CGI-Programm WWW Server winformmail MailTransferAgent MailTransferAgent mailit sendmail SMTP Proxy Server S 1 a m b a r S e r v e r SMTP Server im Zusammenhang mit Datenerfassung von Internetfragebögen nebensächlich 6. KSFE 28.2.-1.3.2002 an der Universität Dortmund POP3 Server Auftraggeber, Entwickler Provider, Rechenzentrum 9 Software • Sambar Server 5.0 ActivePerl Build 522 • FormMail 1.6 (1.9) (-> winformmail.pl) • SAS 8.2 • Eudora 5.1 • Internet Explorer 6.0 Netscape Navigator 6.2 Opera 6.0 6. KSFE 28.2.-1.3.2002 an der Universität Dortmund 10 Datenaggregation _IP_ _LINK_ _IP_ _LINK_ _IP_ _LINK_ eMail eMail eMail Jede Datenzeile enthält einige technisch bedingte zusätzliche Proband Proband Proband ... Fragekomplex Fragekomplex Fragekomplex Variablen. (Formular ) (Formular ) (Formular ) 1 1 1 1 2 1 k 2 k Eine aktuelle Datentabelle wird über die Felddauer mit PROC Jeder Fragekomplex eMail eMail eMail APPEND fortgeschrieben. Proband Proband Für dasProband Match Merge enthält jede eMail Schlüssel : . . zwei .(Formular) Jedes Eingabefeld (Variable) bildet 2 Fragekomplex1 (Formular1) 2 2 Fragekomplex2 (Formular2) Fragekomplexk (Formulark) _IP_ übergeordnet: IP-Adresse bildet einewerden Spalteein derSegment Datentabelle Evtl. mehrfach erfaßte Fragebögen nach Ablauf der Feld_LINK_ untergeordnet: Zeit in Fragebögen ms (loadder Formular Die Anzahl der zurückgesandten begrenzt Datentabelle 1) dauer abgefiltert. (Evaluierungsschritt) ... . . . bildet eine Zeile der. Datentabelle .. Jeder Fragebogen (Proband) den Stichprobenumfang Je Tabellenzeile enthalten _IP_ n und _LINK_ konstante Werte, d.h. es genügt, sie einmal permanent zu speichern. eMail eMail Probandn Fragekomplex1 (Formular1) Probandn Fragekomplex2 (Formular2) eMail ... 6. KSFE 28.2.-1.3.2002 an der Universität Dortmund Probandn Fragekomplexk (Formulark) 11 Generieren eines eMail-Interpreters HTMLEmpfehlungen: Warum? PC Mailbox Formulare eMails Voraussetzungen: Wie? Dokumente Konstruktion des Fragebogens Tabellen HTML enthalten immit Kontext bereits die Metaabfiltern Syntaktisch validierte HTML 4.0 (SAS Dokumente und ASCIIGenerator Informationen (Variablen-Attribute) Erzeugung der SAS Aufruf des Generatorprogramms Vorsichtiger Einsatz von JavaScriptzur undProgramm) VBAusgabe (Möglichkeiten Datentabelle: LABEL, FORMAT, LENGTH Ausgabe einesTYPE, Ablaufprotokolls sind dann so NAME, komplex, daß Verträglichkeit nicht exakt Geringe Anpassungen, z.B.sich bei numerischen Eingabefeldern eMailDictionary eMails beschreiben läßt von - ggf.Namensverzeichnissen Experimente nötig) ist Generatorprogramm kein Ausgabe TYPE="text" zu vereinbaren Interpreter Ein minimiert den Tastaufwand und Ausgabe des eMail-Interpreters als SAS Programm liefert immer syntaktisch fehlerfreien Code. Einrichtung einer Testumgebung aufBuchstaben, dem PC Namen sollten max. 8 Zeichen - nur Ziffern und eMaileMailNacheditieren des generierten eMail-Interpreters Underline enthalten undInterpreter mit Buchstabe beginnen Interpreter HTML Dokumente ändert der Auftraggeber gern editieren Bei speziellen Umfragetechniken zur Steuerung und von häufig, d.h. es sind vom Rechenzentrum bereits FormMail am Beispiel orientieren Namen deru.U. konfigurierenden Variablen von geleistete FormMail sind Arbeiten mitNamen möglichst geringem Aufwand zuSAS wiederholen reservierte Tab. 6. KSFE 28.2.-1.3.2002 an der Universität Dortmund 12 Ein Beispiel • Sambar Server starten • Fragebogen (Internet Explorer) • eingehende eMails (Eudora) • • • • Generator starten Das Interpreter-Programm Editierten Interpreter starten Die SAS Datentabelle 6. KSFE 28.2.-1.3.2002 an der Universität Dortmund SAS 13 6. KSFE 28.2.-1.3.2002 an der Universität Dortmund 14