Aufbereitung von Audio- und Videodaten für das Musik
Transcrição
Aufbereitung von Audio- und Videodaten für das Musik
5 Aufbereitung von Audio- und Videodaten für das Musik- und das Videoalbum des AEIOU-Informationsservers Diplomarbeit vorgelegt von Gottfried Müllner Dezember 2000 Institut für Informationsverarbeitung und Computergestützte neue Medien Technische Universität Graz Begutachter: O. Univ. Prof. Dr. phil. Dr. h. c. Hermann Maurer Betreuer: Dipl.-Ing. Dr. techn. Peter Sammer Danksagung An dieser Stelle bedanke ich mich bei O. Univ.-Prof. Dr. phil. Dr. h.c. Hermann Maurer, dem Begutachter dieser Diplomarbeit, und bei Dipl.-Ing. Dr. techn. Peter Sammer, meinem Betreuer. Ebenso bedanke ich mich bei allen Kollegen und Freunden, die mir im Verlauf meines Studiums mit Rat und Tat zur Seite gestanden sind. Mein besonderer Dank gilt meinen Eltern, Gottfried und Herta Müllner, die mich während meines gesamten Studiums in jeder Hinsicht unterstützt haben. Graz, Dezember 2000 Gottfried Müllner Grundsätzlich wurden die Recherchen und Untersuchungen für die vorliegende Arbeit in den Jahren 1996 und 1997 durchgeführt und zu einem großen Teil auch in schriftlicher Form Ende des Jahres 1997 fertiggestellt. Aus persönlichen Gründen war es dem Autor dieser Arbeit erst im Jahr 2000 möglich, die schriftliche Arbeit abzuschließen und zur Bewertung vorzulegen. 2 ZUSAMMENFASSUNG Zusammenfassung Für das Projekt AEIOU, einen Informationsserver, der anlässlich des Millenniums Österreichs ins Leben gerufen wurde, mussten unter anderem ein Musik- und ein Videoalbum implementiert werden. In diesen Alben sollten verschiedene Sequenzen aus der österreichischen Kultur und Geschichte weltweit elektronisch verfügbar gemacht werden. Aus diesem Grund war es die Aufgabe des Autors der vorliegenden Arbeit, in den Jahren 1996 und 1997 Recherchen anzustellen, in denen die große Anzahl an verfügbaren Audiound Videoformaten evaluiert und auf ihre Tauglichkeit für das Projekt AEIOU untersucht wurden. Dafür wurden unter Verwendung von spezieller Hardware und Software umfangreiche Testreihen mit einzelnen Formaten durchgeführt. Die Sequenzen, die im Laufe dieser Untersuchungen erstellt wurden, wurden unter Anwendung von bestimmten Kriterien (Kompressionsrate, Bild- bzw. Tonqualität) bewertet. Auf Basis der in diesen Recherchen erzielten Ergebnisse wurden einige der evaluierten Formate im Musik- oder im Videoalbum des AEIOU zum Einsatz gebracht. Zusätzlich zu den Sequenzen in Formaten, die aufgrund ihrer hohen Qualität gewählt wurden, wurde ein weiteres Format mit geringerer Qualität in den AEIOU-Umfang aufgenommen, das den Benutzern als Preview (Vorschau) diente. Die vorliegende Arbeit zeigt nun die Ergebnisse dieser umfangreichen Untersuchungen. Dazu wird zunächst gezeigt, wie Sequenzen in den vielversprechendsten der in den Jahren 1996 und 1997 verfügbaren Formate erstellt und weiterverarbeitet werden. In weiterer Folge werden anhand der erzielten Recherche-Ergebnisse die Stärken und Schwächen der gewählten Formate aufgezeigt und untereinander verglichen. Dieser Vergleich erfolgte vor allem in Hinblick auf die geplante Verwendung der Clips in den AEIOU-Alben. Das AEIOU-System, das als Plattform für diese Untersuchungen und auch für die effektive Umsetzung der Konvertierungen in die auf Basis der Analysen innerhalb dieser Arbeit gewählten Formate, ist seit 1996 weltweit über das Internet verfügbar und wurde aufgrund des großen Erfolges und Zuspruches auch nach Beendigung dieser Arbeit erweitert. So wurden wenige Jahre nach Abschluss der Recherchen für die vorliegende Arbeit für die im System abgelegten Clips einige Formate durch neuere, bessere Formate, wie zum Beispiel MP3 ersetzt. 3 INHALTSVERZEICHNIS Inhaltsverzeichnis 1. EINLEITUNG ...........................................................................................................................6 1.1 1.2 1.3 1.4 DAS MILLENNIUM ..........................................................................................................7 HYPERWAVE ....................................................................................................................7 DAS AEIOU-TEAM .......................................................................................................8 AUFBAU DER ARBEIT ....................................................................................................8 2. AEIOU UND MULTIMEDIA .................................................................................. 10 2.1 2.2 2.3 2.4 DAS PROJEKT AEIOU.................................................................................................11 GLIEDERUNG VON AEIOU IN ALBEN.....................................................................12 MULTIMEDIA .................................................................................................................14 BEWERTUNGSKRITERIEN............................................................................................ 15 2.4.1 2.4.2 Kompression ............................................................................................................................ 15 Bildqualität .............................................................................................................................. 16 2.5 ARBEITSUMGEBUNG ....................................................................................................16 3. AEIOU UND MUSIK .......................................................................................................18 3.1 EINLEITUNG ...................................................................................................................19 3.2 DAS AUDIOFORMAT MICROSOFT WAVEFORM (WAV, WAVE) ....................21 3.2.1 3.2.2 3.2.3 Generierung von Sequenzen im Waveform-Format....................................................................23 Integration von Waveform-Sequenzen in eine HTML-Seite ........................................................ 25 Ergebnisse................................................................................................................................ 26 3.3 DAS AUDIOFORMAT REAL AUDIO ...........................................................................29 3.3.1 3.3.2 3.3.3 Generierung von Sequenzen im Real Audio-Format ..................................................................29 Integration von Real Audio-Sequenzen in eine HTML-Seite .......................................................31 Ergebnisse................................................................................................................................ 32 3.4 DAS AUDIOFORMAT VIVO ACTIVE..........................................................................35 3.4.1 3.4.2 3.4.3 Generierung von Sequenzen im Vivo Active-Format ..................................................................35 Integration von Vivo Active-Sequenzen in eine HTML-Seite.......................................................38 Ergebnisse................................................................................................................................ 39 3.5 DAS AUDIOFORMAT MP3 ..........................................................................................41 3.5.1 3.5.2 3.5.3 Generierung von Sequenzen im MP3-Format ............................................................................ 43 Integration von Sequenzen im MP3-Format in eine HTML-Seite................................................47 Ergebnisse................................................................................................................................ 48 4. AEIOU UND FILM............................................................................................................ 52 4.1 EINLEITUNG ...................................................................................................................53 4.2 DAS VIDEOFORMAT AUDIO VIDEO INTERLEAVE (AVI)....................................56 4.2.1 4.2.2 4.2.3 Generierung von Sequenzen im AVI-Format .............................................................................63 Integration von AVI-Sequenzen in eine HTML-Seite ..................................................................74 Ergebnisse................................................................................................................................ 76 4.3 DAS VIDEOFORMAT APPLE QUICKTIME ................................................................ 78 4.3.1 4.3.2 4.3.3 Generierung von Sequenzen im QuickTime-Format...................................................................83 Integration von QuickTime-Sequenzen in eine HTML-Seite .......................................................85 Ergebnisse................................................................................................................................ 87 4 INHALTSVERZEICHNIS 4.4 DAS VIDEOFORMAT MOVING PICTURES EXPERT GROUP .................................90 4.4.1 4.4.2 4.4.3 Generierung von Sequenzen im MPEG-Format.........................................................................92 Integration von MPEG-Sequenzen in eine HTML-Seite .............................................................96 Ergebnisse................................................................................................................................ 98 4.5 DAS VIDEOFORMAT REAL VIDEO............................................................................99 4.5.1 4.5.2 4.5.3 Generierung von Sequenzen im Real Video-Format...................................................................99 Integration von Real Video-Sequenzen in eine HTML-Seite ..................................................... 102 Ergebnisse.............................................................................................................................. 103 4.6 DAS VIDEOFORMAT VIVO ACTIVE ........................................................................ 106 4.6.1 4.6.2 4.6.3 Generierung von Sequenzen im Vivo Active-Format ................................................................ 106 Integration von Vivo Active-Sequenzen in HTML-Seiten.......................................................... 107 Ergebnisse.............................................................................................................................. 110 ANHÄNGE ...................................................................................................................................... 114 ABBILDUNGSVERZEICHNIS.................................................................................................................. 135 TABELLENVERZEICHNIS...................................................................................................................... 136 TABELLENVERZEICHNIS...................................................................................................................... 137 LITERATURVERZEICHNIS .................................................................................................................... 138 LINKSAMMLUNG (STAND: DEZEMBER 2000).................................................................................... 141 5 1. Einleitung Kapitel 1 Einleitung EINLEITUNG 1.1 Das Millennium Hyperwave Das Millennium Wir schreiben das Jahr 996 nach Christi Geburt. Ein als Ostmark bekanntes Gebiet wird als Lehen der Babenberger deklariert. Der Name dieses Lehens lautet ostarrîchi. Eintausend Jahre sind vergangen. Wir schreiben das Jahr 1996 nach Christi Geburt. Anlässlich des Millenniums, der 1000-Jahr-Feier Österreichs, wird der AEIOUInformationsserver [AEIOU97a] realisiert. Dieser Server stellt die größte Ansammlung von österreichbezogenen Daten dar, die in elektronischer Form weltweit öffentlich verfügbar gemacht wurde. Millionen von Menschen wird hiermit die Möglichkeit geboten, weltweit unter der Internet-Adresse http://www.aeiou.at Informationen über das Land Österreich abzurufen, darunter auch jene Schenkungsurkunde aus dem Jahr 996, in der Österreich zum ersten Mal namentlich erwähnt wurde. Das AEIOU-Informationssystem baut auf zwei Entwicklungen auf, ohne deren spezielle Eigenschaften und Möglichkeiten eine erfolgreiche Umsetzung des Systems nicht möglich gewesen wäre: 1.2 • das Internet 1, das eine weltweite Verbreitung von Informationen in Form von Text, Ton und Bild ermöglicht und • das Softwarepaket Hyperwave [MAURER96], das die Grundlage des AEIOUInformationssystems bildet. Hyperwave Die Entwicklung von Hyperwave wurde im Jahr 1989 am Institut für Informationsverarbeitung und Computergestütze neue Medien (IICM) der Technischen Universität Graz unter der Leitung von O.Univ.Prof. Dr. phil. h. c. Hermann Maurer begonnen. Dieses „Informationssystem der zweiten Generation“ ist zwar als einfacher Informationsserver konzipiert, weist jedoch eine Vielzahl an elementaren Funktionen auf, die eine Nutzung des Netzes im eigentlichen Sinn erst ermöglichen. Im Gegensatz zu den üblichen Web-Server-Technologien werden in Hyperwave Dokumente und Links auf diese Dokumente separat verwaltet. Dadurch ist eine effiziente Datenpflege in Bezug auf die Vermeidung von dangling links2 möglich. Zusätzlich unterstützt dieses System Mehrsprachigkeit und bietet umfassende Suchfunktionen. Nähere Informationen über die Struktur und die Funktionalität des Hyperwave-Systems können in den Handbüchern der Firma Hyperwave [HYPERWAVE00] sowie in einigen anderen Werken (z.B. HyperG is now Hyperwave [MAURER96], The PLACE Language [MOSER96]) gefunden werden. 1 Das Internet ist ein globales Computernetzwerk, das die Verbindung und den Datenaustausch zwischen zwei beliebigen Computern in diesem Netzwerk ermöglicht. Das Internet bestand Ende 1995 aus ca. 40.000.000 Computern mit einer Zuwachsrate von ca. 15% pro Monat. Die Daten auf dem Internet werden m it dem TCP/IPProtokoll übertragen. Jeder am Internet angeschlossene Computer hat als "Adresse" eine Internet-Nummer. 2 Link auf ein Dokument, das bereits von dem entsprechenden Web-Server gelöscht wurde. 7 EINLEITUNG 1.3 Das AEIOU-Team Das AEIOU-Team Über ein Dutzend Personen wirkte allein am IICM bei der Umsetzung des AEIOUInformationssystems mit. Die wichtigsten Mitglieder des AEIOU-Teams sowie ihre Arbeitsbereiche seien hier kurz angeführt: Unter der Gesamtleitung von O.Univ. Prof. Dr. phil. h. c. Hermann Maurer erfolgte die Umsetzung des Projektes am IICM. Die Entwicklung der einzelnen Alben führte dabei Dipl.Ing. Dr. techn. Peter Sammer an, der als Projektleiter und Koordinator eingesetzt war. Im ersten Jahr war Andreas Ausserhofer [AUSSERHOFER96] an der Entwicklung des Österreich-Lexikons beteiligt. Im selben Zeitraum beschäftigte sich Andreas Walser [WALSER96] mit der Implementation des Briefmarken-Albums. Unter maßgeblicher Mithilfe von Roland Krasser [KRASSER97] wurden die Teile Photo-Album, Musik-Album und Kunsthistorisches Bilderalbum konzipiert und realisiert. Michael Hollauf [HOLLAUF97] war am Aufbau des Video-Albums, des Österreich-Lexikons und in den späteren Phasen auch des Briefmarken-Albums beteiligt. Zu den Aufgabe des Autors der vorliegenden Arbeit gehörten die Aufbereitung von Videodaten für das Video-Album sowie ergänzenden Audiodaten für das Musik-Album und in weiterer Folge auch der Import dieser Daten in das Informationssystem. Zusätzlich zu den Mitarbeitern des IICM war im Auftrag des Ministeriums für Wissenschaft und Verkehr (BMWV) Mag. Edith Murlasits mit der Auswahl und Festlegung der Videosequenzen, die in das Video-Album aufgenommen werden sollten, verantwortlich. Für das Musikgeschichte-Album war Mag. Elisabeth Stadler vom Institut für Musikwissenschaften der Universität Graz mit der Auswahl und Festlegung der Audiosequenzen beauftragt. 1.4 Aufbau der Arbeit Im Rahmen des AEIOU-Projektes wurde eine Hypermedia-Präsentation mit Audio- und Videosequenzen über die Kultur und die Geschichte Österreichs aufgebaut. Das Ziel der vorliegenden Arbeit war es, die zum damaligen Zeitpunkt zur Verfügung stehenden Audiound Videoformate zu evaluieren. In diesen Untersuchungen musste recherchiert werden, welche Vor- und Nachteile die jeweiligen Formate aufweisen und wie Clips in diesen verschiedenen Formaten erzeugt und weiterverarbeitet werden können. Zusätzlich wurde in diesen in den Jahren 1996 und 1997 durchgeführten Untersuchungen anhand den Ergebnissen bewertet, welche der vorliegenden Formate sich für eine Präsentation der Daten auf dem AEIOU-Server geeignet waren. Aufgrund der aus den umfangreichen Recherchen gewonnenen Erkenntnisse wurden mehrere Audio- und Videoformate mit guter Qualität für das AEIOU-Projekt gewählt. Zusätzlich wurde ein weiteres Videoformat als PreviewFunktion im Videoalbum des AEIOU-Projektes eingesetzt, um dem Betrachter vor dem Laden der Sequenz eine Vorinformation anzubieten. Die vorliegende Arbeit präsentiert die in den Testreihen erzielten Ergebnisse und festgestellten Stärken und Schwächen der einzelnen Formate. Der Aufbau dieser Arbeit ist wie folgt: 8 EINLEITUNG Aufbau der Arbeit Nach der Einleitung wird in Kapitel 2 (AEIOU und Multimedia) das Projekt AEIOU kurz erklärt sowie die für die Recherchen zur Verfügung gestellte Arbeitsumgebung beschrieben. Danach gibt Kapitel 3 (AEIOU und Musik) einen Überblick über die evaluierten Audioformate. Dabei wird auf die Erzeugung der jeweiligen Sequenzen und deren Weiterverarbeitung und in weiterer Folge auf die im Zuge der Untersuchungen erworbenen Erkenntnisse im Hinblick auf eine Verwendung im AEIOU-System eingegangen. Schließlich folgt in Kapitel 4 (AEIOU und Film) die Präsentation der Rechercheergebnisse der analysierten Videoformate. Zunächst wird dabei die Erzeugung und Weiterverarbeitung derartiger Sequenzen erklärt. Im Anschluss daran werden die Stärken und Schwächen der einzelnen Videoformate beleuchtet und die Formate im Hinblick auf Ihre Eignung für eine internetbezogene Verwendung bewertet. 9 2. AEIOU und Multimedia Kapitel 2 AEIOU und Multimedia AEIOU UND MULTIMEDIA Das Projekt AEIOU In diesem Kapitel wird das Projekt AEIOU kurz vorgestellt und die Gliederung der Daten auf dem AEIOU-Server in verschiedene Alben beschrieben. Weiters werden in den letzten beiden Abschnitten dieses Kapitels die für die Evaluierung der einzelnen Formate wichtigen Bewertungs-Kriterien (Kompression und Bildqualität) erklärt und die für die Untersuchungen verwendeten Komponenten der Arbeitsumgebung aufgelistet. 2.1 Das Projekt AEIOU Verschiedene Institutionen starteten anlässlich der Millenniums-Feier Österreichs – 1000 Jahre Ostarrîchi – unterschiedliche Millenniums-Projekte. Eines dieser Projekte war ein Internet-Informationssystem das den Namen AEIOU trägt. Dieses Projekt hatte das Ziel, unser Land und seine Kultur nachhaltig in aller Welt zu präsentieren. Seinen Namen lieh sich das Projekt von einer Vokalreihe, die Kaiser Friedrich III. (14401493) an vielen repräsentativen Bauten anbringen ließ. Waren sich die Historiker über lange Zeit (und sind es teilweise noch) uneinig darüber, ob diese Vokalreihe nun bedeuten sollte, dass Österreich ewig in der Welt sein wird (Austria Erit In Orbe Ultima) oder dass es Österreichs Bestimmung sei, die ganze Welt zu beherrschen (Austria Est Imperare Orbi Universo) oder gar heißen sollte Alles Erdreich Ist Österreich Untertan, ist im Gegensatz dazu der Name des Millenniumsprojektes klar und wird auf der Einstiegsseite (Abbildung 1) erklärt. Dieses Projekt wurde im Auftrag des Bundesministeriums für Wissenschaft und Verkehr (BMWV) vom Institut für Informationsverarbeitung und Computergestützte neue Medien (IICM) der Technischen Universität Graz entwickelt. Unterstützung lieferte dabei auch das Institut für Hypermedia Systeme (HMS) der Joanneum Research Forschungsgesellschaft. Das multimediale Informationssystem AEIOU, das seit November 1996 im Internet vertreten ist, enthält Daten zu Geschichte und Kultur Österreichs in Text, Bild, Ton und Video und ist in 9 verschiedene Alben gegliedert. Das Ziel dieses Projektes war, mit dem Inhalt dieser neun Alben einen Einblick in die Landschaft und die Kultur Österreichs sowie in die Lebensweise seiner Bewohner zu geben. Außerdem sollte sich dieses System nicht nur für den zufälligen Benutzer eignen, sondern auch einem Informationssuchenden ein möglichst vollständiges Nachschlagewerk bieten, in dem eine spezielle Suche durch Eingabe eines oder mehrerer Stichworte ermöglicht wird. 11 AEIOU UND MULTIMEDIA Das Projekt AEIOU Abbildung 1: Die Einstiegsseite des AEIOU-Projektes 2.2 Gliederung von AEIOU in Alben Das Projekt AEIOU wurde in mehrere Subprojekte unterteilt, um bei einem System dieser Größenordnung (der AEIOU-Server umfasst eine Datenmenge von rund 10 Gigabyte) die Übersichtlichkeit wahren zu können. Das AEIOU-System enthält neun Subprojekte, auch Alben genannt. Sechs dieser Alben, die am IICM basierend auf Hyperwave entwickelt wurden, werden in Abbildung 2 gezeigt. 12 AEIOU UND MULTIMEDIA Gliederung von AEIOU in Alben Abbildung 2: Sechs Alben des AEIOU-Systems Nachfolgend sind diese Alben kurz beschrieben: Österreich-Lexikon: Die Online-Version des Österreich-Lexikons mit ungefähr 13.000 Stichwörtern und 2000 Abbildungen. Musik-Album: Ein Streifzug durch die österreichische Musikgeschichte mit etwa 150 Tonbeispielen und geschichtlichen Hintergründen. Bilderalbum: Ein Auszug der Kunst-Datenbank des Institutes für mittelalterliche Realienkunde und der frühen Neuzeit der Österreichischen Akademie der Wissenschaften. 13 AEIOU UND MULTIMEDIA Gliederung von AEIOU Multimedia in Alben Video-Album: Eine Sammlung von rund 360 Videosequenzen aus Geschichte und Kultur Österreichs. Briefmarken-Album: Alle von der österreichischen Post in den Jahren 1986 bis 1996 herausgegebenen Sonderbriefmarken. Foto-Album: Über 1.500 Fotografien von den schönsten Plätzen Österreichs aus dem Archiv der Österreich Werbung, die aus der vom IICM entwickelten Bildersammlung Ein Digitales Reiseerlebnis übernommen wurden. Zusätzlich von der Einstiegsseite aus erreichbare Subprojekte stellen ein Album über den Psychologen Sigmund Freud, eine Auswahl österreichischer Designerkunst sowie Links zu anderen Informationsanbietern (Österreich-Online-Modul) zur Verfügung. Der Vorteil dieses modularen Aufbaus ist, dass dem AEIOU-System jederzeit weitere Alben zusätzlich eingebunden werden können sowie dass eine Erweiterung der bestehenden Alben ohne Schwierigkeiten vorgenommen werden kann. Das zugrundegelegte Hyperwave gewährleistet auch dabei durch eine seiner speziellen Eigenschaften die Wahrung der Linkkonsistenz. Das Kernstück dieser sechs Alben sowie des gesamten Systems stellt die elektronische Implementation des Österreich-Lexikons dar. Doch für die Betrachtungen in dieser Arbeit sind das Videoalbum und das Musikalbum mit vielen Tonbeispielen aus der Musikgeschichte unserer Heimat von Bedeutung. Genauere Betrachtungen der übrigen 4 Alben können der Arbeit von Michael Hollauf [HOLLAUF97] entnommen werden. 2.3 Multimedia Multimedia in Bezug auf das Internet bedeutet die digitale Integration unterschiedlicher Medien in bereitgestellte HTML3-Seiten. Diese eingebundenen Medien (Dateien) werden als Multimedia-Objekte bezeichnet und können Textdateien, Grafiken oder Bilder, Animationen, Musikstücke oder auch Videoclips enthalten. Ein Beispiel für die Kombination mehrerer unterschiedlicher Medientypen - in diesem Fall Text, Bilder und Links4 auf Videoclips - kann in nachfolgender Abbildung 3 gefunden werden. Die Schritte, die nötig sind, um eine derartige Seite zu erhalten, also die Erstellung der HTML-Seite und die Generierung der benötigten Multimedia-Dateien, werden weiter unten erklärt. Texte in diese Dokumente einzubinden, bringt im Allgemeinen keinerlei Schwierigkeiten mit sich und wird deshalb in dieser Arbeit nicht näher erklärt. Auch Bilder in den unterschiedlichsten Formaten, allen voran GIF (Graphics Interchange Format) und JPEG (Joint Photographic Experts Group), werden bereits seit einiger Zeit im Internet verbreitet und verwendet. Deshalb wird in dieser Arbeit auch nicht weiter auf Standbild-Formate eingegangen, sondern das Augenmerk eher auf die neueren multimedialen Möglichkeiten, wie Audio- und Video-Clips, gelegt. 3 HTML heißt „Hyper Text Markup Language“ und ist die im World Wide Web verwendete DokumentenBeschreibungssprache. HTML unterstützt Hyperlinks. 4 Links (oder Hyperlinks) sind direkt ausführbare Verweise auf andere Dokumente. 14 AEIOU UND MULTIMEDIA Multimedia Abbildung 3: Ein Blick auf das Videoalbum des AEIOU-Projektes 2.4 Bewertungskriterien Für die beiden im Folgenden betrachteten Alben, das Musik- und das Video-Album, war es nötig, Audio- und Videoclips zu erzeugen und diese im System bereitzustellen. Dabei erhob sich die Frage, in welchem Format diese Clips bereitgestellt werden sollten, das heißt, welches der zur Verfügung stehenden Formate für die geplante Verwendung im Internet am besten geeignet ist. Aus diesem Grund wurde eine umfangreiche Testreihe durchgeführt, im Zuge derer die vielversprechendsten Formate verglichen und bewertet werden sollten. Die Kriterien für diese Bewertung (Kompression und Bildqualität) sind in den folgenden Abschnitten kurz erklärt. 2.4.1 Kompression Bei der Kompression handelt es sich um ein Verfahren um große Datenmengen, wie sie beispielsweise bei der Erstellung von Video- oder Audiodaten entstehen, zu reduzieren. Man unterscheidet dabei verlustfreie („lossless“) Kompression und verlustbehaftete („lossy“) 15 AEIOU UND MULTIMEDIA Bewertungskriterien Kompression. Bei der verlustfreien Kompression werden nur Daten entfernt, die redundante Informationen enthalten. Daher können die Daten beim Entkomprimieren, dem umgekehrten Vorgang zur Komprimierung, wieder vollständig hergestellt werden. Da digitale Videos so sehr oft zu Dateimonstern mutieren, wird bei der Videokompression im Allgemeinen die verlustbehaftete Kompression verwendet. Wie der Name schon sagt, gehen dabei Informationen unwiederbringlich verloren und können bei der Dekompression nicht wiederhergestellt werden. Doch trotz der auftretenden Datenverluste ist die Kompression vor allem für Videodaten nicht wegzudenken. Zwar sind die Kapazitäten der erhältlichen Datenträger schon erheblich groß, aber sie sind noch immer beschränkt und werden dies wohl auch bleiben. Zudem ist zu beachten, dass nicht nur der Betreiber einer Web-Site Probleme mit großen Datenmengen bekommen kann, sondern auch der Internet-Benutzer, der sich diese Informationen durchsehen oder sogar herunterladen möchte. 2.4.2 Bildqualität Die zuvor angesprochenen Verluste führen nun zum zweiten, ebenso wichtigen Bewertungsmaß. Unter den Platzsparmaßnahmen sollte die Bildqualität nicht allzu sehr leiden, da man sonst zwar nur wenig Speicherplatz benötigt, um die Audio- und Videodateien abzulegen, man diese aber genauso gut gleich wieder löschen könnte, da sie ohnehin niemand anschauen möchte. 2.5 Arbeitsumgebung In den in den Jahren 1996 und 1997 durchgeführten Studien wurden folgende Formate und Verfahren betrachtet und bewertet: • • Audio o o o o Microsoft Waveform (WAV) Real Audio (RA, RM) Vivo Active (VIV) MPEG1 Audio Layer III (MP3) Video o o o o o Audio Video Interleave (AVI) Apple QuickTime Movie (MOV) Motion Picture Expert Group (MPEG) Real Video (RV, RM) Vivo Active (VIV) Die Testumgebung bildete ein Standard PC Pentium 133 in nachstehender Konfiguration (siehe Tabelle 1). 16 AEIOU UND MULTIMEDIA Arbeitsumgebung Tabelle 1: Konfiguration der Arbeitsumgebung Prozessor (CPU) Hauptspeicher (RAM) Festplatte (HB) Soundkarte Grafikkarte Pentium 133 MHz 32 MB IBM DCAS 4,2 GB SCSI 16bit ISA Standard VGA 2MB RAM Extras Miro DC20 Videoschnittkarte Philips S-VHS Videorecorder S-VHS Videokabel Audiokabel Optibase MPEG 4000 Encoder-Karte Optibase PCMotion Pro Decoder-Karte 17 3. AEIOU und Musik Kapitel 3 AEIOU und Musik AEIOU UND MUSIK Einleitung Dieses Kapitel zeigt nach einer kurzen Einleitung mit allgemeinen Betrachtungen zum Thema AEIOU und Musik die Ergebnisse der in den Jahren 1996 und 1997 durchgeführten Evaluierungen der Audioformate WAV (Abschnitt 3.2), Real Audio (Abschnitt 3.3), Vivo Active (Abschnitt 3.4) und MP3 (Abschnitt 3.5). Zu diesem Zweck werden in den jeweiligen Abschnitten zunächst die Formate selbst erklärt. Darauf folgt die Beschreibung der Generierung von Sequenzen in diesen Formaten sowie die Einbindung derartiger Sequenzen in bestimmte HTML-Seiten. Danach werden die Ergebnisse der Untersuchungen und die Eignung des jeweiligen Formates für einen eventuellen Einsatz im AEIOU-Projekt beleuchtet. 3.1 Einleitung Das Musik-Album des AEIOU-Systems enthält ungefähr 150 Tonbeispiele aus der Musikgeschichte Österreichs inklusive geschichtlichem Hintergrund und Partiturauszügen. Der Einstieg in die Musikgeschichte ist in Abbildung 4 zu sehen. Abbildung 4: Der Einstieg in die Musikgeschichte Die für dieses Album ausgewählten Musikbeispiele lagen dem AEIOU-Team in Form von DAT-Bändern vor und mussten für die Archivierung sowie für die Bereitstellung auf dem AEIOU-Server in verschiedene, dafür geeignete Audioformate konvertiert werden. Zusätzlich 19 AEIOU UND MUSIK Einleitung zur Umwandlung in die digitale Form mussten einige Clips auch noch etwas nachbearbeitet werden. So wurden manche Musikpassagen geschnitten und die Beispiele mit einem Fade-In5 und einem Fade-Out 6 versehen. Die Zeiten, in denen vom Personal Computer nur leises Piepsen zu hören war, sind schon seit langem vorbei. Heute gehören eine gute Soundkarte und entsprechend leistungsstarke Lautsprecher bereits zur Standardausrüstung der meisten PC-Benutzer. Wenn diese Benutzer mit ihren Maschinen im Internet nach Informationen suchen und dabei auf Audio-Clips stoßen, erwarten sie auch ein gewisses Maß an Qualität bei diesen Musikstücken. Doch womit kann dieses Maß an Qualität sichergestellt werden? Mit welchen Formaten kann man erreichen, dass die Zufriedenheit der Internet-Benutzer möglichst hoch ist, und sie zum einem erneuten Besuch auf der Web-Site animiert werden oder gar die URL7 an Freunde und Bekannte weitergeben? Was muss gemacht werden, damit die vorgesehene Botschaft die Person am anderen Ende der Internet-Leitung erreicht und anspricht? Grundsätzlich kann davon ausgegangen werden, dass hauptsächlich die Tonqualität dafür ausschlaggebend ist, welche Akzeptanz die Musikstücke erreichen. Doch bei der Verwendung im Internet ist dieses Kriterium nicht unbedingt ausreichend. So empfinden es Anwender im Allgemeinen nicht als positiv, wenn ein Audioclip zwar einen reinen Klang hat und vielleicht sogar Stereo unterstützt, dabei aber die Wartezeit, bis man diesen Clip auch anhören kann, durch lange Downloads ein fast unerträgliches Ausmaß annimmt. Daraus ist zu schließen, dass gute Qualität allein nicht alles ist, sondern dass auch die Dateigröße eine nicht unbedeutende Rolle spielt. Auch ist Audio-on-demand im Internet beinahe schon allgegenwärtig, das heißt, beim Download von beliebigen Musikclips kann der User selbst wählen, welcher Teil für ihn von Interesse ist. Es ist dabei z.B. nicht mehr nötig, sich eine 30-Minuten lange Nachrichtensendung zur Gänze anzuschauen, wenn man sich nur über die neuesten Meldungen und Entdeckungen im Bereich der Technik informieren möchte. Um dies realisieren zu können, ist eine Bereitstellung eines kontinuierlichen Datenstromes erforderlich, wofür allerdings das Internet nicht entworfen wurde. Denn das Internet verfolgt zwei verschiedene Strategien, um Daten zu verschicken. Diese sind: • • So schnell wie möglich, jedoch ohne Verlässlichkeit zu garantieren (UDP8-Protokoll): UDP stellt einen Fluss von Audio-Paketen zur Verfügung, ohne eine signifikante Verzögerung zu verursachen. Diese Methode bringt unglücklicherweise die Gefahr mit sich, dass gelegentlich Pakete verloren gehen. Wird die Rate an verlorenen Paketen zu hoch, ist an eine gute Übertragung von Audiodaten nicht zu denken. Verlässlich und hoffentlich schnell genug (TCP9-Protokoll): Im Gegensatz zu UDP ist TCP erheblich verlässlicher, da bei Ausfall von Datenpaketen versucht wird, diesen durch erneutes Senden der betroffenen Pakete zu kompensieren. Bei hoher Verlustrate sendet TCP mehrmals Information vom Server zum Client und wartet dabei jedes Mal auf die entsprechende Empfangsbestätigung, wodurch bei dieser Methode zwar keine wirklichen Ausfälle, jedoch teilweise erhebliche Verzögerungen auftreten können. 5 Stetige Erhöhung der Lautstärke von Null ausgehend bis zu der Normal-Lautstärke Stetige Reduktion der Lautstärke von der Normal-Lautstärke ausgehend bis Null 7 URL bedeutet Uniform Resource Locator. Dies ist die Adresse, die den genauen Standort eines HTML-Textes, einer Web-Site, einer Grafik oder ähnliches bezeichnet. 8 UDP bedeutet User Datagram Protocol 9 TCP bedeutet Transmission Control Protocol. 6 20 AEIOU UND MUSIK Microsoft Waveform (WAV, WAVE) Dieser Abschnitt liefert zunächst eine Beschreibung des Waveform-Formates. Im Anschluss daran wird die Erzeugung von Sequenzen im Waveform-Format genauer erklärt und deren Anwendung in einer HTML-Seite gezeigt. Danach werden die Stärken und Schwächen dieses Formates näher beleuchtet und die in den Untersuchungen erzielten Ergebnisse bezüglich Kompression und Tonqualität kommentiert. 3.2 Das Audioformat Microsoft Waveform (WAV, WAVE) Wie der Name schon andeutet, wurde das WAVE-Format von Microsoft entwickelt. Es handelt sich dabei um eine Untermenge der ebenfalls von Microsoft entwickelten RIFFSpezifikation (Ressource Interchange File Format) zur Speicherung von Multimedia-Dateien, also Audio- und Video-Clips. Endian Datei-Offset (bytes) 0 groß Feldname Feldgröße (bytes) Segment-ID 4 “RIFF” Segment-Beschreibung Segment-Größe 4 Das hier betrachtete „WAVE“Format erfordert die beiden Untersegmente „fmt“ und „data“ Format 4 Untersegment 1 – ID 4 Untersegment 1 – Größe 4 Audioformat 2 Anzahl der Kanäle 2 4 klein 8 groß 12 groß 16 klein 20 klein „fmt“ – Untersegment 22 klein 24 klein Sample-Rate 4 Byterate 4 Blockausrichtung 2 Bits pro Sample 2 Untersegment 2 – ID 4 beschreibt das Klanginformation Untersegment Format der im Daten- 28 klein 32 klein 34 klein 36 groß „data“ – Untersegment 40 klein Untersegment 2 – Größe 4 Daten Untersegment 2 – Größe 44 Klein zeigt die Größe der Klanginformation an und enthält die eigentlichen Klangdaten. Abbildung 5: Die kanonische Form des RIFF-Formates 21 AEIOU UND MUSIK Microsoft Waveform (WAV, WAVE) Eine RIFF-Datei besteht aus einem Dateikopf („file header“), dem eine Reihe von Datensegmenten („data chunks“) folgt. Eine WAVE-Datei ist oft eine RIFF-Datei, die nur ein einzelnes, aus zwei Untersegmenten bestehendes „WAVE“-Segment besitzt. Diese beiden Untersegmente sind ein Format-Segment („fmt chunk“), welches das Datenformat beschreibt, und ein Daten-Segment („data chunk“), das die aktuellen Sample-Daten beinhaltet. Diese Form einer RIFF-Datei wird in der folgenden Kurzübersicht als kanonische Form („Canonical form“) bezeichnet (siehe Abbildung 5). Eine ausführliche Beschreibung des RIFF- sowie des WAV-Formates, die hier anzuführen den Rahmen dieser Arbeit sprengen würde, kann im MSDN (Microsoft Developer Network, URL: http://msdn.microsoft.com) gefunden werden. Das kanonische WAVE-Format beginnt, wie in obiger Grafik zu sehen ist, mit dem RIFFDateikopf: 0 4 Segment-ID 4 4 Segment-Größe 8 4 Format Enthält die Buchstabefolge RIFF im ASCIIFormat (0x52494646 big-endian Format) 36 + Größe des 2. Segmentes, oder genauer: 3 + (8 + Größe des 1. Segmentes) + (8 + Größe des 2. Segmentes) Dies ist die Größe des restlichen Segmentes, das dieser Zahl nachfolgt, das heißt, die Größe der gesamten Datei minus 8 Bytes für die ersten beiden Felder (Segment-ID, SegmentGröße), die hier nicht mitgerechnet werden. Enthält die Buchstabenfolge WAVE (0x57415645 big-endian Format) Im Anschluss daran besteht das WAVE-Format aus zwei Untersegmenten: “fmt” und “data”. Das erste der beiden („fmt“) beschreibt das Format des zweiten („data“): 12 4 Untersegment-ID 1 16 4 Untersegment-Größe 1 20 2 Audio-Format 22 24 2 4 Anzahl der Kanäle Sample-Rate 28 4 Byterate 32 2 Blockausrichtung 34 2 Bits je Sample Enthält die Buchstabenfolge „fmt“ (0x666d7420 big-endian Format) 16 für PCM (puls code modulation). Diese Zahl gibt die Größe des restlichen Untersegmentes an. PCM = 1 (i.e. Lineare Quantisierung). Werte an dieser Stelle, die von 1 abweichen, zeigen eine eventuelle Kompression an. Mono = 1, Stereo = 2 8000, 44100, etc. Diese Zahlenwerte repräsentieren die Sample-Rate in Hertz (Hz). Sample-Rate * Anzahl der Kanäle * Bits je Sample / 8 Anzahl der Kanäle * Bits je Sample / 8 Diese Zahl gibt die Anzahl der Bytes für ein Sample (inklusive aller Kanäle) an. 8 bits = 8, 16 bits = 16, etc. Zu guter Letzt enthält das Daten-Untersegment („data“) die Größe der Daten sowie die eigentlichen Musik- (oder Klang-) Daten selbst: 22 AEIOU UND MUSIK Microsoft Waveform (WAV, WAVE) 36 4 Untersegment-ID 2 40 4 Untersegment-Größe 2 44 * Daten 3.2.1 Enthält die Buchstabenfolge „data“ (0x64617461 big-endian Format) Anzahl der Samples * Anzahl der Kanäle * Bits je Sample / 8 Diese Zahl repräsentiert die Anzahl der Bytes, aus denen die Klangdaten bestehen. Ab hier kommen die eigentlichen Klangdaten Generierung von Sequenzen im Waveform-Format Die Systemvoraussetzungen für die Erzeugung von Wave-Dateien sind sowohl bezüglich Hardware als auch bezüglich Software gering. Wie eingangs schon erwähnt, wurden die Untersuchungen zu dieser Arbeit auf einem Pentium mit 133 MHz durchgeführt. Die Ergebnisse haben dabei gezeigt, dass die Ausstattung mit 32 MB Hauptspeicher und einer Standard-Soundkarte ausreichend ist. Als Eingabegerät kann jedes beliebige Audiogerät mit einem Audioausgang, also zum Beispiel ein CD-Player, DAT-Player oder, falls man selbst singen oder einen Vortrag halten möchte, auch ein Mikrofon, verwendet werden. Der Ausgang dieses Gerätes muss mit einem entsprechenden Kabel mit dem Line-In-Eingang (meist eine Stereo-Klinke 3,5 mm) der Soundkarte verbunden werden. Da die Musikstücke für das Projekt AEIOU in Form von DAT-Bändern vorlag, wurde als Eingabegerät ein DAT-Player verwendet. Um diesen Clip nun im WAVE-Format zu erhalten, müssen folgende Schritte ausgeführt werden: § Sound-Recorder (siehe Abbildung 6) über das Windows-Startmenü starten. Abbildung 6: Der Audiorecorder § Aufnahmequalität auswählen • Über Bearbeiten/Audioeigenschaften (Edit/Audio Properties) wird ein neues Dialogfenster (Abbildung 7) geöffnet. In der unteren Fensterhälfte ist unter dem Punkt Aufnahme ein Schieberegler zu sehen, mit dessen Hilfe die Lautstärke der Aufnahme zwischen den Werten 0 und 100 (in Prozent) eingestellt werden kann. Für eine gute Aufnahme sollte dieser Regler in etwa in die Mitte gesetzt oder auf maximal 75% eingestellt sein. 23 AEIOU UND MUSIK • § § § § Microsoft Waveform (WAV, WAVE) Über die in Abbildung 7 sichtbare Schaltfläche Anpassen (Adjust) wird ein weiteres Dialogfenster aktiviert (Abbildung 8). In diesem kann durch Auswählen der Parameter Format und Attribute (dazu gehören die SampleRate und die Bitrate) die Klangqualität eingestellt werden. Nachdem beide Dialoge, jeweils durch Drücken auf die Schaltfläche OK, geschlossen wurden, das Eingabegerät auf Wiedergabe schalten. Am Beginn des gewünschten Ausschnittes den Recorder durch Drücken auf die Schaltfläche auf Aufnahme schalten. Am Ende der Sequenz die Aufzeichnung des Soundrecorders stoppen ( ). Im Datei-Menü den Menüpunkt Speichern wählen und die neu digitalisierte Sequenz als Datei im „WAV“-Format speichern. Abbildung 7: Festlegen der Audioeigenschaften 24 AEIOU UND MUSIK Microsoft Waveform (WAV, WAVE) Abbildung 8: Anpassen der Audioqualität 3.2.2 Integration von Waveform-Sequenzen in eine HTML-Seite Nachdem nun eine Datei in dem gewünschten Format vorliegt, muss sie, damit sie ihrem angedachten Verwendungszweck dienen kann, noch in die entsprechende HTML-Seite integriert werden. Zunächst sollte die Audiodatei (z.B. Jupiter.wav) auf den Server gespielt werden, und zwar in ein Verzeichnis, in das vom Internet aus zugegriffen werden kann. Für das folgende Beispiel wird angenommen, dass ein solches Verzeichnis mit dem Namen audio auf dem Server existiert und sich direkt unterhalb des Verzeichnisses befindet, in dem die HTML-Seiten abgelegt sind. Ein Internet-Benutzer kann auf diese Datei auf 2 verschiedene Arten zugreifen: • • durch direkte Eingabe der Adresse der www.domain.at/audio/Jupiter.wav) oder über einen entsprechenden Link innerhalb einer HTML-Seite. Tondatei (z.B.: Bei Direkteingabe der Adresse müsste der zugreifende Benutzer die vollständigen Namen und Verzeichnispfade aller Audiodateien wissen, die er sich anhören möchte. Dies ist eher unwahrscheinlich und unpraktisch, aus diesem Grund ist der zweite Weg, also das Anbieten einer HTML-Seite mit dem Link auf das Musikstück, vorzuziehen. Wie eine solche aussehen könnte, wird in Abbildung 9 gezeigt. Um dieses Aussehen zu erhalten, ist folgender HTMLCode notwendig. Es handelt sich dabei nur um einen Auszug der wesentlichen Teile des Source-Codes, die für die Funktionsweise nicht wichtigen Textzeilen wurden ausgelassen. <HTML> <HEAD> <TITLE>Jupiter-Symphonie</TITLE> </HEAD> <BODY> <H2>Wolfgang Amadeus Mozart:<I> Jupiter-Symphonie</I></H2> <TABLE> <TR> <TD> <A HREF="/images/Jupiter.jpg"> <IMG SRC="/images/Jupiter.jps" BORDER=1> </A> Wolfgang Amadeus Mozart (1756 Salzburg - 1791 Wien) …. </TD> 25 AEIOU UND MUSIK Microsoft Waveform (WAV, WAVE) </TR> </TABLE> <TABLE> <TR> <TD VALIGN=CENTER><IMG SRC="/images/ic_sound.gif"></TD> <TD VALIGN=CENTER> <B>Qualität</B>: <A HREF="/audio/Jupiter.wav">Höher</A> </TD> </TR> </TABLE> </BODY> </HTML> Abbildung 9: Beispiel einer HTML-Seite mit Link auf Audiodateien 3.2.3 Ergebnisse Mit Microsoft Waveform liegt ein sehr leistungsfähiges Format vor. Vor allem die große Auswahl an möglichen Qualitätsstufen (siehe Tabelle 2 auf der nächsten Seite) bei der Aufnahme eröffnet ein breites Verwendungsfeld. Die „schwächeren“ Wahlmöglichkeiten dieses Auswahl-Spektrums, jene unterhalb einer Bitrate von 16 KB/sec sowie unterhalb einer Sample-Rate von 22 kHz können jedoch nur bedingt empfohlen werden. Sie zeichnen sich zwar einerseits durch einen sehr geringen Bedarf an Speicherplatz aus, was sich durchaus positiv auf die Wartezeit für den Benutzer bei einem eventuellen Herunterladen der Datei auswirkt. So benötigt zum Beispiel ein 30 Sekunden langes Musikstück nur in etwa 240 KB Speicherplatz (bei Verwendung der Parameter in Zeile 1 der Tabelle 2). Andererseits ist echter Hörgenuss hier nur schwer zu finden, wodurch für diese Einstellungen nur ein Verwendungsfeld übrigbleibt, wo die Schwächen und die Verluste nicht allzu schwerwiegend ins Gewicht fallen. Ein Beispiel für ein derartiges Einsatzgebiet ist etwa das Digitalisieren 26 AEIOU UND MUSIK Microsoft Waveform (WAV, WAVE) von Reden, da auf diesem Gebiet nur die Verständlichkeit der Sprache, nicht jedoch die Raumwirkung oder die Klangreinheit von Bedeutung ist. Soll der gewünschte Clip auch Musik enthalten und diese gegenüber dem Original nicht zu hohe Verluste aufweisen, ist von einer Verwendung der Varianten in den Zeilen 1 bis 15 der Tabelle 2 Abstand zu nehmen. Akzeptable Qualität bei erträglich hohem Anstieg an Platzund Download-Zeitbedarf bringen die Kombinationen im mittleren Abschnitt der Tabelle 2 (Zeilen 16 bis 27). Mit der Einstellung von 24 kHz für die Sample-Rate bei einer Bitrate von 16 Bits/Sample in Stereo werden schon brauchbare Ergebnisse erzielt. Die Dateigröße steigt für das oben genannte Musikstück von 30 Sekunden Spieldauer schon merklich an, sie beträgt immerhin bereits 2,7 MB. Trotzdem kann noch nicht unbedingt von einer Verschwendung des Speicherplatzes gesprochen werden. Tabelle 2: Qualitätsstufen des Waveform-Formates Sample-Rate (kHz) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 8 8 8 8 11,025 11,025 11,025 11,025 12 12 12 12 16 16 16 16 22,050 22,050 22,050 22,050 24 24 24 24 32 32 32 32 44,100 44,100 44,100 44,100 48 48 48 48 Bits/Sample 8 8 16 16 8 8 16 16 8 8 16 16 8 8 16 16 8 8 16 16 8 8 16 16 8 8 16 16 8 8 16 16 8 8 16 16 27 Mono/Stereo Mono Stereo Mono Stereo Mono Stereo Mono Stereo Mono Stereo Mono Stereo Mono Stereo Mono Stereo Mono Stereo Mono Stereo Mono Stereo Mono Stereo Mono Stereo Mono Stereo Mono Stereo Mono Stereo Mono Stereo Mono Stereo KB/Sekunde 8 16 16 31 11 22 22 43 12 23 23 47 16 31 31 63 22 43 43 86 23 47 47 94 31 63 63 125 43 86 86 172 47 94 94 188 AEIOU UND MUSIK Microsoft Waveform (WAV, WAVE) Die wahre Stärke von WAV-Dateien liegt allerdings nicht in der direkten Verbreitung der Sound-Dateien im Internet, sondern eher in der „indirekten“. Damit ist gemeint, dass sich dieses Format unter anderem hervorragend zur Archivierung von Tondokumenten eignet. Außerdem bietet es eine gute Datenquelle für die Erzeugung von Audio-Clips in anderen Formaten (wie zum Beispiel Real Audio, wird in einem späteren Kapitel behandelt). Dafür werden die unteren Zeilen der obenstehenden Tabelle als Parameterschema interessant, da mit diesen die besten Ergebnisse in Bezug auf Qualität und Klangreinheit erzielt werden. Die Größe der jeweiligen Dateien erreicht nun aber mit 5,6 MB bei 48 kHz Sample-Rate und einer Bitrate von 16 Bits/Sample in Stereo Werte, die das Herunterladen einer solchen Datei nicht gerade empfehlen. Denn wer wartet schon gerne 20 Minuten für nur 30 Sekunden Hörvergnügen, wenn das Herunterladen der Datei über ein Modem mit einer Übertragungsrate von 28.8 Kbps erfolgt. Für die Archivierung von Tondokumenten und auch für die Konvertierung in andere Audioformate spielt dieser Umstand jedoch keine Rolle. Bei letzterem ist sogar die höchstmögliche Einstellung (siehe letzte Zeile in der Tabelle 2) vorzuziehen, da dadurch die Verluste beim Digitalisieren gering gehalten werden. Zudem besteht noch die Möglichkeit, bei Bedarf die Ausgabequalität beim Umwandeln über die entsprechenden Encoder einzuschränken, falls die gegebenen Voraussetzungen wie eine langsame Internet-Verbindung oder verfügbarer Speicherplatz dies erfordern. Encoder, also Werkzeuge zum Aufnehmen von Audio-Clips oder zum Umwandeln dieser Clips in andere Formate, die WAV-Dateien als Datenquelle akzeptieren, sind für fast alle anderen Formate erhältlich. Somit wird das Microsoft Waveform-Format auch in Zukunft oft Verwendung finden. 28 AEIOU UND MUSIK Real Audio Nach einer kurzen allgemeinen Betrachtung des Real Audio-Formates zeigt dieser Abschnitt die Generierung von Real Audio-Clips sowie deren Anwendung in einer HTML-Seite. Danach werden die Stärken und Schwächen dieses Formates näher beleuchtet und die in den Untersuchungen erzielten Ergebnisse bezüglich Kompression und Tonqualität kommentiert. 3.3 Das Audioformat Real Audio Herkömmliche Lösungsansätze sind nicht sehr gut geeignet, um Audio-On-Demand realisieren zu können, da sie meist große Probleme haben, zeitkritische Daten verlustfrei und kontinuierlich zu übertragen. Aus diesem Grund versuchte die Firma Real Networks einen anderen Weg und entwarf in den Jahren 1994 und 1995 das Real Audio Protokoll und die Real Audio Client/Server Architektur. Dieser Technologie wurde ein neues Protokoll zugrunde gelegt, welches, im Gegensatz zu den bis dahin schon bestehenden Protokollen, bidirektionale Kommunikation zwischen Client und Server unterstützt, wodurch Funktionen wie Pause, schneller Vorlauf und Rücklauf möglich sowie das Springen zu bestimmten Teilen des Programms schnell und zuverlässig werden sollten. Das Real Audio System, und damit das Real Audio Protokoll, unterstützt TCP und UDP, wobei die besseren Ergebnisse meist über UDP erreicht werden. Die Ursache dafür ist, dass UDP in einem großen Teil der Fälle eine kontinuierliche Präsentation der Audiodaten gewährleistet. Um eventuell auftretende Paketverluste und die daraus resultierenden Ausfälle im Audio-Stream ausgleichen zu können, wurde zusätzlich ein relativ leistungsfähiges Korrektursystem entwickelt, das im Wesentlichen die Auswirkungen der Paketverluste minimieren soll und so den Client in die Lage versetzen soll, das ihm fehlende Stück zu ersetzen. Leider ist es hier nicht möglich, eine Beschreibung über die verwendeten Dateiformate und Kompressionsmethoden anzugeben, da sich Real Networks dahingehend mehr als bedeckt halten. Daher bleibt an dieser Stelle nur, die mit Real Audio erzielbaren Ergebnisse zu untersuchen. 3.3.1 Generierung von Sequenzen im Real Audio-Format Für die Erzeugung von Real Audio-Dateien sind wie für Waveform-Dateien keine High-EndGeräte erforderlich. Laut Angabe von Real Networks reicht ein PC 486 mit 8 MB Hauptspeicher bereits aus. Trotzdem ist die Verwendung mindestens eines Pentium mit 90 MHz und 16 MB Hauptspeicher zu empfehlen, um die für die Konvertierung benötigte Rechenzeit gering zu halten. Aber für den aktuellen Stand der Technik sind diese Werte ohnehin nur noch als Substandard zu betrachten. Erzeugt werden Real Audio-Clips mit dem bei Real Networks erhältlichen Encoding-Tool (bis 1998: Real Audio Encoder, ab 1998: Real Producer). Für die Tests, die im Rahmen dieser Arbeit durchgeführt wurden, fand die Version 3.0 dieser 32-Bit Anwendung, die für Windows 95/98, Windows NT und auch in einer Macintosh PowerPC-Version erhältlich war, Verwendung. Externe Eingabegeräte werden nicht mehr benötigt, da der Encoder 8- und 16Bit Audioaufnahmen in Mono und Stereo der Formate *.wav (Microsoft Waveform), *.pcm, *.au (Soundformat, dass auf Sun-Computern verwendet wird) und *.snd unterstützt. Da keine Dekompressoren für diese Eingabeformate im Encoder enthalten sind, müssen die 29 AEIOU UND MUSIK Real Audio Quelldateien in unkomprimierter Form vorliegen oder mittels eigener Tools, die für beinahe alle Plattformen erhältlich sind, vor der Weiterverarbeitung dekomprimiert werden. Stehen geeignete Dateien zur Verfügung, können daraus durch die Ausführung folgender Arbeitsschritte Real Audio-Dateien erzeugt werden: § § § § § § Real Audio Encoder über das Windows Startmenü starten. Der Konverter präsentiert sich mit der in Abbildung 10 gezeigten Ansicht. Durch Eingabe des vollständigen Pfades oder durch Wahl über die Schaltfläche Browse die gewünschte Quelldatei auswählen. Anschließend die Ausgabedatei, ebenfalls durch Eingeben oder über Browse festlegen. Die Ausgabedatei erhält üblicherweise die Erweiterung „.ra“ oder „.rm“ Nun muss unter dem Punkt Compression die gewünschte Kompressionsart gewählt werden. Eine Aufstellung aller möglichen Kompressionseinstellungen erfolgt später. Zusätzlich besteht noch die Möglichkeit, Informationen über Titel, Autor und Copyright-Inhaber des digitalisierten Clips in den entsprechenden Feldern einzutragen. Diese werden mit den Tondaten in der Datei gespeichert und beim Abspielen über einen Real Audio Player angezeigt. Danach kann durch Drücken auf die Schaltfläche Start Encoding der Konvertierungsvorgang gestartet werden. Dieser Vorgang wird nach Umrechnung der gesamten Datei automatisch beendet oder kann durch Drücken der Taste Stop Encoding vorzeitig abgebrochen werden. Abbildung 10: Der Real Audio Encoder v3.0 30 AEIOU UND MUSIK 3.3.2 Real Audio Integration von Real Audio-Sequenzen in eine HTML-Seite In HTML-Seiten werden die erstellten Audiodateien analog zu der für die Integration von Microsoft Waveform-Dateien geschilderten Vorgehensweise eingebaut. Wie diese müssen sie auf dem Server in einem bestimmtes Verzeichnis abgelegt und durch den entsprechenden Link referenziert werden. Auf diese Weise haben Internet-Benutzer die Möglichkeit, die Clips lokal auf ihren Rechner zu laden und danach abzuspielen. Soll dem Benutzer auch das Streaming-Feature10 zur Verfügung gestellt werden, ist eine etwas abgeänderte Vorgehensweise anzuwenden. Erstens muss dazu die Datei auf einem Server abgelegt werden, wo auch ein Real Audio-Server installiert ist. Zweitens ist zu beachten, dass der Link nicht direkt auf die Real Audio-Datei gelegt wird, sondern auf ein Real Media-Metafile. Der nachfolgend angeführte HTML-Code zeigt die Seite aus dem vorangegangenen Beispiel, diesmal aber mit einer Real Audio-Datei anstelle des zuvor verwendeten Waveform-Clips. Sollen die Clips auf einem Server bereitgestellt werden, der Streaming nicht unterstützt, so ist anstelle des Links auf die Metadatei *.ram der direkte Link auf die Audiodatei zu setzen. <HTML> <HEAD> <TITLE>Jupiter-Symphonie</TITLE> </HEAD> <BODY> <H2>Wolfgang Amadeus Mozart:<I> Jupiter-Symphonie</I></H2> <TABLE> <TR> <TD> <A HREF="/images/Jupiter.jpg"> <IMG SRC="/images/Jupiter.jps" BORDER=1> </A> Wolfgang Amadeus Mozart (1756 Salzburg - 1791 Wien) …. </TD> </TR> </TABLE> <TABLE> <TR> <TD VALIGN=CENTER><IMG SRC="/images/ic_sound.gif"></TD> <TD VALIGN=CENTER> <B>Qualität</B>: <A HREF="/audio/Jupiter.ram">Höher</A> </TD> </TR> </TABLE> </BODY> </HTML> Die Datei “Jupiter.ram”, auf die der Hyperlink gesetzt ist, besteht nur aus einer Zeile, in der die virtuelle Adresse der entsprechenden Sounddatei angegeben ist: http://www.aeiou.at/aeiou/Jupiter.ra 10 Streaming bedeutet, dass die gewählte Audiodatei vor der Wiedergabe auf den lokalen PC gespeichert wird, sondern direkt vom Server abgespielt wird. 31 AEIOU UND MUSIK 3.3.3 Real Audio Ergebnisse Real Audio 3.0 weist gegenüber dem WAV-Format und auch gegenüber Real Audio 2.0 ein neues, zusätzliches Feature auf, das sogenannte „Streaming“. Die ausgewählte Audiodatei muss nach dem Klicken auf den entsprechenden Link, nicht mehr vollständig auf den lokalen Datenträger geladen werden, bevor mit dem Abspielen begonnen werden kann, sondern der Clip wird „päckchenweise“ geladen und auch abgespielt. Dazu wird schon bei der Aufnahme festgelegt, über welche Internet-Anbindung der Benutzer verfügen muss und wie viel der gesamten Datei vor dem Start der Ausgabe heruntergeladen werden muss, damit der AudioStream unterbrechungsfrei wiedergegeben wird. Die Festlegung der notwendigen Verbindung und Übertragungsrate erfolgt über die Wahl des Aufnahmeformats (=Kompressionsart). Eine Aufstellung der möglichen Varianten ist in Tabelle 3 zu finden. Einige Jahre nach Abschluss dieser Untersuchungen wurde Real Audio um das sogenannte „SureStream“ erweitert. Dabei muss nicht mehr für jede gewünschte Übertragungsrate eine eigene Mediendatei erstellt werden, sondern es wird eine gemeinsame Datei generiert, die mehrere gewünschte Internetanbindungen (z.B. Modem 28.8 und LAN) unterstützt. Wenn der Benutzer auf die am Server abgelegte Datei zugreift, dann berechnet der Real Audio-Server, welche Datenübertragungsrate dem Benutzer zur Verfügung steht und passt die Qualität und die Vorladezeit für den gewählten Clip automatisch an. Das heißt, dem Benutzer wird aus der Datei jene Spur übertragen, deren Anforderungen an die Verbindung durch die Übertragungsrate auf den PC des Benutzers erfüllt werden. Für ein klagloses Funktionieren des Streamings ist neben der richtigen Aufnahme auch die Verwendung eines eigenen Real Audio-Servers auf Seiten des Anbieters erforderlich. Daraus ergeben sich Nachteile, die manchmal etwas schwerer wiegen als die Vorteile, die dieses Format mit sich bringt. Etwa werden dadurch die Kosten für die Bereitstellung von Real Audio-Dateien durch die Anschaffung der Real Audio-Serversoftware in die Höhe getrieben. Aber trotz der genannten Nachteile durfte dieses Verfahren nicht vernachlässigt werden, da es bei „herkömmlicher“ Verwendung, das heißt, wenn die Dateien vor dem Abspielen vollständig heruntergeladen werden, eine echte Alternative zu den schon seit längerem etablierten Formaten darstellte. Die erreichbare Klangqualität ist ansprechend bis ausgezeichnet. Bei Verwendung der Real Audio 2.0 Varianten sind noch merkbare Qualitätseinbußen festzustellen, vor allem der Stereo-Effekt kommt kaum zur Entfaltung. Doch mit den beiden Real Audio 3.0 Dual ISDN-Varianten ist der Unterschied zu einer qualitativ hochwertigen Quelldatei nur mehr marginal und somit kaum hörbar. Überraschend hoch sind in Anbetracht des geringen Qualitätsverlustes die erzielten Kompressionsraten. Benötigte ein Musikstück mit einer Spieldauer von 30 Sekunden im Microsoft Waveform-Format (44 kHz, 16 Bit, Stereo) noch ungefähr 4.8 MB, so begnügt sich die qualitativ vergleichbare Real Audio-Datei (Dual ISDN, Stereo) mit weniger als 300 KB. Eine kurze Gegenüberstellung der erzielbaren Kompressionsraten ist im Anschluss an Tabelle 3 zu finden. Für die hier gezeigten Beispiele wurden WAV-Dateien aus dem Projekt AEIOU als Quelldateien genommen und probeweise in das Real Audio-Format konvertiert. Dabei wurde darauf geachtet, dass die Ergebnisdatei eine zur Quelldatei vergleichbare Qualität aufweist. 32 AEIOU UND MUSIK Real Audio Tabelle 3: Qualitätsstufen von Real Audio Real Audio 2.0 – 14.4 Diese Variante ist für Aufnahmen geeignet, die nur Sprache enthalten. Um den Clip im „Life-Streaming“-Modus spielen zu können, ist mindestens eine Internet-Verbindung über Modem mit 14.4 Kbps Übertragungsrate erforderlich. Die Frequenzantwort der Aufnahme liegt bei 4.0 kHz. Bereits ein wenig Hintergrundmusik können Clips enthalten, die in dieser Einstellung aufgenommen werden. Die benötigte Übertragungsrate steigt dabei auf 28.8 Kbps. Die Frequenzantwort liegt ebenfalls bei 4.0 kHz. Real Audio 2.0 – 28.8 Real Audio 3.0 – 28.8, Mono, full response Real Audio 3.0 – 28.8, Mono, medium response Real Audio 3.0 – 28.8, Mono, narrow response Real Audio 3.0 – 28.8, Stereo Real Audio 3.0 – ISDN, Mono Real Audio 3.0 – ISDN, Stereo Real Audio 3.0 – Dual ISDN, Mono Real Audio 3.0 – Dual ISDN, Stereo Mit dieser Variante beginnen die Aufnahmearten des neuen 3.0-Formates. Damit ist bereits relativ klarer Klang bei Musikstücken erreichbar, die über ein Modem mit 28.8 Kbps ohne große Ausfälle übertragen werden können. Auf Stereoeffekt muss aber verzichtet werden. Die Frequenzantwort beträgt in diesem Fall 5.5 kHz. Ebenfalls Mono-Clips werden mit dieser Einstellung erhalten. Im Vergleich zu full response wird eine leichte Verbesserung der Klangklarheit bei Musikstücken mit Schnarrtrommeln, Becken und wenig Gesang erzielt. Die Mindestanforderung bezüglich der Internet-Anbindung für „Streaming“ ändert sich dabei nicht. Die Frequenzantwort sinkt auf 4.7 kHz. Eine weitere Verbesserung der Klangklarheit bringt narrow response mit sich, vor allem bei sprachintensiven Musikstücken und bei geräuschvollen Signalen. Wiederum wird für eine fehlerfreie Übertragung mindestens ein Modem mit 28.8 Kbps benötigt. Die Frequenzantwort beträgt 4 kHz. Grundsätzlich weist diese Variante dieselben Eigenschaften auf, wie die vorhergegangene (narrow response). Zusätzlich ist nun auch Stereoeffekt verfügbar. Diese Einstellung erfordert eine ISDN-Leitung als minimale Anbindung an das Internet, da die Übertragung sonst nicht mehr fehlerfrei erfolgen kann und Teile des Musikstückes verloren gehen. Die Frequenzantwort liegt bei 11 kHz. Auch diese für Stereoaufnahmen gedachte Variante liefert nur bei einer ISDN-Verbindung die gewünschten Ergebnisse. Die Frequenzantwort liegt bei 8 kHz. Soll bei Tonaufnahmen (Mono) optimale Qualität erreicht werden, ist diese Einstellung zu wählen. Bei geeigneter Quelle weist die Ausgabedatei beinahe CD-Qualität auf. Für eine fehlerfreie Übertragung ist allerdings ebenfalls ein ISDN-Anschluss nötig. Die Frequenzantwort beträgt 20 kHz. Nahezu die Qualität einer sehr guten Rundfunkübertragung erreichen Aufnahmen in dieser Stereo-Variante. Die Frequenzantwort liegt bei 16 kHz. Beispiel 1 (Spieldauer: 14 Sekunden) Quelle: Ziel: WAV-Format, 44.1 kHz Samplerate, 16 Bit, Stereo Dateigröße: 2584 KB Real Audio 3.0-Format, Dual ISDN, Stereo Dateigröße: 148 KB Beispiel 2 (Spieldauer: 28 Sekunden) Quelle: Ziel: WAV-Format, 44.1 kHz Samplerate, 16 Bit, Stereo Dateigröße: 4869 KB Real Audio 3.0-Format, Dual ISDN, Stereo Dateigröße: 278 KB 33 AEIOU UND MUSIK Real Audio Beispiel 3 (Spieldauer: 28 Sekunden) Quelle: Ziel: WAV-Format, 22.05 kHz Samplerate, 8 Bit, Stereo Dateigröße: 1219 KB Real Audio 3.0-Format, ISDN, Stereo Dateigröße: 139 KB Beispiel 4 (Spieldauer: 28 Sekunden) Quelle: Ziel: WAV-Format, 11.025 kHz Samplerate, 8 Bit, Mono Dateigröße: 305 KB Real Audio 3.0-Format, Modem 28.8, medium response, Mono Dateigröße: 56 KB Bei derart hohem Speicherplatzgewinn und der daraus resultierenden Verkürzung der Download-Zeit, kann eine leichte Verminderung des Hörvergnügens ohne Zweifel in Kauf genommen werden. 34 AEIOU UND MUSIK Vivo Active Nach einer kurzen allgemeinen Betrachtung des Vivo Active-Formates zeigt dieser Abschnitt die Generierung von Vivo Active-Audioclips sowie deren Anwendung in einer HTML-Seite. Danach werden die Stärken und Schwächen dieses Formates näher beleuchtet und die in den Untersuchungen erzielten Ergebnisse bezüglich Kompression und Tonqualität kommentiert. 3.4 Das Audioformat Vivo Active Aufgrund der ständig wachsenden Konkurrenz im Bereich der Audioformate kann sich ein neues Format nur noch dann durchsetzen, wenn es alle besonderen Features der Konkurrenten in verbesserter Form anbietet oder zusätzliche Funktionen einbaut. Diesem Trend schließen sich auch Vivo Software mit VivoActive an. Ähnlich wie Real Audio unterstützt auch VivoActive das Streaming Media-Verfahren. Gegenüber dem Konkurrenten wurde jedoch eine kleine Verbesserung in diesem Bereich erzielt, da kein eigener Server für das Anbieten des Life-Streamings nötig ist. Somit kann Audio-On-Demand mit VivoActive-Clips auf jedem herkömmlichen Server genutzt werden, ohne dass dabei mit Kompatibilitätsproblemen gerechnet werden muss. Auf der Client-Seite, das heißt, auf der Seite jener, die derartige Clips anhören möchten, werden Windows- und Macintosh-Systeme unterstützt, Unix-Systeme hingegen noch nicht. In Bezug auf die Gewährung eines Einblicks in die Verfahrensweise bei der Kompression und Dekompression der Audio-Clips halten es Vivo Software wie Real Networks: kein Kommentar. 3.4.1 Generierung von Sequenzen im Vivo Active-Format An die Hardware stellt auch die Erzeugung von VivoActive-Dateien keine großen Anforderungen. Bereits ein Mittelklasse-Computer reicht aus, um Encoding nahezu in Echtzeit durchführen zu können. Die dazu erforderliche Software, der VivoActive Producer 2.0, kann über die Homepage von Vivo Software (http://www.vivo.com) bezogen werden. Als Quelle für die Codierung in das VivoActive Audioformat werden Musikstücke im Microsoft Waveform-Format (*.wav) benötigt. Liegen diese vor, so können daraus durch Durchführung folgender Schritte VivoActive-Dateien erzeugt werden: • • • Der VivoActive Producer wird über das Windows Startmenu gestartet. Das Hauptfenster der Anwendung ist in Abbildung 11 zu sehen. Über die Schaltfläche Add Movie können nun ein oder auch mehrere Eingabedateien im *.wav-Format geöffnet werden. Die Beschriftung Movie erklärt sich daraus, dass der VivoActive Producer ebenfalls dafür vorgesehen ist, Videoclips zu erzeugen. Dies wird zu einem späteren Zeitpunkt näher beleuchtet (siehe Abschnitt 4.6). Durch Markieren einer Quelldatei und anschließenden Klick auf die Schaltfläche Setting (oder auch über das Menü Settings/Select) eine der vorhandenen Parameter-Dateien wählen. Diese Dateien enthalten alle für die Konvertierung benötigten Einstellungen wie zum Beispiel die gewünschte Tonqualität oder die für Streaming erforderliche Internet-Anbindung. Falls keine geeignete Parameterkombination angeboten wird, bietet sich dem Anwender die 35 AEIOU UND MUSIK Vivo Active Möglichkeit, eine bestehende Datei zu editieren oder eine eigene, neue Parameterdatei zu erstellen. Dazu geht man wie folgt vor: o Für das Editieren einer Konfiguration den Menüpunkt Settings/Edit wählen und im erscheinenden Fenster (siehe Abbildung 12) die abzuändernde Kombination auswählen, für das Hinzufügen einer Datei den Menüpunkt Settings/Add wählen. o In beiden Fällen gelangt man zu dem in Abbildung 13 gezeigten Fenster. In diesem können alle gewünschten Werte geändert und die Datei gespeichert werden. Abbildung 11: Der VivoActive Producer v2.0 • Nachdem alle erforderlichen Einstellungen gemacht wurden, werden durch Drücken auf Generate All alle oder durch Drücken auf Generate Selected nur die ausgewählten Eingabedateien bearbeitet. Während die Konvertierung läuft, kann der Erstellungsprozess jederzeit durch Drücken auf „Stop“ abgebrochen werden. 36 AEIOU UND MUSIK Vivo Active Abbildung 12: Auswahl einer Parameterdatei Abbildung 13: Editieren einer Parameterdatei 37 AEIOU UND MUSIK 3.4.2 Vivo Active Integration von Vivo Active-Sequenzen in eine HTML-Seite Das Einbinden der erzeugten Clips in eine HTML-Seite gestaltet sich nicht mehr ganz so einfach wie bei den bisher gezeigten Formaten. Wird die Datei nämlich nur durch einen einfachen Link referenziert, ist keine Wiedergabe von Clips mit einer Spieldauer von mehr als 10 Sekunden möglich. Um Abhilfe für dieses Problem zu schaffen, müssen die gewünschten Dateien als Objekte in die HTML-Seiten eingebettet werden. Das bedeutet, dass der Videoclip beim Abspielen nicht mehr in einem eigenen Player-Fenster angezeigt wird, sondern gleich innerhalb der HTML-Seite erscheint. Damit verändert sich die bereits bekannte Beispielseite auf folgende Syntax: <HTML> <HEAD> <TITLE>Jupiter-Symphonie</TITLE> </HEAD> <BODY> <H2>Wolfgang Amadeus Mozart:<I> Jupiter-Symphonie</I></H2> <TABLE> <TR> <TD> <A HREF="/images/Jupiter.jpg"> <IMG SRC="/images/Jupiter.jps" BORDER=1> </A> Wolfgang Amadeus Mozart (1756 Salzburg - 1791 Wien) …. </TD> </TR> </TABLE> <TABLE> <TR> <TD VALIGN=CENTER><IMG SRC="/images/ic_sound.gif"></TD> <TD VALIGN=CENTER> <OBJECT CLASSID="clsid:02466323-75ed-11cf-a2670020af2546ea" Width=240 Height=180 CODEBASE = "http://player.vivo.com/ie/vvweb.cab#Version=2,0,0,0"> <PARAM NAME="URL" VALUE="/audio/Jupiter.viv"> <PARAM NAME="AUTOSTART" VALUE="true"> <PARAM NAME="VIDEOCONTROLS" VALUE="on"> <EMBED SRC="/audio/Jupiter.viv" PLUGINSPACE = "http://www.vivo.com/dldv2/cgi-bin/dldform.cgi" TYPE = "video/vnd.vivo" AUTOSTART="true" VIDEOCONTROLS="on" WIDTH=240 HEIGHT=180> </EMBED> </OBJECT> </TD> </TR> </TABLE> </BODY> </HTML> 38 AEIOU UND MUSIK 3.4.3 Vivo Active Ergebnisse Keine nennenswerten Verbesserungen gegenüber den Konkurrenten bringt VivoActive, wenn ein rein qualitativer Vergleich angestellt wird. Im Gegenteil, der Hörgenuss ist bei VivoActive-Clips zwar nicht erheblich, aber doch feststellbar geringer. Ein nicht unbedeutender Grund dafür ist, dass die Aufnahmelautstärke bei VivoActive nicht regelbar ist. Auch ist die Wahl der Aufnahmeparameter auf die Festlegung der Internetanbindung und Tonqualität beschränkt, wobei für letzteres nur die beiden Stufen „Voice quality“ und „FM quality“ zur Verfügung stehen. Außerdem beeinflusst die Einstellung der Internetanbindung die Tonqualität in keiner Weise. Beachtlich hingegen sind die bei diesem Format erzielten Kompressionsraten. Gelang es bei Real Audio den Speicherplatzbedarf bei bestimmten Audioclips von 5 MB bei einer WAVDatei auf 300 kB zu senken, so schafft VivoActive eine weitere Reduktion auf 60 kB. Noch eindrucksvoller sieht die Kompressionsrate aus, wenn als Quelldatei ein 44 MB großes Wavecodiertes Musikstück (Spieldauer etwa 5 Minuten) verwendet wird. Die entsprechende VivoActive-Datei misst nämlich nur noch 575 kB. Nachfolgend sind einige Konvertierungsbeispiele gegenübergestellt. Tabelle 4: Gegenüberstellung Waveform-VivoActive Quelle (Microsoft Waveform) Ergebnis (VivoActive) Bsp1 (ca. 28 Sekunden) Bsp1_l.wav (305 kB) Bsp1_m.wav (1218 kB) Bsp1_h.wav (4869 kB) Bsp2 (ca. 22 Sekunden) Bsp2_l.wav (241 kB) Bsp2_m.wav (964 kB) Bsp3 (ca. 4 Minuten 20) Bsp3_h.wav (44855 kB) 39 Bsp1_l0.viv Bsp1_l1.viv Bsp1_l2.viv Bsp1_m0.viv Bsp1_m1.viv Bsp1_m2.viv Bsp1_h0.viv Bsp1_h1.viv Bsp1_h2.viv (26 kB) (60 kB) (60 kB) (26 kB) (60 kB) (60 kB) (26 kB) (60 kB) (60 kB) Bsp2_l0.viv Bsp2_l1.viv Bsp2_l2.viv Bsp2_m0.viv Bsp2_m1.viv Bsp2_m2.viv (22 kB) (48 kB) (48 kB) (22 kB) (48 kB) (48 kB) Bsp3_h0.viv Bsp3_h1.viv Bsp3_h2.viv (215 kB) (525 kB) (525 kB) AEIOU UND MUSIK Vivo Active Die Abkürzungen in Tabelle 4 sind im Folgenden kurz erklärt: • Waveform-Dateien o *_l.wav 11.025 Hz Sample-Rate 8 Bit/Sample Mono o *_m.wav 22.050 Hz Sample-Rate 8 Bit/Sample Stereo o *_h.wav 44.100 Hz Sample-Rate 16 Bit/Sample Stereo • VivoActive Dateien o *0.viv Client Connection Type : Custom (16000) Voice quality (6,4 kbps) Framerate: 1 Automatic gain adjust o *1.viv Client Connection Type : Custom (16000) FM quality (16 kbps) Framerate: 1 Automatic gain adjust o *2.viv Client Connection Type : ISDN (54 k) FM quality (16 kbps) Framerate: 1 Automatic gain adjust Wie in den Beispielen zu sehen ist, beeinflussen weder die angepeilte Internetverbindung noch die Qualität der Quelldatei die Größe der VivoActive-kodierten Datei. Nur die angegebene Tonqualität (Voice oder FM quality) schlägt sich in der Kompressionsrate nieder. Doch auch wenn die Ausgabedateien gleich groß sind, so ist doch ein Unterschied in der Qualität festzustellen. Diese lässt sich bei VivoActive-Clips auf 2 Arten verändern. Zum einen, indem festgelegt wird, ob die Ergebnisdateien in „Voice quality“ oder in „FM quality“ vorliegen sollen. Da bei „Voice quality“ nur 6,4 kb pro Sekunde verwendet werden, kann von dieser Option im Allgemeinen abgeraten werden Sie eignet sich nur für Tondokumente, die keinerlei Musik oder nur unwesentliche Hintergrundgeräusche enthalten (z.B. Reden). Zum anderen gibt es noch die Möglichkeit, eine qualitativ höherwertigere Quelle einzusetzen, denn je besser die Quelle ist, desto höher ist auch der Hörgenuss in VivoActive. Obwohl gegenüber Real Audio ein größerer Verlust an Reinheit und Klangfülle in Kauf genommen werden muss, bleibt VivoActive eine Überlegung bei der Wahl des richtigen Audioformates wert, da es durch extrem hohe Kompressionsraten und geringe Konvertierungszeiten, die unterhalb der echten Spieldauer der jeweiligen Clips liegen, Punkte sammeln kann. 40 AEIOU UND MUSIK MP3 In diesem Abschnitt wird zunächst einige Hintergründe des Formates MP3 beleuchtet. Danach wird gezeigt, wie Audioclips in diesem Format generiert werden und in HTMLSeiten integriert werden. Danach werden die Stärken und Schwächen dieses Formates näher beleuchtet und die in den Untersuchungen erzielten Ergebnisse bezüglich Kompression und Tonqualität kommentiert. 3.5 Das Audioformat MP3 Unkomprimierte Audiodaten, wie sie auf einer CD zu finden sind, enthalten mehr Information als das menschliche Hirn verarbeiten kann. Liegen zum Beispiel zwei aufeinanderfolgende Töne in der Frequenz (und der Lautstärke) sehr nach beieinander, kann das Gehirn unter Umständen nur einen der beiden Töne feststellen. Derselbe Effekt tritt auf, wenn die Töne zwar stark verschieden sind, einer davon aber erheblich lauter ist als der andere. In diesem Fall kann das Gehirn den leiseren Ton nicht wahrnehmen. Dazu kommt noch, dass die Ohren manche Frequenzen besser hören können als andere. Derartige menschliche Hörmuster können mit Tabellen, Grafiken und mathematischen Formeln genau beschrieben werden11. Im Allgemeinen können Menschen weder Frequenzen unterhalb von 20 Hz noch oberhalb von 20 kHz hören. Obwohl das Hörvermögen von einzelnen Individuen unterschiedlich ist, kann, davon ausgegangen werden, dass mittlere Frequenzen stärker wahrgenommen werden als hohe oder niedrige Frequenzen (siehe Abbildung 14). Für die meisten Personen liegt der hörempfindlichere Bereich zwischen 2 und 4 kHz, ein Bereich, der wahrscheinlich evolutionsbedingt mit dem normalen Bereich der menschlichen Stimme (500 Hz bis 2 kHz) zusammenhängt. Das heißt, das menschliche Gehirn funktioniert teilweise wie ein Sieb, das systematisch wichtige Informationen in den Vordergrund bringt und überflüssige oder redundante Wahrnehmungen beschränkt oder sogar ignoriert. Abbildung 14: Der Frequenzbereich des Hörvermögens eines Menschen 11 Das Studium dieses Hörphänomens wird Psychoakustik genannt. 41 AEIOU UND MUSIK MP3 Die Basis eines „perceptual“ Codecs12 ist, dass es wenig Sinn macht, Informationen zu speichern, die Menschen ohnehin nicht wahrnehmen können. Da Aufnahmegeräte (Mikrofone und ähnliches) um ein Vielfaches sensibler sind als das menschliche Ohr, vor allem gemessen an der Bandbreite des wahrnehmbaren Frequenzbereiches, ist ein großes Potential für eine Datenreduktion vorhanden. MPEG1 Audio Layer 3, kurz MP3 genannt, verwendet dafür 2 verschiedene Kompressionsverfahren, wovon eine verlustbehaftet ist, die andere verlustfrei. Der gesamte Kompressionsvorgang kann in folgende verschiedene Schritte unterteilt werden, wobei die angegebene Reihenfolge nicht unbedingt eingehalten werden muss: 1. Das Signal wird in kleinere Stücke zerlegt. Diese Stücke werden „Frames“ genannt (analog zu den Frames bei Videoclips) und sind typischerweise Bruchteile von Sekunden lang. 2. Um die spektrale Energieverteilung zu bestimmen, wird das Signal analysiert. Das heißt, in Bezug auf das gesamte Spektrum der hörbaren Frequenzen wird bestimmt, wie die Bits verteilt werden müssen, um das Audiosignal, das kodiert werden soll, bestmöglich darzustellen. Da verschiedene Abschnitte des Frequenzspektrums am effizientesten kodiert werden können, wenn derselbe Algorithmus in leicht abgewandelter Form angewendet wird, zerlegt dieser Schritt das Signal in sogenannte Subbänder, die unabhängig voneinander behandelt werden können. Dabei verwenden alle Subbänder denselben Algorithmus und variieren nur die Anzahl an zugeordneten Bits (abhängig von der Berechnung durch den Encoder). 3. Die (gewählte) Kodierungsbitrate wird dazu verwendet, um die maximale Anzahl an Bits zu bestimmen, die den einzelnen Frames zugeordnet werden können. Dieser Schritt entscheidet also, wie viel der vorhandenen Audiodaten gespeichert wird. 4. Die Frequenzreichweite für jeden einzelnen Frame wird mit mathematischen Modellen aus der Psychoakustik, die im Encoder gespeichert sind, verglichen. Daraus kann bestimmt werden, welche Frequenzen genau gerendert werden müssen, da sie für den Menschen gut wahrnehmbar sind, und welche Frequenzen ausgelassen oder zumindest mit geringerer Bitrate aufgenommen werden können, da die potentiellen Hörer sie ohnehin nicht hören können. 5. Durch die Anwendung des Huffman-Kodierungsalgorithmus auf den Bitstream werden die redundanten Daten weiter komprimiert, ohne dabei Daten wegzuwerfen (verlustfreie Komprimierung). 6. Die einzelnen Frames werden zu einem seriellen Bitstream zusammengefügt, wobei jedem Frame bestimmte Kopfinformationen (Header) vorangehen. Das Format des resultierenden Bitstreams wurde bereits kurz angedeutet und soll im Folgenden näher beleuchtet werden (siehe Abbildung 15). Jeder der im Bitstream enthaltenen Frames beginnt mit einem Block, der allgemeine Informationen zum Format des Teilstückes enthält. Dieser Block wird Framekopf (Header) genannt. Dieser Kopf setzt sich aus folgenden Teilen zusammen: Abbildung 15: Der Aufbau eines MP3-Frames 12 Codec ist die Kurzform von Coding (Kodierung) und Decoding (Dekodierung). 42 AEIOU UND MUSIK • • • • • • • • • • • • • MP3 Am Beginn dieses Kopfes befindet sich der sogenannte Sync-Block (A), der aus 11 Bits besteht. Dieser Teil des Kopfes wird benötigt, damit bei einer Ausstrahlung eines längeren Streams (z.B. Radiosendung via Internet) ein Empfänger an einer beliebigen Stelle der Übertragung einsteigen und mit der Wiedergabe beginnen kann. Auf diesen Sync-Block folgt ein ID-Bit (B), das angibt, ob der Frame in MPEG-1 oder MPEG-2 kodiert wurde. Darauf folgen 2 weitere Bits (C), die angeben, ob es sich um Layer I, II oder III handelt oder ob der Layer nicht näher definiert wurde. Das Protection-Bit (D) zeigt an, ob der Frame vor den Audiodaten eine Kontrollsumme aufweist oder nicht. Anschließend wird mit 4 Bits der Bitraten-Index (E) des aktuellen Frame angegeben. Die Bitrate selbst ist in einer entsprechenden Referenztabelle eingetragen. Auf die Bitratenangabe folgt die Spezifikation der verwendeten AudioSamplefrequenz (F). Diese kann sich zwischen 16 kHz und 44,1 kHz bewegen, abhängig davon, ob MPEG-1 oder MPEG-2 für die Kodierung verwendet wurde. Der Wert der vorliegenden Frequenz kann analog zur Bitrate über eine Referenttabelle bestimmt werden. Das nächste Bit (G, Padding-Bit) wird dazu verwendet, um sicherzustellen, dass jeder einzelne Frame die Bitraten-Anforderungen exakt erfüllt. Das darauffolgende Bit (H) ist für anwendungsspezifische Einträge reserviert. Die Kanalinformation wird durch die nächsten beiden Bits (I) repräsentiert. Mögliche Werte sind hier zum Beispiel Stereo, Zweikanal-Ton, Joint-Stereo oder Mono. Durch 2 weitere Bits (J), Modus-Erweiterung genannt, wird dem Decoder mitgeteilt, wie er mit Joint-Stereo-Effekten umgehen muss, wenn diese aktiviert sind (z.B. ob hohe Frequenzen über mehrere Kanäle kombiniert werden sollen). Im Framekopf ist zwar keine Copyright-Information im eigentlichen Sinne enthalten, doch das folgende Bit (K) zeigt an, ob es offiziell erlaubt ist, Kopien des vorliegenden Stücks zu machen (Bit nicht gesetzt) oder nicht (Bit gesetzt). Das Original-Bit (L) zeigt an, ob es sich bei dem vorliegenden Stück um das Original (Bit gesetzt) oder um eine Kopie (Bit nicht gesetzt) handelt. Das letzte 2-Bit-Feld wird nur sehr selten verwendet und kann für die meisten Aufnahmen als eher überflüssig betrachtet werden. Im Anschluss an diese Kopfinformationen folgen eventuell eine Kontrollsumme und danach die Audiodaten des Frames. Das hier gezeigte Muster setzt sich über den gesamten Bitstream fort. Doch diese kurze Beschreibung des Formates soll an dieser Stelle genügen, für weitere Informationen sei der interessierte Leser auf [HACKER00] oder verwandte Werke verwiesen. 3.5.1 Generierung von Sequenzen im MP3-Format Für die Erzeugung von MP3-Dateien wird analog zu den zuvor behandelten Audioformaten eine dafür geeignete Software benötigt. Für das Projekt AEIOU stand der XING MP3Encoder in der Version 1.5 zur Verfügung. Als Quelle werden vom XING MP3-Encoder Dateien im Microsoft Waveform-Format unterstützt. Der Erstellungsprozess gliedert sich damit in nachfolgend beschriebene Schritte: • Über das Windows-Startmenü wird der XING MP3-Encoder gestartet. Das Encoder startet mit dem in Abbildung 16 gezeigten Hauptfenster. 43 AEIOU UND MUSIK MP3 Abbildung 16: Das Hauptfenster des XING MP3-Encoders • Über das Menü Datei/Hinzufügen (File/Add) oder über den Button können eine oder mehrere Quelldateien (im WAVE-Format) als Arbeitsauftrag (Job) hinzugefügt werden. Die eingefügten Dateien werden im Hauptfenster angezeigt (siehe Abbildung 17). Angelegte Jobs können bei Bedarf über den Button wieder entfernt werden. Abbildung 17: Anzeige der eingefügten Kodierungsjobs im XING MP3-Encoder • • Im Anschluss daran kann für jeden angelegten Job (oder auch für alle gemeinsam) das gewünschte Konvertierungsprofil ausgewählt werden. Dazu muss der entsprechende Job durch einen Mausklick ausgewählt werden und danach entweder über das Menü Datei/Eigenschaften (File/Properties) oder über einen rechten Mausklick auf die gewünschte Datei und danach Auswahl des Menüpunktes Eigenschaften (Properties) das Eigenschaftsfenster geöffnet werden (siehe Abbildung 18). Im neu geöffneten Fenster besteht die Möglichkeit, den Speicherpfad für die MP3Dateien festzulegen (über die Schaltfläche ) und das Kodierungsprofil des gewählten Jobs zu ändern (über die Schaltfläche ). Durch Drücken des zweiten Buttons wird ein neues Fenster geöffnet (siehe Abbildung 19). 44 AEIOU UND MUSIK • MP3 Aus den angebotenen Profilen kann durch einen Mausklick auf das gewünschte Profil und anschließende Bestätigung der Auswahl mit der Schaltfläche die Zielbitrate (konstant oder variabel) für den aktuellen Konvertierungsjob festgelegt werden. Abbildung 18: Anzeige der Eigenschaften eines Konvertierungsauftrages Abbildung 19: Festlegen eines Konvertierungsprofiles mit bestimmter Bitrate • Nach Bestätigung der Eingabe im Profile-Fenster Eigenschaftsfenster über die entsprechende Schaltfläche ( 45 muss diese auch ) bestätigt werden. im AEIOU UND MUSIK • MP3 Damit sind alle für die Konvertierung notwendigen Einstellungen getroffen und der Vorgang kann mit Betätigung der Schaltfläche gestartet werden. Der Konvertierungsvorgang wird automatisch beendet, sobald alle ausgewählten Dateien in das MP3-Format umgewandelt wurden, kann aber auch über die Schaltfläche (wird nur im Laufe der Konvertierung angezeigt) unterbrochen werden. Sollen mehrere Dateien mit demselben MP3-Profil konvertiert werden, kann das Profil auch als Standardeinstellung (Default) hinterlegt werden. Das Profil wird dann automatisch jedem neuen Job zugeteilt und muss nicht mehr eigens ausgewählt werden. Dies wird wie folgt durchgeführt: • • Im Hauptfenster des Encoders den Menüpunkt Bearbeitung/Einstellungen (Edit/Preferences) wählen. In der Lasche Encode des neu geöffneten Fensters (siehe Abbildung 20) die Schaltfläche betätigen und danach auf die zuvor beschriebene Art und Weise das gewünschte Profil aktivieren. • • Analog dazu kann in derselben Lasche (über die Schaltfläche ) für den MP3-Speicherpfad eine Standardeinstellung eingegeben werden. Zusätzlich kann in der Lasche Erweiterte Einstellungen (Advanced Options) ausgewählt werden, ob das Original-Bit und das Copyright-Bit gesetzt werden sollen oder nicht. Abbildung 20: Festlegung der Standardeinstellungen für die Kodierung 46 AEIOU UND MUSIK 3.5.2 MP3 Integration von Sequenzen im MP3-Format in eine HTML-Seite Die erstellten MP3-Dateien können in analoger Weise wie Microsoft Waveform-Dateien in HTML-Seiten eingebaut werden. geschilderten Vorgehensweise eingebaut. Die Audiodateien müssen auf dem Server in einem bestimmtes Verzeichnis abgelegt und über einen entsprechenden Link referenziert werden. Durch einen Mausklick auf diesen Link können Internet-Benutzer die Clips lokal auf ihren Rechner laden und abspielen. Das Aussehen der entsprechenden Seite innerhalb des AEIOU-Systems wird in Abbildung 9 (siehe Abschnitt 3.2.2) gezeigt. <HTML> <HEAD> <TITLE>Jupiter-Symphonie</TITLE> </HEAD> <BODY> <H2>Wolfgang Amadeus Mozart:<I> Jupiter-Symphonie</I></H2> <TABLE> <TR> <TD> <A HREF="/images/Jupiter.jpg"> <IMG SRC="/images/Jupiter.jps" BORDER=1> </A> Wolfgang Amadeus Mozart (1756 Salzburg - 1791 Wien) …. </TD> </TR> </TABLE> <TABLE> <TR> <TD VALIGN=CENTER><IMG SRC="/images/ic_sound.gif"></TD> <TD VALIGN=CENTER> <B>Qualität</B>: <A HREF="/audio/Jupiter.mp3">Geringer</A> </TD> </TR> </TABLE> </BODY> </HTML> 47 AEIOU UND MUSIK 3.5.3 MP3 Ergebnisse Ähnlich wie Microsoft Waveform präsentiert sich auch MPEG 1 Audio Layer III (MP3) äußerst leistungsfähig und mit einer großen Auswahl an möglichen Qualitätsstufen (siehe Tabelle 5). Vor allem bei Verwendung der höheren Qualitätsstufen, das sind jene mit einer Zielbitrate von 128 bis 192 kbps (CBR13 128, CBR 192, VBR14 Normal, VBR High), reicht die Klangfülle der erstellten MP3-Clips nahezu an das verwendete Original heran. Mit den Profilen mit geringerer Zielbitrate, also 96 kbps oder weniger, ist jedoch der Verlust an Qualität deutlich spürbar. Tabelle 5: Die Qualitätsstufen von MP3 Encoding-Profil CBR 320K VBR High CBR 192K VBR Normal/High VBR Normal CBR 128K VBR Normal/Low CBR 112K VBR Low CBR 64K CBR 64K Mono CBR 32K Mono CBR 16K Mono Bitrate Sample(kbps) Rate (kHz) 320 192 192 160 128 128 112 112 96 64 64 32 16 44 44 44 44 44 44 44 44 44 22 22 22 16 Mono / Stereo Stereo Stereo Stereo Stereo Stereo Stereo Stereo Stereo Stereo Stereo Mono Mono Mono Bitrate ist konstant Bitrate ist variabel Bitrate ist konstant Bitrate ist variabel Bitrate ist variabel Bitrate ist konstant Bitrate ist variabel Bitrate ist konstant Bitrate ist variabel Bitrate ist konstant Bitrate ist konstant Bitrate ist konstant Bitrate ist konstant Was den Speicherplatz betrifft, so muss unterschieden werden, ob die MP3-Datei unter Verwendung von konstanter Bitrate erzeugt wurde, oder ob eine Variante mit variabler Bitrate gewählt wurde. Denn bei konstanter Bitrate wird die Größe der Ausgabedatei nur von der Spieldauer der Quelldatei beeinflusst, nicht jedoch von deren Qualität und Beschaffenheit. In diesem Fall kann die MP3-Version mitunter größer sein als die als Quelle verwendete WaveDatei, wenn diese zum Beispiel mit 16 kbps kodiert ist und für die MP3-Kodierung das Profil VBR Normal (ca. 128 kbps) eingestellt wurde. Bei Kodierung mit variabler Bitrate hingegen wird die für einen bestimmten Frame des Musikstückes verwendete Bitanzahl vom Encoder aus der Beschaffenheit der Quellframes berechnet. Diese Variante veranlasst den Encoder, ausgehend von einem festgelegten Zielwert (z.B. 160 kbps bei VBR Normal/High) je nach Bedarf die Anzahl der für die Beschreibung eines bestimmten Teilsegmentes (Frame) des Quellstückes verwendeten Bits zu erhöhen oder auch zu senken. Dadurch wird es auch möglich, bei einer qualitativ schwachen, also mit einer 13 14 CBR bedeutet Konstante Bitrate (Constant BitRate) VBR bedeutet Variable Bitrate (Variable BitRate) 48 AEIOU UND MUSIK MP3 niedrigen Bitrate aufgenommenen Microsoft Waveform-Datei weitere Kompression zu erreichen. Dies bringt den Vorteil gegenüber den Profilen mit konstanten Bitraten mit sich, dass die erzeugten Dateien bei vergleichbarer Qualität wesentlich kleiner werden, womit sowohl der Speicherverbrauch als auch die Download-Zeit für den Benutzer positiv beeinflusst werden. Als Nachteil muss an dieser Stelle angemerkt werden, dass MP3-Dateien mit variabler Bitrate nicht von allen MP3-Wiedergabeanwendungen (Player) unterstützt werden. Nachfolgende Tabelle 6 zeigt eine kurze Gegenüberstellung einiger Konvertierungsbeispiele: Tabelle 6: Gegenüberstellung Microsoft Waveform und MP3 Quelle (Microsoft Waveform) Bsp1 (ca. 28 Sekunden) Bsp1_l.wav (305 kB) Bsp1_m.wav (1218 kB) Bsp1_h.wav (4869 kB) Bsp2 (ca. 22 Sekunden) Bsp2_l.wav (241 kB) Bsp2_m.wav (964 kB) Ergebnis (MP3) Bsp1_lc64.mp3 Bsp1_lv128.mp3 Bsp1_lc128.mp3 Bsp1_lv192.mp3 Bsp1_lc192.mp3 Bsp1_lc320.mp3 Bsp1_mc64.mp3 Bsp1_mv128.mp3 Bsp1_mc128.mp3 Bsp1_mv192.mp3 Bsp1_mc192.mp3 Bsp1_mc320.mp3 Bsp1_hc64.mp3 Bsp1_hv128.mp3 Bsp1_hc128.mp3 Bsp1_hv192.mp3 Bsp1_hc192.mp3 Bsp1_hc320.mp3 (221 kB) (134 kB) (443 kB) (166 kB) (663 kB) (1.105 kB) (222 kB) (359 kB) (442 kB) (503 kB) (663 kB) (1.105 kB) (222 kB) (452 kB) (442 kB) (665 kB) (663 kB) (1.105 kB) Bsp1_lc64.mp3 Bsp1_lv128.mp3 Bsp1_lc128.mp3 Bsp1_lv192.mp3 Bsp1_lc192.mp3 Bsp1_lc320.mp3 Bsp1_lc64.mp3 Bsp1_lv128.mp3 Bsp1_lc128.mp3 Bsp1_lv192.mp3 Bsp1_lc192.mp3 Bsp1_lc320.mp3 (176 kB) (108 kB) (351 kB) (133 kB) (525 kB) (875 kB) (175 kB) (282 kB) (350 kB) (398 kB) (525 kB) (875 kB) 49 AEIOU UND MUSIK Bsp3 (ca. 4 Minuten 20) Bsp3_h.wav (44855 kB) Vivo Active Bsp1_lc64.mp3 Bsp1_lv128.mp3 Bsp1_lc128.mp3 Bsp1_lv192.mp3 Bsp1_lc192.mp3 Bsp1_lc320.mp3 Die Abkürzungen in Tabelle 6 sind im Folgenden kurz erklärt: • Waveform-Dateien o *_l.wav 11.025 Hz Sample-Rate 8 Bit/Sample Mono o *_m.wav 22.050 Hz Sample-Rate 8 Bit/Sample Stereo o *_h.wav 44.100 Hz Sample-Rate 16 Bit/Sample Stereo • MP3-Dateien o *c64.mp3 Bitrate: 64 kbps konstant Sample-Rate: 22 kHz Stereo o *v128.mp3 Bitrate: 128 kbps variabel Sample-Rate: 44 kHz Stereo o *c128.mp3 Bitrate: 128 kbps konstant Sample-Rate: 44 kHz Stereo o *v192.mp3 Bitrate: 192 kbps variabel Sample-Rate: 44 kHz Stereo o *c192.mp3 Bitrate: 192 kbps konstant Sample-Rate: 44 kHz Stereo o *c320.mp3 Bitrate: 320 kbps konstant Sample-Rate: 44 kHz Stereo 50 (1.999 kB) (3.805 kB) (3.997 kB) (5.504 kB) (5.996 kB) (9.992 kB) Wie in der Tabelle zu sehen ist, sind die erzielten Kompressionsraten durchaus bemerkenswert. So wird zum Beispiel der Platzbedarf für ein ca. 5 Minuten langes Musikstück in der höchsten Qualitätsstufe von ca 44 MB auf immerhin nur noch 6 bis 10 MB reduziert. Auch der damit verbundene Qualitätsverlust im Vergleich zum Original ist kaum hörbar. Aus diesen Gründen und durch den zusätzlichen Umstand, dass MP3-Dateien sich im Internet großer Beliebtheit erfreuen, wurden für die Musikstücke des AEIOU-Musikalbums anstelle verschiedener schwächerer Qualitätsstufen in anderen Formaten entsprechenden Dateien im MP3-Format auf dem AEIOU-Server zur Verfügung gestellt. 51 4. AEIOU und Film Kapitel 4 AEIOU und Film AEIOU UND FILM Einleitung In diesem Kapitel werden nach allgemeinen Betrachtungen zum Thema AEIOU und Film die Ergebnisse und Erkenntnisse, die aus den in den Jahren 1996 und 1997 durchgeführten Untersuchungen gewonnen wurden, behandelt. Evaluiert wurden die Videoformate AVI (Abschnitt 4.2), Apple Quick Time (Abschnitt 4.3), MPEG (Abschnitt 4.4), Real Video (Abschnitt 4.5) und Vivo Active (Abschnitt 4.6). In den einzelnen Abschnitten werden die jeweiligen Formate zunächst vorgestellt und erklärt. Danach folgt eine Beschreibung der Generierung von Videoclips in diesen Formaten und deren Einbau in HTML-Seiten. Im Anschluss daran werden die erzielten Ergebnisse und beobachteten Effekte diskutiert und die Verwendbarkeit der jeweiligen Formate für das Videoalbum des AEIOU-Projektes bewertet. 4.1 Einleitung Werden Web-Sites mit Tondokumenten, also Musikclips oder erklärenden Sprechtexten, etwas aufgepeppt und Informationsinhalte damit plastischer gemacht, so gewinnen diese Sites ohne Zweifel an Anziehungskraft den Internet-Nutzern gegenüber. Trotzdem ist damit das Ei des Kolumbus noch nicht gefunden. Es ist zwar ganz interessant, in Worten eine Beschreibung zu erhalten, wie zum Beispiel die Burg Hochosterwitz aussieht, ausreichend vorstellbar wird dieses Bauwerk dadurch aber nicht. Ebenso verhält es sich mit Beispielen aus der Medizin: eine noch so wortreiche Schilderung einer Untersuchung wird dem interessierten Benutzer nicht die Menge an Information vermitteln können, wie er sie zu finden erhofft. Man könnte zwar die verwendeten Tonstücke durch Hinzufügen von Standbildern im JPEGoder GIF-Format untermalen und damit auch visuelle Information anbieten, doch die vorhandenen multimedialen Möglichkeiten würde man in diesem Fall nicht zur Gänze nutzen. Die bessere Variante, die auch einen größeren Gewinn an Attraktivität und Informationsgehalt mit sich bringt, stellt die Kombination von Bild und Ton in einer anderen Form dar: als Videoclip. Wie im Audiobereich sollten auch dabei bestimmte Grundregeln beachtet und die verwendeten Formate sorgfältig ausgesucht werden. Die Kriterien dafür sind ein wenig anders gelagert, obwohl nach wie vor die Tonqualität mitentscheidend für den Anklang ist, den die Clips bei den Anwendern finden. Die wesentlich wichtigeren Kriterien im Videobereich sind jedoch die Bildqualität und die erreichte Kompressionsrate. Ersteres lässt sich über zwei Unterkriterien definieren, nämlich über die Bildschärfe und über die Flüssigkeit der Bildbewegung. Keiner der beiden Parameter bringt vernünftige Ergebnisse, wenn das Augenmerk nur auf einen gelegt und der jeweils andere gänzlich vernachlässigt wird. Wird zuviel Gewicht auf die Bildschärfe gelegt, so wird bei einigen Formaten aus dem erhofften Videoclip unweigerlich eine Einzelbildfolge, die eher an einen Diavortrag erinnert als an einen Film. Bevorzugt man hingegen die Flüssigkeit der Bewegung bei den Bildübergängen und schenkt der Bildschärfe keinerlei Beachtung, so erhält man einen Clip, in dem wie gewünscht die einzelnen Bilder nicht unterschieden werden können. Leider bringt diese Vorgehensweise mit sich, dass auch der Bildvordergrund nur sehr schwer vom Bildhintergrund zu trennen ist. Das Erzielen eines brauchbaren Kompromisses zwischen diesen beiden Parametern gestaltet sich oft sehr schwierig, vor allem, wenn die Videoclips kleinere Objekte enthalten, die nicht bewegungslos an einem Platz verweilen, sondern sich in irgendeiner Form bewegen oder bewegt werden. Ähnlich wie bei Audioclips darf auch im Videobereich die Kompressionsrate nicht aus den Augen verloren werden. Die Gründe dafür sind dieselben wie im Audiobereich, wenn auch 53 AEIOU UND FILM Einleitung durch den höheren Informationsgehalt und damit verbundenem höheren Speicherplatzbedarf vielleicht noch schwerwiegender, denn die Ladezeiten steigen dramatisch. Auch für das Projekt AEIOU war es von Bedeutung, einen Teil der Informationen, vor allem über die Geschichte und die Kultur Österreichs, in Form von kleinen Videosequenzen zur Verfügung zu stellen. Dazu wurden aus den Archiven des ORF fünf Videokassetten im SVHS-Format und aus dem Filmarchiv in Laxenburg 7 Videokassetten ebenfalls im S-VHSFormat mit einer sehr großen Anzahl an kurzen, historisch wertvollen Videoclips angefordert. Aus diesen Videokassetten wurde dann von Frau Edith Murlasits eine Sammlung von ungefähr 360 Videosequenzen zusammengestellt. Bei der Auswahl dieser Clips mussten aus den vorhandenen Filmstücken kleine Teile ausgesucht und teilweise bildgenau bestimmt werden. Danach wurden diese Kurzfilme einzelnen Kategorien, wie zum Beispiel „Persönlichkeiten“ oder „Leute“ zugeordnet. Über diese Kategorien sollten diese Filme später von der Einstiegsseite des Videoalbums (Abbildung 21) erreichbar sein. Abbildung 21: Gliederung der Videosequenzen in Kategorien Nach dieser Vorselektion war es dann die Aufgabe des Autors der vorliegenden Arbeit, die einzelnen Sequenzen in digitale Form zu bringen (Abbildung 22). Dabei war es zuvor 54 AEIOU UND FILM Einleitung notwendig, in einer umfangreichen und langwierigen Testreihe zu bestimmen, welche Videoformate für welche Aufgabe geeignet war. Grundsätzlich gab es zwei verschiedene Verwendungszwecke, für welche die Clips in bestimmte Formate konvertiert werden mussten: einerseits für die Archivierung und als Ausgangspunkt zur Weiterverarbeitung und andererseits für die Bereitstellung am AEIOU-Server. Für die erste Aufgabe war es wesentlich, dass die einzelnen Filmstücke in ein Format gebracht wurden, das einen sehr geringen Qualitätsverlust aufwies und auch einfach bearbeitet werden konnte. Vor allem war es für die einzelnen Clips wichtig, dass die digitalisierte Sequenz nach der Aufnahme noch bildgenau geschnitten werden konnte, da eine framegenaue Aufnahme nahezu unmöglich war. Der für die verschiedenen Filmstücke verbrauchte Speicherplatz war eher sekundär. Ganz im Gegensatz zur zweiten Anforderung, denn bei der Bereitstellung am AEIOU-Server musste ein guter Kompromiss zwischen Qualität und dafür verbrauchtem Platz gefunden werden. Abbildung 22: Skizzierter Ablauf bei der Erstellung der Videosequenzen Da das Angebot an verschiedenen Videoformaten groß war, wurde nur eine Auswahl der vielversprechendsten Formate in die Versuchsreihe aufgenommen. Folgende Formate wurden auf ihre Tauglichkeit für die Archivierung und auf die Bereitstellung im Internet untersucht: • • • • • Audio-Video-Interleave (AVI) Apple QuickTime (MOV) Moving Pictures Expert Group (MPEG) Real Video (RM) Vivo Active (VIV) Dabei war Audio Video Interleave für die Archivierung und als Ausgangspunkt für andere Formate vorgesehen, die restlichen für eine eventuelle Verwendung im Internet bestimmt. Inwieweit die ausgesuchten Formate den gesetzten Anforderungen entsprechen konnten, belegen die in den nächsten Abschnitten gezeigten Ergebnisse. 55 AEIOU UND FILM Audio Video Interleave (AVI) Der folgende Abschnitt stellt das Format von AVI-Dateien vor. Anschließend wird die Generierung von Sequenzen im AVI-Format und deren Integration in HTML-Seiten behandelt. Danach werden die Stärken und Schwächen dieses Formates näher beleuchtet und die in den Untersuchungen erzielten Ergebnisse bezüglich Kompression und Tonqualität kommentiert und die Bedeutung dieses Formates für das Videoalbum des AEIOU-Projektes bewertet. 4.2 Das Videoformat Audio Video Interleave (AVI) Als Dinosaurier unter den Videoformaten könnte Audio Video Interleave bezeichnet werden. Clips dieses Formates sind nämlich seit vielen Jahren im Einsatz, insbesondere dann, wenn es um die Archivierung von Videodaten geht. Sie werden nur in seltenen Fällen direkt im Internet verwendet, da sie dafür durch ihren hohen Bedarf an Speicherplatz nicht gerade vorzüglich geeignet sind. Trotzdem sind sie in dieser Arbeit wichtig, da sich AVI stark als Quelle für die Konvertierung in andere Videoformate empfiehlt. Audio Video Interleave wurde von Microsoft für Intel entwickelt und baut, wie das Audioformat Waveform auf der RIFF-Spezifikation auf. Im Allgemeinen enthält eine AVIDatei mehrere Spuren von unterschiedlichen Datentypen. Die meisten AVI-Sequenzen verwenden sowohl die Video- als auch die Audiospur. Einfachere Sequenzen, die keine Audiospur benötigen, werden jedoch nur die Videodaten enthalten. Zusätzlich können spezielle AVI-Clips eine Kontrollspur oder eine MIDI-Spur als zusätzliche Datenspur enthalten. So ist es zum Beispiel möglich, über die enthaltene Kontrollspur ein externes Gerät wie einen MCI Videodisc Player zu steuern. Im Folgenden werden hauptsächlich AVISequenzen berücksichtigt, die sowohl Audio- und Videodaten, jedoch keine speziellen Spuren enthalten. Das AVI RIFF Format wird durch den vierstelligen Code ´AVI ´ identifiziert. Alle Dateien dieses Formates müssen 2 bestimmte LIST-Blöcke enthalten. Diese definieren das Format der einzelnen Spuren sowie die Daten der Spuren. Zusätzlich dazu können AVI-Dateien einen Indexblock enthalten, der die Position der Datenblöcke innerhalb der Datei angibt. Mit diesen Komponenten sieht eine AVI-Datei wie folgt aus: RIFF (´AVI ´) LIST (´hdrl´ . . . ) LIST (´movi´ . . . ) [´idx1´<AVI Index>] ) 56 AEIOU UND FILM Audio Video Interleave (AVI) Die LIST-Blöcke sind Unterblöcke des RIFF `AVI `-Blocks, durch welchen die Datei als AVI RIFF-Datei charakterisiert wird. Die gezeigte Reihenfolge der einzelnen Blöcke muss bei AVI-Dateien unbedingt eingehalten werden, damit sie korrekt abgespielt werden können. • • • Durch den ersten zwingend notwendigen Block, den LIST `hdrl`-Block, wird das Format der Daten bestimmt. Der zweite, der LIST `movi`-Block, beinhaltet die Daten für die AVI-Sequenz. An dritter Stelle kommt der optionale Index-Block, im Beispiel mit `idx1` bezeichnet. Die Blöcke LIST `hdrl` und LIST `movi` verwenden weitere Unterblöcke für ihre Daten. Im nachstehenden Beispiel ist das um die Unterblöcke erweiterte AVI RIFF-Format zu sehen. RIFF (´AVI ´) LIST (´hdrl´ ´avih´ (<AVI Kopf>) LIST (´strl´ ´strh´ (<Spurkopf>) ´strf´ (<Spurformat>) ´strd` (<zusätzliche Kopfdaten>) . ) . ) LIST (´movi´ {Subblock | LIST (´rec ´ Subblock1 Subblock2 . ) . } . ) [`idx1`<AVI Index>] ) Am Beginn jeder AVI-Datei steht der Hauptkopf. Darin werden allgemeine Dateiinformationen, wie zum Beispiel die Anzahl der enthaltenen Spuren oder die Bildhöhe und die Bildbreite des Clips, gespeichert. Welche Daten dort mitgeliefert werden, ist am besten an der für den Hauptkopf definierten Datenstruktur und den dazugehörigen Feldbeschreibungen zu sehen: Typedef struct { DWORD dwMicroSecPerFrame; DWORD dwMaxBytesperSec; DWORD dwReserved1; DWORD dwFlags; DWORD dwTotalFrames; DWORD dwInitialFrames; DWORD dwStreams; 57 AEIOU UND FILM DWORD DWORD DWORD DWORD DWORD DWORD DWORD } Audio Video Interleave (AVI) dwSuggestedBufferSize; dwWidth; dwHeight; dwScale; dwRate; dwStart; dwLength; dwMicroSecPerFrame: Durch dieses Feld wird die Zeitspanne zwischen den einzelnen Videoframes angegeben. • dwMaxBytesPerSec: Die ungefähre maximale Datenrate der Datei wird durch dieses Feld spezifiziert. Der eingetragene Wert gibt die Anzahl der Bytes pro Sekunde an, die das System verarbeiten muss, um eine AVI-Sequenz darstellen zu können, wie sie durch die restlichen im Hauptkopf und im Spurkopf enthaltenen Parameter beschrieben wird. • dwFlags: Das dwFlags-Feld enthält alle Flags der Datei. Für AVI-Dateien sind die folgenden Flags möglich: o AVIF-HASINDEX gibt an, ob die Datei einen Indexblock besitzt. o AVIF_MUSTUSEINDEX zeigt an, ob der Index dazu verwendet werden soll, die Reihenfolge der Datenpräsentation zu bestimmen. o AVIF_ISINTERLEAVED liefert die Information, ob die AVI-Datei „interleaved“ ist. o AVIF_WASCAPTUREFILE gibt an, ob die Datei speziell für die EchtzeitVideoaufnahme reserviert ist. o AVIF_COPYRIGHTED zeigt, ob die Daten Copyright-geschützt sind. • • • • Die Flags AVIF_HASINDEX und AVIF_MUSTUSEINDEX sind nur für Dateien, die einen Indexblock besitzen, von Bedeutung. Während der erste dem System mitteilt, dass ein Indexblock in der Datei existiert, bestimmt der zweite, ob dieser Indexblock bei der Ausgabe der Audio- und Videodaten verwendet werden muss. Ist dieser Flag gesetzt, so bedeutet dies, dass die Informationen in der Datei nicht in derselben Reihenfolge abgelegt sind, in der sie bei der Ausgabe präsentiert werden müssen. dwTotalFrames: Die Gesamtanzahl der Frames (Einzelbilder) der Videodaten in der Datei wird durch diesen Wert angegeben. dwInitialFrames: dwInitialFrames wird nur für „interleaved“ Clips verwendet. Werden derartige Sequenzen erzeugt, so wird die Anzahl der Einzelbilder vor dem eigentlichen ersten Frame der Sequenz in diesem Feld gespeichert. dwStreams: Bestimmt die Anzahl der Spuren in der Datei. Ein Clip, der sowohl Audio- als auch Videodaten enthält, besitzt 2 Spuren. dwSuggestedBufferSize: Dieser Parameter charakterisiert die empfohlene Puffergröße beim Lesen der Datei. Der Lesepuffer sollte generell groß genug sein, um einen Block vollständig aufnehmen zu können. 58 AEIOU UND FILM • • • Audio Video Interleave (AVI) dwWidth, dwHeight: Damit werden die Bildbreite und die Bildhöhe des AVI-Clips in Pixel angegeben. dwScale, dwRate: Diese beiden Felder werden verwendet, um die allgemeine Zeitskala für die Datei festzulegen. Zusätzlich zu der allgemeinen Skala kann jede Spur noch ihre eigene Zeitskala besitzen. Die Zeitskala (in Samples per Second) wird durch Division von dwRate durch dwScale ermittelt. dwStart, dwLength: Die restlichen zwei Felder geben die Startzeit und die Spieldauer des AVI-Clips an. Die Einheiten für diese Werte werden durch dwRate und dwScale festgelegt. Der Wert des Feldes dwStart ist üblicherweise gleich Null. Im Anschluss an den Hauptkopf folgen ein oder mehrere ´strl´-Blöcke, je nachdem, ob die Datei eine oder mehrere Spuren enthält. Für jede der Spuren ist ein entsprechender ´strl´Block erforderlich, da dieser Informationen über die in der Spur befindlichen Daten bereitstellt. Jeder dieser Blöcke muss sich aus einem Spurkopf, eingeleitet durch den vierstelligen Code ´strh´, und einem Spurformat-Block, zu erkennen an dem ebenfalls vierstelligen Code ´strf´, zusammensetzen. Eventuell kann noch ein weiterer Block mit der Bezeichnung ´strd´, der die Spurdaten speichert, im ´strl´-Block zu finden sein. Zum besseren Verständnis sei auch für den Spurkopf die zugehörige Datenstruktur angeführt und kurz erklärt. Typedef struct { FOURCC fccType; FOURCC fccHandler; DWORD dwFlags; DWORD dwReserved1; DWORD dwInitialFrames; DWORD dwScale; DWORD dwRate; DWORD dwStart; DWORD dwLength; DWORD dwSuggestedBufferSize; DWORD dwQuality; DWORD dwSampleSize; } • • • fccType: Im Spurkopf wird die Art der in der jeweiligen Spur enthaltenen Daten durch einen vierstelligen Zeichencode beschrieben. Wenn dieser Wert auf ´vids´gesetzt ist, dann beinhaltet diese Spur Videodaten. Ist für diesen Wert ´auds´eingetragen, so handelt es sich um eine Audiospur. fccHandler: Das Feld fccHandler stellt einen vierstelligen Zeichencode bereit, der angibt, welcher Kompressor und welcher Dekompressor für diese Datei verwendet werden kann. dwFlags: Analog zum Hauptkopf liegen auch beim Spurkopf alle Flags der Spur im Feld dwFlags. Zwei verschiedene Flags können an dieser Stelle eingetragen sein. Einerseits das Flag AVISF_DISABLED, das angibt, dass die Datei nur dann gerendert werden soll, wenn der Anwender (bzw. die Software) es explizit verlangt. 59 AEIOU UND FILM • • Audio Video Interleave (AVI) Andererseits das Flag AVISF_VIDEO_PALCHANGES, das anzeigt, dass Palettenänderungen in die Datei eingebettet sind. dwInitialFrames: dwInitialFrames wird nur für „interleaved“ Clips verwendet. Werden derartige Sequenzen erzeugt, so wird die Anzahl der Einzelbilder vor dem eigentlichen ersten Frame der Sequenz in diesem Feld gespeichert. dwScale, dwRate, dwLength, dwSuggestedBufferSize, dwQuality, dwSampleSize: Die übrigen Felder beschreiben die Wiedergabe-Charakteristiken der Spur. Zu diesen Faktoren gehören die Wiedergabe-Rate (dwScale und dwRate), die Beginnzeit der Sequenz (dwStart), die Spieldauer der Sequenz (dwLength), die Größe des Lesepuffers (dwSuggestedBufferSize), ein Indikator für die Datenqualität (dwQuality) und die Samplegröße (dwSampleSize). Wie in der Auflistung zu sehen ist, befinden sich im Spurkopf teilweise dieselben Felder, wie sie auch im Hauptkopf vorhanden sind. Der Unterschied zwischen den jeweiligen Feldern liegt darin, dass sich die im Hauptkopf gespeicherten Werte auf die gesamte Datei, jene im Spurkopf hingegen nur auf die entsprechende Spur beziehen. Auf den Spurkopf muss immer ein Spurformat-Block folgen. Darin liegt die Beschreibung des Formates, welchem die Daten in der Spur unterliegen. Bei Videospuren sind die Daten in einer BITMAPINFO-Struktur abgelegt, inklusive der gesamten benötigten Paletteninformation. Die Struktur, die bei Tonspuren verwendet wird, ist entweder WAVEFORMATEX, eine erweiterte Form des WAVEFORMAT, oder PCMWAVEFORMAT. Der ´strl´-Block kann auch einen Datenblock für die aktuelle Spur enthalten. Falls er verwendet wird, folgt dieser Block auf den Spurformat-Block und wird durch die Zeichen ´strd´ gekennzeichnet. Das Format und der Inhalt dieses Blocks werden durch die verwendbaren Treiber für die Kompression und Dekompression definiert. Diese Information wird von den einzelnen Treibern bei der Konfiguration verwendet. Player und Encoder, die RIFF-Dateien lesen oder schreiben, müssen diese Information nicht dekodieren. Bei der Wiedergabe verbindet ein AVI-Player die Spurkopfdaten im LIST ´hdrl´-Block mit den Spurdaten im LIST ´movi´-Block, indem er die in den ´strl´-Blöcken angegebene Reihenfolge interpretiert. Das heisst, der erste ´strl´-Block wird auf die Spur 0, der zweite auf die Spur 1 angewendet und so weiter. Wenn also der erste ´strl´-Block Wave-Audiodaten beschreibt, dann befinden sich diese Daten in der ersten Spur (Spur 0). Ebenso gilt, dass, wenn der zweite ´strl´-Block Videodaten beschreibt, diese Videodaten in der zweiten Spur (Spur 1) gefunden werden können. Der oben angesprochene Block wird durch die Zeichenkette LIST ´movi´ eingeleitet und folgt auf den Dateikopf. Dort befinden sich die eigentlichen Datenblöcke in den einzelnen Spuren, sprich die Audio- und Videodaten selbst. Die Datenblöcke können dabei direkt im ´movi´Block liegen oder auch in mehreren ´rec´-Blöcken gekapselt sein. Diese Gruppierung bedingt jedoch, dass die einzelnen Gruppenblöcke auf einmal vom Datenträger gelesen werden. Wie jeder andere RIFF-Block enthalten auch die Datenblöcke eine vierstellige Zeichenkette, die den Blocktyp kennzeichnet. Die ersten beiden Zeichen geben dabei die Nummer des Blockes an, die restlichen beiden bezeichnen die Art der im Block gespeicherten Information. Für einen Waveform-Block lautet der zweistellige Code ´wb´. Daraus folgt, wenn sich dieser Waveform-Block in der zweiten Spur befindet, dann lautet die entsprechende 4-Zeichenkette 60 AEIOU UND FILM Audio Video Interleave (AVI) ´01wb´. Da die gesamte Formatinformation im Kopf abgelegt ist, beinhalten die Audiodaten in den Datenblöcken keinerlei Angaben über ihr Format. Das Format eines derartigen Audioblockes sieht demnach wie folgt aus (## steht für die Nummer der Spur): WAVE BYTE Bytes `##wb´ abBytes []; Videodaten können komprimierte oder unkomprimierte DIB’s sein. Bei einem unkomprimierten DIB ist der Wert BI_RGB, andernfalls ein davon verschiedener Wert in das biCompression-Feld der zugehörigen BITMAPINFO15-Struktur eingetragen. Der Datenblock eines unkomprimierten DIB besteht aus RGB-Bilddaten. Diese Blöcke werden charakterisiert durch den zwei Zeichen langen Code ´db´. Datenblöcke eines komprimierten DIB hingegen werden durch die Zeichenkette ´dc´ gekennzeichnet. In beiden Fällen sind keine Kopfdaten für die DIB’s in den Datenblöcken verpackt. Im Folgenden ist die Struktur für unkomprimierte und komprimierte DIB’s zu sehen: DIB Bits ´##db´ Byte abBits [] Compressed DIB Byte abBits [] ´##dc´ Videodatenblöcke können auch neue Farbbaletteneinträge definieren, die dazu verwendet werden, um die Palette beim Abspielen der AVI-Sequenz zu aktualisieren. Der Code für diese Blöcke lautet ´pc´. Die für derartige Blöcke vorgesehene Datenstruktur sei hier der Vollständigkeit halber kurz gezeigt: Typedef struct { BYTE BYTE WORD PALETTEENTRY } • • bFirstEntry; bNumEntries; wFlags; peNew; bFirstEntry, bNumEntries: Mit bFirstEntry wird festgelegt, welcher der erste zu ändernde Eintrag in der Palette ist. Im Feld bNumEntries wird hinterlegt, wie viele Einträge geändert werden sollen. peNew: Die neuen Farbeinträge sind in diesem Feld gespeichert. Wie bereits erwähnt wurde, kann eine AVI-Datei nach dem LIST ´movi´-Block noch einen Indexblock besitzen, der durch die vierstellige Zeichenkette ´idx1´ eingeleitet wird. Dieser enthält, wenn notwendig, eine Liste von Datenblöcken und deren Position innerhalb der Datei. Dadurch wird ein effizienter wahlweiser Zugriff auf die Informationen innerhalb der Datei ermöglicht, da eine Applikation eine bestimmte Tonsequenz oder eine bestimmte Bildfolge in der Datei lokalisieren kann, ohne diese als Ganzes zu scannen. Folgende Datenstruktur ist für Indexblöcke definiert: 15 Genaue Informationen zu diesem Format können in Microsoft Windows Multimedia Programmer’s Reference [MICROSOFT92a] gefunden werden. 61 AEIOU UND FILM Audio Video Interleave (AVI) Typedef struct { DWORD DWORD DWORD DWORD } • • • ckid; dwFlags; dwChunkOffset; dwChunkLength; ckid: Dieses Feld enthält die Zeichenkette, durch die einzelne Indexblöcke identifiziert werden können. dwFlags: Das dwFlags-Feld enthält alle Flags des Blocks. Folgende können gesetzt sein: o AVIIF-KEYFRAME zeigt Keyframes in der Videosequenz an. Diese Bilder benötigen keinerlei Videodekompression, bevor sie angezeigt werden können. o AVIIF_NOTIME bedeutet, dass ein bestimmter Block das Zeitverhalten der Sequenz nicht beeinflusst. Werden zum Beispiel Paletteneinträge geändert, so sollte dies während der Ausgabe der Einzelbilder geschehen. Das heisst, wenn ein Programm die Spielzeit für eine AVI-Sequenz bestimmen soll, dürfen Blöcke mit gesetzten AVIIF_NOTIME-Flag nicht miteingerechnet werden. o AVIIF_LIST gibt an, dass es sich bei dem aktuellen Block um einen LISTBlock handelt. dwChunkOffset, dwChunkLength: Durch diese beiden Felder wird die Position des Blockes innerhalb der Datei sowie dessen Länge angegeben. Dabei bedeutet dwChunkOffset die Position des Blockes relativ zum LIST ´movi´-Block. Nach dieser theoretischen Betrachtung soll auch die praktische Anwendung, das heisst die Erzeugung eines derartigen Videoclips, nicht zu kurz kommen. Als Beispielsequenz für die folgenden Erklärungen dient ein Kurzfilm aus dem AEIOU-Projekt, und zwar der „Kranzltanz“, getanzt von der kroatischen Volkstanzgruppe „Kolo Slavuj“ (Abbildung 23). Dieser Clip ist sehr gut als Testsequenz geeignet, da er sowohl schnelle bewegte Bilder als auch viele Farben und eine Tonspur aufweist. Aus diesem Grund stellt dieser Film hohe Ansprüche an die Testkandidaten. Abbildung 23: Der "Kranzltanz" aus dem AEIOU-Videoalbum 62 AEIOU UND FILM 4.2.1 Audio Video Interleave (AVI) Generierung von Sequenzen im AVI-Format Bei der Erzeugung der einzelnen Clips sind Videoformate nicht mehr so genügsam, wie es im Audiobereich der Fall war. Audio Video Interleave bildet dabei keine Ausnahme. Die Anforderungen bezüglich der Grundausstattung des Rechners, also Prozessor, Hauptspeicher und ähnliches, halten sich noch in Grenzen, noch immer ist ein Standard-PC ausreichend. Zusätzlich sind für die Aufnahme von Videoclips im AVI-Format eine Videobearbeitungskarte sowie ein Videoplayer als Eingabegerät erforderlich. Für die Untersuchungen im Rahmen dieser Arbeit wurde eine MIRO DC20-Videobearbeitungskarte kombiniert mit einem S-VHS-Recorder verwendet. Eine Darstellung des Anschlussplanes befindet sich in Anhang A. Softwareseitig stehen je nach weiterem Verwendungszweck zwei verschiedene Encoder zur Verfügung. Wenn eine spätere Konvertierung in MPEG beabsichtigt ist, so empfiehlt es sich, die Clips mit Miro VidCap 32 aufzunehmen, in allen anderen Fällen ist aufgrund der größeren Bedienerfreundlichkeit das Softwarepaket Adobe Premiere vorzuziehen. Da für die Filme des Projektes AEIOU eine Hardware-Lösung für die Aufnahme in MPEG zur Verfügung stand, war die Aufnahme mit Miro VidCap 32 nicht von Belang. Aus diesem Grund ist im Folgenden nur die Generierung von Videoclips im AVI-Format mit Adobe Premiere v4.2 kurz erklärt. In Abbildung 24 werden die einzelnen Stufen bei der Erzeugung von AVIFilmen gezeigt. Abbildung 24: Ablaufskizze für die Erstellung von AVI-Sequenzen 63 AEIOU UND FILM Audio Video Interleave (AVI) Bevor mit der Aufnahme eines Clips begonnen werden kann, ist es notwendig, dass bestimmte Einstellungen vorgenommen werden. Da die Möglichkeit besteht, mehrere Sequenzen hintereinander zu digitalisieren, ist es zweckmäßig, zuerst jene Parameter festzulegen, die für alle aufzunehmenden Filme Gültigkeit haben. • • Das Programm Adobe Premiere 4.2 wird über das Windows Startmenü gestartet. Gleich nach dem Programmstart wird der Benutzer aufgefordert, einzustellen, welche Art von Videoprojekt erstellt werden soll (siehe Abbildung 25). Im Falle der Videosequenzen des AEIOU-Projektes war die Einstellung „Presentation 240x180“ zutreffend. Bei dieser Einstellung werden die Clips im Format 240x180 Bildpunkten gespeichert. Diese Einstellung beeinflusst nur das Bildformat der endgültigen AVIDatei, nicht jedoch das Format bei der Aufnahme. Ausserdem ist diese Einstellung nur als Voreinstellung zu sehen, da sie bei der Speicherung selbst noch angepasst werden kann. Es empfiehlt sich trotzdem, die Bildgröße des Clips gleich an die Anforderungen bei der späteren Verwendung anzupassen, um nicht unnötig Speicherplatz zu verschwenden. Sollte diese noch nicht bekannt sein, ist man gut beraten, eher ein größeres Bildformat zu wählen, da eine spätere Reduktion ohne merkbaren Qualitätsverlust möglich ist, ein Vergrößern des Bildes aber nicht. Abbildung 25: Öffnen eines neuen Projektes • Danach gelangt man in das Hauptfenster des Programms. Das Hauptfenster von Adobe Premiere präsentiert sich vorerst nur mit dem Schnitt-, dem Vorschau- und dem Clipfenster. Erst über Wahl von Movie Capture aus dem Menü File/Capture wird ein neuer Menüpunkt (Capture Movie) erhalten. Darüber hinaus wird ein zusätzliches Fenster, das Aufnahmefenster, geöffnet. In diesem ist, sofern eine Videoquelle angeschlossen und die Wiedergabe gestartet wurde, das Eingabesignal dieser Videoquelle zu sehen. Eine Ansicht des Hauptfensters mit bereits gestarteter Videowiedergabe wird in Abbildung 26 gezeigt. 64 AEIOU UND FILM Audio Video Interleave (AVI) Abbildung 26: Das Hauptfenster von Adobe Premiere mit Videoquelle • • Anschließend muss festgelegt werden, welche Signale aufgenommen werden sollen. Dazu ist im Menü Movie Capture die Option Record Video zu selektieren, wenn das Videosignal aufgezeichnet werden soll. Um in der digitalisierten Sequenz auch das Audiosignal zu integrieren, muss die Option Record Audio gesetzt sein. Im Projekt AEIOU wiesen nicht alle Sequenzen eine Audiospur auf. Trotzdem wurde auch bei diesen standardmäßig sowohl das Video- als auch das Audiosignal aufgezeichnet, da zu einem späteren Zeitpunkt, beim Speichern des Clips, die Audiospur noch ausgeblendet werden kann. Durch Auswahl des Punktes Video Source im Menü Movie Capture werden Einstellungsmöglichkeiten für die Videoquelle gezeigt (Abbildung 27). Mit den nachstehend erklärten Parametern wird die Art des Eingangssignals festgelegt. Die restlichen in diesem Fenster gezeigten Parameter sind für den aktuellen Arbeitsschritt des Erstellungsprozesses noch nicht relevant. o Eingang: Mit diesem Parameter wird der Typ des Eingangssignals gewählt. Wird wie im Beispielfall ein S-VHS-Recorder als Eingabegerät verwendet, so muss die Option S-VHS eingestellt werden. o Standard: Hier wird eingestellt, welchem Standard (PAL, NTSC) das Videosignal entspricht. Videosequenzen im europäischen Raum, so auch die Filmausschnitte aus den Archiven des ORF und von Laxenburg, liegen im Regelfall im PALStandard vor. 65 AEIOU UND FILM Audio Video Interleave (AVI) o Qualität: Mit dieser Auswahlliste wird die Qualität des eingehenden Signals angegeben. Wie beim Punkt Eingang sollte hier S-VHS-Recorder gewählt werden, wenn ein derartiges Gerät als Eingabegerät verwendet wird. Abbildung 27: Festlegung der Videoquelle • Wie bereits zu Beginn erwähnt wurde, wird die Bildgröße bei der Aufnahme durch die Einstellung für das Projekt bei Programmstart nicht beeinflusst. Dazu muss der Menüpunkt Movie Capture/Recording Options aufgerufen werden. Die Abbildungen 28-30 zeigen die Fenster, in denen das Bildformat, die Kompressionsart und die Kompressionsrate eingestellt werden können. Das Fenster Videoformat erhält man durch Drücken des Button , das Fenster Video Compression über den Button . Welche Werte dort eingestellt werden sollen, um vernünftige Ergebnisse zu erzielen, hängt von der Beschaffenheit des Ausgangsmaterials ab. Bei der Datenaufbereitung für das Projekt AEIOU standen als Quelle mehrere Videokassetten im PAL-Format zur Verfügung. Da Videoaufnahmen dieses Standards ein Seitenverhältnis von 4:3 und eine Bildfolge von 25 Bildern je Sekunde aufweisen, wurden folgende Einstellungen gewählt: o Video-Rate (Abbildung 28): 25 fps (=Frames pro Sekunde) o Video Format (Abbildung 29): Horizontal: volle Auflösung Zeitlich: beide Halbbilder Seitenverhältnis: 4:3 Bildgröße: 720x540 Datenformat: MJPEG-komprimiert Kompression: 7,0:1 o Compression (Abbildung 30): No Recompression o Options (Abbildung 28): Report dropped frames Conform movie to 25 fps 66 AEIOU UND FILM Audio Video Interleave (AVI) Abbildung 28: Einstellung der Aufnahmeoptionen Abbildung 29: Videoformat festlegen 67 AEIOU UND FILM Audio Video Interleave (AVI) Abbildung 30: Wahl der Videokompression • Die Tonparameter werden über das Menü Movie Capture/Audio Recording Options festgelegt (siehe Abbildung 31). Die Sequenzen des AEIOU-Videoalbums wurden unabhängig von der vorhandenen Tonspur mit folgenden Werten aufgezeichnet: o Format: 16 Bit Stereo o Rate: 44 kHz o Type: Uncompressed Abbildung 31: Einstellen der Audioeigenschaften Damit ist der erste Schritt, die Einstellung der für alle Sequenzen gleichbleibenden Parameter, abgeschlossen. Für diesen Abschnitt gestaltet es sich noch ziemlich einfach, die richtigen Werte herauszufinden. Nun kann mit der Aufnahme der Filmausschnitte begonnen werden. Dazu muss die entsprechende Videokassette in den Rekorder eingelegt und der gewünschte Abschnitt herausgesucht werden. Um nun die restlichen Bildeinstellungen vornehmen zu können, ist es erforderlich, dass die Zielsequenz im Aufnahmefenster sichtbar ist. • Danach wird wieder der Punkt Video Source im Menü Movie Capture ausgewählt (Abbildung 27). Folgende Kennwerte können hier eingestellt werden. o Helligkeit: Durch Verändern dieses Wertes kann die Helligkeit des eingehenden Signals bei der Aufnahme beeinflusst werden. Höhere Werte ergeben dabei hellere Bilder, niedrigere Werte entsprechend dunklere Bilder. 68 AEIOU UND FILM Audio Video Interleave (AVI) o Kontrast: Über diesen Parameter kann die Stärke des Hell/Dunkel-Kontrastes bestimmt werden. Hohe Werte bedingen einen starken Kontrast, niedrige Werte schwache Abstufungen. o Sättigung: Festlegung der Farbintensität bei der Aufnahme. Mit höheren Werten werden satte, kräftige Farben erreicht. Durch die unterschiedliche Beschaffenheit der einzelnen Videos sowie manchmal sogar der einzelnen Bilder innerhalb eines Filmes kann leider kein Standard-Verfahren angegeben werden, mit dem einfach für alle Clips die richtigen Werte gefunden werden können. Vor allem die unterschiedlichen Filme aus der Sammlung für das Videoalbum des AEIOU machten es oftmals nötig, das „Trial and Error“-Verfahren anzuwenden bzw. mit empirischen Werten zu arbeiten. Das heißt, es wurden bestimmte Werte eingestellt und der gesamte Clip mit den eingestellten Werten aufgezeichnet. Danach wurde das Video zur Gänze abgespielt und das erzielte Ergebnis überprüft. Dieser Vorgang musste so oft wiederholt werden bis der aufgenommene Clip die gewünschte (bzw. bestmögliche) Qualität erreicht hatte. Jene Werte, die für den „Kranzltanz“ das dem Original gerechtwerdende Ergebnis hervorbrachten, sind in Tabelle 7 zu sehen. Tabelle 7: Bildparameter für den „Kranzltanz“ aus dem Videoalbum des AEIOU Sequenznummer o503a (Kranzltanz) Helligkeit Sättigung Kontrast 150 120 130 Diese Werte konnten erst nach mehreren Versuchen gefunden werden. Um im Falle einer erneuten Digitalisierung nicht wieder die gesamte „Trial and Error“-Reihe durchlaufen zu müssen, wurden für jeden aufgenommenen Film die verwendeten Werte in einer Tabelle gesammelt. Die vollständige Auflistung befindet sich in Anhang B. • • Nachdem nun alle vor der Aufzeichnung nötigen Einstellungen getätigt wurden, kann die eigentliche Aufnahme begonnen werden. Dazu muss der Videorecorder auf Wiedergabe geschaltet sein und das Band an die gewünschte Stelle gespult worden sein. Um die Aufnahme zu starten, muss zu Beginn der gewünschten Sequenz auf Record geklickt werden. Beendet wird die Aufnahme mit einem neuerlichen Klick in das MovieCapture-Fenster oder durch Drücken der Escape-Taste. Die Beginn- und Endzeitpunkte müssen bei der Aufnahme mit Adobe Premiere nicht unbedingt genau getroffen werden, da es noch die Möglichkeit gibt, den digitalisierten Clip zu bearbeiten. Zuvor muss allerdings die Sequenz noch über File/SaveAs unter einem beliebigen Namen gespeichert werden. Im Anschluss muss mit der Maus in das Filmfenster geklickt und der Clip bei gedrückter Maustaste in das Schnittfenster gezogen werden (siehe Abbildung 32). In diesem Fenster wird dann sowohl die Audio- als auch die Videospur angezeigt. Dort ist es nun möglich, verschiedene Veränderungen des Clips vorzunehmen, wie zum Beispiel bestimmte Einzelbilder zu entfernen, andere einzufügen oder die Tonspur zu manipulieren. 69 AEIOU UND FILM Audio Video Interleave (AVI) Abbildung 32: Das Schnittfenster von Adobe Premiere • Sollte die Darstellung der einzelnen Clip-Abschnitte (bzw. Einzelbilder) nicht groß genug sein, um die richtigen Anfangs- und Endbilder erkennen zu können, besteht die Möglichkeit, die Darstellungsgröße zu verändern. Dazu muss mit der rechten Maustaste auf die blaue Titelleiste geklickt werden. Im daraufhin erscheinenden Fenster (Abbildung 33) kann die Darstellungsart für die Sequenz verändert werden. Abbildung 33: Änderung der Darstellung im Schnittfenster 70 AEIOU UND FILM • Audio Video Interleave (AVI) Die Länge des Clips kann verändert werden, indem wie folgt Anfangs- und Endmarke des Films gesetzt werden. o Mit dem Schieberegler die Auflösung auf 1 Frame setzen, damit alle Einzelbilder angezeigt werden o Auf klicken und danach jenes Bild auswählen, mit dem der Clip beginnen soll. o Auf klicken und danach das erste Bild nach jenem auswählen, mit dem der Clip enden soll. o Mit dem Schieberegler die Auflösung auf 1 Sekunde setzen und den Clip nach links ziehen, bis die Anfangsmarke bei 0 Sekunden liegt. • • Der gelbe Balken muss nun von der Anfangsmarke bis zur Endmarke gezogen werden, um die Länge des Videos zu bestätigen. Bevor der geschnittene Film gespeichert werden kann, müssen folgende Einstellungen im Konvertierungsdialog (Menü Make/Make Movie, siehe Abbildung 34) getätigt werden: o Durch Drücken der Schaltfläche Output Options wird das Eingabefenster für die Ausgabeeinstellungen geöffnet (Abbildung 35). Als Richtwerte seien die im Projekt AEIOU verwendeten Werte angegeben. Output: Work Area as AVI Movie Video (immer aktiviert): Size: 240h, 180v, 4:3 Aspect Type: Full Size Frame Audio (nur bei Sequenzen mit Ton aktiviert): Rate: 22 kHz Format: 16 Bit, Stereo Type: Uncompressed Interleave: 1 Second o Durch Drücken der Schaltfläche Compression gelangt man zum Dialog Compression Settings (Abbildung 36). Dort wird für die einzelnen Datentypen festgelegt, in welcher Qualität und mit wie starker Kompression die endgültigen Clips gespeichert werden sollen. Folgende Einstellungen wurden im Projekt AEIOU verwendet: Settings for: Video for Windows (AVI) Compressor: Method: Microsoft Video 1 Depth: Thousands Quality: 100% (High) Options: Frames per second: 25 Keyframe every 25 frames Optimize stills Special processing (Schaltfläche Special, Abbildung 37): Gamma: 1.0 Better Resize: On Noise Reduction: None Deinterlace: Off Cropping: Off 71 AEIOU UND FILM Audio Video Interleave (AVI) o Namen der Ausgabedatei eingeben Um die mehr als 360 Filmsequenzen eindeutig zu benennen, wurde ein fünfstelliger Code entwickelt. Dieser Code ermöglicht einerseits festzustellen, aus welchem Archiv ein bestimmter Clip stammt und bietet andererseits durch die Erweiterbarkeit auf 8 Zeichen für etwa die Kürzel ge und en eine spätere Implementation von Mehrsprachigkeit. Dieser Code setzt sich wie folgt zusammen: <Herkunftskürzel><Filmnummer><Unterscheidungsbuchstabe>.<Erweiterung> Der erste Teil, das Herkunftskürzel, kann, je nach Ursprung des Films, entweder a (AVL), o (ORF) oder f (Filmarchiv von Laxenburg) sein. Die dreistellige Filmnummer ergibt sich aus der Anordnung der Originalsequenzen auf den jeweiligen Kassetten. Da aus manchen Sequenzen mehr als nur ein Clip entnommen wurde, musste auch ein zusätzliches Zeichen, der Unterscheidungsbuchstabe, eingeführt werden. Die Erweiterung schließlich wird durch das Videoformat, in dem der Clip vorliegt, bestimmt (zum Beispiel avi, mpg). • Schließlich muss nur noch Save gedrückt werden, um den geschnittenen Film abzuspeichern. Der Konvertierungsvorgang kann je nach Länge des Films mehrere Minuten dauern. Abbildung 34: Der "Make Movie"-Dialog 72 AEIOU UND FILM Audio Video Interleave (AVI) Abbildung 35: Festlegen der Ausgabeeinstellungen Abbildung 36: Kompressionseinstellungen wählen 73 AEIOU UND FILM Audio Video Interleave (AVI) Abbildung 37: Zusätzliche Parameter festlegen 4.2.2 Integration von AVI-Sequenzen in eine HTML-Seite Auch ein AVI-Clip kann in eine HTML-Seite eingebaut werden. Dies erfolgt auf dieselbe Art, wie sie schon bei den Audioformaten gezeigt wurde: durch Angabe eines Links auf die am Server abgelegte Videodatei. Der nachstehende HTML-Code stellt einen Auszug aus der in Abbildung 38 gezeigten HTML-Seite dar. Wird in dieser Seite auf den Schriftzug AVI oder das voranstehende Symbol geklickt, so wird der Kurzfilm „Kranzltanz“ in einem eigenen Fenster geöffnet und abgespielt. <HTML> <HEAD> <TITLE>"Kranzltanz", Burgenland.</TITLE> </HEAD> <BODY> <TABLE ALIGN=CENTER CELLPADDING=10 BORDER=0> <TR> <TD> <IMG SRC="/aeiou.film.data.image/o503a.jpg"> </TD> <TD VALIGN=CENTER> <TABLE BORDER=0 CELLPADDING=5> <TR> 74 AEIOU UND FILM Audio Video Interleave (AVI) <TD COLSPAN=2>"Kranzltanz", getanzt von der kroatischen Volkstanzgruppe "Kolo Slavuj", Burgenland. </TD> </TR> <TR> <TD VALIGN=CENTER> <A HREF="/aeiou.film.data.film/o503a.avi"><IMG SRC= "/aeiou.film.data.image.general/movie_ton.gif" BORDER=0></A> </TD> <TD VALIGN=CENTER ALIGN=LEFT> <A HREF="/aeiou.film.data.film/o503a.AVI">AVI (74.5 MB)</A> </TD> </TR> </TABLE> </TD> </TR> </TABLE> </BODY> </HTML> Abbildung 38: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im AVI-Format 75 AEIOU UND FILM 4.2.3 Audio Video Interleave (AVI) Ergebnisse Wie man dies von einem bereits etablierten und seit geraumer Zeit eingesetzten Format erwartet, bieten die Ergebnisse der mit AVI durchgeführten Tests kaum Überraschungen. Die Bildqualität der erstellten Videoclips ist bestechend hoch und hat damit die gesetzten Erwartungen voll erfüllt. Auch die Qualität einer eventuell mitaufgezeichneten Tonspur ist durch die interne Verwendung des in Abschnitt 3.2 behandelten Microsoft WaveformFormates sehr gut. Zusätzliche Pluspunkte dieses Formates stellen die relative hohe Flexibilität bei der Wahl der Qualitätsstufen sowie die nachträgliche Editierbarkeit des digitalisierten Clips dar. Dies bedeutet, dass es nach der Aufnahme noch möglich ist, Beginn und Ende der Sequenz bildgenau festzulegen oder sogar einzelne Teile der Sequenz (auch aus der Mitte) zu entfernen. Durch den eher hohen Bedarf an Speicherplatz, wie für das Beispielvideo in Abbildung 38 fast 75 MB, ist Audio Video Interleave nicht dazu geeignet, im Internet zur Betrachtung angeboten zu werden. Die damit verbundenen Wartezeiten beim Herunterladen auch von kurzen Filmen wären zu lang und den Benutzern nicht zumutbar. Doch die Stärke dieses Formates liegt darin, als Quelle für eine weitere Konvertierung in viele andere Formate, wie zum Beispiel Real Video, Moving Pictures Expert Group (MPEG) oder Apple QuickTime geeignet zu sein. Für eine solche Weiterverarbeitung empfiehlt es sich, die AVI-Clips wie im Projekt AEIOU mit einer Bildgröße von mindestens 240x180 Bildpunkten aufzunehmen, da es in jedem Fall noch möglich ist, die Abmessungen gegebenenfalls bei einer Weiterverarbeitung entweder über den verwendeten Konverter, wenn er diese Aktion anbietet (z.B.: Vivo Producer), oder über das Programm, mit dem der AVI-Clip erstellt wurde (z.B. Adobe Premiere) zu reduzieren, ohne dabei die Qualität des Clips negativ zu beeinflussen. Eine Vergrößerung der Abmessungen hingegen ist nicht ohne Einbußen möglich. Einen weiteren bedeutenden Parameter stellt die Anzahl der Einzelbilder pro Sekunde, auch Framerate genannt, dar. Wenn als Grundlage für die Erstellung von AVI-Clips Videosequenzen im PAL-Standard verwendet werden, so sollte für diesen Parameter der Wert 25 eingesetzt werden. Wie in den durchgeführten Test ermittelt werden konnte (siehe Abbildung 39), kann durch den Umstand, dass auch der PAL-Standard 25 Einzelbilder pro Sekunde verwendet, auf diese Art die beste Annäherung an das Original erreicht werden. Durch eine Abweichung von diesem Wert bewirkt man keinerlei positive Veränderung. So etwa hat eine Verringerung dieser Framerate eine Verschlechterung der Flüssigkeit der Bildfolge zur Folge, weil einige Teilbilder nicht mehr mitgespeichert werden. Ein zuvor noch schön gleichmäßig rollender Ball scheint sich nach dieser Frameraten-Reduktion in kleinen Sprüngen voranzubewegen. Auch eine Erhöhung dieser Rate bringt keine Qualitätssteigerung für den Clip mit sich. Denn da im Originalfilm nur 25 Bilder pro Sekunde zur Verfügung stehen, erreicht man mit einer Framerate von 30 Bildern je Sekunde nur, dass manche Einzelbilder doppelt in der digitalisierten Sequenz enthalten sind. Dies ist zwar für den Betrachter kaum merkbar, aber durch die damit verbundene Verschwendung von Speicherplatz auch nicht erstrebenswert. 76 AEIOU UND FILM Audio Video Interleave (AVI) Abbildung 39: Auszug aus den Testreihen für das AEIOU-Projekt Überraschungen boten dagegen einige im Laufe der Testreihen festgestellte Seiteneffekte dieses Formates. Es zeigte sich zum Beispiel, dass AVI-Clips nicht gleich AVI-Clips sind. Sequenzen, die mit Adobe Premiere erstellt wurden, werden von einigen zur Konvertierung in andere Formate vorgesehenen Tools (z.B. XING MPEG-Encoder) nicht als Quelle akzeptiert. Sind Weiterverarbeitungen in diese Formate geplant, so müssen diese Videos zum Beispiel mit Miro Vidcap 32 erstellt werden. Ebenso ist es empfehlenswert, AVI-Clips immer in Stereo aufzunehmen, auch wenn die Quellvideos nur Mono-Ton enthalten. Denn AVI-Videos, deren Audiospur nur in MonoQualität vorliegt, können erhebliche Tonstörungen bei der Konvertierung in andere Formate verursachen. Derartige Störungen konnten zum Beispiel bei der Konvertierung von AVI nach MPEG beobachtet werden. Doch auch diese kleinen Seiteneffekte ändern nichts an der Tatsache, dass mit Audio Video Interleave ein äußerst leistungsfähiges Videoformat vorliegt, vor allem, wenn es darum geht, Videosequenzen in andere Formate weiterzuverarbeiten oder für eine spätere Weiterverarbeitung zu archivieren. 77 AEIOU UND FILM Apple QuickTime Der folgende Abschnitt stellt das Format von Apple Quick Time-Dateien vor. Anschließend wird die Generierung von Sequenzen im Quick Time-Format und deren Integration in HTMLSeiten behandelt. Danach werden die Stärken und Schwächen dieses Formates näher beleuchtet und die in den Untersuchungen erzielten Ergebnisse bezüglich Kompression und Tonqualität kommentiert und die Bedeutung dieses Formates für das Videoalbum des AEIOU-Projektes bewertet. 4.3 Das Videoformat Apple QuickTime Ähnlich wie das AVI-Format ist auch Apple QuickTime schon seit längerer Zeit im Einsatz. Dieses Format wurde ursprünglich, wie aus seinem Namen schon erkennbar ist, für Apple Macintosh entwickelt. Es ist darauf ausgerichtet, verschiedene Arten von Informationen zu speichern, die nötig sind, um mit digitalen Medien arbeiten zu können. Da dieses Format dafür verwendet werden kann, um beinahe jede nur erdenkliche Art von Medienstruktur zu beschreiben, stellt es ein ideales Format dar, um digitale Medien zwischen einzelnen Applikationen auszutauschen, ohne dabei Rücksicht auf die dahinterliegende Plattform nehmen zu müssen. Eine QuickTime-Datei speichert die Beschreibung der Daten getrennt von den Daten selbst. Die Beschreibung (Meta-Daten) wird movie genannt und enthält Informationen wie die Anzahl der Spuren, die Kompressionsart und Timing-Informationen. Ebenso ist im movie auch ein Index enthalten, der beschreibt, wo sich die Mediendaten befinden. Die Mediendaten umfassen alle restlichen Daten der Datei wie Videospuren und Audiosamples und können sowohl in derselben Datei wie die Beschreibung als auch in einer oder mehreren anderen Dateien gespeichert sein. QuickTime-Dateien verwenden zwei Basisstrukturen für die Speicherung der Daten: Atome und QT-Atome. Beide erlauben die Konstruktion einer komplexen, hierarchisch verschachtelten Datenstruktur. Ebenso ermöglichen es beide, dass Programme jene Datensegmente ignorieren, die sie nicht verarbeiten können. Jedes Atom enthält zusätzlich zu den Daten Informationen über seine Größe und seinen Typ. Dabei gibt die Größe (size) die Anzahl der enthaltenen Bytes inklusive Größe- und TypFelder an. Das Typ-Feld (type) spezifiziert den Datentyp, also das Format, der in der Datei gespeicherten Daten. Bei beiden Feldern handelt es sich um 32-Bit große Integer-Werte. Diese Atome können rekursiv aufgebaut sein. Das heißt, ein solches Atom kann mehrere andere Atome verschiedenen Typs enthalten. Zum Beispiel enthält ein movie-Atom ein weiteres Atom für jede im Film enthaltene Spur. Diese Spuratome wiederum enthalten je ein oder mehrere Medienatome zusammen mit anderen Atomen, die Spur- und FilmCharakteristiken definieren. Das Format der Daten eines solchen Atoms kann allerdings nicht nur auf Basis der TypInformationen bestimmt werden. Denn die Verwendung eines Atoms wird vor allem durch seinen Kontext bestimmt. So kann ein bestimmtes Atom verschiedene Verwendungszwecke haben, wenn es in Atomen verschiedenen Typs enthalten ist. Das bedeutet, das beim Lesen einer QuickTime-Datei nicht nur der Atom-Typ sondern auch die Hierarchie des Atoms beachtet werden muss. 78 AEIOU UND FILM Apple QuickTime Nachfolgende Abbildung 40 zeigt das Layout eines Atoms. Dabei wird ein Atom, das andere Atome enthält, als Container-Atom (container atom), und ein Atom, das keine weiteren Atome mehr enthält als Blatt-Atom (leaf atom) bezeichnet. Blatt-Atome enthalten die Atomdaten im Regelfall in Form von Tabellen. Bei der Verschachtelung von Atomen muss auf keine bestimmte Reihenfolge geachtet werden. Die einzige Ausnahme bilden hier die Verarbeitungsbeschreibungen, denn diese müssen bekannt sein, bevor die entsprechenden Daten verarbeitet werden sollen. Abbildung 40: Beispiel eines QuickTime-Atoms Atome bestehen aus einem Kopf (Header), auf den die Daten folgen. Ein derartiger Atomkopf setzt sich, wie auch in Abbildung 40 zu sehen ist, aus den folgenden Feldern zusammen: o o Atom-Größe (atom size): Dies ist ein 32-Bit-Integerwert, der die Größe des Atoms inklusive Atomkopf und Daten angibt. Bei einem Container-Atom umfasst dies die Größen aller enthaltenen Atome, bei einem Blattatom nur die Größe des Atoms selbst. Atom-Typ (atom type): Ein 32-Bit-Integerwert, der den Typ des Atoms anzeigt. Da die Struktur eines einfachen Atoms beschränkt ist, hat Apple eine erweiterte Datenstruktur entwickelt, das sogenannte QT-Atom. Diese weist ein allgemeiner verwendbares Format auf und beseitigt einige der Zweideutigkeiten, die mit einfachen Atomen verbunden sind. Vor allem gab es bei einfachen Atomen keine Möglichkeit, ohne genaue Kenntnis über das Atom festzustellen, ob es ein Container-Atom oder ein Blatt-Atom oder gar beides ist. Mit der Verwendung von QT-Atomen wird ein bestimmter Knoten eindeutig entweder als ContainerAtom oder als Blatt-Atom ausgewiesen. Da QT-Atome eine mächtigere Datenstruktur darstellen, erfordern sie auch mehr Aufwand in der Datei. 79 AEIOU UND FILM Apple QuickTime Das QuickTime-Dateiformat verwendet sowohl einfache als auch QT-Atome. Im Allgemeinen verwenden neuere Abschnitte des QuickTime-Dateiformates QT-Atome, während bei älteren Abschnitten einfache Atome zum Einsatz kommen. Abbildung 41 zeigt den Aufbau eines QT-Atoms. Abbildung 41: Beispiel eines QT-Atoms Jedes QT-Atom beginnt mit einem QT-Atom Container-Kopf, auf den das „Wurzel“-Atom (root atom) folgt. Dessen Typ wird durch den Typ des QT-Atoms bestimmt. Das „Wurzel“Atom enthält alle anderen in der Struktur enthaltenen Atome. Jedes darin enthaltene 80 AEIOU UND FILM Apple QuickTime Container-Atom beginnt mit einem QT-Atomkopf, gefolgt vom Inhalt des Atoms. Dies ist entweder ein weiteres Atom (child atom) oder es sind bereits die Daten des Atoms, jedoch niemals eine Kombination daraus. Wenn ein Atom Kinder (children) enthält, dann umfasst es ebenfalls die Daten und eventuell vorhandene Nachfolger dieser Kinder. Der QT-Atom Container-Kopf besteht aus den folgenden Feldern: o Reserviert (Reserved): Ein 10-Byte Element, das auf den Wert 0 gesetzt werden muss. o Lock Count: Ein 16-Bit-Integerwert, der ebenfalls 0 enthalten muss. Jeder QT-Atomkopf enthält nachstehend beschriebene Daten: o Größe (size): Dies ist ein 32-Bit-Integerwert, der die Größe des Atoms (in Byte) angibt. Dieser Wert umfasst sowohl den Atomkopf als auch den Inhalt. o Typ (type): Ein 32-Bit-Integerwert, der den Typ des Atoms ausweist. Wenn das aktuelle Atom nicht die Wurzel selbst ist, dann wird dieser Wert auf ´sean´ gesetzt. o Atom-ID: Dieser 32-Bit-Integerwert enthält die eindeutige Identifikationsnummer des Atoms. Die Wurzel hat immer die ID gleich 1. o Reserviert (Reserved): Ein 16-Bit-Integerwert, der den Wert 0 enthalten muss. o Anzahl der Kinder (child count): Dieses 16-Bit-Feld vom Typ Integer gibt die Anzahl der Child-Atome für das aktuelle Atom an. Diese Zahl berücksichtigt nur die direkten Nachfolger und wird nicht rekursiv gezählt. Wenn hier der Wert 0 aufscheint, dann handelt es sich um ein Blatt-Atom. o Reserviert (Reserved): Auch diese 32-Bit-Integerfeld muss 0 enthalten. Die QuickTime-Datei selbst ist nun nur eine Folge von Atomen, ohne bestimmten Regeln, die Reihenfolge betreffend, zu folgen (siehe Abbildung 42). Jedes einzelne dieser Atome hat einen bestimmten Atomtyp. Einige dieser Atome werden als Basis-Atomtypen betrachtet. Diese bilden die Grundstruktur der QuickTime-Datei, in die alle restlichen Atome eingebettet werden. Tabelle 8 zeigt eine Auflistung der unterstützten Basis-Atomtypen. Tabelle 8: Auflistung der Basis-Atomtypen des QuickTime-Formates ´free´ ´skip´ ´mdat´ ´pnot´ ´moov´ Freier (nicht benutzter) Platz in der Datei Nicht benutzter Platz in der Datei Ein Atom dieses Typs enthält die Filmdaten. Im Regelfall können diese Daten nur unter Verwendung der Film-Ressource verarbeitet werden. Verweis auf die Daten der Filmvorschau (Preview). Film-Ressource 81 AEIOU UND FILM Apple QuickTime Abbildung 42: Beispiel einer QuickTime-Datei Dies sollte als kleiner Ausflug in die Theorie, die hinter dem Apple QuickTime-Format steckt ausreichen. Für weitere Informationen sei der interessierte Leser auf die Beschreibung des QuickTime-Formates [Apple96], herausgegeben von der Apple Developer Press, verwiesen. Am Beginn dieses Kapitels wurde auf die Plattform-Unabhängigkeit von Apple QuickTime hingewiesen. Da im AEIOU-Projekt ausnahmslos Dateien im AVI-Format als Quelle für die Erzeugung von QuickTime-Clips zur Verfügung standen, bezieht sich die im Folgenden beschriebene Arbeitsweise auf Windows-Plattformen. Als Testvideo für dieses Format wurde, wie schon für AVI, der „Kranzltanz“ herangezogen. 82 AEIOU UND FILM 4.3.1 Apple QuickTime Generierung von Sequenzen im QuickTime-Format Für die Generierung von Apple QuickTime-Clips gelten dieselben Systemvoraussetzungen wie sie beim AVI-Format aufgeführt sind, abgesehen davon, dass die Videobearbeitungskarte und der Videoreplayer nicht mehr benötigt werden. Als Quelle für diese Konvertierung können AVI-Clips verwendet werden. Liegen diese vor, gliedert sich der Erstellungsprozess für QuickTime-Clips in folgende Schritte: • • • • Der gewünschte AVI-Clip wird in Adobe Premiere über das Menü File/Open geladen. Er wird dadurch, wie bei der Aufnahme im vorigen Kapitel, in ein eigenes Filmfenster geladen. Den Clip mittels Drag and Drop aus dem Filmfenster in das Schnittfenster (siehe Abbildung 33) ziehen. Analog zum Schneidevorgang im vorhergehenden Abschnitt 4.2 nun den gelben Balken über die gesamte Länge des Filmausschnittes ziehen. Vor dem Start des Konvertierungsvorgangs müssen im entsprechenden Dialog (Menü MakeMovie, siehe Abbildung 43) folgende Einstellungen getätigt werden (analog zu den für das Videoalbum im Projekt AEIOU verwendeten Werten): Abbildung 43: Der Make Movie-Dialog (QuickTime-Format) o Durch Drücken der Schaltfläche Output Options wird das Eingabefenster für die Ausgabeeinstellungen geöffnet (Abbildung 44). Als Richtwerte seien die im Projekt AEIOU verwendeten Werte angegeben. Output: Work Area as QuickTime Movie Video (immer aktiviert): Size: 160h, 120v, 4:3 Aspect Type: Full Size Frame 83 AEIOU UND FILM Apple QuickTime Audio (nur bei Sequenzen mit Ton aktiviert): Rate: 22 kHz (Musik) 11 kHz (Reden) Format: 16 Bit, Mono Type: Uncompressed Interleave: 1 Second Abbildung 44: Festlegung der Ausgabeeinstellungen (QuickTime-Format) o Durch Drücken der Schaltfläche Compression gelangt man zum Dialog Compression Settings (Abbildung 45). Folgende Werte müssen eingestellt werden: Settings for: QuickTime Compressor: Method: Video Depth: Thousands Quality: 5.00 (High) Options: Frames per second: 15 Keyframe every 15 frames Optimize stills Special processing (Schaltfläche Settings, Abbildung 37): Gamma: 1.0 Better Resize: On Noise Reduction: None Deinterlace: Off Cropping: Off o Namen der Ausgabedatei eingeben • Durch Drücken auf die Schaltfläche Save wird nun der Konvertierungsvorgang gestartet. Dies kann je nach Länge des Clips einige Minuten dauern (in etwa 15 bis 20 Minuten bei einem Clip mit einer Spieldauer von 30 Sekunden). 84 AEIOU UND FILM Apple QuickTime Abbildung 45: Kompressionseinstellungen wählen (QuickTime-Format) 4.3.2 Integration von QuickTime-Sequenzen in eine HTML-Seite Auch bei Apple QuickTime-Filmclips reicht ein Link auf die am Server gespeicherte Videodatei aus, um ihn in eine HTML-Seite einzubauen. Nachfolgend ist der entsprechende Source-Code sowie die dabei erzeugte Web-Seite gezeigt. <HTML> <HEAD> <TITLE>"Kranzltanz", Burgenland.</TITLE> </HEAD> <BODY> <TABLE ALIGN=CENTER CELLPADDING=10 BORDER=0> <TR> <TD> <IMG SRC="/aeiou.film.data.image/o503a.jpg"> </TD> <TD VALIGN=CENTER> <TABLE BORDER=0 CELLPADDING=5> <TR> <TD COLSPAN=5>"Kranzltanz", getanzt von der kroatischen Volkstanzgruppe "Kolo Slavuj", Burgenland. </TD> </TR> 85 AEIOU UND FILM Apple QuickTime <TR> <TD COLSPAN=5></TD> </TR> <TR> <TD COLSPAN=3></TD> <TD VALIGN=CENTER> <A HREF="/aeiou.film.data.film/o503a.mov"><IMG SRC= "/aeiou.film.data.image.general/movie_ton.gif" BORDER=0></A> </TD> <TD VALIGN=CENTER ALIGN=LEFT> <A HREF="/aeiou.film.data.film/o503a.mov">QuickTime (8.3 MB)</A> </TD> </TR> </TABLE> </TD> </TR> </TABLE> </BODY> </HTML> Abbildung 46: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im QuickTime-Format 86 AEIOU UND FILM 4.3.3 Apple QuickTime Ergebnisse Wie in Abbildung 46 zu sehen ist, fand das Apple QuickTime-Format im Videoalbum des AEIOU-Projektes Verwendung. Und dies, obwohl sich dieses Format in allen Belangen als mittelmäßig erwies. Es traten zwar keinerlei nennenswerte Probleme oder unangenehme Besonderheiten auf, doch auch in Bezug auf die Qualität trat QuickTime nicht in den Vordergrund. Für die Archivierung der erstellten Sequenzen ist aus zwei wichtigen Gründen das im letzten Kapitel behandelte AVI-Format vorzuziehen: erstens, weil die Bildschärfe und flüssige Bildfolge bei QuickTime nicht an den Konkurrenten heranreicht und zweitens, weil mit Ausnahme des RealVideo Encoders kein verbreiteter Konverter eine QuickTime-Quelle akzeptiert. Somit ist dieses Datenformat auch für eine spätere Weiterverarbeitung ungeeignet. Da zum Zeitpunkt der Bewertung QuickTime-Player relativ stark verbreitet waren, wurden diese Clips trotz der erwähnten Nachteile in das Videoalbum aufgenommen. Es war allerdings eine Reduktion der Qualität und Bildgrösse unerlässlich. Denn ohne entsprechende Einschränkungen bewegt sich der Platzbedarf eines Apple QuickTime-Filmes in Bereichen, die nicht zumutbare Wartezeiten beim Abspielen des Clips mit sich bringen. Aus diesem Grund ist im Interesse einer Optimierung der Ladezeiten eine Senkung der Framerate von 25 fps auf 15 fps erforderlich. Zusätzlich sollte die Bildgröße auf 160x120 Bildpunkte gesetzt werden, um den Speicherplatzbedarf weiter zu verringern. Falls diese Maßnahmen noch immer nicht ausreichend sein sollten, besteht noch die Möglichkeit, auch die Audioqualität durch Absenken der verwendeten Bits/Sample zu vermindern. Damit können akzeptabel große und im Internet verwendbare Dateien erhalten werden, auch wenn diese keine allzu hohe Qualität mehr aufweisen. Nachfolgende Tabelle zeigt ein kurzes Beispiel der Entwicklung der Dateigrößen von QuickTime-Clips (ausgehend von einer AVI-Quelle) in verschiedenen Qualitätsstufen. Bei dieser Gegenüberstellung wurde in jeder Stufe die Qualität des Ergebnisvideos verringert, indem folgende Werte der Reihe nach verändert wurden: • • • • • Framerate von 25 auf 15 fps Bildgröße von 320x240 auf 240x180 Bildpunkte Bildgröße von 240x180 auf 160x120 Bildpunkte Audio-Samplerate von 22.050 auf 11.025 Hz Audio-Qualität von 16 Bit Stereo auf 8 Bit Mono 87 AEIOU UND FILM Apple QuickTime Tabelle 9: Gegenüberstellung AVI-Apple QuickTime Quellvideo (Spielzeit: ca. 34 Sekunden) AVI-Format Video: Bildgröße: 320x240 Bildpunkte Framerate: 25 Frames/Sekunde Audio: Kompression: PCM Sample-Rate: 22.050 Hz 16 Bit/Sample Stereo 76.343 KB Ergebnisvideo 1 Apple QuickTime Video: Bildgröße: 320x240 Bildpunkte Framerate: 25 Frames/Sekunde Audio: Kompression: PCM Sample-Rate: 22.050 Hz 16 Bit/Sample Stereo Apple QuickTime Video: Bildgröße: 320x240 Bildpunkte Framerate: 15 Frames/Sekunde Audio: Kompression: PCM Sample-Rate: 22.050 Hz 16 Bit/Sample Stereo Apple QuickTime Video: Bildgröße: 240x180 Bildpunkte Framerate: 15 Frames/Sekunde Audio: Kompression: PCM Sample-Rate: 22.050 Hz 16 Bit/Sample Stereo Apple QuickTime Video: Bildgröße: 160x120 Bildpunkte Framerate: 15 Frames/Sekunde Audio: Kompression: PCM Sample-Rate: 22.050 Hz 16 Bit/Sample Stereo 43.371 KB Ergebnisvideo 2 Ergebnisvideo 3 Ergebnisvideo 4 88 26.406 KB 17.520 KB 10.278 KB AEIOU UND FILM Ergebnisvideo 5 Ergebnisvideo 6 Ergebnisvideo 7 Apple QuickTime Apple QuickTime Video: Bildgröße: 160x120 Bildpunkte Framerate: 15 Frames/Sekunde Audio: Kompression: PCM Sample-Rate: 11.025 Hz 16 Bit/Sample Stereo Apple QuickTime Video: Bildgröße: 160x120 Bildpunkte Framerate: 15 Frames/Sekunde Audio: Kompression: PCM Sample-Rate: 11.025 Hz 16 Bit/Sample Mono Apple QuickTime Video: Bildgröße: 160x120 Bildpunkte Framerate: 15 Frames/Sekunde Audio: Kompression: PCM Sample-Rate: 11.025 Hz 8 Bit/Sample Mono 89 8.782 KB 8.034 KB 7.660 KB AEIOU UND FILM Moving Pictures Expert Group Der folgende Abschnitt gibt einen Einblick in das Format von MPEG-Dateien und behandelt anschließend die Generierung von Sequenzen im AVI-Format und deren Integration in HTML-Seiten. Im Anschluss daran werden die Stärken und Schwächen dieses Formates näher beleuchtet und die in den Untersuchungen erzielten Ergebnisse bezüglich Kompression und Tonqualität kommentiert. Dabei wird auch die Bedeutung dieses Formates für das Videoalbum des AEIOU-Projektes bewertet. Die Betrachtungen in diesem Abschnitt betreffen das Format MPEG1 (im Folgenden als MPEG bezeichnet), da dieses im Gegensatz zu den übrigen Vertretern dieses Videostandards (z.B. MPEG2 oder MPEG4) eine große Bedeutung für das AEIOU-Projekt hatte. 4.4 Das Videoformat Moving Pictures Expert Group MPEG (Moving Pictures Expert Group) lautet der Name des ISO-Komitees, das sich mit der digitalen Speicherung von Audio- und Videodaten beschäftigt und als Folge davon auch der Name des Standards, den dieses Komitee hervorgebracht hat. Dieser Standard definiert eine Bitstream-Repräsentation von synchronisierten digitalen Audio- und Videodaten, die derart komprimiert sind, dass sie in eine Bandbreite von 1,5 Mbit/Sekunde passen. Diese Bandbreite korrespondiert zu der Datenlesegeschwindigkeit von CD-ROM und DAT; und ein großes Verwendungsfeld des MPEG-Formates ist auch die Speicherung von audiovisuellen Daten auf eben diesen Datenträgern. Außerdem hat MPEG in den vergangenen Jahren auch im Internet als Standard für Videoclips viel an Boden gewonnen. Das Ziel bei der Entwicklung dieses Standards war es, einen Kodierungsalgorithmus zu entwickeln, der einen hohen Grad an Flexibilität aufweist und deshalb in vielen verschiedenen Anwendungen verwendet werden kann. Um dieses Ziel erreichen zu können, ist ein bestimmter Teil der Parameter, welche die Charakteristiken des kodierten Bitstreams und der Decoder beschreiben, bereits im Bitstream selbst enthalten. Das erlaubt zum Beispiel, dass der Algorithmus für Bilder mit einer Vielzahl an Größen und Seitenverhältnissen angewendet werden kann. Da durch diesen Standard ein breites Spektrum der Charakteristiken von Bitstreams beschrieben werden kann, wurde eine Untermenge dieser Kodierungsparameter, auch „Constrained Parameters“16 genannt, definiert. Dabei werden zwar einige Parameter auf bestimmte erlaubte Wertebereiche beschränkt, doch dieser Standard verpflichtet nicht zu der Einhaltung dieser Einschränkungen. Ein Flag in diesem Bitstream gibt an, ob es sich dabei um einen Bitstream mit eingeschränkten Parametern handelt oder nicht. Zu dieser „Constrained Parameters“-Menge gehören folgende Kennwerte: • • • • • • Horizontale Bildgröße: Vertikale Bildgröße: Bildbereich: Pixelrate: Bildrate: Bewegungsvektor –Bereich: • • Inputbuffer-Größe: Bitrate: kleiner oder gleich 768 Bildpunkte kleiner oder gleich 576 Zeilen kleiner oder gleich 396 Makroblöcke kleiner oder gleich 396x25 Makroblöcke je Sekunde kleiner oder gleich 30 Hz kleiner als ± 64 Pixel (bei Verwendung von HalbpixelVektoren) kleiner oder gleich 327.680 Bits kleiner oder gleich 1.856.000 Bits/Sekunde 16 Dies bedeutet, dass die in dieser Untermenge enthaltenen Parameter in ihren erlaubten Werten eingeschränkt sind. 90 AEIOU UND FILM Moving Pictures Expert Group Videosequenzen, die in diesem Standard vorliegen, erreichen eine hohe Kompressionsrate ohne dabei ihre gute Bildqualität einzubüssen. Dieser Algorithmus ist allerdings nicht verlustfrei, da während der Kodierung nicht die exakten Pixel-Werte beibehalten werden. Die Wahl der jeweiligen Kodierungstechniken hängt von der Notwendigkeit ab, einen Kompromiss zwischen hoher Bildqualität und hoher Kompression mit der Anforderung, dass ein wahlfreier Zugriff auf den Bitstream möglich sein muss, zu finden. Die erste, von diesem Standard beinahe unabhängige Technik liegt darin, eine geeignete räumliche Auflösung für das Signal zu finden. Danach vermindert der Algorithmus über Block-basierte Bewegungskompensation die zeitliche Redundanz. Sowohl für die bedingte Vorhersage des aktuellen Bildes aus einem vorhergehenden Bild als auch für dessen Interpolation aus einem vorhergehenden und einem nachfolgenden Bild wird die Bewegungskompensation verwendet. Dabei werden Bewegungsvektoren für jeden 16x16-Bereich des Bildes definiert. Das Differenzsignal, das dem Fehler aus der Vorhersage entspricht, wird unter Verwendung der diskreten Cosinus-Transformation (DCT) weiter komprimiert, um räumliche Korrelationen zu entfernen, bevor es in einem nicht reversiblen Prozess quantisiert wird. Dieser Prozess verwirft alle weniger wichtigen Informationen. Zuletzt werden die berechneten Bewegungsvektoren mit der restlichen DCT-Information kombiniert und mittels variabler Längencodes übermittelt. Um den Konflikt zwischen den beiden Anforderungen, wahlfreier Zugriff und effiziente Komprimierung, lösen zu können, wurden folgende drei Hauptbildarten definiert: • Intra-Frames (I-Frames): I-Frames werden ohne Referenz zu anderen Bildern kodiert. Sie bieten Einstiegspunkte, an denen die Wiedergabe gestartet werden kann, werden jedoch mit eher geringer Kompression gespeichert. • Predicted Frames (P-Frames): P-Frames werden etwas effizienter kodiert, indem das aktuelle Bild mittels bewegungskompensierter Vorhersage aus einem vorangegangenen I- oder P-Frame berechnet wird. P-Frames werden im Allgemeinen für weitere Vorhersage verwendet. • Bidirectionally-Predicted Frames (B-Frames): B-Frames weisen den höchsten Kompressionsgrad auf. Sie benötigen jedoch sowohl vorangegangene als auch nachfolgende Referenzbilder für die Bewegungskompensation. Derartige Bilder werden nie selbst als Referenz für eine Vorhersage verwendet. Die Art und Weise, auf welche diese drei Bildarten innerhalb einer Sequenz angeordnet werden, ist sehr flexibel und kann durch den Encoder abhängig von den Anforderungen der geplanten Verwendung gewählt werden. Den Zusammenhang zwischen den einzelnen Bildarten zeigt Abbildung 47. Für detaillierte Informationen siehe [MPEG97] und [DCT90]. 91 AEIOU UND FILM Moving Pictures Expert Group Abbildung 47: Der Zusammenhang zwischen I-, P- und B-Frames 4.4.1 Generierung von Sequenzen im MPEG-Format Um Videoclips direkt in MPEG, analog zu dem im Abschnitt 4.2 („Audio Video Interleave“) beschriebenen Vorgang, aufzunehmen, ist eine spezielle Hardware17 notwendig. Für das Projekt AEIOU stand eine Optibase MPEG-4000 Encoder-Karte inklusive der dafür benötigten Software (MPEG Lab Pro 1.10 Beta) sowie eine Optibase PCMotion DecoderKarte zur Verfügung. Der Anschlussplan für diese Komponenten befindet sich im Anhang A. Sind alle Geräte ordnungsgemäß angeschlossen, sieht der Aufnahmevorgang wie nachfolgend beschrieben aus. • • Das Programm „MPEG Lab Pro“ aus dem Windows Startmenü aufrufen. Es erscheint der Hauptbildschirm, der in Abbildung 48 gezeigt wird. Zu Beginn müssen die Setup-Parameter direkt am Hauptbildschirm eingestellt werden. Diese Einstellungen werden nur einmal nach jedem Programmstart durchgeführt. Die entsprechenden Werte, mit Ausnahme des Namens der Ausgabedatei, bleiben also für alle in einer Sitzung digitalisierten Clips unverändert. Folgende Optionen sind festzulegen: o Quelle (source): Dort wird die Art der Videoquelle gewählt. Wird als Eingabegerät ein Videorecorder verwendet, so ist der Wert camera einzustellen. o Zieldatei (output): Der Name der gewünschten Ausgabedatei stellt den einzigen Parameter in diesem Bereich dar, der für jeden Clip neu eingegeben werden sollte. Es besteht jedoch auch die Möglichkeit, immer dieselbe Ausgabedatei zu verwenden und die fertiggestellten Clips vor einer weiteren Aufnahme zu verschieben bzw. umzubenennen. 17 1996: Zusätzlich zu einem im Jahr 1996 handelsüblichen Computer war ein Videoplayer und eine eigene MPEG-Encoder-Karte notwendig. 2000: Zusätzlich zu einem im Jahr 2000 handelsüblichen Computer wird ein Videoplayer benötigt. Eine eigene Encoder-Karte ist im Allgemeinen nicht mehr erforderlich, da ein großer Teil der erhältlichen Grafikkarten MPEG-Encoding unterstützt. 92 AEIOU UND FILM Moving Pictures Expert Group o N, M, GOP: Mit den 3 Werten N, M und GOP werden die I- (intra), P- (predicted) und B(bidirectional) Frames eingestellt. I-Frames sind dabei Standbilder, die meist alle 10 oder 12 Frames gesendet werden, P-Frames sind die Abweichung vom letzten I- oder P-Frame, und B-Frames stellen die Interpolation zwischen I- und P-Frames dar. Als Richtwerte können N=12, M=1 und GOP=N*1 herangezogen werden. o Quellformat (format): Bei Verwendung eines S-VHS-Videorecorders als Eingabegerät muss S-Video und das Format entsprechend den Videokassetten (im europäischen Bereich PAL) gewählt werden. Abbildung 48: Ein Blick auf das MPEG Lab Pro • Nun ist es notwendig, die Ausgabeparameter (file output parameters) festzulegen. Mit Ausnahme des Dateityps erfolgen die Eingaben dieser Werte über ein eigenes Fenster (siehe Abbildung 49), das durch Drücken auf Rate Control geöffnet wird. o Dateityp (file type): MPEG-System o Ziel-Bitrate (target bitrate): Damit wird die Anzahl der Bits/Sekunde bei der Encodierung festgelegt. Um bei guter Qualität nicht zu große Ausgabedateien zu erzeugen, sollte die Bitrate auf 150 KB/Sec gesetzt werden. o Audio Layer II Parameters: Mit diesem Parameterblock wird die Qualität der Tonspur beeinflusst, indem die Anzahl der für die Audioaufnahme verwendeten Bits/Sekunde, die Lautstärke, die 93 AEIOU UND FILM Moving Pictures Expert Group Sampling-Frequenz sowie Mono bzw. Stereo gewählt werden. Mit den unten angeführten Werten können gute Ergebnisse erzielt werden. Frequency 44100 MONO Bitrate 112 (mit Ton) 48 (ohne Ton) Input Volume 6 (mit Ton) 0 (ohne Ton) Abbildung 49: Festlegung der Ausgabeparameter • Bevor der Aufnahmevorgang gestartet werden kann, muss für das gewünschte Video noch die Video-Kalibrierung durchgeführt werden. Das dafür notwendige Fenster erhält man durch Wahl des Punktes Video Preview aus dem Menü Options (Abbildung 50). Folgende Parameter sind für die einzelnen Sequenzen anzupassen. o Farbton (hue): Der Bereich für diesen Wert erstreckt sich von –64 bis +63. Die besten Ergebnisse konnten mit Eingabe des Wertes 0 erzielt werden o Sättigung (saturation): Damit wird die Farbsättigung des Ausgabevideos festgelegt. Gültige Werte liegen zwischen 0 und 127. o Kontrast (contrast): Mit diesem Parameter wird die Stärke des Hell-/Dunkel-Kontrastes im Bereich 0 bis 127 gewählt. 94 AEIOU UND FILM Moving Pictures Expert Group o Helligkeit (brightness): Die Helligkeit der Videosequenz kann durch Veränderung dieses Punktes geregelt werden. Der dafür vorgesehene Bereich erstreckt sich von –64 (dunkel) bis +63 (hell) o Horizontale Bildverschiebung (horizontal offset): Bei der Aufnahme können horizontale Verschiebungen auftreten. Um diesem Effekt entgegenzuwirken, besteht die Möglichkeit, einen Offset zwischen –45 und +30 einzugeben. Negative Werte bedeuten eine Verschiebung nach rechts, positive Werte entsprechend nach links. o Vertikale Bildverschiebung (vertical offset): Zusätzlich zu den horizontalen Verschiebungen können auch solche in vertikaler Richtung auftreten. Der vertikale Offset kann in der Datei „Optibase.ini“ eingegeben werden. Diese Eingabe muss vor dem Start von MPEG Lab Pro erfolgen, da sie andernfalls keine Auswirkung auf die erstellten MPEG-Clips hat. Negative Werte bewirken eine Verschiebung nach unten, positive Werte eine Verschiebung nach oben. Abbildung 50: Kalibrierung der Videoquelle • Damit sind alle nötigen Voreinstellungen getroffen und die Aufnahme kann durchgeführt werden. Dies geschieht so: o Schaltfläche Start Encoding drücken. Das Encoding-Fenster wird geöffnet (siehe Abbildung 51). 95 AEIOU UND FILM Moving Pictures Expert Group o Nach Starten der Wiedergabe am Videorecorder zu Beginn der gewünschten Sequenz die Schaltfläche Start drücken. o Am Ende der Sequenz wird die Aufnahme mit Stop beendet. Abbildung 51: Das Encoding-Fenster 4.4.2 Integration von MPEG-Sequenzen in eine HTML-Seite Die Handhabung von MPEG-Clips unterscheidet sich nach der Konvertierung nicht von der bereits bekannten Vorgehensweise. Durch Einfügen eines Links auf die Videodatei wird diese den Internet-Surfern zugänglich gemacht, womit die HTML-Seite folgenden Quellcode und das in Abbildung 52 gezeigte Aussehen erhält: <HTML> <HEAD> <TITLE>"Kranzltanz", Burgenland.</TITLE> </HEAD> <BODY> <TABLE ALIGN=CENTER CELLPADDING=10 BORDER=0> <TR> <TD> <IMG SRC="/aeiou.film.data.image/o503a.jpg"> </TD> <TD VALIGN=CENTER> <TABLE BORDER=0 CELLPADDING=5> <TR> <TD COLSPAN=5>"Kranzltanz", getanzt von der kroatischen Volkstanzgruppe "Kolo Slavuj", Burgenland. </TD> </TR> <TR> <TD COLSPAN=5></TD> </TR> <TR> <TD VALIGN=CENTER> 96 AEIOU UND FILM Moving Pictures Expert Group <A HREF="/aeiou.film.data.film/o503a.mpg"><IMG SRC= "/aeiou.film.data.image.general/movie_ton.gif" BORDER=0></A> </TD> <TD VALIGN=CENTER ALIGN=LEFT> <A HREF="/aeiou.film.data.film/o503a.mpg">MPEG (5.4 MB)</A> <TD></TD> <TD VALIGN=CENTER> <A HREF="/aeiou.film.data.film/o503a.mov"><IMG SRC= "/aeiou.film.data.image.general/movie_ton.gif" BORDER=0></A> </TD> <TD VALIGN=CENTER ALIGN=LEFT> <A HREF="/aeiou.film.data.film/o503a.mov">QuickTime (8.3 MB)</A> </TD> </TR> </TABLE> </TD> </TR> </TABLE> </BODY> </HTML> Abbildung 52: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im MPEG-Format 97 AEIOU UND FILM 4.4.3 Moving Pictures Expert Group Ergebnisse Das wohl leistungsstärkste und vielversprechendste Videoformat präsentiert sich mit Moving Pictures Expert Group (MPEG). Für dieses Format bleiben als Nachteile nur 3 Punkte zu nennen: • Erstens die Notwendigkeit einer speziellen Ausrüstung zur Gewährleistung von Aufnahme in Echtzeit. • Zweitens der Umstand, dass MPEG-Clips nicht nachträglich editiert werden können. Dadurch gerät auch die Erstellung derartiger Clips zu einer kleinen Odyssee, da man bei der Aufnahme zum richtigen Zeitpunkt Start bzw. Stop drücken muss. Werden diese Zeitpunkte verpasst, so ist eine Neuaufnahme der Sequenz erforderlich. • Drittens wird durch MPEG kein Streaming unterstützt. In allen anderen Bereichen kann das MPEG-Format als Referenz und Vorbild herangezogen werden. Es überzeugt durch bestechende Bildqualität und flüssige Bildfolge. Dabei gelingt es in diesem Format, gegenüber dem qualitativ vergleichbaren Audio Video Interleave, eine deutliche Reduktion des erforderlichen Speicherplatzes und damit auch der Wartezeiten beim Download entsprechender Videoclips zu erzielen. Etwa werden für einen 30-Sekunden-Clip nicht mehr 50 MB oder darüber verbraucht, sondern nur noch etwas mehr als 5 MB. Außerdem gibt MPEG durch die ständig vorangetriebenen Neuentwicklungen auch das Versprechen für die Zukunft ab, dass es nicht so schnell in der Versenkung verschwinden wird. Aus diesem Grund bleibt auch noch die Hoffnung, dass vielleicht auch StreamingMedia mit MPEG realisiert werden kann. 98 AEIOU UND FILM Real Video Nach einer kurzen allgemeinen Betrachtung des Real Video-Formates wird im folgenden Abschnitt die Generierung von Sequenzen im Real Video-Format und deren Integration in HTML-Seiten behandelt. In der Folge werden die Stärken und Schwächen dieses Formates erläutert und die in den Untersuchungen erzielten Ergebnisse bezüglich Kompression und Tonqualität kommentiert. 4.5 Das Videoformat Real Video Zeitkritische Daten stellen für herkömmliche Lösungsansätze nicht nur im Audiobereich, sondern auch im Videobereich Probleme dar. Aus diesem Grund ist Video-On-Demand mit diesen Ansätzen nicht realisierbar. Im Zuge ihrer Neuentwicklung im Audiobereich versuchten Real Networks auch auf dem Videosektor einen anderen Weg zu gehen und entwickelten in den Jahren 1994 und 1995 neben dem Real Audio Protokoll das damit verwandte Real Video Protokoll. Aus dieser Ähnlichkeit ergeben sich gegenüber den bis dahin bestehenden Technologien dieselben Vorteile, die das Real Audio Protokoll gegenüber seinen Konkurrenten aufweist (siehe auch Abschnitt 3.3, Real Audio): bidirektionale Kommunikation zwischen Client und Server wird unterstützt. Doch nicht nur in der verwendeten Technologie kann von einer Verwandtschaft zwischen Real Audio und Real Video gesprochen werden, sondern auch in Bezug auf Auskünfte über den Hintergrund dieser Verfahren. Deshalb kann im Folgenden nur gezeigt werden, wie mit diesem Format umgegangen werden muss und welche Ergebnisse damit erzielbar sind. 4.5.1 Generierung von Sequenzen im Real Video-Format Real Networks stellt für die Generierung von Real Video-Dateien den Real Video Encoder zur Verfügung. In der Version 3.0 (für Windows 95, Windows NT und auch für Macintosh Power PC’s) begnügt sich der Encoder noch immer mit einem Pentium 90, 16 MB Hauptspeicher und einer 16 Bit Soundkarte. Die Verwendung eines schnelleren Rechners mit etwas mehr Hauptspeicher ist jedoch vorteilhaft, da es die Konvertierungszeiten positiv beeinflussen kann. Als Quelle unterstützt der Real Video-Encoder Dateien, die im AVI- oder im Apple QuickTime-Format vorliegen. Es werden sowohl komprimierte als auch unkomprimierte AVI-Videos akzeptiert; Unkomprimierte Dateien sind dabei vorzuziehen, da mit ihnen die qualitativ besseren Ergebnisse erzielt werden können. Zusätzlich müssen noch folgende Voraussetzungen durch die Dateien im AVI-Format erfüllt werden: • • • Die Farbtiefe muss 24 Bit betragen Sowohl die Höhe als auch die Breite des Bildes muss durch 16 teilbar sein. Die einzige Ausnahme bilden hier die Bildabmessungen von 160x120, die durch den Encoder ebenfalls unterstützt werden. Die passenden Indeo-Videotreiber müssen auf dem verwendeten Rechner installiert sein. Etwas stärker eingeschränkt ist die Auswahl bei den unterstützten QuickTime-Clips. Diese dürfen nur in unkomprimierter Form verwendet werden: Außerdem gilt ebenfalls die 99 AEIOU UND FILM Real Video Einschränkung auf eine Farbtiefe von 24 Bit. In Bezug auf die Tonspur ist es unbedeutend, ob es sich um 8- oder 16-Bit Audio in Mono oder Stereo handelt. Ausgehend von den zuvor angeführten Dateien können Real Video-Filme erzeugt werden, indem der nachstehende Arbeitsablauf eingehalten wird: • • • • • • Real Video Encoder über das Windows Startmenü starten. Der Konverter präsentiert sich mit der in Abbildung 53 gezeigten Ansicht. Zuerst muss die Encoding-Sitzung gestartet und konfiguriert werden. Dazu ist der Punkt Open Session aus dem Menü File zu wählen. Der in Abbildung 54 gezeigte Dialog wird geöffnet. Nachdem in diesem Dialog als Quelle (Source) eine Datei (File) gewählt wurde, kann durch Drücken auf die Schaltfläche Add der Ausgangsclip ausgewählt werden. Anschließend wird über den Button Select der Ausgabepfad festgelegt. Mit OK kehrt man wieder in das Hauptfenster zurück, wo nun die Möglichkeit besteht, eines der Konvertierungstemplates als Parameter zu übernehmen. Diese von Real Networks bereitgestellten Vorlagen werden zu einem späteren Zeitpunkt noch vorgestellt. Fortgeschrittenen Benutzern wird auch angeboten, über Anwahl des Punktes Advanced eine bestehende Vorlage zu verändern oder sogar eigene Templates zu entwerfen. Das entsprechende Eingabefenster ist in Abbildung 55 zu sehen. Gestartet wird der Konvertierungsvorgang durch Betätigung der Schaltfläche Start. Die Dauer der Konvertierung ist von der Länge des Eingabevideos und der gewählten Ausgabequalität abhängig. Abbildung 53: Der Real Video Encoder 100 AEIOU UND FILM Real Video Abbildung 54: Wahl der Eingabe- und der Ausgabedatei Abbildung 55: Erweiterte Einstellungen für die Konvertierung 101 AEIOU UND FILM 4.5.2 Real Video Integration von Real Video-Sequenzen in eine HTML-Seite Bereits in Abschnitt 3.3 (Real Audio) wurde die Vorgehensweise bei Real Media-Dateien erklärt, die für die Unterstützung von Life-Streaming nötig ist. Dabei darf nämlich der Link nicht direkt auf die Videodatei gelegt werden, sondern auf ein Real Media-Metafile, welches wiederum den Link auf die Videodatei selbst enthält (siehe nachstehendes Beispiel und Abbildung 56). Will man kein Life-Streaming ermöglichen, kann der Link, analog zu AVI oder QuickTime, auch direkt auf den Clip gesetzt werden. <HTML> <HEAD> <TITLE>"Kranzltanz", Burgenland.</TITLE> </HEAD> <BODY> <TABLE ALIGN=CENTER CELLPADDING=10 BORDER=0> <TR> <TD> <IMG SRC="/aeiou.film.data.image/o503a.jpg"> </TD> <TD VALIGN=CENTER> <TABLE BORDER=0 CELLPADDING=5> <TR> <TD COLSPAN=2>"Kranzltanz", getanzt von der kroatischen Volkstanzgruppe "Kolo Slavuj", Burgenland. </TD> </TR> <TR> <TD VALIGN=CENTER> <A HREF="/aeiou.film.data.film/o503a.rm"><IMG SRC= "/aeiou.film.data.image.general/movie_ton.gif" BORDER=0></A> </TD> <TD VALIGN=CENTER ALIGN=LEFT> <A HREF="/aeiou.film.data.film/o503a.rm">Real Video (355 KB)</A> </TD> </TR> </TABLE> </TD> </TR> </TABLE> </BODY> </HTML> Die Datei “o503a.rm”, auf die der HREF-Link gesetzt ist, besteht nur aus einer Zeile, in der die virtuelle Adresse der entsprechenden Sounddatei angegeben ist: http://www.aeiou.at/aeiou/o503a.rv 102 AEIOU UND FILM Real Video Abbildung 56: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im RealVideo-Format 4.5.3 Ergebnisse Ebenso wie ein Real Audio-Clip kann auch eine Real Video-Datei abgespielt werden, ohne dass sie zuvor vollständig auf den lokalen Datenträger geladen werden muss (Life-Streaming, siehe Kapitel 3.3.2). Um dieses Feature nutzen zu können, müssen folgende wichtige Voraussetzungen erfüllt werden: • Erstens muss für die Videoclips bereits bei der Aufnahme festgelegt werden, für welche Internet-Anbindung des Konsumenten sie vorgesehen sind. Denn die verfügbare Übertragungsrate bestimmt, wie viel der Datei vor dem Beginn der Wiedergabe geladen werden muss, um diese danach ohne Unterbrechungen gewährleisten zu können. Eine Aufstellung der von Real Networks für die Aufnahme zur Verfügung gestellten Vorlagen (Templates) ist in Tabelle 10 zu sehen. Die verwendeten Parameter seien hier kurz erklärt: o Ziel-Bandbreite: Übertragungsrate, bei welcher Life-Streaming genützt werden kann. o Audio-Bitrate: Anzahl der Bits pro Sekunde, die zur Speicherung der Audiodaten verwendet werden. o Video-Bitrate: Anzahl der Bits pro Sekunde, die zur Speicherung der Videodaten verwendet werden. o Gesamt-Bitrate: Anzahl der Bits pro Sekunde, die zur Speicherung der gesamten Daten verwendet werden. 103 AEIOU UND FILM Real Video o Videoqualität: Gewichtung zwischen Bildschärfe (100) und flüssiger Bildabfolge (10). o Framerate: Gibt die Anzahl der verwendeten Einzelbilder pro Sekunde an. • Zweitens ist es notwendig, die Clips auf einem eigenen Real Video-Server bereitzustellen. Da für das AEIOU-Projekt ausschließlich kurze Videoclips verwendet wurden, konnte auf den Einsatz eines eigenen Real Video-Servers verzichtet werden. Tabelle 10: Real Video Aufnahmevorlagen Name des Templates High Action (Fractal) with Music High Action 56 with Music High Action 56 with Voice Music Video 56, Emphasize Audio Music Video 56, Emphasize Video Talking Heads 56 High Action (Fractal) with Voice High Action 28.8 with Music High Action 28.8 with Voice Music Video 28.8, Emphasize Audio Music Video 28.8, Emphasize Video Talking Heads 28.8 ZielBandbreite AudioBitrate (Kbps) VideoBitrate (Kbps) Gesamt- Video- Framerate Bitrate Qualität (fps) (Kbps) 112,0 56,0 56,0 56,0 12 16 8 16 78 29 36,5 29 90 45 45 45 70 100 100 100 15 7,5 7,5 7,5 56,0 12 33 45 100 7,5 56,0 28,8 28,8 28,8 28,8 8,5 8,5 8 6,5 12 36,5 36,5 11,0 12,5 7 45 45 19 19 19 100 70 100 100 100 7,5 10 0,25 0,25 0,25 28,8 8 11 19 100 0,25 28,8 6,5 12,5 19 100 7,5 Im Gegensatz zu den in den vorangegangenen Abschnitten behandelten Formaten zeichnet sich Real Video durch geringen Speicherplatzbedarf aus. Benötigte eine 30 Sekunden lange Sequenz im AVI-Format noch ungefähr 50 MB und mit Apple QuickTime noch immer 6 MB, so begnügt sich Real Video mit weniger als 500 KB. Dies bringt den Vorteil mit sich, dass die Download-Zeiten merklich gesenkt werden. Die hohen Kompressionsraten sind leider nicht nur vorteilhaft, denn es ist nötig, in anderen Bereichen Abstriche zu machen, um sie erreichen zu können. Die Qualität der erstellten Videos hat dadurch sehr große Verluste erlitten und ist mit jener der Konkurrenten nicht mehr vergleichbar. Mit den vorgegebenen Einstellungen ist es nicht möglich, einen guten Kompromiss zwischen Bildschärfe und flüssiger Bildabfolge zu erzielen. Zwar besteht die Möglichkeit, diese Einstellungen abzuändern, doch auch dann ist die erzielte Qualität nicht zufriedenstellend. Der Grund dafür liegt darin, dass nur die Bitraten für Audio und Video beinahe ohne Einschränkungen erhöht werden können, nicht jedoch die Anzahl der Einzelbilder pro Sekunde (Framerate). Letztere ist mit 15 fps (Frames per Second) beschränkt. Durch Erhöhung der Audio- und Video-Bitraten können die Bildschärfe und die Klangqualität auf ein akzeptables Niveau gehoben werden. Damit verbunden ist allerdings ein Anstieg des Bedarfs an Speicherplatz. Eine entsprechende Erhöhung der verwendeten Framerate würde 104 eine flüssigere Bildfolge bewirken. Doch für eine ruckelfreie Bewegung sind 15 Bilder pro Sekunde, verglichen mit der bei einer Fernsehübertragung verwendeten Framerate von 25 fps, einfach zu wenig. Deshalb vermitteln Real Video-Clips, vor allem bei einer Bevorzugung der Bildschärfe, eher den Eindruck einer Dia-Show als eines Videos. Auch die Konvertierungsdauer in den höheren, oder besser gesagt, in den gerade noch annehmbaren, Qualitätsstufen ist als Nachteil zu werten. Denn bei Verwendung von fraktaler Kompression, wobei die besten Ergebnisse erzielt werden, weist der Konvertierungsvorgang einer 34 Sekunden langen Videosequenz auf einem Pentium 133 eine Laufzeit von 6 Stunden und 20 Minuten auf. Im Vergleich dazu ist die Konvertierung von AVI in Apple QuickTime für dieselbe Sequenz in nur 8 Minuten abgeschlossen. Einige Jahre nach Abschluss dieser Untersuchungen wurde Real Video um das sogenannte „SureStream“ erweitert. Dabei muss nicht mehr für jede gewünschte Übertragungsrate eine eigene Mediendatei erstellt werden, sondern es wird eine gemeinsame Datei generiert, die mehrere gewünschte Internetanbindungen (z.B. Modem 28.8 und LAN) unterstützt. Wenn der Benutzer auf die am Server abgelegte Datei zugreift, dann berechnet der Real Video-Server, welche Datenübertragungsrate dem Benutzer zur Verfügung steht und passt die Qualität und die Vorladezeit für den gewählten Clip automatisch an. Das heißt, dem Benutzer wird aus der Datei jene Spur übertragen, deren Anforderungen an die Verbindung durch die Übertragungsrate auf den PC des Benutzers erfüllt werden. Zusammenfassend musste festgestellt werden, dass Real Video die gesetzten Erwartungen leider nicht erfüllen konnte. Aus den oben genannten Gründen wurde dieses Format auch im Videoalbum des Projektes AEIOU nicht eingesetzt. Bleibt also nur die Hoffnung auf eine Verbesserung der grundsätzlich guten Ansätze. 105 AEIOU UND FILM Vivo Active Der folgende Abschnitt zeigt nach einer kurzen Vorstellung des Vivo Active-Formates die Erzeugung von Sequenzen im Vivo Active-Format und deren Integration in HTML-Seiten. Im Anschluss daran werden die Stärken und Schwächen dieses Formates näher beleuchtet, die in den Untersuchungen erzielten Ergebnisse bezüglich Kompression und Tonqualität kommentiert und die Bedeutung dieses Formates für das Videoalbum des AEIOU-Projektes bewertet. 4.6 Das Videoformat Vivo Active Ständig wachsende Konkurrenz bedingt auch im Videobereich für neue Formate die Notwendigkeit: alle besonderen Funktionen der etablierten Konkurrenten anbieten und teilweise sogar übertreffen zu müssen. Das von Vivo Software entwickelte VivoActiveFormat wurde schon teilweise in Abschnitt 3.4 behandelt, da es als kombiniertes Format die Erstellung sowohl von reinen Audiodateien als auch von Videodateien unterstützt. Im Folgenden werden nur noch jene Punkte behandelt, die sich in der Erstellung und Behandlung der Dateien im Vergleich zu VivoActive Audio unterscheiden. 4.6.1 Generierung von Sequenzen im Vivo Active-Format Im Zusammenhang mit der Generierung von VivoActive Audio-Clips wurde bereits der von VivoSoftware entwickelte VivoActive Producer 2.0 vorgestellt. Dieser ist nicht nur in der Lage, Audiodateien im Waveform-Format zu verarbeiten, sondern auch Videoclips im AVIFormat nach VivoActive zu konvertieren. Da für beides dasselbe Werkzeug verwendet werden kann, unterscheiden sich die Voraussetzungen für die Erstellung von Audioclips und Videoclips nicht. Das dafür nötige Quellformat unterliegt denselben Auflagen, wie sie bereits für RealVideo aufgezeigt wurden. Die Bildabmessungen der Ausgangsfilme im AVI-Format müssen durch 16 teilbar sind, wobei die Bildgröße 160x120 eine Ausnahme bildet. Was die Farbtiefe betrifft, so wird eine 24 Bit-Auflösung verlangt. In Bezug auf die enthaltene Tonspur sind keine Einschränkungen einzuhalten, sowohl 8 als auch 16 Bit in Mono und Stereo werden unterstützt. Mit den geeigneten Dateien als Quelle erhält man VivoActive Videoclips nach Durchführung der im Anschluss aufgelisteten Punkte. • • • Der VivoActive Producer wird über das Windows Startmenü gestartet. Das Hauptfenster der Anwendung ist in Abbildung 9 zu sehen. Über die Schaltfläche Add Movie können nun ein oder auch mehrere Eingabedateien im *.avi-Format geöffnet werden. Durch Markieren einer Quelldatei und anschließenden Klick auf die Schaltfläche Setting (oder auch über das Menü Settings/Select) eine der vorhandenen ParameterDateien wählen. Diese Dateien enthalten alle für die Konvertierung benötigten Einstellungen wie zum Beispiel die gewünschte Tonqualität oder die für Streaming erforderliche Internet-Anbindung. Falls keine geeignete Parameterkombination angeboten wird, besteht die Möglichkeit, eine bestehende Datei zu editieren oder eine neue Parameterdatei zu erstellen. Dazu geht man wie folgt vor: o Für das Editieren einer Konfiguration den Menüpunkt Settings/Edit wählen und im angezeigten Fenster (siehe Abbildung 10) die abzuändernde Kombination auswählen; für das Hinzufügen einer Datei den Menupunkt Settings/Add wählen. 106 AEIOU UND FILM • Vivo Active o In beiden Fällen gelangt man zu dem in Abbildung 11 gezeigten Fenster. In diesem können alle gewünschten Werte geändert und die Datei gespeichert werden. Nachdem alle erforderlichen Einstellungen gemacht wurden, werden durch Drücken auf Generate All alle oder durch Drücken auf Generate Selected nur die ausgewählten Eingabedateien bearbeitet. Abbildung 57: Der VivoActive-Producer v2.0 (Video) 4.6.2 Integration von Vivo Active-Sequenzen in HTML-Seiten Wie bei der reinen Audioversion reicht auch bei der Verwendung von VivoActive Videoclips im Internet die Angabe eines einfachen Links auf die Filmdatei nicht aus, da bei Verwendung eines solchen Links die korrekte Funktion der Wiedergabe nicht immer gewährleistet werden kann. Zum Abbruch des Abspielvorganges kommt es vor allem bei Sequenzen, die mehr als 10 Sekunden Spielzeit haben. Dieses Problem wird gelöst, indem die gewünschten Videoclips nicht mehr direkt als Link angeboten werden, sondern über den Umweg über eine eigene HTML-Seite, in der die gewünschte Datei als Objekt eingebettet ist, wie dies im Folgenden Beispiel gezeigt wird. Der erste Teil des angeführten Beispiels zeigt die referenzierende HTML-Seite (siehe Abbildung 58) sowie den zugehörigen HTML-Code. Danach wird gezeigt, wie jene Seite, die das Vivo Active-Videoobjekt enthält (siehe Abbildung 59), erzeugt wird. 107 AEIOU UND FILM Vivo Active <HTML> <HEAD> <TITLE>"Kranzltanz", Burgenland.</TITLE> </HEAD> <BODY> <TABLE ALIGN=CENTER CELLPADDING=10 BORDER=0> <TR> <TD> <IMG SRC="/aeiou.film.data.image/o503a.jpg"> </TD> <TD VALIGN=CENTER> <TABLE BORDER=0 CELLPADDING=5> <TR> <TD COLSPAN=5>"Kranzltanz", getanzt von der kroatischen Volkstanzgruppe "Kolo Slavuj", Burgenland. </TD> </TR> <TR> <TD VALIGN=CENTER> <A HREF="/aeiou.film.data.film/o503a_viv.htm"> <IMG SRC= "/aeiou.film.data.image.general/movie_ton.gif" BORDER=0></A> </TD> <TD VALIGN=CENTER ALIGN=LEFT> <A HREF="/aeiou.film.data.film/o503a_viv.htm"> Vorschau (VivoActive, 244 KB) </A> </TD> </TR> <TR> <TD VALIGN=CENTER> <A HREF="/aeiou.film.data.film/o503a.mpg"> <IMG SRC="/aeiou.film.data.image.general/movie_ton.gif" BORDER=0></A> </TD> <TD VALIGN=CENTER ALIGN=LEFT> <A HREF="/aeiou.film.data.film/o503a.mpg"> MPEG (5.4 MB) </A> <TD></TD> <TD VALIGN=CENTER> <A HREF="/aeiou.film.data.film/o503a.mov"> <IMG SRC= "/aeiou.film.data.image.general/movie_ton.gif" BORDER=0></A> </TD> <TD VALIGN=CENTER ALIGN=LEFT> <A HREF="/aeiou.film.data.film/o503a.mov"> QuickTime (8.3 MB) </A> </TD> </TR> 108 AEIOU UND FILM Vivo Active </TABLE> </TD> </TR> </TABLE> </BODY> </HTML> Abbildung 58: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im VivoActive-Format <HTML> <HEAD> <TITLE>o503a.viv</TITLE> </HEAD> <BODY> <TABLE ALIGN=CENTER CELLPADDING=10 BORDER=0> <TR> <TD> <OBJECT CLASSID="clsid:02466323-75ed-11cf-a2670020af2546ea" Width=240 Height=180 CODEBASE = "http://player.vivo.com/ie/vvweb.cab#Version=2,0,0,0"> <PARAM NAME="URL" VALUE="/aeiou.film.data.film/o503a.viv"> <PARAM NAME="AUTOSTART" VALUE="true"> <PARAM NAME="VIDEOCONTROLS" VALUE="on"> <EMBED SRC="/aeiou.film.data.film/o503a.viv " PLUGINSPACE = "http://www.vivo.com/dldv2/cgi-bin/dldform.cgi" TYPE = "video/vnd.vivo" AUTOSTART="true" VIDEOCONTROLS="on" WIDTH=240 HEIGHT=180> 109 AEIOU UND FILM Vivo Active </EMBED> </OBJECT> </TR> </TABLE> </BODY> </HTML> Abbildung 59: HTML-Seite aus dem Videoalbum mit dem "Kranzltanz" als VivoActive-Objekt 4.6.3 Ergebnisse Qualitativ kann VivoActive auch im Videobereich nicht immer überzeugen. Abgesehen davon, dass Real Video eine höhere Tonqualität aufweist, ist auch in punkto Bildschärfe der direkte Konkurrent vorzuziehen. Dies liegt vor allem daran, dass bei VivoActive keine Möglichkeit besteht, die Videobitrate zu verändern. Dafür sind bei VivoActive die Bildabmessungen, also Bildbreite und Bildhöhe, direkt einstellbar. Das bedeutet, dass die Ergebnisvideos in ihren Abmessungen unabhängig von den verwendeten Quellsequenzen sind und gegenüber diesen sowohl verkleinert als auch vergrößert werden können. Von einer Vergrößerung sollte jedoch im Hinblick auf den damit verbundenen Verlust an Bildschärfe abgesehen werden. Zusätzlich bietet VivoActive noch ein etwas breiteres Spektrum bei der Wahl der Framerate. Es gilt hier nicht dieselbe Beschränkung auf 15 Bilder pro Sekunde, sondern es können Werte zwischen 1 und 30 Bildern pro Sekunde gewählt werden. Damit ist eine deutlich flüssigere Bildfolge realisierbar, vorausgesetzt dass die Quelldatei ebenfalls eine entsprechend hohe oder noch höhere Framerate aufweist. Andernfalls bringt eine Erhöhung dieses Wertes keinerlei Verbesserung. Werden die erzielten Kompressionsraten von Real Video und VivoActive verglichen, können kaum Unterschiede festgestellt werden. Bei ähnlicher Bildqualität sind auch die 110 AEIOU UND FILM Vivo Active resultierenden Dateien annähernd gleich groß, wobei die Konvertierungszeiten bei VivoActive erheblich besser sind. Denn während Real Video für manche Konvertierungen mehr als 6 Stunden benötigt, wird dieser Vorgang bei VivoActive in ungefähr der doppelten Laufzeit der Videosequenz durchgeführt. Auffallend ist, dass im Gegensatz zu Real Video oder VivoActive Audio die Kompressionsraten nicht nur von den eingestellten Parametern bestimmt werden, sondern auch durch die Beschaffenheit der Videosequenz. Enthält eine Videosequenz wie bei Quellvideo 2 aus Tabelle 11 viel Bewegung und damit auch mehr Veränderungen der einzelnen Farbwerte von einem Einzelbild zum darauffolgenden, dann wird dafür trotz geringerer Qualität und kleineren Bildabmessungen deutlich mehr Speicherplatz verbraucht. Tabelle 11: Gegenüberstellung AVI-VivoActive Quellvideo 1 (Spielzeit: ca. 20 Sekunden) AVI-Format Video: Bildgröße: 320x240 Bildpunkte Framerate: 15 Frames/Sekunde Audio: Kompression: PCM Sample-Rate: 22.050 Hz 16 Bit/Sample Stereo 27.409 KB Ergebnisvideo 1.1 VivoActive-Format Client Connection Type: T1 (108 kbps) Video: Bildgröße: 240x180 Bildpunkte Framerate: 15 Frames/Sekunde Audio: FM quality (16 kbps) Automatic gain adjust VivoActive-Format Client Connection Type: ISDN (54 kbps) Video: Bildgröße: 240x180 Bildpunkte Framerate: 15 Frames/Sekunde Audio: Voice quality (6.4 kbps) Automatic gain adjust VivoActive-Format Client Connection Type: ISDN (54 kbps) Video: Bildgröße: 160x120 Bildpunkte Framerate: 15 Frames/Sekunde Audio: Voice quality (6.4 kbps) Automatic gain adjust 270 KB Ergebnisvideo 1.2 Ergebnisvideo 1.3 111 142 KB 137 KB AEIOU UND FILM Ergebnisvideo 1.4 Vivo Active VivoActive-Format Client Connection Type: ISDN (54 kbps) Video: Bildgröße: 160x120 Bildpunkte Framerate: 15 Frames/Sekunde Audio: FM quality (16 kbps) Automatic gain adjust VivoActive-Format Client Connection Type: Modem 28.8 (28.8 kbps) Video: Bildgröße: 160x120 Bildpunkte Framerate: 8 Frames/Sekunde Audio: FM quality (16 kbps) Automatic gain adjust 138 KB Quellvideo 2 (Spielzeit: ca. 33 Sekunden) AVI-Format Video: Bildgröße: 160x120 Bildpunkte Framerate: 15 Frames/Sekunde Audio: Kompression: PCM Sample-Rate: 11.025 Hz 8 Bit/Sample Mono 4.848 KB Ergebnisvideo 2.1 VivoActive-Format Client Connection Type: T1 (108 kbps) Video: Bildgröße: 240x180 Bildpunkte Framerate: 15 Frames/Sekunde Audio: FM quality (16 kbps) Automatic gain adjust VivoActive-Format Client Connection Type: ISDN (54 kbps) Video: Bildgröße: 240x180 Bildpunkte Framerate: 15 Frames/Sekunde Audio: Voice quality (6.4 kbps) Automatic gain adjust 439 KB Ergebnisvideo 1.5 Ergebnisvideo 2.2 112 59 KB 227 KB AEIOU UND FILM Ergebnisvideo 2.3 Ergebnisvideo 2.4 Ergebnisvideo 2.5 Vivo Active VivoActive-Format Client Connection Type: ISDN (54 kbps) Video: Bildgröße: 160x120 Bildpunkte Framerate: 15 Frames/Sekunde Audio: Voice quality (6.4 kbps) Automatic gain adjust VivoActive-Format Client Connection Type: ISDN (54 kbps) Video: Bildgröße: 160x120 Bildpunkte Framerate: 15 Frames/Sekunde Audio: FM quality (16 kbps) Automatic gain adjust VivoActive-Format Client Connection Type: Modem 28.8 (28.8 kbps) Video: Bildgröße: 160x120 Bildpunkte Framerate: 8 Frames/Sekunde Audio: FM quality (16 kbps) Automatic gain adjust 227 KB 228 KB 92 KB Durch den vergleichsweise geringen Speicherplatzbedarf und den Vorteil, dass LifeStreaming auch auf den herkömmlichen Web-Architekturen realisiert werden kann, empfiehlt sich VivoActive als Vorschau (Preview) auf das eigentliche Video, das in einem qualitativ besseren Format auf dem Server abgelegt wird. In dieser Form findet die VivoActive-Version der einzelnen Videosequenzen auch im Projekt AEIOU ihre Anwendung. Für jegliche andere Verwendung ist dieses Format aufgrund der doch sehr schwachen Qualität nicht unbedingt als erste Wahl zu betrachten. 113 Anhänge Anhänge ANHÄNGE Anschlusspläne Anhang A: Anschlusspläne Abbildung 60: Anschlussplan für die Aufnahme im AVI-Format Verbindung Anschluss 1 Anschluss 2 Kabel 1 Kabel 2 Kabel 3 Kabel 4 VCR S-Video Out (S-VHS) VCR Audio Out (Doppel-Cinch) VCR Scart Soundkarte Speakers (Stereo Klinke 3,5 mm) Miro DC 20 S-Video In (S-VHS) Soundkarte Line In (Stereo Klinke 3,5 mm) Monitor Scart Kopfhörer / Lautsprecher 115 ANHÄNGE Anschlusspläne Abbildung 61: Anschlussplan für die Aufnahme im MPEG-Format Verbindung Anschluss 1 Kabel 1 Kabel 2 VCR S-Video Out (S-VHS) VCR Audio Out (Doppel-Cinch) Kabel 3 Kabel 4 Anschluss 2 MPEG 4000 S-Video In (S-VHS) PC Motion Pro Audio In (Stereo Klinke 3,5 mm) PC Motion S-Video Out (S-VHS) Monitor Scart (Adapter nötig) PC Motion Audio Out (Stereo Klinke 3,5 mm) Kopfhörer / Lautsprecher 116 ANHÄNGE Kennwert-Tabellen Anhang B: Kennwert-Tabellen Kennwerte für die Aufnahme im AVI-Format Sequenzen der AVL (1 Kassette): AVL - 1 Film Dauer Helligkeit Kontrast Sättigung a001a 25:20 170 145 115 Ton Sample-Rate 22 kHz Sequenzen des österreichischen Filmarchivs Laxenburg (7 Kassetten): ÖFA - 1 Film Dauer Helligkeit Kontrast Sättigung f001a f001b f005a f006a f007a f008a f009a f010a f011a f012a f014a f015a f016a f018a f019a f019b f020a f021a f022a f024a f025a 28:28 23:19 11:17 21:10 15:10 17:17 23:04 28:18 24:25 18:06 23:27 22:26 22:10 34:09 30:20 22:06 20:29 25:13 29:60 23:11 28:07 155 130 130 150 135 130 145 140 135 150 150 145 150 145 130 155 135 160 165 135 150 120 135 150 145 145 145 145 145 125 145 145 145 145 120 130 145 135 135 135 135 135 90 100 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 Film Dauer Helligkeit Kontrast Sättigung f027a f028a f029a f032a f033a f034a f035a f037a 17:20 18:19 40:10 34:08 23:20 15:22 25:29 11:03 155 145 145 150 130 165 140 140 140 140 140 170 140 145 130 145 85 85 85 85 85 85 85 85 Ton Sample-Rate 11 kHz 11 kHz 11 kHz 11 kHz 11 kHz 11 kHz 11 kHz 22 kHz 11 kHz 22 kHz 11 kHz 11 kHz 11 kHz 22 kHz 22 kHz ÖFA - 2 117 Ton Sample-Rate 11 kHz 11 kHz 22 kHz ANHÄNGE Kennwert-Tabellen ÖFA – 2 Film Dauer Helligkeit Kontrast Sättigung f038a f040a f041a f042a f044a f046a f047a f047b f050a f052a 18:23 22:12 21:21 27:28 19:27 20:24 31:16 24:06 12:26 31:29 125 160 160 155 140 140 150 150 155 145 160 130 150 145 135 135 135 135 145 135 85 85 85 85 85 85 85 85 85 85 Film Dauer Helligkeit Kontrast Sättigung f053a f053b f053c f053d f055a f056a f057a f058a f059a f060a f061a f061b f062a f064a f064b f065a f066a f067a f068a f069a f070a f071a f072a f073a f074a f075a f076a f076b f077a f078a 13:14 23:20 29:17 31:40 18:11 35:29 33:04 33:29 17:23 18:29 18:23 39:10 33:09 12:21 32:29 12:23 28:09 28:01 25:40 28:57 20:10 28:27 24:22 31:12 18:00 26:27 20:13 17:29 23:15 26:12 115 120 130 140 160 170 140 170 155 140 170 170 160 155 155 140 155 140 135 150 160 175 155 160 120 185 150 160 130 155 150 150 150 150 145 145 135 150 150 150 150 150 125 150 150 130 145 125 140 135 170 155 165 175 160 170 155 165 145 155 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 Ton Sample-Rate 22 kHz ÖFA - 3 118 Ton Sample-Rate 11 kHz 11 kHz 22 kHz 22 kHz 22 kHz 11 kHz 22 kHz 22 kHz 22 kHz 22 kHz 11 kHz 11 kHz 22 kHz ANHÄNGE Kennwert-Tabellen ÖFA - 4 Film Dauer Helligkeit Kontrast Sättigung f079a f080a f081a f082a f083a f084a f085a f086a f088a f089a f091a f092a f093a f094a f097a f098a f099a f100a f100b f101a f102a f104a f104b f106a f107a 16:01 24:04 33:22 8:17 19:14 14:20 19:05 24:05 38:01 7:04 33:03 26:06 36:03 9:09 8:19 18:26 20:15 31:11 36:14 20:24 33:04 19:12 31:02 30:20 12:19 155 160 170 180 180 155 155 155 155 150 145 160 160 135 160 140 150 155 155 155 175 175 165 190 180 165 160 165 165 175 155 155 155 165 145 145 150 150 140 140 140 150 150 150 150 150 180 150 180 180 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 Film Dauer Helligkeit Kontrast Sättigung f108a f108b f109a f111a f112a f113a f114a f115a f116a f117a f120a f121a f122a f123a f124a f125a f127a 31:20 25:06 16:29 17:07 38:10 29:23 32:19 26:02 21:07 25:10 26:10 38:29 21:04 25:27 20:06 19:06 10:22 185 140 140 190 190 170 170 180 185 170 155 165 165 145 170 170 180 165 160 165 170 175 175 175 170 175 160 160 160 170 165 165 165 175 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 Ton Sample-Rate 22 kHz 22 kHz 22 kHz 22 kHz 22 kHz 11 kHz 22 kHz 22 kHz 22 kHz 22 kHz 11 kHz 11 kHz 22 kHz 11 kHz 11 kHz ÖFA - 5 119 Ton Sample-Rate 22 kHz 22 kHz 11 kHz 11 kHz 11 kHz 22 kHz 22 kHz 11 kHz 11 kHz ANHÄNGE Kennwert-Tabellen ÖFA - 5 Film Dauer Helligkeit Kontrast Sättigung f128a f128b f129a 28:93 39:13 19:07 205 205 205 190 190 190 85 85 85 Film Dauer Helligkeit Kontrast Sättigung f130a f131a f132a f133a f135a f136a f138a f142a f145a f146a f148a 33:01 26:14 13:10 17:28 21:01 23:29 29:77 27:01 31:03 28:10 42:26 180 165 175 190 185 180 175 180 155 175 200 175 175 175 175 190 175 160 175 120 130 175 85 85 85 85 85 85 85 85 85 85 85 Film Dauer Helligkeit Kontrast Sättigung f150a f150b f151a f151e f152a f152b 33:13 16:16 10:16 22:57 24:19 12:28 195 195 145 145 160 160 185 185 180 180 180 180 85 85 85 85 85 85 Ton Sample-Rate 22 kHz ÖFA - 6 Ton Sample-Rate 11 kHz 22 kHz 22 kHz 22 kHz 11 kHz ÖFA - 7 Ton Sample-Rate 11 kHz 11 kHz 22 kHz 22 kHz Sequenzen des ORF (5 Kassetten): ORF - 1 Film Dauer Helligkeit Kontrast Sättigung o100a o101a o102a o103a o104a o105a o106a o107a o108a o109a 15:29 29:16 31:10 17:28 16:16 19:25 12:26 28:02 17:14 16:26 120 145 120 130 130 130 145 150 105 135 120 145 135 130 130 130 130 130 140 110 115 135 145 115 120 115 135 135 120 135 120 Ton Sample-Rate ANHÄNGE Kennwert-Tabellen ORF - 1 Film Dauer Helligkeit Kontrast Sättigung o110a o112a o113a o114a o115a o116a o117a o118a o119a o120a o123a o124a o125a o126a o127a o128a o129a o132a o134a o135a o136a o138a o139a o140a o141a o142a o143a o144a o145a o146a o147a o148a o148b o149a o150a o151a o153a o154a o155a o157a o158a o159a o160a o163a o164a o165a o166a o167a o169a o171a 25:10 31:02 33:21 30:06 21:22 30:09 31:09 25:00 17:06 16:24 11:06 21:21 27:12 30:23 27:26 24:13 31:24 18:25 38:23 26:00 22:16 14:06 31:26 13:00 31:12 19:19 21:29 21:29 32:23 24:15 20:25 17:19 14:12 18:28 25:21 16:00 15:12 20:00 12:14 18:06 28:11 32:23 24:15 12:21 19:29 21:18 21:29 31:26 28:28 18:04 125 130 130 130 150 140 140 140 150 155 150 170 145 155 160 145 150 175 125 170 170 115 125 150 145 160 165 165 115 155 145 150 130 135 130 160 160 160 135 135 125 120 160 145 185 130 130 150 140 155 115 125 125 125 130 130 120 130 120 130 130 130 110 130 125 125 125 135 120 125 130 120 120 130 115 130 140 135 105 130 135 135 145 135 130 130 130 130 135 120 130 130 145 130 140 140 120 125 110 120 125 130 130 130 130 135 135 140 105 120 140 135 105 120 145 125 130 115 120 120 150 125 125 130 115 130 145 135 120 130 125 130 145 145 125 140 135 135 90 110 140 145 125 135 155 150 130 155 125 135 121 Ton Sample-Rate 22 kHz 22 kHz 11 kHz ANHÄNGE Kennwert-Tabellen ORF - 1 o171b o173a o174a o176a o177a o178a o179a o181a o182a o184a o186a o187a o188a o189a o190a o191a o192a o193a o195a o198a o199a 13:20 16:19 33:05 33:15 20:18 16:12 15:25 33:06 14:14 28:18 35:13 23:12 29:00 36:08 24:17 17:02 28:15 16:17 24:09 22:00 29:05 155 145 155 145 140 145 145 150 140 150 145 130 165 160 140 145 165 150 150 140 155 120 125 130 140 130 130 125 125 120 135 130 110 135 135 125 125 120 130 130 120 130 135 130 135 135 135 140 135 140 130 130 130 125 145 145 120 125 100 125 125 135 140 Film Dauer Helligkeit Kontrast Sättigung o202a o204a o206a o207a o208a o209a o210a o211a o212a o213a o214a o215a o216a o217a o219a o226a o227a o228a o230a o231a o232a o233a o234a o235a o236a 33:10 22:27 27:00 12:27 32:26 33:20 30:25 31:11 17:07 32:20 19:02 31:19 22:21 11:04 16:24 26:08 24:17 23:15 21:11 25:07 24:05 26:06 29:16 10:11 21:29 180 180 150 160 165 175 185 165 160 140 140 150 145 145 155 160 145 150 150 150 160 155 160 155 165 185 140 120 150 150 150 150 150 135 120 140 185 145 130 130 140 130 120 160 160 150 140 145 145 130 120 125 135 160 175 165 140 160 130 125 135 150 135 135 130 85 85 85 85 85 85 85 85 85 85 11 kHz 22 kHz 11 kHz 11 kHz ORF - 2 122 Ton Sample-Rate 11 kHz 11 kHz ANHÄNGE Kennwert-Tabellen ORF - 2 Film Dauer Helligkeit Kontrast Sättigung o237a o238a o239a o240a o241a o242a o243a o245a o246a o247a o248a o249a o250a o254a o256a o262a o267a o269a o274a o276a o278a o282a o283a 25:23 33:27 22:17 33:14 31:14 18:14 20:01 28:24 22:06 39:29 24:10 21:20 16:28 25:14 33:15 16:11 29:03 29:03 27:15 29:28 28:12 31:20 31:27 145 140 150 155 165 165 170 155 175 150 175 150 150 155 120 155 130 130 140 160 140 140 150 140 130 135 135 135 145 140 140 140 145 145 150 150 145 115 140 120 120 120 125 125 125 125 85 85 85 85 85 85 85 85 85 85 85 85 85 160 85 140 135 145 130 165 185 170 155 Film Dauer Helligkeit Kontrast Sättigung o301a o302a o303a o304a o305a o306a o308a o311a o312a o313a o314a o316a o317a o318a o320a o322a o323a o324a o325a o326a o327a 18:10 27:10 30:29 29:00 28:28 20:43 28:15 25:00 21:05 16:12 25:15 29:17 22:11 20:17 23:29 31:05 32:07 35:20 7:17 27:25 27:16 160 170 145 160 150 140 135 165 165 130 140 140 125 140 125 140 160 140 120 135 145 165 165 145 140 155 150 165 165 150 175 175 135 130 125 120 135 155 155 120 140 140 135 135 140 155 160 150 155 145 155 140 140 170 170 150 120 140 150 150 140 140 140 Ton Sample-Rate 11 kHz 11 kHz 11 kHz 22 kHz 11 kHz 11 kHz 11 kHz 11 kHz 11 kHz ORF - 3 123 Ton Sample-Rate 11 kHz ANHÄNGE Kennwert-Tabellen ORF - 3 Film Dauer Helligkeit Kontrast Sättigung o328a o329a o330a o331a o334a o335a o336a o337a o338a o339a o340a o341a o342a o343a o344a o346a o347a o348a o349a o350a o351a o353a o355a o356a o357a o358a 26:17 32:00 30:04 15:26 31:21 19:03 30:06 29:28 30:22 30:18 31:26 31:13 18:04 20:01 33:11 29:29 29:25 14:29 30:05 24:06 19:29 18:00 23:22 24:19 8:20 18:10 145 145 160 135 140 140 160 165 165 130 165 145 120 130 155 150 145 160 175 155 160 150 140 155 160 145 125 130 140 130 170 125 140 145 140 125 145 140 120 120 135 125 155 155 135 120 130 125 120 120 120 135 125 120 155 140 135 125 145 140 140 130 140 150 175 165 150 155 140 160 150 140 165 120 135 140 120 120 Film Dauer Helligkeit Kontrast Sättigung o401a o402a o403a o404a o405a o406a o407a o408a o409a o410a o411a o412a o413a o414a o416a o417a o418a o419a 39:12 27:12 25:29 47:09 20:00 34:05 29:06 26:26 27:14 25:02 27:24 25:22 37:23 42:14 21:28 28:28 17:14 48:27 150 140 170 165 165 175 185 180 180 180 190 185 180 190 150 150 150 140 125 120 120 120 120 130 140 130 130 130 145 130 140 135 130 130 120 140 85 80 145 100 90 90 110 115 110 110 160 120 100 155 90 90 90 85 Ton Sample-Rate ORF - 4 124 Ton Sample-Rate 11 kHz 11 kHz 11 kHz 11 kHz 11 kHz 22 kHz 22 kHz 22 kHz 11 kHz ANHÄNGE Kennwert-Tabellen ORF - 4 Film Dauer Helligkeit Kontrast Sättigung o420a o421a o422a o423a o424a o425a o425b o426a o427a o428a o428b o429a o430a o431a o432a o433a o434a o435a o436a o437a o439a o440a o441a o442a o444a o445a o446a o447a o448a o449a o450a o451a o452a o454a o455a 14:00 21:02 10:27 15:18 33:10 32:17 10:14 24:24 33:09 20:04 41:00 28:07 31:16 29:26 32:06 22:28 34:04 17:08 28:14 24:22 17:20 32:07 34:22 32:18 23:23 15:09 20:13 30:21 28:29 20:14 21:07 41:25 29:24 16:11 43:14 185 180 155 180 180 185 185 160 180 180 180 180 185 170 185 145 190 175 180 150 185 170 150 185 170 140 170 150 170 170 180 180 180 180 190 135 135 130 140 140 150 150 140 130 155 135 150 140 140 120 115 160 130 135 140 135 135 135 130 140 140 130 120 120 120 140 140 140 140 170 85 115 100 110 105 110 110 90 100 85 85 85 85 100 100 110 85 100 100 85 85 85 85 85 70 80 110 80 100 100 80 80 80 90 100 Film Dauer Helligkeit Kontrast Sättigung o501a o502a o503a o504a 26:16 42:08 34:25 24:02 180 160 150 165 130 120 120 130 130 85 100 120 Ton Sample-Rate 11 kHz 11 kHz 22 kHz 11 kHz 11 kHz 11 kHz 11 kHz 11 kHz 11 kHz 11 kHz 11 kHz 11 kHz 11 kHz 11 kHz 11 kHz 11 kHz 22 kHz 11 kHz 22 kHz 22 kHz 11 kHz 11 kHz 22 kHz 11 kHz ORF - 5 125 Ton Sample-Rate 11 kHz 11 kHz 22 kHz 11 kHz ANHÄNGE Kennwert-Tabellen Kennwerte für die Aufnahme im MPEG-Format Sequenzen der AVL (1 Kassette) : AVL - 1 Video Länge Helligkeit Sättigung Kontrast a001a 26:40 15 60 60 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 3/0 112 6 150 Sequenzen des österreichischen Filmarchivs Laxenburg (7 Kassetten): ÖFA - 1 Video Länge Helligkeit Sättigung Kontrast f001a f001b f005a f006a f007a f008a f009a f010a f011a f012a f014a f015a f016a f018a f019a f019b f020a f021a f022a f024a f025a 27:72 24:12 11:04 21:96 14:88 17:64 23:76 28:08 24:96 18:84 23:76 24:60 21:00 33:84 29:04 21:48 21:48 25:44 28:08 23:28 27:72 -5 -5 -25 0 -5 -15 -5 -5 -5 -5 0 -5 0 -5 -25 5 -5 -5 -5 -25 -10 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 80 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 80 64 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 7/0 150 7/0 112 6 150 7 / -2 150 7/0 150 7/0 112 6 150 7/0 112 6 150 7/0 112 6 150 7/0 112 6 150 7/0 112 6 150 7/0 112 6 150 7 / -2 150 7 / -2 150 7 / -2 150 7/0 112 6 150 7/0 112 6 150 7/0 112 6 150 7/0 112 6 150 7/0 112 6 150 7/0 112 6 150 7/0 112 6 150 7/0 112 6 150 ÖFA - 2 Video Länge Helligkeit Sättigung Kontrast f027a f028a f029a f032a f033a f034a f035a f037a f038a f040a 17:16 17:64 39:48 33:72 22:92 18:00 25:92 8:76 18:84 21:96 0 -5 -5 0 -5 0 -10 -15 -10 0 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 80 80 80 64 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 6 / -2 150 6/0 150 7/0 112 6 150 6/0 112 6 150 6/0 150 6/0 112 6 150 7/0 150 8 / -2 150 6 / -2 150 7 / -2 150 126 ANHÄNGE Kennwert-Tabellen ÖFA - 2 Video Länge Helligkeit Sättigung Kontrast f041a f042a f044a f046a f047a f047b f050a f052a 22:92 28:08 21:48 19:80 31:20 23:64 12:36 31:20 0 -5 0 -5 0 0 0 -10 64 64 64 64 64 64 64 64 64 64 64 80 64 64 64 64 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 6 / -2 150 7/0 112 6 150 6 / -2 150 6 / -2 150 6 / -2 150 6 / -2 150 6/0 150 6 / -2 150 ÖFA - 3 Video Länge Helligkeit Sättigung Kontrast f053a f053b f053c f053d f055a f056a f057a f058a f059a f060a f061a f061b f062a f064a f064b f065a f066a f067a f068a f069a f070a f071a f072a f073a f074a f075a f076a f076b f077a f078a 14:04 24:56 26:76 32:52 17:16 36:00 33:84 34:32 17:16 18:36 18:48 39:48 32:88 13:20 31:68 12:24 28:08 27:24 24:24 27:24 19:76 27:72 25:08 31:20 17:64 27:24 18:48 17:16 24:12 25:44 -10 -10 0 -10 0 0 -20 0 -5 -10 -5 -5 0 -5 -5 5 -5 -10 -5 -30 10 5 -5 -5 -5 0 -5 -5 -5 -5 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 60 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 80 64 64 64 80 64 64 64 64 54 64 64 64 64 64 64 64 64 64 64 64 64 64 64 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 6 / -2 150 6 / -2 150 6 / -2 150 6 / -2 150 6 / -2 150 6 / -2 150 6 / -2 112 6 150 6/0 150 7/0 112 6 150 6 / -2 150 6/0 112 6 150 6/0 112 6 150 6/0 112 6 150 6 / -2 150 6 / -2 150 6 / -2 150 6/0 112 6 150 6/0 112 6 150 7/0 150 6/0 150 7 / -2 150 6/0 150 2/0 150 6/0 112 6 150 6/0 112 6 150 6/0 112 6 150 6/0 112 6 150 6/0 112 6 150 6/0 112 6 150 5/0 150 127 ANHÄNGE Kennwert-Tabellen ÖFA - 4 Video Länge Helligkeit Sättigung Kontrast f079a f080a f081a f082a f083a f084a f085a f086a f088a f089a f091a f092a f093a f094a f097a f098a f099a f100a f100b f101a f102a f104a f104b f106a f107a 15:36 24:60 33:48 8:28 19:32 14:04 18:84 23:28 37:68 7:44 33:72 26:40 36:48 8:76 9:72 18:48 20:64 31:68 36:48 20:16 32:88 19:80 31:20 30:72 12:72 -5 -5 -5 -5 0 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 0 -5 -5 -5 0 -5 -5 -5 -5 -5 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 6/0 150 6/0 112 6 150 6 / -2 112 6 150 6/0 150 6/0 150 6/0 112 6 150 6/0 112 6 150 6/0 112 6 150 6/0 112 6 150 6/0 112 6 150 6/0 150 6/0 150 6/0 150 2 / -2 150 2 / -2 150 0/0 150 6/0 112 6 150 6/0 112 6 150 6/0 112 6 150 6/0 112 6 150 6/0 112 6 150 6/0 112 6 150 6/0 112 6 150 6 / -2 150 6 / -2 112 6 150 ÖFA - 5 Video Länge Helligkeit Sättigung Kontrast f108a f108b f109a f111a f112a f113a f114a f115a f116a f117a f120a f121a f122a f123a f124a f125a f127a 31:32 24:60 17:16 16:68 38:64 31:68 32:52 26:40 21:96 25:92 26:40 39:48 20:64 25:44 20:28 17:52 8:76 -5 0 -5 10 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 64 64 64 64 64 64 64 64 64 64 64 64 64 80 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 6/0 112 6 150 6/0 112 6 150 2/0 150 6 / -2 150 6/0 112 6 150 6/0 112 6 150 6/0 112 6 150 6/0 112 6 150 6/0 150 6 / -2 150 6/0 112 6 150 6/0 112 6 150 6/0 112 6 150 6/0 150 6/0 150 4 / -2 150 4/0 150 128 ANHÄNGE Kennwert-Tabellen ÖFA - 5 Video Länge Helligkeit Sättigung Kontrast f128a f128b f129a 24:12 36:84 19:80 0 30 -5 64 60 64 64 58 64 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 4 / -2 150 4 / -2 150 6/0 112 6 150 ÖFA - 6 Video Länge Helligkeit Sättigung Kontrast f130a f131a f132a f133a f135a f136a f137a f138a f142a f145a f146a f148a 33:48 26:76 12:24 18:00 21:12 24:60 19:32 29:88 27:08 30:72 25:44 43:08 -5 -5 -10 -5 -5 -5 -5 10 -5 -5 0 0 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 2 / -2 112 6 158 6 / -2 150 6/0 150 6 / -2 150 6/0 112 6 150 7 / -2 150 6 / -2 150 6 / -2 112 6 150 6 / -2 150 6/0 112 6 150 6 / -2 150 6/0 112 6 150 ÖFA - 7 Video Länge Helligkeit Sättigung Kontrast f150a f150b f151a f151e f151f f151g f151h f152a f152b 33:84 16:68 10:08 21:96 21:00 42:12 17:52 24:60 13:20 0 0 0 -10 0 0 0 0 0 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 7/0 112 6 150 7/0 112 6 150 7/0 150 7/0 150 7/0 150 7/0 150 7/0 150 7/0 112 6 150 7/0 112 6 150 Sequenzen des ORF (5 Cassetten) : ORF – 1 Video Länge Helligkeit Sättigung Kontrast o100a o101a o102a o103a o104a o105a 14:40 28:52 29:88 17:64 14:04 17:96 -30 -5 -25 -20 -20 -20 80 80 80 80 90 64 64 64 64 64 80 64 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 2/0 150 2/0 150 2/0 150 2/0 150 2/0 150 2/0 150 129 ANHÄNGE Kennwert-Tabellen ORF – 1 Video Länge Helligkeit Sättigung Kontrast o106a o107a o108a o109a o110a o112a o113a o114a o115a o116a o117a o118a o119a o120a o123a o124a o125a o126a o127a o128a o129a o132a o134a o135a o136a o138a o139a o140a o141a o142a o143a o144a o145a o146a o147a o148a o148b o149a o150a o151a o153a o154a o155a o157a o158a o159a o160a o163a o164a o165a 12:72 26:88 16:68 16:20 24:12 30:72 33:36 28:08 20:96 31:56 29:04 23:28 14:40 14:88 11:04 21:60 25:92 32:52 27:24 24:96 32:04 16:68 38:76 25:44 22:44 14:52 31:20 10:56 31:68 19:32 21:48 20:64 32:52 24:60 18:48 16:68 14:04 17:52 25:56 16:32 15:00 18:96 12:36 18:48 25:92 33:36 24:60 12:36 18:36 21:60 -5 -15 -40 -20 -15 -20 -15 -40 -30 -20 -30 -5 -5 -5 -20 5 -10 -5 -10 -10 5 0 -10 -5 10 -15 -20 -10 -5 5 0 -5 -35 -5 -10 -15 -20 -5 -10 -10 -5 5 -15 -10 -15 -25 -10 -10 -5 -25 90 64 80 64 80 64 80 64 64 80 90 90 80 80 64 90 80 80 64 64 72 72 60 64 80 60 80 64 64 80 64 64 68 68 64 72 68 68 64 64 64 80 68 64 64 64 80 64 64 68 80 64 64 64 64 64 64 64 64 64 80 80 64 64 64 80 64 64 64 64 64 64 64 64 64 50 64 64 64 64 64 64 60 64 56 72 64 64 64 64 64 64 60 64 64 64 64 64 64 64 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 2/0 150 2/0 150 2/0 150 2/0 150 2/0 150 2/0 150 3/0 150 2/0 150 2/0 150 3/0 150 2/0 150 4 / -4 150 3/0 150 3/0 150 2/0 150 2/0 150 3/0 150 1/0 150 2/0 150 3/0 150 3/0 112 6 150 8/0 150 3/0 112 6 150 2/0 150 3/0 150 2/0 150 0/0 150 2/0 150 2/0 150 3/0 150 2/0 150 2/0 150 2/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 2/0 150 2/0 112 6 150 2/0 150 2/0 150 3/0 150 2/0 150 2/0 150 2/0 150 3/0 150 2/0 150 3/0 150 3/0 150 130 ANHÄNGE Kennwert-Tabellen ORF – 1 Video Länge Helligkeit Sättigung Kontrast o166a o167a o169a o171a o171b o173a o174a o176a o177a o178a o179a o181a o182a o184a o186a o187a o188a o189a o190a o191a o192a o193a o195a o198a o199a 21:00 26:76 28:08 16:68 13:20 15:84 32:52 29:40 19:32 15:00 14:88 32:52 13:56 27:72 30:24 18:48 27:72 36:48 24:48 16:68 29:04 16:32 24:12 25:44 29:52 -20 -10 -15 -10 -10 -10 -10 -20 -25 -20 -25 -15 -15 -20 -15 -40 -10 0 -5 -20 -10 -10 -10 5 -15 68 64 64 64 64 64 64 64 64 64 64 64 42 64 90 64 68 68 64 64 60 68 80 42 90 64 64 64 64 64 64 64 64 64 64 64 64 44 64 80 56 60 56 60 52 60 64 64 45 80 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 3/0 150 3/0 150 2/0 150 4/0 150 4/0 150 3/0 150 4/0 150 3/0 150 3/0 150 3/0 150 1/0 150 1/0 150 0/0 150 3/0 150 3/0 150 3/0 150 2/0 150 4/0 112 6 150 3/0 112 6 150 3/0 112 6 150 3/0 150 3/0 150 3/0 112 6 150 3/0 150 3/0 150 ORF - 2 Video Länge Helligkeit Sättigung Kontrast o202a o204a o206a o207a o208a o209a o210a o211a o212a o213a o214a o215a o216a o217a o219a o226a o227a o228a o230a 32:88 20:64 26:28 12:72 31:68 33:36 30:24 31:20 16:20 32:04 18:48 30:72 21:96 11:40 15:84 26:76 24:12 23:28 21:12 0 0 -35 -10 -10 -10 0 -10 -5 -15 0 0 -10 -10 -15 -10 -5 -10 -10 80 76 52 76 90 64 80 80 68 68 66 64 64 64 76 60 64 64 64 64 64 56 68 64 64 64 64 68 64 60 64 64 64 60 72 64 64 64 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 2/0 150 2/0 150 2/0 150 2/0 150 2/0 150 3/0 150 3/0 150 3/0 150 2/0 150 2/0 112 6 150 3/0 112 6 150 3/0 150 131 ANHÄNGE Kennwert-Tabellen ORF - 2 Video Länge Helligkeit Sättigung Kontrast o231a o232a o233a o234a o235a o236a o237a o238a o239a o240a o241a o242a o243a o245a o246a o247a o248a o249a o250a o254a o256a o262a o267a o269a o274a o276a o278a o282a o283a 25:08 21:96 26:40 29:88 10:56 21:96 25:08 31:08 21:96 33:00 31:68 18:48 20:28 28:08 22:32 39:48 24:60 20:64 15:24 25:00 33:36 16:68 29:40 29:40 27:12 28:10 28:08 31:68 31:68 -10 -10 -10 -5 -10 0 -25 -10 -10 -10 -5 -10 0 -10 0 -20 -10 -15 0 -10 -20 -10 -10 -10 -15 -10 -10 -10 -10 58 64 64 64 64 64 56 54 64 64 64 64 64 64 64 56 64 60 64 64 48 80 68 72 60 80 80 74 80 60 64 64 64 64 64 64 60 64 64 64 64 64 64 64 68 64 60 64 64 54 64 64 64 54 64 64 58 64 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 3/0 150 3/0 150 3/0 150 2/0 112 6 150 3/0 112 6 150 2/0 150 2/0 112 6 150 2/0 150 3/0 150 3 / -2 150 2/0 150 3/0 150 2/0 112 6 150 3/0 150 2/0 112 6 150 3/0 112 6 150 3/0 150 2/0 150 2/0 150 3/0 150 3/0 150 3/0 150 3/0 112 6 150 -1 / 0 112 6 150 2/0 150 2/0 112 6 150 3/0 112 6 150 3/0 150 3/0 112 6 150 ORF - 3 Video Länge Helligkeit Sättigung Kontrast o301a o302a o303a o304a o305a o306a o308a o311a o312a o313a o314a o316a o317a o318a o320a 18:84 25:92 29:88 28:56 27:72 20:28 28:56 23:76 21:48 15:84 25:56 29:40 21:00 18:84 22:44 -10 -10 -20 -10 -10 -10 -10 -10 -10 -20 -10 -10 -25 -10 -30 64 64 64 64 64 80 80 64 80 80 80 80 80 80 80 64 64 64 64 64 64 64 64 80 64 64 64 64 64 64 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 3/0 150 3/0 150 3/0 150 4/0 150 4/0 150 4/0 150 5/0 112 6 150 3/0 150 4/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 132 ANHÄNGE Kennwert-Tabellen ORF - 3 Video Länge Helligkeit Sättigung Kontrast o322a o323a o324a o325a o326a o327a o328a o329a o330a o331a o334a o335a o336a o337a o338a o339a o340a o341a o342a o343a o344a o346a o347a o348a o349a o350a o351a o353a o355a o356a o357a o358a 30:72 31:20 34:24 6:96 27:60 26:28 24:60 25:92 29:88 14:52 30:72 18:96 29:40 28:20 29:88 29:08 30:72 29:88 17:16 19:80 33:00 29:04 28:92 14:04 28:56 24:12 19:32 17:16 22:92 24:60 7:44 17:16 -10 -10 -10 -50 -10 -10 -10 -10 -10 -15 -20 -10 5 -10 -10 -30 -10 -5 -60 -15 -10 -10 -10 -10 15 -5 -10 -10 -20 0 -15 -35 64 80 64 80 64 80 80 64 64 80 80 80 80 64 64 80 80 80 100 100 64 64 64 64 120 80 80 80 80 100 90 90 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 80 80 64 64 64 64 80 64 64 64 64 80 80 80 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 6/0 150 3/ 0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 3/0 150 ORF - 4 Video Länge Helligkeit Sättigung Kontrast o401a o402a o403a o404a o405a o406a o407a o408a o409a o410a o411a o412a 39:60 26:28 25:92 47:40 20:28 32:04 28:56 25:44 25:44 24:12 27:72 27:24 -10 0 0 5 0 0 25 35 20 15 30 15 48 44 68 72 64 60 60 54 68 64 70 64 52 54 64 64 60 64 64 62 64 64 64 64 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 9/0 112 6 150 8/0 150 8/0 112 6 150 7/0 112 6 150 8/0 112 6 150 7/0 150 8/0 150 8/0 150 8/0 150 8/0 150 8/0 112 6 150 8/0 150 133 ANHÄNGE Kennwert-Tabellen ORF - 4 Video Länge Helligkeit Sättigung Kontrast o413a o414a o416a o417a o418a o419a o420a o421a o422a o423a o424a o425a o425b o426a o427a o428a o428b o429a o430a o431a o432a o433a o434a o435a o436a o437a o439a o440a o441a o442a o444a o445a o446a o447a o448a o449a o450a o451a o452a o454a o455a 37:80 42:12 22:44 29:04 17:16 48:72 13:56 21:00 10:92 15:36 32:88 31:20 10:08 24:12 32:04 19:68 40:44 28:56 31:08 29:52 30:24 23:76 33:36 17:16 28:08 25:08 17:16 31:56 35:16 32:52 22:80 15:36 19:32 30:72 29:52 19:80 21:48 41:76 29:04 16:20 43:08 15 20 -5 10 5 -15 5 30 0 20 40 25 25 5 25 20 25 20 30 30 20 -25 25 15 20 0 5 25 -5 30 20 -15 15 -5 25 0 10 20 5 15 30 44 60 68 56 64 70 64 40 36 44 66 54 52 58 60 58 54 58 58 60 56 58 60 48 60 64 64 58 60 62 20 64 62 52 64 64 54 60 64 60 50 54 62 64 62 64 62 54 52 40 64 60 58 58 54 64 56 58 62 58 62 60 56 70 58 64 64 64 62 62 64 40 60 60 60 62 64 62 52 64 60 60 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 7/0 150 7/0 150 7/0 112 6 150 7/0 112 6 150 8/0 112 6 150 7/0 112 6 150 4/0 112 6 150 7/0 112 6 150 7/0 112 6 150 7/0 150 7/0 150 5/0 150 5/0 150 5/0 150 8/0 150 4/0 150 4/0 150 4/0 150 4/0 112 6 150 4/0 112 6 150 6 / -2 150 4/0 112 6 150 5/0 112 6 150 5/0 112 6 150 5/0 112 6 150 4/0 112 6 150 5/0 112 6 150 4/0 112 6 150 4/0 112 6 150 4/0 112 6 150 7/0 112 6 150 4/0 112 6 150 4/0 112 6 150 8/0 112 6 150 4/0 112 6 150 8/0 112 6 150 8/0 112 6 150 4/0 112 6 150 4/0 112 6 150 4/0 112 6 150 4/0 112 6 150 ORF - 5 Video Länge Helligkeit Sättigung Kontrast o501a o502a o503a o504a 28:08 41:76 34:68 23:64 10 -10 5 5 80 52 72 50 64 60 64 60 Offset Ton Ton Gesamt Hor./Vert. Bitrate Lautst. Bitrate 3/0 112 6 150 5/0 112 6 150 4/0 112 6 150 7/0 112 6 150 134 ABBILDUNGSVERZEICHNIS Abbildungsverzeichnis Die Abbildungen auf den Deckblättern der einzelnen Kapitel stellen Screenshots aus der OnlinePräsentation des AEIOU-Projektes und den darin enthaltenen Alben dar. Abbildung 1: Die Einstiegsseite des AEIOU-Projektes.....................................................................................12 Abbildung 2: Sechs Alben des AEIOU-Systems .............................................................................................. 13 Abbildung 3: Ein Blick auf das Videoalbum des AEIOU-Projektes ..................................................................15 Abbildung 4: Der Einstieg in die Musikgeschichte...........................................................................................19 Abbildung 5: Die kanonische Form des RIFF-Formates ...................................................................................21 Abbildung 6: Der Audiorecorder .....................................................................................................................23 Abbildung 7: Festlegen der Audioeigenschaften...............................................................................................24 Abbildung 8: Anpassen der Audioqualität........................................................................................................25 Abbildung 9: Beispiel einer HTML-Seite mit Link auf Audiodateien ...............................................................26 Abbildung 10: Der Real Audio Encoder v3.0...................................................................................................30 Abbildung 11: Der VivoActive Producer v2.0..................................................................................................36 Abbildung 12: Auswahl einer Parameterdatei...................................................................................................37 Abbildung 13: Editieren einer Parameterdatei ..................................................................................................37 Abbildung 14: Der Frequenzbereich des Hörvermögens eines Menschen.......................................................... 41 Abbildung 15: Der Aufbau eines MP3-Frames.................................................................................................42 Abbildung 16: Das Hauptfenster des XING MP3-Encoders..............................................................................44 Abbildung 17: Anzeige der eingefügten Kodierungsjobs im XING MP3-Encoder............................................ 44 Abbildung 18: Anzeige der Eigenschaften eines Konvertierungsauftrages ........................................................ 45 Abbildung 19: Festlegen eines Konvertierungsprofiles mit bestimmter Bitrate.................................................. 45 Abbildung 20: Festlegung der Standardeinstellungen für die Kodierung ...........................................................46 Abbildung 21: Gliederung der Videosequenzen in Kategorien.......................................................................... 54 Abbildung 22: Skizzierter Ablauf bei der Erstellung der Videosequenzen.........................................................55 Abbildung 23: Der "Kranzltanz" aus dem AEIOU-Videoalbum........................................................................62 Abbildung 24: Ablaufskizze für die Erstellung von AVI-Sequenzen.................................................................63 Abbildung 25: Öffnen eines neuen Projektes....................................................................................................64 Abbildung 26: Das Hauptfenster von Adobe Premiere mit Videoquelle ............................................................ 65 Abbildung 27: Festlegung der Videoquelle ......................................................................................................66 Abbildung 28: Einstellung der Aufnahmeoptionen ...........................................................................................67 Abbildung 29: Videoformat festlegen ..............................................................................................................67 Abbildung 30: Wahl der Videokompression.....................................................................................................68 Abbildung 31: Einstellen der Audioeigenschaften ............................................................................................ 68 Abbildung 32: Das Schnittfenster von Adobe Premiere.................................................................................... 70 Abbildung 33: Änderung der Darstellung im Schnittfenster..............................................................................70 Abbildung 34: Der "Make Movie"-Dialog .......................................................................................................72 Abbildung 35: Festlegen der Ausgabeeinstellungen .........................................................................................73 Abbildung 36: Kompressionseinstellungen wählen .......................................................................................... 73 Abbildung 37: Zusätzliche Parameter festlegen ................................................................................................ 74 Abbildung 38: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im AVI-Format ........................ 75 Abbildung 39: Auszug aus den Testreihen für das AEIOU-Projekt ...................................................................77 Abbildung 40: Beispiel eines QuickTime-Atoms .............................................................................................79 Abbildung 41: Beispiel eines QT-Atoms.......................................................................................................... 80 Abbildung 42: Beispiel einer QuickTime-Datei................................................................................................ 82 Abbildung 43: Der Make Movie-Dialog (QuickTime-Format).......................................................................... 83 Abbildung 44: Festlegung der Ausgabeeinstellungen (QuickTime-Format) ...................................................... 84 Abbildung 45: Kompressionseinstellungen wählen (QuickTime-Format) .........................................................85 Abbildung 46: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im QuickTime-Format..............86 Abbildung 47: Der Zusammenhang zwischen I-, P- und B-Frames ...................................................................92 Abbildung 48: Ein Blick auf das MPEG Lab Pro .............................................................................................93 Abbildung 49: Festlegung der Ausgabeparameter ............................................................................................ 94 Abbildung 50: Kalibrierung der Videoquelle....................................................................................................95 Abbildung 51: Das Encoding-Fenster ..............................................................................................................96 Abbildung 52: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im MPEG-Format .................... 97 Abbildung 53: Der Real Video Encoder ......................................................................................................... 100 Abbildung 54: Wahl der Eingabe- und der Ausgabedatei................................................................................ 101 Abbildung 55: Erweiterte Einstellungen für die Konvertierung....................................................................... 101 Abbildung 56: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im RealVideo-Format............. 103 135 ABBILDUNGSVERZEICHNIS Abbildung 57: Der VivoActive-Producer v2.0 (Video)................................................................................... 107 Abbildung 58: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im VivoActive-Format ........... 109 Abbildung 59: HTML-Seite aus dem Videoalbum mit dem "Kranzltanz" als VivoActive-Objekt .................... 110 Abbildung 60: Anschlussplan für die Aufnahme im AVI-Format ................................................................... 115 Abbildung 61: Anschlussplan für die Aufnahme im MPEG-Format................................................................ 116 136 TABELLENVERZEICHNIS Tabellenverzeichnis Tabelle 1: Konfiguration der Arbeitsumgebung................................................................................................ 17 Tabelle 2: Qualitätsstufen des Waveform-Formates .........................................................................................27 Tabelle 3: Qualitätsstufen von Real Audio.......................................................................................................33 Tabelle 4: Gegenüberstellung Waveform-VivoActive ...................................................................................... 39 Tabelle 5: Die Qualitätsstufen von MP3...........................................................................................................48 Tabelle 6: Gegenüberstellung Microsoft Waveform und MP3 .......................................................................... 49 Tabelle 7: Bildparameter für den „Kranzltanz“ aus dem Videoalbum des AEIOU.............................................69 Tabelle 8: Auflistung der Basis-Atomtypen des QuickTime-Formates.............................................................. 81 Tabelle 9: Gegenüberstellung AVI-Apple QuickTime...................................................................................... 88 Tabelle 10: Real Video Aufnahmevorlagen.................................................................................................... 104 Tabelle 11: Gegenüberstellung AVI-VivoActive............................................................................................ 111 137 LITERATURVERZEICHNIS Literaturverzeichnis [APPLE96] DEVELOPER PRESS APPLE; Quick Time File Format Specification. 1996 [AUSSERHOFER96] AUSSERHOFER ANDREAS; Das Österreich-Lexikon und HGINFO – zwei Hypermedia-Applikationen. Technische Universität Graz, Institut für Informationsverarbeitung und Computergestützte neue Medien, Graz, Diplomarbeit, 1996 [BAMBERGER95] BAMBERGER RICHARD UND MARIA, BRUCKMÜLLER ERNST, GUTKAS KARL; Österreich Lexikon in zwei Bänden. Verlagsgemeinschaft Österreich-Lexikon, 1995 [DCT90] K. R. RAO, P. YIP; Discrete Cosine Transforn – Algorithms, Advantages, Applications. Academic Press, Inc., 1990 [FLYNN95] FLYNN PETER; The World Wide Web Handbook. An HTML Guide for Users, Authors and Publishers. Thomson, 1995 [GRAHAM96] GRAHAM IAN S.; The HTML-Sourcebook – a complete guide to HTML 3.0. Wiley Verlag, 1996 [HACKER00] HACKER SCOT; MP3: The Definitive Guide, 1st. Edition, O’Reilly & Associates, 2000 [HEROLD92] HEROLD HELMUTH; UNIX Grundlagen: Kommandos und Konzepte. 2. überarbeitete Auflage, Bonn: Addison-Wesley Publishing Company, 1992 [HOLLAUF97] HOLLAUF MICHAEL; Aufbau der Hypermediapräsentationen Österreich-Lexikon, Videoalbum und Briefmarkenalbum für den AEIOU-Informationsserver. Technische Universität Graz, Institut für Informationsverarbeitung und Computergestützte neue Medien, Graz, Diplomarbeit, 1997 [KAPPE93] KAPPE FRANK; Hyper-G: A Distributed Hypermedia System. Proc. INET’93, San Francisco, 1993 138 LITERATURVERZEICHNIS [KAY95] KAY DAVID C., LEVINE JOHN R.; Graphics file formats. Windcrest, McGraw-Hill, 1995 [KRASSER97] KRASSER ROLAND; Aufbau der Hypermediapräsentationen Musikgeschichte, Fotoalbum und Kunsthistorisches Bilderalbum für den AEIOU-Informationsserver. Technische Universität Graz, Institut für Informationsverarbeitung und Computergestützte neue Medien, Graz, Diplomarbeit, 1997 [MAURER96] MAURER HERMANN; Hyper-G is now HyperWave. The Next Generation Web Solution. 1. Auflage. Graz: Addison-Wesley Publishing Company, 1996 [MPEG94| Generic Coding of Moving Pictures and Associated Audio Information: Video. ISO/IEC 13818-2: Draft International Standard, November 1994 [MPEG97] BARRY G. HASKELL, ATUL PURI, ARUN N. NETRAVALI; Digital Video: An Introduction to MPEG-2. Chapman and Hall, 1997 [MICROSOFT92a] MICROSOFT CORPORATION; Microsoft Windows Multimedia Programmer’s Reference. 1992 [MICROSOFT92b] MICROSOFT CORPORATION; Microsoft Windows Multimedia Programmer’s Workbook. 1992 [RAGGET95] RAGGET DAVE; HyperText Markup Language Specification Version 3.0. Internet Draft, 1995 [SAMMER95] SAMMER PETER; AEIOU Projektbericht Dezember 1995. Projektzwischenbericht an das BMWV, Technische Universität Graz, Institut für Informationsverarbeitung und Computergestützte neue Medien, Graz, Internes Dokument, 1995 [SAMMER96] SAMMER PETER; AEIOU Projektbericht Dezember 1996. Projektzwischenbericht an das BMWV, Technische Universität Graz, Institut für Informationsverarbeitung und Computergestützte neue Medien, Graz, Internes Dokument, 1996 139 LITERATURVERZEICHNIS [WALSER96] WALSER ANDREAS; Aufbau der Hyperwave-Applikation Briefmarken-Album. Projektbericht, Technische Universität Graz, Institut für Informationsverarbeitung und Computergestützte neue Medien, Graz, Internes Dokument, 1996 140 LINKSAMMLUNG Linksammlung (Stand: Dezember 2000) [AEIOU97a] AEIOU-Informationssystem URL: http://www.aeiou.at [AEIOU97b] Musik-Album des AEIOU-Informationssystem URL: http://www.aeiou.at/aeiou.musalbum [AEIOU97c] Musik-Album des AEIOU-Informationssystem URL: http://www.aeiou.at/aeiou.film [GLOSSAR99] Internet Glossar. URL: http://www.bernnet.ch/htm/glossar.htm [MICROSOFT97a] MICROSOFT CORPORATION; The Microsoft Internet Explorer. URL: http://www.microsoft.com [MICROSOFT97b] Microsoft Developer Network. URL: http://www.microsoft.com [MOSER96] MOSER MATTHIAS; The PLACE Language. URL: http://www.iicm.edu/wm_doc/place [NETSCAPE97] NETSCAPE CORPORATION; Netscape Navigator. URL: http://www.netscape.com [REALNETWORK98] Real Networks. URL: http://www.Real Networks.com [REISINGER96] REISINGER BRUNO; General Information about Hyperwave Tools. URL: http://www.iicm.edu/hw_tools [VIVO98] Vivo Software. URL: http://www.vivo.com [W3C97] World Wide Web Consortium. URL: http://www.w3.org 141 LINKSAMMLUNG [WOTSIT99] Wotsit’s Format The Programmer’s Resource URL: http://www.wotsit.org 142