Aufbereitung von Audio- und Videodaten für das Musik

Transcrição

5
Aufbereitung von Audio- und Videodaten
für das Musik- und das Videoalbum des
AEIOU-Informationsservers
Diplomarbeit
vorgelegt von
Gottfried Müllner
Dezember 2000
Institut für Informationsverarbeitung
und Computergestützte neue Medien
Technische Universität Graz
Begutachter: O. Univ. Prof. Dr. phil. Dr. h. c. Hermann Maurer
Betreuer: Dipl.-Ing. Dr. techn. Peter Sammer
Danksagung
An dieser Stelle bedanke ich mich bei O. Univ.-Prof. Dr. phil. Dr. h.c. Hermann Maurer, dem
Begutachter dieser Diplomarbeit, und bei Dipl.-Ing. Dr. techn. Peter Sammer, meinem
Betreuer.
Ebenso bedanke ich mich bei allen Kollegen und Freunden, die mir im Verlauf meines
Studiums mit Rat und Tat zur Seite gestanden sind.
Mein besonderer Dank gilt meinen Eltern, Gottfried und Herta Müllner, die mich während
meines gesamten Studiums in jeder Hinsicht unterstützt haben.
Graz, Dezember 2000
Gottfried Müllner
Grundsätzlich wurden die Recherchen und Untersuchungen für die vorliegende Arbeit in den Jahren 1996 und
1997 durchgeführt und zu einem großen Teil auch in schriftlicher Form Ende des Jahres 1997 fertiggestellt. Aus
persönlichen Gründen war es dem Autor dieser Arbeit erst im Jahr 2000 möglich, die schriftliche Arbeit
abzuschließen und zur Bewertung vorzulegen.
2
ZUSAMMENFASSUNG
Zusammenfassung
Für das Projekt AEIOU, einen Informationsserver, der anlässlich des Millenniums Österreichs
ins Leben gerufen wurde, mussten unter anderem ein Musik- und ein Videoalbum
implementiert werden. In diesen Alben sollten verschiedene Sequenzen aus der
österreichischen Kultur und Geschichte weltweit elektronisch verfügbar gemacht werden.
Aus diesem Grund war es die Aufgabe des Autors der vorliegenden Arbeit, in den Jahren
1996 und 1997 Recherchen anzustellen, in denen die große Anzahl an verfügbaren Audiound Videoformaten evaluiert und auf ihre Tauglichkeit für das Projekt AEIOU untersucht
wurden. Dafür wurden unter Verwendung von spezieller Hardware und Software
umfangreiche Testreihen mit einzelnen Formaten durchgeführt. Die Sequenzen, die im Laufe
dieser Untersuchungen erstellt wurden, wurden unter Anwendung von bestimmten Kriterien
(Kompressionsrate, Bild- bzw. Tonqualität) bewertet.
Auf Basis der in diesen Recherchen erzielten Ergebnisse wurden einige der evaluierten
Formate im Musik- oder im Videoalbum des AEIOU zum Einsatz gebracht. Zusätzlich zu den
Sequenzen in Formaten, die aufgrund ihrer hohen Qualität gewählt wurden, wurde ein
weiteres Format mit geringerer Qualität in den AEIOU-Umfang aufgenommen, das den
Benutzern als Preview (Vorschau) diente.
Die vorliegende Arbeit zeigt nun die Ergebnisse dieser umfangreichen Untersuchungen. Dazu
wird zunächst gezeigt, wie Sequenzen in den vielversprechendsten der in den Jahren 1996 und
1997 verfügbaren Formate erstellt und weiterverarbeitet werden. In weiterer Folge werden
anhand der erzielten Recherche-Ergebnisse die Stärken und Schwächen der gewählten
Formate aufgezeigt und untereinander verglichen. Dieser Vergleich erfolgte vor allem in
Hinblick auf die geplante Verwendung der Clips in den AEIOU-Alben.
Das AEIOU-System, das als Plattform für diese Untersuchungen und auch für die effektive
Umsetzung der Konvertierungen in die auf Basis der Analysen innerhalb dieser Arbeit
gewählten Formate, ist seit 1996 weltweit über das Internet verfügbar und wurde aufgrund des
großen Erfolges und Zuspruches auch nach Beendigung dieser Arbeit erweitert. So wurden
wenige Jahre nach Abschluss der Recherchen für die vorliegende Arbeit für die im System
abgelegten Clips einige Formate durch neuere, bessere Formate, wie zum Beispiel MP3
ersetzt.
3
INHALTSVERZEICHNIS
Inhaltsverzeichnis
1. EINLEITUNG ...........................................................................................................................6
1.1
1.2
1.3
1.4
DAS MILLENNIUM ..........................................................................................................7
HYPERWAVE ....................................................................................................................7
DAS AEIOU-TEAM .......................................................................................................8
AUFBAU DER ARBEIT ....................................................................................................8
2. AEIOU UND MULTIMEDIA .................................................................................. 10
2.1
2.2
2.3
2.4
DAS PROJEKT AEIOU.................................................................................................11
GLIEDERUNG VON AEIOU IN ALBEN.....................................................................12
MULTIMEDIA .................................................................................................................14
BEWERTUNGSKRITERIEN............................................................................................ 15
2.4.1
2.4.2
Kompression ............................................................................................................................ 15
Bildqualität .............................................................................................................................. 16
2.5 ARBEITSUMGEBUNG ....................................................................................................16
3. AEIOU UND MUSIK .......................................................................................................18
3.1 EINLEITUNG ...................................................................................................................19
3.2 DAS AUDIOFORMAT MICROSOFT WAVEFORM (WAV, WAVE) ....................21
3.2.1
3.2.2
3.2.3
Generierung von Sequenzen im Waveform-Format....................................................................23
Integration von Waveform-Sequenzen in eine HTML-Seite ........................................................ 25
Ergebnisse................................................................................................................................ 26
3.3 DAS AUDIOFORMAT REAL AUDIO ...........................................................................29
3.3.1
3.3.2
3.3.3
Generierung von Sequenzen im Real Audio-Format ..................................................................29
Integration von Real Audio-Sequenzen in eine HTML-Seite .......................................................31
Ergebnisse................................................................................................................................ 32
3.4 DAS AUDIOFORMAT VIVO ACTIVE..........................................................................35
3.4.1
3.4.2
3.4.3
Generierung von Sequenzen im Vivo Active-Format ..................................................................35
Integration von Vivo Active-Sequenzen in eine HTML-Seite.......................................................38
Ergebnisse................................................................................................................................ 39
3.5 DAS AUDIOFORMAT MP3 ..........................................................................................41
3.5.1
3.5.2
3.5.3
Generierung von Sequenzen im MP3-Format ............................................................................ 43
Integration von Sequenzen im MP3-Format in eine HTML-Seite................................................47
Ergebnisse................................................................................................................................ 48
4. AEIOU UND FILM............................................................................................................ 52
4.1 EINLEITUNG ...................................................................................................................53
4.2 DAS VIDEOFORMAT AUDIO VIDEO INTERLEAVE (AVI)....................................56
4.2.1
4.2.2
4.2.3
Generierung von Sequenzen im AVI-Format .............................................................................63
Integration von AVI-Sequenzen in eine HTML-Seite ..................................................................74
Ergebnisse................................................................................................................................ 76
4.3 DAS VIDEOFORMAT APPLE QUICKTIME ................................................................ 78
4.3.1
4.3.2
4.3.3
Generierung von Sequenzen im QuickTime-Format...................................................................83
Integration von QuickTime-Sequenzen in eine HTML-Seite .......................................................85
Ergebnisse................................................................................................................................ 87
4
INHALTSVERZEICHNIS
4.4 DAS VIDEOFORMAT MOVING PICTURES EXPERT GROUP .................................90
4.4.1
4.4.2
4.4.3
Generierung von Sequenzen im MPEG-Format.........................................................................92
Integration von MPEG-Sequenzen in eine HTML-Seite .............................................................96
Ergebnisse................................................................................................................................ 98
4.5 DAS VIDEOFORMAT REAL VIDEO............................................................................99
4.5.1
4.5.2
4.5.3
Generierung von Sequenzen im Real Video-Format...................................................................99
Integration von Real Video-Sequenzen in eine HTML-Seite ..................................................... 102
Ergebnisse.............................................................................................................................. 103
4.6 DAS VIDEOFORMAT VIVO ACTIVE ........................................................................ 106
4.6.1
4.6.2
4.6.3
Generierung von Sequenzen im Vivo Active-Format ................................................................ 106
Integration von Vivo Active-Sequenzen in HTML-Seiten.......................................................... 107
Ergebnisse.............................................................................................................................. 110
ANHÄNGE ...................................................................................................................................... 114
ABBILDUNGSVERZEICHNIS.................................................................................................................. 135
TABELLENVERZEICHNIS...................................................................................................................... 136
TABELLENVERZEICHNIS...................................................................................................................... 137
LITERATURVERZEICHNIS .................................................................................................................... 138
LINKSAMMLUNG (STAND: DEZEMBER 2000).................................................................................... 141
5
1.
Einleitung
Kapitel 1
Einleitung
EINLEITUNG
1.1
Das Millennium
Hyperwave
Das Millennium
Wir schreiben das Jahr 996 nach Christi Geburt. Ein als Ostmark bekanntes Gebiet wird als
Lehen der Babenberger deklariert. Der Name dieses Lehens lautet ostarrîchi.
Eintausend Jahre sind vergangen. Wir schreiben das Jahr 1996 nach Christi Geburt.
Anlässlich des Millenniums, der 1000-Jahr-Feier Österreichs, wird der AEIOUInformationsserver [AEIOU97a] realisiert. Dieser Server stellt die größte Ansammlung von
österreichbezogenen Daten dar, die in elektronischer Form weltweit öffentlich verfügbar
gemacht wurde. Millionen von Menschen wird hiermit die Möglichkeit geboten, weltweit
unter der Internet-Adresse
http://www.aeiou.at
Informationen über das Land Österreich abzurufen, darunter auch jene Schenkungsurkunde
aus dem Jahr 996, in der Österreich zum ersten Mal namentlich erwähnt wurde.
Das AEIOU-Informationssystem baut auf zwei Entwicklungen auf, ohne deren spezielle
Eigenschaften und Möglichkeiten eine erfolgreiche Umsetzung des Systems nicht möglich
gewesen wäre:
1.2
•
das Internet 1, das eine weltweite Verbreitung von Informationen in Form von Text,
Ton und Bild ermöglicht und
•
das Softwarepaket Hyperwave [MAURER96], das die Grundlage des AEIOUInformationssystems bildet.
Hyperwave
Die Entwicklung von Hyperwave wurde im Jahr 1989 am Institut für
Informationsverarbeitung und Computergestütze neue Medien (IICM) der Technischen
Universität Graz unter der Leitung von O.Univ.Prof. Dr. phil. h. c. Hermann Maurer
begonnen. Dieses „Informationssystem der zweiten Generation“ ist zwar als einfacher
Informationsserver konzipiert, weist jedoch eine Vielzahl an elementaren Funktionen auf, die
eine Nutzung des Netzes im eigentlichen Sinn erst ermöglichen.
Im Gegensatz zu den üblichen Web-Server-Technologien werden in Hyperwave Dokumente
und Links auf diese Dokumente separat verwaltet. Dadurch ist eine effiziente Datenpflege in
Bezug auf die Vermeidung von dangling links2 möglich. Zusätzlich unterstützt dieses System
Mehrsprachigkeit und bietet umfassende Suchfunktionen.
Nähere Informationen über die Struktur und die Funktionalität des Hyperwave-Systems
können in den Handbüchern der Firma Hyperwave [HYPERWAVE00] sowie in einigen
anderen Werken (z.B. HyperG is now Hyperwave [MAURER96], The PLACE Language
[MOSER96]) gefunden werden.
1
Das Internet ist ein globales Computernetzwerk, das die Verbindung und den Datenaustausch zwischen zwei
beliebigen Computern in diesem Netzwerk ermöglicht. Das Internet bestand Ende 1995 aus ca. 40.000.000
Computern mit einer Zuwachsrate von ca. 15% pro Monat. Die Daten auf dem Internet werden m it dem TCP/IPProtokoll übertragen. Jeder am Internet angeschlossene Computer hat als "Adresse" eine Internet-Nummer.
2
Link auf ein Dokument, das bereits von dem entsprechenden Web-Server gelöscht wurde.
7
EINLEITUNG
1.3
Das AEIOU-Team
Das AEIOU-Team
Über ein Dutzend Personen wirkte allein am IICM bei der Umsetzung des AEIOUInformationssystems mit. Die wichtigsten Mitglieder des AEIOU-Teams sowie ihre
Arbeitsbereiche seien hier kurz angeführt:
Unter der Gesamtleitung von O.Univ. Prof. Dr. phil. h. c. Hermann Maurer erfolgte die
Umsetzung des Projektes am IICM. Die Entwicklung der einzelnen Alben führte dabei Dipl.Ing. Dr. techn. Peter Sammer an, der als Projektleiter und Koordinator eingesetzt war.
Im ersten Jahr war Andreas Ausserhofer [AUSSERHOFER96] an der Entwicklung des
Österreich-Lexikons beteiligt. Im selben Zeitraum beschäftigte sich Andreas Walser
[WALSER96] mit der Implementation des Briefmarken-Albums. Unter maßgeblicher Mithilfe
von Roland Krasser [KRASSER97] wurden die Teile Photo-Album, Musik-Album und
Kunsthistorisches Bilderalbum konzipiert und realisiert. Michael Hollauf [HOLLAUF97] war
am Aufbau des Video-Albums, des Österreich-Lexikons und in den späteren Phasen auch des
Briefmarken-Albums beteiligt.
Zu den Aufgabe des Autors der vorliegenden Arbeit gehörten die Aufbereitung von
Videodaten für das Video-Album sowie ergänzenden Audiodaten für das Musik-Album und in
weiterer Folge auch der Import dieser Daten in das Informationssystem.
Zusätzlich zu den Mitarbeitern des IICM war im Auftrag des Ministeriums für Wissenschaft
und Verkehr (BMWV) Mag. Edith Murlasits mit der Auswahl und Festlegung der
Videosequenzen, die in das Video-Album aufgenommen werden sollten, verantwortlich. Für
das Musikgeschichte-Album war Mag. Elisabeth Stadler vom Institut für
Musikwissenschaften der Universität Graz mit der Auswahl und Festlegung der
Audiosequenzen beauftragt.
1.4
Aufbau der Arbeit
Im Rahmen des AEIOU-Projektes wurde eine Hypermedia-Präsentation mit Audio- und
Videosequenzen über die Kultur und die Geschichte Österreichs aufgebaut. Das Ziel der
vorliegenden Arbeit war es, die zum damaligen Zeitpunkt zur Verfügung stehenden Audiound Videoformate zu evaluieren. In diesen Untersuchungen musste recherchiert werden,
welche Vor- und Nachteile die jeweiligen Formate aufweisen und wie Clips in diesen
verschiedenen Formaten erzeugt und weiterverarbeitet werden können. Zusätzlich wurde in
diesen in den Jahren 1996 und 1997 durchgeführten Untersuchungen anhand den Ergebnissen
bewertet, welche der vorliegenden Formate sich für eine Präsentation der Daten auf dem
AEIOU-Server geeignet waren. Aufgrund der aus den umfangreichen Recherchen
gewonnenen Erkenntnisse wurden mehrere Audio- und Videoformate mit guter Qualität für
das AEIOU-Projekt gewählt. Zusätzlich wurde ein weiteres Videoformat als PreviewFunktion im Videoalbum des AEIOU-Projektes eingesetzt, um dem Betrachter vor dem
Laden der Sequenz eine Vorinformation anzubieten.
Die vorliegende Arbeit präsentiert die in den Testreihen erzielten Ergebnisse und
festgestellten Stärken und Schwächen der einzelnen Formate. Der Aufbau dieser Arbeit ist
wie folgt:
8
EINLEITUNG
Aufbau der Arbeit
Nach der Einleitung wird in Kapitel 2 (AEIOU und Multimedia) das Projekt AEIOU kurz
erklärt sowie die für die Recherchen zur Verfügung gestellte Arbeitsumgebung beschrieben.
Danach gibt Kapitel 3 (AEIOU und Musik) einen Überblick über die evaluierten
Audioformate. Dabei wird auf die Erzeugung der jeweiligen Sequenzen und deren
Weiterverarbeitung und in weiterer Folge auf die im Zuge der Untersuchungen erworbenen
Erkenntnisse im Hinblick auf eine Verwendung im AEIOU-System eingegangen. Schließlich
folgt in Kapitel 4 (AEIOU und Film) die Präsentation der Rechercheergebnisse der
analysierten Videoformate. Zunächst wird dabei die Erzeugung und Weiterverarbeitung
derartiger Sequenzen erklärt. Im Anschluss daran werden die Stärken und Schwächen der
einzelnen Videoformate beleuchtet und die Formate im Hinblick auf Ihre Eignung für eine
internetbezogene Verwendung bewertet.
9
2.
AEIOU und Multimedia
Kapitel 2
AEIOU und Multimedia
AEIOU UND MULTIMEDIA
Das Projekt AEIOU
In diesem Kapitel wird das Projekt AEIOU kurz vorgestellt und die Gliederung der Daten auf
dem AEIOU-Server in verschiedene Alben beschrieben. Weiters werden in den letzten beiden
Abschnitten dieses Kapitels die für die Evaluierung der einzelnen Formate wichtigen
Bewertungs-Kriterien (Kompression und Bildqualität) erklärt und die für die Untersuchungen
verwendeten Komponenten der Arbeitsumgebung aufgelistet.
2.1
Das Projekt AEIOU
Verschiedene Institutionen starteten anlässlich der Millenniums-Feier Österreichs – 1000
Jahre Ostarrîchi – unterschiedliche Millenniums-Projekte. Eines dieser Projekte war ein
Internet-Informationssystem das den Namen AEIOU trägt. Dieses Projekt hatte das Ziel,
unser Land und seine Kultur nachhaltig in aller Welt zu präsentieren.
Seinen Namen lieh sich das Projekt von einer Vokalreihe, die Kaiser Friedrich III. (14401493) an vielen repräsentativen Bauten anbringen ließ. Waren sich die Historiker über lange
Zeit (und sind es teilweise noch) uneinig darüber, ob diese Vokalreihe nun bedeuten sollte,
dass Österreich ewig in der Welt sein wird (Austria Erit In Orbe Ultima) oder dass es
Österreichs Bestimmung sei, die ganze Welt zu beherrschen (Austria Est Imperare Orbi
Universo) oder gar heißen sollte Alles Erdreich Ist Österreich Untertan, ist im Gegensatz
dazu der Name des Millenniumsprojektes klar und wird auf der Einstiegsseite (Abbildung 1)
erklärt.
Dieses Projekt wurde im Auftrag des Bundesministeriums für Wissenschaft und Verkehr
(BMWV) vom Institut für Informationsverarbeitung und Computergestützte neue Medien
(IICM) der Technischen Universität Graz entwickelt. Unterstützung lieferte dabei auch das
Institut für Hypermedia Systeme (HMS) der Joanneum Research Forschungsgesellschaft.
Das multimediale Informationssystem AEIOU, das seit November 1996 im Internet vertreten
ist, enthält Daten zu Geschichte und Kultur Österreichs in Text, Bild, Ton und Video und ist
in 9 verschiedene Alben gegliedert. Das Ziel dieses Projektes war, mit dem Inhalt dieser neun
Alben einen Einblick in die Landschaft und die Kultur Österreichs sowie in die Lebensweise
seiner Bewohner zu geben. Außerdem sollte sich dieses System nicht nur für den zufälligen
Benutzer eignen, sondern auch einem Informationssuchenden ein möglichst vollständiges
Nachschlagewerk bieten, in dem eine spezielle Suche durch Eingabe eines oder mehrerer
Stichworte ermöglicht wird.
11
Das Projekt AEIOU
Abbildung 1: Die Einstiegsseite des AEIOU-Projektes
2.2
Gliederung von AEIOU in Alben
Das Projekt AEIOU wurde in mehrere Subprojekte unterteilt, um bei einem System dieser
Größenordnung (der AEIOU-Server umfasst eine Datenmenge von rund 10 Gigabyte) die
Übersichtlichkeit wahren zu können. Das AEIOU-System enthält neun Subprojekte, auch
Alben genannt. Sechs dieser Alben, die am IICM basierend auf Hyperwave entwickelt
wurden, werden in Abbildung 2 gezeigt.
12
Gliederung von AEIOU in Alben
Abbildung 2: Sechs Alben des AEIOU-Systems
Nachfolgend sind diese Alben kurz beschrieben:
Österreich-Lexikon:
Die Online-Version des Österreich-Lexikons mit ungefähr 13.000
Stichwörtern und 2000 Abbildungen.
Musik-Album:
Ein Streifzug durch die österreichische Musikgeschichte mit etwa
150 Tonbeispielen und geschichtlichen Hintergründen.
Bilderalbum:
Ein Auszug der Kunst-Datenbank des Institutes für mittelalterliche
Realienkunde und der frühen Neuzeit der Österreichischen
Akademie der Wissenschaften.
13
Gliederung von AEIOU
Multimedia
in Alben
Video-Album:
Eine Sammlung von rund 360 Videosequenzen aus Geschichte und
Kultur Österreichs.
Briefmarken-Album:
Alle von der österreichischen Post in den Jahren 1986 bis 1996
herausgegebenen Sonderbriefmarken.
Foto-Album:
Über 1.500 Fotografien von den schönsten Plätzen Österreichs aus
dem Archiv der Österreich Werbung, die aus der vom IICM
entwickelten Bildersammlung Ein Digitales Reiseerlebnis
übernommen wurden.
Zusätzlich von der Einstiegsseite aus erreichbare Subprojekte stellen ein Album über den
Psychologen Sigmund Freud, eine Auswahl österreichischer Designerkunst sowie Links zu
anderen Informationsanbietern (Österreich-Online-Modul) zur Verfügung.
Der Vorteil dieses modularen Aufbaus ist, dass dem AEIOU-System jederzeit weitere Alben
zusätzlich eingebunden werden können sowie dass eine Erweiterung der bestehenden Alben
ohne Schwierigkeiten vorgenommen werden kann. Das zugrundegelegte Hyperwave
gewährleistet auch dabei durch eine seiner speziellen Eigenschaften die Wahrung der
Linkkonsistenz.
Das Kernstück dieser sechs Alben sowie des gesamten Systems stellt die elektronische
Implementation des Österreich-Lexikons dar. Doch für die Betrachtungen in dieser Arbeit
sind das Videoalbum und das Musikalbum mit vielen Tonbeispielen aus der Musikgeschichte
unserer Heimat von Bedeutung. Genauere Betrachtungen der übrigen 4 Alben können der
Arbeit von Michael Hollauf [HOLLAUF97] entnommen werden.
2.3
Multimedia
Multimedia in Bezug auf das Internet bedeutet die digitale Integration unterschiedlicher
Medien in bereitgestellte HTML3-Seiten. Diese eingebundenen Medien (Dateien) werden als
Multimedia-Objekte bezeichnet und können Textdateien, Grafiken oder Bilder, Animationen,
Musikstücke oder auch Videoclips enthalten. Ein Beispiel für die Kombination mehrerer
unterschiedlicher Medientypen - in diesem Fall Text, Bilder und Links4 auf Videoclips - kann
in nachfolgender Abbildung 3 gefunden werden. Die Schritte, die nötig sind, um eine
derartige Seite zu erhalten, also die Erstellung der HTML-Seite und die Generierung der
benötigten Multimedia-Dateien, werden weiter unten erklärt.
Texte in diese Dokumente einzubinden, bringt im Allgemeinen keinerlei Schwierigkeiten mit
sich und wird deshalb in dieser Arbeit nicht näher erklärt. Auch Bilder in den
unterschiedlichsten Formaten, allen voran GIF (Graphics Interchange Format) und JPEG
(Joint Photographic Experts Group), werden bereits seit einiger Zeit im Internet verbreitet und
verwendet. Deshalb wird in dieser Arbeit auch nicht weiter auf Standbild-Formate
eingegangen, sondern das Augenmerk eher auf die neueren multimedialen Möglichkeiten, wie
Audio- und Video-Clips, gelegt.
3
HTML heißt „Hyper Text Markup Language“ und ist die im World Wide Web verwendete DokumentenBeschreibungssprache. HTML unterstützt Hyperlinks.
4
Links (oder Hyperlinks) sind direkt ausführbare Verweise auf andere Dokumente.
14
Multimedia
Abbildung 3: Ein Blick auf das Videoalbum des AEIOU-Projektes
2.4
Bewertungskriterien
Für die beiden im Folgenden betrachteten Alben, das Musik- und das Video-Album, war es
nötig, Audio- und Videoclips zu erzeugen und diese im System bereitzustellen. Dabei erhob
sich die Frage, in welchem Format diese Clips bereitgestellt werden sollten, das heißt,
welches der zur Verfügung stehenden Formate für die geplante Verwendung im Internet am
besten geeignet ist. Aus diesem Grund wurde eine umfangreiche Testreihe durchgeführt, im
Zuge derer die vielversprechendsten Formate verglichen und bewertet werden sollten. Die
Kriterien für diese Bewertung (Kompression und Bildqualität) sind in den folgenden
Abschnitten kurz erklärt.
2.4.1
Kompression
Bei der Kompression handelt es sich um ein Verfahren um große Datenmengen, wie sie
beispielsweise bei der Erstellung von Video- oder Audiodaten entstehen, zu reduzieren. Man
unterscheidet dabei verlustfreie („lossless“) Kompression und verlustbehaftete („lossy“)
15
Bewertungskriterien
Kompression. Bei der verlustfreien Kompression werden nur Daten entfernt, die redundante
Informationen enthalten. Daher können die Daten beim Entkomprimieren, dem umgekehrten
Vorgang zur Komprimierung, wieder vollständig hergestellt werden. Da digitale Videos so
sehr oft zu Dateimonstern mutieren, wird bei der Videokompression im Allgemeinen die
verlustbehaftete Kompression verwendet. Wie der Name schon sagt, gehen dabei
Informationen unwiederbringlich verloren und können bei der Dekompression nicht
wiederhergestellt werden.
Doch trotz der auftretenden Datenverluste ist die Kompression vor allem für Videodaten nicht
wegzudenken. Zwar sind die Kapazitäten der erhältlichen Datenträger schon erheblich groß,
aber sie sind noch immer beschränkt und werden dies wohl auch bleiben. Zudem ist zu
beachten, dass nicht nur der Betreiber einer Web-Site Probleme mit großen Datenmengen
bekommen kann, sondern auch der Internet-Benutzer, der sich diese Informationen
durchsehen oder sogar herunterladen möchte.
2.4.2
Bildqualität
Die zuvor angesprochenen Verluste führen nun zum zweiten, ebenso wichtigen
Bewertungsmaß. Unter den Platzsparmaßnahmen sollte die Bildqualität nicht allzu sehr
leiden, da man sonst zwar nur wenig Speicherplatz benötigt, um die Audio- und Videodateien
abzulegen, man diese aber genauso gut gleich wieder löschen könnte, da sie ohnehin niemand
anschauen möchte.
2.5
Arbeitsumgebung
In den in den Jahren 1996 und 1997 durchgeführten Studien wurden folgende Formate und
Verfahren betrachtet und bewertet:
•
•
Audio
o
o
o
o
Microsoft Waveform (WAV)
Real Audio (RA, RM)
Vivo Active (VIV)
MPEG1 Audio Layer III (MP3)
Video
o
o
o
o
o
Audio Video Interleave (AVI)
Apple QuickTime Movie (MOV)
Motion Picture Expert Group (MPEG)
Real Video (RV, RM)
Vivo Active (VIV)
Die Testumgebung bildete ein Standard PC Pentium 133 in nachstehender Konfiguration
(siehe Tabelle 1).
16
Arbeitsumgebung
Tabelle 1: Konfiguration der Arbeitsumgebung
Prozessor (CPU)
Hauptspeicher (RAM)
Festplatte (HB)
Soundkarte
Grafikkarte
Pentium 133 MHz
32 MB
IBM DCAS 4,2 GB SCSI
16bit ISA
Standard VGA 2MB RAM
Extras
Miro DC20 Videoschnittkarte
Philips S-VHS Videorecorder
S-VHS Videokabel
Audiokabel
Optibase MPEG 4000 Encoder-Karte
Optibase PCMotion Pro Decoder-Karte
17
3.
AEIOU und Musik
Kapitel 3
AEIOU und Musik
AEIOU UND MUSIK
Einleitung
Dieses Kapitel zeigt nach einer kurzen Einleitung mit allgemeinen Betrachtungen zum Thema
AEIOU und Musik die Ergebnisse der in den Jahren 1996 und 1997 durchgeführten
Evaluierungen der Audioformate WAV (Abschnitt 3.2), Real Audio (Abschnitt 3.3), Vivo
Active (Abschnitt 3.4) und MP3 (Abschnitt 3.5). Zu diesem Zweck werden in den jeweiligen
Abschnitten zunächst die Formate selbst erklärt. Darauf folgt die Beschreibung der
Generierung von Sequenzen in diesen Formaten sowie die Einbindung derartiger Sequenzen
in bestimmte HTML-Seiten. Danach werden die Ergebnisse der Untersuchungen und die
Eignung des jeweiligen Formates für einen eventuellen Einsatz im AEIOU-Projekt beleuchtet.
3.1
Einleitung
Das Musik-Album des AEIOU-Systems enthält ungefähr 150 Tonbeispiele aus der
Musikgeschichte Österreichs inklusive geschichtlichem Hintergrund und Partiturauszügen.
Der Einstieg in die Musikgeschichte ist in Abbildung 4 zu sehen.
Abbildung 4: Der Einstieg in die Musikgeschichte
Die für dieses Album ausgewählten Musikbeispiele lagen dem AEIOU-Team in Form von
DAT-Bändern vor und mussten für die Archivierung sowie für die Bereitstellung auf dem
AEIOU-Server in verschiedene, dafür geeignete Audioformate konvertiert werden. Zusätzlich
19
AEIOU UND MUSIK
Einleitung
zur Umwandlung in die digitale Form mussten einige Clips auch noch etwas nachbearbeitet
werden. So wurden manche Musikpassagen geschnitten und die Beispiele mit einem Fade-In5
und einem Fade-Out 6 versehen.
Die Zeiten, in denen vom Personal Computer nur leises Piepsen zu hören war, sind schon seit
langem vorbei. Heute gehören eine gute Soundkarte und entsprechend leistungsstarke
Lautsprecher bereits zur Standardausrüstung der meisten PC-Benutzer. Wenn diese Benutzer
mit ihren Maschinen im Internet nach Informationen suchen und dabei auf Audio-Clips
stoßen, erwarten sie auch ein gewisses Maß an Qualität bei diesen Musikstücken. Doch womit
kann dieses Maß an Qualität sichergestellt werden? Mit welchen Formaten kann man
erreichen, dass die Zufriedenheit der Internet-Benutzer möglichst hoch ist, und sie zum einem
erneuten Besuch auf der Web-Site animiert werden oder gar die URL7 an Freunde und
Bekannte weitergeben? Was muss gemacht werden, damit die vorgesehene Botschaft die
Person am anderen Ende der Internet-Leitung erreicht und anspricht?
Grundsätzlich kann davon ausgegangen werden, dass hauptsächlich die Tonqualität dafür
ausschlaggebend ist, welche Akzeptanz die Musikstücke erreichen. Doch bei der Verwendung
im Internet ist dieses Kriterium nicht unbedingt ausreichend. So empfinden es Anwender im
Allgemeinen nicht als positiv, wenn ein Audioclip zwar einen reinen Klang hat und vielleicht
sogar Stereo unterstützt, dabei aber die Wartezeit, bis man diesen Clip auch anhören kann,
durch lange Downloads ein fast unerträgliches Ausmaß annimmt. Daraus ist zu schließen,
dass gute Qualität allein nicht alles ist, sondern dass auch die Dateigröße eine nicht
unbedeutende Rolle spielt.
Auch ist Audio-on-demand im Internet beinahe schon allgegenwärtig, das heißt, beim
Download von beliebigen Musikclips kann der User selbst wählen, welcher Teil für ihn von
Interesse ist. Es ist dabei z.B. nicht mehr nötig, sich eine 30-Minuten lange
Nachrichtensendung zur Gänze anzuschauen, wenn man sich nur über die neuesten
Meldungen und Entdeckungen im Bereich der Technik informieren möchte. Um dies
realisieren zu können, ist eine Bereitstellung eines kontinuierlichen Datenstromes
erforderlich, wofür allerdings das Internet nicht entworfen wurde. Denn das Internet verfolgt
zwei verschiedene Strategien, um Daten zu verschicken. Diese sind:
•
•
So schnell wie möglich, jedoch ohne Verlässlichkeit zu garantieren (UDP8-Protokoll):
UDP stellt einen Fluss von Audio-Paketen zur Verfügung, ohne eine signifikante
Verzögerung zu verursachen. Diese Methode bringt unglücklicherweise die Gefahr mit
sich, dass gelegentlich Pakete verloren gehen. Wird die Rate an verlorenen Paketen zu
hoch, ist an eine gute Übertragung von Audiodaten nicht zu denken.
Verlässlich und hoffentlich schnell genug (TCP9-Protokoll):
Im Gegensatz zu UDP ist TCP erheblich verlässlicher, da bei Ausfall von Datenpaketen
versucht wird, diesen durch erneutes Senden der betroffenen Pakete zu kompensieren.
Bei hoher Verlustrate sendet TCP mehrmals Information vom Server zum Client und
wartet dabei jedes Mal auf die entsprechende Empfangsbestätigung, wodurch bei dieser
Methode zwar keine wirklichen Ausfälle, jedoch teilweise erhebliche Verzögerungen
auftreten können.
5
Stetige Erhöhung der Lautstärke von Null ausgehend bis zu der Normal-Lautstärke
Stetige Reduktion der Lautstärke von der Normal-Lautstärke ausgehend bis Null
7
URL bedeutet Uniform Resource Locator. Dies ist die Adresse, die den genauen Standort eines HTML-Textes,
einer Web-Site, einer Grafik oder ähnliches bezeichnet.
8
UDP bedeutet User Datagram Protocol
9
TCP bedeutet Transmission Control Protocol.
6
20
AEIOU UND MUSIK
Microsoft Waveform (WAV, WAVE)
Dieser Abschnitt liefert zunächst eine Beschreibung des Waveform-Formates. Im Anschluss
daran wird die Erzeugung von Sequenzen im Waveform-Format genauer erklärt und deren
Anwendung in einer HTML-Seite gezeigt. Danach werden die Stärken und Schwächen dieses
Formates näher beleuchtet und die in den Untersuchungen erzielten Ergebnisse bezüglich
Kompression und Tonqualität kommentiert.
3.2
Das Audioformat Microsoft Waveform (WAV, WAVE)
Wie der Name schon andeutet, wurde das WAVE-Format von Microsoft entwickelt. Es
handelt sich dabei um eine Untermenge der ebenfalls von Microsoft entwickelten RIFFSpezifikation (Ressource Interchange File Format) zur Speicherung von Multimedia-Dateien,
also Audio- und Video-Clips.
Endian
Datei-Offset
(bytes)
0
groß
Feldname
Feldgröße
(bytes)
Segment-ID
4
“RIFF” Segment-Beschreibung
Segment-Größe
4
Das hier betrachtete „WAVE“Format erfordert die beiden
Untersegmente „fmt“ und „data“
Format
4
Untersegment 1 – ID
4
Untersegment 1 – Größe
4
Audioformat
2
Anzahl der Kanäle
2
4
klein
8
groß
12
groß
16
klein
20
klein
„fmt“ – Untersegment
22
klein
24
klein
Sample-Rate
4
Byterate
4
Blockausrichtung
2
Bits pro Sample
2
Untersegment 2 – ID
4
beschreibt
das
Klanginformation
Untersegment
Format
der
im
Daten-
28
klein
32
klein
34
klein
36
groß
„data“ – Untersegment
40
klein
Untersegment 2 – Größe
4
Daten
Untersegment 2 –
Größe
44
Klein
zeigt
die
Größe
der
Klanginformation an und enthält die
eigentlichen Klangdaten.
Abbildung 5: Die kanonische Form des RIFF-Formates
21
AEIOU UND MUSIK
Eine RIFF-Datei besteht aus einem Dateikopf („file header“), dem eine Reihe von
Datensegmenten („data chunks“) folgt. Eine WAVE-Datei ist oft eine RIFF-Datei, die nur ein
einzelnes, aus zwei Untersegmenten bestehendes „WAVE“-Segment besitzt. Diese beiden
Untersegmente sind ein Format-Segment („fmt chunk“), welches das Datenformat beschreibt,
und ein Daten-Segment („data chunk“), das die aktuellen Sample-Daten beinhaltet. Diese
Form einer RIFF-Datei wird in der folgenden Kurzübersicht als kanonische Form („Canonical
form“) bezeichnet (siehe Abbildung 5). Eine ausführliche Beschreibung des RIFF- sowie des
WAV-Formates, die hier anzuführen den Rahmen dieser Arbeit sprengen würde, kann im
MSDN (Microsoft Developer Network, URL: http://msdn.microsoft.com) gefunden werden.
Das kanonische WAVE-Format beginnt, wie in obiger Grafik zu sehen ist, mit dem RIFFDateikopf:
0
4
Segment-ID
4
4
Segment-Größe
8
4
Format
Enthält die Buchstabefolge RIFF im ASCIIFormat
(0x52494646 big-endian Format)
36 + Größe des 2. Segmentes, oder genauer:
3 + (8 + Größe des 1. Segmentes) + (8 + Größe
des 2. Segmentes)
Dies ist die Größe des restlichen Segmentes,
das dieser Zahl nachfolgt, das heißt, die Größe
der gesamten Datei minus 8 Bytes für die
ersten beiden Felder (Segment-ID, SegmentGröße), die hier nicht mitgerechnet werden.
Enthält die Buchstabenfolge WAVE
Im Anschluss daran besteht das WAVE-Format aus zwei Untersegmenten: “fmt” und “data”.
Das erste der beiden („fmt“) beschreibt das Format des zweiten („data“):
12
4
Untersegment-ID 1
16
4
Untersegment-Größe 1
20
2
Audio-Format
22
24
2
4
Anzahl der Kanäle
Sample-Rate
28
4
Byterate
32
2
Blockausrichtung
34
2
Bits je Sample
Enthält die Buchstabenfolge „fmt“
(0x666d7420 big-endian Format)
16 für PCM (puls code modulation). Diese
Zahl gibt die Größe des restlichen
Untersegmentes an.
PCM = 1 (i.e. Lineare Quantisierung). Werte
an dieser Stelle, die von 1 abweichen, zeigen
eine eventuelle Kompression an.
Mono = 1, Stereo = 2
8000, 44100, etc. Diese Zahlenwerte
repräsentieren die Sample-Rate in Hertz (Hz).
Sample-Rate * Anzahl der Kanäle * Bits je
Sample / 8
Anzahl der Kanäle * Bits je Sample / 8
Diese Zahl gibt die Anzahl der Bytes für ein
Sample (inklusive aller Kanäle) an.
8 bits = 8, 16 bits = 16, etc.
Zu guter Letzt enthält das Daten-Untersegment („data“) die Größe der Daten sowie die
eigentlichen Musik- (oder Klang-) Daten selbst:
22
AEIOU UND MUSIK
36
4
Untersegment-ID 2
40
4
Untersegment-Größe 2
44
*
Daten
3.2.1
Enthält die Buchstabenfolge „data“
Anzahl der Samples * Anzahl der Kanäle *
Bits je Sample / 8
Diese Zahl repräsentiert die Anzahl der Bytes,
aus denen die Klangdaten bestehen.
Ab hier kommen die eigentlichen Klangdaten
Generierung von Sequenzen im Waveform-Format
Die Systemvoraussetzungen für die Erzeugung von Wave-Dateien sind sowohl bezüglich
Hardware als auch bezüglich Software gering. Wie eingangs schon erwähnt, wurden die
Untersuchungen zu dieser Arbeit auf einem Pentium mit 133 MHz durchgeführt. Die
Ergebnisse haben dabei gezeigt, dass die Ausstattung mit 32 MB Hauptspeicher und einer
Standard-Soundkarte ausreichend ist.
Als Eingabegerät kann jedes beliebige Audiogerät mit einem Audioausgang, also zum
Beispiel ein CD-Player, DAT-Player oder, falls man selbst singen oder einen Vortrag halten
möchte, auch ein Mikrofon, verwendet werden. Der Ausgang dieses Gerätes muss mit einem
entsprechenden Kabel mit dem Line-In-Eingang (meist eine Stereo-Klinke 3,5 mm) der
Soundkarte verbunden werden. Da die Musikstücke für das Projekt AEIOU in Form von
DAT-Bändern vorlag, wurde als Eingabegerät ein DAT-Player verwendet.
Um diesen Clip nun im WAVE-Format zu erhalten, müssen folgende Schritte ausgeführt
werden:
§
Sound-Recorder (siehe Abbildung 6) über das Windows-Startmenü starten.
Abbildung 6: Der Audiorecorder
§
Aufnahmequalität auswählen
•
Über Bearbeiten/Audioeigenschaften (Edit/Audio Properties) wird ein neues
Dialogfenster (Abbildung 7) geöffnet. In der unteren Fensterhälfte ist unter
dem Punkt Aufnahme ein Schieberegler zu sehen, mit dessen Hilfe die
Lautstärke der Aufnahme zwischen den Werten 0 und 100 (in Prozent)
eingestellt werden kann. Für eine gute Aufnahme sollte dieser Regler in etwa
in die Mitte gesetzt oder auf maximal 75% eingestellt sein.
23
AEIOU UND MUSIK
•
§
§
§
§
Über die in Abbildung 7 sichtbare Schaltfläche Anpassen (Adjust) wird ein
weiteres Dialogfenster aktiviert (Abbildung 8). In diesem kann durch
Auswählen der Parameter Format und Attribute (dazu gehören die SampleRate und die Bitrate) die Klangqualität eingestellt werden.
Nachdem beide Dialoge, jeweils durch Drücken auf die Schaltfläche OK, geschlossen
wurden, das Eingabegerät auf Wiedergabe schalten.
Am Beginn des gewünschten Ausschnittes den Recorder durch Drücken auf die
Schaltfläche
auf Aufnahme schalten.
Am Ende der Sequenz die Aufzeichnung des Soundrecorders stoppen (
).
Im Datei-Menü den Menüpunkt Speichern wählen und die neu digitalisierte Sequenz
als Datei im „WAV“-Format speichern.
Abbildung 7: Festlegen der Audioeigenschaften
24
AEIOU UND MUSIK
Abbildung 8: Anpassen der Audioqualität
3.2.2
Integration von Waveform-Sequenzen in eine HTML-Seite
Nachdem nun eine Datei in dem gewünschten Format vorliegt, muss sie, damit sie ihrem
angedachten Verwendungszweck dienen kann, noch in die entsprechende HTML-Seite
integriert werden. Zunächst sollte die Audiodatei (z.B. Jupiter.wav) auf den Server gespielt
werden, und zwar in ein Verzeichnis, in das vom Internet aus zugegriffen werden kann. Für
das folgende Beispiel wird angenommen, dass ein solches Verzeichnis mit dem Namen audio
auf dem Server existiert und sich direkt unterhalb des Verzeichnisses befindet, in dem die
HTML-Seiten abgelegt sind. Ein Internet-Benutzer kann auf diese Datei auf 2 verschiedene
Arten zugreifen:
•
•
durch
direkte
Eingabe
der
Adresse
der
www.domain.at/audio/Jupiter.wav) oder
über einen entsprechenden Link innerhalb einer HTML-Seite.
Tondatei
(z.B.:
Bei Direkteingabe der Adresse müsste der zugreifende Benutzer die vollständigen Namen und
Verzeichnispfade aller Audiodateien wissen, die er sich anhören möchte. Dies ist eher
unwahrscheinlich und unpraktisch, aus diesem Grund ist der zweite Weg, also das Anbieten
einer HTML-Seite mit dem Link auf das Musikstück, vorzuziehen. Wie eine solche aussehen
könnte, wird in Abbildung 9 gezeigt. Um dieses Aussehen zu erhalten, ist folgender HTMLCode notwendig. Es handelt sich dabei nur um einen Auszug der wesentlichen Teile des
Source-Codes, die für die Funktionsweise nicht wichtigen Textzeilen wurden ausgelassen.
<HTML>
<HEAD>
<TITLE>Jupiter-Symphonie</TITLE>
</HEAD>
<BODY>
<H2>Wolfgang Amadeus Mozart:<I> Jupiter-Symphonie</I></H2>
<TABLE>
<TR>
<TD>
<A HREF="/images/Jupiter.jpg">
<IMG SRC="/images/Jupiter.jps" BORDER=1>
</A>
Wolfgang Amadeus Mozart (1756 Salzburg - 1791 Wien) ….
</TD>
25
AEIOU UND MUSIK
</TR>
</TABLE>
<TABLE>
<TR>
<TD VALIGN=CENTER><IMG SRC="/images/ic_sound.gif"></TD>
<TD VALIGN=CENTER> <B>Qualität</B>:
<A HREF="/audio/Jupiter.wav">Höher</A>
</TD>
</TR>
</TABLE>
</BODY>
</HTML>
Abbildung 9: Beispiel einer HTML-Seite mit Link auf Audiodateien
3.2.3
Ergebnisse
Mit Microsoft Waveform liegt ein sehr leistungsfähiges Format vor. Vor allem die große
Auswahl an möglichen Qualitätsstufen (siehe Tabelle 2 auf der nächsten Seite) bei der
Aufnahme eröffnet ein breites Verwendungsfeld. Die „schwächeren“ Wahlmöglichkeiten
dieses Auswahl-Spektrums, jene unterhalb einer Bitrate von 16 KB/sec sowie unterhalb einer
Sample-Rate von 22 kHz können jedoch nur bedingt empfohlen werden. Sie zeichnen sich
zwar einerseits durch einen sehr geringen Bedarf an Speicherplatz aus, was sich durchaus
positiv auf die Wartezeit für den Benutzer bei einem eventuellen Herunterladen der Datei
auswirkt. So benötigt zum Beispiel ein 30 Sekunden langes Musikstück nur in etwa 240 KB
Speicherplatz (bei Verwendung der Parameter in Zeile 1 der Tabelle 2). Andererseits ist
echter Hörgenuss hier nur schwer zu finden, wodurch für diese Einstellungen nur ein
Verwendungsfeld übrigbleibt, wo die Schwächen und die Verluste nicht allzu schwerwiegend
ins Gewicht fallen. Ein Beispiel für ein derartiges Einsatzgebiet ist etwa das Digitalisieren
26
AEIOU UND MUSIK
von Reden, da auf diesem Gebiet nur die Verständlichkeit der Sprache, nicht jedoch die
Raumwirkung oder die Klangreinheit von Bedeutung ist.
Soll der gewünschte Clip auch Musik enthalten und diese gegenüber dem Original nicht zu
hohe Verluste aufweisen, ist von einer Verwendung der Varianten in den Zeilen 1 bis 15 der
Tabelle 2 Abstand zu nehmen. Akzeptable Qualität bei erträglich hohem Anstieg an Platzund Download-Zeitbedarf bringen die Kombinationen im mittleren Abschnitt der Tabelle 2
(Zeilen 16 bis 27). Mit der Einstellung von 24 kHz für die Sample-Rate bei einer Bitrate von
16 Bits/Sample in Stereo werden schon brauchbare Ergebnisse erzielt. Die Dateigröße steigt
für das oben genannte Musikstück von 30 Sekunden Spieldauer schon merklich an, sie beträgt
immerhin bereits 2,7 MB. Trotzdem kann noch nicht unbedingt von einer Verschwendung des
Speicherplatzes gesprochen werden.
Tabelle 2: Qualitätsstufen des Waveform-Formates
Sample-Rate (kHz)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
8
8
8
8
11,025
11,025
11,025
11,025
12
12
12
12
16
16
16
16
22,050
22,050
22,050
22,050
24
24
24
24
32
32
32
32
44,100
44,100
44,100
44,100
48
48
48
48
Bits/Sample
8
8
16
16
8
8
16
16
8
8
16
16
8
8
16
16
8
8
16
16
8
8
16
16
8
8
16
16
8
8
16
16
8
8
16
16
27
Mono/Stereo
Mono
Stereo
Mono
Stereo
Mono
Stereo
Mono
Stereo
Mono
Stereo
Mono
Stereo
Mono
Stereo
Mono
Stereo
Mono
Stereo
Mono
Stereo
Mono
Stereo
Mono
Stereo
Mono
Stereo
Mono
Stereo
Mono
Stereo
Mono
Stereo
Mono
Stereo
Mono
Stereo
KB/Sekunde
8
16
16
31
11
22
22
43
12
23
23
47
16
31
31
63
22
43
43
86
23
47
47
94
31
63
63
125
43
86
86
172
47
94
94
188
AEIOU UND MUSIK
Die wahre Stärke von WAV-Dateien liegt allerdings nicht in der direkten Verbreitung der
Sound-Dateien im Internet, sondern eher in der „indirekten“. Damit ist gemeint, dass sich
dieses Format unter anderem hervorragend zur Archivierung von Tondokumenten eignet.
Außerdem bietet es eine gute Datenquelle für die Erzeugung von Audio-Clips in anderen
Formaten (wie zum Beispiel Real Audio, wird in einem späteren Kapitel behandelt). Dafür
werden die unteren Zeilen der obenstehenden Tabelle als Parameterschema interessant, da mit
diesen die besten Ergebnisse in Bezug auf Qualität und Klangreinheit erzielt werden. Die
Größe der jeweiligen Dateien erreicht nun aber mit 5,6 MB bei 48 kHz Sample-Rate und einer
Bitrate von 16 Bits/Sample in Stereo Werte, die das Herunterladen einer solchen Datei nicht
gerade empfehlen. Denn wer wartet schon gerne 20 Minuten für nur 30 Sekunden
Hörvergnügen, wenn das Herunterladen der Datei über ein Modem mit einer
Übertragungsrate von 28.8 Kbps erfolgt.
Für die Archivierung von Tondokumenten und auch für die Konvertierung in andere
Audioformate spielt dieser Umstand jedoch keine Rolle. Bei letzterem ist sogar die
höchstmögliche Einstellung (siehe letzte Zeile in der Tabelle 2) vorzuziehen, da dadurch die
Verluste beim Digitalisieren gering gehalten werden. Zudem besteht noch die Möglichkeit,
bei Bedarf die Ausgabequalität beim Umwandeln über die entsprechenden Encoder
einzuschränken, falls die gegebenen Voraussetzungen wie eine langsame Internet-Verbindung
oder verfügbarer Speicherplatz dies erfordern. Encoder, also Werkzeuge zum Aufnehmen von
Audio-Clips oder zum Umwandeln dieser Clips in andere Formate, die WAV-Dateien als
Datenquelle akzeptieren, sind für fast alle anderen Formate erhältlich. Somit wird das
Microsoft Waveform-Format auch in Zukunft oft Verwendung finden.
28
AEIOU UND MUSIK
Real Audio
Nach einer kurzen allgemeinen Betrachtung des Real Audio-Formates zeigt dieser Abschnitt
die Generierung von Real Audio-Clips sowie deren Anwendung in einer HTML-Seite.
Danach werden die Stärken und Schwächen dieses Formates näher beleuchtet und die in den
Untersuchungen erzielten Ergebnisse bezüglich Kompression und Tonqualität kommentiert.
3.3
Das Audioformat Real Audio
Herkömmliche Lösungsansätze sind nicht sehr gut geeignet, um Audio-On-Demand
realisieren zu können, da sie meist große Probleme haben, zeitkritische Daten verlustfrei und
kontinuierlich zu übertragen. Aus diesem Grund versuchte die Firma Real Networks einen
anderen Weg und entwarf in den Jahren 1994 und 1995 das Real Audio Protokoll und die
Real Audio Client/Server Architektur. Dieser Technologie wurde ein neues Protokoll
zugrunde gelegt, welches, im Gegensatz zu den bis dahin schon bestehenden Protokollen,
bidirektionale Kommunikation zwischen Client und Server unterstützt, wodurch Funktionen
wie Pause, schneller Vorlauf und Rücklauf möglich sowie das Springen zu bestimmten Teilen
des Programms schnell und zuverlässig werden sollten.
Das Real Audio System, und damit das Real Audio Protokoll, unterstützt TCP und UDP,
wobei die besseren Ergebnisse meist über UDP erreicht werden. Die Ursache dafür ist, dass
UDP in einem großen Teil der Fälle eine kontinuierliche Präsentation der Audiodaten
gewährleistet. Um eventuell auftretende Paketverluste und die daraus resultierenden Ausfälle
im Audio-Stream ausgleichen zu können, wurde zusätzlich ein relativ leistungsfähiges
Korrektursystem entwickelt, das im Wesentlichen die Auswirkungen der Paketverluste
minimieren soll und so den Client in die Lage versetzen soll, das ihm fehlende Stück zu
ersetzen.
Leider ist es hier nicht möglich, eine Beschreibung über die verwendeten Dateiformate und
Kompressionsmethoden anzugeben, da sich Real Networks dahingehend mehr als bedeckt
halten. Daher bleibt an dieser Stelle nur, die mit Real Audio erzielbaren Ergebnisse zu
untersuchen.
3.3.1
Generierung von Sequenzen im Real Audio-Format
Für die Erzeugung von Real Audio-Dateien sind wie für Waveform-Dateien keine High-EndGeräte erforderlich. Laut Angabe von Real Networks reicht ein PC 486 mit 8 MB
Hauptspeicher bereits aus. Trotzdem ist die Verwendung mindestens eines Pentium mit 90
MHz und 16 MB Hauptspeicher zu empfehlen, um die für die Konvertierung benötigte
Rechenzeit gering zu halten. Aber für den aktuellen Stand der Technik sind diese Werte
ohnehin nur noch als Substandard zu betrachten.
Erzeugt werden Real Audio-Clips mit dem bei Real Networks erhältlichen Encoding-Tool
(bis 1998: Real Audio Encoder, ab 1998: Real Producer). Für die Tests, die im Rahmen dieser
Arbeit durchgeführt wurden, fand die Version 3.0 dieser 32-Bit Anwendung, die für Windows
95/98, Windows NT und auch in einer Macintosh PowerPC-Version erhältlich war,
Verwendung. Externe Eingabegeräte werden nicht mehr benötigt, da der Encoder 8- und 16Bit Audioaufnahmen in Mono und Stereo der Formate *.wav (Microsoft Waveform), *.pcm,
*.au (Soundformat, dass auf Sun-Computern verwendet wird) und *.snd unterstützt. Da keine
Dekompressoren für diese Eingabeformate im Encoder enthalten sind, müssen die
29
AEIOU UND MUSIK
Real Audio
Quelldateien in unkomprimierter Form vorliegen oder mittels eigener Tools, die für beinahe
alle Plattformen erhältlich sind, vor der Weiterverarbeitung dekomprimiert werden.
Stehen geeignete Dateien zur Verfügung, können daraus durch die Ausführung folgender
Arbeitsschritte Real Audio-Dateien erzeugt werden:
§
§
§
§
§
§
Real Audio Encoder über das Windows Startmenü starten. Der Konverter präsentiert
sich mit der in Abbildung 10 gezeigten Ansicht.
Durch Eingabe des vollständigen Pfades oder durch Wahl über die Schaltfläche
Browse die gewünschte Quelldatei auswählen.
Anschließend die Ausgabedatei, ebenfalls durch Eingeben oder über Browse festlegen.
Die Ausgabedatei erhält üblicherweise die Erweiterung „.ra“ oder „.rm“
Nun muss unter dem Punkt Compression die gewünschte Kompressionsart gewählt
werden. Eine Aufstellung aller möglichen Kompressionseinstellungen erfolgt später.
Zusätzlich besteht noch die Möglichkeit, Informationen über Titel, Autor und
Copyright-Inhaber des digitalisierten Clips in den entsprechenden Feldern
einzutragen. Diese werden mit den Tondaten in der Datei gespeichert und beim
Abspielen über einen Real Audio Player angezeigt.
Danach kann durch Drücken auf die Schaltfläche Start Encoding der
Konvertierungsvorgang gestartet werden. Dieser Vorgang wird nach Umrechnung der
gesamten Datei automatisch beendet oder kann durch Drücken der Taste Stop
Encoding vorzeitig abgebrochen werden.
Abbildung 10: Der Real Audio Encoder v3.0
30
AEIOU UND MUSIK
3.3.2
Real Audio
Integration von Real Audio-Sequenzen in eine HTML-Seite
In HTML-Seiten werden die erstellten Audiodateien analog zu der für die Integration von
Microsoft Waveform-Dateien geschilderten Vorgehensweise eingebaut. Wie diese müssen sie
auf dem Server in einem bestimmtes Verzeichnis abgelegt und durch den entsprechenden
Link referenziert werden. Auf diese Weise haben Internet-Benutzer die Möglichkeit, die Clips
lokal auf ihren Rechner zu laden und danach abzuspielen.
Soll dem Benutzer auch das Streaming-Feature10 zur Verfügung gestellt werden, ist eine
etwas abgeänderte Vorgehensweise anzuwenden. Erstens muss dazu die Datei auf einem
Server abgelegt werden, wo auch ein Real Audio-Server installiert ist. Zweitens ist zu
beachten, dass der Link nicht direkt auf die Real Audio-Datei gelegt wird, sondern auf ein
Real Media-Metafile. Der nachfolgend angeführte HTML-Code zeigt die Seite aus dem
vorangegangenen Beispiel, diesmal aber mit einer Real Audio-Datei anstelle des zuvor
verwendeten Waveform-Clips. Sollen die Clips auf einem Server bereitgestellt werden, der
Streaming nicht unterstützt, so ist anstelle des Links auf die Metadatei *.ram der direkte Link
auf die Audiodatei zu setzen.
<HTML>
<HEAD>
</HEAD>
<BODY>
<TABLE>
<TR>
<TD>
</A>
</TD>
</TR>
</TABLE>
<TABLE>
<TR>
<A HREF="/audio/Jupiter.ram">Höher</A>
</TD>
</TR>
</TABLE>
</BODY>
</HTML>
Die Datei “Jupiter.ram”, auf die der Hyperlink gesetzt ist, besteht nur aus einer Zeile, in der
die virtuelle Adresse der entsprechenden Sounddatei angegeben ist:
http://www.aeiou.at/aeiou/Jupiter.ra
10
Streaming bedeutet, dass die gewählte Audiodatei vor der Wiedergabe auf den lokalen PC gespeichert wird,
sondern direkt vom Server abgespielt wird.
31
AEIOU UND MUSIK
3.3.3
Real Audio
Ergebnisse
Real Audio 3.0 weist gegenüber dem WAV-Format und auch gegenüber Real Audio 2.0 ein
neues, zusätzliches Feature auf, das sogenannte „Streaming“. Die ausgewählte Audiodatei
muss nach dem Klicken auf den entsprechenden Link, nicht mehr vollständig auf den lokalen
Datenträger geladen werden, bevor mit dem Abspielen begonnen werden kann, sondern der
Clip wird „päckchenweise“ geladen und auch abgespielt. Dazu wird schon bei der Aufnahme
festgelegt, über welche Internet-Anbindung der Benutzer verfügen muss und wie viel der
gesamten Datei vor dem Start der Ausgabe heruntergeladen werden muss, damit der AudioStream unterbrechungsfrei wiedergegeben wird. Die Festlegung der notwendigen Verbindung
und Übertragungsrate erfolgt über die Wahl des Aufnahmeformats (=Kompressionsart). Eine
Aufstellung der möglichen Varianten ist in Tabelle 3 zu finden.
Einige Jahre nach Abschluss dieser Untersuchungen wurde Real Audio um das sogenannte
„SureStream“ erweitert. Dabei muss nicht mehr für jede gewünschte Übertragungsrate eine
eigene Mediendatei erstellt werden, sondern es wird eine gemeinsame Datei generiert, die
mehrere gewünschte Internetanbindungen (z.B. Modem 28.8 und LAN) unterstützt. Wenn der
Benutzer auf die am Server abgelegte Datei zugreift, dann berechnet der Real Audio-Server,
welche Datenübertragungsrate dem Benutzer zur Verfügung steht und passt die Qualität und
die Vorladezeit für den gewählten Clip automatisch an. Das heißt, dem Benutzer wird aus der
Datei jene Spur übertragen, deren Anforderungen an die Verbindung durch die
Übertragungsrate auf den PC des Benutzers erfüllt werden.
Für ein klagloses Funktionieren des Streamings ist neben der richtigen Aufnahme auch die
Verwendung eines eigenen Real Audio-Servers auf Seiten des Anbieters erforderlich. Daraus
ergeben sich Nachteile, die manchmal etwas schwerer wiegen als die Vorteile, die dieses
Format mit sich bringt. Etwa werden dadurch die Kosten für die Bereitstellung von Real
Audio-Dateien durch die Anschaffung der Real Audio-Serversoftware in die Höhe getrieben.
Aber trotz der genannten Nachteile durfte dieses Verfahren nicht vernachlässigt werden, da es
bei „herkömmlicher“ Verwendung, das heißt, wenn die Dateien vor dem Abspielen
vollständig heruntergeladen werden, eine echte Alternative zu den schon seit längerem
etablierten Formaten darstellte. Die erreichbare Klangqualität ist ansprechend bis
ausgezeichnet. Bei Verwendung der Real Audio 2.0 Varianten sind noch merkbare
Qualitätseinbußen festzustellen, vor allem der Stereo-Effekt kommt kaum zur Entfaltung.
Doch mit den beiden Real Audio 3.0 Dual ISDN-Varianten ist der Unterschied zu einer
qualitativ hochwertigen Quelldatei nur mehr marginal und somit kaum hörbar.
Überraschend hoch sind in Anbetracht des geringen Qualitätsverlustes die erzielten
Kompressionsraten. Benötigte ein Musikstück mit einer Spieldauer von 30 Sekunden im
Microsoft Waveform-Format (44 kHz, 16 Bit, Stereo) noch ungefähr 4.8 MB, so begnügt sich
die qualitativ vergleichbare Real Audio-Datei (Dual ISDN, Stereo) mit weniger als 300 KB.
Eine kurze Gegenüberstellung der erzielbaren Kompressionsraten ist im Anschluss an Tabelle
3 zu finden. Für die hier gezeigten Beispiele wurden WAV-Dateien aus dem Projekt AEIOU
als Quelldateien genommen und probeweise in das Real Audio-Format konvertiert. Dabei
wurde darauf geachtet, dass die Ergebnisdatei eine zur Quelldatei vergleichbare Qualität
aufweist.
32
AEIOU UND MUSIK
Real Audio
Tabelle 3: Qualitätsstufen von Real Audio
Real Audio 2.0 – 14.4
Diese Variante ist für Aufnahmen geeignet, die nur Sprache enthalten. Um
den Clip im „Life-Streaming“-Modus spielen zu können, ist mindestens eine
Internet-Verbindung über Modem mit 14.4 Kbps Übertragungsrate
erforderlich. Die Frequenzantwort der Aufnahme liegt bei 4.0 kHz.
Bereits ein wenig Hintergrundmusik können Clips enthalten, die in dieser
Einstellung aufgenommen werden. Die benötigte Übertragungsrate steigt
dabei auf 28.8 Kbps. Die Frequenzantwort liegt ebenfalls bei 4.0 kHz.
Real Audio 2.0 – 28.8
Real Audio 3.0 – 28.8, Mono,
full response
medium response
narrow response
Real Audio 3.0 – 28.8, Stereo
Real Audio 3.0 – ISDN, Mono
Real Audio 3.0 – ISDN, Stereo
Real Audio 3.0 – Dual ISDN,
Mono
Real Audio 3.0 – Dual ISDN,
Stereo
Mit dieser Variante beginnen die Aufnahmearten des neuen 3.0-Formates.
Damit ist bereits relativ klarer Klang bei Musikstücken erreichbar, die über
ein Modem mit 28.8 Kbps ohne große Ausfälle übertragen werden können.
Auf Stereoeffekt muss aber verzichtet werden. Die Frequenzantwort beträgt
in diesem Fall 5.5 kHz.
Ebenfalls Mono-Clips werden mit dieser Einstellung erhalten. Im Vergleich
zu full response wird eine leichte Verbesserung der Klangklarheit bei
Musikstücken mit Schnarrtrommeln, Becken und wenig Gesang erzielt. Die
Mindestanforderung bezüglich der Internet-Anbindung für „Streaming“
ändert sich dabei nicht. Die Frequenzantwort sinkt auf 4.7 kHz.
Eine weitere Verbesserung der Klangklarheit bringt narrow response mit
sich, vor allem bei sprachintensiven Musikstücken und bei geräuschvollen
Signalen. Wiederum wird für eine fehlerfreie Übertragung mindestens ein
Modem mit 28.8 Kbps benötigt. Die Frequenzantwort beträgt
4 kHz.
Grundsätzlich weist diese Variante dieselben Eigenschaften auf, wie die
vorhergegangene (narrow response). Zusätzlich ist nun auch Stereoeffekt
verfügbar.
Diese Einstellung erfordert eine ISDN-Leitung als minimale Anbindung an
das Internet, da die Übertragung sonst nicht mehr fehlerfrei erfolgen kann
und Teile des Musikstückes verloren gehen. Die Frequenzantwort liegt bei
11 kHz.
Auch diese für Stereoaufnahmen gedachte Variante liefert nur bei einer
ISDN-Verbindung die gewünschten Ergebnisse. Die Frequenzantwort liegt
bei 8 kHz.
Soll bei Tonaufnahmen (Mono) optimale Qualität erreicht werden, ist diese
Einstellung zu wählen. Bei geeigneter Quelle weist die Ausgabedatei beinahe
CD-Qualität auf. Für eine fehlerfreie Übertragung ist allerdings ebenfalls ein
ISDN-Anschluss nötig. Die Frequenzantwort beträgt 20 kHz.
Nahezu die Qualität einer sehr guten Rundfunkübertragung erreichen
Aufnahmen in dieser Stereo-Variante. Die Frequenzantwort liegt bei 16 kHz.
Beispiel 1 (Spieldauer: 14 Sekunden)
Quelle:
Ziel:
WAV-Format, 44.1 kHz Samplerate, 16 Bit, Stereo
Dateigröße: 2584 KB
Real Audio 3.0-Format, Dual ISDN, Stereo
Quelle:
Ziel:
Real Audio 3.0-Format, Dual ISDN, Stereo
33
AEIOU UND MUSIK
Real Audio
Quelle:
Ziel:
Real Audio 3.0-Format, ISDN, Stereo
Quelle:
Ziel:
WAV-Format, 11.025 kHz Samplerate, 8 Bit, Mono
Real Audio 3.0-Format, Modem 28.8, medium response, Mono
Dateigröße: 56 KB
Bei derart hohem Speicherplatzgewinn und der daraus resultierenden Verkürzung der
Download-Zeit, kann eine leichte Verminderung des Hörvergnügens ohne Zweifel in Kauf
genommen werden.
34
AEIOU UND MUSIK
Vivo Active
Nach einer kurzen allgemeinen Betrachtung des Vivo Active-Formates zeigt dieser Abschnitt
die Generierung von Vivo Active-Audioclips sowie deren Anwendung in einer HTML-Seite.
Danach werden die Stärken und Schwächen dieses Formates näher beleuchtet und die in den
Untersuchungen erzielten Ergebnisse bezüglich Kompression und Tonqualität kommentiert.
3.4
Das Audioformat Vivo Active
Aufgrund der ständig wachsenden Konkurrenz im Bereich der Audioformate kann sich ein
neues Format nur noch dann durchsetzen, wenn es alle besonderen Features der Konkurrenten
in verbesserter Form anbietet oder zusätzliche Funktionen einbaut. Diesem Trend schließen
sich auch Vivo Software mit VivoActive an. Ähnlich wie Real Audio unterstützt auch
VivoActive das Streaming Media-Verfahren. Gegenüber dem Konkurrenten wurde jedoch
eine kleine Verbesserung in diesem Bereich erzielt, da kein eigener Server für das Anbieten
des Life-Streamings nötig ist. Somit kann Audio-On-Demand mit VivoActive-Clips auf
jedem herkömmlichen Server genutzt werden, ohne dass dabei mit Kompatibilitätsproblemen
gerechnet werden muss. Auf der Client-Seite, das heißt, auf der Seite jener, die derartige Clips
anhören möchten, werden Windows- und Macintosh-Systeme unterstützt, Unix-Systeme
hingegen noch nicht.
In Bezug auf die Gewährung eines Einblicks in die Verfahrensweise bei der Kompression und
Dekompression der Audio-Clips halten es Vivo Software wie Real Networks: kein
Kommentar.
3.4.1
Generierung von Sequenzen im Vivo Active-Format
An die Hardware stellt auch die Erzeugung von VivoActive-Dateien keine großen
Anforderungen. Bereits ein Mittelklasse-Computer reicht aus, um Encoding nahezu in
Echtzeit durchführen zu können. Die dazu erforderliche Software, der VivoActive Producer
2.0, kann über die Homepage von Vivo Software (http://www.vivo.com) bezogen werden.
Als Quelle für die Codierung in das VivoActive Audioformat werden Musikstücke im
Microsoft Waveform-Format (*.wav) benötigt. Liegen diese vor, so können daraus durch
Durchführung folgender Schritte VivoActive-Dateien erzeugt werden:
•
•
•
Der VivoActive Producer wird über das Windows Startmenu gestartet. Das
Hauptfenster der Anwendung ist in Abbildung 11 zu sehen.
Über die Schaltfläche Add Movie können nun ein oder auch mehrere
Eingabedateien im *.wav-Format geöffnet werden. Die Beschriftung Movie erklärt
sich daraus, dass der VivoActive Producer ebenfalls dafür vorgesehen ist,
Videoclips zu erzeugen. Dies wird zu einem späteren Zeitpunkt näher beleuchtet
(siehe Abschnitt 4.6).
Durch Markieren einer Quelldatei und anschließenden Klick auf die Schaltfläche
Setting (oder auch über das Menü Settings/Select) eine der vorhandenen
Parameter-Dateien wählen. Diese Dateien enthalten alle für die Konvertierung
benötigten Einstellungen wie zum Beispiel die gewünschte Tonqualität oder die
für Streaming erforderliche Internet-Anbindung. Falls keine geeignete
Parameterkombination angeboten wird, bietet sich dem Anwender die
35
AEIOU UND MUSIK
Vivo Active
Möglichkeit, eine bestehende Datei zu editieren oder eine eigene, neue
Parameterdatei zu erstellen. Dazu geht man wie folgt vor:
o Für das Editieren einer Konfiguration den Menüpunkt Settings/Edit wählen
und im erscheinenden Fenster (siehe Abbildung 12) die abzuändernde
Kombination auswählen, für das Hinzufügen einer Datei den Menüpunkt
Settings/Add wählen.
o In beiden Fällen gelangt man zu dem in Abbildung 13 gezeigten Fenster. In
diesem können alle gewünschten Werte geändert und die Datei gespeichert
werden.
Abbildung 11: Der VivoActive Producer v2.0
•
Nachdem alle erforderlichen Einstellungen gemacht wurden, werden durch
Drücken auf Generate All alle oder durch Drücken auf Generate Selected nur die
ausgewählten Eingabedateien bearbeitet. Während die Konvertierung läuft, kann
der Erstellungsprozess jederzeit durch Drücken auf „Stop“ abgebrochen werden.
36
AEIOU UND MUSIK
Vivo Active
Abbildung 12: Auswahl einer Parameterdatei
Abbildung 13: Editieren einer Parameterdatei
37
AEIOU UND MUSIK
3.4.2
Vivo Active
Integration von Vivo Active-Sequenzen in eine HTML-Seite
Das Einbinden der erzeugten Clips in eine HTML-Seite gestaltet sich nicht mehr ganz so
einfach wie bei den bisher gezeigten Formaten. Wird die Datei nämlich nur durch einen
einfachen Link referenziert, ist keine Wiedergabe von Clips mit einer Spieldauer von mehr als
10 Sekunden möglich. Um Abhilfe für dieses Problem zu schaffen, müssen die gewünschten
Dateien als Objekte in die HTML-Seiten eingebettet werden. Das bedeutet, dass der Videoclip
beim Abspielen nicht mehr in einem eigenen Player-Fenster angezeigt wird, sondern gleich
innerhalb der HTML-Seite erscheint. Damit verändert sich die bereits bekannte Beispielseite
auf folgende Syntax:
<HTML>
<HEAD>
</HEAD>
<BODY>
<TABLE>
<TR>
<TD>
</A>
</TD>
</TR>
</TABLE>
<TABLE>
<TR>
<TD VALIGN=CENTER>
<OBJECT CLASSID="clsid:02466323-75ed-11cf-a2670020af2546ea" Width=240 Height=180 CODEBASE =
"http://player.vivo.com/ie/vvweb.cab#Version=2,0,0,0">
<PARAM NAME="URL" VALUE="/audio/Jupiter.viv">
<PARAM NAME="AUTOSTART" VALUE="true">
<PARAM NAME="VIDEOCONTROLS" VALUE="on">
<EMBED SRC="/audio/Jupiter.viv" PLUGINSPACE =
"http://www.vivo.com/dldv2/cgi-bin/dldform.cgi" TYPE =
"video/vnd.vivo" AUTOSTART="true" VIDEOCONTROLS="on"
WIDTH=240 HEIGHT=180>
</EMBED>
</OBJECT>
</TD>
</TR>
</TABLE>
</BODY>
</HTML>
38
AEIOU UND MUSIK
3.4.3
Vivo Active
Ergebnisse
Keine nennenswerten Verbesserungen gegenüber den Konkurrenten bringt VivoActive, wenn
ein rein qualitativer Vergleich angestellt wird. Im Gegenteil, der Hörgenuss ist bei
VivoActive-Clips zwar nicht erheblich, aber doch feststellbar geringer. Ein nicht
unbedeutender Grund dafür ist, dass die Aufnahmelautstärke bei VivoActive nicht regelbar
ist. Auch ist die Wahl der Aufnahmeparameter auf die Festlegung der Internetanbindung und
Tonqualität beschränkt, wobei für letzteres nur die beiden Stufen „Voice quality“ und „FM
quality“ zur Verfügung stehen. Außerdem beeinflusst die Einstellung der Internetanbindung
die Tonqualität in keiner Weise.
Beachtlich hingegen sind die bei diesem Format erzielten Kompressionsraten. Gelang es bei
Real Audio den Speicherplatzbedarf bei bestimmten Audioclips von 5 MB bei einer WAVDatei auf 300 kB zu senken, so schafft VivoActive eine weitere Reduktion auf 60 kB. Noch
eindrucksvoller sieht die Kompressionsrate aus, wenn als Quelldatei ein 44 MB großes Wavecodiertes Musikstück (Spieldauer etwa 5 Minuten) verwendet wird. Die entsprechende
VivoActive-Datei misst nämlich nur noch 575 kB. Nachfolgend sind einige
Konvertierungsbeispiele gegenübergestellt.
Tabelle 4: Gegenüberstellung Waveform-VivoActive
Quelle
(Microsoft Waveform)
Ergebnis
(VivoActive)
Bsp1 (ca. 28 Sekunden)
Bsp1_l.wav
(305 kB)
Bsp1_m.wav
(1218 kB)
Bsp1_h.wav
(4869 kB)
Bsp2_l.wav
(241 kB)
Bsp2_m.wav
(964 kB)
Bsp3 (ca. 4 Minuten 20)
Bsp3_h.wav
(44855 kB)
39
Bsp1_l0.viv
Bsp1_l1.viv
Bsp1_l2.viv
Bsp1_m0.viv
Bsp1_m1.viv
Bsp1_m2.viv
Bsp1_h0.viv
Bsp1_h1.viv
Bsp1_h2.viv
(26 kB)
(60 kB)
(60 kB)
(26 kB)
(60 kB)
(60 kB)
(26 kB)
(60 kB)
(60 kB)
Bsp2_l0.viv
Bsp2_l1.viv
Bsp2_l2.viv
Bsp2_m0.viv
Bsp2_m1.viv
Bsp2_m2.viv
(22 kB)
(48 kB)
(48 kB)
(22 kB)
(48 kB)
(48 kB)
Bsp3_h0.viv
Bsp3_h1.viv
Bsp3_h2.viv
(215 kB)
(525 kB)
(525 kB)
AEIOU UND MUSIK
Vivo Active
Die Abkürzungen in Tabelle 4 sind im Folgenden kurz erklärt:
• Waveform-Dateien
o *_l.wav
11.025 Hz Sample-Rate
8 Bit/Sample
Mono
o *_m.wav
8 Bit/Sample
Stereo
o *_h.wav
16 Bit/Sample
Stereo
• VivoActive Dateien
o *0.viv
Client Connection Type : Custom (16000)
Voice quality (6,4 kbps)
Framerate: 1
Automatic gain adjust
o *1.viv
Client Connection Type : Custom (16000)
FM quality (16 kbps)
Framerate: 1
o *2.viv
Client Connection Type : ISDN (54 k)
Framerate: 1
Wie in den Beispielen zu sehen ist, beeinflussen weder die angepeilte Internetverbindung
noch die Qualität der Quelldatei die Größe der VivoActive-kodierten Datei. Nur die
angegebene Tonqualität (Voice oder FM quality) schlägt sich in der Kompressionsrate nieder.
Doch auch wenn die Ausgabedateien gleich groß sind, so ist doch ein Unterschied in der
Qualität festzustellen. Diese lässt sich bei VivoActive-Clips auf 2 Arten verändern. Zum
einen, indem festgelegt wird, ob die Ergebnisdateien in „Voice quality“ oder in „FM quality“
vorliegen sollen. Da bei „Voice quality“ nur 6,4 kb pro Sekunde verwendet werden, kann von
dieser Option im Allgemeinen abgeraten werden Sie eignet sich nur für Tondokumente, die
keinerlei Musik oder nur unwesentliche Hintergrundgeräusche enthalten (z.B. Reden). Zum
anderen gibt es noch die Möglichkeit, eine qualitativ höherwertigere Quelle einzusetzen, denn
je besser die Quelle ist, desto höher ist auch der Hörgenuss in VivoActive.
Obwohl gegenüber Real Audio ein größerer Verlust an Reinheit und Klangfülle in Kauf
genommen werden muss, bleibt VivoActive eine Überlegung bei der Wahl des richtigen
Audioformates wert, da es durch extrem hohe Kompressionsraten und geringe
Konvertierungszeiten, die unterhalb der echten Spieldauer der jeweiligen Clips liegen,
Punkte sammeln kann.
40
AEIOU UND MUSIK
MP3
In diesem Abschnitt wird zunächst einige Hintergründe des Formates MP3 beleuchtet.
Danach wird gezeigt, wie Audioclips in diesem Format generiert werden und in HTMLSeiten integriert werden. Danach werden die Stärken und Schwächen dieses Formates näher
beleuchtet und die in den Untersuchungen erzielten Ergebnisse bezüglich Kompression und
Tonqualität kommentiert.
3.5
Das Audioformat MP3
Unkomprimierte Audiodaten, wie sie auf einer CD zu finden sind, enthalten mehr Information
als das menschliche Hirn verarbeiten kann. Liegen zum Beispiel zwei aufeinanderfolgende
Töne in der Frequenz (und der Lautstärke) sehr nach beieinander, kann das Gehirn unter
Umständen nur einen der beiden Töne feststellen. Derselbe Effekt tritt auf, wenn die Töne
zwar stark verschieden sind, einer davon aber erheblich lauter ist als der andere. In diesem
Fall kann das Gehirn den leiseren Ton nicht wahrnehmen. Dazu kommt noch, dass die Ohren
manche Frequenzen besser hören können als andere. Derartige menschliche Hörmuster
können mit Tabellen, Grafiken und mathematischen Formeln genau beschrieben werden11.
Im Allgemeinen können Menschen weder Frequenzen unterhalb von 20 Hz noch oberhalb
von 20 kHz hören. Obwohl das Hörvermögen von einzelnen Individuen unterschiedlich ist,
kann, davon ausgegangen werden, dass mittlere Frequenzen stärker wahrgenommen werden
als hohe oder niedrige Frequenzen (siehe Abbildung 14). Für die meisten Personen liegt der
hörempfindlichere Bereich zwischen 2 und 4 kHz, ein Bereich, der wahrscheinlich
evolutionsbedingt mit dem normalen Bereich der menschlichen Stimme (500 Hz bis 2 kHz)
zusammenhängt. Das heißt, das menschliche Gehirn funktioniert teilweise wie ein Sieb, das
systematisch wichtige Informationen in den Vordergrund bringt und überflüssige oder
redundante Wahrnehmungen beschränkt oder sogar ignoriert.
Abbildung 14: Der Frequenzbereich des Hörvermögens eines Menschen
11
Das Studium dieses Hörphänomens wird Psychoakustik genannt.
41
AEIOU UND MUSIK
MP3
Die Basis eines „perceptual“ Codecs12 ist, dass es wenig Sinn macht, Informationen zu
speichern, die Menschen ohnehin nicht wahrnehmen können. Da Aufnahmegeräte (Mikrofone
und ähnliches) um ein Vielfaches sensibler sind als das menschliche Ohr, vor allem gemessen
an der Bandbreite des wahrnehmbaren Frequenzbereiches, ist ein großes Potential für eine
Datenreduktion vorhanden. MPEG1 Audio Layer 3, kurz MP3 genannt, verwendet dafür 2
verschiedene Kompressionsverfahren, wovon eine verlustbehaftet ist, die andere verlustfrei.
Der gesamte Kompressionsvorgang kann in folgende verschiedene Schritte unterteilt werden,
wobei die angegebene Reihenfolge nicht unbedingt eingehalten werden muss:
1. Das Signal wird in kleinere Stücke zerlegt. Diese Stücke werden „Frames“ genannt
(analog zu den Frames bei Videoclips) und sind typischerweise Bruchteile von
Sekunden lang.
2. Um die spektrale Energieverteilung zu bestimmen, wird das Signal analysiert. Das
heißt, in Bezug auf das gesamte Spektrum der hörbaren Frequenzen wird bestimmt,
wie die Bits verteilt werden müssen, um das Audiosignal, das kodiert werden soll,
bestmöglich darzustellen. Da verschiedene Abschnitte des Frequenzspektrums am
effizientesten kodiert werden können, wenn derselbe Algorithmus in leicht
abgewandelter Form angewendet wird, zerlegt dieser Schritt das Signal in sogenannte
Subbänder, die unabhängig voneinander behandelt werden können. Dabei verwenden
alle Subbänder denselben Algorithmus und variieren nur die Anzahl an zugeordneten
Bits (abhängig von der Berechnung durch den Encoder).
3. Die (gewählte) Kodierungsbitrate wird dazu verwendet, um die maximale Anzahl an
Bits zu bestimmen, die den einzelnen Frames zugeordnet werden können. Dieser
Schritt entscheidet also, wie viel der vorhandenen Audiodaten gespeichert wird.
4. Die Frequenzreichweite für jeden einzelnen Frame wird mit mathematischen
Modellen aus der Psychoakustik, die im Encoder gespeichert sind, verglichen. Daraus
kann bestimmt werden, welche Frequenzen genau gerendert werden müssen, da sie für
den Menschen gut wahrnehmbar sind, und welche Frequenzen ausgelassen oder
zumindest mit geringerer Bitrate aufgenommen werden können, da die potentiellen
Hörer sie ohnehin nicht hören können.
5. Durch die Anwendung des Huffman-Kodierungsalgorithmus auf den Bitstream
werden die redundanten Daten weiter komprimiert, ohne dabei Daten wegzuwerfen
(verlustfreie Komprimierung).
6. Die einzelnen Frames werden zu einem seriellen Bitstream zusammengefügt, wobei
jedem Frame bestimmte Kopfinformationen (Header) vorangehen.
Das Format des resultierenden Bitstreams wurde bereits kurz angedeutet und soll im
Folgenden näher beleuchtet werden (siehe Abbildung 15). Jeder der im Bitstream enthaltenen
Frames beginnt mit einem Block, der allgemeine Informationen zum Format des Teilstückes
enthält. Dieser Block wird Framekopf (Header) genannt. Dieser Kopf setzt sich aus folgenden
Teilen zusammen:
Abbildung 15: Der Aufbau eines MP3-Frames
12
Codec ist die Kurzform von Coding (Kodierung) und Decoding (Dekodierung).
42
AEIOU UND MUSIK
•
•
•
•
•
•
•
•
•
•
•
•
•
MP3
Am Beginn dieses Kopfes befindet sich der sogenannte Sync-Block (A), der aus 11
Bits besteht. Dieser Teil des Kopfes wird benötigt, damit bei einer Ausstrahlung eines
längeren Streams (z.B. Radiosendung via Internet) ein Empfänger an einer beliebigen
Stelle der Übertragung einsteigen und mit der Wiedergabe beginnen kann.
Auf diesen Sync-Block folgt ein ID-Bit (B), das angibt, ob der Frame in MPEG-1 oder
MPEG-2 kodiert wurde.
Darauf folgen 2 weitere Bits (C), die angeben, ob es sich um Layer I, II oder III
handelt oder ob der Layer nicht näher definiert wurde.
Das Protection-Bit (D) zeigt an, ob der Frame vor den Audiodaten eine
Kontrollsumme aufweist oder nicht.
Anschließend wird mit 4 Bits der Bitraten-Index (E) des aktuellen Frame angegeben.
Die Bitrate selbst ist in einer entsprechenden Referenztabelle eingetragen.
Auf die Bitratenangabe folgt die Spezifikation der verwendeten AudioSamplefrequenz (F). Diese kann sich zwischen 16 kHz und 44,1 kHz bewegen,
abhängig davon, ob MPEG-1 oder MPEG-2 für die Kodierung verwendet wurde. Der
Wert der vorliegenden Frequenz kann analog zur Bitrate über eine Referenttabelle
bestimmt werden.
Das nächste Bit (G, Padding-Bit) wird dazu verwendet, um sicherzustellen, dass jeder
einzelne Frame die Bitraten-Anforderungen exakt erfüllt.
Das darauffolgende Bit (H) ist für anwendungsspezifische Einträge reserviert.
Die Kanalinformation wird durch die nächsten beiden Bits (I) repräsentiert. Mögliche
Werte sind hier zum Beispiel Stereo, Zweikanal-Ton, Joint-Stereo oder Mono.
Durch 2 weitere Bits (J), Modus-Erweiterung genannt, wird dem Decoder mitgeteilt,
wie er mit Joint-Stereo-Effekten umgehen muss, wenn diese aktiviert sind (z.B. ob
hohe Frequenzen über mehrere Kanäle kombiniert werden sollen).
Im Framekopf ist zwar keine Copyright-Information im eigentlichen Sinne enthalten,
doch das folgende Bit (K) zeigt an, ob es offiziell erlaubt ist, Kopien des vorliegenden
Stücks zu machen (Bit nicht gesetzt) oder nicht (Bit gesetzt).
Das Original-Bit (L) zeigt an, ob es sich bei dem vorliegenden Stück um das Original
(Bit gesetzt) oder um eine Kopie (Bit nicht gesetzt) handelt.
Das letzte 2-Bit-Feld wird nur sehr selten verwendet und kann für die meisten
Aufnahmen als eher überflüssig betrachtet werden.
Im Anschluss an diese Kopfinformationen folgen eventuell eine Kontrollsumme und danach
die Audiodaten des Frames. Das hier gezeigte Muster setzt sich über den gesamten Bitstream
fort. Doch diese kurze Beschreibung des Formates soll an dieser Stelle genügen, für weitere
Informationen sei der interessierte Leser auf [HACKER00] oder verwandte Werke verwiesen.
3.5.1
Generierung von Sequenzen im MP3-Format
Für die Erzeugung von MP3-Dateien wird analog zu den zuvor behandelten Audioformaten
eine dafür geeignete Software benötigt. Für das Projekt AEIOU stand der XING MP3Encoder in der Version 1.5 zur Verfügung. Als Quelle werden vom XING MP3-Encoder
Dateien im Microsoft Waveform-Format unterstützt. Der Erstellungsprozess gliedert sich
damit in nachfolgend beschriebene Schritte:
•
Über das Windows-Startmenü wird der XING MP3-Encoder gestartet. Das Encoder
startet mit dem in Abbildung 16 gezeigten Hauptfenster.
43
AEIOU UND MUSIK
MP3
Abbildung 16: Das Hauptfenster des XING MP3-Encoders
•
Über das Menü Datei/Hinzufügen (File/Add) oder über den Button
können
eine oder mehrere Quelldateien (im WAVE-Format) als Arbeitsauftrag (Job)
hinzugefügt werden. Die eingefügten Dateien werden im Hauptfenster angezeigt
(siehe Abbildung 17). Angelegte Jobs können bei Bedarf über den Button
wieder entfernt werden.
Abbildung 17: Anzeige der eingefügten Kodierungsjobs im XING MP3-Encoder
•
•
Im Anschluss daran kann für jeden angelegten Job (oder auch für alle gemeinsam) das
gewünschte Konvertierungsprofil ausgewählt werden. Dazu muss der entsprechende
Job durch einen Mausklick ausgewählt werden und danach entweder über das Menü
Datei/Eigenschaften (File/Properties) oder über einen rechten Mausklick auf die
gewünschte Datei und danach Auswahl des Menüpunktes Eigenschaften (Properties)
das Eigenschaftsfenster geöffnet werden (siehe Abbildung 18).
Im neu geöffneten Fenster besteht die Möglichkeit, den Speicherpfad für die MP3Dateien festzulegen (über die Schaltfläche
) und das Kodierungsprofil des
gewählten Jobs zu ändern (über die Schaltfläche
). Durch Drücken des
zweiten Buttons wird ein neues Fenster geöffnet (siehe Abbildung 19).
44
AEIOU UND MUSIK
•
MP3
Aus den angebotenen Profilen kann durch einen Mausklick auf das gewünschte Profil
und anschließende Bestätigung der Auswahl mit der Schaltfläche
die
Zielbitrate (konstant oder variabel) für den aktuellen Konvertierungsjob festgelegt
werden.
Abbildung 18: Anzeige der Eigenschaften eines Konvertierungsauftrages
Abbildung 19: Festlegen eines Konvertierungsprofiles mit bestimmter Bitrate
•
Nach
Bestätigung
der
Eingabe
im
Profile-Fenster
Eigenschaftsfenster über die entsprechende Schaltfläche (
45
muss
diese
auch
) bestätigt werden.
im
AEIOU UND MUSIK
•
MP3
Damit sind alle für die Konvertierung notwendigen Einstellungen getroffen und der
Vorgang kann mit Betätigung der Schaltfläche
gestartet werden. Der
Konvertierungsvorgang wird automatisch beendet, sobald alle ausgewählten Dateien
in das MP3-Format umgewandelt wurden, kann aber auch über die Schaltfläche
(wird nur im Laufe der Konvertierung angezeigt) unterbrochen werden.
Sollen mehrere Dateien mit demselben MP3-Profil konvertiert werden, kann das Profil auch
als Standardeinstellung (Default) hinterlegt werden. Das Profil wird dann automatisch jedem
neuen Job zugeteilt und muss nicht mehr eigens ausgewählt werden. Dies wird wie folgt
durchgeführt:
•
•
Im Hauptfenster des Encoders den Menüpunkt Bearbeitung/Einstellungen
(Edit/Preferences) wählen.
In der Lasche Encode des neu geöffneten Fensters (siehe Abbildung 20) die
Schaltfläche
betätigen und danach auf die zuvor beschriebene Art und
Weise das gewünschte Profil aktivieren.
•
•
Analog dazu kann in derselben Lasche (über die Schaltfläche
) für den
MP3-Speicherpfad eine Standardeinstellung eingegeben werden.
Zusätzlich kann in der Lasche Erweiterte Einstellungen (Advanced Options)
ausgewählt werden, ob das Original-Bit und das Copyright-Bit gesetzt werden sollen
oder nicht.
Abbildung 20: Festlegung der Standardeinstellungen für die Kodierung
46
AEIOU UND MUSIK
3.5.2
MP3
Integration von Sequenzen im MP3-Format in eine HTML-Seite
Die erstellten MP3-Dateien können in analoger Weise wie Microsoft Waveform-Dateien in
HTML-Seiten eingebaut werden. geschilderten Vorgehensweise eingebaut. Die Audiodateien
müssen auf dem Server in einem bestimmtes Verzeichnis abgelegt und über einen
entsprechenden Link referenziert werden. Durch einen Mausklick auf diesen Link können
Internet-Benutzer die Clips lokal auf ihren Rechner laden und abspielen. Das Aussehen der
entsprechenden Seite innerhalb des AEIOU-Systems wird in Abbildung 9 (siehe Abschnitt
3.2.2) gezeigt.
<HTML>
<HEAD>
</HEAD>
<BODY>
<TABLE>
<TR>
<TD>
</A>
</TD>
</TR>
</TABLE>
<TABLE>
<TR>
<A HREF="/audio/Jupiter.mp3">Geringer</A>
</TD>
</TR>
</TABLE>
</BODY>
</HTML>
47
AEIOU UND MUSIK
3.5.3
MP3
Ergebnisse
Ähnlich wie Microsoft Waveform präsentiert sich auch MPEG 1 Audio Layer III (MP3)
äußerst leistungsfähig und mit einer großen Auswahl an möglichen Qualitätsstufen (siehe
Tabelle 5). Vor allem bei Verwendung der höheren Qualitätsstufen, das sind jene mit einer
Zielbitrate von 128 bis 192 kbps (CBR13 128, CBR 192, VBR14 Normal, VBR High), reicht
die Klangfülle der erstellten MP3-Clips nahezu an das verwendete Original heran. Mit den
Profilen mit geringerer Zielbitrate, also 96 kbps oder weniger, ist jedoch der Verlust an
Qualität deutlich spürbar.
Tabelle 5: Die Qualitätsstufen von MP3
Encoding-Profil
CBR 320K
VBR High
CBR 192K
VBR Normal/High
VBR Normal
CBR 128K
VBR Normal/Low
CBR 112K
VBR Low
CBR 64K
CBR 64K Mono
CBR 32K Mono
CBR 16K Mono
Bitrate Sample(kbps)
Rate
(kHz)
320
192
192
160
128
128
112
112
96
64
64
32
16
44
44
44
44
44
44
44
44
44
22
22
22
16
Mono /
Stereo
Stereo
Stereo
Stereo
Stereo
Stereo
Stereo
Stereo
Stereo
Stereo
Stereo
Mono
Mono
Mono
Bitrate ist konstant
Bitrate ist variabel
Was den Speicherplatz betrifft, so muss unterschieden werden, ob die MP3-Datei unter
Verwendung von konstanter Bitrate erzeugt wurde, oder ob eine Variante mit variabler Bitrate
gewählt wurde. Denn bei konstanter Bitrate wird die Größe der Ausgabedatei nur von der
Spieldauer der Quelldatei beeinflusst, nicht jedoch von deren Qualität und Beschaffenheit. In
diesem Fall kann die MP3-Version mitunter größer sein als die als Quelle verwendete WaveDatei, wenn diese zum Beispiel mit 16 kbps kodiert ist und für die MP3-Kodierung das Profil
VBR Normal (ca. 128 kbps) eingestellt wurde.
Bei Kodierung mit variabler Bitrate hingegen wird die für einen bestimmten Frame des
Musikstückes verwendete Bitanzahl vom Encoder aus der Beschaffenheit der Quellframes
berechnet. Diese Variante veranlasst den Encoder, ausgehend von einem festgelegten Zielwert
(z.B. 160 kbps bei VBR Normal/High) je nach Bedarf die Anzahl der für die Beschreibung
eines bestimmten Teilsegmentes (Frame) des Quellstückes verwendeten Bits zu erhöhen oder
auch zu senken. Dadurch wird es auch möglich, bei einer qualitativ schwachen, also mit einer
13
14
CBR bedeutet Konstante Bitrate (Constant BitRate)
VBR bedeutet Variable Bitrate (Variable BitRate)
48
AEIOU UND MUSIK
MP3
niedrigen Bitrate aufgenommenen Microsoft Waveform-Datei weitere Kompression zu
erreichen. Dies bringt den Vorteil gegenüber den Profilen mit konstanten Bitraten mit sich,
dass die erzeugten Dateien bei vergleichbarer Qualität wesentlich kleiner werden, womit
sowohl der Speicherverbrauch als auch die Download-Zeit für den Benutzer positiv
beeinflusst werden. Als Nachteil muss an dieser Stelle angemerkt werden, dass MP3-Dateien
mit variabler Bitrate nicht von allen MP3-Wiedergabeanwendungen (Player) unterstützt
werden.
Nachfolgende Tabelle 6 zeigt eine kurze Gegenüberstellung einiger Konvertierungsbeispiele:
Tabelle 6: Gegenüberstellung Microsoft Waveform und MP3
Quelle
(Microsoft Waveform)
Bsp1_l.wav
(305 kB)
Bsp1_m.wav
(1218 kB)
Bsp1_h.wav
(4869 kB)
Bsp2_l.wav
(241 kB)
Bsp2_m.wav
(964 kB)
Ergebnis
(MP3)
Bsp1_lc64.mp3
Bsp1_lv128.mp3
Bsp1_lc128.mp3
Bsp1_lv192.mp3
Bsp1_lc192.mp3
Bsp1_lc320.mp3
Bsp1_mc64.mp3
Bsp1_mv128.mp3
Bsp1_mc128.mp3
Bsp1_mv192.mp3
Bsp1_mc192.mp3
Bsp1_mc320.mp3
Bsp1_hc64.mp3
Bsp1_hv128.mp3
Bsp1_hc128.mp3
Bsp1_hv192.mp3
Bsp1_hc192.mp3
Bsp1_hc320.mp3
(221 kB)
(134 kB)
(443 kB)
(166 kB)
(663 kB)
(1.105 kB)
(222 kB)
(359 kB)
(442 kB)
(503 kB)
(663 kB)
(1.105 kB)
(222 kB)
(452 kB)
(442 kB)
(665 kB)
(663 kB)
(1.105 kB)
Bsp1_lc64.mp3
Bsp1_lv128.mp3
Bsp1_lc128.mp3
Bsp1_lv192.mp3
Bsp1_lc192.mp3
Bsp1_lc320.mp3
Bsp1_lc64.mp3
Bsp1_lv128.mp3
Bsp1_lc128.mp3
Bsp1_lv192.mp3
Bsp1_lc192.mp3
Bsp1_lc320.mp3
(176 kB)
(108 kB)
(351 kB)
(133 kB)
(525 kB)
(875 kB)
(175 kB)
(282 kB)
(350 kB)
(398 kB)
(525 kB)
(875 kB)
49
AEIOU UND MUSIK
Bsp3 (ca. 4 Minuten 20)
Bsp3_h.wav
(44855 kB)
Vivo Active
Bsp1_lc64.mp3
Bsp1_lv128.mp3
Bsp1_lc128.mp3
Bsp1_lv192.mp3
Bsp1_lc192.mp3
Bsp1_lc320.mp3
Die Abkürzungen in Tabelle 6 sind im Folgenden kurz erklärt:
• Waveform-Dateien
o *_l.wav
8 Bit/Sample
Mono
o *_m.wav
8 Bit/Sample
Stereo
o *_h.wav
16 Bit/Sample
Stereo
• MP3-Dateien
o *c64.mp3
Bitrate: 64 kbps konstant
Sample-Rate: 22 kHz
Stereo
o *v128.mp3
Bitrate: 128 kbps variabel
Sample-Rate: 44 kHz
Stereo
o *c128.mp3
Sample-Rate: 44 kHz
Stereo
o *v192.mp3
Bitrate: 192 kbps variabel
Sample-Rate: 44 kHz
Stereo
o *c192.mp3
Sample-Rate: 44 kHz
Stereo
o *c320.mp3
Sample-Rate: 44 kHz
Stereo
50
(1.999 kB)
(3.805 kB)
(3.997 kB)
(5.504 kB)
(5.996 kB)
(9.992 kB)
Wie in der Tabelle zu sehen ist, sind die erzielten Kompressionsraten durchaus
bemerkenswert. So wird zum Beispiel der Platzbedarf für ein ca. 5 Minuten langes
Musikstück in der höchsten Qualitätsstufe von ca 44 MB auf immerhin nur noch 6 bis 10 MB
reduziert. Auch der damit verbundene Qualitätsverlust im Vergleich zum Original ist kaum
hörbar. Aus diesen Gründen und durch den zusätzlichen Umstand, dass MP3-Dateien sich im
Internet großer Beliebtheit erfreuen, wurden für die Musikstücke des AEIOU-Musikalbums
anstelle verschiedener schwächerer Qualitätsstufen in anderen Formaten entsprechenden
Dateien im MP3-Format auf dem AEIOU-Server zur Verfügung gestellt.
51
4.
AEIOU und Film
Kapitel 4
AEIOU und Film
AEIOU UND FILM
Einleitung
In diesem Kapitel werden nach allgemeinen Betrachtungen zum Thema AEIOU und Film die
Ergebnisse und Erkenntnisse, die aus den in den Jahren 1996 und 1997 durchgeführten
Untersuchungen gewonnen wurden, behandelt. Evaluiert wurden die Videoformate AVI
(Abschnitt 4.2), Apple Quick Time (Abschnitt 4.3), MPEG (Abschnitt 4.4), Real Video
(Abschnitt 4.5) und Vivo Active (Abschnitt 4.6). In den einzelnen Abschnitten werden die
jeweiligen Formate zunächst vorgestellt und erklärt. Danach folgt eine Beschreibung der
Generierung von Videoclips in diesen Formaten und deren Einbau in HTML-Seiten. Im
Anschluss daran werden die erzielten Ergebnisse und beobachteten Effekte diskutiert und die
Verwendbarkeit der jeweiligen Formate für das Videoalbum des AEIOU-Projektes bewertet.
4.1
Einleitung
Werden Web-Sites mit Tondokumenten, also Musikclips oder erklärenden Sprechtexten,
etwas aufgepeppt und Informationsinhalte damit plastischer gemacht, so gewinnen diese Sites
ohne Zweifel an Anziehungskraft den Internet-Nutzern gegenüber. Trotzdem ist damit das Ei
des Kolumbus noch nicht gefunden. Es ist zwar ganz interessant, in Worten eine
Beschreibung zu erhalten, wie zum Beispiel die Burg Hochosterwitz aussieht, ausreichend
vorstellbar wird dieses Bauwerk dadurch aber nicht. Ebenso verhält es sich mit Beispielen aus
der Medizin: eine noch so wortreiche Schilderung einer Untersuchung wird dem interessierten
Benutzer nicht die Menge an Information vermitteln können, wie er sie zu finden erhofft.
Man könnte zwar die verwendeten Tonstücke durch Hinzufügen von Standbildern im JPEGoder GIF-Format untermalen und damit auch visuelle Information anbieten, doch die
vorhandenen multimedialen Möglichkeiten würde man in diesem Fall nicht zur Gänze nutzen.
Die bessere Variante, die auch einen größeren Gewinn an Attraktivität und Informationsgehalt
mit sich bringt, stellt die Kombination von Bild und Ton in einer anderen Form dar: als
Videoclip.
Wie im Audiobereich sollten auch dabei bestimmte Grundregeln beachtet und die
verwendeten Formate sorgfältig ausgesucht werden. Die Kriterien dafür sind ein wenig anders
gelagert, obwohl nach wie vor die Tonqualität mitentscheidend für den Anklang ist, den die
Clips bei den Anwendern finden. Die wesentlich wichtigeren Kriterien im Videobereich sind
jedoch die Bildqualität und die erreichte Kompressionsrate.
Ersteres lässt sich über zwei Unterkriterien definieren, nämlich über die Bildschärfe und über
die Flüssigkeit der Bildbewegung. Keiner der beiden Parameter bringt vernünftige
Ergebnisse, wenn das Augenmerk nur auf einen gelegt und der jeweils andere gänzlich
vernachlässigt wird. Wird zuviel Gewicht auf die Bildschärfe gelegt, so wird bei einigen
Formaten aus dem erhofften Videoclip unweigerlich eine Einzelbildfolge, die eher an einen
Diavortrag erinnert als an einen Film. Bevorzugt man hingegen die Flüssigkeit der Bewegung
bei den Bildübergängen und schenkt der Bildschärfe keinerlei Beachtung, so erhält man einen
Clip, in dem wie gewünscht die einzelnen Bilder nicht unterschieden werden können. Leider
bringt diese Vorgehensweise mit sich, dass auch der Bildvordergrund nur sehr schwer vom
Bildhintergrund zu trennen ist. Das Erzielen eines brauchbaren Kompromisses zwischen
diesen beiden Parametern gestaltet sich oft sehr schwierig, vor allem, wenn die Videoclips
kleinere Objekte enthalten, die nicht bewegungslos an einem Platz verweilen, sondern sich in
irgendeiner Form bewegen oder bewegt werden.
Ähnlich wie bei Audioclips darf auch im Videobereich die Kompressionsrate nicht aus den
Augen verloren werden. Die Gründe dafür sind dieselben wie im Audiobereich, wenn auch
53
AEIOU UND FILM
Einleitung
durch den höheren Informationsgehalt und damit verbundenem höheren Speicherplatzbedarf
vielleicht noch schwerwiegender, denn die Ladezeiten steigen dramatisch.
Auch für das Projekt AEIOU war es von Bedeutung, einen Teil der Informationen, vor allem
über die Geschichte und die Kultur Österreichs, in Form von kleinen Videosequenzen zur
Verfügung zu stellen. Dazu wurden aus den Archiven des ORF fünf Videokassetten im SVHS-Format und aus dem Filmarchiv in Laxenburg 7 Videokassetten ebenfalls im S-VHSFormat mit einer sehr großen Anzahl an kurzen, historisch wertvollen Videoclips angefordert.
Aus diesen Videokassetten wurde dann von Frau Edith Murlasits eine Sammlung von
ungefähr 360 Videosequenzen zusammengestellt. Bei der Auswahl dieser Clips mussten aus
den vorhandenen Filmstücken kleine Teile ausgesucht und teilweise bildgenau bestimmt
werden. Danach wurden diese Kurzfilme einzelnen Kategorien, wie zum Beispiel
„Persönlichkeiten“ oder „Leute“ zugeordnet. Über diese Kategorien sollten diese Filme
später von der Einstiegsseite des Videoalbums (Abbildung 21) erreichbar sein.
Abbildung 21: Gliederung der Videosequenzen in Kategorien
Nach dieser Vorselektion war es dann die Aufgabe des Autors der vorliegenden Arbeit, die
einzelnen Sequenzen in digitale Form zu bringen (Abbildung 22). Dabei war es zuvor
54
AEIOU UND FILM
Einleitung
notwendig, in einer umfangreichen und langwierigen Testreihe zu bestimmen, welche
Videoformate für welche Aufgabe geeignet war. Grundsätzlich gab es zwei verschiedene
Verwendungszwecke, für welche die Clips in bestimmte Formate konvertiert werden
mussten: einerseits für die Archivierung und als Ausgangspunkt zur Weiterverarbeitung und
andererseits für die Bereitstellung am AEIOU-Server. Für die erste Aufgabe war es
wesentlich, dass die einzelnen Filmstücke in ein Format gebracht wurden, das einen sehr
geringen Qualitätsverlust aufwies und auch einfach bearbeitet werden konnte. Vor allem war
es für die einzelnen Clips wichtig, dass die digitalisierte Sequenz nach der Aufnahme noch
bildgenau geschnitten werden konnte, da eine framegenaue Aufnahme nahezu unmöglich war.
Der für die verschiedenen Filmstücke verbrauchte Speicherplatz war eher sekundär. Ganz im
Gegensatz zur zweiten Anforderung, denn bei der Bereitstellung am AEIOU-Server musste
ein guter Kompromiss zwischen Qualität und dafür verbrauchtem Platz gefunden werden.
Abbildung 22: Skizzierter Ablauf bei der Erstellung der Videosequenzen
Da das Angebot an verschiedenen Videoformaten groß war, wurde nur eine Auswahl der
vielversprechendsten Formate in die Versuchsreihe aufgenommen. Folgende Formate wurden
auf ihre Tauglichkeit für die Archivierung und auf die Bereitstellung im Internet untersucht:
•
•
•
•
•
Audio-Video-Interleave (AVI)
Apple QuickTime (MOV)
Moving Pictures Expert Group (MPEG)
Real Video (RM)
Vivo Active (VIV)
Dabei war Audio Video Interleave für die Archivierung und als Ausgangspunkt für andere
Formate vorgesehen, die restlichen für eine eventuelle Verwendung im Internet bestimmt.
Inwieweit die ausgesuchten Formate den gesetzten Anforderungen entsprechen konnten,
belegen die in den nächsten Abschnitten gezeigten Ergebnisse.
55
AEIOU UND FILM
Der folgende Abschnitt stellt das Format von AVI-Dateien vor. Anschließend wird die
Generierung von Sequenzen im AVI-Format und deren Integration in HTML-Seiten
behandelt. Danach werden die Stärken und Schwächen dieses Formates näher beleuchtet und
die in den Untersuchungen erzielten Ergebnisse bezüglich Kompression und Tonqualität
kommentiert und die Bedeutung dieses Formates für das Videoalbum des AEIOU-Projektes
bewertet.
4.2
Das Videoformat Audio Video Interleave (AVI)
Als Dinosaurier unter den Videoformaten könnte Audio Video Interleave bezeichnet werden.
Clips dieses Formates sind nämlich seit vielen Jahren im Einsatz, insbesondere dann, wenn es
um die Archivierung von Videodaten geht. Sie werden nur in seltenen Fällen direkt im
Internet verwendet, da sie dafür durch ihren hohen Bedarf an Speicherplatz nicht gerade
vorzüglich geeignet sind. Trotzdem sind sie in dieser Arbeit wichtig, da sich AVI stark als
Quelle für die Konvertierung in andere Videoformate empfiehlt.
Audio Video Interleave wurde von Microsoft für Intel entwickelt und baut, wie das
Audioformat Waveform auf der RIFF-Spezifikation auf. Im Allgemeinen enthält eine AVIDatei mehrere Spuren von unterschiedlichen Datentypen. Die meisten AVI-Sequenzen
verwenden sowohl die Video- als auch die Audiospur. Einfachere Sequenzen, die keine
Audiospur benötigen, werden jedoch nur die Videodaten enthalten. Zusätzlich können
spezielle AVI-Clips eine Kontrollspur oder eine MIDI-Spur als zusätzliche Datenspur
enthalten. So ist es zum Beispiel möglich, über die enthaltene Kontrollspur ein externes Gerät
wie einen MCI Videodisc Player zu steuern. Im Folgenden werden hauptsächlich AVISequenzen berücksichtigt, die sowohl Audio- und Videodaten, jedoch keine speziellen Spuren
enthalten.
Das AVI RIFF Format wird durch den vierstelligen Code ÁVI ´ identifiziert. Alle Dateien
dieses Formates müssen 2 bestimmte LIST-Blöcke enthalten. Diese definieren das Format der
einzelnen Spuren sowie die Daten der Spuren. Zusätzlich dazu können AVI-Dateien einen
Indexblock enthalten, der die Position der Datenblöcke innerhalb der Datei angibt. Mit diesen
Komponenten sieht eine AVI-Datei wie folgt aus:
RIFF
(ÁVI ´)
LIST (´hdrl´
.
.
.
)
LIST (´movi´
.
.
.
)
[ídx1´<AVI Index>]
)
56
AEIOU UND FILM
Die LIST-Blöcke sind Unterblöcke des RIFF ÀVI `-Blocks, durch welchen die Datei als AVI
RIFF-Datei charakterisiert wird. Die gezeigte Reihenfolge der einzelnen Blöcke muss bei
AVI-Dateien unbedingt eingehalten werden, damit sie korrekt abgespielt werden können.
•
•
•
Durch den ersten zwingend notwendigen Block, den LIST `hdrl`-Block, wird das
Format der Daten bestimmt.
Der zweite, der LIST `movi`-Block, beinhaltet die Daten für die AVI-Sequenz.
An dritter Stelle kommt der optionale Index-Block, im Beispiel mit ìdx1`
bezeichnet.
Die Blöcke LIST `hdrl` und LIST `movi` verwenden weitere Unterblöcke für ihre Daten. Im
nachstehenden Beispiel ist das um die Unterblöcke erweiterte AVI RIFF-Format zu sehen.
RIFF (ÁVI ´)
LIST (´hdrl´
ávih´ (<AVI Kopf>)
LIST (´strl´
´strh´ (<Spurkopf>)
´strf´ (<Spurformat>)
´strd` (<zusätzliche Kopfdaten>)
.
)
.
)
LIST (´movi´
{Subblock | LIST (´rec ´
Subblock1
Subblock2
.
)
.
}
.
)
[ìdx1`<AVI Index>]
)
Am Beginn jeder AVI-Datei steht der Hauptkopf. Darin werden allgemeine
Dateiinformationen, wie zum Beispiel die Anzahl der enthaltenen Spuren oder die Bildhöhe
und die Bildbreite des Clips, gespeichert. Welche Daten dort mitgeliefert werden, ist am
besten an der für den Hauptkopf definierten Datenstruktur und den dazugehörigen
Feldbeschreibungen zu sehen:
Typedef struct {
DWORD dwMicroSecPerFrame;
DWORD dwMaxBytesperSec;
DWORD dwReserved1;
DWORD dwFlags;
DWORD dwTotalFrames;
DWORD dwInitialFrames;
DWORD dwStreams;
57
AEIOU UND FILM
DWORD
DWORD
DWORD
DWORD
DWORD
DWORD
DWORD
}
dwSuggestedBufferSize;
dwWidth;
dwHeight;
dwScale;
dwRate;
dwStart;
dwLength;
dwMicroSecPerFrame:
Durch dieses Feld wird die Zeitspanne zwischen den einzelnen Videoframes
angegeben.
• dwMaxBytesPerSec:
Die ungefähre maximale Datenrate der Datei wird durch dieses Feld spezifiziert. Der
eingetragene Wert gibt die Anzahl der Bytes pro Sekunde an, die das System
verarbeiten muss, um eine AVI-Sequenz darstellen zu können, wie sie durch die
restlichen im Hauptkopf und im Spurkopf enthaltenen Parameter beschrieben wird.
• dwFlags:
Das dwFlags-Feld enthält alle Flags der Datei. Für AVI-Dateien sind die folgenden
Flags möglich:
o AVIF-HASINDEX gibt an, ob die Datei einen Indexblock besitzt.
o AVIF_MUSTUSEINDEX zeigt an, ob der Index dazu verwendet werden soll,
die Reihenfolge der Datenpräsentation zu bestimmen.
o AVIF_ISINTERLEAVED liefert die Information, ob die AVI-Datei
„interleaved“ ist.
o AVIF_WASCAPTUREFILE gibt an, ob die Datei speziell für die EchtzeitVideoaufnahme reserviert ist.
o AVIF_COPYRIGHTED zeigt, ob die Daten Copyright-geschützt sind.
•
•
•
•
Die Flags AVIF_HASINDEX und AVIF_MUSTUSEINDEX sind nur für Dateien,
die einen Indexblock besitzen, von Bedeutung. Während der erste dem System
mitteilt, dass ein Indexblock in der Datei existiert, bestimmt der zweite, ob dieser
Indexblock bei der Ausgabe der Audio- und Videodaten verwendet werden muss. Ist
dieser Flag gesetzt, so bedeutet dies, dass die Informationen in der Datei nicht in
derselben Reihenfolge abgelegt sind, in der sie bei der Ausgabe präsentiert werden
müssen.
dwTotalFrames:
Die Gesamtanzahl der Frames (Einzelbilder) der Videodaten in der Datei wird durch
diesen Wert angegeben.
dwInitialFrames:
dwInitialFrames wird nur für „interleaved“ Clips verwendet. Werden derartige
Sequenzen erzeugt, so wird die Anzahl der Einzelbilder vor dem eigentlichen ersten
Frame der Sequenz in diesem Feld gespeichert.
dwStreams:
Bestimmt die Anzahl der Spuren in der Datei. Ein Clip, der sowohl Audio- als auch
Videodaten enthält, besitzt 2 Spuren.
dwSuggestedBufferSize:
Dieser Parameter charakterisiert die empfohlene Puffergröße beim Lesen der Datei.
Der Lesepuffer sollte generell groß genug sein, um einen Block vollständig
aufnehmen zu können.
58
AEIOU UND FILM
•
•
•
dwWidth, dwHeight:
Damit werden die Bildbreite und die Bildhöhe des AVI-Clips in Pixel angegeben.
dwScale, dwRate:
Diese beiden Felder werden verwendet, um die allgemeine Zeitskala für die Datei
festzulegen. Zusätzlich zu der allgemeinen Skala kann jede Spur noch ihre eigene
Zeitskala besitzen. Die Zeitskala (in Samples per Second) wird durch Division von
dwRate durch dwScale ermittelt.
dwStart, dwLength:
Die restlichen zwei Felder geben die Startzeit und die Spieldauer des AVI-Clips an.
Die Einheiten für diese Werte werden durch dwRate und dwScale festgelegt. Der
Wert des Feldes dwStart ist üblicherweise gleich Null.
Im Anschluss an den Hauptkopf folgen ein oder mehrere ´strl´-Blöcke, je nachdem, ob die
Datei eine oder mehrere Spuren enthält. Für jede der Spuren ist ein entsprechender ´strl´Block erforderlich, da dieser Informationen über die in der Spur befindlichen Daten
bereitstellt. Jeder dieser Blöcke muss sich aus einem Spurkopf, eingeleitet durch den
vierstelligen Code ´strh´, und einem Spurformat-Block, zu erkennen an dem ebenfalls
vierstelligen Code ´strf´, zusammensetzen. Eventuell kann noch ein weiterer Block mit der
Bezeichnung ´strd´, der die Spurdaten speichert, im ´strl´-Block zu finden sein. Zum besseren
Verständnis sei auch für den Spurkopf die zugehörige Datenstruktur angeführt und kurz
erklärt.
Typedef struct {
FOURCC fccType;
FOURCC fccHandler;
DWORD dwFlags;
DWORD dwReserved1;
DWORD dwInitialFrames;
DWORD dwScale;
DWORD dwRate;
DWORD dwStart;
DWORD dwLength;
DWORD dwSuggestedBufferSize;
DWORD dwQuality;
DWORD dwSampleSize;
}
•
•
•
fccType:
Im Spurkopf wird die Art der in der jeweiligen Spur enthaltenen Daten durch einen
vierstelligen Zeichencode beschrieben. Wenn dieser Wert auf ´vids´gesetzt ist, dann
beinhaltet diese Spur Videodaten. Ist für diesen Wert áudséingetragen, so handelt
es sich um eine Audiospur.
fccHandler:
Das Feld fccHandler stellt einen vierstelligen Zeichencode bereit, der angibt, welcher
Kompressor und welcher Dekompressor für diese Datei verwendet werden kann.
dwFlags:
Analog zum Hauptkopf liegen auch beim Spurkopf alle Flags der Spur im Feld
dwFlags. Zwei verschiedene Flags können an dieser Stelle eingetragen sein.
Einerseits das Flag AVISF_DISABLED, das angibt, dass die Datei nur dann
gerendert werden soll, wenn der Anwender (bzw. die Software) es explizit verlangt.
59
AEIOU UND FILM
•
•
Andererseits das Flag AVISF_VIDEO_PALCHANGES, das anzeigt, dass
Palettenänderungen in die Datei eingebettet sind.
dwInitialFrames:
dwInitialFrames wird nur für „interleaved“ Clips verwendet. Werden derartige
Sequenzen erzeugt, so wird die Anzahl der Einzelbilder vor dem eigentlichen ersten
Frame der Sequenz in diesem Feld gespeichert.
dwScale, dwRate, dwLength, dwSuggestedBufferSize, dwQuality, dwSampleSize:
Die übrigen Felder beschreiben die Wiedergabe-Charakteristiken der Spur. Zu diesen
Faktoren gehören die Wiedergabe-Rate (dwScale und dwRate), die Beginnzeit der
Sequenz (dwStart), die Spieldauer der Sequenz (dwLength), die Größe des
Lesepuffers (dwSuggestedBufferSize), ein Indikator für die Datenqualität
(dwQuality) und die Samplegröße (dwSampleSize).
Wie in der Auflistung zu sehen ist, befinden sich im Spurkopf teilweise dieselben Felder, wie
sie auch im Hauptkopf vorhanden sind. Der Unterschied zwischen den jeweiligen Feldern
liegt darin, dass sich die im Hauptkopf gespeicherten Werte auf die gesamte Datei, jene im
Spurkopf hingegen nur auf die entsprechende Spur beziehen.
Auf den Spurkopf muss immer ein Spurformat-Block folgen. Darin liegt die Beschreibung
des Formates, welchem die Daten in der Spur unterliegen. Bei Videospuren sind die Daten in
einer
BITMAPINFO-Struktur
abgelegt,
inklusive
der
gesamten
benötigten
Paletteninformation. Die Struktur, die bei Tonspuren verwendet wird, ist entweder
WAVEFORMATEX,
eine
erweiterte
Form
des
WAVEFORMAT,
oder
PCMWAVEFORMAT.
Der ´strl´-Block kann auch einen Datenblock für die aktuelle Spur enthalten. Falls er
verwendet wird, folgt dieser Block auf den Spurformat-Block und wird durch die Zeichen
´strd´ gekennzeichnet. Das Format und der Inhalt dieses Blocks werden durch die
verwendbaren Treiber für die Kompression und Dekompression definiert. Diese Information
wird von den einzelnen Treibern bei der Konfiguration verwendet. Player und Encoder, die
RIFF-Dateien lesen oder schreiben, müssen diese Information nicht dekodieren.
Bei der Wiedergabe verbindet ein AVI-Player die Spurkopfdaten im LIST ´hdrl´-Block mit
den Spurdaten im LIST ´movi´-Block, indem er die in den ´strl´-Blöcken angegebene
Reihenfolge interpretiert. Das heisst, der erste ´strl´-Block wird auf die Spur 0, der zweite auf
die Spur 1 angewendet und so weiter. Wenn also der erste ´strl´-Block Wave-Audiodaten
beschreibt, dann befinden sich diese Daten in der ersten Spur (Spur 0). Ebenso gilt, dass,
wenn der zweite ´strl´-Block Videodaten beschreibt, diese Videodaten in der zweiten Spur
(Spur 1) gefunden werden können.
Der oben angesprochene Block wird durch die Zeichenkette LIST ´movi´ eingeleitet und folgt
auf den Dateikopf. Dort befinden sich die eigentlichen Datenblöcke in den einzelnen Spuren,
sprich die Audio- und Videodaten selbst. Die Datenblöcke können dabei direkt im ´movi´Block liegen oder auch in mehreren ´rec´-Blöcken gekapselt sein. Diese Gruppierung bedingt
jedoch, dass die einzelnen Gruppenblöcke auf einmal vom Datenträger gelesen werden.
Wie jeder andere RIFF-Block enthalten auch die Datenblöcke eine vierstellige Zeichenkette,
die den Blocktyp kennzeichnet. Die ersten beiden Zeichen geben dabei die Nummer des
Blockes an, die restlichen beiden bezeichnen die Art der im Block gespeicherten Information.
Für einen Waveform-Block lautet der zweistellige Code ´wb´. Daraus folgt, wenn sich dieser
Waveform-Block in der zweiten Spur befindet, dann lautet die entsprechende 4-Zeichenkette
60
AEIOU UND FILM
´01wb´. Da die gesamte Formatinformation im Kopf abgelegt ist, beinhalten die Audiodaten
in den Datenblöcken keinerlei Angaben über ihr Format. Das Format eines derartigen
Audioblockes sieht demnach wie folgt aus (## steht für die Nummer der Spur):
WAVE
BYTE
Bytes `##wb´
abBytes [];
Videodaten können komprimierte oder unkomprimierte DIB’s sein. Bei einem
unkomprimierten DIB ist der Wert BI_RGB, andernfalls ein davon verschiedener Wert in das
biCompression-Feld der zugehörigen BITMAPINFO15-Struktur eingetragen. Der Datenblock
eines unkomprimierten DIB besteht aus RGB-Bilddaten. Diese Blöcke werden charakterisiert
durch den zwei Zeichen langen Code ´db´. Datenblöcke eines komprimierten DIB hingegen
werden durch die Zeichenkette ´dc´ gekennzeichnet. In beiden Fällen sind keine Kopfdaten
für die DIB’s in den Datenblöcken verpackt. Im Folgenden ist die Struktur für
unkomprimierte und komprimierte DIB’s zu sehen:
DIB Bits ´##db´
Byte abBits []
Compressed DIB
Byte abBits []
´##dc´
Videodatenblöcke können auch neue Farbbaletteneinträge definieren, die dazu verwendet
werden, um die Palette beim Abspielen der AVI-Sequenz zu aktualisieren. Der Code für diese
Blöcke lautet ´pc´. Die für derartige Blöcke vorgesehene Datenstruktur sei hier der
Vollständigkeit halber kurz gezeigt:
Typedef struct {
BYTE
BYTE
WORD
PALETTEENTRY
}
•
•
bFirstEntry;
bNumEntries;
wFlags;
peNew;
bFirstEntry, bNumEntries:
Mit bFirstEntry wird festgelegt, welcher der erste zu ändernde Eintrag in der Palette
ist. Im Feld bNumEntries wird hinterlegt, wie viele Einträge geändert werden sollen.
peNew:
Die neuen Farbeinträge sind in diesem Feld gespeichert.
Wie bereits erwähnt wurde, kann eine AVI-Datei nach dem LIST ´movi´-Block noch einen
Indexblock besitzen, der durch die vierstellige Zeichenkette ídx1´ eingeleitet wird. Dieser
enthält, wenn notwendig, eine Liste von Datenblöcken und deren Position innerhalb der
Datei. Dadurch wird ein effizienter wahlweiser Zugriff auf die Informationen innerhalb der
Datei ermöglicht, da eine Applikation eine bestimmte Tonsequenz oder eine bestimmte
Bildfolge in der Datei lokalisieren kann, ohne diese als Ganzes zu scannen. Folgende
Datenstruktur ist für Indexblöcke definiert:
15
Genaue Informationen zu diesem Format können in Microsoft Windows Multimedia Programmer’s Reference
[MICROSOFT92a] gefunden werden.
61
AEIOU UND FILM
Typedef struct {
DWORD
DWORD
DWORD
DWORD
}
•
•
•
ckid;
dwFlags;
dwChunkOffset;
dwChunkLength;
ckid:
Dieses Feld enthält die Zeichenkette, durch die einzelne Indexblöcke identifiziert
werden können.
dwFlags:
Das dwFlags-Feld enthält alle Flags des Blocks. Folgende können gesetzt sein:
o AVIIF-KEYFRAME zeigt Keyframes in der Videosequenz an. Diese Bilder
benötigen keinerlei Videodekompression, bevor sie angezeigt werden können.
o AVIIF_NOTIME bedeutet, dass ein bestimmter Block das Zeitverhalten der
Sequenz nicht beeinflusst. Werden zum Beispiel Paletteneinträge geändert, so
sollte dies während der Ausgabe der Einzelbilder geschehen. Das heisst, wenn
ein Programm die Spielzeit für eine AVI-Sequenz bestimmen soll, dürfen
Blöcke mit gesetzten AVIIF_NOTIME-Flag nicht miteingerechnet werden.
o AVIIF_LIST gibt an, dass es sich bei dem aktuellen Block um einen LISTBlock handelt.
dwChunkOffset, dwChunkLength:
Durch diese beiden Felder wird die Position des Blockes innerhalb der Datei sowie
dessen Länge angegeben. Dabei bedeutet dwChunkOffset die Position des Blockes
relativ zum LIST ´movi´-Block.
Nach dieser theoretischen Betrachtung soll auch die praktische Anwendung, das heisst die
Erzeugung eines derartigen Videoclips, nicht zu kurz kommen. Als Beispielsequenz für die
folgenden Erklärungen dient ein Kurzfilm aus dem AEIOU-Projekt, und zwar der
„Kranzltanz“, getanzt von der kroatischen Volkstanzgruppe „Kolo Slavuj“ (Abbildung 23).
Dieser Clip ist sehr gut als Testsequenz geeignet, da er sowohl schnelle bewegte Bilder als
auch viele Farben und eine Tonspur aufweist. Aus diesem Grund stellt dieser Film hohe
Ansprüche an die Testkandidaten.
Abbildung 23: Der "Kranzltanz" aus dem AEIOU-Videoalbum
62
AEIOU UND FILM
4.2.1
Generierung von Sequenzen im AVI-Format
Bei der Erzeugung der einzelnen Clips sind Videoformate nicht mehr so genügsam, wie es im
Audiobereich der Fall war. Audio Video Interleave bildet dabei keine Ausnahme. Die
Anforderungen bezüglich der Grundausstattung des Rechners, also Prozessor, Hauptspeicher
und ähnliches, halten sich noch in Grenzen, noch immer ist ein Standard-PC ausreichend.
Zusätzlich sind für die Aufnahme von Videoclips im AVI-Format eine
Videobearbeitungskarte sowie ein Videoplayer als Eingabegerät erforderlich. Für die
Untersuchungen im Rahmen dieser Arbeit wurde eine MIRO DC20-Videobearbeitungskarte
kombiniert mit einem S-VHS-Recorder verwendet. Eine Darstellung des Anschlussplanes
befindet sich in Anhang A.
Softwareseitig stehen je nach weiterem Verwendungszweck zwei verschiedene Encoder zur
Verfügung. Wenn eine spätere Konvertierung in MPEG beabsichtigt ist, so empfiehlt es sich,
die Clips mit Miro VidCap 32 aufzunehmen, in allen anderen Fällen ist aufgrund der größeren
Bedienerfreundlichkeit das Softwarepaket Adobe Premiere vorzuziehen. Da für die Filme des
Projektes AEIOU eine Hardware-Lösung für die Aufnahme in MPEG zur Verfügung stand,
war die Aufnahme mit Miro VidCap 32 nicht von Belang. Aus diesem Grund ist im
Folgenden nur die Generierung von Videoclips im AVI-Format mit Adobe Premiere v4.2
kurz erklärt. In Abbildung 24 werden die einzelnen Stufen bei der Erzeugung von AVIFilmen gezeigt.
Abbildung 24: Ablaufskizze für die Erstellung von AVI-Sequenzen
63
AEIOU UND FILM
Bevor mit der Aufnahme eines Clips begonnen werden kann, ist es notwendig, dass
bestimmte Einstellungen vorgenommen werden. Da die Möglichkeit besteht, mehrere
Sequenzen hintereinander zu digitalisieren, ist es zweckmäßig, zuerst jene Parameter
festzulegen, die für alle aufzunehmenden Filme Gültigkeit haben.
•
•
Das Programm Adobe Premiere 4.2 wird über das Windows Startmenü gestartet.
Gleich nach dem Programmstart wird der Benutzer aufgefordert, einzustellen, welche
Art von Videoprojekt erstellt werden soll (siehe Abbildung 25). Im Falle der
Videosequenzen des AEIOU-Projektes war die Einstellung „Presentation 240x180“
zutreffend. Bei dieser Einstellung werden die Clips im Format 240x180 Bildpunkten
gespeichert. Diese Einstellung beeinflusst nur das Bildformat der endgültigen AVIDatei, nicht jedoch das Format bei der Aufnahme. Ausserdem ist diese Einstellung nur
als Voreinstellung zu sehen, da sie bei der Speicherung selbst noch angepasst werden
kann. Es empfiehlt sich trotzdem, die Bildgröße des Clips gleich an die Anforderungen
bei der späteren Verwendung anzupassen, um nicht unnötig Speicherplatz zu
verschwenden. Sollte diese noch nicht bekannt sein, ist man gut beraten, eher ein
größeres Bildformat zu wählen, da eine spätere Reduktion ohne merkbaren
Qualitätsverlust möglich ist, ein Vergrößern des Bildes aber nicht.
Abbildung 25: Öffnen eines neuen Projektes
•
Danach gelangt man in das Hauptfenster des Programms. Das Hauptfenster von Adobe
Premiere präsentiert sich vorerst nur mit dem Schnitt-, dem Vorschau- und dem
Clipfenster. Erst über Wahl von Movie Capture aus dem Menü File/Capture wird ein
neuer Menüpunkt (Capture Movie) erhalten. Darüber hinaus wird ein zusätzliches
Fenster, das Aufnahmefenster, geöffnet. In diesem ist, sofern eine Videoquelle
angeschlossen und die Wiedergabe gestartet wurde, das Eingabesignal dieser
Videoquelle zu sehen. Eine Ansicht des Hauptfensters mit bereits gestarteter
Videowiedergabe wird in Abbildung 26 gezeigt.
64
AEIOU UND FILM
Abbildung 26: Das Hauptfenster von Adobe Premiere mit Videoquelle
•
•
Anschließend muss festgelegt werden, welche Signale aufgenommen werden sollen.
Dazu ist im Menü Movie Capture die Option Record Video zu selektieren, wenn das
Videosignal aufgezeichnet werden soll. Um in der digitalisierten Sequenz auch das
Audiosignal zu integrieren, muss die Option Record Audio gesetzt sein. Im Projekt
AEIOU wiesen nicht alle Sequenzen eine Audiospur auf. Trotzdem wurde auch bei
diesen standardmäßig sowohl das Video- als auch das Audiosignal aufgezeichnet, da
zu einem späteren Zeitpunkt, beim Speichern des Clips, die Audiospur noch
ausgeblendet werden kann.
Durch Auswahl des Punktes Video Source im Menü Movie Capture werden
Einstellungsmöglichkeiten für die Videoquelle gezeigt (Abbildung 27). Mit den
nachstehend erklärten Parametern wird die Art des Eingangssignals festgelegt. Die
restlichen in diesem Fenster gezeigten Parameter sind für den aktuellen Arbeitsschritt
des Erstellungsprozesses noch nicht relevant.
o Eingang:
Mit diesem Parameter wird der Typ des Eingangssignals gewählt. Wird wie im
Beispielfall ein S-VHS-Recorder als Eingabegerät verwendet, so muss die Option
S-VHS eingestellt werden.
o Standard:
Hier wird eingestellt, welchem Standard (PAL, NTSC) das Videosignal
entspricht. Videosequenzen im europäischen Raum, so auch die Filmausschnitte
aus den Archiven des ORF und von Laxenburg, liegen im Regelfall im PALStandard vor.
65
AEIOU UND FILM
o Qualität:
Mit dieser Auswahlliste wird die Qualität des eingehenden Signals angegeben.
Wie beim Punkt Eingang sollte hier S-VHS-Recorder gewählt werden, wenn ein
derartiges Gerät als Eingabegerät verwendet wird.
Abbildung 27: Festlegung der Videoquelle
•
Wie bereits zu Beginn erwähnt wurde, wird die Bildgröße bei der Aufnahme durch die
Einstellung für das Projekt bei Programmstart nicht beeinflusst. Dazu muss der
Menüpunkt Movie Capture/Recording Options aufgerufen werden. Die Abbildungen
28-30 zeigen die Fenster, in denen das Bildformat, die Kompressionsart und die
Kompressionsrate eingestellt werden können. Das Fenster Videoformat erhält man
durch Drücken des Button
, das Fenster Video Compression über den
Button
. Welche Werte dort eingestellt werden sollen, um vernünftige
Ergebnisse zu erzielen, hängt von der Beschaffenheit des Ausgangsmaterials ab. Bei
der Datenaufbereitung für das Projekt AEIOU standen als Quelle mehrere
Videokassetten im PAL-Format zur Verfügung. Da Videoaufnahmen dieses Standards
ein Seitenverhältnis von 4:3 und eine Bildfolge von 25 Bildern je Sekunde aufweisen,
wurden folgende Einstellungen gewählt:
o Video-Rate (Abbildung 28):
25 fps (=Frames pro Sekunde)
o Video Format (Abbildung 29):
Horizontal: volle Auflösung
Zeitlich: beide Halbbilder
Seitenverhältnis: 4:3
Bildgröße: 720x540
Datenformat: MJPEG-komprimiert
Kompression: 7,0:1
o Compression (Abbildung 30):
No Recompression
o Options (Abbildung 28):
Report dropped frames
Conform movie to 25 fps
66
AEIOU UND FILM
Abbildung 28: Einstellung der Aufnahmeoptionen
Abbildung 29: Videoformat festlegen
67
AEIOU UND FILM
Abbildung 30: Wahl der Videokompression
•
Die Tonparameter werden über das Menü Movie Capture/Audio Recording Options
festgelegt (siehe Abbildung 31). Die Sequenzen des AEIOU-Videoalbums wurden
unabhängig von der vorhandenen Tonspur mit folgenden Werten aufgezeichnet:
o Format:
16 Bit Stereo
o Rate:
44 kHz
o Type:
Uncompressed
Abbildung 31: Einstellen der Audioeigenschaften
Damit ist der erste Schritt, die Einstellung der für alle Sequenzen gleichbleibenden Parameter,
abgeschlossen. Für diesen Abschnitt gestaltet es sich noch ziemlich einfach, die richtigen
Werte herauszufinden. Nun kann mit der Aufnahme der Filmausschnitte begonnen werden.
Dazu muss die entsprechende Videokassette in den Rekorder eingelegt und der gewünschte
Abschnitt herausgesucht werden. Um nun die restlichen Bildeinstellungen vornehmen zu
können, ist es erforderlich, dass die Zielsequenz im Aufnahmefenster sichtbar ist.
•
Danach wird wieder der Punkt Video Source im Menü Movie Capture ausgewählt
(Abbildung 27). Folgende Kennwerte können hier eingestellt werden.
o Helligkeit:
Durch Verändern dieses Wertes kann die Helligkeit des eingehenden Signals bei
der Aufnahme beeinflusst werden. Höhere Werte ergeben dabei hellere Bilder,
niedrigere Werte entsprechend dunklere Bilder.
68
AEIOU UND FILM
o Kontrast:
Über diesen Parameter kann die Stärke des Hell/Dunkel-Kontrastes bestimmt
werden. Hohe Werte bedingen einen starken Kontrast, niedrige Werte schwache
Abstufungen.
o Sättigung:
Festlegung der Farbintensität bei der Aufnahme. Mit höheren Werten werden
satte, kräftige Farben erreicht.
Durch die unterschiedliche Beschaffenheit der einzelnen Videos sowie manchmal
sogar der einzelnen Bilder innerhalb eines Filmes kann leider kein Standard-Verfahren
angegeben werden, mit dem einfach für alle Clips die richtigen Werte gefunden
werden können. Vor allem die unterschiedlichen Filme aus der Sammlung für das
Videoalbum des AEIOU machten es oftmals nötig, das „Trial and Error“-Verfahren
anzuwenden bzw. mit empirischen Werten zu arbeiten. Das heißt, es wurden
bestimmte Werte eingestellt und der gesamte Clip mit den eingestellten Werten
aufgezeichnet. Danach wurde das Video zur Gänze abgespielt und das erzielte
Ergebnis überprüft. Dieser Vorgang musste so oft wiederholt werden bis der
aufgenommene Clip die gewünschte (bzw. bestmögliche) Qualität erreicht hatte. Jene
Werte, die für den „Kranzltanz“ das dem Original gerechtwerdende Ergebnis
hervorbrachten, sind in Tabelle 7 zu sehen.
Tabelle 7: Bildparameter für den „Kranzltanz“ aus dem Videoalbum des AEIOU
Sequenznummer
o503a (Kranzltanz)
Helligkeit
Sättigung
Kontrast
150
120
130
Diese Werte konnten erst nach mehreren Versuchen gefunden werden. Um im Falle
einer erneuten Digitalisierung nicht wieder die gesamte „Trial and Error“-Reihe
durchlaufen zu müssen, wurden für jeden aufgenommenen Film die verwendeten
Werte in einer Tabelle gesammelt. Die vollständige Auflistung befindet sich in
Anhang B.
•
•
Nachdem nun alle vor der Aufzeichnung nötigen Einstellungen getätigt wurden, kann
die eigentliche Aufnahme begonnen werden. Dazu muss der Videorecorder auf
Wiedergabe geschaltet sein und das Band an die gewünschte Stelle gespult worden
sein. Um die Aufnahme zu starten, muss zu Beginn der gewünschten Sequenz auf
Record geklickt werden. Beendet wird die Aufnahme mit einem neuerlichen Klick in
das MovieCapture-Fenster oder durch Drücken der Escape-Taste. Die Beginn- und
Endzeitpunkte müssen bei der Aufnahme mit Adobe Premiere nicht unbedingt genau
getroffen werden, da es noch die Möglichkeit gibt, den digitalisierten Clip zu
bearbeiten. Zuvor muss allerdings die Sequenz noch über File/SaveAs unter einem
beliebigen Namen gespeichert werden.
Im Anschluss muss mit der Maus in das Filmfenster geklickt und der Clip bei
gedrückter Maustaste in das Schnittfenster gezogen werden (siehe Abbildung 32). In
diesem Fenster wird dann sowohl die Audio- als auch die Videospur angezeigt. Dort
ist es nun möglich, verschiedene Veränderungen des Clips vorzunehmen, wie zum
Beispiel bestimmte Einzelbilder zu entfernen, andere einzufügen oder die Tonspur zu
manipulieren.
69
AEIOU UND FILM
Abbildung 32: Das Schnittfenster von Adobe Premiere
•
Sollte die Darstellung der einzelnen Clip-Abschnitte (bzw. Einzelbilder) nicht groß
genug sein, um die richtigen Anfangs- und Endbilder erkennen zu können, besteht die
Möglichkeit, die Darstellungsgröße zu verändern. Dazu muss mit der rechten
Maustaste auf die blaue Titelleiste geklickt werden. Im daraufhin erscheinenden
Fenster (Abbildung 33) kann die Darstellungsart für die Sequenz verändert werden.
Abbildung 33: Änderung der Darstellung im Schnittfenster
70
AEIOU UND FILM
•
Die Länge des Clips kann verändert werden, indem wie folgt Anfangs- und Endmarke
des Films gesetzt werden.
o Mit dem Schieberegler
die Auflösung auf 1 Frame setzen, damit
alle Einzelbilder angezeigt werden
o Auf
klicken und danach jenes Bild auswählen, mit dem der Clip beginnen soll.
o Auf
klicken und danach das erste Bild nach jenem auswählen, mit dem der
Clip enden soll.
o Mit dem Schieberegler die Auflösung auf 1 Sekunde setzen und den Clip nach
links ziehen, bis die Anfangsmarke bei 0 Sekunden liegt.
•
•
Der gelbe Balken muss nun von der Anfangsmarke bis zur Endmarke gezogen werden,
um die Länge des Videos zu bestätigen.
Bevor der geschnittene Film gespeichert werden kann, müssen folgende Einstellungen
im Konvertierungsdialog (Menü Make/Make Movie, siehe Abbildung 34) getätigt
werden:
o Durch Drücken der Schaltfläche Output Options wird das Eingabefenster für die
Ausgabeeinstellungen geöffnet (Abbildung 35). Als Richtwerte seien die im
Projekt AEIOU verwendeten Werte angegeben.
Output:
Work Area as AVI Movie
Video (immer aktiviert):
Size:
240h, 180v, 4:3 Aspect
Type:
Full Size Frame
Audio (nur bei Sequenzen mit Ton aktiviert):
Rate:
22 kHz
Format:
16 Bit, Stereo
Type:
Uncompressed
Interleave:
1 Second
o Durch Drücken der Schaltfläche Compression gelangt man zum Dialog
Compression Settings (Abbildung 36). Dort wird für die einzelnen Datentypen
festgelegt, in welcher Qualität und mit wie starker Kompression die endgültigen
Clips gespeichert werden sollen. Folgende Einstellungen wurden im Projekt
AEIOU verwendet:
Settings for:
Video for Windows (AVI)
Compressor:
Method:
Microsoft Video 1
Depth:
Thousands
Quality:
100% (High)
Options:
Frames per second: 25
Keyframe every 25 frames
Optimize stills
Special processing (Schaltfläche Special, Abbildung 37):
Gamma:
1.0
Better Resize:
On
Noise Reduction:
None
Deinterlace:
Off
Cropping:
Off
71
AEIOU UND FILM
o Namen der Ausgabedatei eingeben
Um die mehr als 360 Filmsequenzen eindeutig zu benennen, wurde ein
fünfstelliger Code entwickelt. Dieser Code ermöglicht einerseits festzustellen, aus
welchem Archiv ein bestimmter Clip stammt und bietet andererseits durch die
Erweiterbarkeit auf 8 Zeichen für etwa die Kürzel ge und en eine spätere
Implementation von Mehrsprachigkeit. Dieser Code setzt sich wie folgt
zusammen:
<Herkunftskürzel><Filmnummer><Unterscheidungsbuchstabe>.<Erweiterung>
Der erste Teil, das Herkunftskürzel, kann, je nach Ursprung des Films, entweder a
(AVL), o (ORF) oder f (Filmarchiv von Laxenburg) sein. Die dreistellige
Filmnummer ergibt sich aus der Anordnung der Originalsequenzen auf den
jeweiligen Kassetten. Da aus manchen Sequenzen mehr als nur ein Clip
entnommen
wurde,
musste
auch
ein
zusätzliches Zeichen,
der
Unterscheidungsbuchstabe, eingeführt werden. Die Erweiterung schließlich wird
durch das Videoformat, in dem der Clip vorliegt, bestimmt (zum Beispiel avi,
mpg).
•
Schließlich muss nur noch Save gedrückt werden, um den geschnittenen Film
abzuspeichern. Der Konvertierungsvorgang kann je nach Länge des Films mehrere
Minuten dauern.
Abbildung 34: Der "Make Movie"-Dialog
72
AEIOU UND FILM
Abbildung 35: Festlegen der Ausgabeeinstellungen
Abbildung 36: Kompressionseinstellungen wählen
73
AEIOU UND FILM
Abbildung 37: Zusätzliche Parameter festlegen
4.2.2
Integration von AVI-Sequenzen in eine HTML-Seite
Auch ein AVI-Clip kann in eine HTML-Seite eingebaut werden. Dies erfolgt auf dieselbe Art,
wie sie schon bei den Audioformaten gezeigt wurde: durch Angabe eines Links auf die am
Server abgelegte Videodatei. Der nachstehende HTML-Code stellt einen Auszug aus der in
Abbildung 38 gezeigten HTML-Seite dar. Wird in dieser Seite auf den Schriftzug AVI oder
das voranstehende Symbol geklickt, so wird der Kurzfilm „Kranzltanz“ in einem eigenen
Fenster geöffnet und abgespielt.
<HTML>
<HEAD>
<TITLE>"Kranzltanz", Burgenland.</TITLE>
</HEAD>
<BODY>
<TABLE ALIGN=CENTER CELLPADDING=10 BORDER=0>
<TR>
<TD>
<IMG SRC="/aeiou.film.data.image/o503a.jpg">
</TD>
<TD VALIGN=CENTER>
<TABLE BORDER=0 CELLPADDING=5>
<TR>
74
AEIOU UND FILM
<TD COLSPAN=2>"Kranzltanz", getanzt von der kroatischen
Volkstanzgruppe "Kolo Slavuj", Burgenland.
</TD>
</TR>
<TR>
<TD VALIGN=CENTER>
<A HREF="/aeiou.film.data.film/o503a.avi"><IMG SRC=
"/aeiou.film.data.image.general/movie_ton.gif" BORDER=0></A>
</TD>
<TD VALIGN=CENTER ALIGN=LEFT>
<A HREF="/aeiou.film.data.film/o503a.AVI">AVI
(74.5 MB)</A>
</TD>
</TR>
</TABLE>
</TD>
</TR>
</TABLE>
</BODY>
</HTML>
Abbildung 38: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im AVI-Format
75
AEIOU UND FILM
4.2.3
Ergebnisse
Wie man dies von einem bereits etablierten und seit geraumer Zeit eingesetzten Format
erwartet, bieten die Ergebnisse der mit AVI durchgeführten Tests kaum Überraschungen. Die
Bildqualität der erstellten Videoclips ist bestechend hoch und hat damit die gesetzten
Erwartungen voll erfüllt. Auch die Qualität einer eventuell mitaufgezeichneten Tonspur ist
durch die interne Verwendung des in Abschnitt 3.2 behandelten Microsoft WaveformFormates sehr gut. Zusätzliche Pluspunkte dieses Formates stellen die relative hohe
Flexibilität bei der Wahl der Qualitätsstufen sowie die nachträgliche Editierbarkeit des
digitalisierten Clips dar. Dies bedeutet, dass es nach der Aufnahme noch möglich ist, Beginn
und Ende der Sequenz bildgenau festzulegen oder sogar einzelne Teile der Sequenz (auch aus
der Mitte) zu entfernen.
Durch den eher hohen Bedarf an Speicherplatz, wie für das Beispielvideo in Abbildung 38
fast 75 MB, ist Audio Video Interleave nicht dazu geeignet, im Internet zur Betrachtung
angeboten zu werden. Die damit verbundenen Wartezeiten beim Herunterladen auch von
kurzen Filmen wären zu lang und den Benutzern nicht zumutbar. Doch die Stärke dieses
Formates liegt darin, als Quelle für eine weitere Konvertierung in viele andere Formate, wie
zum Beispiel Real Video, Moving Pictures Expert Group (MPEG) oder Apple QuickTime
geeignet zu sein. Für eine solche Weiterverarbeitung empfiehlt es sich, die AVI-Clips wie im
Projekt AEIOU mit einer Bildgröße von mindestens 240x180 Bildpunkten aufzunehmen, da
es in jedem Fall noch möglich ist, die Abmessungen gegebenenfalls bei einer
Weiterverarbeitung entweder über den verwendeten Konverter, wenn er diese Aktion anbietet
(z.B.: Vivo Producer), oder über das Programm, mit dem der AVI-Clip erstellt wurde (z.B.
Adobe Premiere) zu reduzieren, ohne dabei die Qualität des Clips negativ zu beeinflussen.
Eine Vergrößerung der Abmessungen hingegen ist nicht ohne Einbußen möglich.
Einen weiteren bedeutenden Parameter stellt die Anzahl der Einzelbilder pro Sekunde, auch
Framerate genannt, dar. Wenn als Grundlage für die Erstellung von AVI-Clips
Videosequenzen im PAL-Standard verwendet werden, so sollte für diesen Parameter der Wert
25 eingesetzt werden. Wie in den durchgeführten Test ermittelt werden konnte (siehe
Abbildung 39), kann durch den Umstand, dass auch der PAL-Standard 25 Einzelbilder pro
Sekunde verwendet, auf diese Art die beste Annäherung an das Original erreicht werden.
Durch eine Abweichung von diesem Wert bewirkt man keinerlei positive Veränderung. So
etwa hat eine Verringerung dieser Framerate eine Verschlechterung der Flüssigkeit der
Bildfolge zur Folge, weil einige Teilbilder nicht mehr mitgespeichert werden. Ein zuvor noch
schön gleichmäßig rollender Ball scheint sich nach dieser Frameraten-Reduktion in kleinen
Sprüngen voranzubewegen.
Auch eine Erhöhung dieser Rate bringt keine Qualitätssteigerung für den Clip mit sich. Denn
da im Originalfilm nur 25 Bilder pro Sekunde zur Verfügung stehen, erreicht man mit einer
Framerate von 30 Bildern je Sekunde nur, dass manche Einzelbilder doppelt in der
digitalisierten Sequenz enthalten sind. Dies ist zwar für den Betrachter kaum merkbar, aber
durch die damit verbundene Verschwendung von Speicherplatz auch nicht erstrebenswert.
76
AEIOU UND FILM
Abbildung 39: Auszug aus den Testreihen für das AEIOU-Projekt
Überraschungen boten dagegen einige im Laufe der Testreihen festgestellte Seiteneffekte
dieses Formates. Es zeigte sich zum Beispiel, dass AVI-Clips nicht gleich AVI-Clips sind.
Sequenzen, die mit Adobe Premiere erstellt wurden, werden von einigen zur Konvertierung in
andere Formate vorgesehenen Tools (z.B. XING MPEG-Encoder) nicht als Quelle akzeptiert.
Sind Weiterverarbeitungen in diese Formate geplant, so müssen diese Videos zum Beispiel
mit Miro Vidcap 32 erstellt werden.
Ebenso ist es empfehlenswert, AVI-Clips immer in Stereo aufzunehmen, auch wenn die
Quellvideos nur Mono-Ton enthalten. Denn AVI-Videos, deren Audiospur nur in MonoQualität vorliegt, können erhebliche Tonstörungen bei der Konvertierung in andere Formate
verursachen. Derartige Störungen konnten zum Beispiel bei der Konvertierung von AVI nach
MPEG beobachtet werden.
Doch auch diese kleinen Seiteneffekte ändern nichts an der Tatsache, dass mit Audio Video
Interleave ein äußerst leistungsfähiges Videoformat vorliegt, vor allem, wenn es darum geht,
Videosequenzen in andere Formate weiterzuverarbeiten oder für eine spätere
Weiterverarbeitung zu archivieren.
77
AEIOU UND FILM
Apple QuickTime
Der folgende Abschnitt stellt das Format von Apple Quick Time-Dateien vor. Anschließend
wird die Generierung von Sequenzen im Quick Time-Format und deren Integration in HTMLSeiten behandelt. Danach werden die Stärken und Schwächen dieses Formates näher
Tonqualität kommentiert und die Bedeutung dieses Formates für das Videoalbum des
AEIOU-Projektes bewertet.
4.3
Das Videoformat Apple QuickTime
Ähnlich wie das AVI-Format ist auch Apple QuickTime schon seit längerer Zeit im Einsatz.
Dieses Format wurde ursprünglich, wie aus seinem Namen schon erkennbar ist, für Apple
Macintosh entwickelt. Es ist darauf ausgerichtet, verschiedene Arten von Informationen zu
speichern, die nötig sind, um mit digitalen Medien arbeiten zu können. Da dieses Format
dafür verwendet werden kann, um beinahe jede nur erdenkliche Art von Medienstruktur zu
beschreiben, stellt es ein ideales Format dar, um digitale Medien zwischen einzelnen
Applikationen auszutauschen, ohne dabei Rücksicht auf die dahinterliegende Plattform
nehmen zu müssen.
Eine QuickTime-Datei speichert die Beschreibung der Daten getrennt von den Daten selbst.
Die Beschreibung (Meta-Daten) wird movie genannt und enthält Informationen wie die
Anzahl der Spuren, die Kompressionsart und Timing-Informationen. Ebenso ist im movie
auch ein Index enthalten, der beschreibt, wo sich die Mediendaten befinden. Die Mediendaten
umfassen alle restlichen Daten der Datei wie Videospuren und Audiosamples und können
sowohl in derselben Datei wie die Beschreibung als auch in einer oder mehreren anderen
Dateien gespeichert sein.
QuickTime-Dateien verwenden zwei Basisstrukturen für die Speicherung der Daten: Atome
und QT-Atome. Beide erlauben die Konstruktion einer komplexen, hierarchisch
verschachtelten Datenstruktur. Ebenso ermöglichen es beide, dass Programme jene
Datensegmente ignorieren, die sie nicht verarbeiten können.
Jedes Atom enthält zusätzlich zu den Daten Informationen über seine Größe und seinen Typ.
Dabei gibt die Größe (size) die Anzahl der enthaltenen Bytes inklusive Größe- und TypFelder an. Das Typ-Feld (type) spezifiziert den Datentyp, also das Format, der in der Datei
gespeicherten Daten. Bei beiden Feldern handelt es sich um 32-Bit große Integer-Werte.
Diese Atome können rekursiv aufgebaut sein. Das heißt, ein solches Atom kann mehrere
andere Atome verschiedenen Typs enthalten. Zum Beispiel enthält ein movie-Atom ein
weiteres Atom für jede im Film enthaltene Spur. Diese Spuratome wiederum enthalten je ein
oder mehrere Medienatome zusammen mit anderen Atomen, die Spur- und FilmCharakteristiken definieren.
Das Format der Daten eines solchen Atoms kann allerdings nicht nur auf Basis der TypInformationen bestimmt werden. Denn die Verwendung eines Atoms wird vor allem durch
seinen Kontext bestimmt. So kann ein bestimmtes Atom verschiedene Verwendungszwecke
haben, wenn es in Atomen verschiedenen Typs enthalten ist. Das bedeutet, das beim Lesen
einer QuickTime-Datei nicht nur der Atom-Typ sondern auch die Hierarchie des Atoms
beachtet werden muss.
78
AEIOU UND FILM
Apple QuickTime
Nachfolgende Abbildung 40 zeigt das Layout eines Atoms. Dabei wird ein Atom, das andere
Atome enthält, als Container-Atom (container atom), und ein Atom, das keine weiteren
Atome mehr enthält als Blatt-Atom (leaf atom) bezeichnet. Blatt-Atome enthalten die
Atomdaten im Regelfall in Form von Tabellen. Bei der Verschachtelung von Atomen muss
auf keine bestimmte Reihenfolge geachtet werden. Die einzige Ausnahme bilden hier die
Verarbeitungsbeschreibungen, denn diese müssen bekannt sein, bevor die entsprechenden
Daten verarbeitet werden sollen.
Abbildung 40: Beispiel eines QuickTime-Atoms
Atome bestehen aus einem Kopf (Header), auf den die Daten folgen. Ein derartiger Atomkopf
setzt sich, wie auch in Abbildung 40 zu sehen ist, aus den folgenden Feldern zusammen:
o
o
Atom-Größe (atom size):
Dies ist ein 32-Bit-Integerwert, der die Größe des Atoms inklusive Atomkopf und
Daten angibt. Bei einem Container-Atom umfasst dies die Größen aller enthaltenen
Atome, bei einem Blattatom nur die Größe des Atoms selbst.
Atom-Typ (atom type):
Ein 32-Bit-Integerwert, der den Typ des Atoms anzeigt.
Da die Struktur eines einfachen Atoms beschränkt ist, hat Apple eine erweiterte Datenstruktur
entwickelt, das sogenannte QT-Atom. Diese weist ein allgemeiner verwendbares Format auf
und beseitigt einige der Zweideutigkeiten, die mit einfachen Atomen verbunden sind. Vor
allem gab es bei einfachen Atomen keine Möglichkeit, ohne genaue Kenntnis über das Atom
festzustellen, ob es ein Container-Atom oder ein Blatt-Atom oder gar beides ist. Mit der
Verwendung von QT-Atomen wird ein bestimmter Knoten eindeutig entweder als ContainerAtom oder als Blatt-Atom ausgewiesen. Da QT-Atome eine mächtigere Datenstruktur
darstellen, erfordern sie auch mehr Aufwand in der Datei.
79
AEIOU UND FILM
Apple QuickTime
Das QuickTime-Dateiformat verwendet sowohl einfache als auch QT-Atome. Im
Allgemeinen verwenden neuere Abschnitte des QuickTime-Dateiformates QT-Atome,
während bei älteren Abschnitten einfache Atome zum Einsatz kommen. Abbildung 41 zeigt
den Aufbau eines QT-Atoms.
Abbildung 41: Beispiel eines QT-Atoms
Jedes QT-Atom beginnt mit einem QT-Atom Container-Kopf, auf den das „Wurzel“-Atom
(root atom) folgt. Dessen Typ wird durch den Typ des QT-Atoms bestimmt. Das „Wurzel“Atom enthält alle anderen in der Struktur enthaltenen Atome. Jedes darin enthaltene
80
AEIOU UND FILM
Apple QuickTime
Container-Atom beginnt mit einem QT-Atomkopf, gefolgt vom Inhalt des Atoms. Dies ist
entweder ein weiteres Atom (child atom) oder es sind bereits die Daten des Atoms, jedoch
niemals eine Kombination daraus. Wenn ein Atom Kinder (children) enthält, dann umfasst es
ebenfalls die Daten und eventuell vorhandene Nachfolger dieser Kinder.
Der QT-Atom Container-Kopf besteht aus den folgenden Feldern:
o Reserviert (Reserved):
Ein 10-Byte Element, das auf den Wert 0 gesetzt werden muss.
o Lock Count:
Ein 16-Bit-Integerwert, der ebenfalls 0 enthalten muss.
Jeder QT-Atomkopf enthält nachstehend beschriebene Daten:
o Größe (size):
Dies ist ein 32-Bit-Integerwert, der die Größe des Atoms (in Byte) angibt. Dieser
Wert umfasst sowohl den Atomkopf als auch den Inhalt.
o Typ (type):
Ein 32-Bit-Integerwert, der den Typ des Atoms ausweist. Wenn das aktuelle Atom
nicht die Wurzel selbst ist, dann wird dieser Wert auf ´sean´ gesetzt.
o Atom-ID:
Dieser 32-Bit-Integerwert enthält die eindeutige Identifikationsnummer des Atoms.
Die Wurzel hat immer die ID gleich 1.
Ein 16-Bit-Integerwert, der den Wert 0 enthalten muss.
o Anzahl der Kinder (child count):
Dieses 16-Bit-Feld vom Typ Integer gibt die Anzahl der Child-Atome für das
aktuelle Atom an. Diese Zahl berücksichtigt nur die direkten Nachfolger und wird
nicht rekursiv gezählt. Wenn hier der Wert 0 aufscheint, dann handelt es sich um ein
Blatt-Atom.
Auch diese 32-Bit-Integerfeld muss 0 enthalten.
Die QuickTime-Datei selbst ist nun nur eine Folge von Atomen, ohne bestimmten Regeln, die
Reihenfolge betreffend, zu folgen (siehe Abbildung 42). Jedes einzelne dieser Atome hat
einen bestimmten Atomtyp. Einige dieser Atome werden als Basis-Atomtypen betrachtet.
Diese bilden die Grundstruktur der QuickTime-Datei, in die alle restlichen Atome eingebettet
werden. Tabelle 8 zeigt eine Auflistung der unterstützten Basis-Atomtypen.
Tabelle 8: Auflistung der Basis-Atomtypen des QuickTime-Formates
´free´
´skip´
´mdat´
´pnot´
´moov´
Freier (nicht benutzter) Platz in der Datei
Nicht benutzter Platz in der Datei
Ein Atom dieses Typs enthält die Filmdaten. Im Regelfall können diese
Daten nur unter Verwendung der Film-Ressource verarbeitet werden.
Verweis auf die Daten der Filmvorschau (Preview).
Film-Ressource
81
AEIOU UND FILM
Apple QuickTime
Abbildung 42: Beispiel einer QuickTime-Datei
Dies sollte als kleiner Ausflug in die Theorie, die hinter dem Apple QuickTime-Format steckt
ausreichen. Für weitere Informationen sei der interessierte Leser auf die Beschreibung des
QuickTime-Formates [Apple96], herausgegeben von der Apple Developer Press, verwiesen.
Am Beginn dieses Kapitels wurde auf die Plattform-Unabhängigkeit von Apple QuickTime
hingewiesen. Da im AEIOU-Projekt ausnahmslos Dateien im AVI-Format als Quelle für die
Erzeugung von QuickTime-Clips zur Verfügung standen, bezieht sich die im Folgenden
beschriebene Arbeitsweise auf Windows-Plattformen.
Als Testvideo für dieses Format wurde, wie schon für AVI, der „Kranzltanz“ herangezogen.
82
AEIOU UND FILM
4.3.1
Apple QuickTime
Generierung von Sequenzen im QuickTime-Format
Für die Generierung von Apple QuickTime-Clips gelten dieselben Systemvoraussetzungen
wie sie beim AVI-Format aufgeführt sind, abgesehen davon, dass die Videobearbeitungskarte
und der Videoreplayer nicht mehr benötigt werden. Als Quelle für diese Konvertierung
können AVI-Clips verwendet werden. Liegen diese vor, gliedert sich der Erstellungsprozess
für QuickTime-Clips in folgende Schritte:
•
•
•
•
Der gewünschte AVI-Clip wird in Adobe Premiere über das Menü File/Open geladen.
Er wird dadurch, wie bei der Aufnahme im vorigen Kapitel, in ein eigenes Filmfenster
geladen.
Den Clip mittels Drag and Drop aus dem Filmfenster in das Schnittfenster (siehe
Abbildung 33) ziehen.
Analog zum Schneidevorgang im vorhergehenden Abschnitt 4.2 nun den gelben
Balken über die gesamte Länge des Filmausschnittes ziehen.
Vor dem Start des Konvertierungsvorgangs müssen im entsprechenden Dialog (Menü
MakeMovie, siehe Abbildung 43) folgende Einstellungen getätigt werden (analog zu
den für das Videoalbum im Projekt AEIOU verwendeten Werten):
Abbildung 43: Der Make Movie-Dialog (QuickTime-Format)
o Durch Drücken der Schaltfläche Output Options wird das Eingabefenster für die
Ausgabeeinstellungen geöffnet (Abbildung 44). Als Richtwerte seien die im
Projekt AEIOU verwendeten Werte angegeben.
Output:
Work Area as QuickTime Movie
Video (immer aktiviert):
Size:
160h, 120v, 4:3 Aspect
Type:
Full Size Frame
83
AEIOU UND FILM
Apple QuickTime
Audio (nur bei Sequenzen mit Ton aktiviert):
Rate:
22 kHz (Musik)
11 kHz (Reden)
Format:
16 Bit, Mono
Type:
Uncompressed
Interleave:
1 Second
Abbildung 44: Festlegung der Ausgabeeinstellungen (QuickTime-Format)
o Durch Drücken der Schaltfläche Compression gelangt man zum Dialog
Compression Settings (Abbildung 45). Folgende Werte müssen eingestellt
werden:
Settings for:
QuickTime
Compressor:
Method:
Video
Depth:
Thousands
Quality:
5.00 (High)
Options:
Frames per second: 15
Keyframe every 15 frames
Optimize stills
Special processing (Schaltfläche Settings, Abbildung 37):
Gamma:
1.0
Better Resize:
On
Noise Reduction:
None
Deinterlace:
Off
Cropping:
Off
o Namen der Ausgabedatei eingeben
•
Durch Drücken auf die Schaltfläche Save wird nun der Konvertierungsvorgang
gestartet. Dies kann je nach Länge des Clips einige Minuten dauern (in etwa 15 bis 20
Minuten bei einem Clip mit einer Spieldauer von 30 Sekunden).
84
AEIOU UND FILM
Apple QuickTime
Abbildung 45: Kompressionseinstellungen wählen (QuickTime-Format)
4.3.2
Integration von QuickTime-Sequenzen in eine HTML-Seite
Auch bei Apple QuickTime-Filmclips reicht ein Link auf die am Server gespeicherte
Videodatei aus, um ihn in eine HTML-Seite einzubauen. Nachfolgend ist der entsprechende
Source-Code sowie die dabei erzeugte Web-Seite gezeigt.
<HTML>
<HEAD>
</HEAD>
<BODY>
<TR>
<TD>
</TD>
<TD VALIGN=CENTER>
<TR>
</TD>
</TR>
85
AEIOU UND FILM
Apple QuickTime
<TR>
<TD COLSPAN=5></TD>
</TR>
<TR>
<TD COLSPAN=3></TD>
<TD VALIGN=CENTER>
<A HREF="/aeiou.film.data.film/o503a.mov"><IMG SRC=
</TD>
<A HREF="/aeiou.film.data.film/o503a.mov">QuickTime
(8.3 MB)</A>
</TD>
</TR>
</TABLE>
</TD>
</TR>
</TABLE>
</BODY>
</HTML>
Abbildung 46: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im QuickTime-Format
86
AEIOU UND FILM
4.3.3
Apple QuickTime
Ergebnisse
Wie in Abbildung 46 zu sehen ist, fand das Apple QuickTime-Format im Videoalbum des
AEIOU-Projektes Verwendung. Und dies, obwohl sich dieses Format in allen Belangen als
mittelmäßig erwies. Es traten zwar keinerlei nennenswerte Probleme oder unangenehme
Besonderheiten auf, doch auch in Bezug auf die Qualität trat QuickTime nicht in den
Vordergrund.
Für die Archivierung der erstellten Sequenzen ist aus zwei wichtigen Gründen das im letzten
Kapitel behandelte AVI-Format vorzuziehen: erstens, weil die Bildschärfe und flüssige
Bildfolge bei QuickTime nicht an den Konkurrenten heranreicht und zweitens, weil mit
Ausnahme des RealVideo Encoders kein verbreiteter Konverter eine QuickTime-Quelle
akzeptiert. Somit ist dieses Datenformat auch für eine spätere Weiterverarbeitung ungeeignet.
Da zum Zeitpunkt der Bewertung QuickTime-Player relativ stark verbreitet waren, wurden
diese Clips trotz der erwähnten Nachteile in das Videoalbum aufgenommen. Es war allerdings
eine Reduktion der Qualität und Bildgrösse unerlässlich. Denn ohne entsprechende
Einschränkungen bewegt sich der Platzbedarf eines Apple QuickTime-Filmes in Bereichen,
die nicht zumutbare Wartezeiten beim Abspielen des Clips mit sich bringen. Aus diesem
Grund ist im Interesse einer Optimierung der Ladezeiten eine Senkung der Framerate von 25
fps auf 15 fps erforderlich. Zusätzlich sollte die Bildgröße auf 160x120 Bildpunkte gesetzt
werden, um den Speicherplatzbedarf weiter zu verringern. Falls diese Maßnahmen noch
immer nicht ausreichend sein sollten, besteht noch die Möglichkeit, auch die Audioqualität
durch Absenken der verwendeten Bits/Sample zu vermindern. Damit können akzeptabel
große und im Internet verwendbare Dateien erhalten werden, auch wenn diese keine allzu
hohe Qualität mehr aufweisen.
Nachfolgende Tabelle zeigt ein kurzes Beispiel der Entwicklung der Dateigrößen von
QuickTime-Clips (ausgehend von einer AVI-Quelle) in verschiedenen Qualitätsstufen. Bei
dieser Gegenüberstellung wurde in jeder Stufe die Qualität des Ergebnisvideos verringert,
indem folgende Werte der Reihe nach verändert wurden:
•
•
•
•
•
Framerate von 25 auf 15 fps
Bildgröße von 320x240 auf 240x180 Bildpunkte
Bildgröße von 240x180 auf 160x120 Bildpunkte
Audio-Samplerate von 22.050 auf 11.025 Hz
Audio-Qualität von 16 Bit Stereo auf 8 Bit Mono
87
AEIOU UND FILM
Apple QuickTime
Tabelle 9: Gegenüberstellung AVI-Apple QuickTime
Quellvideo (Spielzeit:
ca. 34 Sekunden)
AVI-Format
Video:
Bildgröße: 320x240 Bildpunkte
Framerate: 25 Frames/Sekunde
Audio:
Kompression: PCM
Sample-Rate: 22.050 Hz
16 Bit/Sample
Stereo
76.343 KB
Ergebnisvideo 1
Apple QuickTime
Video:
Audio:
Kompression: PCM
16 Bit/Sample
Stereo
Apple QuickTime
Video:
Audio:
Kompression: PCM
16 Bit/Sample
Stereo
Apple QuickTime
Video:
Audio:
Kompression: PCM
16 Bit/Sample
Stereo
Apple QuickTime
Video:
Audio:
Kompression: PCM
16 Bit/Sample
Stereo
43.371 KB
Ergebnisvideo 2
Ergebnisvideo 3
Ergebnisvideo 4
88
26.406 KB
17.520 KB
10.278 KB
AEIOU UND FILM
Ergebnisvideo 5
Ergebnisvideo 6
Ergebnisvideo 7
Apple QuickTime
Apple QuickTime
Video:
Audio:
Kompression: PCM
16 Bit/Sample
Stereo
Apple QuickTime
Video:
Audio:
Kompression: PCM
16 Bit/Sample
Mono
Apple QuickTime
Video:
Audio:
Kompression: PCM
8 Bit/Sample
Mono
89
8.782 KB
8.034 KB
7.660 KB
AEIOU UND FILM
Moving Pictures Expert Group
Der folgende Abschnitt gibt einen Einblick in das Format von MPEG-Dateien und behandelt
anschließend die Generierung von Sequenzen im AVI-Format und deren Integration in
HTML-Seiten. Im Anschluss daran werden die Stärken und Schwächen dieses Formates näher
Tonqualität kommentiert. Dabei wird auch die Bedeutung dieses Formates für das
Videoalbum des AEIOU-Projektes bewertet. Die Betrachtungen in diesem Abschnitt betreffen
das Format MPEG1 (im Folgenden als MPEG bezeichnet), da dieses im Gegensatz zu den
übrigen Vertretern dieses Videostandards (z.B. MPEG2 oder MPEG4) eine große Bedeutung
für das AEIOU-Projekt hatte.
4.4
Das Videoformat Moving Pictures Expert Group
MPEG (Moving Pictures Expert Group) lautet der Name des ISO-Komitees, das sich mit der
digitalen Speicherung von Audio- und Videodaten beschäftigt und als Folge davon auch der
Name des Standards, den dieses Komitee hervorgebracht hat. Dieser Standard definiert eine
Bitstream-Repräsentation von synchronisierten digitalen Audio- und Videodaten, die derart
komprimiert sind, dass sie in eine Bandbreite von 1,5 Mbit/Sekunde passen. Diese Bandbreite
korrespondiert zu der Datenlesegeschwindigkeit von CD-ROM und DAT; und ein großes
Verwendungsfeld des MPEG-Formates ist auch die Speicherung von audiovisuellen Daten
auf eben diesen Datenträgern. Außerdem hat MPEG in den vergangenen Jahren auch im
Internet als Standard für Videoclips viel an Boden gewonnen.
Das Ziel bei der Entwicklung dieses Standards war es, einen Kodierungsalgorithmus zu
entwickeln, der einen hohen Grad an Flexibilität aufweist und deshalb in vielen verschiedenen
Anwendungen verwendet werden kann. Um dieses Ziel erreichen zu können, ist ein
bestimmter Teil der Parameter, welche die Charakteristiken des kodierten Bitstreams und der
Decoder beschreiben, bereits im Bitstream selbst enthalten. Das erlaubt zum Beispiel, dass
der Algorithmus für Bilder mit einer Vielzahl an Größen und Seitenverhältnissen angewendet
werden kann.
Da durch diesen Standard ein breites Spektrum der Charakteristiken von Bitstreams
beschrieben werden kann, wurde eine Untermenge dieser Kodierungsparameter, auch
„Constrained Parameters“16 genannt, definiert. Dabei werden zwar einige Parameter auf
bestimmte erlaubte Wertebereiche beschränkt, doch dieser Standard verpflichtet nicht zu der
Einhaltung dieser Einschränkungen. Ein Flag in diesem Bitstream gibt an, ob es sich dabei um
einen Bitstream mit eingeschränkten Parametern handelt oder nicht. Zu dieser „Constrained
Parameters“-Menge gehören folgende Kennwerte:
•
•
•
•
•
•
Horizontale Bildgröße:
Vertikale Bildgröße:
Bildbereich:
Pixelrate:
Bildrate:
Bewegungsvektor –Bereich:
•
•
Inputbuffer-Größe:
Bitrate:
kleiner oder gleich 768 Bildpunkte
kleiner oder gleich 576 Zeilen
kleiner oder gleich 396 Makroblöcke
kleiner oder gleich 396x25 Makroblöcke je Sekunde
kleiner oder gleich 30 Hz
kleiner als ± 64 Pixel (bei Verwendung von HalbpixelVektoren)
kleiner oder gleich 327.680 Bits
kleiner oder gleich 1.856.000 Bits/Sekunde
16
Dies bedeutet, dass die in dieser Untermenge enthaltenen Parameter in ihren erlaubten Werten eingeschränkt
sind.
90
AEIOU UND FILM
Videosequenzen, die in diesem Standard vorliegen, erreichen eine hohe Kompressionsrate
ohne dabei ihre gute Bildqualität einzubüssen. Dieser Algorithmus ist allerdings nicht
verlustfrei, da während der Kodierung nicht die exakten Pixel-Werte beibehalten werden. Die
Wahl der jeweiligen Kodierungstechniken hängt von der Notwendigkeit ab, einen
Kompromiss zwischen hoher Bildqualität und hoher Kompression mit der Anforderung, dass
ein wahlfreier Zugriff auf den Bitstream möglich sein muss, zu finden. Die erste, von diesem
Standard beinahe unabhängige Technik liegt darin, eine geeignete räumliche Auflösung für
das Signal zu finden. Danach vermindert der Algorithmus über Block-basierte
Bewegungskompensation die zeitliche Redundanz. Sowohl für die bedingte Vorhersage des
aktuellen Bildes aus einem vorhergehenden Bild als auch für dessen Interpolation aus einem
vorhergehenden und einem nachfolgenden Bild wird die Bewegungskompensation verwendet.
Dabei werden Bewegungsvektoren für jeden 16x16-Bereich des Bildes definiert. Das
Differenzsignal, das dem Fehler aus der Vorhersage entspricht, wird unter Verwendung der
diskreten Cosinus-Transformation (DCT) weiter komprimiert, um räumliche Korrelationen zu
entfernen, bevor es in einem nicht reversiblen Prozess quantisiert wird. Dieser Prozess
verwirft alle weniger wichtigen Informationen. Zuletzt werden die berechneten
Bewegungsvektoren mit der restlichen DCT-Information kombiniert und mittels variabler
Längencodes übermittelt.
Um den Konflikt zwischen den beiden Anforderungen, wahlfreier Zugriff und effiziente
Komprimierung, lösen zu können, wurden folgende drei Hauptbildarten definiert:
•
Intra-Frames (I-Frames):
I-Frames werden ohne Referenz zu anderen Bildern kodiert. Sie bieten
Einstiegspunkte, an denen die Wiedergabe gestartet werden kann, werden jedoch mit
eher geringer Kompression gespeichert.
• Predicted Frames (P-Frames):
P-Frames werden etwas effizienter kodiert, indem das aktuelle Bild mittels
bewegungskompensierter Vorhersage aus einem vorangegangenen I- oder P-Frame
berechnet wird. P-Frames werden im Allgemeinen für weitere Vorhersage verwendet.
• Bidirectionally-Predicted Frames (B-Frames):
B-Frames weisen den höchsten Kompressionsgrad auf. Sie benötigen jedoch sowohl
vorangegangene
als
auch
nachfolgende
Referenzbilder
für
die
Bewegungskompensation. Derartige Bilder werden nie selbst als Referenz für eine
Vorhersage verwendet.
Die Art und Weise, auf welche diese drei Bildarten innerhalb einer Sequenz angeordnet
werden, ist sehr flexibel und kann durch den Encoder abhängig von den Anforderungen der
geplanten Verwendung gewählt werden. Den Zusammenhang zwischen den einzelnen
Bildarten zeigt Abbildung 47. Für detaillierte Informationen siehe [MPEG97] und [DCT90].
91
AEIOU UND FILM
Abbildung 47: Der Zusammenhang zwischen I-, P- und B-Frames
4.4.1
Generierung von Sequenzen im MPEG-Format
Um Videoclips direkt in MPEG, analog zu dem im Abschnitt 4.2 („Audio Video Interleave“)
beschriebenen Vorgang, aufzunehmen, ist eine spezielle Hardware17 notwendig. Für das
Projekt AEIOU stand eine Optibase MPEG-4000 Encoder-Karte inklusive der dafür
benötigten Software (MPEG Lab Pro 1.10 Beta) sowie eine Optibase PCMotion DecoderKarte zur Verfügung. Der Anschlussplan für diese Komponenten befindet sich im Anhang A.
Sind alle Geräte ordnungsgemäß angeschlossen, sieht der Aufnahmevorgang wie nachfolgend
beschrieben aus.
•
•
Das Programm „MPEG Lab Pro“ aus dem Windows Startmenü aufrufen. Es erscheint
der Hauptbildschirm, der in Abbildung 48 gezeigt wird.
Zu Beginn müssen die Setup-Parameter direkt am Hauptbildschirm eingestellt werden.
Diese Einstellungen werden nur einmal nach jedem Programmstart durchgeführt. Die
entsprechenden Werte, mit Ausnahme des Namens der Ausgabedatei, bleiben also für
alle in einer Sitzung digitalisierten Clips unverändert. Folgende Optionen sind
festzulegen:
o Quelle (source):
Dort wird die Art der Videoquelle gewählt. Wird als Eingabegerät ein
Videorecorder verwendet, so ist der Wert camera einzustellen.
o Zieldatei (output):
Der Name der gewünschten Ausgabedatei stellt den einzigen Parameter in diesem
Bereich dar, der für jeden Clip neu eingegeben werden sollte. Es besteht jedoch
auch die Möglichkeit, immer dieselbe Ausgabedatei zu verwenden und die
fertiggestellten Clips vor einer weiteren Aufnahme zu verschieben bzw.
umzubenennen.
17
1996: Zusätzlich zu einem im Jahr 1996 handelsüblichen Computer war ein Videoplayer und eine eigene
MPEG-Encoder-Karte notwendig.
2000: Zusätzlich zu einem im Jahr 2000 handelsüblichen Computer wird ein Videoplayer benötigt. Eine
eigene Encoder-Karte ist im Allgemeinen nicht mehr erforderlich, da ein großer Teil der erhältlichen
Grafikkarten MPEG-Encoding unterstützt.
92
AEIOU UND FILM
o N, M, GOP:
Mit den 3 Werten N, M und GOP werden die I- (intra), P- (predicted) und B(bidirectional) Frames eingestellt. I-Frames sind dabei Standbilder, die meist alle
10 oder 12 Frames gesendet werden, P-Frames sind die Abweichung vom letzten
I- oder P-Frame, und B-Frames stellen die Interpolation zwischen I- und P-Frames
dar. Als Richtwerte können N=12, M=1 und GOP=N*1 herangezogen werden.
o Quellformat (format):
Bei Verwendung eines S-VHS-Videorecorders als Eingabegerät muss S-Video
und das Format entsprechend den Videokassetten (im europäischen Bereich PAL)
gewählt werden.
Abbildung 48: Ein Blick auf das MPEG Lab Pro
•
Nun ist es notwendig, die Ausgabeparameter (file output parameters) festzulegen. Mit
Ausnahme des Dateityps erfolgen die Eingaben dieser Werte über ein eigenes Fenster
(siehe Abbildung 49), das durch Drücken auf Rate Control geöffnet wird.
o Dateityp (file type):
MPEG-System
o Ziel-Bitrate (target bitrate):
Damit wird die Anzahl der Bits/Sekunde bei der Encodierung festgelegt. Um bei
guter Qualität nicht zu große Ausgabedateien zu erzeugen, sollte die Bitrate auf
150 KB/Sec gesetzt werden.
o Audio Layer II Parameters:
Mit diesem Parameterblock wird die Qualität der Tonspur beeinflusst, indem die
Anzahl der für die Audioaufnahme verwendeten Bits/Sekunde, die Lautstärke, die
93
AEIOU UND FILM
Sampling-Frequenz sowie Mono bzw. Stereo gewählt werden. Mit den unten
angeführten Werten können gute Ergebnisse erzielt werden.
Frequency
44100
MONO
Bitrate
112 (mit Ton)
48 (ohne Ton)
Input Volume
6 (mit Ton)
0 (ohne Ton)
Abbildung 49: Festlegung der Ausgabeparameter
•
Bevor der Aufnahmevorgang gestartet werden kann, muss für das gewünschte Video
noch die Video-Kalibrierung durchgeführt werden. Das dafür notwendige Fenster
erhält man durch Wahl des Punktes Video Preview aus dem Menü Options (Abbildung
50). Folgende Parameter sind für die einzelnen Sequenzen anzupassen.
o Farbton (hue):
Der Bereich für diesen Wert erstreckt sich von –64 bis +63. Die besten Ergebnisse
konnten mit Eingabe des Wertes 0 erzielt werden
o Sättigung (saturation):
Damit wird die Farbsättigung des Ausgabevideos festgelegt. Gültige Werte liegen
zwischen 0 und 127.
o Kontrast (contrast):
Mit diesem Parameter wird die Stärke des Hell-/Dunkel-Kontrastes im Bereich 0
bis 127 gewählt.
94
AEIOU UND FILM
o Helligkeit (brightness):
Die Helligkeit der Videosequenz kann durch Veränderung dieses Punktes geregelt
werden. Der dafür vorgesehene Bereich erstreckt sich von –64 (dunkel) bis +63
(hell)
o Horizontale Bildverschiebung (horizontal offset):
Bei der Aufnahme können horizontale Verschiebungen auftreten. Um diesem
Effekt entgegenzuwirken, besteht die Möglichkeit, einen Offset zwischen –45 und
+30 einzugeben. Negative Werte bedeuten eine Verschiebung nach rechts,
positive Werte entsprechend nach links.
o Vertikale Bildverschiebung (vertical offset):
Zusätzlich zu den horizontalen Verschiebungen können auch solche in vertikaler
Richtung auftreten. Der vertikale Offset kann in der Datei „Optibase.ini“
eingegeben werden. Diese Eingabe muss vor dem Start von MPEG Lab Pro
erfolgen, da sie andernfalls keine Auswirkung auf die erstellten MPEG-Clips hat.
Negative Werte bewirken eine Verschiebung nach unten, positive Werte eine
Verschiebung nach oben.
Abbildung 50: Kalibrierung der Videoquelle
•
Damit sind alle nötigen Voreinstellungen getroffen und die Aufnahme kann
durchgeführt werden. Dies geschieht so:
o Schaltfläche Start Encoding drücken. Das Encoding-Fenster wird geöffnet (siehe
Abbildung 51).
95
AEIOU UND FILM
o Nach Starten der Wiedergabe am Videorecorder zu Beginn der gewünschten
Sequenz die Schaltfläche Start drücken.
o Am Ende der Sequenz wird die Aufnahme mit Stop beendet.
Abbildung 51: Das Encoding-Fenster
4.4.2
Integration von MPEG-Sequenzen in eine HTML-Seite
Die Handhabung von MPEG-Clips unterscheidet sich nach der Konvertierung nicht von der
bereits bekannten Vorgehensweise. Durch Einfügen eines Links auf die Videodatei wird diese
den Internet-Surfern zugänglich gemacht, womit die HTML-Seite folgenden Quellcode und
das in Abbildung 52 gezeigte Aussehen erhält:
<HTML>
<HEAD>
</HEAD>
<BODY>
<TR>
<TD>
</TD>
<TD VALIGN=CENTER>
<TR>
</TD>
</TR>
<TR>
<TD COLSPAN=5></TD>
</TR>
<TR>
<TD VALIGN=CENTER>
96
AEIOU UND FILM
<A HREF="/aeiou.film.data.film/o503a.mpg"><IMG SRC=
</TD>
<A HREF="/aeiou.film.data.film/o503a.mpg">MPEG
(5.4 MB)</A>
<TD></TD>
<TD VALIGN=CENTER>
<A HREF="/aeiou.film.data.film/o503a.mov"><IMG SRC=
</TD>
<A HREF="/aeiou.film.data.film/o503a.mov">QuickTime
(8.3 MB)</A>
</TD>
</TR>
</TABLE>
</TD>
</TR>
</TABLE>
</BODY>
</HTML>
Abbildung 52: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im MPEG-Format
97
AEIOU UND FILM
4.4.3
Ergebnisse
Das wohl leistungsstärkste und vielversprechendste Videoformat präsentiert sich mit Moving
Pictures Expert Group (MPEG). Für dieses Format bleiben als Nachteile nur 3 Punkte zu
nennen:
• Erstens die Notwendigkeit einer speziellen Ausrüstung zur Gewährleistung von
Aufnahme in Echtzeit.
• Zweitens der Umstand, dass MPEG-Clips nicht nachträglich editiert werden
können. Dadurch gerät auch die Erstellung derartiger Clips zu einer kleinen
Odyssee, da man bei der Aufnahme zum richtigen Zeitpunkt Start bzw. Stop
drücken muss. Werden diese Zeitpunkte verpasst, so ist eine Neuaufnahme der
Sequenz erforderlich.
• Drittens wird durch MPEG kein Streaming unterstützt.
In allen anderen Bereichen kann das MPEG-Format als Referenz und Vorbild herangezogen
werden. Es überzeugt durch bestechende Bildqualität und flüssige Bildfolge. Dabei gelingt es
in diesem Format, gegenüber dem qualitativ vergleichbaren Audio Video Interleave, eine
deutliche Reduktion des erforderlichen Speicherplatzes und damit auch der Wartezeiten beim
Download entsprechender Videoclips zu erzielen. Etwa werden für einen 30-Sekunden-Clip
nicht mehr 50 MB oder darüber verbraucht, sondern nur noch etwas mehr als 5 MB.
Außerdem gibt MPEG durch die ständig vorangetriebenen Neuentwicklungen auch das
Versprechen für die Zukunft ab, dass es nicht so schnell in der Versenkung verschwinden
wird. Aus diesem Grund bleibt auch noch die Hoffnung, dass vielleicht auch StreamingMedia mit MPEG realisiert werden kann.
98
AEIOU UND FILM
Real Video
Nach einer kurzen allgemeinen Betrachtung des Real Video-Formates wird im folgenden
Abschnitt die Generierung von Sequenzen im Real Video-Format und deren Integration in
HTML-Seiten behandelt. In der Folge werden die Stärken und Schwächen dieses Formates
erläutert und die in den Untersuchungen erzielten Ergebnisse bezüglich Kompression und
Tonqualität kommentiert.
4.5
Das Videoformat Real Video
Zeitkritische Daten stellen für herkömmliche Lösungsansätze nicht nur im Audiobereich,
sondern auch im Videobereich Probleme dar. Aus diesem Grund ist Video-On-Demand mit
diesen Ansätzen nicht realisierbar. Im Zuge ihrer Neuentwicklung im Audiobereich
versuchten Real Networks auch auf dem Videosektor einen anderen Weg zu gehen und
entwickelten in den Jahren 1994 und 1995 neben dem Real Audio Protokoll das damit
verwandte Real Video Protokoll. Aus dieser Ähnlichkeit ergeben sich gegenüber den bis
dahin bestehenden Technologien dieselben Vorteile, die das Real Audio Protokoll gegenüber
seinen Konkurrenten aufweist (siehe auch Abschnitt 3.3, Real Audio): bidirektionale
Kommunikation zwischen Client und Server wird unterstützt.
Doch nicht nur in der verwendeten Technologie kann von einer Verwandtschaft zwischen
Real Audio und Real Video gesprochen werden, sondern auch in Bezug auf Auskünfte über
den Hintergrund dieser Verfahren. Deshalb kann im Folgenden nur gezeigt werden, wie mit
diesem Format umgegangen werden muss und welche Ergebnisse damit erzielbar sind.
4.5.1
Generierung von Sequenzen im Real Video-Format
Real Networks stellt für die Generierung von Real Video-Dateien den Real Video Encoder
zur Verfügung. In der Version 3.0 (für Windows 95, Windows NT und auch für Macintosh
Power PC’s) begnügt sich der Encoder noch immer mit einem Pentium 90, 16 MB
Hauptspeicher und einer 16 Bit Soundkarte. Die Verwendung eines schnelleren Rechners mit
etwas mehr Hauptspeicher ist jedoch vorteilhaft, da es die Konvertierungszeiten positiv
beeinflussen kann.
Als Quelle unterstützt der Real Video-Encoder Dateien, die im AVI- oder im Apple
QuickTime-Format vorliegen. Es werden sowohl komprimierte als auch unkomprimierte
AVI-Videos akzeptiert; Unkomprimierte Dateien sind dabei vorzuziehen, da mit ihnen die
qualitativ besseren Ergebnisse erzielt werden können. Zusätzlich müssen noch folgende
Voraussetzungen durch die Dateien im AVI-Format erfüllt werden:
•
•
•
Die Farbtiefe muss 24 Bit betragen
Sowohl die Höhe als auch die Breite des Bildes muss durch 16 teilbar sein. Die einzige
Ausnahme bilden hier die Bildabmessungen von 160x120, die durch den Encoder
ebenfalls unterstützt werden.
Die passenden Indeo-Videotreiber müssen auf dem verwendeten Rechner installiert
sein.
Etwas stärker eingeschränkt ist die Auswahl bei den unterstützten QuickTime-Clips. Diese
dürfen nur in unkomprimierter Form verwendet werden: Außerdem gilt ebenfalls die
99
AEIOU UND FILM
Real Video
Einschränkung auf eine Farbtiefe von 24 Bit. In Bezug auf die Tonspur ist es unbedeutend, ob
es sich um 8- oder 16-Bit Audio in Mono oder Stereo handelt.
Ausgehend von den zuvor angeführten Dateien können Real Video-Filme erzeugt werden,
indem der nachstehende Arbeitsablauf eingehalten wird:
•
•
•
•
•
•
Real Video Encoder über das Windows Startmenü starten. Der Konverter präsentiert
sich mit der in Abbildung 53 gezeigten Ansicht.
Zuerst muss die Encoding-Sitzung gestartet und konfiguriert werden. Dazu ist der
Punkt Open Session aus dem Menü File zu wählen. Der in Abbildung 54 gezeigte
Dialog wird geöffnet.
Nachdem in diesem Dialog als Quelle (Source) eine Datei (File) gewählt wurde, kann
durch Drücken auf die Schaltfläche Add der Ausgangsclip ausgewählt werden.
Anschließend wird über den Button Select der Ausgabepfad festgelegt.
Mit OK kehrt man wieder in das Hauptfenster zurück, wo nun die Möglichkeit besteht,
eines der Konvertierungstemplates als Parameter zu übernehmen. Diese von Real
Networks bereitgestellten Vorlagen werden zu einem späteren Zeitpunkt noch
vorgestellt. Fortgeschrittenen Benutzern wird auch angeboten, über Anwahl des
Punktes Advanced eine bestehende Vorlage zu verändern oder sogar eigene Templates
zu entwerfen. Das entsprechende Eingabefenster ist in Abbildung 55 zu sehen.
Gestartet wird der Konvertierungsvorgang durch Betätigung der Schaltfläche Start.
Die Dauer der Konvertierung ist von der Länge des Eingabevideos und der gewählten
Ausgabequalität abhängig.
Abbildung 53: Der Real Video Encoder
100
AEIOU UND FILM
Real Video
Abbildung 54: Wahl der Eingabe- und der Ausgabedatei
Abbildung 55: Erweiterte Einstellungen für die Konvertierung
101
AEIOU UND FILM
4.5.2
Real Video
Integration von Real Video-Sequenzen in eine HTML-Seite
Bereits in Abschnitt 3.3 (Real Audio) wurde die Vorgehensweise bei Real Media-Dateien
erklärt, die für die Unterstützung von Life-Streaming nötig ist. Dabei darf nämlich der Link
nicht direkt auf die Videodatei gelegt werden, sondern auf ein Real Media-Metafile, welches
wiederum den Link auf die Videodatei selbst enthält (siehe nachstehendes Beispiel und
Abbildung 56). Will man kein Life-Streaming ermöglichen, kann der Link, analog zu AVI
oder QuickTime, auch direkt auf den Clip gesetzt werden.
<HTML>
<HEAD>
</HEAD>
<BODY>
<TR>
<TD>
</TD>
<TD VALIGN=CENTER>
<TR>
</TD>
</TR>
<TR>
<TD VALIGN=CENTER>
<A HREF="/aeiou.film.data.film/o503a.rm"><IMG SRC=
</TD>
<A HREF="/aeiou.film.data.film/o503a.rm">Real Video
(355 KB)</A>
</TD>
</TR>
</TABLE>
</TD>
</TR>
</TABLE>
</BODY>
</HTML>
Die Datei “o503a.rm”, auf die der HREF-Link gesetzt ist, besteht nur aus einer Zeile, in der
die virtuelle Adresse der entsprechenden Sounddatei angegeben ist:
http://www.aeiou.at/aeiou/o503a.rv
102
AEIOU UND FILM
Real Video
Abbildung 56: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im RealVideo-Format
4.5.3
Ergebnisse
Ebenso wie ein Real Audio-Clip kann auch eine Real Video-Datei abgespielt werden, ohne
dass sie zuvor vollständig auf den lokalen Datenträger geladen werden muss (Life-Streaming,
siehe Kapitel 3.3.2). Um dieses Feature nutzen zu können, müssen folgende wichtige
Voraussetzungen erfüllt werden:
•
Erstens muss für die Videoclips bereits bei der Aufnahme festgelegt werden, für
welche Internet-Anbindung des Konsumenten sie vorgesehen sind. Denn die
verfügbare Übertragungsrate bestimmt, wie viel der Datei vor dem Beginn der
Wiedergabe geladen werden muss, um diese danach ohne Unterbrechungen
gewährleisten zu können. Eine Aufstellung der von Real Networks für die Aufnahme
zur Verfügung gestellten Vorlagen (Templates) ist in Tabelle 10 zu sehen. Die
verwendeten Parameter seien hier kurz erklärt:
o Ziel-Bandbreite:
Übertragungsrate, bei welcher Life-Streaming genützt werden kann.
o Audio-Bitrate:
Anzahl der Bits pro Sekunde, die zur Speicherung der Audiodaten verwendet
werden.
o Video-Bitrate:
Anzahl der Bits pro Sekunde, die zur Speicherung der Videodaten verwendet
werden.
o Gesamt-Bitrate:
Anzahl der Bits pro Sekunde, die zur Speicherung der gesamten Daten
verwendet werden.
103
AEIOU UND FILM
Real Video
o Videoqualität:
Gewichtung zwischen Bildschärfe (100) und flüssiger Bildabfolge (10).
o Framerate:
Gibt die Anzahl der verwendeten Einzelbilder pro Sekunde an.
•
Zweitens ist es notwendig, die Clips auf einem eigenen Real Video-Server
bereitzustellen. Da für das AEIOU-Projekt ausschließlich kurze Videoclips verwendet
wurden, konnte auf den Einsatz eines eigenen Real Video-Servers verzichtet werden.
Tabelle 10: Real Video Aufnahmevorlagen
Name des Templates
High Action (Fractal) with Music
High Action 56 with Music
High Action 56 with Voice
Music Video 56,
Emphasize Audio
Music Video 56,
Emphasize Video
Talking Heads 56
High Action (Fractal) with Voice
High Action 28.8 with Music
High Action 28.8 with Voice
Music Video 28.8,
Emphasize Audio
Music Video 28.8,
Emphasize Video
Talking Heads 28.8
ZielBandbreite
AudioBitrate
(Kbps)
VideoBitrate
(Kbps)
Gesamt- Video- Framerate
Bitrate Qualität
(fps)
(Kbps)
112,0
56,0
56,0
56,0
12
16
8
16
78
29
36,5
29
90
45
45
45
70
100
100
100
15
7,5
7,5
7,5
56,0
12
33
45
100
7,5
56,0
28,8
28,8
28,8
28,8
8,5
8,5
8
6,5
12
36,5
36,5
11,0
12,5
7
45
45
19
19
19
100
70
100
100
100
7,5
10
0,25
0,25
0,25
28,8
8
11
19
100
0,25
28,8
6,5
12,5
19
100
7,5
Im Gegensatz zu den in den vorangegangenen Abschnitten behandelten Formaten zeichnet
sich Real Video durch geringen Speicherplatzbedarf aus. Benötigte eine 30 Sekunden lange
Sequenz im AVI-Format noch ungefähr 50 MB und mit Apple QuickTime noch immer 6 MB,
so begnügt sich Real Video mit weniger als 500 KB. Dies bringt den Vorteil mit sich, dass die
Download-Zeiten merklich gesenkt werden.
Die hohen Kompressionsraten sind leider nicht nur vorteilhaft, denn es ist nötig, in anderen
Bereichen Abstriche zu machen, um sie erreichen zu können. Die Qualität der erstellten
Videos hat dadurch sehr große Verluste erlitten und ist mit jener der Konkurrenten nicht mehr
vergleichbar. Mit den vorgegebenen Einstellungen ist es nicht möglich, einen guten
Kompromiss zwischen Bildschärfe und flüssiger Bildabfolge zu erzielen. Zwar besteht die
Möglichkeit, diese Einstellungen abzuändern, doch auch dann ist die erzielte Qualität nicht
zufriedenstellend. Der Grund dafür liegt darin, dass nur die Bitraten für Audio und Video
beinahe ohne Einschränkungen erhöht werden können, nicht jedoch die Anzahl der
Einzelbilder pro Sekunde (Framerate). Letztere ist mit 15 fps (Frames per Second)
beschränkt.
Durch Erhöhung der Audio- und Video-Bitraten können die Bildschärfe und die Klangqualität
auf ein akzeptables Niveau gehoben werden. Damit verbunden ist allerdings ein Anstieg des
Bedarfs an Speicherplatz. Eine entsprechende Erhöhung der verwendeten Framerate würde
104
eine flüssigere Bildfolge bewirken. Doch für eine ruckelfreie Bewegung sind 15 Bilder pro
Sekunde, verglichen mit der bei einer Fernsehübertragung verwendeten Framerate von 25 fps,
einfach zu wenig. Deshalb vermitteln Real Video-Clips, vor allem bei einer Bevorzugung der
Bildschärfe, eher den Eindruck einer Dia-Show als eines Videos.
Auch die Konvertierungsdauer in den höheren, oder besser gesagt, in den gerade noch
annehmbaren, Qualitätsstufen ist als Nachteil zu werten. Denn bei Verwendung von fraktaler
Kompression, wobei die besten Ergebnisse erzielt werden, weist der Konvertierungsvorgang
einer 34 Sekunden langen Videosequenz auf einem Pentium 133 eine Laufzeit von 6 Stunden
und 20 Minuten auf. Im Vergleich dazu ist die Konvertierung von AVI in Apple QuickTime
für dieselbe Sequenz in nur 8 Minuten abgeschlossen.
Einige Jahre nach Abschluss dieser Untersuchungen wurde Real Video um das sogenannte
„SureStream“ erweitert. Dabei muss nicht mehr für jede gewünschte Übertragungsrate eine
eigene Mediendatei erstellt werden, sondern es wird eine gemeinsame Datei generiert, die
mehrere gewünschte Internetanbindungen (z.B. Modem 28.8 und LAN) unterstützt. Wenn der
Benutzer auf die am Server abgelegte Datei zugreift, dann berechnet der Real Video-Server,
welche Datenübertragungsrate dem Benutzer zur Verfügung steht und passt die Qualität und
die Vorladezeit für den gewählten Clip automatisch an. Das heißt, dem Benutzer wird aus der
Datei jene Spur übertragen, deren Anforderungen an die Verbindung durch die
Übertragungsrate auf den PC des Benutzers erfüllt werden.
Zusammenfassend musste festgestellt werden, dass Real Video die gesetzten Erwartungen
leider nicht erfüllen konnte. Aus den oben genannten Gründen wurde dieses Format auch im
Videoalbum des Projektes AEIOU nicht eingesetzt. Bleibt also nur die Hoffnung auf eine
Verbesserung der grundsätzlich guten Ansätze.
105
AEIOU UND FILM
Vivo Active
Der folgende Abschnitt zeigt nach einer kurzen Vorstellung des Vivo Active-Formates die
Erzeugung von Sequenzen im Vivo Active-Format und deren Integration in HTML-Seiten. Im
Anschluss daran werden die Stärken und Schwächen dieses Formates näher beleuchtet, die in
den Untersuchungen erzielten Ergebnisse bezüglich Kompression und Tonqualität
kommentiert und die Bedeutung dieses Formates für das Videoalbum des AEIOU-Projektes
bewertet.
4.6
Das Videoformat Vivo Active
Ständig wachsende Konkurrenz bedingt auch im Videobereich für neue Formate die
Notwendigkeit: alle besonderen Funktionen der etablierten Konkurrenten anbieten und
teilweise sogar übertreffen zu müssen. Das von Vivo Software entwickelte VivoActiveFormat wurde schon teilweise in Abschnitt 3.4 behandelt, da es als kombiniertes Format die
Erstellung sowohl von reinen Audiodateien als auch von Videodateien unterstützt. Im
Folgenden werden nur noch jene Punkte behandelt, die sich in der Erstellung und Behandlung
der Dateien im Vergleich zu VivoActive Audio unterscheiden.
4.6.1
Generierung von Sequenzen im Vivo Active-Format
Im Zusammenhang mit der Generierung von VivoActive Audio-Clips wurde bereits der von
VivoSoftware entwickelte VivoActive Producer 2.0 vorgestellt. Dieser ist nicht nur in der
Lage, Audiodateien im Waveform-Format zu verarbeiten, sondern auch Videoclips im AVIFormat nach VivoActive zu konvertieren. Da für beides dasselbe Werkzeug verwendet
werden kann, unterscheiden sich die Voraussetzungen für die Erstellung von Audioclips und
Videoclips nicht.
Das dafür nötige Quellformat unterliegt denselben Auflagen, wie sie bereits für RealVideo
aufgezeigt wurden. Die Bildabmessungen der Ausgangsfilme im AVI-Format müssen durch
16 teilbar sind, wobei die Bildgröße 160x120 eine Ausnahme bildet. Was die Farbtiefe
betrifft, so wird eine 24 Bit-Auflösung verlangt. In Bezug auf die enthaltene Tonspur sind
keine Einschränkungen einzuhalten, sowohl 8 als auch 16 Bit in Mono und Stereo werden
unterstützt. Mit den geeigneten Dateien als Quelle erhält man VivoActive Videoclips nach
Durchführung der im Anschluss aufgelisteten Punkte.
•
•
•
Der VivoActive Producer wird über das Windows Startmenü gestartet. Das
Hauptfenster der Anwendung ist in Abbildung 9 zu sehen.
Über die Schaltfläche Add Movie können nun ein oder auch mehrere Eingabedateien
im *.avi-Format geöffnet werden.
Durch Markieren einer Quelldatei und anschließenden Klick auf die Schaltfläche
Setting (oder auch über das Menü Settings/Select) eine der vorhandenen ParameterDateien wählen. Diese Dateien enthalten alle für die Konvertierung benötigten
Einstellungen wie zum Beispiel die gewünschte Tonqualität oder die für Streaming
erforderliche Internet-Anbindung. Falls keine geeignete Parameterkombination
angeboten wird, besteht die Möglichkeit, eine bestehende Datei zu editieren oder eine
neue Parameterdatei zu erstellen. Dazu geht man wie folgt vor:
o Für das Editieren einer Konfiguration den Menüpunkt Settings/Edit wählen und
im angezeigten Fenster (siehe Abbildung 10) die abzuändernde Kombination
auswählen; für das Hinzufügen einer Datei den Menupunkt Settings/Add wählen.
106
AEIOU UND FILM
•
Vivo Active
o In beiden Fällen gelangt man zu dem in Abbildung 11 gezeigten Fenster. In
diesem können alle gewünschten Werte geändert und die Datei gespeichert
werden.
Nachdem alle erforderlichen Einstellungen gemacht wurden, werden durch Drücken
auf Generate All alle oder durch Drücken auf Generate Selected nur die ausgewählten
Eingabedateien bearbeitet.
Abbildung 57: Der VivoActive-Producer v2.0 (Video)
4.6.2
Integration von Vivo Active-Sequenzen in HTML-Seiten
Wie bei der reinen Audioversion reicht auch bei der Verwendung von VivoActive Videoclips
im Internet die Angabe eines einfachen Links auf die Filmdatei nicht aus, da bei Verwendung
eines solchen Links die korrekte Funktion der Wiedergabe nicht immer gewährleistet werden
kann. Zum Abbruch des Abspielvorganges kommt es vor allem bei Sequenzen, die mehr als
10 Sekunden Spielzeit haben. Dieses Problem wird gelöst, indem die gewünschten Videoclips
nicht mehr direkt als Link angeboten werden, sondern über den Umweg über eine eigene
HTML-Seite, in der die gewünschte Datei als Objekt eingebettet ist, wie dies im Folgenden
Beispiel gezeigt wird. Der erste Teil des angeführten Beispiels zeigt die referenzierende
HTML-Seite (siehe Abbildung 58) sowie den zugehörigen HTML-Code. Danach wird
gezeigt, wie jene Seite, die das Vivo Active-Videoobjekt enthält (siehe Abbildung 59),
erzeugt wird.
107
AEIOU UND FILM
Vivo Active
<HTML>
<HEAD>
</HEAD>
<BODY>
<TR>
<TD>
</TD>
<TD VALIGN=CENTER>
<TR>
</TD>
</TR>
<TR>
<TD VALIGN=CENTER>
<A HREF="/aeiou.film.data.film/o503a_viv.htm">
<IMG SRC= "/aeiou.film.data.image.general/movie_ton.gif"
BORDER=0></A>
</TD>
<A HREF="/aeiou.film.data.film/o503a_viv.htm">
Vorschau (VivoActive, 244 KB)
</A>
</TD>
</TR>
<TR>
<TD VALIGN=CENTER>
<A HREF="/aeiou.film.data.film/o503a.mpg">
<IMG SRC="/aeiou.film.data.image.general/movie_ton.gif"
BORDER=0></A>
</TD>
<A HREF="/aeiou.film.data.film/o503a.mpg">
MPEG (5.4 MB)
</A>
<TD></TD>
<TD VALIGN=CENTER>
<A HREF="/aeiou.film.data.film/o503a.mov">
<IMG SRC= "/aeiou.film.data.image.general/movie_ton.gif"
BORDER=0></A>
</TD>
<A HREF="/aeiou.film.data.film/o503a.mov">
QuickTime (8.3 MB)
</A>
</TD>
</TR>
108
AEIOU UND FILM
Vivo Active
</TABLE>
</TD>
</TR>
</TABLE>
</BODY>
</HTML>
Abbildung 58: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im VivoActive-Format
<HTML>
<HEAD>
<TITLE>o503a.viv</TITLE>
</HEAD>
<BODY>
<TR>
<TD>
<OBJECT CLASSID="clsid:02466323-75ed-11cf-a2670020af2546ea" Width=240 Height=180 CODEBASE =
"http://player.vivo.com/ie/vvweb.cab#Version=2,0,0,0">
<PARAM NAME="URL" VALUE="/aeiou.film.data.film/o503a.viv">
<PARAM NAME="AUTOSTART" VALUE="true">
<PARAM NAME="VIDEOCONTROLS" VALUE="on">
<EMBED SRC="/aeiou.film.data.film/o503a.viv " PLUGINSPACE =
"http://www.vivo.com/dldv2/cgi-bin/dldform.cgi" TYPE =
"video/vnd.vivo" AUTOSTART="true" VIDEOCONTROLS="on"
WIDTH=240 HEIGHT=180>
109
AEIOU UND FILM
Vivo Active
</EMBED>
</OBJECT>
</TR>
</TABLE>
</BODY>
</HTML>
Abbildung 59: HTML-Seite aus dem Videoalbum mit dem "Kranzltanz" als VivoActive-Objekt
4.6.3
Ergebnisse
Qualitativ kann VivoActive auch im Videobereich nicht immer überzeugen. Abgesehen
davon, dass Real Video eine höhere Tonqualität aufweist, ist auch in punkto Bildschärfe der
direkte Konkurrent vorzuziehen. Dies liegt vor allem daran, dass bei VivoActive keine
Möglichkeit besteht, die Videobitrate zu verändern. Dafür sind bei VivoActive die
Bildabmessungen, also Bildbreite und Bildhöhe, direkt einstellbar. Das bedeutet, dass die
Ergebnisvideos in ihren Abmessungen unabhängig von den verwendeten Quellsequenzen sind
und gegenüber diesen sowohl verkleinert als auch vergrößert werden können. Von einer
Vergrößerung sollte jedoch im Hinblick auf den damit verbundenen Verlust an Bildschärfe
abgesehen werden. Zusätzlich bietet VivoActive noch ein etwas breiteres Spektrum bei der
Wahl der Framerate. Es gilt hier nicht dieselbe Beschränkung auf 15 Bilder pro Sekunde,
sondern es können Werte zwischen 1 und 30 Bildern pro Sekunde gewählt werden. Damit ist
eine deutlich flüssigere Bildfolge realisierbar, vorausgesetzt dass die Quelldatei ebenfalls eine
entsprechend hohe oder noch höhere Framerate aufweist. Andernfalls bringt eine Erhöhung
dieses Wertes keinerlei Verbesserung.
Werden die erzielten Kompressionsraten von Real Video und VivoActive verglichen, können
kaum Unterschiede festgestellt werden. Bei ähnlicher Bildqualität sind auch die
110
AEIOU UND FILM
Vivo Active
resultierenden Dateien annähernd gleich groß, wobei die Konvertierungszeiten bei
VivoActive erheblich besser sind. Denn während Real Video für manche Konvertierungen
mehr als 6 Stunden benötigt, wird dieser Vorgang bei VivoActive in ungefähr der doppelten
Laufzeit der Videosequenz durchgeführt. Auffallend ist, dass im Gegensatz zu Real Video
oder VivoActive Audio die Kompressionsraten nicht nur von den eingestellten Parametern
bestimmt werden, sondern auch durch die Beschaffenheit der Videosequenz. Enthält eine
Videosequenz wie bei Quellvideo 2 aus Tabelle 11 viel Bewegung und damit auch mehr
Veränderungen der einzelnen Farbwerte von einem Einzelbild zum darauffolgenden, dann
wird dafür trotz geringerer Qualität und kleineren Bildabmessungen deutlich mehr
Speicherplatz verbraucht.
Tabelle 11: Gegenüberstellung AVI-VivoActive
Quellvideo 1
(Spielzeit: ca. 20
Sekunden)
AVI-Format
Video:
Audio:
Kompression: PCM
16 Bit/Sample
Stereo
27.409 KB
Ergebnisvideo 1.1
VivoActive-Format
Client Connection Type:
T1 (108 kbps)
Video:
Audio:
VivoActive-Format
ISDN (54 kbps)
Video:
Audio:
Voice quality (6.4 kbps)
VivoActive-Format
ISDN (54 kbps)
Video:
Audio:
270 KB
Ergebnisvideo 1.2
Ergebnisvideo 1.3
111
142 KB
137 KB
AEIOU UND FILM
Ergebnisvideo 1.4
Vivo Active
VivoActive-Format
ISDN (54 kbps)
Video:
Audio:
VivoActive-Format
Modem 28.8 (28.8 kbps)
Video:
Audio:
138 KB
Quellvideo 2
(Spielzeit: ca. 33
Sekunden)
AVI-Format
Video:
Audio:
Kompression: PCM
8 Bit/Sample
Mono
4.848 KB
Ergebnisvideo 2.1
VivoActive-Format
T1 (108 kbps)
Video:
Audio:
VivoActive-Format
ISDN (54 kbps)
Video:
Audio:
439 KB
Ergebnisvideo 1.5
Ergebnisvideo 2.2
112
59 KB
227 KB
AEIOU UND FILM
Ergebnisvideo 2.3
Ergebnisvideo 2.4
Ergebnisvideo 2.5
Vivo Active
VivoActive-Format
ISDN (54 kbps)
Video:
Audio:
VivoActive-Format
ISDN (54 kbps)
Video:
Audio:
VivoActive-Format
Modem 28.8 (28.8 kbps)
Video:
Audio:
227 KB
228 KB
92 KB
Durch den vergleichsweise geringen Speicherplatzbedarf und den Vorteil, dass LifeStreaming auch auf den herkömmlichen Web-Architekturen realisiert werden kann, empfiehlt
sich VivoActive als Vorschau (Preview) auf das eigentliche Video, das in einem qualitativ
besseren Format auf dem Server abgelegt wird. In dieser Form findet die VivoActive-Version
der einzelnen Videosequenzen auch im Projekt AEIOU ihre Anwendung. Für jegliche andere
Verwendung ist dieses Format aufgrund der doch sehr schwachen Qualität nicht unbedingt als
erste Wahl zu betrachten.
113
Anhänge
Anhänge
ANHÄNGE
Anschlusspläne
Anhang A: Anschlusspläne
Abbildung 60: Anschlussplan für die Aufnahme im AVI-Format
Verbindung
Anschluss 1
Anschluss 2
Kabel 1
Kabel 2
Kabel 3
Kabel 4
VCR S-Video Out (S-VHS)
VCR Audio Out (Doppel-Cinch)
VCR Scart
Soundkarte Speakers (Stereo Klinke 3,5 mm)
Miro DC 20 S-Video In (S-VHS)
Soundkarte Line In (Stereo Klinke 3,5 mm)
Monitor Scart
Kopfhörer / Lautsprecher
115
ANHÄNGE
Anschlusspläne
Abbildung 61: Anschlussplan für die Aufnahme im MPEG-Format
Verbindung
Anschluss 1
Kabel 1
Kabel 2
VCR S-Video Out (S-VHS)
VCR Audio Out (Doppel-Cinch)
Kabel 3
Kabel 4
Anschluss 2
MPEG 4000 S-Video In (S-VHS)
PC Motion Pro Audio In (Stereo Klinke 3,5
mm)
PC Motion S-Video Out (S-VHS)
Monitor Scart (Adapter nötig)
PC Motion Audio Out (Stereo Klinke 3,5 mm) Kopfhörer / Lautsprecher
116
ANHÄNGE
Kennwert-Tabellen
Anhang B: Kennwert-Tabellen
Kennwerte für die Aufnahme im AVI-Format
Sequenzen der AVL (1 Kassette):
AVL - 1
Film
Dauer
Helligkeit
Kontrast
Sättigung
a001a
25:20
170
145
115
Ton
Sample-Rate
22 kHz
Sequenzen des österreichischen Filmarchivs Laxenburg (7 Kassetten):
ÖFA - 1
Film
Dauer
Helligkeit
Kontrast
Sättigung
f001a
f001b
f005a
f006a
f007a
f008a
f009a
f010a
f011a
f012a
f014a
f015a
f016a
f018a
f019a
f019b
f020a
f021a
f022a
f024a
f025a
28:28
23:19
11:17
21:10
15:10
17:17
23:04
28:18
24:25
18:06
23:27
22:26
22:10
34:09
30:20
22:06
20:29
25:13
29:60
23:11
28:07
155
130
130
150
135
130
145
140
135
150
150
145
150
145
130
155
135
160
165
135
150
120
135
150
145
145
145
145
145
125
145
145
145
145
120
130
145
135
135
135
135
135
90
100
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
Film
Dauer
Helligkeit
Kontrast
Sättigung
f027a
f028a
f029a
f032a
f033a
f034a
f035a
f037a
17:20
18:19
40:10
34:08
23:20
15:22
25:29
11:03
155
145
145
150
130
165
140
140
140
140
140
170
140
145
130
145
85
85
85
85
85
85
85
85
Ton
Sample-Rate
11 kHz
11 kHz
11 kHz
11 kHz
11 kHz
11 kHz
11 kHz
22 kHz
11 kHz
22 kHz
11 kHz
11 kHz
11 kHz
22 kHz
22 kHz
ÖFA - 2
117
Ton
Sample-Rate
11 kHz
11 kHz
22 kHz
ANHÄNGE
Kennwert-Tabellen
ÖFA – 2
Film
Dauer
Helligkeit
Kontrast
Sättigung
f038a
f040a
f041a
f042a
f044a
f046a
f047a
f047b
f050a
f052a
18:23
22:12
21:21
27:28
19:27
20:24
31:16
24:06
12:26
31:29
125
160
160
155
140
140
150
150
155
145
160
130
150
145
135
135
135
135
145
135
85
85
85
85
85
85
85
85
85
85
Film
Dauer
Helligkeit
Kontrast
Sättigung
f053a
f053b
f053c
f053d
f055a
f056a
f057a
f058a
f059a
f060a
f061a
f061b
f062a
f064a
f064b
f065a
f066a
f067a
f068a
f069a
f070a
f071a
f072a
f073a
f074a
f075a
f076a
f076b
f077a
f078a
13:14
23:20
29:17
31:40
18:11
35:29
33:04
33:29
17:23
18:29
18:23
39:10
33:09
12:21
32:29
12:23
28:09
28:01
25:40
28:57
20:10
28:27
24:22
31:12
18:00
26:27
20:13
17:29
23:15
26:12
115
120
130
140
160
170
140
170
155
140
170
170
160
155
155
140
155
140
135
150
160
175
155
160
120
185
150
160
130
155
150
150
150
150
145
145
135
150
150
150
150
150
125
150
150
130
145
125
140
135
170
155
165
175
160
170
155
165
145
155
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
Ton
Sample-Rate
22 kHz
ÖFA - 3
118
Ton
Sample-Rate
11 kHz
11 kHz
22 kHz
22 kHz
22 kHz
11 kHz
22 kHz
22 kHz
22 kHz
22 kHz
11 kHz
11 kHz
22 kHz
ANHÄNGE
Kennwert-Tabellen
ÖFA - 4
Film
Dauer
Helligkeit
Kontrast
Sättigung
f079a
f080a
f081a
f082a
f083a
f084a
f085a
f086a
f088a
f089a
f091a
f092a
f093a
f094a
f097a
f098a
f099a
f100a
f100b
f101a
f102a
f104a
f104b
f106a
f107a
16:01
24:04
33:22
8:17
19:14
14:20
19:05
24:05
38:01
7:04
33:03
26:06
36:03
9:09
8:19
18:26
20:15
31:11
36:14
20:24
33:04
19:12
31:02
30:20
12:19
155
160
170
180
180
155
155
155
155
150
145
160
160
135
160
140
150
155
155
155
175
175
165
190
180
165
160
165
165
175
155
155
155
165
145
145
150
150
140
140
140
150
150
150
150
150
180
150
180
180
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
Film
Dauer
Helligkeit
Kontrast
Sättigung
f108a
f108b
f109a
f111a
f112a
f113a
f114a
f115a
f116a
f117a
f120a
f121a
f122a
f123a
f124a
f125a
f127a
31:20
25:06
16:29
17:07
38:10
29:23
32:19
26:02
21:07
25:10
26:10
38:29
21:04
25:27
20:06
19:06
10:22
185
140
140
190
190
170
170
180
185
170
155
165
165
145
170
170
180
165
160
165
170
175
175
175
170
175
160
160
160
170
165
165
165
175
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
85
Ton
Sample-Rate
22 kHz
22 kHz
22 kHz
22 kHz
22 kHz
11 kHz
22 kHz
22 kHz
22 kHz
22 kHz
11 kHz
11 kHz
22 kHz
11 kHz
11 kHz
ÖFA - 5
119
Ton
Sample-Rate
22 kHz
22 kHz
11 kHz
11 kHz
11 kHz
22 kHz
22 kHz
11 kHz
11 kHz
ANHÄNGE
Kennwert-Tabellen
ÖFA - 5
Film
Dauer
Helligkeit
Kontrast
Sättigung
f128a
f128b
f129a
28:93
39:13
19:07
205
205
205
190
190
190
85
85
85
Film
Dauer
Helligkeit
Kontrast
Sättigung
f130a
f131a
f132a
f133a
f135a
f136a
f138a
f142a
f145a
f146a
f148a
33:01
26:14
13:10
17:28
21:01
23:29
29:77
27:01
31:03
28:10
42:26
180
165
175
190
185
180
175
180
155
175
200
175
175
175
175
190
175
160
175
120
130
175
85
85
85
85
85
85
85
85
85
85
85
Film
Dauer
Helligkeit
Kontrast
Sättigung
f150a
f150b
f151a
f151e
f152a
f152b
33:13
16:16
10:16
22:57
24:19
12:28
195
195
145
145
160
160
185
185
180
180
180
180
85
85
85
85
85
85
Ton
Sample-Rate
22 kHz
ÖFA - 6
Ton
Sample-Rate
11 kHz
22 kHz
22 kHz
22 kHz
11 kHz
ÖFA - 7
Ton
Sample-Rate
11 kHz
11 kHz
22 kHz
22 kHz
Sequenzen des ORF (5 Kassetten):
ORF - 1
Film
Dauer
Helligkeit
Kontrast
Sättigung
o100a
o101a
o102a
o103a
o104a
o105a
o106a
o107a
o108a
o109a
15:29
29:16
31:10
17:28
16:16
19:25
12:26
28:02
17:14
16:26
120
145
120
130
130
130
145
150
105
135
120
145
135
130
130
130
130
130
140
110
115
135
145
115
120
115
135
135
120
135
120
Ton
Sample-Rate
ANHÄNGE
Kennwert-Tabellen
ORF - 1
Film
Dauer
Helligkeit
Kontrast
Sättigung
o110a
o112a
o113a
o114a
o115a
o116a
o117a
o118a
o119a
o120a
o123a
o124a
o125a
o126a
o127a
o128a
o129a
o132a
o134a
o135a
o136a
o138a
o139a
o140a
o141a
o142a
o143a
o144a
o145a
o146a
o147a
o148a
o148b
o149a
o150a
o151a
o153a
o154a
o155a
o157a
o158a
o159a
o160a
o163a
o164a
o165a
o166a
o167a
o169a
o171a
25:10
31:02
33:21
30:06
21:22
30:09
31:09
25:00
17:06
16:24
11:06
21:21
27:12
30:23
27:26
24:13
31:24
18:25
38:23
26:00
22:16
14:06
31:26
13:00
31:12
19:19
21:29
21:29
32:23
24:15
20:25
17:19
14:12
18:28
25:21
16:00
15:12
20:00
12:14
18:06
28:11
32:23
24:15
12:21
19:29
21:18
21:29
31:26
28:28
18:04
125
130
130
130
150
140
140
140
150
155
150
170
145
155
160
145
150
175
125
170
170
115
125
150
145
160
165
165
115
155
145
150
130
135
130
160
160
160
135
135
125
120
160
145
185
130
130
150
140
155
115
125
125
125
130
130
120
130
120
130
130
130
110
130
125
125
125
135
120
125
130
120
120
130
115
130
140
135
105
130
135
135
145
135
130
130
130
130
135
120
130
130
145
130
140
140
120
125
110
120
125
130
130
130
130
135
135
140
105
120
140
135
105
120
145
125
130
115
120
120
150
125
125
130
115
130
145
135
120
130
125
130
145
145
125
140
135
135
90
110
140
145
125
135
155
150
130
155
125
135
121
Ton
Sample-Rate
22 kHz
22 kHz
11 kHz
ANHÄNGE
Kennwert-Tabellen
ORF - 1
o171b
o173a
o174a
o176a
o177a
o178a
o179a
o181a
o182a
o184a
o186a
o187a
o188a
o189a
o190a
o191a
o192a
o193a
o195a
o198a
o199a
13:20
16:19
33:05
33:15
20:18
16:12
15:25
33:06
14:14
28:18
35:13
23:12
29:00
36:08
24:17
17:02
28:15
16:17
24:09
22:00
29:05
155
145
155
145
140
145
145
150
140
150
145
130
165
160
140
145
165
150
150
140
155
120
125
130
140
130
130
125
125
120
135
130
110
135
135
125
125
120
130
130
120
130
135
130
135
135
135
140
135
140
130
130
130
125
145
145
120
125
100
125
125
135
140
Film
Dauer
Helligkeit
Kontrast
Sättigung
o202a
o204a
o206a
o207a
o208a
o209a
o210a
o211a
o212a
o213a
o214a
o215a
o216a
o217a
o219a
o226a
o227a
o228a
o230a
o231a
o232a
o233a
o234a
o235a
o236a
33:10
22:27
27:00
12:27
32:26
33:20
30:25
31:11
17:07
32:20
19:02
31:19
22:21
11:04
16:24
26:08
24:17
23:15
21:11
25:07
24:05
26:06
29:16
10:11
21:29
180
180
150
160
165
175
185
165
160
140
140
150
145
145
155
160
145
150
150
150
160
155
160
155
165
185
140
120
150
150
150
150
150
135
120
140
185
145
130
130
140
130
120
160
160
150
140
145
145
130
120
125
135
160
175
165
140
160
130
125
135
150
135
135
130
85
85
85
85
85
85
85
85
85
85
11 kHz
22 kHz
11 kHz
11 kHz
ORF - 2
122
Ton
Sample-Rate
11 kHz
11 kHz
ANHÄNGE
Kennwert-Tabellen
ORF - 2
Film
Dauer
Helligkeit
Kontrast
Sättigung
o237a
o238a
o239a
o240a
o241a
o242a
o243a
o245a
o246a
o247a
o248a
o249a
o250a
o254a
o256a
o262a
o267a
o269a
o274a
o276a
o278a
o282a
o283a
25:23
33:27
22:17
33:14
31:14
18:14
20:01
28:24
22:06
39:29
24:10
21:20
16:28
25:14
33:15
16:11
29:03
29:03
27:15
29:28
28:12
31:20
31:27
145
140
150
155
165
165
170
155
175
150
175
150
150
155
120
155
130
130
140
160
140
140
150
140
130
135
135
135
145
140
140
140
145
145
150
150
145
115
140
120
120
120
125
125
125
125
85
85
85
85
85
85
85
85
85
85
85
85
85
160
85
140
135
145
130
165
185
170
155
Film
Dauer
Helligkeit
Kontrast
Sättigung
o301a
o302a
o303a
o304a
o305a
o306a
o308a
o311a
o312a
o313a
o314a
o316a
o317a
o318a
o320a
o322a
o323a
o324a
o325a
o326a
o327a
18:10
27:10
30:29
29:00
28:28
20:43
28:15
25:00
21:05
16:12
25:15
29:17
22:11
20:17
23:29
31:05
32:07
35:20
7:17
27:25
27:16
160
170
145
160
150
140
135
165
165
130
140
140
125
140
125
140
160
140
120
135
145
165
165
145
140
155
150
165
165
150
175
175
135
130
125
120
135
155
155
120
140
140
135
135
140
155
160
150
155
145
155
140
140
170
170
150
120
140
150
150
140
140
140
Ton
Sample-Rate
11 kHz
11 kHz
11 kHz
22 kHz
11 kHz
11 kHz
11 kHz
11 kHz
11 kHz
ORF - 3
123
Ton
Sample-Rate
11 kHz
ANHÄNGE
Kennwert-Tabellen
ORF - 3
Film
Dauer
Helligkeit
Kontrast
Sättigung
o328a
o329a
o330a
o331a
o334a
o335a
o336a
o337a
o338a
o339a
o340a
o341a
o342a
o343a
o344a
o346a
o347a
o348a
o349a
o350a
o351a
o353a
o355a
o356a
o357a
o358a
26:17
32:00
30:04
15:26
31:21
19:03
30:06
29:28
30:22
30:18
31:26
31:13
18:04
20:01
33:11
29:29
29:25
14:29
30:05
24:06
19:29
18:00
23:22
24:19
8:20
18:10
145
145
160
135
140
140
160
165
165
130
165
145
120
130
155
150
145
160
175
155
160
150
140
155
160
145
125
130
140
130
170
125
140
145
140
125
145
140
120
120
135
125
155
155
135
120
130
125
120
120
120
135
125
120
155
140
135
125
145
140
140
130
140
150
175
165
150
155
140
160
150
140
165
120
135
140
120
120
Film
Dauer
Helligkeit
Kontrast
Sättigung
o401a
o402a
o403a
o404a
o405a
o406a
o407a
o408a
o409a
o410a
o411a
o412a
o413a
o414a
o416a
o417a
o418a
o419a
39:12
27:12
25:29
47:09
20:00
34:05
29:06
26:26
27:14
25:02
27:24
25:22
37:23
42:14
21:28
28:28
17:14
48:27
150
140
170
165
165
175
185
180
180
180
190
185
180
190
150
150
150
140
125
120
120
120
120
130
140
130
130
130
145
130
140
135
130
130
120
140
85
80
145
100
90
90
110
115
110
110
160
120
100
155
90
90
90
85
Ton
Sample-Rate
ORF - 4
124
Ton
Sample-Rate
11 kHz
11 kHz
11 kHz
11 kHz
11 kHz
22 kHz
22 kHz
22 kHz
11 kHz
ANHÄNGE
Kennwert-Tabellen
ORF - 4
Film
Dauer
Helligkeit
Kontrast
Sättigung
o420a
o421a
o422a
o423a
o424a
o425a
o425b
o426a
o427a
o428a
o428b
o429a
o430a
o431a
o432a
o433a
o434a
o435a
o436a
o437a
o439a
o440a
o441a
o442a
o444a
o445a
o446a
o447a
o448a
o449a
o450a
o451a
o452a
o454a
o455a
14:00
21:02
10:27
15:18
33:10
32:17
10:14
24:24
33:09
20:04
41:00
28:07
31:16
29:26
32:06
22:28
34:04
17:08
28:14
24:22
17:20
32:07
34:22
32:18
23:23
15:09
20:13
30:21
28:29
20:14
21:07
41:25
29:24
16:11
43:14
185
180
155
180
180
185
185
160
180
180
180
180
185
170
185
145
190
175
180
150
185
170
150
185
170
140
170
150
170
170
180
180
180
180
190
135
135
130
140
140
150
150
140
130
155
135
150
140
140
120
115
160
130
135
140
135
135
135
130
140
140
130
120
120
120
140
140
140
140
170
85
115
100
110
105
110
110
90
100
85
85
85
85
100
100
110
85
100
100
85
85
85
85
85
70
80
110
80
100
100
80
80
80
90
100
Film
Dauer
Helligkeit
Kontrast
Sättigung
o501a
o502a
o503a
o504a
26:16
42:08
34:25
24:02
180
160
150
165
130
120
120
130
130
85
100
120
Ton
Sample-Rate
11 kHz
11 kHz
22 kHz
11 kHz
11 kHz
11 kHz
11 kHz
11 kHz
11 kHz
11 kHz
11 kHz
11 kHz
11 kHz
11 kHz
11 kHz
11 kHz
22 kHz
11 kHz
22 kHz
22 kHz
11 kHz
11 kHz
22 kHz
11 kHz
ORF - 5
125
Ton
Sample-Rate
11 kHz
11 kHz
22 kHz
11 kHz
ANHÄNGE
Kennwert-Tabellen
Kennwerte für die Aufnahme im MPEG-Format
Sequenzen der AVL (1 Kassette) :
AVL - 1
Video Länge Helligkeit Sättigung Kontrast
a001a
26:40
15
60
60
Offset
Ton
Ton Gesamt
Hor./Vert. Bitrate Lautst. Bitrate
3/0
112
6
150
Sequenzen des österreichischen Filmarchivs Laxenburg (7 Kassetten):
ÖFA - 1
f001a
f001b
f005a
f006a
f007a
f008a
f009a
f010a
f011a
f012a
f014a
f015a
f016a
f018a
f019a
f019b
f020a
f021a
f022a
f024a
f025a
27:72
24:12
11:04
21:96
14:88
17:64
23:76
28:08
24:96
18:84
23:76
24:60
21:00
33:84
29:04
21:48
21:48
25:44
28:08
23:28
27:72
-5
-5
-25
0
-5
-15
-5
-5
-5
-5
0
-5
0
-5
-25
5
-5
-5
-5
-25
-10
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
80
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
80
64
Offset
Ton
Ton Gesamt
7/0
150
7/0
112
6
150
7 / -2
150
7/0
150
7/0
112
6
150
7/0
112
6
150
7/0
112
6
150
7/0
112
6
150
7/0
112
6
150
7/0
112
6
150
7 / -2
150
7 / -2
150
7 / -2
150
7/0
112
6
150
7/0
112
6
150
7/0
112
6
150
7/0
112
6
150
7/0
112
6
150
7/0
112
6
150
7/0
112
6
150
7/0
112
6
150
ÖFA - 2
f027a
f028a
f029a
f032a
f033a
f034a
f035a
f037a
f038a
f040a
17:16
17:64
39:48
33:72
22:92
18:00
25:92
8:76
18:84
21:96
0
-5
-5
0
-5
0
-10
-15
-10
0
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
80
80
80
64
Offset
Ton
Ton Gesamt
6 / -2
150
6/0
150
7/0
112
6
150
6/0
112
6
150
6/0
150
6/0
112
6
150
7/0
150
8 / -2
150
6 / -2
150
7 / -2
150
126
ANHÄNGE
Kennwert-Tabellen
ÖFA - 2
f041a
f042a
f044a
f046a
f047a
f047b
f050a
f052a
22:92
28:08
21:48
19:80
31:20
23:64
12:36
31:20
0
-5
0
-5
0
0
0
-10
64
64
64
64
64
64
64
64
64
64
64
80
64
64
64
64
Offset
Ton
Ton Gesamt
6 / -2
150
7/0
112
6
150
6 / -2
150
6 / -2
150
6 / -2
150
6 / -2
150
6/0
150
6 / -2
150
ÖFA - 3
f053a
f053b
f053c
f053d
f055a
f056a
f057a
f058a
f059a
f060a
f061a
f061b
f062a
f064a
f064b
f065a
f066a
f067a
f068a
f069a
f070a
f071a
f072a
f073a
f074a
f075a
f076a
f076b
f077a
f078a
14:04
24:56
26:76
32:52
17:16
36:00
33:84
34:32
17:16
18:36
18:48
39:48
32:88
13:20
31:68
12:24
28:08
27:24
24:24
27:24
19:76
27:72
25:08
31:20
17:64
27:24
18:48
17:16
24:12
25:44
-10
-10
0
-10
0
0
-20
0
-5
-10
-5
-5
0
-5
-5
5
-5
-10
-5
-30
10
5
-5
-5
-5
0
-5
-5
-5
-5
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
60
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
80
64
64
64
80
64
64
64
64
54
64
64
64
64
64
64
64
64
64
64
64
64
64
64
Offset
Ton
Ton Gesamt
6 / -2
150
6 / -2
150
6 / -2
150
6 / -2
150
6 / -2
150
6 / -2
150
6 / -2
112
6
150
6/0
150
7/0
112
6
150
6 / -2
150
6/0
112
6
150
6/0
112
6
150
6/0
112
6
150
6 / -2
150
6 / -2
150
6 / -2
150
6/0
112
6
150
6/0
112
6
150
7/0
150
6/0
150
7 / -2
150
6/0
150
2/0
150
6/0
112
6
150
6/0
112
6
150
6/0
112
6
150
6/0
112
6
150
6/0
112
6
150
6/0
112
6
150
5/0
150
127
ANHÄNGE
Kennwert-Tabellen
ÖFA - 4
f079a
f080a
f081a
f082a
f083a
f084a
f085a
f086a
f088a
f089a
f091a
f092a
f093a
f094a
f097a
f098a
f099a
f100a
f100b
f101a
f102a
f104a
f104b
f106a
f107a
15:36
24:60
33:48
8:28
19:32
14:04
18:84
23:28
37:68
7:44
33:72
26:40
36:48
8:76
9:72
18:48
20:64
31:68
36:48
20:16
32:88
19:80
31:20
30:72
12:72
-5
-5
-5
-5
0
-5
-5
-5
-5
-5
-5
-5
-5
-5
-5
0
-5
-5
-5
0
-5
-5
-5
-5
-5
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
Offset
Ton
Ton Gesamt
6/0
150
6/0
112
6
150
6 / -2
112
6
150
6/0
150
6/0
150
6/0
112
6
150
6/0
112
6
150
6/0
112
6
150
6/0
112
6
150
6/0
112
6
150
6/0
150
6/0
150
6/0
150
2 / -2
150
2 / -2
150
0/0
150
6/0
112
6
150
6/0
112
6
150
6/0
112
6
150
6/0
112
6
150
6/0
112
6
150
6/0
112
6
150
6/0
112
6
150
6 / -2
150
6 / -2
112
6
150
ÖFA - 5
f108a
f108b
f109a
f111a
f112a
f113a
f114a
f115a
f116a
f117a
f120a
f121a
f122a
f123a
f124a
f125a
f127a
31:32
24:60
17:16
16:68
38:64
31:68
32:52
26:40
21:96
25:92
26:40
39:48
20:64
25:44
20:28
17:52
8:76
-5
0
-5
10
-5
-5
-5
-5
-5
-5
-5
-5
-5
-5
-5
-5
-5
64
64
64
64
64
64
64
64
64
64
64
64
64
80
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
Offset
Ton
Ton Gesamt
6/0
112
6
150
6/0
112
6
150
2/0
150
6 / -2
150
6/0
112
6
150
6/0
112
6
150
6/0
112
6
150
6/0
112
6
150
6/0
150
6 / -2
150
6/0
112
6
150
6/0
112
6
150
6/0
112
6
150
6/0
150
6/0
150
4 / -2
150
4/0
150
128
ANHÄNGE
Kennwert-Tabellen
ÖFA - 5
f128a
f128b
f129a
24:12
36:84
19:80
0
30
-5
64
60
64
64
58
64
Offset
Ton
Ton Gesamt
4 / -2
150
4 / -2
150
6/0
112
6
150
ÖFA - 6
f130a
f131a
f132a
f133a
f135a
f136a
f137a
f138a
f142a
f145a
f146a
f148a
33:48
26:76
12:24
18:00
21:12
24:60
19:32
29:88
27:08
30:72
25:44
43:08
-5
-5
-10
-5
-5
-5
-5
10
-5
-5
0
0
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
Offset
Ton
Ton Gesamt
2 / -2
112
6
158
6 / -2
150
6/0
150
6 / -2
150
6/0
112
6
150
7 / -2
150
6 / -2
150
6 / -2
112
6
150
6 / -2
150
6/0
112
6
150
6 / -2
150
6/0
112
6
150
ÖFA - 7
f150a
f150b
f151a
f151e
f151f
f151g
f151h
f152a
f152b
33:84
16:68
10:08
21:96
21:00
42:12
17:52
24:60
13:20
0
0
0
-10
0
0
0
0
0
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
Offset
Ton
Ton Gesamt
7/0
112
6
150
7/0
112
6
150
7/0
150
7/0
150
7/0
150
7/0
150
7/0
150
7/0
112
6
150
7/0
112
6
150
Sequenzen des ORF (5 Cassetten) :
ORF – 1
o100a
o101a
o102a
o103a
o104a
o105a
14:40
28:52
29:88
17:64
14:04
17:96
-30
-5
-25
-20
-20
-20
80
80
80
80
90
64
64
64
64
64
80
64
Offset
Ton
Ton Gesamt
2/0
150
2/0
150
2/0
150
2/0
150
2/0
150
2/0
150
129
ANHÄNGE
Kennwert-Tabellen
ORF – 1
o106a
o107a
o108a
o109a
o110a
o112a
o113a
o114a
o115a
o116a
o117a
o118a
o119a
o120a
o123a
o124a
o125a
o126a
o127a
o128a
o129a
o132a
o134a
o135a
o136a
o138a
o139a
o140a
o141a
o142a
o143a
o144a
o145a
o146a
o147a
o148a
o148b
o149a
o150a
o151a
o153a
o154a
o155a
o157a
o158a
o159a
o160a
o163a
o164a
o165a
12:72
26:88
16:68
16:20
24:12
30:72
33:36
28:08
20:96
31:56
29:04
23:28
14:40
14:88
11:04
21:60
25:92
32:52
27:24
24:96
32:04
16:68
38:76
25:44
22:44
14:52
31:20
10:56
31:68
19:32
21:48
20:64
32:52
24:60
18:48
16:68
14:04
17:52
25:56
16:32
15:00
18:96
12:36
18:48
25:92
33:36
24:60
12:36
18:36
21:60
-5
-15
-40
-20
-15
-20
-15
-40
-30
-20
-30
-5
-5
-5
-20
5
-10
-5
-10
-10
5
0
-10
-5
10
-15
-20
-10
-5
5
0
-5
-35
-5
-10
-15
-20
-5
-10
-10
-5
5
-15
-10
-15
-25
-10
-10
-5
-25
90
64
80
64
80
64
80
64
64
80
90
90
80
80
64
90
80
80
64
64
72
72
60
64
80
60
80
64
64
80
64
64
68
68
64
72
68
68
64
64
64
80
68
64
64
64
80
64
64
68
80
64
64
64
64
64
64
64
64
64
80
80
64
64
64
80
64
64
64
64
64
64
64
64
64
50
64
64
64
64
64
64
60
64
56
72
64
64
64
64
64
64
60
64
64
64
64
64
64
64
Offset
Ton
Ton Gesamt
2/0
150
2/0
150
2/0
150
2/0
150
2/0
150
2/0
150
3/0
150
2/0
150
2/0
150
3/0
150
2/0
150
4 / -4
150
3/0
150
3/0
150
2/0
150
2/0
150
3/0
150
1/0
150
2/0
150
3/0
150
3/0
112
6
150
8/0
150
3/0
112
6
150
2/0
150
3/0
150
2/0
150
0/0
150
2/0
150
2/0
150
3/0
150
2/0
150
2/0
150
2/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
2/0
150
2/0
112
6
150
2/0
150
2/0
150
3/0
150
2/0
150
2/0
150
2/0
150
3/0
150
2/0
150
3/0
150
3/0
150
130
ANHÄNGE
Kennwert-Tabellen
ORF – 1
o166a
o167a
o169a
o171a
o171b
o173a
o174a
o176a
o177a
o178a
o179a
o181a
o182a
o184a
o186a
o187a
o188a
o189a
o190a
o191a
o192a
o193a
o195a
o198a
o199a
21:00
26:76
28:08
16:68
13:20
15:84
32:52
29:40
19:32
15:00
14:88
32:52
13:56
27:72
30:24
18:48
27:72
36:48
24:48
16:68
29:04
16:32
24:12
25:44
29:52
-20
-10
-15
-10
-10
-10
-10
-20
-25
-20
-25
-15
-15
-20
-15
-40
-10
0
-5
-20
-10
-10
-10
5
-15
68
64
64
64
64
64
64
64
64
64
64
64
42
64
90
64
68
68
64
64
60
68
80
42
90
64
64
64
64
64
64
64
64
64
64
64
64
44
64
80
56
60
56
60
52
60
64
64
45
80
Offset
Ton
Ton Gesamt
3/0
150
3/0
150
2/0
150
4/0
150
4/0
150
3/0
150
4/0
150
3/0
150
3/0
150
3/0
150
1/0
150
1/0
150
0/0
150
3/0
150
3/0
150
3/0
150
2/0
150
4/0
112
6
150
3/0
112
6
150
3/0
112
6
150
3/0
150
3/0
150
3/0
112
6
150
3/0
150
3/0
150
ORF - 2
o202a
o204a
o206a
o207a
o208a
o209a
o210a
o211a
o212a
o213a
o214a
o215a
o216a
o217a
o219a
o226a
o227a
o228a
o230a
32:88
20:64
26:28
12:72
31:68
33:36
30:24
31:20
16:20
32:04
18:48
30:72
21:96
11:40
15:84
26:76
24:12
23:28
21:12
0
0
-35
-10
-10
-10
0
-10
-5
-15
0
0
-10
-10
-15
-10
-5
-10
-10
80
76
52
76
90
64
80
80
68
68
66
64
64
64
76
60
64
64
64
64
64
56
68
64
64
64
64
68
64
60
64
64
64
60
72
64
64
64
Offset
Ton
Ton Gesamt
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
2/0
150
2/0
150
2/0
150
2/0
150
2/0
150
3/0
150
3/0
150
3/0
150
2/0
150
2/0
112
6
150
3/0
112
6
150
3/0
150
131
ANHÄNGE
Kennwert-Tabellen
ORF - 2
o231a
o232a
o233a
o234a
o235a
o236a
o237a
o238a
o239a
o240a
o241a
o242a
o243a
o245a
o246a
o247a
o248a
o249a
o250a
o254a
o256a
o262a
o267a
o269a
o274a
o276a
o278a
o282a
o283a
25:08
21:96
26:40
29:88
10:56
21:96
25:08
31:08
21:96
33:00
31:68
18:48
20:28
28:08
22:32
39:48
24:60
20:64
15:24
25:00
33:36
16:68
29:40
29:40
27:12
28:10
28:08
31:68
31:68
-10
-10
-10
-5
-10
0
-25
-10
-10
-10
-5
-10
0
-10
0
-20
-10
-15
0
-10
-20
-10
-10
-10
-15
-10
-10
-10
-10
58
64
64
64
64
64
56
54
64
64
64
64
64
64
64
56
64
60
64
64
48
80
68
72
60
80
80
74
80
60
64
64
64
64
64
64
60
64
64
64
64
64
64
64
68
64
60
64
64
54
64
64
64
54
64
64
58
64
Offset
Ton
Ton Gesamt
3/0
150
3/0
150
3/0
150
2/0
112
6
150
3/0
112
6
150
2/0
150
2/0
112
6
150
2/0
150
3/0
150
3 / -2
150
2/0
150
3/0
150
2/0
112
6
150
3/0
150
2/0
112
6
150
3/0
112
6
150
3/0
150
2/0
150
2/0
150
3/0
150
3/0
150
3/0
150
3/0
112
6
150
-1 / 0
112
6
150
2/0
150
2/0
112
6
150
3/0
112
6
150
3/0
150
3/0
112
6
150
ORF - 3
o301a
o302a
o303a
o304a
o305a
o306a
o308a
o311a
o312a
o313a
o314a
o316a
o317a
o318a
o320a
18:84
25:92
29:88
28:56
27:72
20:28
28:56
23:76
21:48
15:84
25:56
29:40
21:00
18:84
22:44
-10
-10
-20
-10
-10
-10
-10
-10
-10
-20
-10
-10
-25
-10
-30
64
64
64
64
64
80
80
64
80
80
80
80
80
80
80
64
64
64
64
64
64
64
64
80
64
64
64
64
64
64
Offset
Ton
Ton Gesamt
3/0
150
3/0
150
3/0
150
4/0
150
4/0
150
4/0
150
5/0
112
6
150
3/0
150
4/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
132
ANHÄNGE
Kennwert-Tabellen
ORF - 3
o322a
o323a
o324a
o325a
o326a
o327a
o328a
o329a
o330a
o331a
o334a
o335a
o336a
o337a
o338a
o339a
o340a
o341a
o342a
o343a
o344a
o346a
o347a
o348a
o349a
o350a
o351a
o353a
o355a
o356a
o357a
o358a
30:72
31:20
34:24
6:96
27:60
26:28
24:60
25:92
29:88
14:52
30:72
18:96
29:40
28:20
29:88
29:08
30:72
29:88
17:16
19:80
33:00
29:04
28:92
14:04
28:56
24:12
19:32
17:16
22:92
24:60
7:44
17:16
-10
-10
-10
-50
-10
-10
-10
-10
-10
-15
-20
-10
5
-10
-10
-30
-10
-5
-60
-15
-10
-10
-10
-10
15
-5
-10
-10
-20
0
-15
-35
64
80
64
80
64
80
80
64
64
80
80
80
80
64
64
80
80
80
100
100
64
64
64
64
120
80
80
80
80
100
90
90
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
64
80
80
64
64
64
64
80
64
64
64
64
80
80
80
Offset
Ton
Ton Gesamt
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
6/0
150
3/ 0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
3/0
150
ORF - 4
o401a
o402a
o403a
o404a
o405a
o406a
o407a
o408a
o409a
o410a
o411a
o412a
39:60
26:28
25:92
47:40
20:28
32:04
28:56
25:44
25:44
24:12
27:72
27:24
-10
0
0
5
0
0
25
35
20
15
30
15
48
44
68
72
64
60
60
54
68
64
70
64
52
54
64
64
60
64
64
62
64
64
64
64
Offset
Ton
Ton Gesamt
9/0
112
6
150
8/0
150
8/0
112
6
150
7/0
112
6
150
8/0
112
6
150
7/0
150
8/0
150
8/0
150
8/0
150
8/0
150
8/0
112
6
150
8/0
150
133
ANHÄNGE
Kennwert-Tabellen
ORF - 4
o413a
o414a
o416a
o417a
o418a
o419a
o420a
o421a
o422a
o423a
o424a
o425a
o425b
o426a
o427a
o428a
o428b
o429a
o430a
o431a
o432a
o433a
o434a
o435a
o436a
o437a
o439a
o440a
o441a
o442a
o444a
o445a
o446a
o447a
o448a
o449a
o450a
o451a
o452a
o454a
o455a
37:80
42:12
22:44
29:04
17:16
48:72
13:56
21:00
10:92
15:36
32:88
31:20
10:08
24:12
32:04
19:68
40:44
28:56
31:08
29:52
30:24
23:76
33:36
17:16
28:08
25:08
17:16
31:56
35:16
32:52
22:80
15:36
19:32
30:72
29:52
19:80
21:48
41:76
29:04
16:20
43:08
15
20
-5
10
5
-15
5
30
0
20
40
25
25
5
25
20
25
20
30
30
20
-25
25
15
20
0
5
25
-5
30
20
-15
15
-5
25
0
10
20
5
15
30
44
60
68
56
64
70
64
40
36
44
66
54
52
58
60
58
54
58
58
60
56
58
60
48
60
64
64
58
60
62
20
64
62
52
64
64
54
60
64
60
50
54
62
64
62
64
62
54
52
40
64
60
58
58
54
64
56
58
62
58
62
60
56
70
58
64
64
64
62
62
64
40
60
60
60
62
64
62
52
64
60
60
Offset
Ton
Ton Gesamt
7/0
150
7/0
150
7/0
112
6
150
7/0
112
6
150
8/0
112
6
150
7/0
112
6
150
4/0
112
6
150
7/0
112
6
150
7/0
112
6
150
7/0
150
7/0
150
5/0
150
5/0
150
5/0
150
8/0
150
4/0
150
4/0
150
4/0
150
4/0
112
6
150
4/0
112
6
150
6 / -2
150
4/0
112
6
150
5/0
112
6
150
5/0
112
6
150
5/0
112
6
150
4/0
112
6
150
5/0
112
6
150
4/0
112
6
150
4/0
112
6
150
4/0
112
6
150
7/0
112
6
150
4/0
112
6
150
4/0
112
6
150
8/0
112
6
150
4/0
112
6
150
8/0
112
6
150
8/0
112
6
150
4/0
112
6
150
4/0
112
6
150
4/0
112
6
150
4/0
112
6
150
ORF - 5
o501a
o502a
o503a
o504a
28:08
41:76
34:68
23:64
10
-10
5
5
80
52
72
50
64
60
64
60
Offset
Ton
Ton Gesamt
3/0
112
6
150
5/0
112
6
150
4/0
112
6
150
7/0
112
6
150
134
ABBILDUNGSVERZEICHNIS
Abbildungsverzeichnis
Die Abbildungen auf den Deckblättern der einzelnen Kapitel stellen Screenshots aus der OnlinePräsentation des AEIOU-Projektes und den darin enthaltenen Alben dar.
Abbildung 1: Die Einstiegsseite des AEIOU-Projektes.....................................................................................12
Abbildung 2: Sechs Alben des AEIOU-Systems .............................................................................................. 13
Abbildung 3: Ein Blick auf das Videoalbum des AEIOU-Projektes ..................................................................15
Abbildung 4: Der Einstieg in die Musikgeschichte...........................................................................................19
Abbildung 5: Die kanonische Form des RIFF-Formates ...................................................................................21
Abbildung 6: Der Audiorecorder .....................................................................................................................23
Abbildung 7: Festlegen der Audioeigenschaften...............................................................................................24
Abbildung 8: Anpassen der Audioqualität........................................................................................................25
Abbildung 9: Beispiel einer HTML-Seite mit Link auf Audiodateien ...............................................................26
Abbildung 10: Der Real Audio Encoder v3.0...................................................................................................30
Abbildung 11: Der VivoActive Producer v2.0..................................................................................................36
Abbildung 12: Auswahl einer Parameterdatei...................................................................................................37
Abbildung 13: Editieren einer Parameterdatei ..................................................................................................37
Abbildung 14: Der Frequenzbereich des Hörvermögens eines Menschen.......................................................... 41
Abbildung 15: Der Aufbau eines MP3-Frames.................................................................................................42
Abbildung 16: Das Hauptfenster des XING MP3-Encoders..............................................................................44
Abbildung 17: Anzeige der eingefügten Kodierungsjobs im XING MP3-Encoder............................................ 44
Abbildung 18: Anzeige der Eigenschaften eines Konvertierungsauftrages ........................................................ 45
Abbildung 19: Festlegen eines Konvertierungsprofiles mit bestimmter Bitrate.................................................. 45
Abbildung 20: Festlegung der Standardeinstellungen für die Kodierung ...........................................................46
Abbildung 21: Gliederung der Videosequenzen in Kategorien.......................................................................... 54
Abbildung 22: Skizzierter Ablauf bei der Erstellung der Videosequenzen.........................................................55
Abbildung 23: Der "Kranzltanz" aus dem AEIOU-Videoalbum........................................................................62
Abbildung 24: Ablaufskizze für die Erstellung von AVI-Sequenzen.................................................................63
Abbildung 25: Öffnen eines neuen Projektes....................................................................................................64
Abbildung 26: Das Hauptfenster von Adobe Premiere mit Videoquelle ............................................................ 65
Abbildung 27: Festlegung der Videoquelle ......................................................................................................66
Abbildung 28: Einstellung der Aufnahmeoptionen ...........................................................................................67
Abbildung 29: Videoformat festlegen ..............................................................................................................67
Abbildung 30: Wahl der Videokompression.....................................................................................................68
Abbildung 31: Einstellen der Audioeigenschaften ............................................................................................ 68
Abbildung 32: Das Schnittfenster von Adobe Premiere.................................................................................... 70
Abbildung 33: Änderung der Darstellung im Schnittfenster..............................................................................70
Abbildung 34: Der "Make Movie"-Dialog .......................................................................................................72
Abbildung 35: Festlegen der Ausgabeeinstellungen .........................................................................................73
Abbildung 36: Kompressionseinstellungen wählen .......................................................................................... 73
Abbildung 37: Zusätzliche Parameter festlegen ................................................................................................ 74
Abbildung 38: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im AVI-Format ........................ 75
Abbildung 39: Auszug aus den Testreihen für das AEIOU-Projekt ...................................................................77
Abbildung 40: Beispiel eines QuickTime-Atoms .............................................................................................79
Abbildung 41: Beispiel eines QT-Atoms.......................................................................................................... 80
Abbildung 42: Beispiel einer QuickTime-Datei................................................................................................ 82
Abbildung 43: Der Make Movie-Dialog (QuickTime-Format).......................................................................... 83
Abbildung 44: Festlegung der Ausgabeeinstellungen (QuickTime-Format) ...................................................... 84
Abbildung 45: Kompressionseinstellungen wählen (QuickTime-Format) .........................................................85
Abbildung 46: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im QuickTime-Format..............86
Abbildung 47: Der Zusammenhang zwischen I-, P- und B-Frames ...................................................................92
Abbildung 48: Ein Blick auf das MPEG Lab Pro .............................................................................................93
Abbildung 49: Festlegung der Ausgabeparameter ............................................................................................ 94
Abbildung 50: Kalibrierung der Videoquelle....................................................................................................95
Abbildung 51: Das Encoding-Fenster ..............................................................................................................96
Abbildung 52: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im MPEG-Format .................... 97
Abbildung 53: Der Real Video Encoder ......................................................................................................... 100
Abbildung 54: Wahl der Eingabe- und der Ausgabedatei................................................................................ 101
Abbildung 55: Erweiterte Einstellungen für die Konvertierung....................................................................... 101
Abbildung 56: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im RealVideo-Format............. 103
135
ABBILDUNGSVERZEICHNIS
Abbildung 57: Der VivoActive-Producer v2.0 (Video)................................................................................... 107
Abbildung 58: HTML-Seite aus dem Videoalbum mit dem Film „Kranzltanz“ im VivoActive-Format ........... 109
Abbildung 59: HTML-Seite aus dem Videoalbum mit dem "Kranzltanz" als VivoActive-Objekt .................... 110
Abbildung 60: Anschlussplan für die Aufnahme im AVI-Format ................................................................... 115
Abbildung 61: Anschlussplan für die Aufnahme im MPEG-Format................................................................ 116
136
TABELLENVERZEICHNIS
Tabellenverzeichnis
Tabelle 1: Konfiguration der Arbeitsumgebung................................................................................................ 17
Tabelle 2: Qualitätsstufen des Waveform-Formates .........................................................................................27
Tabelle 3: Qualitätsstufen von Real Audio.......................................................................................................33
Tabelle 4: Gegenüberstellung Waveform-VivoActive ...................................................................................... 39
Tabelle 5: Die Qualitätsstufen von MP3...........................................................................................................48
Tabelle 6: Gegenüberstellung Microsoft Waveform und MP3 .......................................................................... 49
Tabelle 7: Bildparameter für den „Kranzltanz“ aus dem Videoalbum des AEIOU.............................................69
Tabelle 8: Auflistung der Basis-Atomtypen des QuickTime-Formates.............................................................. 81
Tabelle 9: Gegenüberstellung AVI-Apple QuickTime...................................................................................... 88
Tabelle 10: Real Video Aufnahmevorlagen.................................................................................................... 104
Tabelle 11: Gegenüberstellung AVI-VivoActive............................................................................................ 111
137
LITERATURVERZEICHNIS
Literaturverzeichnis
[APPLE96]
DEVELOPER PRESS APPLE; Quick Time File Format
Specification. 1996
[AUSSERHOFER96]
AUSSERHOFER ANDREAS; Das Österreich-Lexikon und
HGINFO – zwei Hypermedia-Applikationen. Technische
Universität Graz, Institut für Informationsverarbeitung und
Computergestützte neue Medien, Graz, Diplomarbeit, 1996
[BAMBERGER95]
BAMBERGER RICHARD UND MARIA, BRUCKMÜLLER
ERNST, GUTKAS KARL; Österreich Lexikon in zwei Bänden.
Verlagsgemeinschaft Österreich-Lexikon, 1995
[DCT90]
K. R. RAO, P. YIP; Discrete Cosine Transforn – Algorithms,
Advantages, Applications. Academic Press, Inc., 1990
[FLYNN95]
FLYNN PETER; The World Wide Web Handbook. An HTML
Guide for Users, Authors and Publishers. Thomson, 1995
[GRAHAM96]
GRAHAM IAN S.; The HTML-Sourcebook – a complete guide
to HTML 3.0. Wiley Verlag, 1996
[HACKER00]
HACKER SCOT; MP3: The Definitive Guide, 1st. Edition,
O’Reilly & Associates, 2000
[HEROLD92]
HEROLD HELMUTH; UNIX Grundlagen: Kommandos und
Konzepte. 2. überarbeitete Auflage, Bonn: Addison-Wesley
Publishing Company, 1992
[HOLLAUF97]
HOLLAUF MICHAEL; Aufbau der Hypermediapräsentationen
Österreich-Lexikon, Videoalbum und Briefmarkenalbum für den
AEIOU-Informationsserver. Technische Universität Graz,
Institut für Informationsverarbeitung und Computergestützte
neue Medien, Graz, Diplomarbeit, 1997
[KAPPE93]
KAPPE FRANK; Hyper-G: A Distributed Hypermedia System.
Proc. INET’93, San Francisco, 1993
138
[KAY95]
KAY DAVID C., LEVINE JOHN R.; Graphics file formats.
Windcrest, McGraw-Hill, 1995
[KRASSER97]
KRASSER ROLAND; Aufbau der Hypermediapräsentationen
Musikgeschichte, Fotoalbum und Kunsthistorisches Bilderalbum
für den AEIOU-Informationsserver. Technische Universität
Graz, Institut für Informationsverarbeitung und
Computergestützte neue Medien, Graz, Diplomarbeit, 1997
[MAURER96]
MAURER HERMANN; Hyper-G is now HyperWave. The Next
Generation Web Solution. 1. Auflage. Graz: Addison-Wesley
Publishing Company, 1996
[MPEG94|
Generic Coding of Moving Pictures and Associated Audio
Information: Video. ISO/IEC 13818-2: Draft International
Standard, November 1994
[MPEG97]
BARRY G. HASKELL, ATUL PURI, ARUN N. NETRAVALI;
Digital Video: An Introduction to MPEG-2. Chapman and Hall,
1997
[MICROSOFT92a]
MICROSOFT CORPORATION; Microsoft Windows
Multimedia Programmer’s Reference. 1992
[MICROSOFT92b]
MICROSOFT CORPORATION; Microsoft Windows
Multimedia Programmer’s Workbook. 1992
[RAGGET95]
RAGGET DAVE; HyperText Markup Language Specification
Version 3.0. Internet Draft, 1995
[SAMMER95]
SAMMER PETER; AEIOU Projektbericht Dezember 1995.
Projektzwischenbericht an das BMWV, Technische Universität
Computergestützte neue Medien, Graz, Internes Dokument,
1995
[SAMMER96]
SAMMER PETER; AEIOU Projektbericht Dezember 1996.
Projektzwischenbericht an das BMWV, Technische Universität
1996
139
[WALSER96]
WALSER ANDREAS; Aufbau der Hyperwave-Applikation
Briefmarken-Album. Projektbericht, Technische Universität
1996
140
LINKSAMMLUNG
Linksammlung (Stand: Dezember 2000)
[AEIOU97a]
AEIOU-Informationssystem
URL: http://www.aeiou.at
[AEIOU97b]
Musik-Album des AEIOU-Informationssystem
URL: http://www.aeiou.at/aeiou.musalbum
[AEIOU97c]
Musik-Album des AEIOU-Informationssystem
URL: http://www.aeiou.at/aeiou.film
[GLOSSAR99]
Internet Glossar.
URL: http://www.bernnet.ch/htm/glossar.htm
[MICROSOFT97a]
MICROSOFT CORPORATION; The Microsoft Internet
Explorer. URL: http://www.microsoft.com
[MICROSOFT97b]
Microsoft Developer Network.
URL: http://www.microsoft.com
[MOSER96]
MOSER MATTHIAS; The PLACE Language.
URL: http://www.iicm.edu/wm_doc/place
[NETSCAPE97]
NETSCAPE CORPORATION; Netscape Navigator.
URL: http://www.netscape.com
[REALNETWORK98]
Real Networks.
URL: http://www.Real Networks.com
[REISINGER96]
REISINGER BRUNO; General Information about Hyperwave
Tools. URL: http://www.iicm.edu/hw_tools
[VIVO98]
Vivo Software.
URL: http://www.vivo.com
[W3C97]
World Wide Web Consortium.
URL: http://www.w3.org
141
LINKSAMMLUNG
[WOTSIT99]
Wotsit’s Format The Programmer’s Resource
URL: http://www.wotsit.org
142

Aufbereitung von Audio- und Videodaten für das Musik

Transcrição

Documentos relacionados

Page 1 of 1 DENON | DCD-CX3 | CD/SACD

Multimediale Werkzeuge, Audio: Formate, Tools

lucas 1000 - DJ OldFischi

Knopf HiFi Düsseldorf

Audio System F4-380 Preis: 350 Euro

Datenblatt Kenwood KDC-3054UR Integrierter Decoder zum

Creative USB Sound Blaster X

HF Art.-Nr.: C003

Testbericht MKI

2011-08-2