tAT-HF 1 - artecast

Transcrição

tAT-HF 1 - artecast
Grundlagen der Audiotechnik – tAT-HF
Von Karl Petermichl und Karl M. Slavik
CV Karl M. Slavik
•
•
•
•
•
•
•
•
Dipl.Paed. Ing. Karl M. Slavik, Jahrgang 1960
Lehre, HTL und Pädagogik-Studium
Sprecher- und Moderatorenausbildung
Seit 1981 im Medienbereich, u.a. als Tonmeister,
AV-Gestalter, Journalist
1999 – 2005 Toningenieur / Projektleiter beim ORF
Seit 02/2005 selbständig als Autor, Trainer und
Berater für Medientechnik & Kommunikation
Lehraufträge an der FH Hagenberg, BS für
Veranstaltungstechnik, Univ. Wien
Freizeit: DJ/VJ, Medienkunst
© 2006 by Karl Petermichl und Karl M. Slavik
1
Inhalte 01
•
Historische Entwicklung der Rundfunktechnik
•
Grundlagen der Akustik (Gehör, Sprache, Schallausbreitung, Psychoakustik)
•
Schallwandler: Mikrofon, Kopfhörer, Lautsprecher
•
Aufnahmegeräte (Cassette, DAT, MiniDisc, Flashcard- und HD-Recorder)
•
Studiogeräte (CD, DVD, Platte, Band)
•
Bearbeitungsgeräte (Audioworkstation, Mischpult, Effekte)
•
Hörfunkspezifische Anwendungen (Mono-Stereo, Geräusche, OTs, Musik)
•
Analog-Digitalwandlung und Datenreduktion in der Audioverarbeitung
© 2006 by Karl Petermichl und Karl M. Slavik
Inhalte 02
•
Audio- und Fileformate bei Apple, Windows und Linux
•
Übertragungstechnik analog und digital (Telefon, ISDN, Netzwerk)
•
Audio-Streaming, Download, Podcasting
•
Audio-Software und Plug-Ins für Computer
•
Die Schnittsoftware AUDACITY im Detail
•
Praktische Aufnahme- und Schnittübungen
•
Übergabe der fertigen Materialien per E-Mail, FTP und Datenträger
© 2006 by Karl Petermichl und Karl M. Slavik
2
Entwicklung der Audiotechnik
© 2006 by Karl Petermichl und Karl M. Slavik
Entwicklung der Audiotechnik
1857 - Théodore du Moncel, Prinzip des Kohlemikrofons
1861 - Erste Musikübertragung: "Waldhornsolo", J.P. Reis.
1862 - H. v. Helmholtz, „Lehre von den Tonempfindungen“
1881 - Weltausstellung, Stereo-Übertragung aus der Pariser Oper
1900 - Hören zu Hause wird üblich – sogar in Stereo
1900 - Valdemar Poulsen, Draht-Magnetophon
1906 - Elektronenröhre, Robert v. Lieben und Lee de Forest
1910 - Verstärkerröhre mit Steuergitter, Robert von Lieben
1910 - Erste Rundfunkübertragung, Lee de Forest, Enrico Caruso
1924 - Rundfunk wird zum täglichen Dienst (AM-Modulation)
© 2006 by Karl Petermichl und Karl M. Slavik
3
Entwicklung der Audiotechnik
1930 - Elektrische Aufnahmen auf Schallplatte werden Standard
1932 - Tonband, Fritz Pfleumer
1936 - HF-Vormagnetisierung, bei AEG durch „Zufall“ entdeckt
1941 - Walt Disneys "Fantasia", erstmals "Surround"-Kinoton
1948 - Transistor (Bell Laboratories), ab 1959 in der Praxis
1948 - UKW-Rundfunk in Europa (FM-Modulation)
1950 - Film-Magnetton, 4 bis 6 Spuren
1955 - Stereo-Aufnahmetechnik setzt sich durch
1958 - Stereo-Schallplatte, "Living Stereo", HiFi
1959 - Jack St. Clair Kilby erforscht ICs auf Halbleiterbasis
© 2006 by Karl Petermichl und Karl M. Slavik
Entwicklung der Audiotechnik
1961 - Stereo-Rundfunk in Europa
1966 - Mehrspuraufnahmen, "Sgt. Peppers…" (Beatles)
1967 - Erste Drahtlos-Mikrofone auf deutschen Showbühnen
1970 - Dolby B, erstmals angewandte Psychoakustik
1970 - Compact Cassette (Philips)
1972 - Quadrofonie: SQ, CD4, Tonabnehmer bis 45 kHz
1974 - Dolby A Studio-Rauschunterdrückung
1976 - Dolby Stereo (4-Channel opt.), Ken Russell's "Lisztomania“
1976 - Erster praktischer Einsatz von Lichtleitern
1978 - Rauschunterdrückung: Telcom C4, HiCom, dbx
© 2006 by Karl Petermichl und Karl M. Slavik
4
Entwicklung der Audiotechnik
1980 - Laser Disc (USA, Japan)
1981 - Direct Metal Mastering (DMM for Vinyl)
1981 - Dolby C Rauschunterdrückung, HiCom
1982 - Compact Disc - 16 Bit
1982 - Dolby Surround (3 Channels)
1982 - R-DAT - 16 Bit
1983 - Dolby SR Studio-Rauschunterdrückung (SNR > 108dB)
1986 - Stereo-Ton beim Fernsehen
1986 - Leistungsfähige DSPs ermöglichen Digitalpulte, etc.
1987 - Dolby-SR Filmton (4-Kanal-Matrix)
© 2006 by Karl Petermichl und Karl M. Slavik
Entwicklung der Audiotechnik
1995 - Internet-Audio, Audio über TCP/IP wird zum Standard
1997 - DVD-Video - erstmals 24 Bit / 96 kHz
1998 - SACD (DSD), DVD-Audio: Vorstellung in Amsterdam
1998 - RealAudio, WMA, MP3 beginnen Siegeszug
1999 - SACD und DVD-Audio lieferbereit
2000 - Mobile Audioproduktion wird Realität (Notebook, WLAN)
2001 - ATM und LNet flächendeckend. Das Ende der Echtzeit?
2003 - Der ORF sendet als erster öffentlich-rechtlicher Broadcaster
Europas TV mit Ton in Dolby Digital
2004 - Auch der ORF-Hörfunk sendet in Dolby Digital & Prologic II
© 2006 by Karl Petermichl und Karl M. Slavik
5
Grundlagen der Akustik
© 2006 by Karl Petermichl und Karl M. Slavik
Schall und Schallausbreitung
Definition: “Mechanische Schwingungen eines elastischen Mediums im
Frequenzbereich des menschlichen Hörens”
Medium:
Feste, flüssige oder gasförmige Stoffe, im Vakuum keine
Schallübertragung möglich
Verlauf:
Periodisch = harmonische Schwingung = Ton
Unperiodisch = unharmonische Schwingung = Geräusch
Merkmale: Schallgeschwindigkeit in Luft = 343 m/s
Amplitude = größte Auslenkung [V, dBSPL, Phon)
Frequenz = Anzahl der Schwingungen pro Sekunde [Hz]
Wellenlänge = Abstand der Wiederholungen [m]
Richtung: Bei Frequenzen unterhalb von etwa 250 Herz breitet sich
Schall in Luft kugelförmig aus, darüber zunehmend
keulenformig.
© 2006 by Karl Petermichl und Karl M. Slavik
6
Schall und Schallausbreitung
Die Schwingungen der
Stimmgabel erzeugen
periodische
Luftdruckänderungen
+
Schwingungsdarstellung
mit Amplitude, Frequenz
und Wellenlänge entlang
der Zeitachse.
-
© 2006 by Karl Petermichl und Karl M. Slavik
Schallausbreitung
Schall breitet sich in verschiedenen Medien unterschiedlich schnell aus:
• Gummi: Etwa 80 m/s
• Luft: 343 m/s (bei 20°C, auf Seehöhe, bei 60% Frel)
• Wasser: 1.480 m/s
• Hartholz: etwa 3.500 m/s
• Stahl: etwa 5.000 m/s
Bei Frequenzen unterhalb von etwa 250 Herz breitet sich Schall in Luft
kugelförmig aus, darüber zunehmend gerichtet (keulenförmig).
© 2006 by Karl Petermichl und Karl M. Slavik
7
Raumakustik
Wirkung:
Abgestrahlte Schallwellen werden an den Begrenzungswänden reflektiert. Dies beeinflußt unsere Wahrnehmung –
das Schallereignis wird in einen örtlichen Kontext gestellt:
außen - innen - kleiner Raum - großer Saal - nahe - entfernt
Abstand:
Die Schallintensität nimmt mit dem Quadrat der Entfernung
ab nahe an die Schallquelle herangehen…
Frequenz: Die Luftmoleküle dämpfen hohe Frequenzen stärker als tiefe
Frequenzen in der Entfernung klingt’s “dumpfer”
Radius:
Der Hallradius gibt die Entfernung von der Schallquelle an,
bei der die Reflexionen gleich laut wie der Direktschall sind
hallige Räume haben einen kleinen Hallradius
nahe an die Schallquelle herangehen…
© 2006 by Karl Petermichl und Karl M. Slavik
Raumakustik
Im Freien gibt es kaum Reflexionen.
In kleinen Räumen entstehen kurze,
diskret wahrnehmbare, dichte
Refexionen (“Shatter”, “Echo”)
In großen Räumen hört man erst mit
zeitlichem Abstand zum Direktschall
nichtdiskreten “Hall” … ist weniger
störend für die Sprachverständlichkeit
als die kurzen Reflexionen.
Die Zeit von 150 ms nach dem
Direktschall ist für die Verständlichkeit
ausschlaggebend.
© 2006 by Karl Petermichl und Karl M. Slavik
8
Ton und Klang
Definition:
Ein Ton ist eine periodische Schwingung mit einer
gewissen Frequenz [Hz].
Klang:
Jedes natürliche Instrument erzeugt gemeinsam mit dem
Grundton auch ganzzahlige Oberwellen. An der
Ausformung der Oberwellen erkennt man das Instrument.
Formanten: Speziell bei der Stimme werden anatomisch bedingt
gewisse Frequenzen unabhängig von der gesungenen
Tonhöhe immer besonders betont. Daran erkennt man
unterschiedliche SängerInnen.
Verlauf:
Neben dem statischen Frequenzgemisch ist besonders
auch der zeitliche Verlauf der Obertöne für den
Instrumententyp wesentlich (Klavier – Violine)
Dynamik:
Bei leiser Spielweise werden meist weniger Obertöne als
bei starkem Spiel erzeugt.
© 2006 by Karl Petermichl und Karl M. Slavik
Phase
Jede periodische Schallwelle
zeigt abwechselnd eine positive
und negative Auslenkung, dies
übersetzt sich in die Bewegung
des Lautsprechers beim Hörer.
Verstärkung
Auslöschung
Treffen zwei Schallwellen mit
gegengesetzter Auslenkung
aufeinander, wird der
Gesamtklang leiser und dünner
sein als die einzelne Welle. Dies
kann bei Aufnahmen oder auch
bei der elektrischen Mischung
auftreten, bis hin zur kompletten
Auslöschung (Mono-Signal
gegenphasig auf den beiden
Stereo-Kanälen)
© 2006 by Karl Petermichl und Karl M. Slavik
9
Hören und Psychoakustik
Unser Ohr ist die Schnittstelle zwischen mechanischen Schallwellen
(Druckänderungen der Luft) und unserer Wahrnehmung.
• Statischer Luftdruck auf Seehöhe: 100.000 pa (Pascal) ≈ 1 bar
• Schalldruck: Maximal 100 pa (≈ 135 dBA >> Schmerzgrenze)
Hören als Gesamtprozess basiert auf zwei Grundelementen:
• Das Ohr: Schallwandlung und Vorfilterung (ähnlich wie ein Mikrofon)
• Das Gehirn: Schallwahrnehmung (Interpretation, Verarbeitung)
© 2006 by Karl Petermichl und Karl M. Slavik
Hören und Psychoakustik: Das Ohr
Aussenohr
Mittelohr
Das Außenohr ist ein
richtungsempfindlicher
akustischer Filter.
Innenohr
Ab einem Schalldruckpegel von etwa 85 dB(A)
wirkt ein Schutzbegrenzer
(Limiter): Muskelkontraktion entlang der Gehörknöchelchen im Mittelohr.
Ohrmuschel
Ohrkanal
Trommelfell
Hörnerv
Gehörknöchelchen
(Hammer, Amboss, Steigbügel)
Schallwandlung erfolgt
über 18.000 Haarzellen in
der Cochlea (Innenohr).
© 2006 by Karl Petermichl und Karl M. Slavik
10
Hören und Psychoakustik: Verarbeitung
Hybrider Prozess aus analoger
und digitaler EchtzeitSignalverarbeitung
Multibit-Bus (etwa 36.000 Nervenfasern) verbindet Ohr mit Gehirn
Multibit-Processing
Botenstoffe (Neurotransmitter)
zwischen Synapsen des Gehirns
bestimmen unsere Wahrnehmung
© 2006 by Karl Petermichl und Karl M. Slavik
Hören und Psychoakustik: AD-Wandlung
Bis etwa 1.200 Hz senden einzelne
Nervenfasern einzelne Impulse
Ab etwa 1.200 Hz senden Gruppen
von Nervenfasern Impulse
Daher: Parallele Multibit-A/DWandlung
Echtzeit-Spektralanalyse inkl.
Tonhöhenwahrnehmung
Mikrosekunden
© 2006 by Karl Petermichl und Karl M. Slavik
11
Hören und Psychoakustik: Tonhöhe
110 dBA
Ca. 60 - 80 dBA
Zu lautes Hören > 90 dB(A)
via Kopfhörer, Ohrhörer
oder Lautsprecher
verändert die Tonhöhenwahrnehmung – und
schädigt das Gehör!
© 2006 by Karl Petermichl und Karl M. Slavik
Hören und Psychoakustik: Frequenzgang
Weitester, linearster
Frequenzgang bei
etwa SPL = 85 dBA
© 2006 by Karl Petermichl und Karl M. Slavik
12
Hören und Psychoakustik: Frequenz
Je nach Frequenz werden Töne
schon bei kleiner oder erst bei
größerer Amplitude gehört
(Hörkurve).
Am Empfindlichsten zeigt sich
das Ohr im Sprachbereich. Das
Maximum liegt im Bereich von
etwa 2 - 3 kHz.
Sprache liegt im Frequenzbereich von ~ 100 bis 7.000 Hz.
© 2006 by Karl Petermichl und Karl M. Slavik
Hören: Richtungswahrnehmung
Interaurale Pegeldifferenz ermöglicht
Ortung durch die frequenzabhängige
Laustärkeabschattung des Schädels.
Interaurale Zeitdifferenz ermöglicht
Ortung durch die unterschiedliche
Signallaufzeit von der Schallquelle
zum linken bzw. rechten Ohr.
( Stereo-Mikrofonie)
L
R
Die Hörverarbeitung im Gerhirn trägt
dazu noch Effekte wie den “CocktailParty-Effekt” und “Cognitive Mapping”
bei. Damit können diskrete “Streams”
separiert werden, Sprache wird auch
unter dichter Geräuschkulisse noch
verstanden.
© 2006 by Karl Petermichl und Karl M. Slavik
13
Hören: Richtungswahrnehmung
Interaurale Pegeldifferenz ermöglicht
Ortung durch die frequenzabhängige
Laustärkeabschattung des Schädels.
Interaurale Zeitdifferenz ermöglicht
Ortung durch die unterschiedliche
Signallaufzeit von der Schallquelle
zum linken bzw. rechten Ohr.
( Stereo-Mikrofonie)
Die Hörverarbeitung im Gerhirn trägt
dazu noch Effekte wie den “CocktailParty-Effekt” und “Cognitive Mapping”
bei. Damit können diskrete “Streams”
separiert werden, Sprache wird auch
unter dichter Geräuschkulisse noch
verstanden.
© 2006 by Karl Petermichl und Karl M. Slavik
Hören/Psychoakustik: Verdeckung
Laute Signale verdecken
leise Signale.
Laute Impulse verdecken
Signale zeitlich nachher
und auch vorher.
Frequenzen unterhalb der
Hörschwelle werden nicht
wahrgenommen.
Anwendungen in der
verlustbehafteten
Datenreduktion (mp3)
© 2006 by Karl Petermichl und Karl M. Slavik
14
Hören und Psychoakustik: Ergebnisse 1
Gemischt analog-digitales System (hybrid)
Frequenzgang des gesunden Ohres: 15 - 20.000 Hz
Frequenzgang ist schalldruckabhängig.
Bandbreitenverlust: Etwa 100 - 200 Hz pro Jahr
Wahrnehmungsbandbreite jedoch: 1 Hz - 45.000 Hz
Systemdynamik des Gehörs: Etwa 120 dBA
Basierend auf: “Ears are Analogue?” Artikelserie von Dr. Wesley A. Bulla, AudioMedia, Februar - April 2001.
© 2006 by Karl Petermichl und Karl M. Slavik
Hören und Psychoakustik: Ergebnisse 2
Räumliche Wahrnehmung: horizontal auf ± 3° genau
Richtcharakteristik frequenzabhängig
Klirrfaktorwahrnehmung: Je nach Frequenz k = 1,2 - 3 %
Ideale Mischlautstärke am Regieplatz: SPL = 75 bis 95 dBA
Maximale Tonhöhenerkennung: SPL = 60 - 80 dBA
Fazit: Ein ideales Audiosystem muss den Eigenschaften des
menschlichen Gehörs entsprechen.
Basierend auf: “Ears are Analogue?” Artikelserie von Dr. Wesley A. Bulla, AudioMedia, Februar - April 2001.
© 2006 by Karl Petermichl und Karl M. Slavik
15
Schallwandler
© 2006 by Karl Petermichl und Karl M. Slavik
Schallwandler: Definition
•
Mikrofone wandeln Schallwellen
in elektrische Signale um.
•
Kopfhörer und Lautsprecher
wandeln elektrische Signale in
Schallwellen um.
© 2006 by Karl Petermichl und Karl M. Slavik
16
Schallwandler: Das Mikrofon
Mikrofone werden nach folgenden Kriterien unterschieden:
•
Wandlerprinzip: Dynamisches Mikrofon, Kondensatormikrofon
•
Einsatzbereich und Bauform: Reportagemikrofon, Studiomikrofon
•
Richtcharakteristik: Kugel, Niere, Superniere, Keule, Acht
© 2006 by Karl Petermichl und Karl M. Slavik
Schallwandler: Richtcharakteristik
© 2006 by Karl Petermichl und Karl M. Slavik
17
Schallwandler: Studiomikrofon
Beispiel: Studio-Kondensatormikrofon AKG C414
Einsprachekorb (zugleich Basis-Windschutz)
Dahinter Mikrofonkapsel
Schalter für Richtcharakteristik
Eingebauter Vorverstärker
XLR-Anschluss für Mikrofonkabel
© 2006 by Karl Petermichl und Karl M. Slavik
Schallwandler: Reportagemikrofon
Beispiel: Kondensatormikrofon AKG C1000
Einsprachekorb (zugleich Basis-Windschutz)
Dahinter Mikrofonkapsel
Ein- Ausschalter
Eingebaute Batterie (9V),
auch Phantomspeisung möglich
XLR-Anschluss für Mikrofonkabel
© 2006 by Karl Petermichl und Karl M. Slavik
18
Schallwandler: Lautsprecher
Beispiel: Aktiver 2-Weg Studiomonitor
KRK V6
Hochton-Lautsprecher
Bassreflex-Gehäuse
Tiefton-Lautsprecher
Zwei eingebaute Verstärker (Aktivsystem)
Bassreflex-Öffnung
© 2006 by Karl Petermichl und Karl M. Slavik
Aufnahmemedien und Geräte
© 2006 by Karl Petermichl und Karl M. Slavik
19
Aufnahmemedien & Geräte
© 2006 by Karl Petermichl und Karl M. Slavik
Aufnahmemedien: Übersicht
Compact Cassette (CC). Analoges, lineares Medium.
Bewährt, kostengünstig, sehr robust und zuverlässig
(wenn man´s richtig macht), Profigeräte verfügbar.
Nachteil: Echtzeit-Überspielung in AWS, beschränkte
Tonqualität.
MiniDisc (MD). Digitales, non-lineares Medium. Kostengünstig, als NetMD auch für Drag & Drop geeignet.
Skalierbare, relativ hohe Audioqualität (Hi-MD). Nachteil:
mechanisch fragil, kaum Profigeräte verfügbar.
Flash Card (CF, SD, MMC). Digitales, non-lineares
Medium ohne bewegte Teile. Sehr robust, auch für
Drag & Drop geeignet, skalierbare, sehr hohe Audioqualität schnellstes Medium. Nachteil: Geräte und
Medien (noch) relativ teuer.
© 2006 by Karl Petermichl und Karl M. Slavik
20
Aufnahmemedien: Übersicht
DAT (Digital Audio Tape). Digitales, lineares Medium.
Bewährt aber teuer, relativ robust und zuverlässig (wenn
man´s richtig macht), sehr hohe Tonqualität. Keine
portablen Geräte mehr verfügbar. Nachteil: EchtzeitÜberspielung in AWS.
Tonband (Tape). Analoges, lineares Medium. Kostengünstig, direkt schneidbar. Skalierbare, sehr hohe
Audioqualität (9,5 – 38 cm/s). Nachteil: Geräte teuer,
Einsatz nur mehr im Studio (selten).
Computer-Recording (Audio-Workstation). Digitales,
non-lineares Medium. Im Studio und als mobile Workstation sehr bewährt. Skalierbare, sehr hohe Audioqualität. Nachteil: Bei mobilen Aufnahmen sehr
unhandlich.
© 2006 by Karl Petermichl und Karl M. Slavik
Aufnahmemedien: Workflow
Cassetten-Recorder
Flashcard-Recorder
Reportagemikrofon
Reportagemikrofon
1
2
Flashcard
USB/Firewire
Audio-Converter (USB od. Firewire)
Anschluss für Mikrofone, Kopfhörer,
externe Geräte (CD, DAT, MD,
Cassettengerät)
PC / Audioworkstation mit Flashcard –
Reader, Bildschirm, Keyboard und
Audiosoftware (CD-Grabber-SW, DIGAS)
Studiomikrofon
© 2006 by Karl Petermichl und Karl M. Slavik
21
Aufnahmemedien: Cassette 1
3-Kopf-System (erlaubt „Hinterbandkontrolle“)
Batteriefach
Kopfhöreranschluss
mit Lautstärkesteller
Aussteuerungsmesser (VU)
und Peak-Anzeige
Bedienelemente für Limiter,
autom. Aussteuerung (ALC),
Eingangswahl (Line/Mic-Tel).
Aufnahmepegelsteller und Moduswahl
(manuell, automatisch/ALC, Limiter)
Mikrofonanschluss
XLR-Buchse, symmetrisch
© 2006 by Karl Petermichl und Karl M. Slavik
Marantz PMD222
Robustes Mono-Gerät
Eingebautes Mikrofon+Lautsprecher
Mikrofoneingänge auf XLR (symmetrisch)
Pegelaussteuerung manuell, mit Limiter, oder automatisch
Mikrofonpegel-Abschwächung um -10dB und -20dB
Bandwahlschalter für 3 Bandsorten
Direkte Aufnahme von Telefongesprächen
Echte Nachbandkontrolle (Abhören über Band / Confidence-Monitoring)
Klangfilter für Aufnahme und Wiedergabe
Separater Line-Eingang und Line-Ausgang
Tonhöhen-Regulierung in der Wiedergabe
Bandgeschwindigkeit halbierbar, um die Aufnahmezeit zu verdoppeln (die
Qualität wird dadurch aber schlechter)
© 2006 by Karl Petermichl und Karl M. Slavik
22
Aufnahmemedien: Cassette 2
WICHTIGE FRAGEN VOR DEM KAUF:
Qualität der Mikrofon-Eingänge (Rauschen)?
Aussteuerungs-Anzeige? Pegelsteller für Aufnahmepegel?
ALC (Automatic Level Control)? Limiter?
Professionelle, robuste Anschlüsse (XLR)?
Tiefencut (Hochpass-Filter)?
Mithören auf Kopfhörer während der Aufnahme? Hinterbandkontrolle?
Akku und/oder Batterien?
Dolby B und Dolby C (Rauschunterdrückungssystem)?
Guter Gleichlauf (keine hörbaren Tonhöhenschwankungen)?
Umschaltbar auf verschiedene Bandsorten (Fe, CrO2)?
Tonköpfe leicht zu reinigen (Wattestäbchen mit Spiritus getränkt)?
© 2006 by Karl Petermichl und Karl M. Slavik
Aufnahmemdien: MiniDisc 1
Batteriefach
Laufwerksteuerung
Aufnahmepegelsteller
Mikrofonanschluss
XLR-Buchsen,
symmetrisch
REC-Button
& Marker
MD-Fach
Bedienelemente für
Menüführung, Setup, Input, etc.
Montagepunkt
für Trageriemen
Kopfhöreranschluss
mit Lautstärkesteller
Funktionstasten F1 … F3
Aussteuerungsmesser/Peak-Anzeige
Status-Display
© 2006 by Karl Petermichl und Karl M. Slavik
23
Aufnahmemedien: MiniDisc 2
WICHTIGE FRAGEN VOR DEM KAUF:
Qualität der Mikrofon-Eingänge (Rauschen)?
Aussteuerungs-Anzeige? Pegelsteller für Aufnahmepegel?
ALC (Automatic Level Control)? Limiter?
Professionelle Anschlüsse (XLR)?
Tiefencut (Hochpass-Filter)?
Mithören auf Kopfhörer während der Aufnahme?
Wählbares Aufnahme-Format ? (Bei MD nur ATRAC, bei HD-MD auch
WAV / Linear, MP3, AAC)
Aufnahmedauer?
Akku und/oder Batterien?
Überspielung zur Workstation: Über USB? Oder nur in Echtzeit?
Analoge und digitale Ein- und Ausgänge?
© 2006 by Karl Petermichl und Karl M. Slavik
Aufnahmemedien: Flashcard 1
Bedienelemente für Limiter, autom.
Aussteuerung, Phantomspeisung
Batteriefach
Mikrofonanschluss
auf XLR-Buchse,
symmetrisch
Kopfhöreranschluss
mit Lautstärkesteller
Fach für 2 CF-Cards
(max. 2 x 1 Gigabyte,
ca. 20 Std. in Sendequalität)
Aufnahmepegelsteller
(manuell od. automatisch)
Aussteuerungsmesser
(Peak-Anzeige), Stausdisplay,
Menüführung
© 2006 by Karl Petermichl und Karl M. Slavik
24
Aufnahmemedien: Flashcard 2
Maycom Handheld Recorder & Mayah Flashman
Mikrofon und Flashcard-Recorder in einem.
Kann mit externen Quellen verbunden werden.
Datenaustausch über Docking-Station (USB).
© 2006 by Karl Petermichl und Karl M. Slavik
Aufnahmemedien: Flashcard 3
WICHTIGE FRAGEN VOR DEM KAUF:
Qualität der Mikrofon-Eingänge (Rauschen)?
Aussteuerungs-Anzeige? Pegelsteller für Aufnahmepegel?
ALC (Automatic Level Control)? Limiter?
Professionelle Anschlüsse (XLR)?
Tiefencut (Hochpass-Filter)?
Mithören auf Kopfhörer während der Aufnahme?
Wählbares Aufnahme-Format (MPEG Layer II, WAV / Linear, MP3, AAC)?
Aufnahmedauer?
Akku und/oder Batterien?
Überspielung zur Workstation: Über USB? Firewire? Flashcard & Reader?
© 2006 by Karl Petermichl und Karl M. Slavik
25
Aufnahmegeräte: DAT
Aussterbendes Format höchster Qualität
Verwendung für Filmton, Musik, Hörspiel
und Feature
Cassetten oft nur mehr als Daten-Band
erhältlich, nicht sehr robust
Digitale Aufnahme in bester linearer
Qualität
Geräte weisen oft umfangreiche
Möglichkeiten für Mikrofonanpassung auf
Meist hochwertige, symmetrische XLREingänge
Oft Phantomspeisung (48V) für
Kondensator-Mikrofone vorhanden
Digitale Ein- und Ausgänge
© 2006 by Karl Petermichl und Karl M. Slavik
Aufnahmemedien: Computer
•
•
•
•
•
•
•
Laptops für mobile Aufnahme/Nachbearbeitung
Heim-PC für Nachbearbeitung
Eingebaute Soundkarten meist NICHT für gute
Mikrofonaufnahmen geeignet
Daher Audio-Interface als Steckkarte oder extern
über USB oder Firewire
Große Festplatten machen Datenbanken zur
Verwaltung notwendig
Laptops müssen für zuverlässige
Audioaufnahme optimiert werden
Rauer Betrieb im Freien nicht machbar
Mackie Spike
© 2006 by Karl Petermichl und Karl M. Slavik
26
Aufnahmemedien: Zubehör
Richtmikrofon mit Rycote-Windschutz
und Pistolengriff
Kopfhörer
Equipmenttasche (mit DAT-Recorder)
Hochflexibles Mikrofonkabel,
XLR-Stecker mit Goldkontakten
© 2006 by Karl Petermichl und Karl M. Slavik
Aufnahmepraxis & Tipps
© 2006 by Karl Petermichl und Karl M. Slavik
27
Aufnahmepraxis: Tipps 1
Mikrofone
Monomikrofon, Niere, dynamisch für einfache Interviews
Monomikrofon, Niere, Kondensator für besseren Klang (Speisung!)
Stereomikrofon für Atmo, Geräusche und Musik
Kabel
Mikrofonkabel sind empfindlich gegen Einstreuungen
Daher möglichst kurz halten
Möglichst nicht bewegen während Aufnahme
Stecker sorgfältig einrasten (Verpolung!)
Bei Mono-Mikrofonen Aufteilung auf beide Eingänge des
Aufnahmegerätes verwenden (sonst nur eine Seite bespielt)
© 2006 by Karl Petermichl und Karl M. Slavik
Aufnahmepraxis: Tipps 2
Pegel
Mikrofone liefern sehr kleine Spannungspegel, die Mikrofoneingänge
sind deshalb sehr empfindlich. Keinesfalls darf man den Ausgang
eines anderen Gerätes (Mischpult, Verteilverstärker) an einen
Mikrofoneingang anschließen (ergibt starke Verzerrrungen).
Aussteuerung
Aufnahme immer so aussteuern, dass der Pegel im Mittel etwa 80%
vom Maximum beträgt.
Profis: Manuelle Aussteuerung, Limiter EIN, AGC AUS.
Weniger Erfahrene: Automatische Aussteuerung, AGC EIN.
© 2006 by Karl Petermichl und Karl M. Slavik
28
Aufnahmepraxis: Aussteuerung
Untersteuerung: Zu geringer
Signalpegel verschlechtert
den Signal-Rauschabstand.
Ergebnis: Störgeräusche
(Rauschen) werden hörbar.
Richtige Aussteuerung: Sie
stellt das optimale Verhältnis
zwischen möglichst geringem
Grundrauschen und möglichst
geringen Verzerrungen her.
Übersteuerung: Zu großer
Aufnahmepegel führt zu
Verzerrungen. Digitale
Systeme reagieren weit
empfindlicher als analoge.
Aussteuerungsgrenze
Pegelbereich
Systemrauschen
© 2006 by Karl Petermichl und Karl M. Slavik
Aufnahmepraxis: Tipps 3
News
Direkter, trockener, konkreter Klang in Mono, hohe
Sprachverständlichkeit. Unbedingt Verkehrslärm
vermeiden ( Schneideprobleme). Auch kleine,
hallige Räume vermeiden („WC-Klang“).
Feature
Interviewklang je nach gewünschter Stimmung (auch
Distanz zulassen). Zusätzlich auch nur Geräusche
bzw. Raumklang als „Atmo“ aufnehmen. Interviews in
Mono, Umgebung in Stereo.
Musik
Gute Balance aller Instrumente zueinander erreichen.
Gute Balance zwischen Direktschall – Hallanteil.
© 2006 by Karl Petermichl und Karl M. Slavik
29
Schnittstellen: Analog
Insert: Dienst zum „Einschleifen“ von Effektgeräten.
Klinken-Buchse, Pegel etwa 100 mV … 2 V, unsymmetrisch.
In und Out auf einer Buchse!
Line: Für CD-Player, AWS, Cass., etc.
Klinken-Buchse, Pegel etwa 100 mV … 2 V, symmetrisch.
Mic: Für Mikrofon (manchmal auch für Line, schaltbar).
XLR-Buchse, Pegel etwa etwa 1 … 100 mV, symmetrisch.
Tape: Für Aufnahme/Wiedergabe.
Cinch-Buchsen, Pegel etwa 300 - 700 mV, unsymmetrisch.
Rot = Rechts, Weiß = Links.
Mikrofon an Line: Zu geringer Pegel = schlechte Aussteuerung, Rauschen steigt!
Line an MIC-Input: Zu hoher Pegel = Übersteuerung, Verzerrungen steigen an!
© 2006 by Karl Petermichl und Karl M. Slavik
Ein- und Ausgänge
Ein Kabel führt immer von einem Ausgang zu einem Eingang. Die
beiden Seiten müssen in folgenden Parametern zusammenpassen:
• Signalspannung (in Volt) oder Pegel (in dB)
• Kanalzahl (Mono, Stereo, Surround)
• Widerstand (Impedanz)
• Samplingfrequenz
Eiserne Regeln
• Mikrofon immer nur am Mikrofon-Eingang anstecken (MIC IN)
• Line-Ausgang immer nur am LINE-IN anstecken
• Analoge Geräte analog verbinden (z.B. Kassettenrecorder zu Mischpult)
• Digitale Geräte nur digital verbinden (z.B. MiniDisc zu Audio-Workstation)
© 2006 by Karl Petermichl und Karl M. Slavik
30
Schnittstellen: Kabel und Stecker
•
XLR: Mechanisch verriegelt, elektrisch isoliert,
symmetrische Signalführung minimiert Einstreuungen
aber nur wenn an beiden Seiten XLR…
beste Wahl für Mikrofonanschlüsse
•
Klinke: 6,3mm (= große Klinke) für semiprofessionelle Geräte und Kopfhöreranschluss im
HiFi-Bereic. Symmetrisch oder unsymmetrisch,
Mono/Stereo
•
Klinke: 3,5mm (=Miniklinke) durchgängig im
Consumer-Markt. Als Kopfhöreranschluss bei allen
MP3-Playern, als Mikrophoneingang bei allen MDGeräten. Mechanisch instabil, Kontaktprobleme
Unsymmetrisch, Mono oder Stereo.
•
Cinch: Standardanschluss im HiFi-Sektor
Meist nur für Line-Signale, mechanisch robust, gute
Kontaktgabe, nur in Mono erhältlich (2 für Stereo).
© 2006 by Karl Petermichl und Karl M. Slavik
Signalkette Aufnahme und Abhören
LINE IN
Kopfhörer
HiFi-Verstärker
Aufnahmegerät
LINE OUT
PHONES
MIC IN
Mikrofon
Lautsprecher
© 2006 by Karl Petermichl und Karl M. Slavik
31
Marantz PMD222: Einstellungen 1
Level = Mitte (Lautstärke im Lautsprecher oder Kopfhörer – wichtig!)
Tone = Mitte (Klangfilter für Wiedergabe - unwichtig)
Monitor = Source (zur Wiedergabe und Aufnahmekontrolle auf „Tape“ stellen – Achtung, in diesem Fall
verzögert!)
Pitch = Mitte (Änderung der Abspielgeschwindigkeit – wichtig!)
Tape Speed = Standard (Bandgeschwindigkeit – wichtig!)
Record Level = auf gute Aussteuerung einstellen – sehr wichtig!
Record Mode = auf „Manual“ einpegeln, dann auf Limiter (nicht ALC!!!)
ANC = „Flat“ oder „Low Cut“ (bei starkem Wind), nicht „Low+Hi Cut“ (dumpf!)
Input Selector = „Mic/Tel“ für Mikrophon, „Line“ für Überspielung von Line-Pegel
Mic Att = Mikrofonabschwächung (0 im Normalfall – wichtig!)
XLR-ECM = Auswahl internes oder externes Mikrofon (XLR = extern vorne)
SPKR MON = interner Lautsprecher Ein-Aus (besser Aus, sonst Koppeln)
© 2006 by Karl Petermichl und Karl M. Slavik
Marantz PMD222: Einstellungen 2
Buchsen:
Phones = Kopfhörer (schaltet internen Lautsprecher ab)
XLR Eingang = Externes Mikrophon (gute Qualität)
Microphone = Externes Mikrophon Mini-Klinke (nicht so gut)
Line Input + Output = Cinch-Buchse für Überspielungen von+zu Line-Pegel
Remote = Fernsteuerung / Telephone = Telefonaufnahme / Ext Spkr = Lautsprecher
Aussteuerung:
Das VU-Meter (Zeigerinstrument) sollte oft in den rechten Bereich ausschlagen, die PeakAnzeige (rote Leuchtdiode) ab und zu aufleuchten. Wenn diese ständig leuchtet, dann
Record Level zurückdrehen oder Mikrophon-Dämpfung zuschalten oder auf Line-Eingang
umschalten. Wenn das VU-Meter eher links bleibt, ist die Schallquelle zu schwach, oder
die Batterie im Mikrophon geht zur Neige.
© 2006 by Karl Petermichl und Karl M. Slavik
32
Studiogeräte
© 2006 by Karl Petermichl und Karl M. Slavik
Studiogeräte: Produktionsstudio
Protools
Radiomax & Digas
Mischpult
CD, DVD, MD, DAT, CASS
Bandmaschine
© 2006 by Karl Petermichl und Karl M. Slavik
33
Studiogeräte: Mischpult (analog)
© 2006 by Karl Petermichl und Karl M. Slavik
Studiogeräte: Filter
Tiefpass
Bandpass
Hochpass
Notchfilter
Ein Filter lässt nur gewisse
Frequenzen durch, und
schwächt andere ab.
Störende Nebengeräusche
werden am besten direkt bei
der Aufnahme weggeblendet.
Ein “High-Pass-Filter” (=
Tiefencut) bei 80 Hz kann
unerwünschtes Blubbern,
Griff- und Windgeräusche
vermindern.
© 2006 by Karl Petermichl und Karl M. Slavik
34
Studiogeräte: Dynamics
Die Dynamik gibt den
Lautstärkeumfang eines
Klangereignisses an.
Ein Limiter (Begrenzer)
begrenzt das Ausgangssignal
auf einen voreingestellten Wert.
Ein Kompressor verringert das
Verhältnis zwischen Eingangsund Ausgangssignal.
© 2006 by Karl Petermichl und Karl M. Slavik
Studiogeräte: Dynamics
Die Dynamik gibt den Lautstärkeumfang eines Klangereignisses an.
Da bei der Übertragung zum Hörer und
bei der Rezeption im Hörumfeld
Störungen auftreten (leise Töne werden
durch Umgebungslärm verdeckt), ist
eine zu große Dynamik meist nicht
sinnvoll.
Nebengeräusche können mit
“Expandern” und “Noise Gates”
teilweise weggeblendet werden.
© 2006 by Karl Petermichl und Karl M. Slavik
35
Verhältnismaß Dezibel [dB] 1
Anwendung: Das dB wird in allen Bereichen der Audiotechnik benutzt
Bezug:
Das dB für sich ist ohne Aussage - wichtig ist der Bezug
Formel:
dB = 20 log Messwert/Bezugswert
Man dividiert also den Messwert durch einen bekannten
Bezugswert, nimmt davon den Zehnerlogarithmus, und
multipliziert mit 20 (oder 10 je nach Anwendung)
Sinn:
Die Wahrnehmung des Menschen entspricht dem „Weber
Fechner´schen Gesetz“. Ein Reiz wird erst dann als
doppelt so stark empfunden, wenn er logarithmisch
erhöht wird. Das Dezibel entspricht in etwa unserem
natürlichen Empfinden.
Beispiel:
Ein gerade noch hörbares Geräusch ist die Bezugsgröße für das dbSPL. Misst man nun ein
Geräusch, und es entspricht genau dieser sehr kleinen Lautstärke, sind beide Messungen
gleich, der Bruch ergibt 1, der Logarithmus ergibt 0.
Ein doppelt so starker Schalldruck ergibt 6dB, ein hundert mal so starker 40dB, ein tausend mal
so starker 60dB, ein einmillionen mal so starker ergibt 120dB.
Verhältnismaß Dezibel (dB) 2
© 2006 by Karl Petermichl und Karl M. Slavik
36
Verhältnismaß Dezibel [dB] 3
dB akustisch:
dBSPL bezogen auf “gerade
Hörbares Geräusch”
dB elektrisch:
dBu .. bezogen auf 0,775V
dB Digital:
dBFs bezogen auf “Full
Scale”, also volle
Aussteuerung der Wandler
Audio-Praxis:
Macht man ein Signal um 3dB
lauter, wird es “ein wenig
lauter”. Bei 6dB wird es
schon “recht stark” lauter.
Signalpegel:
Mikrofon nur -60 dBu (~ 1 mV)
Studio-Linepegel +6 dBu (1,55 V)
© 2006 by Karl Petermichl und Karl M. Slavik
37
Maximum Coding Level
Maximum Program Level
Alignment Level
Audio Levels
AD-Wandlung & Datenreduktion
© 2006 by Karl Petermichl und Karl M. Slavik
38
Grundbegriffe der Digitaltechnik
• Bit ... Kleinste Informationseinheit.
0V = Low oder logisch 0
5V = High = logisch 1
• Byte ... Besteht aus 8 Bit
• kb = 1024 Bit .... kb/s oder kbit/s = 1024 b/s
• kB = 1024 Byte .... kB/s oder kByte/s = 1024 B/s
© 2006 by Karl Petermichl und Karl M. Slavik
Grundbegriffe der Digitaltechnik
Bits (Informationseinheiten) können auf unterschiedlichste
Art repräsentiert werden:
• Elektrisch: Interfaces/Schnittstellen, Übertragung (DVB, …)
• Optisch: Auf CD, DVD, Film-Soundtrack
• Magnetisch: DAT, Digital Video, Harddisk
• Optomagnetisch: MiniDisc
© 2006 by Karl Petermichl und Karl M. Slavik
39
Grundbegriffe der Digitaltechnik
Optisch: Film-Soundtrack
Optisch: CD, DVD
01
Vergrößerung
© 2006 by Karl Petermichl und Karl M. Slavik
Grundbegriffe der Digitaltechnik
Ein zeit- und wertkontinuierliches Signal in wird in ein zeitund wertdiskretes Signal umgewandelt.
© 2006 by Karl Petermichl und Karl M. Slavik
40
AD-Wandlung ADC
Ein zeit- und wertkontinuierliches Signal wird in ein zeitund wertdiskretes Signal umgewandelt … mit einem ADC
(Analog-Digital-Converter).
010011
Tiefpass
Sample & Hold
Anti-Aliasing
A to D
KanalCodierung
Quellcodierung
PCM, ADPCM, DSD
0100110111101
Takt
AD-Wandlung Samplingfrequenz
Abtastfrequenz, Abtastrate. Angabe in Hz.
Sie beschreibt die Anzahl der Messwerte (Samples),
die einem analogen Signal pro Sekunde entnommen
werden.
Das Shannon-Theorem (benannt nach Claude E.
Shannon) lieferte bereits 1948 die theoretische
Basis der Signalabtastung:
fs > 2 . fsig
© 2006 by Karl Petermichl und Karl M. Slavik
41
AD-Wandlung Samplingfrequenz
Es gilt:
Je höher die Abtastfrequenz ....
umso höher ist die obere Grenzfrequenz fo
umso besser klingen Antialiasing-Filter (Tiefpass)
umso feiner wird das Signal in der Zeitachse aufgelöst
© 2004 und erstellt von Karl M. Slavik
AD-Wandlung Abtastung
© 2004 und erstellt von Karl M. Slavik
42
AD-Wandlung: Abtastfrequenz
© 2004 und erstellt von Karl M. Slavik
AD-Wandlung Abstastfrequenz
In der Praxis werden folgende Abtastraten verwendet:
Medium
fs
R-DAT, Digital Satellite Radio (DSR)
32.000 Hz
R-DAT, CD, MiniDisc
44.100 Hz
R-DAT, DVD-Video, Rundfunk, Audio für Digital Video
(Digibeta, D9, DV, IMX), DVB, DAB
48.000 Hz
Highend-Recording und Mastering, DVD-Video
96.000 Hz
Highend-Recording und Mastering, DVD-Audio
192.000 Hz
Super Audio CD (SACD), Direct Stream Digital (DSD)
1-Bit-Verfahren, 64-fache CD-fs
2.822.400 Hz
© 2004 und erstellt von Karl M. Slavik
43
AD-Wandlung Auflösung
Resolution, Wortbreite. Angabe in Bit.
Die Auflösung in Bit gibt an, in wie viele (binäre) Spannungsstufen ein
analoges Signal zerlegt wird.
Es gilt die Beziehung:
Auflösung = 2n
n ... Anzahl der Bit
© 2004 und erstellt von Karl M. Slavik
AD-Wandlung Auflösung
8 Bit
16 Bit
20 Bit
24 Bit
256 Stufen
65536 Stufen
1048576 Stufen
16777216 Stufen
Fazit: Je mehr Bit, umso feiner die akustische „Abbildung“
© 2004 und erstellt von Karl M. Slavik
44
AD-Wandlung Auflösung
-30,5 dBFS, < 11 Bit !!!
Max.Level -0,8 dBFS, < 16 Bit
Max.Level -12,3 dBFS, < 14 Bit
© 2004 und erstellt von Karl M. Slavik
AD-Wandlung Auflösung
Nach der Beziehung Auflösung = 2n ergibt sich:
Bitzahl
8
Spannungsstufen
256
12
4.096
16
65.536
20
1.048.576
24
16.777.216
32
4.294.967.296
© 2004 und erstellt von Karl M. Slavik
45
AD-Wandlung Auflösung
Medium
Auflösung
Telefon (ISDN, GSM)
Nichtlineare Codierung nach A-Law bzw. µ-Law.
8 Bit
nichtlinear
DV-Format (Consumer) im 4-Kanal-Modus
12 Bit
nichtlinear
CD, R-DAT, DV, Sony MPEG-IMX (im 8-Kanal-Modus)
16 Bit
Alesis ADAT, Digibeta, DVCPro
20 Bit
Tascam DTRS, Tascam HiBit-R-DAT, DASH-HR,
praktisch alle Audioworkstations, DVD-Audio, DVDVideo, Sony MPEG-IMX im 4-Spur-Modus
24 Bit
Super Audio CD (SACD), Direct Stream Digital (DSD)
1-Bit-Verfahren, 64-fache CD-fs
1 Bit
© 2004 und erstellt von Karl M. Slavik
Probleme bei Digitaltechnik
Problem
Fehler
Ursache
Lösung
Rauschen steigt
Jitter zu groß
Clockjitter
Kabelmaterial
Externer Takt
Digitalkabel
Verzerrungen
Überpegel
Falsches PPM
Kein Peaklimiter
Zuviel Drive in AWS
dBFS Meter, DINPPM, dbMAX (z.B.)
Glitches,
Knackser
Keine oder falsche
Synchronisation
Synchronisation,
kein SRC
Sync-Konzept
SRC
Mutes (Aussetzer) Reflexionen auf
Leitungen
Falsche Anpassung.
Z, Impedanz.
Digitalkabel und
Anpassung
Instabile Ortung
Clockjitter
Externer Takt
Jitter variabel
© 2004 und erstellt von Karl M. Slavik
46
AD-Wandlung & Datenreduktion
Datenreduktion „intelligent“: Irrelevante und redundante Daten werden
nach einem bestimmten Algorithmus weggelassen. Immer verlust- behaftet!
Beispiel: MPEG Layer II, III, MP-3, ATRAC, dts, Dolby Digital, SDDS, AAC.
Reduktion etwa 1:5 bis 1:12, bei MP-3 etwa 1:20)
Datenreduktion „unintelligent“: Überzählige Daten werden ohne Rücksicht
auf Ihren Inhalt "weggeschnitten" - immer verlustbehaftet!. Üblich bei manchen
(alten) DSP-Applikationen, aber auch in der Analog-Technik (z.B.
Bandbegrenzung bei FM, Chrominanzsignal, etc.).
Datenkompression: Es gehen keine Daten verloren, sie werden
jedoch nach einem bestimmten Schema "verdichtet" (gepackt) und
bei der Wiedergabe entpackt. Beispiel: WinZip, MLP ...Meridian Lossless
Packing, FLAC, WMA Lossless. Verdichtung etwa etwa 1:2 bis typisch 1:1,7.
© 2006 by Karl Petermichl und Karl M. Slavik
AD-Wandlung & Datenreduktion
Hörkurve
1, Unterteilung in Teilbänder
2, Psychoakustische Bewertung
3, Reduktion "unhörbarer" Signale
4, Finale Codierung
© 2006 by Karl Petermichl und Karl M. Slavik
47
AD-Wandlung & Datenreduktion
Zeitliche Maskierung,
Vor- und Nachverdeckung
© 2006 by Karl Petermichl und Karl M. Slavik
Audio- und Fileformate
© 2006 by Karl Petermichl und Karl M. Slavik
48
Audio- und Fileformate
Name
Typ.
Rate
Nachteile
Vorteile
Linear PCM
1400kb/s
Höchste Qualität, Neutrale Basis
Hoher Speicherbedarf
MPEG1/Layer 2
256kb/s
Guter Klang, Robust bei
Mehrfachencoding
Artefakte bei klassischer Musik
Sehr verbreitet, gut für Popmusik,
unzählige Applikationen
Als MP3 für Konsument („Letzter
Punkt“)
MPEG1/Layer 3 128kb/s
AAC
96kb/s
Gute Qualität bei niederen
Bitraten
kaum Gewinn bei höheren
Bitraten, Encoder Lizenzpflichtig
G.722 (ISDN)
64kb/s
Kleines Delay, Sprachqualität,
international akzeptiert
Nur für Live (kein Speicherformat)
nur bis 7kHz mono
WMA, RA
48kb/s
Windows Media und Real Audio
optimal für „Streaming“, LiveAudio
Sehr hohe Delayzeiten, für
Rundfunk bisher nicht verwendet,
nur Internet
FLAC und
WMA Lossless
760kb/s
Verlustfreie Kompression
Nur für File-Konversion, nicht Live
4SBM, apt-x
256kb/s
Optimierungen für Codec,
LowDelay
Lizenzgebühren, Verbreitung
gering
Parameter
Bezeichnung
Beispiel
Beschreibung
Gewählt nach
Bitrate
192kb/s
Menge der Daten nach der
Kodierung
Speicherplatz, Qualitätswunsch,
Übertragungsmedium
Mono, Stereo
Stereo
Ein oder zwei (oder mehr)
Kanäle, beide werden mit
gleicher Bitrarte unabhängig
voneinander Encodiert
Sprache oder Musik
Joint Stereo
JS
Anstatt unabhängig wie bei
Stereo werden hier die Kanäle
verknüpft
Geringere Bitrate, aber
schlechtere Stereo-Auflösung im
Detail
Constante
Bitrate
CBR
Die Bitrate ist unabhängig vom
Inhalt immer konstant
Meist sehr sinnvoll, VBR macht
eher Probleme
Variable Bitrate
VBR
Die Bitrate schwankt je nach
Inhalt
Spart ein paar Bit
Abtastrate
44,1kHz
Menge der Daten am „Eingang“
der Kodierung,
Ziel-Bitrate
49
Fileformate
Name
Typ. Daten
Anwendung
Audioformate
WAV
16bit, 48kHz,
Stereo
Linear PCM, mp3, mp2
Erste Aufnahme,
Qualitätsübertragung
BWF
Kapselt WAV,
Mehrkanalig
„Broadcast Wave Format“ als
universal-Tauschformat
Audio plus Zusatzdaten (Qualität,
Archivdaten), Mehrkanalfiles
SDII
Dual Mono
48kHz 24bit
Linear PCM
Apple (ProTools) QualitätsAufnahmen
AIFF
16bit, 44,1kHz
Stereo
Linear PCM
Apple allgemein, wie WAV auf PC
Musicam
256kb, 48kHz,
Stereo
Eigentlich mp1/layer2, mit
Zusatzdaten für DIGAS
DIGAS, Filextension „.mus“
MP3
128kb,
44,1kHz
Stereo
mp1/layer3, mit „ID3-Tag“
dabei (Titel, Interpret,
Länge...)
Consumer-Fileformat
Audio-CD
16bit, 44,1kHz
Stereo
Linear PCM
Speziell für Audio-CD, benötigt
spezielle „Rip-Software“
MP4
128kb, Stereo
AAC
Apple iTunes: ACHTUNG DRM!!!
Audio-Interfaces
•
•
•
•
Umwandlung von Audio in Digitaldaten
Umwandlung von Digitaldaten in Audio
Eingänge: Mikrofon, Line, Digital
Ausgänge: Line, Kopfhörer, Digital
•
Schnittstellen zu PC:
–
–
–
–
–
PCI: Steckkarte im PC
PC-Card: für Laptops
USB 1.1: für Mobil, Reportage
USB 2.0 und Firewire: für Mehrkanal Ein- und Ausgabe
Externe HW+PCI-Steckkarte: für ProTools
Sauberes Eingangssignal hat höchste Priorität!
Lineare Abtastung meist 48kHz, 16bit, Stereo (PCM)
Software “Treiber“ bestimmt Latenzzeit
Ein- Ausgangsschalter und Regler in Software
Achtung auf Durchschliff des Eingangssignals!
50
PC-Schnittstellen
Name
Max. Rate
Stecker
Verwendung
USB 1.1
12Mb/s
Seriell, Anschluss von Peripherie am PC
(Drucker, Scanner, Maus, Tastatur), einfaches
Audio
USB 2.0
480Mb/s
Seriell, Anschluss von hochwertigen Geräten
am PC, mehrkanalige Audio-Interfaces
Firewire
400Mb/s
Seriell, Anschluss von Kameras und Harddisks
am PC, mehrkanalige Audio-Interfaces
PC-Card
SD-Card
32-128Mb/s
Parallel, Schacht im Notebook, Speicher;
Übergang zu anderen Schnittstellen (WLAN,
ISDN, POTS)
SCSI
40-320Mb/s
Parallel, Anschluss von Harddisks, läuft aus
Bluetooth
700kb/s
Drahtlos, Übergang zu anderen Schnittstellen
(zwischen Handy und PC, Audio denkbar)
LAN (RJ45)
10, 100Mb/s
Seriell, Netzwerk zwischen Computern,
Sternförmige Verbindung über Hub (Switch)
WLAN
11-54Mb/s
Drahtlos, Funken von Netzwerk-Protokollen
(1394)
Signalkette
Überspielung+Bearbeitung
Aufnahmegerät
LINE IN
HiFi-Verstärker
LINE OUT
Audio-Interface
LINE IN
LINE OUT
USB-KABEL
Laptop / PC / Apple
Lautsprecher
51
Audio- und Fileformate: Hinweise
Encodingparameter
Vor allem die “Bitrate” bestimmt die Qualität des Produktes. Je höher die Bitrate,
umso besser die Qualität, jedoch benötigt man auch umso mehr Speicherplatz
bzw. Übertragungszeit.
1 Minute Linear PCM Stereo benötigt 10 Megabyte Speicherplatz.
1 Minute mp3 mit 128kb/s Stereo benötigt 1 Megabyte Speicherplatz.
ACHTUNG
Die allermeisten Audio-Softwareprodukte bearbeiten das Material immer im
linearen PCM-Format. Daher wird bei jedem Öffnen einer encodierten Aufnahme
diese decodiert, und beim Abspeichern in mp3 neu encodiert! Führt man
diesen Vorgang mehrfach hintereinander aus, verschlechtert sich die
Audioqualität enorm!
DAHER alle Aufnahmen, Bearbeitungen, Mischungen durchgehend in linear
durchführen, und erst am Ende (wenn überhaupt nötig) in mp3 codieren!!!
Metadaten
Definition: Metadaten sind “Daten über Daten”.
Sinn:
Bei großen Ansammlungen von Audioaufnahmen (oder Photos
oder Word-Dokumenten…) kann man ohne aussagekräftige
Beschreibung keine Suche mehr durchführen. Metadaten werden
dem eigentlichen Audio (der “Essenz”) zugefügt, um die
Aufnahmen in Datenbanken erfassen, selektieren und sortieren zu
können.
Dateninhalt: Titel // Autor // Aufnahmedatum // Aufnahmeort // Stichworte
Audioformat // Länge // Genre // Interpret // Album
Das Datenfeld “Titel” ist nicht immer der Filename des Files!!!
Anwendung: Im mp3-Format gibt es “ID3-Tags”, diese werden von iTunes oder
vom Windows Media Player angezeigt. Im Hörfunk werden alle
Audioaufnahmen in Datenbanken verwaltet, das Ausfüllen einiger
Datenfelder ist dort Pflicht, oft werden schon im Titelfeld alle
relevanten Informationen zusammengefasst
Beispiel:
MIJ060216 PK Vogelgrippe / Reichmann
52
Metadaten
Problem:
Zur sicheren Verwaltung müssen Metadaten konsistent sein, es
muss über Jahre hinweg mit den gleichen Konventionen Titel,
Autor, Datum etc. eingetragen werden
Problem:
Der Speicherort von Metadaten ist oft nicht aktiv bestimmbar.
Manchmal werden diese direkt im Audiofile (“Header”)
mitgespeichert, manchmal in einem extra Textfile das neben dem
Audiofile liegt, manchmal in einer Datenbank in einem eigenen
Verzeichnis (iTunes), manchmal in einer Datenbank auf einem
Server.
Übertragungstechnik
53
Informationstheorie
Definition: Der Informationsgehalt einer Nachricht steckt in der
Wahrscheinlichkeit ihrer Vorhersehbarkeit. Ist die Nachricht
mit Sicherheit vorhersehbar, geht die Information gegen Null.
Die Menge an Information entspricht dem Fehlen von
Sicherheit, je höher die Entropie eines Systems, je mehr
„Zufall“ durch Menge und Abfolge der ausgesendeten
Symbole zugelassen wird, umso mehr muss übertragen
werden, bis beim Empfänger Sicherheit über den
tatsächlichen Gehalt der Nachricht eintritt.
Sinn:
Aufgabe ist es, an einem Punkt entweder präzise oder auch
nur hinreichend präzise, die Nachricht, die an einem anderen
Punkt ausgewählt wurde, zu reproduzieren.
Siehe:
Claude Shannon: “A mathematical Theory of Communication”
aus “Bell Systems Technical Journal”, Murray Hill, NJ, 1948. S. 11-17
Übertragungsstrecke
54
Übertragungstechnik
Sinn:
Eine Übertragungsstrecke so zu nutzen, dass diese in der
erwünschte Tonqualität, mit dem zulässigen Zeitbedarf, der
geforderte Sicherheit, und dem vorhandene Budget Audiomaterial
(Live oder als Aufnahme) übertragen kann.
Problem:
Zwischen diesen Forderungen kann man nur „Tradeoffs“ erreichen,
sie widersprechen einander teilweise.
Methoden: Je mehr Störungen auf einem Transportweg zu erwarten sind, umso
mehr Redundanz muss man dem Signal zufügen.
( Funkstrecken)
Die Kanalkapazität ist immer begrenzt, kann aber so genutzt werden,
dass trotzdem die volle Qualität übertragen wird.
( „Abtausch“ Übertragungszeit gegen Qualität)
WICHTIG: Es muss zwischen der physikalischen Strecke (zB ISDN), dem
darüber laufenden Übertragungsprotokoll (zB email), dem
verwendeten Fileformat (zB WAVE) und dem im File verwendeten
Audio-Algorithmus (zB mp3) unterschieden werden!!!
für Interessierte: „ISO/OSI Schichtenmodell“
55
Physikalische Strecken
Name
Max. Rate
Telefon Analog 56kb/s
Verwendung
Uploadzeit 1min
HF-Audio
Nur im Notfall, wenn kein ISDN möglich;
bei Daten langsam und unzuverlässig;
Ca. 10 Min.
ISDN
128kb/s
Bevorzugte Rundfunk-Anbindung; Live-Audio gut
möglich, Datenverbindung stabil; gesicherte
Bitrate; Symmetrische Kapazität (bidirektional).
2 Min.
xDSL
512k-2Mb/s
Breitband-Verbindung zu Provider, längere
Anmeldung nötig; Live-Audio unsicher, Daten ok
Ca. 30 Sek.
Ethernet
Netzwerk
10-100Mb/s
Interne Verkabelung zu Server nötig;
Live-Audio möglich („Voice over IP“)
Ca. 5 Sek.
WLAN
54Mb/s
Drahtloses Netzwerk, für Datenübertragung
Ca. 20 Sek.
GSM
28kb/s
Handy für Notfall; langsam, unsicher
Ca. 20 min.
UMTS
384kb/s
Schnelles Handynetz, für Daten interessant, für
qualitatives Live-Audio nicht geeignet
Ca. 40 Sek.
Anwendungsbeispiele
News:
Übertragung muss schnell gehen, Qualität weniger wichtig
Live-Bericht über Telefon (wenn nichts anderes vorhanden)
Feature:
Zeitkomponente weniger wichtig, Qualität sehr wichtig
Übertragung von Linearfile über Internet
Beitrag:
Qualität nicht an oberster Stelle, rasche Erledigung
Übertragung mp3-File über Internet an Server
Beitrag:
Sicherheit sehr wichtig, da vertraulich
Übertragung über Punkt-zu-Punkt ISDN-Einwahl
Konzert:
Livekonzert soll übertragen werden, Qualität wichtig
Anmietung einer sehr teuren Strecke (Postleitung)
Funkhaus: Viele Benutzer, Liveübertragung und Beitragsautausch nötig
geschlossenes Hochleistungs-Netzwerk
Datenbanken und Fileserver, Datenbankreplikation
Live-Codecs höchster Qualität
56
Praktische Live-Verbindungen
Telefon:
- Jederzeit überall vorhanden
- Qualität schlecht, Sicherheit schlecht
ISDN:
- an beiden Enden gleicher “Codec” nötig
- wegen Übertragungs-Verzögerung muss das Studio einen
speziellen Rückkanal schalten
- gute Sprachqualität, gute Sicherheit
Streaming:
- Qualität je nach Internet-Anbindung
- an beiden Enden gleicher “Codec” nötig
- sehr hohe Verzögerung (mindestens 5 Sekunden)
- keinerlei “Quality of Service” für Live
Netzwerk:
- innerhalb von geschlossenen Installationen brauchbar
- sehr flexibel bezüglich Qualität und Routing
Satellit:
- spezielle Gerätelösung nötig
- simuliert ISDN-Leitung, daher gute Sprachqualität
- sehr hohe Flexibilität (Katastrophenberichterstattung)
- hohe Kosten pro Minute
Praktische File-Protokolle
Email:
- mp3 als “Attachement” möglich
- allerdings nur bis max. 5 Megabyte Filegröße
- unsichere Zustellungszeit
- Empfänger-Mailbox oft überfüllt
ftp:
- “File Transfer Protocol”, gut für große Fileübertragung
- Zielserver mit Konto muss eingerichtet und bekannt sein
- ftp-Client-Software muss eingerichtet sein
- relative sichere Übertragung bis zu 1 Gigabyte möglich
- Geschwindigkeit von vorhandener Internet-Anbindung abhängig
- ACHTUNG: Upload ist meist langsamer als Download!
ISDN-PtP: - mit Punkt-zu-Punkt Einwahl auch zur Fileübertragung geeignet
- spezieller Server nötig, Telefonnummer muss bekannt sein
- hohe Vertraulichkeit, hohe Sendesicherheit
57
ftp
Funktion:
Das “File Transfer Protocol” eignet sich sehr gut für den Upload von
Audio-Dateien an einen Rundfunksender oder ein Medienhaus. Es ist
eines von mehreren Internet-Protokollen (von den “http” das üblichste
ist Websurfen).
Sinn:
Das http-Protokoll ist für Text und Webseiten-Übertragung optimiert,
Filetransfers laufen nur langsam und wenig zuverlässig ab. Das ftpProtokoll verbindet sich direkt mit einem ftp-Server, die verschickten
Daten sind nach dem Upload auch am Server als “angekommen”
sichtbar.
Problem:
Der Empfänger des Audiofiles muss einen ftp-Server betreiben, und
ihnen ein Konto zur Anmeldung bekanntgeben. Sie müssen diese
Daten in ihren Web-Browser oder (besser) in einen eigenen ftp-Client
auf ihrem Computer eintragen. Im Browser sieht das so aus:
ftp://username:passwort@servername
Streaming, Download, Podcast
Podcast: Siehe z.B. http://kmslavik.podspot.de/
58
Audio Download
Methode:
Ein Audiofile, das auf einem Webserver bereitgestellt wird, kann man
genau so downloaden wie ein Bild oder ein pdf-Dokument.
Rechte Maustaste (mac: ctrl+click) Ziel speichern unter
Sinn:
Dies wird nur bei statisch angebotenen, rechtefreien Audio-Clips
verwendet, die der Benutzer/Konsument komplett herunterladen und
später erst am PC oder am mp3-Player anhören möchte.
Probleme: - Das File liegt dann tatsächlich kopierbar beim Benutzer
- Bevor man es anhören kann, muss man es komplett downloaden
Will man nur die letzte Minuten eines langen Beitrages hören,
muss man oft eine lange Zeit auf den Download warten
Formate:
- mp3 (44,1kHz – 128kb/s = mittlere Qualität)
- linear WAV (hohe Qualität, langer Download)
Audio Streaming
Methode:
Mit speziellen Streaming-Formaten, kann man direkt nach dem
Anklicken gleich das Audio anhören. Liegt das File auf einem
normalen Webserver kann die Verbindung allerdings leicht ins
Stocken kommen, da das normale Internetprotokoll “http” nicht für
Streaming-Anwendungen ausgelegt ist.
Liegt das Audiofile dagegen auf einem speziellen Streaming-Server,
und kann man (je nach Interneteinstellungen) auch das Protokoll
UDP/RTSP benutzen, dann wird eine flüssige, stabile
Abspielsituation eintreten. Man kann sogar an das Ende der
Aufnahme springen, ohne auf einen Download warten zu müssen.
Probleme: - Streaming-Server sind recht teuer und aufwändig im Betrieb. Sie
können auch nur eine Maximalzahl ein gleichzeitigen Benutzern
bedienen (100-10.000, sehr selten mehr).
- Vor jeder Abspielung müssen ca. 5 Sekunden des Audiomaterials
gebuffert werden (Anspielverzögerung).
- Die Tonqualität ist meist schlecht, da stark komprimiert wird.
Varianten: - “On Demand“: Audiofiles liegen schon fertig am Server
- “Live”: Audio wird live von einem Encoder angeliefert
59
Audio Streaming
Formate:
- Real Audio (64kb/s = mittlere Qualität)
- Windows Media (48kb/s = mittlere Qualität)
- mp3 (über spezielle Server)
Metafiles:
Der Link auf der Webseite geht nie direkt zum Streaming-File,
sondern immer zu einem Text-File. Erst in diesem steht dann der
“Pfad” zum echten Medienfile. Diese können von einem
Streamingserver nicht downgeloadet werden, und sind damit in
gewissen Grenzen kopiergeschützt.
Copyright: Max Baur
Podcasting
Methode:
Podcasting ist keine wirklich neue Art der Audioübertragung, sondern
nur eine Kombination verschiedener Webelemente. Der Kernbereich
der Audioübertragung ist eigentlich ein einfacher Download.
Podcasting ist also kein Streaming.
Sinn:
Möchte man Sendungen, die in mp3-Format angeboten werden und
täglich bzw. stündlich aktualisiert werden, auf einen mp3-Player
laden, müsste man recht viele Klicks durchführen.
Wenn der Anbieter einen Podcast-Link anbietet, kann man damit
solch ein Angebot “abonnieren”, man erhält automatisch die
neuesten Beiträge heruntergeladen, im besten Falle sogar nicht nur
in den PC, sondern gleich in den mp3-Player.
Problem:
Die komplette automatische Kette bis zum mp3-Player funktioniert
nur mit wenigen Kombinationen aus Feed, Download-Software und
mp3-Player-Gerät.
System:
Das Podcasting-System besteht aus mp3-Files und RSS-Feed am
Server, Podcasting-Aggregator beim Client und mp3-Player.
60
Podcasting
Content Management Systeme
Methode:
Um Audiofiles auf Webseiten anbieten zu können, muss die
Redaktion meist ein “CMS” verwenden. Mit diesem können in die
Text-Stories Links zu den Metafiles der Audiofiles gesetzt werden.
Audio
Audio
Server
Server
Audio
Audio
PC
PC
Encoder
Encoder
Streaming
Streaming
Server
Server
web
CMS
CMS
Server
Server
Text
Text
PC
PC
User
ftp
ftp
http
http
Text
Text
Server
Server
Web
Web
Server
Server
61
AUDACITY im Detail
© 2006 by Karl Petermichl und Karl M. Slavik
© 2004 und erstellt von Karl M. Slavik
62
© 2004 und erstellt von Karl M. Slavik
© 2004 und erstellt von Karl M. Slavik
63
© 2004 und erstellt von Karl M. Slavik
© 2004 und erstellt von Karl M. Slavik
64
© 2004 und erstellt von Karl M. Slavik
© 2004 und erstellt von Karl M. Slavik
65
© 2004 und erstellt von Karl M. Slavik
© 2004 und erstellt von Karl M. Slavik
66
© 2004 und erstellt von Karl M. Slavik
Analoger Lichtton (Wellenform)
Dolby Digital (Datenfeld)
DTS (Steuer-Timecode-Spur)
SDDS (Datenstrom)
Zurück
© 2004 und erstellt von Karl M. Slavik
67

Documentos relacionados