tAT-HF 1 - artecast
Transcrição
tAT-HF 1 - artecast
Grundlagen der Audiotechnik – tAT-HF Von Karl Petermichl und Karl M. Slavik CV Karl M. Slavik • • • • • • • • Dipl.Paed. Ing. Karl M. Slavik, Jahrgang 1960 Lehre, HTL und Pädagogik-Studium Sprecher- und Moderatorenausbildung Seit 1981 im Medienbereich, u.a. als Tonmeister, AV-Gestalter, Journalist 1999 – 2005 Toningenieur / Projektleiter beim ORF Seit 02/2005 selbständig als Autor, Trainer und Berater für Medientechnik & Kommunikation Lehraufträge an der FH Hagenberg, BS für Veranstaltungstechnik, Univ. Wien Freizeit: DJ/VJ, Medienkunst © 2006 by Karl Petermichl und Karl M. Slavik 1 Inhalte 01 • Historische Entwicklung der Rundfunktechnik • Grundlagen der Akustik (Gehör, Sprache, Schallausbreitung, Psychoakustik) • Schallwandler: Mikrofon, Kopfhörer, Lautsprecher • Aufnahmegeräte (Cassette, DAT, MiniDisc, Flashcard- und HD-Recorder) • Studiogeräte (CD, DVD, Platte, Band) • Bearbeitungsgeräte (Audioworkstation, Mischpult, Effekte) • Hörfunkspezifische Anwendungen (Mono-Stereo, Geräusche, OTs, Musik) • Analog-Digitalwandlung und Datenreduktion in der Audioverarbeitung © 2006 by Karl Petermichl und Karl M. Slavik Inhalte 02 • Audio- und Fileformate bei Apple, Windows und Linux • Übertragungstechnik analog und digital (Telefon, ISDN, Netzwerk) • Audio-Streaming, Download, Podcasting • Audio-Software und Plug-Ins für Computer • Die Schnittsoftware AUDACITY im Detail • Praktische Aufnahme- und Schnittübungen • Übergabe der fertigen Materialien per E-Mail, FTP und Datenträger © 2006 by Karl Petermichl und Karl M. Slavik 2 Entwicklung der Audiotechnik © 2006 by Karl Petermichl und Karl M. Slavik Entwicklung der Audiotechnik 1857 - Théodore du Moncel, Prinzip des Kohlemikrofons 1861 - Erste Musikübertragung: "Waldhornsolo", J.P. Reis. 1862 - H. v. Helmholtz, „Lehre von den Tonempfindungen“ 1881 - Weltausstellung, Stereo-Übertragung aus der Pariser Oper 1900 - Hören zu Hause wird üblich – sogar in Stereo 1900 - Valdemar Poulsen, Draht-Magnetophon 1906 - Elektronenröhre, Robert v. Lieben und Lee de Forest 1910 - Verstärkerröhre mit Steuergitter, Robert von Lieben 1910 - Erste Rundfunkübertragung, Lee de Forest, Enrico Caruso 1924 - Rundfunk wird zum täglichen Dienst (AM-Modulation) © 2006 by Karl Petermichl und Karl M. Slavik 3 Entwicklung der Audiotechnik 1930 - Elektrische Aufnahmen auf Schallplatte werden Standard 1932 - Tonband, Fritz Pfleumer 1936 - HF-Vormagnetisierung, bei AEG durch „Zufall“ entdeckt 1941 - Walt Disneys "Fantasia", erstmals "Surround"-Kinoton 1948 - Transistor (Bell Laboratories), ab 1959 in der Praxis 1948 - UKW-Rundfunk in Europa (FM-Modulation) 1950 - Film-Magnetton, 4 bis 6 Spuren 1955 - Stereo-Aufnahmetechnik setzt sich durch 1958 - Stereo-Schallplatte, "Living Stereo", HiFi 1959 - Jack St. Clair Kilby erforscht ICs auf Halbleiterbasis © 2006 by Karl Petermichl und Karl M. Slavik Entwicklung der Audiotechnik 1961 - Stereo-Rundfunk in Europa 1966 - Mehrspuraufnahmen, "Sgt. Peppers…" (Beatles) 1967 - Erste Drahtlos-Mikrofone auf deutschen Showbühnen 1970 - Dolby B, erstmals angewandte Psychoakustik 1970 - Compact Cassette (Philips) 1972 - Quadrofonie: SQ, CD4, Tonabnehmer bis 45 kHz 1974 - Dolby A Studio-Rauschunterdrückung 1976 - Dolby Stereo (4-Channel opt.), Ken Russell's "Lisztomania“ 1976 - Erster praktischer Einsatz von Lichtleitern 1978 - Rauschunterdrückung: Telcom C4, HiCom, dbx © 2006 by Karl Petermichl und Karl M. Slavik 4 Entwicklung der Audiotechnik 1980 - Laser Disc (USA, Japan) 1981 - Direct Metal Mastering (DMM for Vinyl) 1981 - Dolby C Rauschunterdrückung, HiCom 1982 - Compact Disc - 16 Bit 1982 - Dolby Surround (3 Channels) 1982 - R-DAT - 16 Bit 1983 - Dolby SR Studio-Rauschunterdrückung (SNR > 108dB) 1986 - Stereo-Ton beim Fernsehen 1986 - Leistungsfähige DSPs ermöglichen Digitalpulte, etc. 1987 - Dolby-SR Filmton (4-Kanal-Matrix) © 2006 by Karl Petermichl und Karl M. Slavik Entwicklung der Audiotechnik 1995 - Internet-Audio, Audio über TCP/IP wird zum Standard 1997 - DVD-Video - erstmals 24 Bit / 96 kHz 1998 - SACD (DSD), DVD-Audio: Vorstellung in Amsterdam 1998 - RealAudio, WMA, MP3 beginnen Siegeszug 1999 - SACD und DVD-Audio lieferbereit 2000 - Mobile Audioproduktion wird Realität (Notebook, WLAN) 2001 - ATM und LNet flächendeckend. Das Ende der Echtzeit? 2003 - Der ORF sendet als erster öffentlich-rechtlicher Broadcaster Europas TV mit Ton in Dolby Digital 2004 - Auch der ORF-Hörfunk sendet in Dolby Digital & Prologic II © 2006 by Karl Petermichl und Karl M. Slavik 5 Grundlagen der Akustik © 2006 by Karl Petermichl und Karl M. Slavik Schall und Schallausbreitung Definition: “Mechanische Schwingungen eines elastischen Mediums im Frequenzbereich des menschlichen Hörens” Medium: Feste, flüssige oder gasförmige Stoffe, im Vakuum keine Schallübertragung möglich Verlauf: Periodisch = harmonische Schwingung = Ton Unperiodisch = unharmonische Schwingung = Geräusch Merkmale: Schallgeschwindigkeit in Luft = 343 m/s Amplitude = größte Auslenkung [V, dBSPL, Phon) Frequenz = Anzahl der Schwingungen pro Sekunde [Hz] Wellenlänge = Abstand der Wiederholungen [m] Richtung: Bei Frequenzen unterhalb von etwa 250 Herz breitet sich Schall in Luft kugelförmig aus, darüber zunehmend keulenformig. © 2006 by Karl Petermichl und Karl M. Slavik 6 Schall und Schallausbreitung Die Schwingungen der Stimmgabel erzeugen periodische Luftdruckänderungen + Schwingungsdarstellung mit Amplitude, Frequenz und Wellenlänge entlang der Zeitachse. - © 2006 by Karl Petermichl und Karl M. Slavik Schallausbreitung Schall breitet sich in verschiedenen Medien unterschiedlich schnell aus: • Gummi: Etwa 80 m/s • Luft: 343 m/s (bei 20°C, auf Seehöhe, bei 60% Frel) • Wasser: 1.480 m/s • Hartholz: etwa 3.500 m/s • Stahl: etwa 5.000 m/s Bei Frequenzen unterhalb von etwa 250 Herz breitet sich Schall in Luft kugelförmig aus, darüber zunehmend gerichtet (keulenförmig). © 2006 by Karl Petermichl und Karl M. Slavik 7 Raumakustik Wirkung: Abgestrahlte Schallwellen werden an den Begrenzungswänden reflektiert. Dies beeinflußt unsere Wahrnehmung – das Schallereignis wird in einen örtlichen Kontext gestellt: außen - innen - kleiner Raum - großer Saal - nahe - entfernt Abstand: Die Schallintensität nimmt mit dem Quadrat der Entfernung ab nahe an die Schallquelle herangehen… Frequenz: Die Luftmoleküle dämpfen hohe Frequenzen stärker als tiefe Frequenzen in der Entfernung klingt’s “dumpfer” Radius: Der Hallradius gibt die Entfernung von der Schallquelle an, bei der die Reflexionen gleich laut wie der Direktschall sind hallige Räume haben einen kleinen Hallradius nahe an die Schallquelle herangehen… © 2006 by Karl Petermichl und Karl M. Slavik Raumakustik Im Freien gibt es kaum Reflexionen. In kleinen Räumen entstehen kurze, diskret wahrnehmbare, dichte Refexionen (“Shatter”, “Echo”) In großen Räumen hört man erst mit zeitlichem Abstand zum Direktschall nichtdiskreten “Hall” … ist weniger störend für die Sprachverständlichkeit als die kurzen Reflexionen. Die Zeit von 150 ms nach dem Direktschall ist für die Verständlichkeit ausschlaggebend. © 2006 by Karl Petermichl und Karl M. Slavik 8 Ton und Klang Definition: Ein Ton ist eine periodische Schwingung mit einer gewissen Frequenz [Hz]. Klang: Jedes natürliche Instrument erzeugt gemeinsam mit dem Grundton auch ganzzahlige Oberwellen. An der Ausformung der Oberwellen erkennt man das Instrument. Formanten: Speziell bei der Stimme werden anatomisch bedingt gewisse Frequenzen unabhängig von der gesungenen Tonhöhe immer besonders betont. Daran erkennt man unterschiedliche SängerInnen. Verlauf: Neben dem statischen Frequenzgemisch ist besonders auch der zeitliche Verlauf der Obertöne für den Instrumententyp wesentlich (Klavier – Violine) Dynamik: Bei leiser Spielweise werden meist weniger Obertöne als bei starkem Spiel erzeugt. © 2006 by Karl Petermichl und Karl M. Slavik Phase Jede periodische Schallwelle zeigt abwechselnd eine positive und negative Auslenkung, dies übersetzt sich in die Bewegung des Lautsprechers beim Hörer. Verstärkung Auslöschung Treffen zwei Schallwellen mit gegengesetzter Auslenkung aufeinander, wird der Gesamtklang leiser und dünner sein als die einzelne Welle. Dies kann bei Aufnahmen oder auch bei der elektrischen Mischung auftreten, bis hin zur kompletten Auslöschung (Mono-Signal gegenphasig auf den beiden Stereo-Kanälen) © 2006 by Karl Petermichl und Karl M. Slavik 9 Hören und Psychoakustik Unser Ohr ist die Schnittstelle zwischen mechanischen Schallwellen (Druckänderungen der Luft) und unserer Wahrnehmung. • Statischer Luftdruck auf Seehöhe: 100.000 pa (Pascal) ≈ 1 bar • Schalldruck: Maximal 100 pa (≈ 135 dBA >> Schmerzgrenze) Hören als Gesamtprozess basiert auf zwei Grundelementen: • Das Ohr: Schallwandlung und Vorfilterung (ähnlich wie ein Mikrofon) • Das Gehirn: Schallwahrnehmung (Interpretation, Verarbeitung) © 2006 by Karl Petermichl und Karl M. Slavik Hören und Psychoakustik: Das Ohr Aussenohr Mittelohr Das Außenohr ist ein richtungsempfindlicher akustischer Filter. Innenohr Ab einem Schalldruckpegel von etwa 85 dB(A) wirkt ein Schutzbegrenzer (Limiter): Muskelkontraktion entlang der Gehörknöchelchen im Mittelohr. Ohrmuschel Ohrkanal Trommelfell Hörnerv Gehörknöchelchen (Hammer, Amboss, Steigbügel) Schallwandlung erfolgt über 18.000 Haarzellen in der Cochlea (Innenohr). © 2006 by Karl Petermichl und Karl M. Slavik 10 Hören und Psychoakustik: Verarbeitung Hybrider Prozess aus analoger und digitaler EchtzeitSignalverarbeitung Multibit-Bus (etwa 36.000 Nervenfasern) verbindet Ohr mit Gehirn Multibit-Processing Botenstoffe (Neurotransmitter) zwischen Synapsen des Gehirns bestimmen unsere Wahrnehmung © 2006 by Karl Petermichl und Karl M. Slavik Hören und Psychoakustik: AD-Wandlung Bis etwa 1.200 Hz senden einzelne Nervenfasern einzelne Impulse Ab etwa 1.200 Hz senden Gruppen von Nervenfasern Impulse Daher: Parallele Multibit-A/DWandlung Echtzeit-Spektralanalyse inkl. Tonhöhenwahrnehmung Mikrosekunden © 2006 by Karl Petermichl und Karl M. Slavik 11 Hören und Psychoakustik: Tonhöhe 110 dBA Ca. 60 - 80 dBA Zu lautes Hören > 90 dB(A) via Kopfhörer, Ohrhörer oder Lautsprecher verändert die Tonhöhenwahrnehmung – und schädigt das Gehör! © 2006 by Karl Petermichl und Karl M. Slavik Hören und Psychoakustik: Frequenzgang Weitester, linearster Frequenzgang bei etwa SPL = 85 dBA © 2006 by Karl Petermichl und Karl M. Slavik 12 Hören und Psychoakustik: Frequenz Je nach Frequenz werden Töne schon bei kleiner oder erst bei größerer Amplitude gehört (Hörkurve). Am Empfindlichsten zeigt sich das Ohr im Sprachbereich. Das Maximum liegt im Bereich von etwa 2 - 3 kHz. Sprache liegt im Frequenzbereich von ~ 100 bis 7.000 Hz. © 2006 by Karl Petermichl und Karl M. Slavik Hören: Richtungswahrnehmung Interaurale Pegeldifferenz ermöglicht Ortung durch die frequenzabhängige Laustärkeabschattung des Schädels. Interaurale Zeitdifferenz ermöglicht Ortung durch die unterschiedliche Signallaufzeit von der Schallquelle zum linken bzw. rechten Ohr. ( Stereo-Mikrofonie) L R Die Hörverarbeitung im Gerhirn trägt dazu noch Effekte wie den “CocktailParty-Effekt” und “Cognitive Mapping” bei. Damit können diskrete “Streams” separiert werden, Sprache wird auch unter dichter Geräuschkulisse noch verstanden. © 2006 by Karl Petermichl und Karl M. Slavik 13 Hören: Richtungswahrnehmung Interaurale Pegeldifferenz ermöglicht Ortung durch die frequenzabhängige Laustärkeabschattung des Schädels. Interaurale Zeitdifferenz ermöglicht Ortung durch die unterschiedliche Signallaufzeit von der Schallquelle zum linken bzw. rechten Ohr. ( Stereo-Mikrofonie) Die Hörverarbeitung im Gerhirn trägt dazu noch Effekte wie den “CocktailParty-Effekt” und “Cognitive Mapping” bei. Damit können diskrete “Streams” separiert werden, Sprache wird auch unter dichter Geräuschkulisse noch verstanden. © 2006 by Karl Petermichl und Karl M. Slavik Hören/Psychoakustik: Verdeckung Laute Signale verdecken leise Signale. Laute Impulse verdecken Signale zeitlich nachher und auch vorher. Frequenzen unterhalb der Hörschwelle werden nicht wahrgenommen. Anwendungen in der verlustbehafteten Datenreduktion (mp3) © 2006 by Karl Petermichl und Karl M. Slavik 14 Hören und Psychoakustik: Ergebnisse 1 Gemischt analog-digitales System (hybrid) Frequenzgang des gesunden Ohres: 15 - 20.000 Hz Frequenzgang ist schalldruckabhängig. Bandbreitenverlust: Etwa 100 - 200 Hz pro Jahr Wahrnehmungsbandbreite jedoch: 1 Hz - 45.000 Hz Systemdynamik des Gehörs: Etwa 120 dBA Basierend auf: “Ears are Analogue?” Artikelserie von Dr. Wesley A. Bulla, AudioMedia, Februar - April 2001. © 2006 by Karl Petermichl und Karl M. Slavik Hören und Psychoakustik: Ergebnisse 2 Räumliche Wahrnehmung: horizontal auf ± 3° genau Richtcharakteristik frequenzabhängig Klirrfaktorwahrnehmung: Je nach Frequenz k = 1,2 - 3 % Ideale Mischlautstärke am Regieplatz: SPL = 75 bis 95 dBA Maximale Tonhöhenerkennung: SPL = 60 - 80 dBA Fazit: Ein ideales Audiosystem muss den Eigenschaften des menschlichen Gehörs entsprechen. Basierend auf: “Ears are Analogue?” Artikelserie von Dr. Wesley A. Bulla, AudioMedia, Februar - April 2001. © 2006 by Karl Petermichl und Karl M. Slavik 15 Schallwandler © 2006 by Karl Petermichl und Karl M. Slavik Schallwandler: Definition • Mikrofone wandeln Schallwellen in elektrische Signale um. • Kopfhörer und Lautsprecher wandeln elektrische Signale in Schallwellen um. © 2006 by Karl Petermichl und Karl M. Slavik 16 Schallwandler: Das Mikrofon Mikrofone werden nach folgenden Kriterien unterschieden: • Wandlerprinzip: Dynamisches Mikrofon, Kondensatormikrofon • Einsatzbereich und Bauform: Reportagemikrofon, Studiomikrofon • Richtcharakteristik: Kugel, Niere, Superniere, Keule, Acht © 2006 by Karl Petermichl und Karl M. Slavik Schallwandler: Richtcharakteristik © 2006 by Karl Petermichl und Karl M. Slavik 17 Schallwandler: Studiomikrofon Beispiel: Studio-Kondensatormikrofon AKG C414 Einsprachekorb (zugleich Basis-Windschutz) Dahinter Mikrofonkapsel Schalter für Richtcharakteristik Eingebauter Vorverstärker XLR-Anschluss für Mikrofonkabel © 2006 by Karl Petermichl und Karl M. Slavik Schallwandler: Reportagemikrofon Beispiel: Kondensatormikrofon AKG C1000 Einsprachekorb (zugleich Basis-Windschutz) Dahinter Mikrofonkapsel Ein- Ausschalter Eingebaute Batterie (9V), auch Phantomspeisung möglich XLR-Anschluss für Mikrofonkabel © 2006 by Karl Petermichl und Karl M. Slavik 18 Schallwandler: Lautsprecher Beispiel: Aktiver 2-Weg Studiomonitor KRK V6 Hochton-Lautsprecher Bassreflex-Gehäuse Tiefton-Lautsprecher Zwei eingebaute Verstärker (Aktivsystem) Bassreflex-Öffnung © 2006 by Karl Petermichl und Karl M. Slavik Aufnahmemedien und Geräte © 2006 by Karl Petermichl und Karl M. Slavik 19 Aufnahmemedien & Geräte © 2006 by Karl Petermichl und Karl M. Slavik Aufnahmemedien: Übersicht Compact Cassette (CC). Analoges, lineares Medium. Bewährt, kostengünstig, sehr robust und zuverlässig (wenn man´s richtig macht), Profigeräte verfügbar. Nachteil: Echtzeit-Überspielung in AWS, beschränkte Tonqualität. MiniDisc (MD). Digitales, non-lineares Medium. Kostengünstig, als NetMD auch für Drag & Drop geeignet. Skalierbare, relativ hohe Audioqualität (Hi-MD). Nachteil: mechanisch fragil, kaum Profigeräte verfügbar. Flash Card (CF, SD, MMC). Digitales, non-lineares Medium ohne bewegte Teile. Sehr robust, auch für Drag & Drop geeignet, skalierbare, sehr hohe Audioqualität schnellstes Medium. Nachteil: Geräte und Medien (noch) relativ teuer. © 2006 by Karl Petermichl und Karl M. Slavik 20 Aufnahmemedien: Übersicht DAT (Digital Audio Tape). Digitales, lineares Medium. Bewährt aber teuer, relativ robust und zuverlässig (wenn man´s richtig macht), sehr hohe Tonqualität. Keine portablen Geräte mehr verfügbar. Nachteil: EchtzeitÜberspielung in AWS. Tonband (Tape). Analoges, lineares Medium. Kostengünstig, direkt schneidbar. Skalierbare, sehr hohe Audioqualität (9,5 – 38 cm/s). Nachteil: Geräte teuer, Einsatz nur mehr im Studio (selten). Computer-Recording (Audio-Workstation). Digitales, non-lineares Medium. Im Studio und als mobile Workstation sehr bewährt. Skalierbare, sehr hohe Audioqualität. Nachteil: Bei mobilen Aufnahmen sehr unhandlich. © 2006 by Karl Petermichl und Karl M. Slavik Aufnahmemedien: Workflow Cassetten-Recorder Flashcard-Recorder Reportagemikrofon Reportagemikrofon 1 2 Flashcard USB/Firewire Audio-Converter (USB od. Firewire) Anschluss für Mikrofone, Kopfhörer, externe Geräte (CD, DAT, MD, Cassettengerät) PC / Audioworkstation mit Flashcard – Reader, Bildschirm, Keyboard und Audiosoftware (CD-Grabber-SW, DIGAS) Studiomikrofon © 2006 by Karl Petermichl und Karl M. Slavik 21 Aufnahmemedien: Cassette 1 3-Kopf-System (erlaubt „Hinterbandkontrolle“) Batteriefach Kopfhöreranschluss mit Lautstärkesteller Aussteuerungsmesser (VU) und Peak-Anzeige Bedienelemente für Limiter, autom. Aussteuerung (ALC), Eingangswahl (Line/Mic-Tel). Aufnahmepegelsteller und Moduswahl (manuell, automatisch/ALC, Limiter) Mikrofonanschluss XLR-Buchse, symmetrisch © 2006 by Karl Petermichl und Karl M. Slavik Marantz PMD222 Robustes Mono-Gerät Eingebautes Mikrofon+Lautsprecher Mikrofoneingänge auf XLR (symmetrisch) Pegelaussteuerung manuell, mit Limiter, oder automatisch Mikrofonpegel-Abschwächung um -10dB und -20dB Bandwahlschalter für 3 Bandsorten Direkte Aufnahme von Telefongesprächen Echte Nachbandkontrolle (Abhören über Band / Confidence-Monitoring) Klangfilter für Aufnahme und Wiedergabe Separater Line-Eingang und Line-Ausgang Tonhöhen-Regulierung in der Wiedergabe Bandgeschwindigkeit halbierbar, um die Aufnahmezeit zu verdoppeln (die Qualität wird dadurch aber schlechter) © 2006 by Karl Petermichl und Karl M. Slavik 22 Aufnahmemedien: Cassette 2 WICHTIGE FRAGEN VOR DEM KAUF: Qualität der Mikrofon-Eingänge (Rauschen)? Aussteuerungs-Anzeige? Pegelsteller für Aufnahmepegel? ALC (Automatic Level Control)? Limiter? Professionelle, robuste Anschlüsse (XLR)? Tiefencut (Hochpass-Filter)? Mithören auf Kopfhörer während der Aufnahme? Hinterbandkontrolle? Akku und/oder Batterien? Dolby B und Dolby C (Rauschunterdrückungssystem)? Guter Gleichlauf (keine hörbaren Tonhöhenschwankungen)? Umschaltbar auf verschiedene Bandsorten (Fe, CrO2)? Tonköpfe leicht zu reinigen (Wattestäbchen mit Spiritus getränkt)? © 2006 by Karl Petermichl und Karl M. Slavik Aufnahmemdien: MiniDisc 1 Batteriefach Laufwerksteuerung Aufnahmepegelsteller Mikrofonanschluss XLR-Buchsen, symmetrisch REC-Button & Marker MD-Fach Bedienelemente für Menüführung, Setup, Input, etc. Montagepunkt für Trageriemen Kopfhöreranschluss mit Lautstärkesteller Funktionstasten F1 … F3 Aussteuerungsmesser/Peak-Anzeige Status-Display © 2006 by Karl Petermichl und Karl M. Slavik 23 Aufnahmemedien: MiniDisc 2 WICHTIGE FRAGEN VOR DEM KAUF: Qualität der Mikrofon-Eingänge (Rauschen)? Aussteuerungs-Anzeige? Pegelsteller für Aufnahmepegel? ALC (Automatic Level Control)? Limiter? Professionelle Anschlüsse (XLR)? Tiefencut (Hochpass-Filter)? Mithören auf Kopfhörer während der Aufnahme? Wählbares Aufnahme-Format ? (Bei MD nur ATRAC, bei HD-MD auch WAV / Linear, MP3, AAC) Aufnahmedauer? Akku und/oder Batterien? Überspielung zur Workstation: Über USB? Oder nur in Echtzeit? Analoge und digitale Ein- und Ausgänge? © 2006 by Karl Petermichl und Karl M. Slavik Aufnahmemedien: Flashcard 1 Bedienelemente für Limiter, autom. Aussteuerung, Phantomspeisung Batteriefach Mikrofonanschluss auf XLR-Buchse, symmetrisch Kopfhöreranschluss mit Lautstärkesteller Fach für 2 CF-Cards (max. 2 x 1 Gigabyte, ca. 20 Std. in Sendequalität) Aufnahmepegelsteller (manuell od. automatisch) Aussteuerungsmesser (Peak-Anzeige), Stausdisplay, Menüführung © 2006 by Karl Petermichl und Karl M. Slavik 24 Aufnahmemedien: Flashcard 2 Maycom Handheld Recorder & Mayah Flashman Mikrofon und Flashcard-Recorder in einem. Kann mit externen Quellen verbunden werden. Datenaustausch über Docking-Station (USB). © 2006 by Karl Petermichl und Karl M. Slavik Aufnahmemedien: Flashcard 3 WICHTIGE FRAGEN VOR DEM KAUF: Qualität der Mikrofon-Eingänge (Rauschen)? Aussteuerungs-Anzeige? Pegelsteller für Aufnahmepegel? ALC (Automatic Level Control)? Limiter? Professionelle Anschlüsse (XLR)? Tiefencut (Hochpass-Filter)? Mithören auf Kopfhörer während der Aufnahme? Wählbares Aufnahme-Format (MPEG Layer II, WAV / Linear, MP3, AAC)? Aufnahmedauer? Akku und/oder Batterien? Überspielung zur Workstation: Über USB? Firewire? Flashcard & Reader? © 2006 by Karl Petermichl und Karl M. Slavik 25 Aufnahmegeräte: DAT Aussterbendes Format höchster Qualität Verwendung für Filmton, Musik, Hörspiel und Feature Cassetten oft nur mehr als Daten-Band erhältlich, nicht sehr robust Digitale Aufnahme in bester linearer Qualität Geräte weisen oft umfangreiche Möglichkeiten für Mikrofonanpassung auf Meist hochwertige, symmetrische XLREingänge Oft Phantomspeisung (48V) für Kondensator-Mikrofone vorhanden Digitale Ein- und Ausgänge © 2006 by Karl Petermichl und Karl M. Slavik Aufnahmemedien: Computer • • • • • • • Laptops für mobile Aufnahme/Nachbearbeitung Heim-PC für Nachbearbeitung Eingebaute Soundkarten meist NICHT für gute Mikrofonaufnahmen geeignet Daher Audio-Interface als Steckkarte oder extern über USB oder Firewire Große Festplatten machen Datenbanken zur Verwaltung notwendig Laptops müssen für zuverlässige Audioaufnahme optimiert werden Rauer Betrieb im Freien nicht machbar Mackie Spike © 2006 by Karl Petermichl und Karl M. Slavik 26 Aufnahmemedien: Zubehör Richtmikrofon mit Rycote-Windschutz und Pistolengriff Kopfhörer Equipmenttasche (mit DAT-Recorder) Hochflexibles Mikrofonkabel, XLR-Stecker mit Goldkontakten © 2006 by Karl Petermichl und Karl M. Slavik Aufnahmepraxis & Tipps © 2006 by Karl Petermichl und Karl M. Slavik 27 Aufnahmepraxis: Tipps 1 Mikrofone Monomikrofon, Niere, dynamisch für einfache Interviews Monomikrofon, Niere, Kondensator für besseren Klang (Speisung!) Stereomikrofon für Atmo, Geräusche und Musik Kabel Mikrofonkabel sind empfindlich gegen Einstreuungen Daher möglichst kurz halten Möglichst nicht bewegen während Aufnahme Stecker sorgfältig einrasten (Verpolung!) Bei Mono-Mikrofonen Aufteilung auf beide Eingänge des Aufnahmegerätes verwenden (sonst nur eine Seite bespielt) © 2006 by Karl Petermichl und Karl M. Slavik Aufnahmepraxis: Tipps 2 Pegel Mikrofone liefern sehr kleine Spannungspegel, die Mikrofoneingänge sind deshalb sehr empfindlich. Keinesfalls darf man den Ausgang eines anderen Gerätes (Mischpult, Verteilverstärker) an einen Mikrofoneingang anschließen (ergibt starke Verzerrrungen). Aussteuerung Aufnahme immer so aussteuern, dass der Pegel im Mittel etwa 80% vom Maximum beträgt. Profis: Manuelle Aussteuerung, Limiter EIN, AGC AUS. Weniger Erfahrene: Automatische Aussteuerung, AGC EIN. © 2006 by Karl Petermichl und Karl M. Slavik 28 Aufnahmepraxis: Aussteuerung Untersteuerung: Zu geringer Signalpegel verschlechtert den Signal-Rauschabstand. Ergebnis: Störgeräusche (Rauschen) werden hörbar. Richtige Aussteuerung: Sie stellt das optimale Verhältnis zwischen möglichst geringem Grundrauschen und möglichst geringen Verzerrungen her. Übersteuerung: Zu großer Aufnahmepegel führt zu Verzerrungen. Digitale Systeme reagieren weit empfindlicher als analoge. Aussteuerungsgrenze Pegelbereich Systemrauschen © 2006 by Karl Petermichl und Karl M. Slavik Aufnahmepraxis: Tipps 3 News Direkter, trockener, konkreter Klang in Mono, hohe Sprachverständlichkeit. Unbedingt Verkehrslärm vermeiden ( Schneideprobleme). Auch kleine, hallige Räume vermeiden („WC-Klang“). Feature Interviewklang je nach gewünschter Stimmung (auch Distanz zulassen). Zusätzlich auch nur Geräusche bzw. Raumklang als „Atmo“ aufnehmen. Interviews in Mono, Umgebung in Stereo. Musik Gute Balance aller Instrumente zueinander erreichen. Gute Balance zwischen Direktschall – Hallanteil. © 2006 by Karl Petermichl und Karl M. Slavik 29 Schnittstellen: Analog Insert: Dienst zum „Einschleifen“ von Effektgeräten. Klinken-Buchse, Pegel etwa 100 mV … 2 V, unsymmetrisch. In und Out auf einer Buchse! Line: Für CD-Player, AWS, Cass., etc. Klinken-Buchse, Pegel etwa 100 mV … 2 V, symmetrisch. Mic: Für Mikrofon (manchmal auch für Line, schaltbar). XLR-Buchse, Pegel etwa etwa 1 … 100 mV, symmetrisch. Tape: Für Aufnahme/Wiedergabe. Cinch-Buchsen, Pegel etwa 300 - 700 mV, unsymmetrisch. Rot = Rechts, Weiß = Links. Mikrofon an Line: Zu geringer Pegel = schlechte Aussteuerung, Rauschen steigt! Line an MIC-Input: Zu hoher Pegel = Übersteuerung, Verzerrungen steigen an! © 2006 by Karl Petermichl und Karl M. Slavik Ein- und Ausgänge Ein Kabel führt immer von einem Ausgang zu einem Eingang. Die beiden Seiten müssen in folgenden Parametern zusammenpassen: • Signalspannung (in Volt) oder Pegel (in dB) • Kanalzahl (Mono, Stereo, Surround) • Widerstand (Impedanz) • Samplingfrequenz Eiserne Regeln • Mikrofon immer nur am Mikrofon-Eingang anstecken (MIC IN) • Line-Ausgang immer nur am LINE-IN anstecken • Analoge Geräte analog verbinden (z.B. Kassettenrecorder zu Mischpult) • Digitale Geräte nur digital verbinden (z.B. MiniDisc zu Audio-Workstation) © 2006 by Karl Petermichl und Karl M. Slavik 30 Schnittstellen: Kabel und Stecker • XLR: Mechanisch verriegelt, elektrisch isoliert, symmetrische Signalführung minimiert Einstreuungen aber nur wenn an beiden Seiten XLR… beste Wahl für Mikrofonanschlüsse • Klinke: 6,3mm (= große Klinke) für semiprofessionelle Geräte und Kopfhöreranschluss im HiFi-Bereic. Symmetrisch oder unsymmetrisch, Mono/Stereo • Klinke: 3,5mm (=Miniklinke) durchgängig im Consumer-Markt. Als Kopfhöreranschluss bei allen MP3-Playern, als Mikrophoneingang bei allen MDGeräten. Mechanisch instabil, Kontaktprobleme Unsymmetrisch, Mono oder Stereo. • Cinch: Standardanschluss im HiFi-Sektor Meist nur für Line-Signale, mechanisch robust, gute Kontaktgabe, nur in Mono erhältlich (2 für Stereo). © 2006 by Karl Petermichl und Karl M. Slavik Signalkette Aufnahme und Abhören LINE IN Kopfhörer HiFi-Verstärker Aufnahmegerät LINE OUT PHONES MIC IN Mikrofon Lautsprecher © 2006 by Karl Petermichl und Karl M. Slavik 31 Marantz PMD222: Einstellungen 1 Level = Mitte (Lautstärke im Lautsprecher oder Kopfhörer – wichtig!) Tone = Mitte (Klangfilter für Wiedergabe - unwichtig) Monitor = Source (zur Wiedergabe und Aufnahmekontrolle auf „Tape“ stellen – Achtung, in diesem Fall verzögert!) Pitch = Mitte (Änderung der Abspielgeschwindigkeit – wichtig!) Tape Speed = Standard (Bandgeschwindigkeit – wichtig!) Record Level = auf gute Aussteuerung einstellen – sehr wichtig! Record Mode = auf „Manual“ einpegeln, dann auf Limiter (nicht ALC!!!) ANC = „Flat“ oder „Low Cut“ (bei starkem Wind), nicht „Low+Hi Cut“ (dumpf!) Input Selector = „Mic/Tel“ für Mikrophon, „Line“ für Überspielung von Line-Pegel Mic Att = Mikrofonabschwächung (0 im Normalfall – wichtig!) XLR-ECM = Auswahl internes oder externes Mikrofon (XLR = extern vorne) SPKR MON = interner Lautsprecher Ein-Aus (besser Aus, sonst Koppeln) © 2006 by Karl Petermichl und Karl M. Slavik Marantz PMD222: Einstellungen 2 Buchsen: Phones = Kopfhörer (schaltet internen Lautsprecher ab) XLR Eingang = Externes Mikrophon (gute Qualität) Microphone = Externes Mikrophon Mini-Klinke (nicht so gut) Line Input + Output = Cinch-Buchse für Überspielungen von+zu Line-Pegel Remote = Fernsteuerung / Telephone = Telefonaufnahme / Ext Spkr = Lautsprecher Aussteuerung: Das VU-Meter (Zeigerinstrument) sollte oft in den rechten Bereich ausschlagen, die PeakAnzeige (rote Leuchtdiode) ab und zu aufleuchten. Wenn diese ständig leuchtet, dann Record Level zurückdrehen oder Mikrophon-Dämpfung zuschalten oder auf Line-Eingang umschalten. Wenn das VU-Meter eher links bleibt, ist die Schallquelle zu schwach, oder die Batterie im Mikrophon geht zur Neige. © 2006 by Karl Petermichl und Karl M. Slavik 32 Studiogeräte © 2006 by Karl Petermichl und Karl M. Slavik Studiogeräte: Produktionsstudio Protools Radiomax & Digas Mischpult CD, DVD, MD, DAT, CASS Bandmaschine © 2006 by Karl Petermichl und Karl M. Slavik 33 Studiogeräte: Mischpult (analog) © 2006 by Karl Petermichl und Karl M. Slavik Studiogeräte: Filter Tiefpass Bandpass Hochpass Notchfilter Ein Filter lässt nur gewisse Frequenzen durch, und schwächt andere ab. Störende Nebengeräusche werden am besten direkt bei der Aufnahme weggeblendet. Ein “High-Pass-Filter” (= Tiefencut) bei 80 Hz kann unerwünschtes Blubbern, Griff- und Windgeräusche vermindern. © 2006 by Karl Petermichl und Karl M. Slavik 34 Studiogeräte: Dynamics Die Dynamik gibt den Lautstärkeumfang eines Klangereignisses an. Ein Limiter (Begrenzer) begrenzt das Ausgangssignal auf einen voreingestellten Wert. Ein Kompressor verringert das Verhältnis zwischen Eingangsund Ausgangssignal. © 2006 by Karl Petermichl und Karl M. Slavik Studiogeräte: Dynamics Die Dynamik gibt den Lautstärkeumfang eines Klangereignisses an. Da bei der Übertragung zum Hörer und bei der Rezeption im Hörumfeld Störungen auftreten (leise Töne werden durch Umgebungslärm verdeckt), ist eine zu große Dynamik meist nicht sinnvoll. Nebengeräusche können mit “Expandern” und “Noise Gates” teilweise weggeblendet werden. © 2006 by Karl Petermichl und Karl M. Slavik 35 Verhältnismaß Dezibel [dB] 1 Anwendung: Das dB wird in allen Bereichen der Audiotechnik benutzt Bezug: Das dB für sich ist ohne Aussage - wichtig ist der Bezug Formel: dB = 20 log Messwert/Bezugswert Man dividiert also den Messwert durch einen bekannten Bezugswert, nimmt davon den Zehnerlogarithmus, und multipliziert mit 20 (oder 10 je nach Anwendung) Sinn: Die Wahrnehmung des Menschen entspricht dem „Weber Fechner´schen Gesetz“. Ein Reiz wird erst dann als doppelt so stark empfunden, wenn er logarithmisch erhöht wird. Das Dezibel entspricht in etwa unserem natürlichen Empfinden. Beispiel: Ein gerade noch hörbares Geräusch ist die Bezugsgröße für das dbSPL. Misst man nun ein Geräusch, und es entspricht genau dieser sehr kleinen Lautstärke, sind beide Messungen gleich, der Bruch ergibt 1, der Logarithmus ergibt 0. Ein doppelt so starker Schalldruck ergibt 6dB, ein hundert mal so starker 40dB, ein tausend mal so starker 60dB, ein einmillionen mal so starker ergibt 120dB. Verhältnismaß Dezibel (dB) 2 © 2006 by Karl Petermichl und Karl M. Slavik 36 Verhältnismaß Dezibel [dB] 3 dB akustisch: dBSPL bezogen auf “gerade Hörbares Geräusch” dB elektrisch: dBu .. bezogen auf 0,775V dB Digital: dBFs bezogen auf “Full Scale”, also volle Aussteuerung der Wandler Audio-Praxis: Macht man ein Signal um 3dB lauter, wird es “ein wenig lauter”. Bei 6dB wird es schon “recht stark” lauter. Signalpegel: Mikrofon nur -60 dBu (~ 1 mV) Studio-Linepegel +6 dBu (1,55 V) © 2006 by Karl Petermichl und Karl M. Slavik 37 Maximum Coding Level Maximum Program Level Alignment Level Audio Levels AD-Wandlung & Datenreduktion © 2006 by Karl Petermichl und Karl M. Slavik 38 Grundbegriffe der Digitaltechnik • Bit ... Kleinste Informationseinheit. 0V = Low oder logisch 0 5V = High = logisch 1 • Byte ... Besteht aus 8 Bit • kb = 1024 Bit .... kb/s oder kbit/s = 1024 b/s • kB = 1024 Byte .... kB/s oder kByte/s = 1024 B/s © 2006 by Karl Petermichl und Karl M. Slavik Grundbegriffe der Digitaltechnik Bits (Informationseinheiten) können auf unterschiedlichste Art repräsentiert werden: • Elektrisch: Interfaces/Schnittstellen, Übertragung (DVB, …) • Optisch: Auf CD, DVD, Film-Soundtrack • Magnetisch: DAT, Digital Video, Harddisk • Optomagnetisch: MiniDisc © 2006 by Karl Petermichl und Karl M. Slavik 39 Grundbegriffe der Digitaltechnik Optisch: Film-Soundtrack Optisch: CD, DVD 01 Vergrößerung © 2006 by Karl Petermichl und Karl M. Slavik Grundbegriffe der Digitaltechnik Ein zeit- und wertkontinuierliches Signal in wird in ein zeitund wertdiskretes Signal umgewandelt. © 2006 by Karl Petermichl und Karl M. Slavik 40 AD-Wandlung ADC Ein zeit- und wertkontinuierliches Signal wird in ein zeitund wertdiskretes Signal umgewandelt … mit einem ADC (Analog-Digital-Converter). 010011 Tiefpass Sample & Hold Anti-Aliasing A to D KanalCodierung Quellcodierung PCM, ADPCM, DSD 0100110111101 Takt AD-Wandlung Samplingfrequenz Abtastfrequenz, Abtastrate. Angabe in Hz. Sie beschreibt die Anzahl der Messwerte (Samples), die einem analogen Signal pro Sekunde entnommen werden. Das Shannon-Theorem (benannt nach Claude E. Shannon) lieferte bereits 1948 die theoretische Basis der Signalabtastung: fs > 2 . fsig © 2006 by Karl Petermichl und Karl M. Slavik 41 AD-Wandlung Samplingfrequenz Es gilt: Je höher die Abtastfrequenz .... umso höher ist die obere Grenzfrequenz fo umso besser klingen Antialiasing-Filter (Tiefpass) umso feiner wird das Signal in der Zeitachse aufgelöst © 2004 und erstellt von Karl M. Slavik AD-Wandlung Abtastung © 2004 und erstellt von Karl M. Slavik 42 AD-Wandlung: Abtastfrequenz © 2004 und erstellt von Karl M. Slavik AD-Wandlung Abstastfrequenz In der Praxis werden folgende Abtastraten verwendet: Medium fs R-DAT, Digital Satellite Radio (DSR) 32.000 Hz R-DAT, CD, MiniDisc 44.100 Hz R-DAT, DVD-Video, Rundfunk, Audio für Digital Video (Digibeta, D9, DV, IMX), DVB, DAB 48.000 Hz Highend-Recording und Mastering, DVD-Video 96.000 Hz Highend-Recording und Mastering, DVD-Audio 192.000 Hz Super Audio CD (SACD), Direct Stream Digital (DSD) 1-Bit-Verfahren, 64-fache CD-fs 2.822.400 Hz © 2004 und erstellt von Karl M. Slavik 43 AD-Wandlung Auflösung Resolution, Wortbreite. Angabe in Bit. Die Auflösung in Bit gibt an, in wie viele (binäre) Spannungsstufen ein analoges Signal zerlegt wird. Es gilt die Beziehung: Auflösung = 2n n ... Anzahl der Bit © 2004 und erstellt von Karl M. Slavik AD-Wandlung Auflösung 8 Bit 16 Bit 20 Bit 24 Bit 256 Stufen 65536 Stufen 1048576 Stufen 16777216 Stufen Fazit: Je mehr Bit, umso feiner die akustische „Abbildung“ © 2004 und erstellt von Karl M. Slavik 44 AD-Wandlung Auflösung -30,5 dBFS, < 11 Bit !!! Max.Level -0,8 dBFS, < 16 Bit Max.Level -12,3 dBFS, < 14 Bit © 2004 und erstellt von Karl M. Slavik AD-Wandlung Auflösung Nach der Beziehung Auflösung = 2n ergibt sich: Bitzahl 8 Spannungsstufen 256 12 4.096 16 65.536 20 1.048.576 24 16.777.216 32 4.294.967.296 © 2004 und erstellt von Karl M. Slavik 45 AD-Wandlung Auflösung Medium Auflösung Telefon (ISDN, GSM) Nichtlineare Codierung nach A-Law bzw. µ-Law. 8 Bit nichtlinear DV-Format (Consumer) im 4-Kanal-Modus 12 Bit nichtlinear CD, R-DAT, DV, Sony MPEG-IMX (im 8-Kanal-Modus) 16 Bit Alesis ADAT, Digibeta, DVCPro 20 Bit Tascam DTRS, Tascam HiBit-R-DAT, DASH-HR, praktisch alle Audioworkstations, DVD-Audio, DVDVideo, Sony MPEG-IMX im 4-Spur-Modus 24 Bit Super Audio CD (SACD), Direct Stream Digital (DSD) 1-Bit-Verfahren, 64-fache CD-fs 1 Bit © 2004 und erstellt von Karl M. Slavik Probleme bei Digitaltechnik Problem Fehler Ursache Lösung Rauschen steigt Jitter zu groß Clockjitter Kabelmaterial Externer Takt Digitalkabel Verzerrungen Überpegel Falsches PPM Kein Peaklimiter Zuviel Drive in AWS dBFS Meter, DINPPM, dbMAX (z.B.) Glitches, Knackser Keine oder falsche Synchronisation Synchronisation, kein SRC Sync-Konzept SRC Mutes (Aussetzer) Reflexionen auf Leitungen Falsche Anpassung. Z, Impedanz. Digitalkabel und Anpassung Instabile Ortung Clockjitter Externer Takt Jitter variabel © 2004 und erstellt von Karl M. Slavik 46 AD-Wandlung & Datenreduktion Datenreduktion „intelligent“: Irrelevante und redundante Daten werden nach einem bestimmten Algorithmus weggelassen. Immer verlust- behaftet! Beispiel: MPEG Layer II, III, MP-3, ATRAC, dts, Dolby Digital, SDDS, AAC. Reduktion etwa 1:5 bis 1:12, bei MP-3 etwa 1:20) Datenreduktion „unintelligent“: Überzählige Daten werden ohne Rücksicht auf Ihren Inhalt "weggeschnitten" - immer verlustbehaftet!. Üblich bei manchen (alten) DSP-Applikationen, aber auch in der Analog-Technik (z.B. Bandbegrenzung bei FM, Chrominanzsignal, etc.). Datenkompression: Es gehen keine Daten verloren, sie werden jedoch nach einem bestimmten Schema "verdichtet" (gepackt) und bei der Wiedergabe entpackt. Beispiel: WinZip, MLP ...Meridian Lossless Packing, FLAC, WMA Lossless. Verdichtung etwa etwa 1:2 bis typisch 1:1,7. © 2006 by Karl Petermichl und Karl M. Slavik AD-Wandlung & Datenreduktion Hörkurve 1, Unterteilung in Teilbänder 2, Psychoakustische Bewertung 3, Reduktion "unhörbarer" Signale 4, Finale Codierung © 2006 by Karl Petermichl und Karl M. Slavik 47 AD-Wandlung & Datenreduktion Zeitliche Maskierung, Vor- und Nachverdeckung © 2006 by Karl Petermichl und Karl M. Slavik Audio- und Fileformate © 2006 by Karl Petermichl und Karl M. Slavik 48 Audio- und Fileformate Name Typ. Rate Nachteile Vorteile Linear PCM 1400kb/s Höchste Qualität, Neutrale Basis Hoher Speicherbedarf MPEG1/Layer 2 256kb/s Guter Klang, Robust bei Mehrfachencoding Artefakte bei klassischer Musik Sehr verbreitet, gut für Popmusik, unzählige Applikationen Als MP3 für Konsument („Letzter Punkt“) MPEG1/Layer 3 128kb/s AAC 96kb/s Gute Qualität bei niederen Bitraten kaum Gewinn bei höheren Bitraten, Encoder Lizenzpflichtig G.722 (ISDN) 64kb/s Kleines Delay, Sprachqualität, international akzeptiert Nur für Live (kein Speicherformat) nur bis 7kHz mono WMA, RA 48kb/s Windows Media und Real Audio optimal für „Streaming“, LiveAudio Sehr hohe Delayzeiten, für Rundfunk bisher nicht verwendet, nur Internet FLAC und WMA Lossless 760kb/s Verlustfreie Kompression Nur für File-Konversion, nicht Live 4SBM, apt-x 256kb/s Optimierungen für Codec, LowDelay Lizenzgebühren, Verbreitung gering Parameter Bezeichnung Beispiel Beschreibung Gewählt nach Bitrate 192kb/s Menge der Daten nach der Kodierung Speicherplatz, Qualitätswunsch, Übertragungsmedium Mono, Stereo Stereo Ein oder zwei (oder mehr) Kanäle, beide werden mit gleicher Bitrarte unabhängig voneinander Encodiert Sprache oder Musik Joint Stereo JS Anstatt unabhängig wie bei Stereo werden hier die Kanäle verknüpft Geringere Bitrate, aber schlechtere Stereo-Auflösung im Detail Constante Bitrate CBR Die Bitrate ist unabhängig vom Inhalt immer konstant Meist sehr sinnvoll, VBR macht eher Probleme Variable Bitrate VBR Die Bitrate schwankt je nach Inhalt Spart ein paar Bit Abtastrate 44,1kHz Menge der Daten am „Eingang“ der Kodierung, Ziel-Bitrate 49 Fileformate Name Typ. Daten Anwendung Audioformate WAV 16bit, 48kHz, Stereo Linear PCM, mp3, mp2 Erste Aufnahme, Qualitätsübertragung BWF Kapselt WAV, Mehrkanalig „Broadcast Wave Format“ als universal-Tauschformat Audio plus Zusatzdaten (Qualität, Archivdaten), Mehrkanalfiles SDII Dual Mono 48kHz 24bit Linear PCM Apple (ProTools) QualitätsAufnahmen AIFF 16bit, 44,1kHz Stereo Linear PCM Apple allgemein, wie WAV auf PC Musicam 256kb, 48kHz, Stereo Eigentlich mp1/layer2, mit Zusatzdaten für DIGAS DIGAS, Filextension „.mus“ MP3 128kb, 44,1kHz Stereo mp1/layer3, mit „ID3-Tag“ dabei (Titel, Interpret, Länge...) Consumer-Fileformat Audio-CD 16bit, 44,1kHz Stereo Linear PCM Speziell für Audio-CD, benötigt spezielle „Rip-Software“ MP4 128kb, Stereo AAC Apple iTunes: ACHTUNG DRM!!! Audio-Interfaces • • • • Umwandlung von Audio in Digitaldaten Umwandlung von Digitaldaten in Audio Eingänge: Mikrofon, Line, Digital Ausgänge: Line, Kopfhörer, Digital • Schnittstellen zu PC: – – – – – PCI: Steckkarte im PC PC-Card: für Laptops USB 1.1: für Mobil, Reportage USB 2.0 und Firewire: für Mehrkanal Ein- und Ausgabe Externe HW+PCI-Steckkarte: für ProTools Sauberes Eingangssignal hat höchste Priorität! Lineare Abtastung meist 48kHz, 16bit, Stereo (PCM) Software “Treiber“ bestimmt Latenzzeit Ein- Ausgangsschalter und Regler in Software Achtung auf Durchschliff des Eingangssignals! 50 PC-Schnittstellen Name Max. Rate Stecker Verwendung USB 1.1 12Mb/s Seriell, Anschluss von Peripherie am PC (Drucker, Scanner, Maus, Tastatur), einfaches Audio USB 2.0 480Mb/s Seriell, Anschluss von hochwertigen Geräten am PC, mehrkanalige Audio-Interfaces Firewire 400Mb/s Seriell, Anschluss von Kameras und Harddisks am PC, mehrkanalige Audio-Interfaces PC-Card SD-Card 32-128Mb/s Parallel, Schacht im Notebook, Speicher; Übergang zu anderen Schnittstellen (WLAN, ISDN, POTS) SCSI 40-320Mb/s Parallel, Anschluss von Harddisks, läuft aus Bluetooth 700kb/s Drahtlos, Übergang zu anderen Schnittstellen (zwischen Handy und PC, Audio denkbar) LAN (RJ45) 10, 100Mb/s Seriell, Netzwerk zwischen Computern, Sternförmige Verbindung über Hub (Switch) WLAN 11-54Mb/s Drahtlos, Funken von Netzwerk-Protokollen (1394) Signalkette Überspielung+Bearbeitung Aufnahmegerät LINE IN HiFi-Verstärker LINE OUT Audio-Interface LINE IN LINE OUT USB-KABEL Laptop / PC / Apple Lautsprecher 51 Audio- und Fileformate: Hinweise Encodingparameter Vor allem die “Bitrate” bestimmt die Qualität des Produktes. Je höher die Bitrate, umso besser die Qualität, jedoch benötigt man auch umso mehr Speicherplatz bzw. Übertragungszeit. 1 Minute Linear PCM Stereo benötigt 10 Megabyte Speicherplatz. 1 Minute mp3 mit 128kb/s Stereo benötigt 1 Megabyte Speicherplatz. ACHTUNG Die allermeisten Audio-Softwareprodukte bearbeiten das Material immer im linearen PCM-Format. Daher wird bei jedem Öffnen einer encodierten Aufnahme diese decodiert, und beim Abspeichern in mp3 neu encodiert! Führt man diesen Vorgang mehrfach hintereinander aus, verschlechtert sich die Audioqualität enorm! DAHER alle Aufnahmen, Bearbeitungen, Mischungen durchgehend in linear durchführen, und erst am Ende (wenn überhaupt nötig) in mp3 codieren!!! Metadaten Definition: Metadaten sind “Daten über Daten”. Sinn: Bei großen Ansammlungen von Audioaufnahmen (oder Photos oder Word-Dokumenten…) kann man ohne aussagekräftige Beschreibung keine Suche mehr durchführen. Metadaten werden dem eigentlichen Audio (der “Essenz”) zugefügt, um die Aufnahmen in Datenbanken erfassen, selektieren und sortieren zu können. Dateninhalt: Titel // Autor // Aufnahmedatum // Aufnahmeort // Stichworte Audioformat // Länge // Genre // Interpret // Album Das Datenfeld “Titel” ist nicht immer der Filename des Files!!! Anwendung: Im mp3-Format gibt es “ID3-Tags”, diese werden von iTunes oder vom Windows Media Player angezeigt. Im Hörfunk werden alle Audioaufnahmen in Datenbanken verwaltet, das Ausfüllen einiger Datenfelder ist dort Pflicht, oft werden schon im Titelfeld alle relevanten Informationen zusammengefasst Beispiel: MIJ060216 PK Vogelgrippe / Reichmann 52 Metadaten Problem: Zur sicheren Verwaltung müssen Metadaten konsistent sein, es muss über Jahre hinweg mit den gleichen Konventionen Titel, Autor, Datum etc. eingetragen werden Problem: Der Speicherort von Metadaten ist oft nicht aktiv bestimmbar. Manchmal werden diese direkt im Audiofile (“Header”) mitgespeichert, manchmal in einem extra Textfile das neben dem Audiofile liegt, manchmal in einer Datenbank in einem eigenen Verzeichnis (iTunes), manchmal in einer Datenbank auf einem Server. Übertragungstechnik 53 Informationstheorie Definition: Der Informationsgehalt einer Nachricht steckt in der Wahrscheinlichkeit ihrer Vorhersehbarkeit. Ist die Nachricht mit Sicherheit vorhersehbar, geht die Information gegen Null. Die Menge an Information entspricht dem Fehlen von Sicherheit, je höher die Entropie eines Systems, je mehr „Zufall“ durch Menge und Abfolge der ausgesendeten Symbole zugelassen wird, umso mehr muss übertragen werden, bis beim Empfänger Sicherheit über den tatsächlichen Gehalt der Nachricht eintritt. Sinn: Aufgabe ist es, an einem Punkt entweder präzise oder auch nur hinreichend präzise, die Nachricht, die an einem anderen Punkt ausgewählt wurde, zu reproduzieren. Siehe: Claude Shannon: “A mathematical Theory of Communication” aus “Bell Systems Technical Journal”, Murray Hill, NJ, 1948. S. 11-17 Übertragungsstrecke 54 Übertragungstechnik Sinn: Eine Übertragungsstrecke so zu nutzen, dass diese in der erwünschte Tonqualität, mit dem zulässigen Zeitbedarf, der geforderte Sicherheit, und dem vorhandene Budget Audiomaterial (Live oder als Aufnahme) übertragen kann. Problem: Zwischen diesen Forderungen kann man nur „Tradeoffs“ erreichen, sie widersprechen einander teilweise. Methoden: Je mehr Störungen auf einem Transportweg zu erwarten sind, umso mehr Redundanz muss man dem Signal zufügen. ( Funkstrecken) Die Kanalkapazität ist immer begrenzt, kann aber so genutzt werden, dass trotzdem die volle Qualität übertragen wird. ( „Abtausch“ Übertragungszeit gegen Qualität) WICHTIG: Es muss zwischen der physikalischen Strecke (zB ISDN), dem darüber laufenden Übertragungsprotokoll (zB email), dem verwendeten Fileformat (zB WAVE) und dem im File verwendeten Audio-Algorithmus (zB mp3) unterschieden werden!!! für Interessierte: „ISO/OSI Schichtenmodell“ 55 Physikalische Strecken Name Max. Rate Telefon Analog 56kb/s Verwendung Uploadzeit 1min HF-Audio Nur im Notfall, wenn kein ISDN möglich; bei Daten langsam und unzuverlässig; Ca. 10 Min. ISDN 128kb/s Bevorzugte Rundfunk-Anbindung; Live-Audio gut möglich, Datenverbindung stabil; gesicherte Bitrate; Symmetrische Kapazität (bidirektional). 2 Min. xDSL 512k-2Mb/s Breitband-Verbindung zu Provider, längere Anmeldung nötig; Live-Audio unsicher, Daten ok Ca. 30 Sek. Ethernet Netzwerk 10-100Mb/s Interne Verkabelung zu Server nötig; Live-Audio möglich („Voice over IP“) Ca. 5 Sek. WLAN 54Mb/s Drahtloses Netzwerk, für Datenübertragung Ca. 20 Sek. GSM 28kb/s Handy für Notfall; langsam, unsicher Ca. 20 min. UMTS 384kb/s Schnelles Handynetz, für Daten interessant, für qualitatives Live-Audio nicht geeignet Ca. 40 Sek. Anwendungsbeispiele News: Übertragung muss schnell gehen, Qualität weniger wichtig Live-Bericht über Telefon (wenn nichts anderes vorhanden) Feature: Zeitkomponente weniger wichtig, Qualität sehr wichtig Übertragung von Linearfile über Internet Beitrag: Qualität nicht an oberster Stelle, rasche Erledigung Übertragung mp3-File über Internet an Server Beitrag: Sicherheit sehr wichtig, da vertraulich Übertragung über Punkt-zu-Punkt ISDN-Einwahl Konzert: Livekonzert soll übertragen werden, Qualität wichtig Anmietung einer sehr teuren Strecke (Postleitung) Funkhaus: Viele Benutzer, Liveübertragung und Beitragsautausch nötig geschlossenes Hochleistungs-Netzwerk Datenbanken und Fileserver, Datenbankreplikation Live-Codecs höchster Qualität 56 Praktische Live-Verbindungen Telefon: - Jederzeit überall vorhanden - Qualität schlecht, Sicherheit schlecht ISDN: - an beiden Enden gleicher “Codec” nötig - wegen Übertragungs-Verzögerung muss das Studio einen speziellen Rückkanal schalten - gute Sprachqualität, gute Sicherheit Streaming: - Qualität je nach Internet-Anbindung - an beiden Enden gleicher “Codec” nötig - sehr hohe Verzögerung (mindestens 5 Sekunden) - keinerlei “Quality of Service” für Live Netzwerk: - innerhalb von geschlossenen Installationen brauchbar - sehr flexibel bezüglich Qualität und Routing Satellit: - spezielle Gerätelösung nötig - simuliert ISDN-Leitung, daher gute Sprachqualität - sehr hohe Flexibilität (Katastrophenberichterstattung) - hohe Kosten pro Minute Praktische File-Protokolle Email: - mp3 als “Attachement” möglich - allerdings nur bis max. 5 Megabyte Filegröße - unsichere Zustellungszeit - Empfänger-Mailbox oft überfüllt ftp: - “File Transfer Protocol”, gut für große Fileübertragung - Zielserver mit Konto muss eingerichtet und bekannt sein - ftp-Client-Software muss eingerichtet sein - relative sichere Übertragung bis zu 1 Gigabyte möglich - Geschwindigkeit von vorhandener Internet-Anbindung abhängig - ACHTUNG: Upload ist meist langsamer als Download! ISDN-PtP: - mit Punkt-zu-Punkt Einwahl auch zur Fileübertragung geeignet - spezieller Server nötig, Telefonnummer muss bekannt sein - hohe Vertraulichkeit, hohe Sendesicherheit 57 ftp Funktion: Das “File Transfer Protocol” eignet sich sehr gut für den Upload von Audio-Dateien an einen Rundfunksender oder ein Medienhaus. Es ist eines von mehreren Internet-Protokollen (von den “http” das üblichste ist Websurfen). Sinn: Das http-Protokoll ist für Text und Webseiten-Übertragung optimiert, Filetransfers laufen nur langsam und wenig zuverlässig ab. Das ftpProtokoll verbindet sich direkt mit einem ftp-Server, die verschickten Daten sind nach dem Upload auch am Server als “angekommen” sichtbar. Problem: Der Empfänger des Audiofiles muss einen ftp-Server betreiben, und ihnen ein Konto zur Anmeldung bekanntgeben. Sie müssen diese Daten in ihren Web-Browser oder (besser) in einen eigenen ftp-Client auf ihrem Computer eintragen. Im Browser sieht das so aus: ftp://username:passwort@servername Streaming, Download, Podcast Podcast: Siehe z.B. http://kmslavik.podspot.de/ 58 Audio Download Methode: Ein Audiofile, das auf einem Webserver bereitgestellt wird, kann man genau so downloaden wie ein Bild oder ein pdf-Dokument. Rechte Maustaste (mac: ctrl+click) Ziel speichern unter Sinn: Dies wird nur bei statisch angebotenen, rechtefreien Audio-Clips verwendet, die der Benutzer/Konsument komplett herunterladen und später erst am PC oder am mp3-Player anhören möchte. Probleme: - Das File liegt dann tatsächlich kopierbar beim Benutzer - Bevor man es anhören kann, muss man es komplett downloaden Will man nur die letzte Minuten eines langen Beitrages hören, muss man oft eine lange Zeit auf den Download warten Formate: - mp3 (44,1kHz – 128kb/s = mittlere Qualität) - linear WAV (hohe Qualität, langer Download) Audio Streaming Methode: Mit speziellen Streaming-Formaten, kann man direkt nach dem Anklicken gleich das Audio anhören. Liegt das File auf einem normalen Webserver kann die Verbindung allerdings leicht ins Stocken kommen, da das normale Internetprotokoll “http” nicht für Streaming-Anwendungen ausgelegt ist. Liegt das Audiofile dagegen auf einem speziellen Streaming-Server, und kann man (je nach Interneteinstellungen) auch das Protokoll UDP/RTSP benutzen, dann wird eine flüssige, stabile Abspielsituation eintreten. Man kann sogar an das Ende der Aufnahme springen, ohne auf einen Download warten zu müssen. Probleme: - Streaming-Server sind recht teuer und aufwändig im Betrieb. Sie können auch nur eine Maximalzahl ein gleichzeitigen Benutzern bedienen (100-10.000, sehr selten mehr). - Vor jeder Abspielung müssen ca. 5 Sekunden des Audiomaterials gebuffert werden (Anspielverzögerung). - Die Tonqualität ist meist schlecht, da stark komprimiert wird. Varianten: - “On Demand“: Audiofiles liegen schon fertig am Server - “Live”: Audio wird live von einem Encoder angeliefert 59 Audio Streaming Formate: - Real Audio (64kb/s = mittlere Qualität) - Windows Media (48kb/s = mittlere Qualität) - mp3 (über spezielle Server) Metafiles: Der Link auf der Webseite geht nie direkt zum Streaming-File, sondern immer zu einem Text-File. Erst in diesem steht dann der “Pfad” zum echten Medienfile. Diese können von einem Streamingserver nicht downgeloadet werden, und sind damit in gewissen Grenzen kopiergeschützt. Copyright: Max Baur Podcasting Methode: Podcasting ist keine wirklich neue Art der Audioübertragung, sondern nur eine Kombination verschiedener Webelemente. Der Kernbereich der Audioübertragung ist eigentlich ein einfacher Download. Podcasting ist also kein Streaming. Sinn: Möchte man Sendungen, die in mp3-Format angeboten werden und täglich bzw. stündlich aktualisiert werden, auf einen mp3-Player laden, müsste man recht viele Klicks durchführen. Wenn der Anbieter einen Podcast-Link anbietet, kann man damit solch ein Angebot “abonnieren”, man erhält automatisch die neuesten Beiträge heruntergeladen, im besten Falle sogar nicht nur in den PC, sondern gleich in den mp3-Player. Problem: Die komplette automatische Kette bis zum mp3-Player funktioniert nur mit wenigen Kombinationen aus Feed, Download-Software und mp3-Player-Gerät. System: Das Podcasting-System besteht aus mp3-Files und RSS-Feed am Server, Podcasting-Aggregator beim Client und mp3-Player. 60 Podcasting Content Management Systeme Methode: Um Audiofiles auf Webseiten anbieten zu können, muss die Redaktion meist ein “CMS” verwenden. Mit diesem können in die Text-Stories Links zu den Metafiles der Audiofiles gesetzt werden. Audio Audio Server Server Audio Audio PC PC Encoder Encoder Streaming Streaming Server Server web CMS CMS Server Server Text Text PC PC User ftp ftp http http Text Text Server Server Web Web Server Server 61 AUDACITY im Detail © 2006 by Karl Petermichl und Karl M. Slavik © 2004 und erstellt von Karl M. Slavik 62 © 2004 und erstellt von Karl M. Slavik © 2004 und erstellt von Karl M. Slavik 63 © 2004 und erstellt von Karl M. Slavik © 2004 und erstellt von Karl M. Slavik 64 © 2004 und erstellt von Karl M. Slavik © 2004 und erstellt von Karl M. Slavik 65 © 2004 und erstellt von Karl M. Slavik © 2004 und erstellt von Karl M. Slavik 66 © 2004 und erstellt von Karl M. Slavik Analoger Lichtton (Wellenform) Dolby Digital (Datenfeld) DTS (Steuer-Timecode-Spur) SDDS (Datenstrom) Zurück © 2004 und erstellt von Karl M. Slavik 67