DIGITAL AUDIO
Zu diesem Foliensatz wurden zahlreiche Audiobeispiele gezeigt, die in der PDF-Version nicht enthalten sind.
Was ist Audio?
Eigenschaften von Schallwellen
Das menschliche Ohr
Räumliches Hören, Klänge & Geräusche
Warum Audio digitalisieren?
Analog zu Digital
Probleme der AD/DA-Wandlung
Psychoakustik
Kompression (MP3)
Übertragung (MIDI)
Audio Retrieval
Übersicht
2AGENDA
3
Töne
Sprache
Geräusche
Musik
...
Was ist Audio? I
Was ist Audio? 4
Schwingungenwellenförmige Vibration in
Flüssigkeiten
Festkörpern
Gasen (Schallgeschwindigkeit: 330m/s = 1188 km/h)
periodische Schwingungen (Klänge)
Musikinstrumente
Gesang
Wind
...
nichtperiodische SchwingungenSprache
Geräusche
...
Was ist Audio? II
Was ist Audio?
5
Amplitudeobjektiv:Energie des Klanges
subjektiv:Lautstärke der Schwingung
Was ist Audio? II
Was ist Audio? 6
FrequenzenInfraschall: 0 bis 20 Hertz (Hz)
Hörschall: 20 bis 20 kHz
Ultraschall: 20 kHz bis 1 GHz
Hyperschall: 1 GHz bis 10 THz
Was ist Audio? III
Was ist Audio?
Was ist Audio? IV
7Was ist Audio?
Longitudinal- und Transversalwellen
Longitudinalwelle: Oszillatoren schwingen in der Ausbreitungsrichtung
Transversalwelle: Oszillatoren schwingen quer zur Ausbreitungsrichtung
8Eigenschaften von Schallwellen
Wellenlänge
Die Länge einer Welle (d.h. der Abstand bis zur nächsten Wiederholung) bestimmt sich aus der Periodenlänge T und der Ausbreitungsgeschwindigkeit c
9Eigenschaften von Schallwellen
Reflexion
10
Reflexionsgesetz (Einfallswinkel gleich Ausfallswinkel) gilt für Schallwellen nur, wenn die Grenzfläche groß genug im Vergleich zur Wellenlänge ist
d.h. in kleineren Räumen keine Reflexion tiefer Frequenzen
Rauigkeit der Oberfläche führt zu diffuser (zerstreuender) Reflexion, wenn Unebenheiten in der Größenordnung der Wellenlänge
d.h. auch bei zentimetergroßen Unebenheiten wirkt Wand auf tieffrequenten Schall als "glatt"
Eigenschaften von Schallwellen
Absorption, Brechung
Ein Teil der Schallenergie wird nicht reflektiert Absorptionsgrad abhängig vom Material und der Schallfrequenz
Dissipation: Umwandlung in Wärmeenergie
Transmission: Weiterleitung im absorbierenden Medium
Aufteilung der absorbierten Energie in Dissipation und Transmission
frequenzabhängig: niedrige Frequenzen höhere Transmission (Körperschall)
Auch Schall wird gebrochen, z.B. bei Luftschichten verschiedener Temperatur
11Eigenschaften von Schallwellen
Beugung
Schall-"Schatten" entsteht erst, wenn ein Gegenstand groß genug im Vergleich zur Wellenlänge ist
Bei Gegenständen in Größenordnung der Wellenlänge tritt Beugung auf
Wellen fliessen "um das Hindernis herum"
Wellen werden von einem Spalt zerstreut
12Eigenschaften von Schallwellen
13
Das menschliche Ohr
Das menschliche Ohr 14
Das menschliche Ohr
Aussenohr: HRTF = Head Related Transfer Function
Mittelohr: Trommelfell, Hammer, Amboss, Steigbügel: Verstärkung der Kraftwirkung
Innenohr: Schnecke (cochlea)
Aufgerollte Röhren (Gänge), gefüllt mit Lymphflüssigkeit
Das menschliche Ohr
Schnecke
15Das menschliche Ohr
Räumliches HörenStereo-Effekt
Unterschiedliche Lautstärke des Schallereignisses an beiden Ohren
Zeitliche Verzögerung des selben Schallereignisses in seiner Wahrnehmung durch beide Ohren
Verzögerungsmessung liefert Information über Entfernung der Quelle
Kann ein einseitig tauber Mensch räumlich hören? Eingeschränkt: ja!
Reflexion und Beugung an Umwelt und Ohrmuscheln liefern umfangreiche Information
Frequenzabhängigkeit der Ortung: Niedrige Frequenzen generell schlechter zu orten
Konsequenz physikalischer Tatsachen (Wellenlänge:Hindernis)
Siehe z.B. „Subwoofer“-Technologie
16Räumliches Hören
Laufzeitdifferenzen
17Räumliches Hören
Head Related Transfer Functions (HRTF)
18
Für alle Positionen rund um den Kopf Impulsantwort von der Position zu beiden Ohren messen (HRIR)
Fourier-Transformation davon ist die HRTF
Enthält alle physikalischen cues für die Lokalisierung
HRTF von Mensch zu Mensch verschieden
Sobald HRTF für beide Ohren bekannt ist, kann mit einem Kopfhörer Raumklang (also auch vorne/hinten und oben/unten) erzeugt werden
Räumliches Hören
Klang und Geräusch
Töne sind vom Menschen wahrnehmbare kleine Luftdruckänderungen
Primärempfindungen der Tonwahrnehmung: Tonhöhe (Bsp. verschiedene Klaviertasten)
Lautstärke (Bsp. Trommelanschlag)
Klangfarbe (Bsp. gleicher Ton auf verschiedenen Instrumenten)
Klang: alle drei Primärempfindungen wahrnehmbar
Geräusch: nur Lautstärke wahrnehmbar
19Klänge und Geräusche 20
Qualität der ReproduktionQualität ist NUR abhängig von der Analog/Digital/Analog-Konvertierung
Qualität ist unabhängig vonVerarbeitung (z. B. Geräte)
Transport (z. B. Kabel)
Speicherung (z. B. Festplatte, Magnetband, CD)
Möglichkeiten der Konvertierung/Bearbeitungverlustfreies Kopieren
nicht-sequentieller Zugriff
nicht-destruktives Editing
platzsparendere Speicherung
...
Warum Digital ?
Warum Digital?
21
PAM (Puls Amplitude Modulation)Ermittlung von Amplitudenwerten innerhalb eines Zeitintervalls
Analog zu Digital I
Analog zu Digital 22
PWM (Puls Width Modulation)Ermittlung von Impulsen, deren Länge die Intensität des analogen Signals wiedergibt
Analog zu Digital II
Analog zu Digital
23
PCM (Pulse Code Modulation)universelles Verfahren zur Digitalisierung von analogen Zeitreihen
SamplingAbtastung des analogen Signals ineinem festgelegten Zeitintervall
Verwendung von PAM
QuantisierungZuordung eines ganzzahligenWertes innerhalb eines festgelegten Zahlenbereiches
Analog zu Digital III
Analog zu Digital
Nyquist Abtast-TheoremHarry Nyquist (1889 – 1976)
Mathematisch bewiesen durch Claude E. Shannon und Vladimir Aleksandrovich Kotelnikov
die Abtastrate (Sampling Frequenz) muss doppelt so hoch sein, wie die höchste Frequenz des abzutastenden Signals
Folge: Frequenz-Überlappung (Aliasing)ggf. falsche Rekonstruktion des Signals
24
Probleme der AD/DA-Wandlung I
Nyquist
Shannon
Kotelnikov
Probleme der AD/DA-Wandlung
25
QuantisierungsrauschenFehler durch Rundung bei der Digitalisierung
Probleme der AD/DA-Wandlung II
Probleme der AD/DA-Wandlung 26
Verzerrungen (Clipping)Übersteuerung des Eingangsignals
Abschneiden der Spitzen eines Signals
Folge von Variablenüberläufen
Probleme der AD/DA-Wandlung III
Probleme der AD/DA-Wandlung
27
Hörschwelleunterschiedliche Empfindlichkeit (Lautstärkeeindruck) des Gehörs für verschiedene Frequenzbereiche
höchste Empfindlichkeit im Bereich von 2 kHz bis 4kHz
Psychoakustik I
Psychoakustik
Psychoakustik II
28Psychoakustik
29
MaskierungÜberdeckung eines Frequenzbereiches durch ein Störsignal (gleichzeitige Maskierung)
Zeitliche Maskierung verdeckt auch nach Abschalten des Störsignals den betreffenden Frequenzbereich(zeitliche Maskierung)
Psychoakustik III
Psychoakustik 30
DynamikkompressionEinsatz nichtlinerarer (logarithmischer) Quantisierung
kleine Signale werden mit niedrigeren Bitwerten kodiert
Beispiele: A-law, u-Law
Psychoakustische KompressionVerwendung von Subband-Kodierung & Maskierung
dadurch Entfernung von irrelevanten Daten
Reduktion der Datenrate
Beispiel: MP3, AAC
Audio-Kompression
Kompression
31
Kurzform von MPEG-1 Audio Layer 3Verwendung der»psychoakustischen Kompression«
Nicht für den Menschen hörbare Informationen werden entfernt
Entfernung von Redundanzen
Kompression von Audiodaten bei vermeintlich geringem Qualitätsverlust
Kanalkopplung (Stereo) – Differenzsignalbildung
Entfernung nicht hörbarer Frequenzen und maskierter Audioinformation
Karl-Heinz Brandenburg, Harald Popp: An Introduction to MPEG Layer 3. EBU Technical Review, Juni 2000.
http://www.iis.fhg.de/amm/
Kompression MP3 (I) Übersicht
Kompression 32
Algorithmus (Übersicht)
Kompression MP3 II
Kompression
33
Algorithmus (1)Anwendung eines Faltungsfilters, um ein Signal in 32 Bänder zu unterteilen
Berechnung des Schallddruckpegels eines Bandes
wenn der Schalldruckpegel eines Bandes kleiner ist als der Maskierungsschwellwert eines Nachbarbandes, wird dieses Band nicht kodiert.
Andernfalls werden die Koeffizienten quantisiert
Kompression MP3 III
Kompression 34
Algorithmus (2)Unterteilung des Datenstromes in Frames
Ein Frame entspricht einem Tonsignal über eine bestimmte Zeiteinheit
Jeder Frame enthält 384 Samples, die Abtastwerte aus 32 Teilbändern repräsentieren
Aus jedem Teilband stammen 12 Werte
Kompression MP3 IV
Kompression
35
Algorithmus (Übersicht)
Kompression MP3 V
Kompression
Kompression MP3 VI
Datenrate von 32 bis zu 320 KBit/s
Samplingrate 32/44,1/48 kHz16 Bit Stereo
Abb. zeigt typische Kompressionsartefakte bei der Fourier-Transformation
36Kompression
Advanced Audio Coding (AAC)Vergleich zu MP3
bessere Qualität bei gleicher Dateigröße
tonale und geräuschhafte Elemente im Eingangssignal effektiver erkannt und kodiert
Pre-Echo Problem (Kompressionsartefakte) verbessert.
Unterstützung für Multichannel-Audio (bis 48)
Bis zu 96 KHz Abtastfrequenz
DRM-Verfahren »FairPlay« implementiert
EntwicklungStandardisiert bei der ISO MPEG2/MPEG4, EBU-Recommendation
Dolby (AC3), Fraunhofer IIS (MP3), AT&T, Sony, Nokia ...
Erweiterung HE-AAC für niedrige BitratenMPEG-4 High Efficiency Advanced Audio Coding,mit Spectral Band Replication (SBR) auch AACplus v1
Mit Parametric Stereo (PS) auch AACplus v2
37Kompression
Hörbeispiele Audiocodecs
38
http://inka.fhtw-berlin.de/Herzog/
Kompression
39
MIDI (Musical Instrument Digital Interface)standardisiertes Protokoll zur Steuerung elektronischer Musikinstrumente und Musikeffektgeräte
physikalische Schnittstelle
Überbegriff für die Musik, die diesem Standard genügt
1984 entwickelt
Standardisierung und Weiterentwicklung durch International Midi Organisation (IMA)
MIDI Manufacturers Association(MMA)http://www.midi.org/
Übertragung - MIDI (I)
Übertragung 40
KomponentenSequenzer
Komponieren/Wiedergabe von Musik mit Rechner
MIDI Sequenzen werden in MIDI-Dateien gespeichert
SynthesizerSynthetische Erzeugung und Manipulation von Klängen
SamplerWie Synthesizer, jedoch synthetisiert ein Sampler Töne aus einer Palette von Instrument-Samples
Übertragung - MIDI (II)
Übertragung
41
Datenformatinstrumentenbezogene Kodierung
Lautstärke
Grundfrequenz
Bezeichnung des Instruments
MIDI-Nachrichten bestehen aus einem Statusbyte und bis zu 3 Datenbytes
Statusbyte 1 B B B K K K K
Datenbyte 0 _ _ _ _ _ _ _
Statusbyte kündigen eine Aktion an und gliedern sich in Kanal- und Systembefehle.
Kanalbefehle (BBB) beziehen sich auf der insgesamt 16 Kanäle (KKKK), mit denen jeweils ein angeschlossenes Instrument assoziiert ist
Übertragung - MIDI III
Übertragung 42
VorteileMIDI-Dateien sind plattformübergreifend
MIDI-Dateien sind sehr klein: 1 min Musik ca. 15- 30 Kbyte
MIDI Kodierung entspricht der Vorgehensweise beim klassischen Komponieren
NachteileOhne wirklich gute Instrumente kein schöner Klang, da synthetische Klangerzeugung
keine Sprache oder Geräusche
MIDI-Dateien klingen auf unterschiedlichen Systemen, je nach eingesetzten Geräten unterschiedlich
Übertragung - MIDI (IV)
Übertragung
43
General Midi (GM)Standard-Erweiterung ermöglicht geräteunabhängig möglichst originalgetreue Wiedergabe
Midi über IEEE 1394 (FireWire)
Verwendung aktueller Technologien und Protokolle
Übertragung MIDI V
Übertragung
Audio Retrieval
TempoerkennungVerfahren zur automatischen Schätzung der Rhythmus beschreibenden Elemente Tempo, Taktart und Mikrotime
Query by Humming (QbH)Melodieerkennung/Musiktitelerkennung auf Grundlage gesungener oder anderer monophoner Melodien
Bsp: http://www.musicline.de/de/melodiesuche/
Statistische KlassifikationJedes Geräusch hat typische Werte (loudness, pitch, brightness, bandwidth)
Trainingsset von Geräuschen einer Klasse ermöglicht Einordnung (Bsp. Gelächter, Beifall, Kinder)
...
44Audio Retrieval
Film: http://www.celemony.com/
»Taschenbuch Multimedia«HENNING, PETER A., Fachbuchverlag Leipzig, 2. Auflage 2001, gebundene Ausgabe, 603 Seiten, ISBN 3446217517, ca. 20
»Multimedia Technologie«Grundlagen, Komponenten und SystemeSteinmetz, Henning, Springer Verlag Heidelberg, 3. überarbeitete Auflage 2000, gebundene Ausgabe, 968 Seiten, ISBN 3-540-67332-6, ca. 55
»The Art of DIGITAL AUDIO«Watkinson, John, Focal Press Oxford, Third Edition 2001, Hardcover, 752 Seiten, ISBN 0-240-51587-0, ca. 84
46
Literatur
Literatur
47
http://www.ieee.org
http://www.itu.int/ITU-T/
http://www.cs.columbia.edu/~hgs/audio/
http://www.digitalaudioguide.com/glossary.htm
http://www.mp3encoding.de
http://www.midi.org/
http://www.superaudio-cd.com/
Links
Links