Klänge
Physikalische Basis:
periodische Druckschwankungen um den (näherungsweise festen) Umgebungsdruck
breiten sich als Schallwellen aus
an einem Ort treffen direkte und (mehrfach) reflektierte Wellen ein
Physiologische Basis:
Hörapparat
Druckschwankungen mechanisch (Trommelfell, Hörknöchelchen) zum Innenohr übertragen
Bewegung feiner Härchen in der Gehörschnecke reizen Nerven
Frequenzbereich etwa 16 Hz - 16 kHz (altersabhängig)
Dynamikumfang etwa 10
-12
W/m
2
(Hörschwelle) bis 1 W/m
2
(Schmerzgrenze)
Empfang an zwei Stellen (Ohren) → Unterschiede (Lautstärke, Zeit, Klang) erlauben Richtungswahrnehmnung
Umwandlung in digitale Signale:
2 Mikrofone → 2 analoge Signale (Stereo)
Beispiel-Clip
Ausschnitt
Diskretisierung = Abtastung (Sampling) in festen Abschnitten
Sample-Zeit dt
Sample-Frequenz f
S
= 1/dt
max. Frequenz im gesampelten Signal = f
S
/2 (
Nyquist-Shannon-Theorem
)
typische Sample-Frequenzen
fS [kHz]
Anwendung
8
Telefon
44.1
CD
96
DVD-Audio
Quantisierung = Annähern der einzelnen Werte durch feste Anzahl von Stufen
typische Quantisierungen
Stufenzahl
Bit
Anwendung
256
8
Telefon (logarithmische Kennlinie)
65536
16
CD
16777216
24
DVD-Audio
Auswirkungen:
Originalclip
(44.1 kHz, 16 Bit)
niedrige Samplerate
Clip 01
(11.02 kHz, 16 Bit)
Clip 02
(5.51 kHz, 16 Bit)
niedrige Auflösung
Clip 03
(44.1 kHz, 8 Bit)
Clip 04
(44.1 kHz, 4 Bit)
mit falscher Samplerate abgespielt
Clip 05
(22.05 kHz, mit 44.1 kHz abgespielt)
Clip 06
(44.1 kHz, mit 22.05 kHz abgespielt)
WAV-Format:
von Microsoft definiertes Audioformat
Aufbau:
Header (Dateityp, Größe)
Formatbeschreiber (u.a. Samplerate, Bitbreite, Zahl der Kanäle)
Daten
Daten können verschieden kodiert sein (PCM, MP3, DOLBY AC2, MULAW etc.)
meistens PCM: Werte direkt (unkomprimiert), jeweils links/rechts abwechselnd
Ergebnis für 1 s Klang in CD-Qualität
2 Kanäle à 44100 Zahlen à 16 bit → 1411 kbit/s
Datenkompression:
verlustfrei schwierig, da wenig Wiederholungen von Bytefolgen
viele verlustbehaftete Formate
Datenrate ↔ Klangqualität bei der Kompression meistens einstellbar
nutzen Eigenheiten des Hörapparates aus, z. B.
geringe Empfindlichkeit bei sehr tiefen bzw. sehr hohen Frequenzen
Bildung von Frequenzgruppen im Innenohr
Maskierung von leisen höheren Tönen durch laute Basstöne
generelle Strategien
konstante Datenrate
Vorteil: Durchsatz (z.B im Internet) und Anforderung an Player konstant
variable Datenrate
Vorteil: "schwierige" Anteile werden aufwändiger kodiert als "einfache" → Qualität konstant
Kompressionsverfahren:
MP3
wichtige Anwendung: Internet, Player
bei 128 kbit/s und neuen Kodierern (Lame) kaum von CD zu unterscheiden
AC-3 ("Dolby Digital")
bei Filmen, DVDs für die Tonspur
verwendete Datenraten: 192 kbit/s (DVD) bzw. 320 kbit/s (im Kino)
AAC ("Nachfolger von MP3")
verwendet bei iPod, Nintendo
128 kbit/s für CD-Qualität
MP3-Klangbeispiele:
mit jeweils konstanter Datenrate
kodiert mit "
lame -h -b RATE"
Clip 07
(128 kbit/s, 231.0 kB)
Clip 08
(64 kbit/s, 115.3 kB)
Clip 09
(32 kbit/s, 57.6 kB)
Clip 10
(16 kbit/s, 28.7 kB)