4. Hangtechnika

 

4.1. A hang fizikai jellemzői

 

A hang (audio, latinul audire = hallani) anyagi közegben, hosszanti hullámokban terjedő mechanikus rezgés. A hangrezgéseket frekvenciájukkal, hangszínükkel, burkológörbéjükkel, hangerejükkel és terjedési sebességükkel jellemezhetőek.

A hangjelek (audiojelek) azok az akusztikus jelek, melyek az emberi fül számára hallhatóak, melyeket az ember észlel.

 

A hangok frekvenciaterületi felosztása:

- 0 – 20 Hz – infrahang

- 20 Hz – 20 kHz – hallható hangok

- beszédhangok (80 Hz ... 1300 Hz)

- zenei hangok (30 Hz ... 3000 Hz)

- 20 kHz – 1 GHz – ultrahang

- 1 GHz – 10 THz - hiperhang

 

Hangszín

Tiszta hangnak, vagy részhangnak nevezzük azt a hangot, melyet a hangforrás egyetlen frekvencián sugároz. A természetes hangok több frekvenciájú és hangerejű (amplitúdójú) részhangból állnak. A legmélyebb részhangot nevezzük alaphangnak, a további részhangok (felhangok) frekvenciái az alaphang frekvenciájának egészszámú többszörösei. A hang hangszínét a felhangok összetétele és hangereje határozza meg.

 

Hangérzékelés

A hallás az embert körülvevő közegben bekövetkezett nyomásingadozások érzékelése. A kisebb rezgésszámú hangokat mélyebb, a nagyobb rezgésszámú hangokat magasabb hangként érzékeljük. A hallható hangok határa életkoronként változhat. A hallásküszöb értéke megadja, hogy az adott ember adott frekvencián milyen hangnyomás szintet képes még meghallani. A hallásküszöb függ az egy időben hallott hangoktól, ezt a jelenséget (hangelfedés) hasznosítják a digitális hangállományok tömörítésénél.

 

Hangerő

A hangnyomás kifejezi a hangrezgés amplitúdóját, ez a hangerő, melynek értékét akusztikus decibelben szokás megadni.

 

Ajánlott linkek:

 

- Akusztikai alapok

 

- Audio tankönyv

 

4.2. Hangok analóg rögzítése, lejátszása

 

A hangjelek rögzítésekor célunk az, hogy egy adott információhordozóról később az eredetihez hasonló minőségben vissza tudjuk adni a hanganyagot. Első lépésben a hangjelek hangnyomását analóg módon rögzíthető elektromos jellé alakítják át, majd rögzítik. Lejátszáskor a rögzített jeleket elektromos jelekké alakítják, felerősítik, majd hangszórókon keresztül, hangnyomás formájában az eredeti hangjelhez hasonló alakban kerülnek visszaadásra.

Napjainkban hanganyagok analóg rögzítésére két eljárást alkalmaznak. Egyre szűkebb felhasználói körben az elektromechanikai hangrögzítést (hanglemezek esetén), valamint jellemzően a mágneses hangrögzítést (hangszalagok). (Tóth [1997] 55. old.)

 

Ajánlott link:

 

- Hangfeldolgozás

 

4.3. A hang digitális rögzítése, lejátszása

 

A digitális hangrögzítés az analóg rögzítés folyamatán alapul, a különbség a rögzített állomány típusában mutatkozik meg. „Az analóg jelek egy folyamatos(an változó) eseményt folyamatosan ábrázolnak. A digitális jelek csak (kódolt) szakaszos elemekből állnak.” (Holzinger [2004] 45. old.) Tehát az analóg jelek időben és értékben folyamatosak, viszont a digitális jelek időben és értékben elkülönülnek, diszkrét mintákból állnak. Az egyes mintákhoz bináris kódok tartoznak, melyek digitális áramkörök segítségével alakulnak át analóg jellé. (PCM technika - PulseCode-Modulation)

 

A PCM jel előállításának folyamatábráját a következő ábra mutatja:

7. ábra: A PCM jel előállítása

 

Digitális hangrögzítéskor az analóg rögzítéshez hasonlóan elektromos jelekké alakul át a hangjel, melyből mintavételezéssel és kvantálással rögzíthető digitális jelsorozatot kapunk.

A digitalizált hangállományból az eredeti hangállományt csak bizonyos hibával lehet visszaállítani. A hiba mértékétől függően beszélünk a digitalizálás minőségéről.

Hangok digitalizálásakor három fontos tényezőt kell figyelembe venni, mely paraméterek befolyásolják a hangállomány méretét és minőségét:

- a mintavételi frekvencia

- a kvantálási hossz

- a hangcsatornák száma (mono vagy sztereo)

 

Mintavételezés

„Mintavételezés: a jelből azonos időszakonként mintát vesznek.” (Holzinger [2004] 50. old.) A mintavételezési frekvencia értéke a rögzíteni kívánt hangfrekvenciás jel frekvenciatartományát határozza meg. Ha ez az érték az analóg jelben előforduló legnagyobb frekvencia kétszerese, akkor a visszaállított hanganyag hangfrekvenciák szempontjából hibamentes lesz. Annak érdekében, hogy az egyes eszközökön elkészített digitális hanganyagok más berendezéseken is megszólaltathatóak legyenek, három szabványos mintavételezési frekvencia létezik: 11,025 kHz, 22,05 kHz és 44,1 kHz. (Spanik, Rügheimer [1995] 111. old) A zenei CD lemezeken található hanganyagok 44,1 kHz-cel lettek mintavételezve.

 

Kvantálás

Kvantálásnak nevezzük azt a folyamatot, amikor mintavételezett impulzussorozat amplitúdó értékeit meghatározott számú bit felhasználásával bináris számokká alakítják át. A rendelkezésre álló bitek száma a kvantálási hossz. Minél több amplitúdó értéket lehet megkülönböztetni, annál pontosabban lehet visszajátszáskor a digitális jelsorozatból visszaállítani az eredeti analóg jelet. A kvantálás általában 16 biten történik, mely eljárás ebben az esetben 65.536 különböző kvantálási szintjével Hi-Fi minőséget eredményez.

 

Sztereo hanganyag rögzítésekor két csatorna jelét (bal- és jobboldali) digitalizáljuk, kétszer annyi információt tárolva, mint mono hanganyag egy csatornájú jelének rögzítésekor.

V. táblázat: A hangfájlok méretei (Holzinger [2004] 84. old.)

 

Minőség

Kvantálás (byte)

Csatornák száma

Mintavételi sebesség (kHz)

1 percnyi anyag

fájlmérete

Stúdió

2

4

48,00

23 MB

CD

2

2

44,10

10,5 MB

Magas minőségű beszéd

2

1

44,10

5,25 MB

PC minőség

1

2

44,10

5,25 MB

MM szabvány

2

2

22,05

5,25 MB

Alacsony minőségű zene

1

2

11,00

1,3 MB

Alacsony minőségű beszéd

1

1

11,00

650 kB

 

Ajánlott link:

 

- Hangrögzítés II. - A digitális korszak

 

4.4. Hangállományok tömörítése  - Hangformátumok

 

A digitális hangállományok tárolásához méretükből fakadóan sok helyre van szükségünk. Egy 16 bit kvantálási hosszal és 44,1 KHz mintavételezési frekvenciával felvett hangállomány hossza csatornánként és percenként:

 

44.100 Hz x 16 bit x 60 sec ÷ 8 = 5.292.000 bájt = 5.168 kbájt = 5,05 Mbájt

 

Tömörítési eljárások:

 

A digitális hangállományok méretét olyan tömörítési eljárással lehet csökkenteni (pszichoakusztikus kódolás), melynek alapja a hangelfedés jelensége.

A tömörítésnél a hangállományt egy kódoló dinamikusan elemzi, majd sávokra bontja. A különböző tömörítési eljárások más-más elemzési módszert használnak és a sávok száma is eltérő lehet. A tömörítések közti különbségekből származó minőségi eltérések alig érzékelhetőek.

 

Ismertebb tömörítési eljárások:

- MPEG Audio

 -Dolby Digital AC-3

- MPEG2 Advanced Audio Coding (AAC)

 

MPEG Audio

Előnye más hangkódolási formátumokkal szemben, kifinomult tömörítési elvének köszönhetően az MPEG állományok sokkal kisebbek. Eredményességét az érzékelthang-kódolás segítségével éri el, az emberi fül számára nem hallható elemeket szűrik ki.

- Mintavételezési frekvencia: 32, 44,1, illetve 48 KHz

- Kvantálási hossz: 8, 16, vagy 20 bit

- Egy vagy két hangcsatornát kezel

- Tömörítési elve: érzékelésen alapuló részsáv kódolás

- Csatornánkénti bitsebesség: 32 kbit/sec – 224 kbit/sec közötti állítható érték

- Az MPEG hangformátumok növekvő hatékonyságú és tömörítési arányú rétegei:

- Layer 1: Egyszerű eljárás

- Layer 2: Közepes bonyolultságú eljárás

- Layer 3: Bonyolult eljárás (MP3)

 

MPEG Audio Layer III – MP3

A hangfájlok tömörítését elenyésző minőségcsökkenéssel teszi lehetővé, a tömörítési eljárás a nem hallható hanginformációk kiszűrésén alapul. Az MP3 fájlok további előnye, hogy az állomány bármely részéből kiemelt kisebb darabot is le tudjuk játszani. 128 kbit/s mintavételezés mellett már CD minőségű hangzást lehet elérni. (Holzinger [2004] 243. old.)

 

Dolby Digital AC-3

A Dolby Laboratories cég fejlesztette ki az analóg Dolby Stereo hangrendszert, melyet a filmtechnika aknázott ki. A Dolby Stereo hangrendszer öt hangszóró (bal, középső, jobb és két környezeti) segítségével térhatású hangot állít elő. A Dolby Stereo digitális továbbfejlesztett változata az 5.1 csatornás Dolby Stereo Digital, melyben alkalmazásra került a mélysugárzó, és a két környezeti hangszórót külön csatornák kezelnek. A használt mintavételezési frekvenciák 32, 44,1 vagy 48 KHz, a kvantálási hossz 8, 16 vagy 20 bit.

A Dolby Digital (AC-3) a DVD lemezek számára módosított Dolby Stereo Digital hangrendszer. A hangállományt érzékelésen alapuló részsáv kódolási technika használatával tömörítik. A hallható hangtartományt 32 különböző szélességű frekvenciasávra bontja fel a kódoló, az egyes sávokból kiszűrésre kerülnek a zajelemek. A hangfelvételhez 6 mikrofont használnak, a 6 bemenő jelből állít elő a Dolby Digital kódoló egyetlen folytonos bitfolyamot. A bitfolyamot a Dolby Digital dekódoló szétbontja, és előállítja a hangszórók számára a vezérlést. (Valentinyi, 70. old.)

 

MPEG2 Advanced Audio Coding (AAC)

Az MPEG2 AAC kódolás a környezeti hangteret 5 hangszóróval valósítja meg. Az MP3 kódolás továbbfejlesztésének tekinthető. A kódolásnál a mintavételi frekvencia 8 KHz és 96 KHz között lehet, a kvantálás hossza 8 és 24 bit között van, míg a részsávok száma 1 és 48 között változhat.

 

Egyszerű hangformátumok:

 

Számos hangfájl formátumot dolgoztak ki a különböző számítógéprendszerek számára, ám ezek közül csak néhány terjedt el.

 

RAW

A legalapvetőbb fájlformátum. Kizárólag a digitalizált hangot tartalmazza, információkat a fájl tartalmával kapcsolatban nem.

 

WAV

Wavelet fájltípus. Az IBM és a Microsoft mintavételi formátuma, digitális hanghullámokat tartalmaz. Mintavételezése 11,025 kHz-től 44,1 kHz-ig, mono vagy sztereo minőségben. A WAV rugalmas felépítése lehetővé teszi, hogy fájlban rögzítsünk különböző, a tartalommal kapcsolatos adatokat (pl.: a hangminta szerzőjének neve).

A fájl a hangfelvétel közben érzékelhető hangnyomás „digitális változata”, tehát tetszőleges hangesemény tárolására alkalmas, a MIDI állományokkal szemben nem csupán a zenére korlátozódik. (Holzinger [2004] 91. old.)

 

4. 5. MIDI (Musical Instrument Digital Interface)

 

A MIDI szabványos adatformátumot elektromos hangszerek és zenei hatásokat létrehozó eszközök vezérlésére hozták létre, lehetővé teszi a számítógép és az elektromos hangszerek közötti zenei jelátvitelt. A MIDI egyidejűleg jelent a szabványnak megfelelő hardvert és ugyanennek a szabványnak megfelelő zenét is. A MIDI szabvány 128 különféle hangszert határoz meg, az egyes hangszerekhez számokat rendel. A szabvány a beszédet nem kezeli. (Collin [1995] 70. old.)

 

A MIDI hangszerre vonatkozó ábrázolásmódot alkalmaz, kódolása három adatot ír le:

- hangerő

- alapfrekvencia

- a hangszer megnevezése.

 

A MIDI segítségével 10 oktávnyi hang, azaz 128 hangjegy kódolása megoldható. Egy adott MIDI állományban levő utasításokat a hangkártyán elhelyezkedő szintetizátor vagy a hangkártya MIDI portjára csatlakoztatott külső szintetizátor értelmezi és szólaltatja meg. A szintetizátor hangszerei közül egyidejűleg több – készüléktől függően - is megszólaltatható, ugyanis a MIDI utasítások átvitele több csatornán történik. A MIDI állományokat egy sorrendvezérlő program segítségével készíthetünk. A program rögzíti, szerkeszti és vissza is játssza a MIDI utasításokat. Az elektronikus hangszereket a hangkártya MIDI portjára kell csatlakoztatni, a kívánt dallam lejátszását követően a sorrendvezérlő feljegyzi és meg is jeleníti az elvégzett műveletet. A megjelenített hangjegyeket módosíthatjuk, változtathatunk a lejátszás sebességén, módosítható az állomány hangneme. (Steinmetz [1995] 38. old)

 

Hangszerkesztő programok:

 

- Adobe Audition

 

- Audacity

 

- Goldwave

 

- Sony SoundForge

 

Zeneszerkesztő programok:

 

- Fruity Loops Studio - szoftveres szintetizátorprogram

 

- Orion - szoftveres szintetizátorprogram

 

- Sony Acid

 

- Ejay

 

Lejátszó programok:

 

- Winamp - a legismertebb MP3 lejátszó

 

- Quintessential Player

 

- Sonique

 

- CoolPlayer

 

Veszteséges hangtömörítő programok:

 

- Lame - ingyenes MP3 tömörítő

 

- MAD (MPEG Audio Decoder) - kiváló minőségű MP3 dekóder

 

- OGG Vorbis - ingyenes, nyilt forráskódú veszteséges hangtömörítő eljárás

 

Veszteségmentes hangtömörítő programok:

 

- FLAC

 

- Lossless Audio

 

- Monkey’s Audio

 

- WinRK

 

- WavPack