hudbaonline 728x15

nedeľa, 10. apríla 2016

Zvukové formáty WAV, MP3, OGG, AC3, AAC, MIDI

Zvukové formáty WAV, MP3, OGG, AC3, AAC, MIDI


Výber zvukového formátu


Pri spracovaní hudby bežne narážame na otázku, aký typ zvukového formátu je pre nás najvhodnejší. Záleží nám viac na kvalite alebo na veľkosti súboru? Nie vždy je ľahké nájsť optimálne riešenie. Každý užívateľ chce niečo iné. Preto vzniklo toľko rôznych formátov.
Pre laikov je určite zaujímavé dodať, že zvukový formát vyberáme kvôli spracovaniu, teda digitalizácii zvuku. Zvuk, ako je známe, je vlnenie. A aby sme ho mohli zaznamenať v počítači, musíme ho tzv. digitalizovať – teda zmeniť na jednotky a nuly, pretože počítače pracujú práve s nimi. Princíp je taký, že spomenuté vlnenie, resp. vlnu si „rozsekáme“ na množstvo tenučkých „slížikov“ a jednotlivým slížikom podľa ich dĺžky priradíme čísla. Ak čísla zase naspäť poskladáme, dostaneme pôvodnú vlnu. V praxi je to trošku zložitejšie, ale detaily teraz riešiť nepotrebujeme.

Pozrime sa teda bližšie na najbežnejšie zvukové formáty, ich plusy a mínusy.

WAV - veľmi rozšírený formát


Najbežnejším zvukovým formátom je WAV. Ako vidno, jeho názov je odvodený z anglického slova vlna (wave). V podstate ide o čistý záznam čísiel popísaný vyššie. Tento formát predstavuje plnú kvalitu (všetky zdigitalizované údaje sa zaznamenajú). Keďže sa údaje zaznamenávajú tak, ako idú, teda jeden za druhým, vzniká problém s veľkosťou takéhoto súboru. Formát WAV sa hodí na záznam zvuku, ktorý sa bude ešte ďalej spracovávať, keďže počítač a digitálne formáty ponúkajú široké možnosti úpravy. Príkladom môže byť úprava hlasitosti, odstránenie šumu, praskania LP platní, úprava frekvenčej charakteristiky (napr. zvýraznenie basov, či iných frekvenčných oblastí) a pod. Výsledný zvuk je ale vhodné nakoniec previesť do nejakého úspornejšieho formátu.

Komprimované formáty


Úspornejšie formáty sú tzv. komprimované a v zásade rozoznávame formáty so stratovou a bezstratovou kompresiou.

Bezstratové FLAC a APE


Bezstratová kompresia znamená, že zvuk zostáva naďalej v plnej kvalite, ale veľkosť súboru je menšia. Bežne cca polovičná oproti formátu WAV. Typickými prestaviteľmi tejto kategórie formátov sú napr. FLAC alebo APE. Pýtate sa, ako je možné stlačiť veľkosť súboru na polovicu bez toho, aby z neho zmizla čo i len jediná jednotka či nula? Jednoducho. V praxi sa totiž ukázalo, že je ďaleko úspornejšie zaznamenávať nie jednotlivé čísla – tzv. vzorky zvuku, ale ich zmenu oproti predchádzajúcej vzorke. Informácia je to tá istá (s trochou počítania), ale objem ukladaných dát je výrazne nižší. Dajú sa použiť ešte iné triky a objem sa tak celkovo zmenší o zhruba spomínanú polovicu.

Geniálna komprimácia na MP3


Existuje ale ešte aj iná kompresia – ako sme už naznačili – a to stratová. Ukázalo sa totiž, že náš sluch nie je dokonalý a dá sa pomerne ľahko oklamať (podobne ako zrak – aj pohyblivý film v televízii nie je v skutočnosti nič iné, len za sebou púšťané nehybné obrázky, ktoré ak sú premietané  v dostatočne rýchlom slede za sebou, vytvárajú ilúziu plynulého pohybu). A presne takúto nedokonalosť nášho sluchu využívajú stratové kompresné formáty. Najväčšou výhodou kompresných formátov je ich výrazne menšia veľkosť pri zanedbateľnom či dokonca nepostrehnuteľnom poklese kvality. Jedným z prvých a najpoužívanejších komprimovaných formátov je formát MP3. Ten dokáže stlačiť pôvodnú veľkosť súboru až na jednu desatinu, pričom sluchom len ťažko poznáme rozdiel oproti pôvodnej nahrávke.

Stratové kompresné formáty spravidla reprezentujú širokú škálu môžností v závislosti od dátového toku (tzv. bitrate) – čím je vyšší, tým je zvuk kvalitnejší ale súbor väčší. A naopak. Takže vlastne povedať, že napr. MP3 formát je nekvalitný nie je celkom v poriadku, veľmi záleží práve od použitého dátového toku. Kým súbor s dátovým tokom napr. 32 Kbit/s znie naozaj ako zvuk z telefónu (bez basov a výšok), tak zvuk v tom istom formáte MP3 ale s dátovým tokom napr. 192 Kbit/s znie naozaj na nerozoznanie od originálu. Dátový tok je asi najpodstatnejší parameter u MP3 súboru, ale určite nie jediný. Nezanedbateľný vplyv má aj kvalita tzv. kodeku (to je ako ten-ktorý kódovací program pracuje) a v neposledom rade tiež napr. to, či je dátový tok konštantný (nemenný) alebo variabilný (premenlivý). Ako už iste tušíte premenlivý dátový tok dáva možnosť tam, kde to nie je treba (napr. v tichších pasážach) použiť menej informácií a naopak tam, kde je to potrebné, ušetrené informácie pridať, čím sa celkový dojem z kvality zlepšuje.

OGG, AC3, AAC - zvuk filmu


V stručnosti spomenieme, že podobne ako MP3, existuje množstvo aj iných stratových formátov, ako napr. OGG (Vorbis), AC3 či AAC. Posledné 2 menované sa často používajú na záznam filmového zvuku, občas dokonca nie len 2-kanálového (stereo), ale aj priestorového – typicky 6-kanálového zvuku. V  súvislosti s priestorovým zvukom sa používa aj označenie Dolby Digital či DTS (Dolby Theatre System).

Všetky uvedené formáty slúžia na zachytenie zvuku presne tak, ako ho poznáme z bežného života – teda nielen hudby, ale aj reči alebo zvukov zvierat, či akýchkoľvek iných zvukov.

Digitálna tvorba v MIDI


Existuje ale ešte jeden špeciálny formát, ktorý slúži len na záznam hudby a to spôsobom úplne odlišným od vyššie popísaného. Tento formát sa nazýva MIDI (niektoré takéto súbory majú príponu MID).
Súbory vo formáte MIDI nezaznamenávajú zdigitalizovaný zvuk, ale zdigitalizovaný spôsob tvorby  zvuku – typicky hudby. Ak teda pripojíme napr. klávesový nástroj (tzv. synťák) s MIDI rozhraním k počítaču (tiež s MIDI rozhraním) a zahráme nejakú pesničku, počítač si uloží informácie o tom, aký nástroj (register) sme mali nastavený, ako silno a ako dlho bola ktorá klávesa stlačená a pri opätovnom prehrávaní vlastne pôvodný zvuk na základe týchto informácií vygeneruje. Ak namiesto pôvodného klávesového nástroja použijeme iný alebo necháme, aby nám zvuk prehrala zvuková karta v počítači, nemusí byť (a ani nebude) výsledný zvuk úplne rovnaký (identický) s pôvodným zvukom. Ale bude samozrejme veľmi podobný.
Súbor MIDI patrí medzi veľmi úsporné formáty, čo do veľkosti (je zrejmé, že tých informácii je oproti rozkúskovanému zvuku, čo býva typicky niekoľko desiatok tisíc vzoriek za sekundu, omnoho omnoho menej).

Pre lepšiu predstavu uveďme zopár typických príkladov. Jedna pieseň vo formáte MIDI má napr. 20 KB. Tá istá pieseň zaznamenaná vo formáte MP3 s dátovým tokom 128-192 Kbit/s môže mať 4 až 6 MB (t.j. cca 250 krát viac). A súbor v nekomprimovanom formáte WAV (systém CD audio používa dátový tok 1,4 Mbit/s (cca 1 400 Kbit/s)) by mal až cca 50 MB. Z uvedneého je jasné, prečo sa v prenosných prehrávačoch uchytili komprimované formáty. Pri dostatočnom dátovom toku je ich kvalita stále veľmi dobrá a je rozdiel, či si do prehrávača s kapacitou napr. 8 GB dokážete nahrať 10 alebo 100 albumov svojej obľúbenej hudby.

A prečo sa vlastne nepoužívajú MIDI prehrávače, ktoré by boli extréme úsporné? Pretože by nedokázali reprodukovať ľudský hlas a spev. Ľudia na rozdiel od klávesových nástrojov digitálny výstup nemajú. A navyše rozdiel vo farbe zvuku medzi 2 klavírmi je určite menší ako napr. medzi farbou hlasu Michaela Jacksona a Madonny :-). Takže ako vidno, nie je jedno, aký zvukový formát použijete.

Autor príspevku: VM