Vzkumné centrum
JAMU
Vizualizace barvy zvuku
MgA. Ondřej Jirásek, Ph.D., Výzkumné centrum JAMU
Vizualizace zvuku v hudební výuce
Hudebník by měl na prvním místě trénovat své hlavní čidlo - sluch. Vizualizace mu ale poslouží
k rychlé zpětné kontrole. Ke kvantitativnímu i kvalitativnímu zobrazení toho, zda správně
rozeznává/analyzuje, co se ve zvukovém vzorku děje ohledně výšky, délky, síly i barvy.
Vizualizace může probíhat jak v reálném čase, tak i zpětně ze záznamu. Učiteli k ní postačí dokonce
jen počítač nebo notebook se zabudovaným mikrofonem a patřičný program. Ještě lepší variantou je
samozřejmě kvalitní mikrofon napojený na kvalitní ADDA převodník, dále dobrá sluchátka i
zvukové monitory (repro bedny).
Barva zvuku a její analýza je poměrně složitá záležitost. Přesto lze barvy rozdělit do několika
základních kategorií, které by měly být srozumitelné i užitečné běžnému muzikantovi.
Tvar kmitů
Už pouhý tvar kmitů/vln prozradí znalému akustikovi a potažmo výkonnému hudebníkovi velmi
mnoho. Podle toho, jak vlna kmitá, lze signál rozdělit do následujících kategorií.
Sinus
Sinus je dokonalý harmonický pohyb, je plně tónový (neobsahuje žádnou hlukovou složku) a jeho
signál obsahuje 1 harmonický.
Obr. 1: Sinus
Barevně se blíží např. písknutí, témbru okaríny, zobcové fétny, pp horny, fažoletu u strunných,
pizzicatu, spodním rejstříkům příčné fétny či klarinetu. Valér je lehce zamaskovatelný jinými zvuky.
Pokud se ve stejné výškové poloze nalézá ostřejší/sytější nástroj, hebčí valér lehce zamaskuje.
Pro barvu potom mohou platit následující adjektiva: měkký, zastřený, hebký, neprůrazný, průhledný,
mělký, jemný, prázdný, průzračný, tupý, kulatý.
Trojúhelník, obdélník (čtverec)
Trojúhelník i obdélník jsou geometrické (předvídatelné) tvary, jsou harmonické, neobsahují žádnou
hlukovou složku. Vykazují nespojitý, lomený zrcadlový (symetrický) pohyb: trojúhelník má jen
jeden lom, blíží se více sinusu, obdélník má již lomy 2, vzdaluje se více od sinusu.
Obr. 2: Trojúhelník
Obr. 3: Čtverec
Trojúhelník a obdélník obsahují jen liché harmonické. Poměr trvání mezi nejhlasitější a nejtišší
polohou se nazývá střída a ovlivňuje, kolik lichých harmonických v signálu bude a jak budou hlasité.
Valér je středně sytý, jakoby dutý. Zvukově sem patří především klarinet, který trojúhelník či čtverec
generuje díky jednoplátku a také válcovitému korpusu (vlastně polokryté píšťale).
Pro barvu potom mohou platit následující adjektiva: dutý, nosový, huhňavý, huhlavý, plovoucí
(s vnitřními barevnými procesy), oblý, rozladěný.
Pila
Pila je geometrický (předvídatelný) tvar, je harmonická, neobsahuje žádnou hlukovou složku. Má
nespojitý, lomený a nesymetrický pohyb. Určujeme u ni fázi náběhu a doběhu, čím budou fáze
náběhu a poklesu strmější (střída rozdílnější), tím bude tón ostřejší s větším množstvím
harmonických.
Obr. 4: Pila
Signál pily obsahuje jak liché tak sudé harmonické, střída ovlivňuje hlasitost harmonických - čím
bude střída rozdílnější, tím bude křivka harmonických pomaleji klesat – shorků bude více a budou
hlasitější. Témbr bude mít podobnou barvu jako např. f či f tón smyčcových nástrojů, žesťů jako
trubky či trombón. Velice ostrá a průrazná barva je nesnadno zamaskovatelná jinými zvuky, ale
sama silně maskuje.
Pro barvu potom mohou platit následující adjektiva: ostrý, průrazný, jasný, plný, sytý, agresivní,
pronikavý, tvrdý, bryskní, špičatý, jiskrný, zvonící.
Obdélník (puls)
Střída u obdélníku je 1:10, tedy úzká, tvarem začíná signál splývat dokonce s úzkou pilou. Lichých i
sudých vyšších harmonických se bude vyskytovat hojně, harmonické zde nepoklesávají
exponenciálně nýbrž vlnovitě.
Obr. 5: Puls
Barvou se signál bude blížit dvojplátkovým nástrojům jako hoboji či fagotu. Pulsový signál vzniká
díky dvojplátkům, hbitě se spojujícím a rozpojujícím, ale také kuželovitému (či kuželovitě vrtanému)
korpusu. Co do barvy, nástroje bude vynikat v okolí jiných třeba i sytějších valérů.
Pro barvu potom mohou platit následující adjektiva: průrazný, agresivní, mečící, vrčící, vrnící,
roztřepený.
Šum/hluk
Šum je negeometrický (nepředvídatelný) tvar, je neharmonický, obsahuje jen hlukové složky (nebo
minimum harmonických). Má nespojitý a nesymetrický pohyb a víceméně pokrývá celé spektrum od basů po výšky.
Obr. 6: Šum
U absolutního šumu nemůžeme určit výšku tónu. Šum či hluk pokrývá výsek spektra, nemůžeme
však stanovit jeho přesnou výškovou hranici (začátek a konec). Zvuk nám připomíná dech,
z hudebních nástrojů sem patří např. činely, gongy anebo přeforsírované tóny (skřípání, chraptění),
nemelodické bicí, tvrdě zkreslená kytara, techno/acid/scratch elektronické rejstříky. Většina
hudebních zvuků obsahuje i šumové či hlukové ingredience. Šum a hluk pokrývají rovnoměrně buď
úsek či výsek spektra a tam důsledně maskují ostatní zvuky.
Pro barvu potom mohou platit následující adjektiva: šumící, syčící, hlučící, chrastící, chraptící,
drnčící.
Půjdou vždy tvary vlny rozdělit do těchto kategorií?
V praxi existují samozřejmě mnohem složitější tvary, hlavně ty, které vycházejí z různě hlasitých
harmonických a tím i pestřeji kmitajícího signálu. I tak můžeme obvykle vypozorovat tendenci, do
které kategorie svým tvarem signál směřuje. Je potřeba sledovat tvar signálu z různého odstupu,
vzdálenosti (funkce Zoom).
Navíc přírodní zvuky obsahují jak tónové tak šumové ingredience a to v různých poměrem. Dále i
množství tzv. tranzientů – přechodných jevů, kdy se relativně ustálený tvar kmitů/vln, tj. v tomto
případě barevně rovnoměrný úsek protíná do úseku druhého později znovu ustáleného. Podobně
jako když se ve flmu prolínají dva záběry. Transientní fáze je proto komplikovaná a víceznačná,
nemusíme v ní vůbec rozpoznat, o které dva propojující se konstantní a jinak lehce identifkovatelné
témbry se jedná.
Tvar vlny v reálném čase a ze záznamu
Ve výuce se pravděpodobně nejvíce užije tzv. osciloskop, zařízení zobrazující výsek kmitů v reálném
čase. Vodorovná ose zleva doprava zobrazuje časový výsek v milisekundách, vertikální osa zleva
doprava označuje amplitudu kmitů, tedy sílu nebo dynamiku zvuku. Je značena v decibelech nebo
převedena do jednotky elektrického napětí (V).
Obr. 7: Osciloskop
Díky okamžitému zobrazení kmitů může hudebník vizuálně posoudit, jaký tvar signálu vyluzuje. Při
znalosti základních kategorií tvaru signálu ihned zařadit, kam témbr nejvíce směřuje. Např. u
uvedeného příkladu, přestože jde o mužský zpěv, se střídají dva druhy kmitů – jeden blížící se
čtverci, druhý blížící se trojúhelníku. Barva bude proto inklinovat k valéru s převládající složkou
lichých shorků (dutější, prázdnější tón).
Můžeme však hudební výkon zaznamenat, přehrávat a ve stejně zapojeném okně s oscilátorem
zpětně pozorovat, co jsme to vlastně zahráli.
Programy pro sledování kmitů/vln v reálném čase
Editační, ale i nahrávací program WaveLab obsahuje ve své bohaté výbavě i okno Osciloskop. Pokud
nastavíme vstupy tak, aby se signál připravený na nahrávání zobrazoval v tomto okně, stačí hrát ale
nezapínat červený/nahrávací knofík a kmity se v osciloskopu živě zobrazí.
Obr. 8: Osciloskop v programu WaveLab
Stejné okno pak obsahuje program Audio Explorer. Stačí u něj přejít do režimu Real Time, který je
nastaven na okamžité měření přicházejícího zvuku. Na ukázce níže zobrazuje tvar písknutí.
Všimněme si, že odpovídá tvaru sinusu, tedy barvě s jediným vyšším harmonickým.
Obr. 9: Osciloskop v programu Audio Explorer
Programy pro sledování vlny/kmitu ze záznamu
Oba výše uvedené programy umí samozřejmě i signál zaznamenat, anebo vlastní zaznamenaný nebo
v jiném programu nahraný a exportovaný soubor přehrát. Výhodou takové analýzy je, že se ke
vzorku můžete vracet, analyzovat jeho jednotlivé fáze. Mimochodem i interpret se na vzorek může
„podívat„ z odstupu, tedy očima i ušima hudebního režiséra, dirigenta či pedagoga nástroje.
V programu WaveLab stačí otevřít dvě okna: Wave (vlna či analyzovaný výchozí soubor) a
osciloskop (analyzující okno). Kurzor nás informuje, kterou fázi vzorku právě přehrává a osciloskop
zobrazuje odpovídající tvar kmitů.
Obr. 10: Přehrávání záznamu v programu WaveLab
V programu Audio Explorer jde stejně zobrazit zdrojové (na obrázku horní) okno, do něj načíst
zvukový soubor, přehrávat jej a sledovat v osciloskopu.
Obr. 11: Přehrávání záznamu v programu Audio Explorer
Existuje řada dalších programů (ProoTools, Logic, Cubase, Adobe Audition, Sound Forge ad.), které
sice nemusí mít ve výbavě osciloskopu, ale přesto v nich můžeme tvar zaznamenaného signálu
rovněž pozorovat. Stačí použít zmíněnou funkci Zoom, kterou podobně jako dalekohledem či lupou
vlnu přibližujeme nebo vzdalujeme.
Výhodou vzdálenějšího pohledu, při kterém už nespatříme detailní tvar kmitu/vlny, ale celý
zobrazený úsek je, že nás informuje o dynamickém obrysu úseku. Na ukázce níže tak můžeme
v mžiku srovnat, jak například u klasické kytary a nylonových strun při drnknutí bříškem rychle
doznívá (psaný) tón e, c´ a e´´. Ověříme si tak prakticky známé pravidlo, že vyšší tóny utichají
dynamicky mnohem rychleji než tóny hlubší.
Obr. 12: Přehrávání záznamu v programu Sound Forge
Při zavádění jakékoliv novinky hraje důležitou roli nezvyk a učení se, tj. práce navíc. Jestliže si však
jak učitel, tak žák tyto dovednosti během času osvojí, budou odměněni: přesnější zpětnou vazbou,
než mohou dát jejich leckdy subjektivně pojaté smysly. A výsledek by měl při správném zužitkování
informací, které analýza poskytla, přinést jak zvýšení hráčské techniky, tak i zlepšení sluchových
dovedností ad.
Spektrogram
Jak název napovídá, jedná se o nástroj umožňující analýzu spektra. Připomeňme, že tóny mají
pravidelný průběh, který je složen zřídka z jedné (sinus) většinou však z více (čtverec, pila atd.)
frekvencí, které se nacházejí v lidském slyšitelném spektru (20Hz – 20.000 Hz). Tón lze při analýze
jeho spektra rozložit právě do těchto dílčích harmonických frekvencí. Nejnižší frekvence tónu (f 0 =
32,7 Hz = C) je považována za základní, udává výšku tónu a bývá označována jako fundament.
Ostatní, vyšší frekvence (f1 = 65,4 Hz = c, f2 = 130,8 Hz = g, f3 = 262,5 Hz = c´ atd.), celé násobky
frekvence základní se označují jako shorky nebo vyšší harmonické a ovlivňují výsledný sluchový
dojem, nazývaný barvou tónu (témbr, timbre). Podle toho jak jsou shorky početné a jako mají
hlasitost se mění valér – témbr tónu.
Obr. 13: Řada vyšších harmonických
Můžeme tak například u drknutí na nylonovou kytarovou strunu nehtem docela přesně změřit, kolik
shorků bylo v daném okamžiku vygenerováno a jak jsou které hlasité. Na obrázku níže jich objevíme
zřetelnějších 8 a všimneme si, že od 5.-8. znějí cca o jedno dynamické patro níže. V barvě se to
projeví základní hlasitou kulatější barvou středů, která je doplněna ostřejšími výškami, avšak o
hladinu tiššími.
Obr. 14: Shorky u kytarového drnknutí
Cílem, proč by měl výkonný hudebník zkusit vizuálně sledovat spektrum tónu, který produkuje, je
racionální poznání, jaké tónové i netónové složky se v něm nacházejí. Na tuto znalost by měla
navázat dovednost, cvik umět podle požadavku spoluhráčů či dirigenta vyloudit zvuk ostřejší nebo
naopak měkčí (pozor nemusí vždy souviset s dynamikou tónu), a to v různých odstínech! Muzikant
si zároveň uvědomí, které složky jeho barvy jsou v různých intervalových poměrech a harmoniích
hraných jinými nástroji náchylnější k překrytí a zamaskování. Jak co nejefektivněji vytvářet
požadované mixtury (harmonii) nebo opačně samostatnější a čitelnější hlasy (kontrapunkt,
polyfonii).
2D zobrazení
2D zobrazení je vlastně okamžitým mini výsekem spektra, např. zprůměrňovaného časového stavu
probíhajícího během 3-4 milisekund. Slouží jako zmražený statický a okamžitý snímek. Podobně
jako v případě opozice fotografe versus flm, podobně jako „časově mrtvé“ foto umožňuje lidským
smyslům detailní pohled na mžik zastaveného času.
Obr. 15: 2D Spektrogram (v programu Audio Explorer)
Půjde-li o jednotlivé tóny - monodii (tedy ne polyfonii či harmonie, které programy analyzovat
nedovedou), v grafu spektra rozeznáme lehce fundament a jeho násobky. Určíme, kolik
násobků/shorku jsme vygenerovali, jak jsou asi hlasité i jaký mají odstup od spodní šumové hladiny.
Můžeme rovněž určit, zda tón neobsahuje případné hlasitější šumové složky nebo například tzv.
spojitá spektra (bývá v případě kovových či skleněných kmitajících těles/oscilátorů – zvonu, kamenů
bicích melodických nástrojů ad.).
3D zobrazení
3D zobrazení poskládá vlastně jednotlivé snímky do časové posloupnosti a my uvidíme, jak se složky
zvuku mění dynamicky v čase. Jako bychom statické fotografe poskládali do běžícího flmu. Zjistíme
například, jak hlasitost jednotlivých alikvótů narůstá například v počátku tj. zrodu tónu (fáze attack
a decay), jak se ustálí ve střední fázi (sustain) a jako měrou který vyšší harmonický odeznívá při
utichání, odcházení tónu (fáze release).
Obr. 16: Tři roviny v 3D spektogramu
Nevýhodou tohoto zobrazení je, že při velkém množství shorků i dalších složek vznikne natolik
složitý terén, že hřebeny jednotlivých komponentů (například hlasitějších harmonických) mohou
při různém úhlu pohledu zakrývat hřebeny shorků dalších. Musíme potom zvolit více úhlů
pozorování, abychom mohli objevit všechny podstatné jevy celého časového vzorku. Tím se analýza
stává náročnější a pro některé uživatele méně atraktivní.
Obr. 17: Možná nepřehlednost v 3D spektogramu
Spektrální analýza v reálném čase a ze záznamu
2D analýza nám umožňuje sledování spektra v reálném čase. Vidíme tak přímo „naživo“, jak se mění
ladění (pohybuje fundament) zleva doprava na horizontální ose, která zobrazuje frekvenci tedy
výšku zvuku. Můžeme rovněž pozorovat, na kterých frekvencích/tónech vznikají jednotlivé shorky.
Vertikální osa odspodu nahoru měřená v decibelech nás informuje o tom, jak narůstá síla
jednotlivých složek..Uvidíme jak dynamicky narůstají a klesají shorky ad.
Ze záznamu můžeme sledovat jak 2D či i 3D formou. 3D pozorování funguje stejně jako u živého
měření, vzorek hraje pouze z nahrávky.
V případě 3D analýzy vybereme ze záznamu požadovaný úsek a zvolíme žádoucí parametry, např.
šíři frekvenčního spektra, jemnost dynamické decibelové stupnice, můžeme i úhel 3D pohledu
anebo způsob grafckého zobrazení.
Programy pro spektrální analýzu v reálném čase
Program WaveLab stačí nastavit podobně jako u živého osciloskopu (viz článek 1), jen otevřít okno
spektrogram. Co právě hrajeme, je analyzováno. V rozeznáme zřetelné špičky shorků, jejich počet a
odstup od dynamicky nižší šumové hladiny či spojitých spekter.
Obr. 18: 2D spektrogram v programu WaveLab vyhodnocuje v reálném čase
Stejné okno a stejné nastavení nabízí i program Audio Explorer – viz obr. 12.
Programy pro spektrální analýzu ze záznamu
Spektrální analýza ze záznamu funguje znovu na stejných základech jako oscilátorová analýza ze
záznamu. Do zdrojového okna načteme požadovaný audio - vzorek a otevřeme spektrogram. Zde
můžeme dokonce žádat mimo 2D analýzy, tj. okamžitého časového výseku, i 3D analýzu, tedy
zobrazení určitého delšího zvukového úseku – např. čtvrtinu sekundy, polovinu sekundy, ale i 5
sekund atd.
Takový úsek je třeba samozřejmě označit kurzorem – jeho začátek a konec. V menu příkazů,
podmenu nástrojů potom nastavit povel analyzovat spektrum. Program WaveLab zobrazí výsek
houslového tónu e2 v takovém případě následujícím grafem.
Obr. 19: WaveLab – 3D spektrogram, pohled zepředu
Všimněme si, jak se jednotlivé shorky postupně rodí a nabývají na hlasitosti. Ke konci měřeného
úseku se již hřebeny překrývají a terén se stává nepřehledným. V takové případě použijeme okno
Poin of View (bod pohledu), změníme svou pozorovatelskou pozici a získáme náhled odzadu
dopředu. Kombinace obou oken nám poskytne objektivnější informace.
Obr. 20: WaveLab – 3D spektrogram, pohled zezadu
Stejný typ 3D analýzy či pozorování nabízí program Sound Forge. Na rozdíl od WaveLab však
disponuje pouze pohledem zepředu a zezadu, ne z bočních pozic. Na druhé straně však umožňuje
postupovat v již vytvořeném 3D grafu krok za krokem po jednotlivých okénkách, tj. jít „do střev“
terénu a zobrazovat jej napříč, například po milisekundách.
Obr. 21: Sound Forge – 3D spektrogram, pohled zepředu i zezadu
Analýza spektra, tedy barva tónu není skutečně produkčně střelhbitá a jednoduchá. Můžeme jít do
různě komplikovaných a jemných úrovní. Již ale při prvním rychlém pohledu zjistíme například,
v kolika oktávách se barva rozprostírá a co ji bude v okolním terénu jak moc ohrožovat či maskovat.
Při podrobnějších rozborech dojdeme až k tomu, z jakých shorků v jaké hlasitosti se valér skládá, co
udělat proto, aby byl sytější či hebčí. Případně kde nejlépe jaké složky mixovat s dalšímu nástroji
nebo barvami, abychom získali žádoucí mixturu.
Poznatky by nám měly sloužit k plnokrevnější a zajímavější hudbě, nejen k suchému racionálnímu
poznání.
Download

Vizualizace barvy zvuku Vizualizace zvuku v hudební výuce