Zpracování řeči Otázky ke zkoušce – zimní semestr 2010/2011
1.
Hlasový signál, diskretizace a digitalizace. Používané vzorkovací kmitočty pro řeč.
2.
Model artikulačního aparátu. Popište a vysvětlete souvislosti s artikulační aparátem člověka.
3.
Základní tón a metody jeho odhadu. Jaké jsou typické hodnoty f0?
4.
Metody odhadu formantových frekvencí a šířky pásma.
5.
Lineární a nelineární skalární kvantizér PCM. Délka slova pro ekvivalentní dynamiku signálu.
6.
Aplikace banky filtrů v analýze řeči. Melovská a PLP banka filtrů.
7.
AR model řeči. LPC koeficienty a jejich výpočet. Aplikace v řečových technologiích.
8.
Kepstrum řeči (DFT a LPC). Základní vlastnosti a aplikace v řečových technologiích.
9.
Spektrální vzdálenost a její nejčastější aplikace. Souvislost s kepstrální vzdáleností.
10.
Algoritmy rozpoznávání řeči založené na porovnávání se vzory. DTW algoritmus 11.
Parametrizace řeči (mel­kepstrum, PLP­kepstrum). Blokové schema výpočtu.
12.
Skryté Markovovy modely HMM. Princip rozpoznávání izolovaných slov.
13.
Viterbiho algoritmus. Princip a základní popis.
14.
Subslovní fonetické elementy (monofóny, difóny, trifóny). Definice a jejich modelování.
15.
Syntéza HMM modelů slov a slovních spojení z modelů kontextově závislých hlásek
16.
Hledání a statistický popis shluků v kepstrálním prostoru
17.
Význam matice A ve struktuře HMM ­ trvání hlásek, bigramový jazykový model
18.
Jazykový model a jeho uplatnění při rozpoznávání souvislé řeči. Co je to n­gram ?
19.
Princip fonetické segmentace na bázi HMM. Základní vlastnosti a problémy.
20.
Principy rozpoznávání mluvčího. Co je to identifikace a verifikace mluvčího.
21.
Princip identifikace mluvčího na bázi GMM. Možné řečové příznaky.
22.
Princip identifikace mluvčího na bázi vektorové kvantizace. Možné řečové příznaky.
23.
Princip verifikace mluvčího na bázi časového zarovnání. Používané řečové příznaky.
24.
Úloha rozpoznávání jazyka. Princip a používané charakteristiky pro rozlišení jazyka.
25.
Adaptační techniky při trénování HMM. Princip řízené a neřízené adaptace.
26.
Princip blokové a inkrementální adaptace parametrů HMM. Používané algoritmy.
27.
Navrhněte postup adaptace rozpoznávače na známého resp. neznámého mluvčího.
28.
Zvýrazňování řeči a odstraňování aditivního rušení z řečových signálů. 29.
Princip odstranění konvolučního zkreslení řečových signálů. CMS při extrakci příznaků řeči.
30.
Měření kvality řečového signálu (SNR, kepstrální vzdálenost)
31.
Detekce řečové aktivity. Používané charakteristiky a jejich vlastnosti.
32.
Detekce řečové aktivity. Heuristické prahovací algoritmy (pevný vs. adaptivní práh).
33.
Konstrukce systémů pro syntézu řeči. Obecné principy TTS systémů 34.
Inventář fonetických elementů v TTS, typické používané elementy
35.
Princip formantové syntézy signálu. Klattův syntezátor.
36.
Princip neparametrické konkatenační syntézy signálu. 37.
Rozdíl mezi neparametrickou a parametrickou konkatenační syntézou. Typy parametrické syntézy.
38.
Prosodické charakteristiky řeči. Definice a jak ovlivňují syntetizovaný řečový signál.
39.
Rozdíl mezi neparametrickou a parametrickou konkatenační syntézou. Typy parametrické syntézy.
40.
Aspekty analýzy textu a tvorba těsné fonetické transkripce 41.
Ortografická, ortoepická a fonetická transkripce řeči. Možnosti převodu psané formy na mluvenou.
42.
Možná uspořádání dialogových systémů, vazby na další informační technologie
43.
Audio­vizuální řečové technologie. Obecné principy AV rozpoznávání a AV syntézy
44.
Extrakce příznaků pro akustickou a obrazovou složku při AV rozpoznávání řeči a možnosti jejich fůze
45.
Anatomie a modelování sluchu:
46.
Sluchové pomůcky a kochleární implantáty: principy a rozdíly
47.
Zpracování signálu pro kochleární implantáty
48.
Charakteristiky a zpracování patologického hlasu a řeči
•
•
Zkouška bude obsahovat 3 vybrané otázky (tématické okruhy), ke kterým si v průběhu 20 minut připraví student krátké pojednání.
Součástí zkoušky může být jako 4 doplňující okruh též diskuse nad problematikou zpracovávanou v semestrální práci
Doc. Ing. Petr Pollák, CSc.
Ing. Václav Hanžl, CSc.
20/9/2010
ODLOŽENÉ OTÁZKY
­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
49.
50.
Principiální obsah řečové databáze pro trénování rozpoznávače řeči
Download

31 DZR Digitální zpracování signálu řeči