Tomáš Karel
LS 2012/2013
Doplňkový materiál ke cvičení z předmětu 4ST201.
Na případné faktické chyby v této presentaci mě prosím upozorněte.
Děkuji.
Tyto slidy berte pouze jako doplňkový materiál – není v nich obsaženo
zdaleka všechno, co byste měli umět. Dalším studijním materiálem je
učebnice, cvičebnice a také poznámky z přednášek a cvičení!
Tomáš Karel - 4ST201
14.11.2013
2
cv.
Program cvičení
1.
Úvod, popisná statistika
2.
Popisná statistika
3.
Míry variability, pravděpodobnost
4.
Pravděpodobnost, náhodné veličiny a jejich charakteristiky
5.
Diskrétní pravděpodobnostní rozdělení
6.
Spojitá pravděpodobnostní rozdělení
7.
TEST – statistické odhady
8.
Testování statistických hypotéz
9.
Regrese
10. Regrese, korelace
11. TEST, časové řady (bazické a řetězové indexy)
12. Časové řady
13. Indexní analýza
Byla změřena výška 6 žen s následujícími výsledky
163 cm, 175 cm, 177 cm, 165 cm, 171 cm, 174 cm
a.) Nalezněte bodový odhad průměrné výšky žen v celé republice.
b.) Sestrojte 95% oboustranný interval spolehlivosti pro odhad průměrné
výšky žen v celé republice.
c.) Výšku kolika žen bychom museli změřit, abychom přiíustnou chybu
intervalového odhadu průměrné výšky žen v celé republice snížili pod 1 cm.
Předpokládejte, že výška jedné náhodně vybrané ženy má normální rozdělení
s neznámou střední hodnotou (tu právě odhadujeme) a s rozptylem
stejným jako byl rozptyl výšky jednoho náhodně vybraného muže (z 5.
cvičení), neboli  2 = 49..
Bodový odhad průměrné výšky žen v celé republice je 170,83 cm.
Pokud budeme chtít přípustnou chybu odhadu snížit pod 1 cm (s
předem zvolenou pravděpodobností 0,95),museli bychom změřit
výšku alespoň 189 žen.
Z velké zásilky balení brambůrků Bohemia Chips bylo vybráno 5
balení a byla zjištěna jejich hmotnost. Výsledky jsou:
163 g, 159 g, 161 g, 157 g, 158 g
a)
b)
c)
nalezněte bodový odhad pro průměrnou hmotnost jednoho balení
v celé zásilce
sestrojte 99% oboustranný interval spolehlivosti pro průměrnou
hmotnost jednoho balení v celé zásilce
odhadněte, kolik váží celá zásilka, pokud víte, že obsahuje 90
balení.
Předpokládejme, že rozdělení hmotnosti balení v zásilce je normální,
se známým rozptylem 25.
Z velké zásilky balení s kukuřičnými vločkami jsme vybrali celkem 5 balení a
zjistili jsme jejich hmotnost. Zde jsou výsledky:
460 gramů, 520 gramů, 490 gramů, 560 gramů, 510 gramů.
a.) Nalezněte bodový odhad pro průměrnou hmotnost jednoho balení v celé
zásilce.
b.) Sestrojte 99% oboustranný interval spolehlivosti pro průměrnou hmotnost
jednoho balení v celé zásilce.
c.) Odhadněte, kolik váží celá zásilka pokud víte, že obsahuje celkem 2400
balení.
Předpokládejme přitom, že rozdělení hmotností balení v zásilce je normální.

Bodový odhad průměrné hmotnosti zásilky s čokoládovými
kuličkami je 508 g.
99% interval spolehlivosti pro hmotnost celé zásilky


Dne 25. a 26. ledna 2013 se v České republice konalo druhé kolo
prezidentské volby. V závěrečném duelu se utkal Karel Schwarzenberg
se pozdějším vítězem volby Milošem Zemanem.
Představme si hypotetickou situaci. 200 náhodně vybraných voličů, po té
co vhodilo svůj hlas do urny, bylo dotázáno, koho volilo. 110 z nich
odpovědělo, že Miloše Zemana.
Předpokládejme, že odpovědi jsou pravdivé, že vybraný vzorek dotázaných
voličů je reprezentativním vzorkem voličů ČR a že k dispozici nejsou
žádné jiné dodatečné průzkumy nebo indicie nasvědčující vítězství M.
Zemana případně K. Schwarzenberga v daném místě.

a.) Bodově odhadněte podíl voličů Miloše Zemana v kraji Vysočina.

b.) Nalezněte 95% oboustranný interval spolehlivosti pro podíl voličů
Miloše Zemana v kraji Vysočina.
Bodový odhad procentuelního zastoupení voličů, kteří volí M. Zemana
v kraji Vysočina je 55%.
Zdroj: idnes.cz


statistická hypotéza je určitý předpoklad o parametrech nebo
tvaru určitého rozdělení.
test statistické hypotézy = postup, kterým na základě
výběrových dat ověřujeme platnost dané hypotézy








A) právní systém demokrat. Státu
= presumpce neviny - status quo
B) alternat. Hypotéza: vina
C) test. Kritériem: počet hlasů poroty
D) kritický obor – shoda všech 12
E) náhodný výběr poroty
F) závěr – jednomyslný – vinen – zamítnuto H0 ->
jednomyslnost – malá pravděpodobnost chybného
zamítnutí H0
B) nebyla prokázána vina (potřeba nových dat,
výběru) -> není výrok nevinen. Status quo – nevina se
nemusí prokazovat – pravděpodobnost chybného
výroku velká)
- nízká pst. Justičních omylů

Chceme otestovat, zda je mince symetrická (tj. zda orel i hlava
padají se stejnou pravděpodobností). Při 150 hodech touto mincí
padl 90-krát orel.
Proveďte test hypotézy o symetrii mince na hladině významnosti 1 %.
Mediálně známý ředitel velkého podniku tvrdí, že průměrná
mzda v jeho zaměstnanců je 25000 korun. Chceme ověřit
toto ředitelovo tvrzení, neboť ho podezíráme, že průměrnou
mzdu nadhodnocuje.
Zjistili jsme tedy mzdy 49 náhodně vybraných zaměstnanců
podniku, a napočetli průměr těchto 49 mezd: 23500 korun, a
výběrovou směrodatnou odchylku těchto 49 mezd: 5500
korun.
Na 5 % hladině významnosti ověřte, zda je možné na základě
těchto údajů zamítnout hypotézu o průměrně mzdě 25000
korun v celém podniku (tj. řečeno neformálně: „vyvrátit
tvrzení ředitele“.)



Bylo vybráno 73 polí stejné kvality. Na 38 z nich se zkoušel nový způsob
hnojení, zbývajících 35 bylo ošetřeno běžným způsobem. Průměrné výnosy
pšenice při novém způsobu hnojení (tzn. průměrné výnosy napočtené z 38
polí pohnojených novým hnojivem) byly 5,3875 tun na hektar a výběrový
rozptyl (výnosů napočtený z 38 polí pohnojených novým hnojivem) byl
0,2698.
Průměrné výnosy pšenice při běžném způsobu hnojení (tzn. průměrné výnosy
napočtené z 35 polí pohnojených běžným hnojivem) byly 4,7 tun na hektar a
výběrový rozptyl (výnosů napočtený z 35 polí pohnojených běžným
hnojivem) byl 0,24.
Je třeba zjistit, zda nový způsob hnojení má vliv na výnosy pšenice.
MODIFIKACE příkladu z:
Anděl, J: Statistické metody, 1998, matfyzpress,
Vydavatelství Matematicko-fyzikální fakulty UK
Čím více se budou lišit výběrové průměry výnosů u nového a
běžného způsobu hnojení, tím „větší je šance“, že nový způsob
hnojení má vliv na výnosy.
ROVNOST STŘEDNÍCH HODNOT DVOU ROZDĚLENÍ
Při sledování životnosti nových baterií VTEC 3000 bylo ze
souboru 50000 baterií vybráno 30 a u nich byl vypočten průměr
195 dnů. Směrodatná odchylka v základním souboru je známá a
její hodnota je 20. Předpokládáme, že životnost baterií se řídí
normálním rozdělením.
a)
b)
c)
sestrojte 95% oboustranný interval spolehlivosti (IS)
Vypočtěte, jak se změní IS, pokud zvýšíme rozsah výběru na 100
baterií
Jak se změní IS, pokud nebudeme požadovat spolehlivost 95 %, ale
99 %?
Prodejna potravin odebírá uzenářské výrobky od dvou
dodavatelů a za důležitou považuje dobu, která uplyne od
předání objednávky dodavatelům do okamžiku dodání
objednaného zboží. První dodavatel byl testován ve 14
případech, průměrná doba čekání na objednané zboží byla 58
hodin při rozptylu 8,5. U druhého dodavatele uzenin bylo
provedeno 11 pozorování, s průměrnou dobou 56 hodin s
rozptylem 5. Na hladině významnosti 5 % ověřte hypotézu,
zda mezi oběma dodavateli existuje takový rozdíl v rychlosti
dodávek uzenin, který by byl pro vedení prodejny potravin
podstatný.
Download

4ST201 STATISTIKA 2. cvičení 4.8.2013