8
Střední hodnota a rozptyl
8
Střední hodnota a rozptyl
Břetislav Fajmon, UMAT FEKT, VUT Brno
Této přednášce odpovídá kapitola 10 ze skript [1].
Také je k dispozici sbírka úloh [2], kde si můžete
procvičit příklady z kapitol 2, 3 a 4.
K samostatnému procvičení této přednášky: po
přečtení kapitoly 10 ve skriptech [1] můžete absolvovat str. 165-168 (otázky i příklady).
bEd [email protected]
OBSAH
1/39
8
Střední hodnota a rozptyl
Nejdůležitějšími pojmy této přednášky jsou
• průměr, modus a medián souboru naměřených
hodnot ; rozptyl souboru naměřených hodnot
(= empirický rozptyl); směrodatná odchylka
souboru naměřených hodnot (= empirická směrodatná odchylka) (JEDNODUCHÉ, nebudeme
probírat, prosím přečtěte si ve skriptech [1]
strany 154-159)
• distribuční funkce náhodné veličiny X – vzorce
pro diskrétní i pro spojitou veličinu;
• střední hodnota a rozptyl náhodné veličiny X –
vzorce pro diskrétní i pro spojitou veličinu.
bEd [email protected]
OBSAH
2/39
8
Střední hodnota a rozptyl
Uvedené pojmy budou vysvětleny na příkladech 2
a 5 z minulé přednášky a na dalších čtyřech příkladech v této přednášce.
Vraťme se k příkladu 2 z minulé přednášky (X =
počet šestek v pěti hodech kostkou; situace popsána
tzv. pravděpodobnostní funkcí, veličina X je diskrétní
veličina).
A vraťme se také k příkladu 5 z minulé přednášky
(X = životnost žárovky do temné komory; situace
popsána tzv. hustotou, veličina X je spojitá veličina).
bEd [email protected]
OBSAH
3/39
8
Střední hodnota a rozptyl
Existuje nějaký matematický pojem, který by
dokázal spojit jak popis diskrétní veličiny (pravděpodobnosti počítáme pomocí sumy), tak popis
spojité veličiny (pravděpodobnosti počítáme pomocí
integrálu)?
Existuje, a jmenuje se distribuční funkce.
Definice: Distribuční funkce F (x0) náhodné veličiny
X se definuje jako pravděpodobnost, že náhodná veličina X nabude hodnotu menší než x0.
F (x0) = P (X < x0).
bEd [email protected]
OBSAH
4/39
8
Střední hodnota a rozptyl
Způsob výpočtu:

P
pro diskrétní X;
k<x0 p(k)
F (x0) = P (X ∈ (−∞, x0)) = R x
(1)
 0 f (x) dx pro spojitou X.
−∞
(POZOR, ROZLIŠUJTE f hustotu od F distribuční
fce! – case-sensitivity) Je jasné, že pak hodnoty
distribuční funkce vypočteme buď diskrétním,
nebo spojitým přístupem, ale samotný pojem
distribuční funkce popisuje jak veličiny spojité, tak
veličiny diskrétní.
Vypočtěme distribuční funkci v příkladech 2 a 5 z
minulé přednášky:
bEd [email protected]
OBSAH
5/39
8
Střední hodnota a rozptyl
Ad příklad 2: v tabulce jsou dány hodnoty pravděpodobnostní funkce p(k):
k
0
1
2
3
4
5
.
p(k) 0,4019 0,4019 0,1608 0,0321 0,0032 0,0001
Sestrojte příslušnou distribuční funkci F (x) této
veličiny.
Řešení: užijme vzorec 1 pro každé reálné x – dostaneme funkci F (x) na obrázku:
bEd [email protected]
OBSAH
6/39
8
Střední hodnota a rozptyl
bEd [email protected]
OBSAH
7/39
8
Střední hodnota a rozptyl
Ad příklad 5: hustota životnosti X žárovky je dána
vztahem

0
pro x < 0;
f (x) =
1 x
 1 · e− 100
pro x ≥ 0.
100
Vypočtěte distribuční funkci F (x) této veličiny (opět
POZOR – rozlišujte f od F ).
Už v minulé přednášce jsme viděli obrázek hustoty
f (x):
bEd [email protected]
OBSAH
8/39
8
Střední hodnota a rozptyl
bEd [email protected]
OBSAH
9/39
8
Střední hodnota a rozptyl
Nyní se podíváme na obrázek distribuční funkce
F (x):
Tato byla získána integrací hustoty f (x) podle
vztahu 1:

Z x
0
pro x ≤ 0;
f (t) dt =
F (x) =
1 x
 1 − e− 100
−∞
pro x > 0.
bEd [email protected]
OBSAH
10/39
8
Střední hodnota a rozptyl
1
0.8
0.6
0.4
0.2
–0.4 –0.2
0
0.2
0.4
0.6
0.8
1
Co mají společného grafy na stranách 7 a 11?
bEd [email protected]
OBSAH
11/39
8
Střední hodnota a rozptyl
Jedná se o distribuční funkce v případě diskrétním
(ad př. 2 z minulé přesnášky) i v případě spojitém
(ad příklad 5 z minulé přednášky). Přestože spojitý
případ se od diskrétního liší, existuje několik vlastností distribuční funkce, které platí pro všechny
situace. Tyto vlastnosti lze odvodit z definice distribuční funkce (z toho, že distribuční funkce je jistá
pravděpodobnost, tj. hodnota v intervalu h0; 1i).
Například pro x1 < x2 máme z definice
F (x1) = P (X ∈ (−∞, x1)),
F (x2) = P (X ∈ (−∞, x2)),
a protože druhý z intervalů je delší než ten první,
musí platit F (x1) ≤ F (x2). vlastnosti přehledně:
1. limx→−∞ F (x) = 0;
bEd [email protected]
limx→∞ F (x) = 1.
OBSAH
12/39
8
Střední hodnota a rozptyl
2. F je neklesající funkce (jedná se o jakousi kumulativní pravděpodobnost, která pro rostoucí
hodnoty proměnné x může jen růst, nikoli klesat).
3. Funkce F je zleva spojitá v každém bodě, tj. limita zleva se rovná funkční hodnotě v každém
bodě:
lim F (x) = F (x0)
x→x0−
pro libovolné reálné x0.
4. U obou typů veličin (diskrétní i spojité) platí
P (X ∈ ha; b)) = F (b) − F (a).
bEd [email protected]
OBSAH
13/39
8
Střední hodnota a rozptyl
Klíčová je vlastnost číslo 4: pro diskrétní i spojitou veličinu X platí vztah P (X ∈ ha; b)) = F (b) − F (a).
(tento vztah pro spojitou veličinu není nic než jiného
než Newton-Leibnizova formule pro výpočet určitého
integrálu, ale po zavedení pojmu distribuční funkce
je jeho platnost rozšířena i pro diskrétní veličiny).
Pro výpočet pravděpodobností platí tedy tento
klíčový vztah:

P
k∈ha;b) p(k) pro diskrétní X;
P (X ∈ ha; b)) = F (b) − F (a) = R b
 f (x) dx
pro spojitou X.
a
bEd [email protected]
OBSAH
14/39
8
Střední hodnota a rozptyl
Podívejme se nyní na další příklady, ve kterých se
naučíme pracovat s distribuční funkcí.
Příklad 8.1. Náhodná veličina X je popsána distribuční funkcí



0,5 pro 0 < x ≤ 1;


F (x) = 0,7 pro 1 < x ≤ 3;



 ?? jinak .
Určete následující pravděpodobnosti, pokud je to
možné: a) P (X > 1); b) P (X < 1); c) P (X ≥ 1);
d) P (X ≤ 1).
bEd [email protected]
OBSAH
15/39
8
Střední hodnota a rozptyl
Řešení: Distribuční funkci známe jen na části reálné osy, ale jsme schopni pomocí ní určit všechny
uvedené pravděpodobnosti:
Nejednodušší je b), protože to je přesně definice
funkce F (x) v bodě x = 1:
P (X < 1) = F (1) = 0,5.
Ze zadání jsme také schopni určit hodnotu pravděpodobnostní funkce p v bodě x = 1, protože ta je rovna
„výšce schoduÿ distribuční funkce v bodě x = 1, A
TEDY p(1) = 0,2. Odtud lze určit b):
P (X ≥ 1) = P (X < 1)+P (X = 1) = F (1)+p(1) = 0,5+0,2 = 0,7.
a) a c) dopočítáme z toho faktu, že od hodnoty 1
bEd [email protected]
OBSAH
16/39
8
Střední hodnota a rozptyl
odečteme pravděpodobnost opačného jevu:
P (X > 1) = 1 − P (X ≤ 1) = 1 − 0,7 = 0,3;
P (X ≥ 1) = 1 − P (X < 1) = 1 − 0,5 = 0,5.
Tyto patálie se mohou objevit pouze u diskrétní
veličiny. U spojité veličiny P (X = 1) = 0 vždy, a proto
vždy platí pro spojitou veličinu P (X < 1) = P (X ≤ 1).
Podívejme se tedy také na distribuční funkci spojité veličiny: Vezměme opět příklad 5 z minulé přednášky:
bEd [email protected]
OBSAH
17/39
8
Střední hodnota a rozptyl
Příklad 8.2. Distribuční funkce životnosti žárovky X
je dána vztahem

0
pro x ≤ 0;
F (x) =
1 x
 1 − e− 100
pro x > 0.
Určete pravděpodobnosti a) P (X < 1) = P (X ≤ 1);
b) P (X ≥ 30) = P (X > 30);
c) P (X ∈ h80; 120i).
Řešení: u spojité veličiny nás nezajímá, zda je v
intervalech kulatá či ostrá závorka, protože to při
integraci nehraje roli. Také je ideální, že je zadána
bEd [email protected]
OBSAH
18/39
8
Střední hodnota a rozptyl
distribuční funkce. Ta totiž v sobě uchovává výsledek integrace – a pro výpočet integrálů stačí už jen
dosadit meze!!
−1 .
P (X < 1) = F (1) = 1 − e 100 = 0,00995;
−30 .
P (X > 30) = 1 − P (X ≤ 30) = 1 − F (30) = e 100 = 0,74082;
−80
−120
P (80 < X < 120) = F (120) − F (80) = e 100 − e 100 = 0,14813.
Viz prostřední řádek výpočtu: s využitím opačného
jevu se snažíme nerovnosti typu X > x0 převést na
výraz využívající pravděpodobnost X < x0, a pak dosadit distribuční funkci v daném x0.
Důležitým cvičením je v každém z uvedených tří
případů nakreslit obrázek plochy, jejíž obsah počítáme (viz minulá přednáška).
bEd [email protected]
OBSAH
19/39
8
Střední hodnota a rozptyl
Příklad 8.3. Domácí úkol na příští přednášku: s využitím vztahu
Z x
F (x) =
f (t) dt
−∞
vypočtěte F (x), jeli zadána hustota f (x) na obrázku:
1
y 0.5
–1
bEd [email protected]
0
0.5
1
x
2
3
OBSAH
20/39
8
Střední hodnota a rozptyl
Důležitými parametry pro popis náhodné veličiny
jsou střední hodnota a rozptyl.
Střední hodnota náhodné veličiny X je, zhruba řečeno, průměrná hodnota, kterou naměříme. Přesněji
řečeno, jedná se o „teoretický průměrÿ = průměr
hodnot měření veličiny X, který bychom většinou
spočetli, pokud by se měřená veličina chovala přesně
podle teoretického popisu zadaného distribuční
funkcí F (x). Studenti musí opět pečlivě vážit, zda
při výpočtu užít „diskrétníÿ či „spojitouÿ variantu
vzorce:
bEd [email protected]
OBSAH
21/39
8
Střední hodnota a rozptyl

P
pro diskrétní X;
k∈Ω k · p(k)
EX = R +∞

−∞ x · f (x) dx pro spojitou X.
(3)
Dalším důležitým parametrem je rozptyl: ten
udává, jak moc by se odchylovaly měřené hodnoty X
od své střední hodnoty EX, pokud by se veličina X
chovala přesně podle teoretického popisu zadaného
distribuční funkcí F (x). Vzorec pro výpočet:

 P
2
2
pro diskrétní X;
k∈Ω k · p(k) − (EX)
(4)
DX = R +∞
2
2

pro spojitou X.
−∞ x · f (x) dx − (EX)
bEd [email protected]
OBSAH
22/39
8
Střední hodnota a rozptyl
Protože rozměr veličiny DX je čtverec rozměru veličiny X, pro praktické účely potřebujeme znát tzv.
směrodatnou odchylku, definovanou jako
√
(5)
σ(X) = DX.
Směrodatná odchylka je tedy veličina, která nám
reprezentuje míru odchylování veličiny X od její
střední hodnoty EX – a to ve stejných jednotkách
jako jsou jednotky veličiny X.
bEd [email protected]
OBSAH
23/39
8
Střední hodnota a rozptyl
Pro názornost: zhruba řečeno, u mnoha veličin
platí tzv. pravidlo šesti σ:
„asi 97,5 procent měření veličiny X (tedy naprostá většina měření veličiny) leží v intervalu
hEX − 3σ; EX + 3σiÿ.
Tedy rozptýlenost měření veličiny X lze popsat intervalem šířky 6σ a středem v bodě EX. Více o tomto
pravidle bude řečeno u normálního rozdělení pravděpodobnosti.
bEd [email protected]
OBSAH
24/39
8
Střední hodnota a rozptyl
Poznámka: pokud máme k dispozici měření
x1, x2, . . . , xn veličiny X, tak odhadem její střední
hodnoty EX je průměr těchto měření
n
1X
x=
xi ,
n 1
odhadem jejího rozptylu DX je empirický rozptyl naměřených hodnot
!
n
n
1X 2
1X
2
2
xi − (x)2
s =
(x − x) = . . . =
n 1
n 1
(pomůcka pro zapamatování: průměr čtverců minus
čtverec průměru).
bEd [email protected]
OBSAH
25/39
8
Střední hodnota a rozptyl
Příklad 8.4. Diskrétní náhodná veličina udává počet
gramatických chyb v krátkém textu, platí pro ni



0
pro x ≤ 0






0,5 pro x ∈ (0; 1i;




 0,8 pro x ∈ (1; 2i;
F (x) =


0,9 pro x ∈ (2; 3i;






0,95 pro x ∈ (3; 4i;




1
pro x ∈ (4; ∞).
Určete pravděpodobnost toho, že v textu budou a)
méně než dvě chyby; b) právě tři chyby; c) vypočtěte
EX, DX.
bEd [email protected]
OBSAH
26/39
8
Střední hodnota a rozptyl
Řešení: Ad a) Nejjednodušší úkol: pouze dosadíme
zadání:
P (X < 2) = F (2) = 0,8.
Ad b,c) Veličina X může nabývat hodnot 0, 1, 2, 3, 4 –
to plyne z charakteru funkce F (x). Hodnoty pravděpodobnostní funkce jsou rovny výšce schodů v jednotlivých bodech skoku. Pak P (X = 3) = 0,05; pro
střední hodnotu platí (vzorec 3)
EX = 0 · (0,5 − 0) + 1 · (0,8 − 0,5) + 2 · (0,9 − 0,8) + 3 · (0,95 − 0,9)
+4 · (1 − 0,95) = 0,85.
DX = 1 · 0,3 + 22 · 0,1 + 32 · 0,05
+42 · 0,05 − 0,852 = 1,2275.
√
.
σ = DX = 1,08.
bEd [email protected]
OBSAH
27/39
8
Střední hodnota a rozptyl
Příklad 8.5. Spojitá náhodná veličina je popsána distribuční funkcí



0
pro x ≤ 0




x
pro x ∈ (0; 2i;
4
F (x) =
x2


− 2x + 52 pro x ∈ (2; 3i;

2



1
pro x ∈ (3; ∞).
Určete a) P (X ∈ (1,5; 2,5)); P (X > 2, 5) b) EX, DX;
c) x0 tak, aby veličina X nabývala hodnoty menší než
x0 s pravděpodobností 0,8.
bEd [email protected]
OBSAH
28/39
8
Střední hodnota a rozptyl
Řešení: ad a) získáme pomocí vztahu 2:
P (X ∈ (1,5; 2,5)) = F (2,5) − F (1, 5) = 0,25;
5
P (X > 2,5) = 1 − F (2,5) = 1 − = 0,375.
8
Ad c) vlastně tentýž příklad jako a), jen máme zadaný výsledek pravděpodobnosti a máme určit x0.
Jen musíme dát pozor, který předpis pro F (x) platí
pro dané x0: z toho, že
P (X < x0) = 0,8 ⇒ F (x0) = 0,8
plyne, že x0 nemůže být z intervalu (0; 2i, protože
rovnice x4 = 0,8 nemá řešení na intervalu (0; 2i. Tedy
bEd [email protected]
OBSAH
29/39
8
Střední hodnota a rozptyl
x ∈ (2; 3i a lze do F (x0) = 0,8 dosadit předpis
x20
5
− 2x0 + = 0,8;
2
2
A nyní víme, že při řešení této kvadratické rovnice
musíme hledat řešení v intervalu x ∈ (2; 3i, tedy ze
dvou řešení kvadratické rovnice nyní odpovídá situaci pouze x0 = 2,7746.
Ad b) pozor, case-sensitive vzorec pro EX vyžaduje, abychom z F (x) určili hustotu f (x). Díky vzorci
1 víme, že F (x) je integrálem z f (x) – naopak f (x)
bEd [email protected]
OBSAH
30/39
8
Střední hodnota a rozptyl
tedy najdeme jako derivaci distribuční funkce:



0
pro x ≤ 0




1
pro x ∈ (0; 2i;
4
0
f (x) = F (x) =


x − 2 pro x ∈ (2; 3i;




0
pro x ∈ (3; ∞).
Nyní pomocí vzorce 3 můžeme počítat
2
Z 3
1
EX =
x · dx +
x · (x − 2) dx =
4
0 2 2 3 2 3
x
x
+
− x2 = 1,8333.
=
8 0
3
2
Z
bEd [email protected]
OBSAH
31/39
8
Střední hodnota a rozptyl
a podle 4
2
Z 3
1
x2 · dx +
DX =
x2 · (x − 2) dx − 1,83332 =
2
2
3 2 0 4
3
x
2x3
x
+
− 1,83332 = 0,97222.
−
=
6 0
4
3 2
Z
bEd [email protected]
OBSAH
32/39
8
Střední hodnota a rozptyl
Zakončíme dalšími shrnujícími otázkami k opakování, jejichž odpovědi musí každý student znát:
otázka č. 6. Jak se definuje distribuční funkce F (x)?
Odpověď:
F (x) = P (X < x).
otázka č. 7. Jak se čte zápis z otázky číslo 6?
Odpověď: Hodnota funkce F v bodě x se rovná
pravděpodobnosti, že veličina X nabude hodnoty
menší než x, tj. hodnoty z intervalu (−∞; x).
otázka č. 8. Jaké jsou vlastnosti distribuční funkce
F (x) u diskrétní i spojité veličiny X?
Odpověď:
bEd [email protected]
OBSAH
33/39
8
Střední hodnota a rozptyl
1. limx→−∞ F (x) = 0;
limx→∞ F (x) = 1.
2. F je neklesající funkce (jedná se o jakousi
kumulativní pravděpodobnost, která pro rostoucí hodnoty proměnné x může jen růst, nikoli klesat).
3. Funkce F je zleva spojitá v každém bodě, tj.
limita zleva se rovná funkční hodnotě v každém bodě:
lim F (x) = F (x0)
x→x0−
pro libovolné reálné x0.
4. U obou typů veličin (diskrétní i spojité) platí
P (X ∈ ha; b)) = F (b) − F (a).
bEd [email protected]
OBSAH
34/39
8
Střední hodnota a rozptyl
otázka č. 9. Je nějaký rozdíl mezi hodnotami
pravděpodobnostiP (X ∈ (a; b)), P (X ∈ ha; b)),
P (X ∈ (a; bi), P (X ∈ ha; bi)?
Odpověď: U spojité veličiny NE, u diskrétní
veličiny ANO. přesněji u diskrétní veličiny
uvedené čtyři pravděpodobnosti mohou být
navzájem různé:
P (X ∈ ha; b))
P (X ∈ ha; bi)
P (X ∈ (a; b))
P (X ∈ (a; bi)
=
=
=
=
F (b) − F (a);
F (b) − F (a) + P (X = b);
F (b) − F (a) − P (X = a);
F (b) − F (a) + P (X = b) − P (X = a).
Jednoduše řečeno, pokud by se uvedené vzorce
někomu zdály kostrbaté, vždy lze z funkce F (x)
bEd [email protected]
OBSAH
35/39
8
Střední hodnota a rozptyl
vyjádřit pravděpodobnostní funkci p(x) a vzorec
X
P (X ∈ I) =
p(k)
k∈I
platí pro jakýkoli tvar intervalu I.
otázka č. 10. Jak se vypočte střední hodnota náhodné veličiny X?
Odpověď: Pro diskrétní veličinu (s pravděpodobnostní funkcí p(k))
X
EX =
k · p(k);
k∈Ω
bEd [email protected]
OBSAH
36/39
8
Střední hodnota a rozptyl
(s hustotou f (x) – pozor, case-sensitive!)
Z ∞
EX =
x · f (x)dx.
−∞
otázka č. 11. Jak se vypočte rozptyl náhodné veličiny
X?
odpověď: Pro diskrétní veličinu (s pravděpodobnostní funkcí p(k))
!
X
DX =
k 2 · p(k) − (EX)2;
k∈Ω
bEd [email protected]
OBSAH
37/39
8
Střední hodnota a rozptyl
(s hustotou f (x) – pozor, case-sensitive!)
Z ∞
x2 · f (x)dx − (EX)2.
DX =
−∞
0
R
otázka č. 12. Sice platí F (x) = f (x), ale F (x) 6= f (x).
Jak je to možné?
R
Odpověď: f (x) je označení celé třídy funkcí,
které se liší o konstantu. Jen jedna z nich má
graf ležící celý v pásu mezi přímkami y = 0 a
y = 1 a je dost malá pravděpodobnost, že je
to zrovna ta, pro niž je konstanta rovna nule.
Správný vztah je
Z x
F (x) =
f (t)dt.
−∞
bEd [email protected]
OBSAH
38/39
Literatura
Dosazením mezí je výpočet správné konstanty
zaručen.
Literatura
[1] Fajmon, B., Růžičková, I.: Matematika 3.
Skriptum FEKT 2003 (identifikační číslo v
informačním systému VUT: MAT103).
http://www.rozhovor.cz/souvislosti/matematika3.pdf.
[2] Hlavičková, I., Hliněná, D.: Sbírka úloh z pravděpodobnosti. Skriptum FEKT 2008.
bEd [email protected]
OBSAH
39/39
Download

8 Střední hodnota a rozptyl 8 Střední hodnota a rozptyl