Pravdˇepodobnost a statistika - Dom´ac´ı u
´loha
Banka
Vypracoval: Petr Dvoˇr´
ak
a) Pro kaˇzd´eho klienta si mus´ıme uloˇzit ˇcas jeho pˇr´ıchodu a dobu, po kterou
klient ˇcekal ve frontˇe (tu lze dopoˇc´ıtat odeˇcten´ım ˇcasu odchodu od ˇcasu, kdy se
klient dostal na ˇradu - to jsou v´
ystupy kter´e n´am d´a funkce banka.jedenden).
D´
ale si pro kaˇzd´
y odsimulovan´
y den uloˇz´ıme celkov´
y poˇcet obslouˇzen´
ych klient˚
u a abychom mohli ˇreˇsit u
´lohu c), pro kaˇzd´
y den si uloˇz´ıme i ˇcas ukonˇcen´ı
obsluhy posledn´ıho klienta. Tato data pot´e pouˇzijeme na vypoˇcten´ı pr˚
umˇern´e
doby ˇcek´
an´ı v jednotliv´
ych denn´ıch dob´ach, na vypoˇcten´ı stˇredn´ı hodnoty poˇctu
obslouˇzen´
ych z´
akazn´ıku za den a na urˇcen´ı stˇredn´ı hodnoty ˇcasu ukonˇcen´ı obsluhy posledn´ıho klienta.
b) Chceme graficky zn´
azornit pr˚
umˇernou dobu ˇcek´an´ı v z´avislosti na denn´ı
dobˇe. V souvislosti s t´ım je ale nejprve nutn´e urˇcit, na jak dlouh´e intervaly
budeme dˇelit otv´ırac´ı dobu. Tento krok je d˚
uleˇzit´
y - na zobrazen´ı pr˚
umˇern´e
doby ˇcek´
an´ı po jednotliv´
ych minut´ach by bylo potˇreba mnohem v´ıce mˇeˇren´ı
(napˇr. pro jednu konkr´etn´ı minutu by se n´am pˇri mal´em poˇctu vstupn´ıch dat
mohlo st´
at, ˇze budeme poˇc´ıtat pr˚
umˇer z dat jedin´eho klienta). Naopak, br´at
celou otv´ırac´ı dobu jako jedin´
y interval a zobrazit pr˚
umˇernou dobu ˇcekan´ı vˇsech
klient˚
u (de fakto bez ohledu na denn´ı dobu) bychom sice mohli, nicm´enˇe tento
statistick´
y v´
ysledek by n´
am mnoho nenapovˇedˇel napˇr´ıklad v situaci, kdy bychom
chtˇeli optimalizovat vyuˇzit´ı pˇrep´aˇzek v z´avislosti na denn´ı dobˇe. Spoˇcteme si
proto nyn´ı optim´
aln´ı d´elku intervalu pro zobrazen´ı pr˚
umˇern´e doby ˇcek´an´ı.
Na z´
akladˇe v´
ystupu kter´e jsme si uloˇzili v´ıme, ˇze pr˚
umˇern´
y poˇcet klient˚
u obslouˇzen´
ych za den je zhruba 253. Provedli jsme simulace pro 250 dn´ı. M˚
uˇzeme
.
proto pˇredpokl´
adat, ˇze m´
ame zhruba n = 250 × 253 = 63250 namˇeˇren´
ych hod.
not. Podle Sturgesova pravidla m = 1 + 3.3 × log10 n = 16.84 je optim´aln´ı
poˇcet interval˚
u, otv´ırac´ı doba je 480 minut, tedy ide´aln´ı d´elka intervalu je
.
480/16.84 = 28.5 minut. Nejbliˇzˇsi rozumnˇe velk´
y interval (zohledn´ıme-li logick´e
ˇclenˇen´ı otv´ırac´ı doby a ˇclenˇen´ı jednotliv´
ych u
´sek˚
u otv´ır´an´ı a zav´ır´an´ı pˇrep´aˇzek
po p˚
ulhodin´
ach) je tedy 30 minut.
Oba grafick´e v´
ystupy potvrdili (trivi´aln´ı) domˇenku, ˇze pˇri uzavˇren´ı nˇekter´
ych
pˇrep´
aˇzek si klient poˇck´
a v pr˚
umˇeru o nˇeco d´ele. Pro ilustraci uv´ad´ım n´asleduj´ıc´ı
pˇr´ıklady. Jsou-li otevˇreny vˇsechny pˇrep´aˇzky, pr˚
umˇern´a doba ˇcek´an´ı (myˇslen je
zde celodenn´ı pr˚
umˇer) je nˇeco m´alo pˇres 2 minuty. Jsou-li nˇekter´e pˇrep´aˇzky
zavˇren´e, vzroste pr˚
umˇern´
a doba ˇcek´an´ı na v´ıce neˇz 7 minut.
1
Obr´
azek 1: Pr˚
umˇern´
a doba ˇcek´an´ı v jednotliv´
ych p˚
ulhodinov´
ych intervalech,
jsou-li otevˇreny vˇsechny pˇrep´aˇzky.
Obr´
azek 2: Pˇr´ısluˇsn´e hodnoty pr˚
umˇern´e doby ˇcek´an´ı za situace, kdy jsou
nˇekter´e pˇrep´
aˇzky uzavˇreny (viz. zad´an´ı).
2
c) Studujme nyn´ı ˇcas ukonˇcen´ı obsluhy posledn´ıho klienta. M´ame n = 250
.
¯ =
namˇeˇren´
ych hodnot, jsme schopni spoˇc´ıtat stˇredn´ı hodnotu X
502.257 (jako
2
aritmetick´
y pr˚
umˇer namˇeˇren´
ych hodnot) i (v´
ybˇerov´
y) rozptyl σ . Dle Centr´aln´ı
limitn´ı vˇety m˚
uˇzeme pro dostateˇcnˇe velk´a n pouˇz´ıt aproximaci norm´aln´ım rozdˇeˇ
len´ım. Casy
ukonˇcen´ı obsluhy jsou nez´avisl´e v´ahodn´e veliˇciny, jsou stejnˇe rozdˇelen´e.
Z´
aroveˇ
n pro nˇe m˚
uˇzeme pouˇz´ıt CLV, nebot’ jsou splnˇeny jej´ı pˇredpoklady.
Tedy m˚
uˇzeme aproximaci norm´aln´ım rozdˇelen´ım pouˇz´ıt (na histogramu si
m˚
uˇzeme tak´e povˇsimnout kladn´e ˇsikmosti, pozn. autor). 90% interval spolehlivosti navrhneme tak, jako by se jednalo o v´
ybˇer z norm´aln´ıho rozdˇelen´ı, tj.
¯ + √σ z(α/2)).
¯ − √σ z(α/2), X
(X
n
n
Dosazen´ım pˇr´ısluˇsn´
ych hodnot (zavol´an´ım funkce t.test v prostˇred´ı R) dostaneme konfidenˇcn´ı interval (501.09,503.43) - to jsou minuty po otv´ırac´ı dobˇe,
coˇz nen´ı moc lidsky ˇciteln´e. Prakticky to znamen´a, ˇze re´aln´a stˇredn´ı hodnota
ˇcasu obsluhy posledn´ıho klienta bude na 90% leˇzet v ˇcasov´em intervalu mezi
17:21’05” a 17:23’30”. Vizu´
aln´ım porovn´an´ım n´ami namˇeˇren´
ych hodnot vˇsak
zjist´ıme, ˇze velk´
a ˇc´
ast hodnot leˇz´ı mimo tento interval (tedy ˇze stˇredn´ı hodnota
sice m˚
uˇze v n´
ami urˇcen´em intervalu leˇzet, ale spousta klient˚
u je obslouˇzen´a
dˇr´ıve a obˇcas se stane, ˇze je nˇekdo obslouˇzen o hodnˇe pozdˇeji)... Velk´
y statistick´
y v´
yznam bych tedy tomuto v´
ysledku nepˇrikl´adal.
d) Z histogramu 2 je vidˇet, ze pr˚
umˇern´
y poˇcet klient˚
u obslouˇzen´
ych za den se
ˇr´ıd´ı pˇribliˇznˇe norm´
aln´ım rozdˇelen´ım. M˚
uˇzeme tedy pouˇz´ıt jednov´
ybˇerov´
y t-test.
T-kvantily jsou pro n = 250 pˇribliˇznˇe schodn´e s norm´aln´ımi. Oznaˇcme
√
n
¯
,
T = (X − µ) ·
σ
.
¯=
kde µ je testovan´
a hodnota (tedy 253), X
253.396 je aritmetick´
y pr˚
umˇer n´ami
.
zjiˇstˇen´
ych hodnot, n je poˇcet dn´ı, kter´
y je v naˇsem pˇr´ıkladˇe 250, a σ 2 = 14.722
je (v´
ybˇerov´
y) rozptyl. Nulovou hypot´ezu ”Pr˚
umˇern´y poˇcet klient˚
u obslouˇzen´ych
za jeden den je 253.” zam´ıtneme na hladinˇe α = 5% tehdy, kdyˇz |T | ≥ z(α).
.
.
M˚
uˇzeme snadno dopoˇc´ıtat, ˇze z(0.05) = 1.645, |T | = 0.43.
Dosazen´ım hodnot kter´e n´am vygeneroval program tedy zjist´ıme, ze hypot´ezu na 5% hladinˇe v´
yznamnosti nezam´ıtneme. Pro upˇresnˇen´ı m˚
uˇzeme dotat,
ˇze p-hodnota (kterou n´
am vr´atila funkce t.test programu R) je v naˇsem pˇr´ıpadˇe
.
rovna p = 0.67.
3
Vys´
azeno syst´
emem LATEX
4
Download

moje zcela neukázkové řešení