Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
I.
Uvod
Da bi uspešno razumeli tekstove zadataka moramo se u svakoj lekciji upoznati sa osnovnim pojmovima vezanim za tu lekciju.
Što se tiče uvoda bitno je shvatiti kako u zadacima razlikovati da li je u pitanju skup ili uzorak. Zbog toga evo definicje skupa i
uzorka:
Osnovni skup se sastoji od svih elemenata ili jedinica posmatranja čije karakteristike ispitujemo – pojedinaca, stvari ili
predmeta.
Deo osnovnog skupa koji je izabran u svrhe statističke analize naziva se uzorkom.
Dakle, ako u zadatku kažu da su „slučajnim putem izabrali ili anketirali 100 studenata ekonomskog fakulteta“, sigurno da je u
pitanju uzorak, dok ako se kaže da su „ispitivanjem svih 3000 studenata ekonomskog fakulteta dobijeni sledeći rezultati ...“,
onda je u pitanju skup. Uglavnom fraza svi, sve, ... ukazuje da je to skup, a ako je samo delić te celine onda je to uzorak.
Svaki skup ili uzorak sastoji se iz jedinica posmatranja ili elemenata. U gornjem primeru to je student.
A da bi jedinice skupa posmatrali biramo jednu njihovu osobinu i to se zove obeležje ili promenljiva. Na primer ako
posmatramo skup studenta ekonomskog fakulteta jedno njihovo obeležje je broj položenih ispita. To je promenljiva jer se
menja od jedne do druge jedinice posmatranja. Vrednost promenljive koja se odnosi na jednu jedinicu naziva se opservacijom
ili podatkom.
Promenljive se inače dele na:
1. Kvantitativne ili numeričke
- prekidne (diskretne)
- neprekidne
2. Kvalitativne ili kategorijske
Kvantitativna promenljiva je promenljiva koja se može brojčano izraziti. Prekidna je ako može da uzme samo cele vrednosti
(npr. Broj golova na utakmici, broj dece, broj osnovnih škola u nekom mestu, ...), a neprekidna ako može da uzme bilo koju
vrednost iz nekog intervala (npr. Cena, vreme za rešavanje nekog zadatka, visina, težina, ...).
Kvalitativna promenljiva ne može numerički da se iskaže ali može da se klasifikuje u dve ili više kategorija (npr. pol, marka
automobila, boja očiju, ...).
I na kraju ove uvodne priče definisaćemo još pojam serije podataka.
Serija podataka je skup podataka koji se odnosi na jednu ili više promenljivih.
Serije se dele na:
1. Strukturne serije
2. Vremenske serije
Vremenske serije se dele na momentne i intervalne. Kod momentnih (zalihe, broj zaposlenih, štednja, ...) godišnji podatak se
poklapa sa poslednjim kvartalom ili mesecom, a kod intervalnih godišnji podatak se dobija sabiranjem kvartalnih ili mesečnih
podataka.
strukturne serije 
x
f
x
f
vremenske serije 
God. y
y
vrednosti obeležja (opservacije)
frekvencije (učestanosti) javljanja
vrednosti obeležja
U novoj knjizi nema priče o mernim skalama, a pominju se na predavanjima i na vežbama, pa evo ukratko priče o tome.
Postoje 4 merne skale: nominalna, ordinalna, intervalna i skala odnosa.
Nominalna se koristi za kvalitativna obeležja koja ne mogu da se rangiraju, kao na primer pol(muško, žensko), lokacija za
odmor (more, planina, banja), vrsta automobila (audi, bmw, opel, ..).
Ordinalna se koristi za kvalitativna obeležja koja mogu da se rangiraju, kao na primer stepen stručne spreme (osnovna, srednja,
viša, visoka), uspeh u srednjoj školi (odličan, vrlo dobar, dobar, dovoljan).
Intervalana se koristi za kvantitativna obeležja za koja ne može da se utvrdi odnos i kod njih pojava postoji i pri vrednosti nula
(temperatura, godina rođenja, godina venčanja, geografska širina,...).
Skala odnosa se koristi za kvantitativna obeležja za koja može da se utvrdi odnos i kod njih nula znači da pojave nema (težina,
visina, plata, ...).
1
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
II.
Sređivanje i grafičko prikazivanje podataka
Vrste raspodela:
1. Raspodela frekvencija
2. Raspodela relativnih frekvencija i procentualna raspodela
3. Raspodela kumulativnih frekvencija
4. Raspodela kumulativnih relativnih frekvencija i kumulativnog učešća
Grafički prikazi:
1. Štapićasti dijagram
2. Strukturni krug
3. Histogram
4. Poligon
5. Kriva frekvencija
6. Prikaz u obliku stabljike i lista
7. Tačkasti dijagrami
8. Aritmetički dijagram
9. Polulogaritamski dijagram
2
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
III.
Numeričke deskriptivne mere
1.
Mere centralne tendencije
a)
Aritmetička sredina
b)
Medijana
c)
Modus
Podrazumevana mera centralne tendencije je aritmetička sredina. Izuzetak je ako je raspored znatno asimetričan jer se
onda koristi medijana (jer je neosetljiva na ekstremne vrednosti). Ako je obeležje na nominalnoj skali od mera centralne
tendencije može da se izračuna samo modus, a ako je obeležje na ordinalnoj skali mogu da se izračunaju samo modus i
medijana.
2.
Mere disperzije
a)
Interval varijacije
b)
Varijansa
c)
Standardna devijacija
d)
Koeficijent varijacije
e)
Kvartili
f)
Interkvartilna razlika
g)
Percentili i rang percentila
Podrazumevana mera disperzije je standardna devijacija. Izuzeci su:
1.
Ako poredimo dve serije sa različitim aritmetičkim sredinama onda je podrazumevana mera koeficijent
varijacije,
2.
Ako je raspored znatno asimetričan računa se interkvartilna razlika.
Kod kvalitativnih obeležja ne mogu da se računaju mere disperzije.
Kad u zadatku kažu apsolutna disperzija misli se na standardnu devijaciju, relativna znači da je u pitanju koeficijent
varijacije, a pozicione mere su interval varijacije i interkvartilna razlika.
Pogledati kako se prikazuje box plot dijagram.
Aritmetička sredina
xi
N
f i xi
x
x
N
xi
n
f i xi
n
- aritmetička sredina skupa
- skup, negrupisani podaci
- skup, grupisani podaci
x - aritmetička sredina uzorka
N – veličina skupa
n – veličina uzorka
Kod grupisanih podataka važi:
-uzorak, negrupisani podaci
a ako je u pitanju uzorak
- uzorak, grupisani podaci
3
n
N
fi ,
fi .
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
Medijana
Medijana je jednaka vrednosti središnjeg člana serije podataka rangirane po rastućem redosledu.
Na primer:
5, 9, 11, 14, 3  3, 5, 9, 11, 14 
3, 5, 9, 11, 14, 15 
Me
Neparan broj podataka
9 11
10.
2
Paran broj podataka
Kod grupisanih podataka medijana je onaj podatak čija kumulanta ispod je prva veća od N/2. Izuzetak je ako postoji podatak
čija kumulanta ispod je tačno N/2. U tom slučaju medijana je aritmetička sredina tog i sledećeg podatka.
Modus
Modus
MO
je vrednost koja se javlja sa najvećom frekvencijom u seriji podataka..
2 3 3 4 5 9 
M O =3
2 3 3 4 4 5 9 
M O1
3, M O 2
2 2 3 3 4 4 5 5  nema
4.
MO.
Interval varijacije
i
x m ax
x m in
Varijansa
2
x
2
x
x
2
N
N
2
s
2
fx
n 1
N
x
2
x
x
2
2
n
- uzorak, negrupisani
n 1
x
2
fx
2
fx
n
n 1
2
- skup, grupisani
N
n 1
f x
fx
2
2
f x
x
- skup, negrupisani
N
N
s2
2
2
- uzorak, grupisani
Varijansa pokazuje prosek kvadrata odstupanja podataka od aritmetičke sredine. Najveći nedostatak varijanse je što je
iskazana u jedinici mere na kvadrat.
4
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
Standardna devijacija
2
- skup
s2
s
- uzorak
Standardna devijacija pokazuje prosek odstupanja podataka od aritmetičke sredine.
Koeficijent varijacije
CV
100
- skup
s
100
x
CV
- uzorak
Koeficijent varijacije pokazuje koliki je prosek odstupanja podataka od aritmetičke sredine izraženo u procentima aritmetičke
sredine.
Kvartili
Kvartili su vrednosti obeležja koji seriju uređenu po rastućem redosledu dele na 4 jednaka dela.
Na primer:
2,4, 6,7, 8,9, 12,15
2,4,6,7, 8,9,12
Q1
4 6
5, Q2 M e
2
4, Q2 M e 7, Q3 9
7 8
2
Q1
2,4, 6,7,8, 9,12, 15,16
2,4,6,7,8, 9,12,15,16,20
4 6
2
Q1
Q1
5, Q2
6, Q2
Me
Me
7,5, Q3
8, Q3
8 9
2
9 12
2
10,5.
12 15
13,5
2
8,5, Q3
15
Kod grupisanih podataka
Q1 je onaj podatak čija kumulanta ispod je prva veća od N/4.
Kod grupisanih podataka Q 3 je onaj podatak čija kumulanta ispod je prva veća od 3N/4.
Interkvartilna razlika
IQR
Q3
Q1
Percentili i rang percentila
Pk=Vrednost
kn
100
tog člana u rangiranoj seriji podataka
gde je sa k označen broj percentila, a sa n veličina uzorka.
Rang percentila za
xi =
5
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
IV.
Verovatnoća
Ne dolazi na pismenom i najvećim delom izbačeno i sa usmenog.
6
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
V.
Diskretne slučajne promenljive i njihove raspodele
Slučajna promenljiva je promenljiva čija je vrednost određena ishodom slučajnog eksperimenta (npr: X – broj grbova pri
bacanju 3 novčića; Y – broj poena na ispitu; Z – zbir na dve kocke; W – vreme potrebno za rešavanje nekog problema). Slučajne
promenljive se dele na diskretne i neprekidne. Diskretne mogu da uzmu samo izolovane cele vrednosti (X,Y,Z), a neprekidne
bilo koju vrednost iz nekog intervala (W).
Raspored verovatnoće diskretne slučajne promenljive
A.
X – broj grbova pri bacanju 3 novčića
x P(x)
x
0
1/8
P(x)
1
3/8
2
3/8
3
1/8
∑
1
P
vrednosti prekidne slučajne promenljive
verovatnoće javljanja tih vrednosti
P(x) 1
broj povoljnih ishoda
ukupan broj ishoda
P P P  0 grove
P P G  1 grb
P(X=2) = 3/8
P(X>2) = P(X=3) = 1/8
P G P  1 grb
P G G  2 grba
P(X<2) = P(X=0) + P(X=1) = 4/8
G P P  1 grb
P(X<7) = P(X=0) + P(X=1) + P(X=2) + P(X=3) = 1
G P G  2 grba
P(1<X<2) = 0
G G P  2 grba
P(1<X≤2) = P(X=2) = 3/8
G G G  3 grba
Grafičko predstavljanje je uvek pomoću štapićastog dijagrama.
7
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
B.
Očekivana vrednost diskretne slučajne promenljive
E( X )
P(x)
x
C.
xP( x)
xP(x)
0
1/8
0
1
3/8
3/8
2
3/8
6/8
3
1/8
3/8
1
1,5
E (X ) 1,5
Očekivana vrednost nije ono što mi očekujemo u statističkom
eksperimentu, već predstavlja prosečnu vrednost neke
slučajne promenljive ili populacije.
Standardna devijacija diskretne slučajne promenljive
x 2 P(x)
2
P(x)
xP(x)
x 2 P( x)
1/8
0
0
1
3/8
3/8
3/8
2
3/8
6/8
12/8
3
1/8
3/8
9/8
1
1,5
3
x
0
x 2 P( x)
0,866
8
3
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
VI.
Neprekidne slučajne promenljive i normalna raspodela
A.
Raspored verovatnoće neprekidne sluč. promenljive
P( X
a)
0
a
P( X
a)
P( X
a)
f ( x)dx
F (a)
Površina koju funkcija gustine verovatnoće
zaklapa sa x-osom je uvek jednaka 1.
f ( x)dx 1 F (a)
a
b
P(a
X
b)
f ( x)dx F (b) F (a)
a
B.
Normalna raspodela
Normalan raspored je raspored čija funkcija verovatnoće glasi:
f ( x)
1
2
(x
e
2
)2
2
Poslednja relacija se skraćeno zapisuje:
X : N( ;
2
)
Grafički prikaz normalnog rasporeda:
Parametar
pokazuje samo gde je x-koordinata vrha rasporeda, a parametar
2
određuje oblik
rasporeda. Što je
veće to je raspored više spljošten. Primer tri normalna rasporeda sa istom aritmetičkom
sredinom, ali različitim varijansama:
1
3
2
1
9
2
3
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
Vezano za normalan raspored bitno je zapamtiti sledeće 3 osobine:
1. 68% normalnog rasporeda se nalazi na rastojanju do jedne standardne devijacije od aritmetičke sredine:
2. 95% normalnog rasporeda se nalazi na rastojanju do dve standardne devijacije od aritmetičke sredine:
2
2
Vrednosti na rastojanju manjem od dve devijacije od proseka se zovu veoma verovatne vrednosti, a
vrednosti na većem odstojanju malo verovatne vrednosti.
3. 99,7 % normalnog rasporeda se nalazi na rastojanju do tri standardne devijacije od aritmetičke sredine:
3
3
Kod normalnog rasporeda važno je upamtiti još sledeće osobine:
Ako su
X1 : N(
1
;
2
1
) i X 2 : N(
2
1.
X1
X 2 : N(
1
2
;
2
1
2
2
)
2.
X1
X 2 : N(
1
2
;
2
1
2
2
)
3.
n X 1 : N (n 1 ; n
2
1
;
2
2
)
10
)
tada važi:
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
C.
Standardizovan normalan raspored ( Z:N(0,1))
1. P( Z a) F (a)
2. P( Z a) 1 F (a)
3. P(a Z b) F (b) F (a )
4. P( a Z a) 2 F (a) 1
Z
D.
X
Tablica 4
- konverzija normalnog u standardizovani normalan raspored.
Primena normalnog rasporeda na računanje proporcije
p
pˆ
N1
N
X
n
p
N1
N
pˆ
X
n
proporcija u skupu
broj „uspeha” u skupu
veličina skupa
proporcija u uzorku
broj „uspeha” u uzorku
veličina uzorka
Proporcija predstavlja verovatnoću da je slučajno izabrana jedinica „uspeh“.
11
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
VII. Uzoračka raspodela
Zadatke iz ove oblasti prepoznajemo po tome što se pitanje uvek odnosi na uzorak, a parametri skupa su uglavnom poznati.
A.
Raspored aritmetičkih sredina uzoraka ( X )
P( X
a ), P ( X
a ), P (a
X
b)
ima normalan raspored ako je ispunjen jedan od sledeća dva uslova:
X
1. Osnovni skup je normalno raspoređen
2.
n 30 (centralna granična teorema)
X : N(
X
;
2
X
)
Izraz
X
X
se zove popravni faktor za konačne skupove
(pfks) i koristi se u formuli samo ako su ispunjena sledeća 3
uslova:
1. uzorak je bez ponavljanja
2. osnovni skup je konačan (zna se N)
N n
N 1
n
N n
N 1
3.
stopa izbora je bar 5% (
n
N
0,05 )
NAPOMENA: Uslov broj 1 se podrazumeva da je uvek
ispunjen osim ako nije drugačije naglašeno.
2
X
varijansa rasporeda aritmetičkih sredina i pokazuje prosek kvadrata odstupanja aritmetičkih sredina uzoraka
od aritmetičke sredine skupa.
X
standardna greška rasporeda aritmetičkih sredina i pokazuje prosek odstupanja aritmetičkih sredina uzoraka
od aritmetičke sredine skupa.
Ponekad u zadacima
x
se računa po sledećoj formuli:
2
X
x P( x) (
x
)2
, pogledati u knjizi na strani
327.
B.
Raspored proporcija uzoraka ( Pˆ )
P ( Pˆ
a ), P ( Pˆ
Da bi
Pˆ
n p
5
2.
n q
5
Pˆ : N (
Pˆ
Pˆ
b)
imao normalan raspored moraju biti ispunjeni sledeći uslovi:
1.
Pˆ
a ), P (a
Pˆ
;
Pˆ
standardna greška ocene proporcija i pokazuje prosek
odstupanja proporcija uzoraka od proporcije skupa.
2
Pˆ
)
p
p q
n
N n
N 1
12
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
Šabloni
1. Da se
X
razlikuje od
za manje od 2
2
2)
P(
2. Da se
3. Da je
X
razlikuje od
1
P(
X
veći od
P(
4. Da je
X
X
6. Da je
X
za manje od 2
2)
za više od 2
2)
manji od
2
manji od
P( X
2)
X
X
veći od
P(
za više od 2
2
P( X
5. Da je
X
za manje od 2
X
)
za više od 2
2)
13
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
VIII. Ocenjivanje aritmetičke sredine i proporcije
Statističko zaključivanje je postupak donošenja zaključaka o parametrima osnovnog skupa na osnovu informacija dobijenih iz
uzorka. Postoje dva vida statističkog zaključivanja:
1. Statističko ocenjivanje
2. Testiranje statističkih hipoteza
A.
Ocenjivanje aritmetičke sredine osnovnog skupa
1.
je poznata
x
z
x
X
2
X
z
x
X
2
standardna greška ocene
x
N n
N 1
n
aritmetička sredina uzorka
aritmetičke sredine
rizik greške (nivo značajnosti)
nivo pouzdanosti (koeficijent poverenja)
1
podrazumevana vrednost
5%
Interval poverenja možemo smanjiti na dva načina:
1. Povećanjem rizika greške
,
2. Povećanjem veličine uzorka n.
Uži interval znači preciznija ocena.
F (z ) 1
2
2
Na primer:
5%
F (z ) 1
2
0,05
2
0,9750
z
1,96.
2
Uslovi:
1.
je poznata
2. a) osnovni skup je normalno raspoređen
b)
n 30
2.
nije poznata
x tn
s
sx
t
1;
n
2
sx
x tn
1;
N n
N 1
studentov t test
2
sx
,
s x - ocena za
tablica 5.
primer:
n 16,
tn
1;
2
0,05
t15;0,025
2,131
14
x
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
Uslovi:
1.
nije poznata
2. a) Osnovni skup je normalno raspoređen
b)
B.
n 30
Ocenjivanje proporcije osnovnog skupa
pˆ z s pˆ
p
2
X
n
pˆ
s pˆ
pˆ
z s pˆ
2
pˆ - proporcija u uzorku
pˆ qˆ
n
N n
s pˆ
N 1
ocena
Pˆ
Uslovi:
1.
n pˆ
5
2.
n qˆ
5
15
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
IX.
Testiranje hipoteza o aritmetičkoj sredini i proporciji
A.
Osnovni pojmovi
H 0 : nulta hipoteza (nevin)
H 1 : alternativna hipoteza (kriv)
Ono što ispitujemo stavljamo u
H 1 . Pokušavamo da odbacimo H 0
suprotnom ne možemo prihvatiti H 1 .
i ako uspemo prihvatamo
H1
Pri testiranju hipoteza postoje dva tipa grešaka:
1. Greška I vrste (
) – da odbacimo tačnu
2. Greška II vrste (
H0
(osudimo nevinog),
) – da ne odbacimo netačnu
Moć (jačina) testa (1-
H0
(pustimo krivca).
) je verovatnoća da odbacimo netačnu
H0
(osudimo krivca).
Postoje 3 tipa hipoteza:
A) H 0 :
0
H1 :
0
B) H 0 :
0
H1 :
0
C) H 0 :
0
H1 :
0
,p
Postupak testiranja hipoteza je sledeći:
I korak: postavljanje nulte i alternativne hipoteze
II korak: izbor odgovarajuće statistike testa
III korak: slika
IV korak: izračunavanje statistike testa
V korak: zaključak
B.
Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa
A) H 0 :
0
H1 :
0
B) H 0 :
0
H1 :
0
C) H 0 :
0
H1 :
0
1.
z
je poznata
x
0
x
x
n
N n
N 1
Uslovi:
1.
je poznata
2. a) osnovni skup je normalno raspoređen
b)
n 30
16
kao tačno, dok u
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
NAPOMENA:
Ako se testiranje radi pomoću p-vrednosti postupak je sledeći:
A)
p
2P(Z
B)
p
P( Z
z)
C)
p
P( Z
z)
Ako je
odbacujemo H0, a ako je
p
2.
ne odbacujemo H0.
p
nije poznata
x
t
z)
0
sx
sx
s
n
N n
N 1
Uslovi:
1.
nije poznata
2. a) Osnovni skup je normalno raspoređen
b)
df
n 30
n 1
df
broj stepeni slobode
17
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
NAPOMENA: Ako se testiranje radi pomoću p-vrednosti postupak je sledeći:
Ako je
C.
A)
p
2P(T
B)
p
P(T
t)
C)
p
P(T
t)
t)
odbacujemo H0, a ako je
p
Testiranje proporcije skupa
A) H 0 : p
p0
H1 : p
p0
B) H 0 : p
p0
H1 : p
p0
C) H 0 : p
p0
H1 : p
p0
z
ne odbacujemo H0.
p
pˆ
p0
pˆ
pˆ
p0 (1 p0 )
n
N n
N 1
Uslovi:
1.
np0
5
3.
nq0
5
18
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
X.
Ocenjivanje i testiranje: Dva osnovna skupa
A.
Zaključivanje o razlici aritmetičkih sredina dva osnovna skupa na
osnovu nezavisnih uzoraka kada su 1 i 2 poznate
OCENJIVANJE
x1
x2
gde je
z
1
x1 x2
2
x1 x2
2
1
2
2
n1
n2
2
x1
x2
z
2
x1 x2
-
TESTIRANJE
A) H 0 :
1
2
H1 :
1
2
1
2
1
2
B) H 0 :
1
2
H1 :
C) H 0 :
1
2
H1 :
x1
z
x2
2
1
2
2
n1
n2
Uslovi:
1. Uzorci su nezavisni
2. Standardne devijacije skupova su poznate
3. Oba uzorka su velika ( n1
30 , n2
30 ) ili oba skupa imaju normalne raspodele
B.
Zaključivanje o razlici aritmetičkih sredina dva osnovna skupa na
osnovu nezavisnih uzoraka kada su 1 i 2 nepoznate ali jednake
OCENJIVANJE
x1
x2
tn
1
gde je
sx
1
sx
n2 2 ;
2
x2
sp
1
x2
1
1
n1
1
n2
2
x1
x2
sp
TESTIRANJE
A) H 0 :
1
2
H1 :
1
2
B) H 0 :
1
2
H1 :
1
2
C) H 0 :
1
2
H1 :
1
2
t
x1 x 2
sx x
1
df
n1
2
n2
2
19
tn
1
n2 2 ;
2
sx
1
x2
(n1 1) s12 (n2 1) s 22
n1 n2 2
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
Uslovi:
1. Uzorci su nezavisni
2. Standardne devijacije skupova su nepoznate, ali jednake
3. Oba uzorka su velika ( n1
30 , n2
30 )
ili oba skupa imaju normalne raspodele
C.
Zaključivanje o razlici aritmetičkih sredina dva osnovna skupa na
osnovu nezavisnih uzoraka kada su 1 i 2 nepoznate ali nisu jednake
OCENJIVANJE
x1
x2
t df ; s x
gde je
sx
1
1
x2
1
2
s12
n1
x2
x1
2
x2
t df ; s x
2
1
x2
s 22
n2
TESTIRANJE
A) H 0 :
1
2
H1 :
1
2
B) H 0 :
1
2
H1 :
1
2
C) H 0 :
1
2
H1 :
1
2
t
x1 x 2
sx x
1
2
s12
n1
df
2
s12
n1
n1 1
2
s 22
n2
s 22
n2
Uvek se zaokružuje na manji ceo broj.
2
n2 1
Uslovi:
1. Uzorci su nezavisni
2. Standardne devijacije skupova su nepoznate, ali nisu jednake
3. Oba uzorka su velika ( n1
30 , n2
30 )
ili oba skupa imaju normalne raspodele
D.
Zaključivanje o razlici aritmetičkih sredina dva osnovna skupa na
osnovu zavisnih uzoraka
OCENJIVANJE
d
t df ; s D
2
gde je
d
1
d
n
2
d
t df ; s D
2
sD
sD
n
d
sD
20
d
2
n
n 1
2
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
TESTIRANJE
A) H 0 :
1
2
H1 :
1
2
B) H 0 :
1
2
H1 :
1
2
C) H 0 :
1
2
H1 :
1
2
d
sD
df n 1
t
Uslovi:
1. Uzorci su zavisni
2. Standardna devijacija osnovnog skupa razlika usklađenih parova,
30 )
3. Uzorak je veliki ( n
D
, nije poznata
ili osnovni skup razlika usklađenih parova ima normalnu raspodelu
E.
Zaključivanje o razlici proporcija dva osnovna skupa na osnovu velikih i
nezavisnih uzoraka
OCENJIVANJE
pˆ 1
pˆ 2
gde je
z s Pˆ
1
2
s Pˆ
1
p1
Pˆ2
pˆ 1qˆ1
n1
Pˆ2
pˆ 1
p2
pˆ 2
z s Pˆ
2
1
Pˆ2
pˆ 2 qˆ 2
n2
TESTIRANJE
A) H 0 : p1
p2
H 1 : p1
p2
B) H 0 : p1
p2
H 1 : p1
p2
C ) H 0 : p1
p2
H 1 : p1
p2
z
pˆ 1 pˆ 2
s Pˆ Pˆ
1
s Pˆ
2
1
Pˆ2
1
pˆ qˆ
n1
1
n2
pˆ
Uslovi:
1. Uzorci su nezavisni
2.
n1 pˆ 1
5, n1qˆ1
5, n2 pˆ 2
5, n2 qˆ 2
5
21
x1
n1
x2
n2
qˆ
1 pˆ
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
2
XI.
test
A.
Test prilagođenosti
H 0 : empirijski raspored odgovara teorijskom
H 1 : empirijski raspored ne odgovara teorijskom
(O
2
E)2
E
O - ostvarena frekvencija (ono što smo dobili u uzorku)
E - očekivana frekvencija (šta je trebalo da dobijemo) E=np
Uslovi:
1.
E
df
k - broj mogućih ishoda
5
tablica 6
k 1
B.
Test nezavisnosti
Služi za testiranje nezavisnosti dva obeležja.
H 0 : obeležja su nezavisna
H 1 : obeležja su zavisna
Testiranje se vrši pomoću tabele kontingencije koja predstavlja kombinovanu tabelu u čijim poljima se uvek nalaze
frekvencije. Ako su u postavci zadatka dati procenti treba ih pretvoriti u frekvencije.
E
(Suma reda)(Suma kolone )
vel . uzorka
df
( R 1)(K 1)
C.
R - broj redova
K - broj kolona
Ispitivanje varijanse osnovnog skupa
OCENJIVANJE
(n 1) s 2
2
n 1;
2
2
(n 1) s 2
2
n 1;1
2
22
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
TESTIRANJE
A) H 0 :
2
B) H 0 :
2
C) H 0 :
2
2
H1 :
2
0
2
0
H1 :
2
0
2
0
H1 :
2
0
2
0
(n 1) s 2
2
0
A)
B)
C)
23
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
XII. Analiza varijanse
A.
Analiza varijanse sa jednim faktorom
Služi za analizu jednakosti aritmetičkih sredina više od dva skupa.
H0 :
H 1 : bar dva se razlikuju
2
ST
SA
SR
ST
ukupan varijabilitet ili ukupna suma kvadrata ili ukupno odstupanje svih opservacija
SA
faktorski varijabilitet ili faktorska suma kvadrata ili ukupno odstupanje između uzoraka
SR
rezidualni varijabilitet ili rezidualna suma kvadrata ili ukupno odstupanje unutar uzoraka
SA
T12
n1
3
...
1
T22
n2
T32
n3
T12
n1
x
...
T22
n2
2
n
T32
n3
SR
x2
VA
SA
k 1
V A faktorska varijansa (prosek odstupanja između uzoraka)
k - broj uzoraka
VR
SR
n k
VR
n
F
F
df1
VA
VR
IZVOR
...
rezidualna varijansa (prosek odstupanja unutar uzoraka)
ukupan broj podataka u svim uzorcima
test (tablica 7)
k 1, df 2
n k
STEPENI
SUMA
SREDNJI
SLOBODE
KVADRATA
KVADRAT
FAKTOR
k 1
SA
VA
GREŠKA
n k
SR
VR
TOTAL
n 1
ST
F
V A VR
24
p-vrednost
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
Primer za traženje p-vrednosti:
k
3,
df1
n 15,
df 2
F
0,01
6,28
k 1 2
n k
p
12 ,
0,05
Uslovi:
1. Uzorci su slučajni i međusobno nezavisni
2. Osnovni skupovi su normalno raspoređeni, a njihove nepoznate varijanse su jednake
25
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
XIII. Prosta linearna regresija i korelacija
A.
Prosta linearna regresija
1.
Osnovni pojmovi
Cilj regresije je da se utvrdi priroda veze, odnosno oblik zavisnosti između posmatranih pojava. To se postiže
pomoću odgovarajućeg regresionog modela koji pokazuje prosečno slaganje varijacija posmatranih pojava.
X
nezavisna (objašnjavajuća) slučajna promenljiva
Y
zavisna promenljiva
Y
f (X )
Y
0
1
- regresiona linija u skupu
X
0
odsečak na Y osi (pokazuje kolika je prosečna vrednost Y-a kada je X=0)
1
koeficijent nagiba (pokazuje prosečnu promenu Y-a kada se X poveća za 1)
Npr:
Y
20 3 X
X
cena u 00 din,
Y
tražnja u 000 t.
Pri ceni od 0 dinara očekuje se prosečna tražnja od 20000 tona, a sa svakim povećanjem cene za 100 dinara,
tražnja u proseku opadne za 3000 tona.
yˆ
b0
b0
b1 x
ocena za
Koeficijente
- regresiona linija u uzorku
0,
b0 i b1
ocena za
b1
1.
nalazimo po metodu najmanjih kvadrata. Taj metod se zasniva na minimiziranju
kvadrata vertikalnih odstupanja podataka od regresione linije. Ta vertikalna odstupanja se zovu reziduali
( ei ).
ei
yˆ
y
b1
SPxy
SK xx
b0
SK yy
,
SPxy
y b1 x,
y2
x
xy
SK xx
y
y
n
x
2
x
2
n
2
n
2.
Mere reprezentativnosti regresione linije
SKU
SKO SKN
SKU
ukupna suma kvadrata (ukupan varijabilitet)
SKO
objašnjena suma kvadrata (objašnjen varijabilitet)
SKN
neobjašnjena suma kvadrata (neobjašnjen varijabilitet
26
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
a)
Apsolutna mera reprezentativnosti (s)
s standardna greška regresije (pokazuje prosečno odstupanje podataka od regresione linije iskazano u
jedinicama mere Y-a).
0 s
s
funkcionalna veza (sve tačkice su na liniji)
0
Sa porastom
s
opada reprezentativnost.
SK yy
SKN
n 2
s
b1 SPxy
n 2
Nedostatak je što je iskazana u jedinici mere.
b)
r2
Relativna mera reprezentativnosti ( r 2 )
koeficijent determinacije (pokazuje udeo objašnjenog varijabiliteta u ukupnom)
b1 SPxy
SKO
SKU
r2
r2
0
SK yy
1
r2
Uslov reprezentativnosti je
r2
0
odsustvo veze
r2
1
funkcionalna veza
r2
0,5.
se izražava u procentima. Sa porastom
SKN
SKU
1 r2
3.
r2
raste reprezentativnost.
udeo neobjašnjenog varijabiliteta u ukupnom.
Testiranje značajnosti regresione linije
(Da li X utiče na Y?)
H0 :
1
0
H1 :
1
0
H0 :
1
0
H1 :
1
0
H0 :
1
0
H1 :
1
0
t
sb1
s b1 - standardna greška ocene koeficijenta
nagiba (pokazuje za koliko u proseku
odstupa od
1)
b1
sb1
s
SK xx
,
df
n 2
Ukolio se testiranje vrši pomoću p-vrednosti, onda važi: ako je
p
b1
X ne utiče na Y.
27
p
X utiče na Y, a ako je
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
b1
tn
s
2; / 2 b1
b1
1
tn
s
2; / 2 b1
Ako 0 pripada gornjem intervalu to znači da X ne utiče na Y.
Npr:
3
cena u 00 din,
2, x
1
tražnja u 000 tona
y
Komentar: X ne utiče na Y.
3
cena u 00 din,
2, x
1
tražnja u 000 tona
y
Komentar: Pri povećanju cene za 100 dinara, tražnja u proseku opadne između 2000 tona i 3000 tona.
Kad god u zadatku pitaju za koliko se promeni Y kada se X poveća za n jedinica, treba formirati interval za
1
pa ga pomnožiti sa n.
4.
Korišćenje regresione funkcije za ocenjivanje i predviđanje Y-a
Uslovi:
2
1.
Reprezentativnost ( r
0,5 )
2.
Značajnost (
3.
Da nije ekstrapolacija (ekstrapolacija je predviđanje Y-a za vrednosti X-a van opsega uzorka; dozvoljena
je samo bliska ekstrapolacija)
0)
1
Najuži interval kod predviđanja se dobija ako je
razlikuje od
x , a najširi za vrednost x-a iz uzorka koja se najviše
xp
(najveća ili najmanja vrednost uzorka).
x
Pri predviđanju individualne vrednosti dobijaju se širi intervali nego pri predviđanju prosečne vrednosti y-a.
U zadacima ne ispitujemo gornje uslove osim ako ne naglase i to ako kažu da li su ispunjeni uslovi ispitujemo
samo prva dva, a ako pitaju da li je ocena validna onda ispitujemo sva tri uslova.
a)
yˆ p
tn
yˆ p
b0
Ocenjivanje prosečne vrednosti Y-a
s
2; / 2 yˆ p
yˆ p
Y X
tn
b1 x p
s
2; / 2 yˆ p
x p - vrednost X-a data u zadatku za koju
vršimo predviđanje
s yˆ p
s
s yp
tn
s
prosečne vrednosti Y-a.
SK xx
b)
yˆ p
s yˆ p - standardna greška ocene
x) 2
(x p
1
n
s
2; / 2 y p
1
1
n
Predviđanje individualne vrednosti Y-a
yˆ p
Yp
(x p
x2
tn
s
2; / 2 y p
x) 2
nx
s y p - standardna greška predviđanja
2
individualne vrednosti Y-a.
28
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
B.
Prosta linearna korelacija
1.
Osnovni pojmovi
Cilj korelacione analize je da se utvrdi da li između varijacija posmatranih pojava postoji kvantitativno
slaganje (korelaciona veza) i ako postoji u kom stepenu.
koeficijent korelacije u skupu
r
Pirsonov koeficijent korelacije u uzorku
r2
r
0 , a – kada je inverzna veza tj. b1
0 ).
1 r 1
SK xx SK yy
0
2.
između pojava ne postoji linearna veza.
Testiranje korelacije
H0 :
t
b1
SPxy
r
r
(+ se koristi kada je direktna veza tj.
r
0
H1 :
n 2
1 r2
df
0
n 2
Ako se testiranje radi pomoći p-vrednosti, onda važi: ako je
između X i Y, a ako je
p
p
u skupu postoji linearna veza
u skupu ne postoji linearna veza između X i Y.
29
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
XIV. Višestruka linearna regresija i korelacija
A.
Višestruka linearna regresija
1.
Osnovni pojmovi
Y
0
1
X1
2
X2
- regresiona ravan u skupu
0
pokazuje kolika je prosečna vrednost
1
pokazuje prosečnu promenu
Y -a kada se pri nepromenjenom X 2 , X 1 poveća za 1.
2
pokazuje prosečnu promenu
Y -a kada se pri nepromenjenom X 1 , X 2
yˆ i
b0
b0
ocena za
2.
b1 x1i
b2 x 2i
0,
b1
Y -a kada su X 1
0 i X2
0.
poveća za 1.
- regresiona ravan u uzorku
ocena za
1,
b2
ocena za
2.
Mere reprezentativnosti regresione funkcije
a)
Apsolutna mera reprezentativnosti (s)
s standardna greška regresije (pokazuje prosečno odstupanje podataka od regresione ravni iskazano u
jedinicama mere Y-a).
0 s
s
funkcionalna veza
0
Sa porastom
s
s
opada reprezentativnost.
SKN
n 3
b)
R2
0
Relativna mera reprezentativnosti ( R 2 )
koeficijent višestruke determinacije (pokazuje udeo objašnjenog varijabiliteta u ukupnom)
R2
1
Uslov reprezentativnosti je
R2
R2
0
odsustvo veze
R2
1
funkcionalna veza
R2
0,5.
se izražava u procentima. Sa porastom
1 R2
R2
raste reprezentativnost.
udeo neobjašnjenog varijabiliteta u ukupnom.
Kod malih uzoraka koristimo korigovani koeficijent višestruke determinacije
30
R
2
1
n 1
(1 R 2 )
n 3
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
3.
Testiranje značajnosti regresione linije
a)
Da li X1 utiče na Y
H0 :
1
0
H1 :
1
0
H0 :
1
0
H1 :
1
0
H0 :
1
0
H1 :
1
0
t
b1
, df
sb1
n 3,
p
2P(T
X 1 utiče na Y
p
b1
tn
3; / 2
sb1
b)
b1
1
tn
2
0
H1 :
2
0
H0 :
2
0
H1 :
2
0
H0 :
2
0
H1 :
2
0
b2
, df
sb 2
p
n 3, p
utiče na
X2
b2
tn
3; / 2
s b1
3; / 2
Da li X2 utiče na Y
H0 :
t
t)
sb 2
2P(T
t)
Y
b2
2
tn
3; / 2
sb 2
U zadacima često pitaju da li datim podacima više odgovara prost ili višestruki model. U tom slučaju treba
izvršiti oba prethodna testa, pa ako oba x-a utiču na y to znači da podacima više odgovara višestruki model, a
ako samo jedan od x-ova utiče na y, to znači da podacima više odgovara prost regresioni model.
4.
Korišćenje regresione funkcije za ocenjivanje i predviđanje Y-a
Uslovi:
1.
Reprezentativnost ( R
2.
Značajnost (
3.
Da nije ekstrapolacija.
a)
yˆ p
tn
yˆ p
b0
0,
1
0,5 )
2
0)
Ocenjivanje prosečne vrednosti Y-a
s
Y X
b1 x1 p
b2 x 2 p
3; / 2 yˆ p
2
yˆ p
tn
s
3; / 2 yˆ p
x1 p , x 2 p - vrednosti za X1 i X2 date u
zadatku, za koje vršimo predviđanje.
s yˆ p - standardna greška ocene prosečne
31
vrednosti Y-a.
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
b)
yˆ p
tn
Predviđanje individualne vrednosti Y-a
s
Yp
3; / 2 y p
yˆ p
tn
s
3; / 2 y p
s y p - standardna greška predviđanja
individualne vrednosti Y-a.
B.
Višestruka linearna korelacija
R
R2
0
R 1
R - koeficijent višestruke linearne korelacije (pokazuje stepen
kvantitativnog slaganja – korelacione veze između varijacija Y-a sa
jedne strane i X1 i X2 sa druge).
PRIMER:
Na osnovu podataka iz zadatka br. 29.3. sa strane 46. zbirke, dobijeni su sledeći rezultati, korišćenjem statističkog
programa MINITAB:
Regression Analysis
The regression equation is
Promet = 98,3 - 1,59 Zaposleni + 9,92 Prostor
Koef
St. Greška
T
P
Konstanta
98,281
6,801
14,45 0,001
Zaposleni
-1,592
1,381
-1,15
0,332
9,924
2,267
4,38
0,022
Prostor
S = 4,299
R2 = 97,6%
R2 (korigovani) = 96,0%
a) Objasnite ekonomski smisao ocenjenih regresionih koeficijenata.
b) Kako tumačite dobijeni koeficijent višestruke determinacije? Objasnite zašto uvodimo korigovani koeficijent
višestruke determinacije i interpretirajte njegovu vrednost u ovom primeru.
c) Testirajte da li broj zaposlenih utiče na obim prometa. Da li veličina poslovnog prostora utiče na obim prometa? Na
osnovu dobijenih rezultata zaključite da li datim podacima više odgovara prost ili višestruki linearni regresioni
model.
d) Predvidite prosečan nivo prometa u prodavnicama sa deset zaposlenih i poslovnim prostorom od 2000m2, ako je
poznato da standardna greška ocene prosečne vrednosti obima prometa iznosi 26,52. Da li je dobijena vrednost
validna? Objasnite!
e) Izračunajte i objasnite koeficijent višestruke linearne korelacije.
f) Ocenite za koliko se promeni promet ako se pri nepromenjenom broju zaposlenih veličina poslovnog prostor
poveća za 200 m2.
32
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
XV. Neparametarski metodi
A.
Spirmanova korelacija ranga (rs)
Računa se samo ako je bar jedan od podataka na ordinalnoj skali ili ako je bar jedan od podataka rangiran, ili ako skup
nije normalan.
rs
1
6
d i2
n (n 2 1)
1 rs 1
di
RX
RY
Testiranje Spirmanove korelacije:
A)
H0 :
S
0
H1 :
S
0
B)
H0 :
S
0
H1 :
S
0
C)
H0 :
0
H1 :
S
S
0
A) je dvosmerna, a B) i C) su jednosmerne hipoteze.
Tablica 11.
Ako je
n 30 testiranje se vrši pomoću Z – testa, gde je z
33
rs
n 1.
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
XVI. Indeksni brojevi
A.
Individualni indeksi
1.
Lančani indeksi
yt
100
yt 1
Lt
Lt
a
y t - tekući podatak
yt
1-
prethodni podatak
se tumači u odnosu na 100, pa tako na primer
L t =101,1 znači da je podatak za 1,1% veći od prethodnog,
L t =98,3 da je podatak za 1,7% manji od prethodnog.
2.
It
Bazni indeksi
yt
100
y0
y t - tekući podatak
y 0 - podatak iz baznog perioda
Najpoznatiji bazni indeksi:
Ip
Iq
I pq
pt
100
p0
qt
100
q0
pt qt
100
p0 q0
indeks cena
p 0 - cena iz baznog perioda
p t - cena iz tekućeg perioda
q 0 - količina iz baznog perioda
indeks količina
q t - količina iz tekućeg perioda
indeks vrednosti
34
p 0 q 0 - vrednost iz baznog perioda
p t q t - vrednost iz tekućeg perioda
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
3.
Preračunavanje individualnih indeksa
a)
Preračunavanje baznih indeksa sa bazom u jednoj
godini na bazne indekse sa bazom u drugoj godini i lančane
indekse
Princip: zamislimo da su bazni indeksi podaci, pa na osnovu njih izračunavamo druge indekse.
Primer:
Godina
Lt I t
100
It
1983=100
1985=100
83
100
84
101,1
85
101,3
86
105,0
87
103,2
88
101,9
b)
It
It
Lt
Preračunavanje lančanih indeksa u bazne indekse
1
It
1
It
100
Lt
Primer:
Godina
Lt
It
1985=100
83
/
84
101,1
85
100,1
86
103,7
87
98,3
88
98,7
35
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
4.
Geometrijska stopa rasta
Geometrijska stopa rasta
rg
se računa samo za vremenske serije i pokazuje prosečan rast pojave u posmatranom
periodu iskazan u procentima.
Računa se na 2 načina:
Pomoću originalnih podataka
1.
rg
T 1
yT
y1
Pomoću lančanih indeksa
2.
rg
rg
rg
G Lt
y1 - prvi podatak, y T - poslednji
podatak, T – broj podataka
1 100
100
se tumači u odnosu na nulu. Tako na primer
32 ,2%
rg
57 ,7%
znači da je pojava u proseku godišnje rasla za 57,7%, a
znači da je pojava u proseku godišnje opadala za 32,2%.
Za razliku od njega lančani indeksi se tumače u odnosu na 100. Tako npr.
odnosu na prethodni period, a
B.
Lt
92
Lt
123
znači da je pojava za 8% manja u odnosu na prethodni preiod.
Grupni indeksi
1.
Metod agregata
pt
100 I q
p0
Ip
2.
Ip
qt
100 I pq
q0
Metod prosečnih odnosa
a)
Ip
n
Aritmetički indeksi
Iq
znači da je pojava za 23% veća u
Iq
n
I pq
I pq
n
36
pt qt
100
p0 q0
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
C.
Ponderisani grupni indeksi
1.
Metod agregata
Ip
Iq
I pq
Ip
Iq
I pq
pt q0
100
p0 q0
qt p0
100
q0 p0
pt qt
100
p0 q0
Ponder iz baznog perioda (Laspejresov metod)
pt qt
100
p0 qt
qt pt
100
q0 pt
pt qt
100
p0 q0
Ponder iz tekućeg perioda (Pašeov metod)
Ip
pt q0
p0 q0
pt qt
100
p0 qt
Iq
qt p0
q0 p0
qt pt
100
q0 pt
pt qt
100
p0 q0
I pq
2.
Ip
Iq
I pq
Fišerovi ”idealni” indeksi
Metod prosečnih odnosa (aritmetički indeksi)
I p p0 q0
p0 q0
I q p0 q0
p0 q0
I pq p0 q0
Ip
Iq
Ponder bazni
I pq
p0 q0
37
I p pt qt
pt qt
I q pt qt
pt qt
I pq p t qt
pt qt
Ponder tekući
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
XVII. Analiza vremenskih serija
Vremenske serije su nizovi statističkih podataka koji pokazuju varijacije pojava tokom vremena. Cilj ovog poglavlja je da
izvršimo analizu vremenskih serija i utvrdimo zašto postoji varijacija podataka tokom vremena.
Uzmimo na primer broj turista na Crnogorskom primorju. Taj broj se tokom godina menja. 1998. broj turista je npr. 185670
a 2000. broj turista je 190248. Zašto postoje ove razlike?
Na varijacije podataka u vremenskim serijama utiču 4 faktora:
T - uticaj trenda
S - uticaj sezone
C - ciklična komponenta
R - rezidualni uticaj.
Uticaj trenda predstavlja dugoročni uticaj na neku pojavu, tako da pojava neprestano raste ili opada po nekom zakonu. Tako
npr. broj turista na Crnogorskom primorju iz godine u godinu je sve veći i veći, dakle postoji dugoročni rastući trend ove
pojave.
Uticaj sezone je pojava da u određenim delovima godine neka pojava je izrazito veća od proseka za tu godinu, a u drugim
delovima godine izrazito manja od proseka. Tako npr. broj turista na Crnogorskom primorju je u julu i avgustu mnogo veći
od proseka za tu godinu, a u januaru i februaru mnogo manji od proseka.
Ciklična komponenta predstavlja pojavu da je tokom niza godina neka pojava naglo veća od očekivanja, a onda niz godina
naglo manja. Tako na primer u periodu rata i sankcija broj stranaca na Crnogorskom primorju je značajno opao, a u periodu
posle će verovatno naglo da poraste zbog znatiželje starih posetilaca.
Rezidualna komponenta predtavlja slučajan uticaj na varijaciju pojave.
Postoji više teorija kako ove komponente utiču na varijaciju pojave.
Ako podatke serije označimo sa Y po multiplikativnoj teoriji važiće Y=T C S R, po aditivnoj Y=T+C+S+R, po kombinovanim
Y=T+C S R ili Y=T C+S R itd. Ako su podaci godišnji multiplikativni model je Y=T C. U ovom poglavlju izučava se samo
multiplikativni model.
Kod multiplikativnog modela T je dato u jedinici mere Y-a, a S,C i R su relativni brojevi. Kod aditivnog modela i T i S i C i R su
dati u jedinici mere Y-a.
U svakom zadatku pre nego što se krene sa bilo kakvom analizom vrši se prenumeracija podataka. Prenumeracija podataka
znači da godine i kvartali nisu t kolona već se t kolona formira prostom prenumeracijom od 1 do n.
A.
Uticaj trenda
Postoje tri funkcije trenda:
1) Linearni trend
2) Parabolični trend
3) Eksponencijalni trend
Prvi problem pri određivanju funkcije trenda je odrediti koja funkcija trenda je najbolja za konkretni slučaj.
Postoje četiri načina za izbor funkcije trenda:
1. Metod diferencija (razlika) - Najpre se formira nova kolona u tabeli koja se označava sa 1 i u koju se upisuju
apsolutne razlike susednih podataka iz kolone y. Ukoliko su te razlike približno jednake, onda je najbolji linearni
trend, a ako nisu jednake formira se nova kolona u tabeli 2 u koju se upisuju apsolutne razlike susednih podataka iz
kolone 1. Ako su te razlike približno jednake onda je u pitanju parabolični trend, a ako nisu formira se nova kolona
logy u koju se upisuju apsolutne razlike svih susednih podataka it kolone logy, pa ako su te razlike približno jednake
onda je to eksponencijalni trend. Najbolji primer kako se ovo radi dat je u rešenju zadatka 6.2. Obratiti pažnju da su
razlike uvek pozitivne. Znači nije bitno koji je podatak veći.
2. Metod pokretnih sredina (proseka) - Najpre se formira kolona u koju se upisuju pokretni proseci. Pokretni proseci
mogu da budu dvogodišnji, trogodišnji, četvorogodišnji, itd. Ukoliko se pokretni proseci prave sa neparnim brojem
podataka, npr. trogodišnji pokretni proseci, vrši se sabiranje svake tri susedne godine i deljenje sa tri. Rezultat koji se
dobije se piše naspram srednje od te tri godine, znači naspram druge. Primer pravljenja trogodišnjih i petogodišnjih
pokretnih proseka dat je na strani 403. Ukoliko se pokretni proseci prave sa parnim brojem podataka, npr.
četvorogodišnji pokretni proseci, vrši se sabiranje svake četiri susedne godine i deljenje sa 4. Rezultat koji se dobije se
piše na mestu između drugog i trećeg podatka. Međutim, kako sad pokretni proseci nisu centrirani, vrši se njihovo
38
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
centriranje, tako što se svaka dva susedna podatka saberu, rezultat podeli sa dva i napiše između ta dva podatka.
Primer pravljenja pokretnih proseka od 4 podatka dat je na str 428. Kada su formirani pokretni proseci, na te
pokretne proseke se primenjuje grafički metod.
3. Srednja kvadratna greška - Najpre se pronađu sve tri funkcije trenda, pa se za svaku od tih funkcija izračuna
srednja kvadratna greška po sledećoj formuli:
y yˆ t
T
SKG
2
.
Bira se ona funkcija trenda koja ima najmanju srednju kvadratnu grešku.
4. Grafički metod – Serija se prikaže na aritmetičkom i polulogaritamskom dijagramu. Ako na aritmetičkom dijagramu
liči na liniju onda je to linearni trend, a ako na polulogaritamskom liči na liniju onda je to eksponencijalni trend.
NAPOMENA : Ako su lančani indeksi približno jednaki uzima se eksponencijalni trend.
1.
Linearni trend
yˆ t
Funkcija linearnog trenda je
t y
T
.
2
t
T
ty
b0 b1t ,
gde je
b0
y b1t , b1
t2
b1
pokazuje srednji apsolutni porast za posmatrani period.
2.
Parabolični trend (Izbačeno)
yˆ t
Funkcija paraboličnog trenda je:
b0
b1t
b2t 2 ,
gde se koeficijenti
b0 , b1 i b2
dobijaju rešavanjem
sledećeg sistema linearnih jednačina:
y T b0
ty
t2 y
b0
b1
t b2
t b1
t2
t2
1.
b0
t2
t3
b2
t 3 b2
b1
Eksponencijalni trend
Funkcija eksponencijalnog trenda je:
log y
T
log b0
b0
t4
log b0
10
log b1
log b1
, b1 10
t
T
yˆ t
b0 b1t ,
gde je
t log y
t
T
2
t
, log b1
t
log y
2
T
.
Vezano za eksponencijalni trend definiše se i eksponencijalna stopa rasta:
b1
srednji relativni porast
b1 100
log yˆt
srednji tempo rasta
log b0
,
t log b1
linearni logaritamski trend.
39
re
b1 1 100 .
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
**************************************************************************************************
1. Tip zadatka: Daju nam funkciju trenda,ili je mi sami nađemo, pa treba da je iskoristimo za predviđanje podatka u
budućnosti, a ne spominje se nigde u zadatku sezona.
**************************************************************************************************
**************************************************************************************************
2. Tip zadatka: Isključiti trend (naći procentualno odstupanje podataka od linije trenda).
**************************************************************************************************
y
100
yˆ t
B.
- formula za isključenje trenda
Sezonska komponenta
Uticaj sezone je pojava da podaci variraju u okviru godine. U svim zadacima vezano za uticaj sezone podaci će uvek
biti dati po kvartalima.
Uticaj sezone se radi na sledeći način: (strana 428)
Najpre se formiraju pokretni proseci i centrirani pokretni proseci od po četiri podatka na ranije objašnjeni način.
Zatim se formira kolona
y
yc
koja se zove specifični sezonski indeksi. Naziv specifični sezonski indeksi potiče od toga
da je u koloni dat količnik podatka iz nekog kvartala
sa prosekom za celu godinu
y
yc .
Dakle, dobija se relativni
uticaj kvartala na podatke. Ako je indeks veći od 1 znači da su u tom kvartalu podaci veći od godišnjeg proseka i
obrnuto. Međutim, problem je što npr. za prvi kvartal mi imamo u tabeli dato 6 različitih vrednosti. To se rešava
pomoću pomoćne tabele na strani 429. U njoj se za svaki kvartal upišu svi specifični sezonski indeksi i nađe niihov
prosek. Tako se dobija kolona koja se zove kvartalne sredine (a ne kao što piše u knjizi
sredina sa 100 dobijamo tipične sezonske indekse
npr. za prvi kvartal
IS
IS
IS
I S ). Množenjem kvartalnih
koji predstavljaju uticaje pojedinih kvartala na podatke. Tako
je 47 što znači da su podaci u prvom kvartalu za 53% manji od proseka, a u trećem kvartalu
je 131 što znači da su podaci u trećem kvartalu za 31% veći od proseka.
Kvartal sa najvećim
Kvartal čiji
IS
IS
se zove živa sezona, a kvartal sa najmanjim
IS
mrtva sezona.
se najviše razlikuje od 100 je kvartal u kojem je sezona najviše izražena.
Kod kvartalnih podataka važi:
Kod mesečnih podataka važi:
IS
400.
IS
1200.
Vezano za sezonske indekse postoje dva tipa zadataka:
**************************************************************************************************
3. Tip zadatka: Predvideti nivo pojave u budućnosti uzimajući u obzir uticaj sezone.
**************************************************************************************************
Formula za predviđanje nivoa pojave koristeći uticaj sezone je:
yˆ t*
yˆ t
IS
.
100
*********************************************************************************
4. Tip zadatka: Isključiti uticaj sezone iz nekih podataka. (Izvršiti desezoniranje)
*********************************************************************************
Formula za isključenje uticaja sezone je
1992
I
II
III
IV
y
100 . Primer:
IS
Y
129
239
361
367
IS
47
88
131
134
40
y/IS 100
274,47
271,59
275,57
273,88
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
C.
Ciklična komponenta
Ciklična komponenta je u knjizi totalno zanemarena, tako da dalji tekst možete slobodno preskočiti. Ukoliko ipak
želite da znate i ponešto o tome pročitajte dalji tekst.
Ovde postoje dva tipa zadatka:
***************************************************************
5. Tip zadatka: Testiranje značajnosti cikličnih varijacija.
***************************************************************
Da bi se ispitalo postojanje cikličnih varijacija postavljamo hipoteze:
H 0 : Pojavu ne karakterišu ciklične varijacije
H 1 : Pojavu karakterišu ciklične varijacije
Postupak testiranja hipoteza je sledeći:
- (strana 406) najpre se isključi trend iz originalnih podataka
- zatim se formira nova kolona Promena u koju se upisuje + tamo gde je u prethodnoj koloni broj veći od 100,
odnosno - gde je broj manji od 100.
- zatim se broje svi uzastopni plusevi i minusevi. Kod faza dužine 1 pišemo 1, kod faza dužine 2 pišemo 2, a kod faza
dužine 3 i više pišemo 3. Sa
f1
označavamo broj faza dužine 1, sa
f2
broj faza dužine 2 i sa
f3
broj faza dužine 3 i
više.
- zatim računamo
- zatim računamo
H0
je
2
f1'
2
5n 3
, f 2'
12
po formuli
11 n 4
i f 3'
60
fi'
fi
fi
'
4n 21
.
60
2
. Za naš primer (vidi stranu 439)
6,898 . Ukoliko je taj uslov zadovoljen prihvatamo H 1
u suprotnom ne prihvatamo
2
je 11,78. Uslov za odbijanje
i zaključujemo da postoje ciklične varijacije, a
H1 .
NAPOMENA: Da bi zadatak mogao da se radi mora da bude bar 13 godina.
*************************************************
6. Tip zadatka: Izolacija cikličnih varijacija.
*************************************************
Izolacija ciklične komponente vrši se po obrascu:
formula je
y
100
yˆ t*
y
100 .
yˆ t
41
ako su u pitanju kvartali ili meseci, a za godišnje podatke
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
42
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
43
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
44
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
45
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
46
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
47
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
48
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
49
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
JANUAR 2010
1. U cilju ispitivanja uticaja kretanja cene jednog proizvoda i troškova reklamiranja na tržištu ocenjena je sledeća
linearna zavisnost tražnje (u 00 din) na osnovu uzorka od 10 opština u jednom gradu:
Konstanta
Cena (u 00 din)
Troškovi reklame
(u dinarima)
Koeficijent
110,2
-1,3
11,3
T
1,89
-10,50
4,50
p-vrednost
…
…
…
Modelom je objašnjeno 96% varijacija
tražnje. Sa pouzdanošću od 0,95 ocenite
za koliko će se u proseku promeniti
tražnja pri povećanju cene od 50 dinara
uz nepromenjene troškove reklame.
2. Iz četiri normalno raspoređena osnovna skupa sa jednakim varijansama izabrani su slučajni uzorci od po 6
elemenata i zabeležene njihove aritmetičke sredine koje iznose:
Ako je primenom
odgovarajućeg testa utvrđeno da aritmetičke sredine nisu međusobno jednake, utvrdite sa rizikom greške I vrste
od 0,05, između kojih sredina postoji statistički značajna razlika (mera odstupanja pojedinih opservacija unutar
uzorka od odgovarajućih aritmetičkih sredina uzoraka je 32).
3. Prečnik jedne industrijske komponente koja se proizvodi u firmi „AKO“ ima približno normalnu raspodelu sa
nepoznatom aritmetičkom sredinom i varijansom. Prost slučajan uzorak od 36 elemenata, dao je aritmetičku
sredinu 10 cm. 98% interval poverenja za ocenu aritmetičke sredine ima širinu 5 cm. Kolika je standardna
devijacija uzorka?
4. U sledećoj tabeli dati su podaci o fizičkom obimu proizvodnje u jednom preduzeću u periodu od 1999-2007.
Godina
Broj proizvoda
(u 000 komada)
1999
150
2000
160
2001
175
2002
190
2003
215
2004
220
2005
230
2006
245
2007
255
a) ocenite linearni trend i protumačite dobijenu ocenu nagiba.
b) polazeći od multiplikativnog modela iz serije isključite trend i grafički prikažite dobijenu seriju.
c) objasnite šta pokazuju dobijena odstupanja.
5. Broj sati koje student provede u sportskom centru ima normalan raspored, prosečan boravak je 80 sati
godišnje, a standardna devijacija je 15 sati. U prostom slučajnom uzorku iz ovog skupa dobijene su sledeće
vrednosti (broj sati boravka u centru):
66, 80, 95, 100, 70, 98, 111, 86, 107, 81, 55, 60, 74, 82, 90, 112, 140, 45, 76, 32.
a) sa nivoom pouzdanosti od 0,99 utvrdite da li je uzorak reprezentativan pri oceni učešća studenata koji godišnje
provedu više od 70 sati u sportskom centru.
b) uporedite relativne mere disperzije skupa i uzorka.
50
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
ISPITNI ZADACI IZ 2011.
1. U prostom slučajnom uzorku od 40 zaposlenih jednog preduzeća, 23 radnika je ostvarilo produktivnost iznad
prosečne. Ispitajte prihvatljivost istraživačke pretpostavke da je učešće svih zaposlenih sa produktivnošću iznad
prosečne manje od 60%, α=0,01.
2. Na osnovu analize prihoda od prodaje proizvoda jednog preduzeća (u 000 din) i ulaganja u istraživanje i razvoj
datog proizvoda (u 000 din) u 12 slučajno odabranih predstavništva u različitim zemljama, ocenjen je prost
linearni regresioni model yˆ 18,5 2,4 x . Poznato je da je standardna greška regresije 2,5 hiljada dinara, a
ocenjena standardna devijacija ocene regresionog parametra uz objašnjavajuću promenljivu 0,57 hiljada dinara.
a) Ispitajte na nivou značajnosti od 0,05 da li ulaganje u istraživanje i razvoj utiče na kretanje prodaje
b) Interpretirajte dobijenu vrednost koeficijenta nagiba
c) Izračunajte sumu kvadrata neobjašnjenog varijabiliteta i interpretirajte rezultat
d) Ukoliko ukupan objašnjeni varijabilitet iznosi 190 hiljada dinara izračunajte i interpretirajte koeficijent
determinacije.
3. Primanja zaposlenih jednog preduzeća su normalno raspoređena. Učešće zaposlenih sa primanjima manjim od
30.000 dinara iznosi 21,19%. Primanja radnika u iznosu od 65.000 veća su od prosečnih primanja za 0,2
standardne devijacije. Izračunajte verovatnoću da u prostom slučajnom uzorku od 25 zaposlenih prosečna
primanja zaposlenih budu manja od 45.000 dinara.
4. Na osnovu podataka iz uzorka od 10 slučajno odabranih radnika:
Radno iskustvo u
mesecima
Broj neispravnih
proizvoda
10
8
5
6
11
10
5
3
11
9
26
20
28
23
18
24
26
38
22
23
a) odredite regresionu jednačinu
b) ucrtajte liniju regresije u dijagram raspršenosti
c) ocenite za koliko će se u proseku promeniti broj neispravnih proizvoda, ako se radno iskustvo poveća za 3
meseca.
5. Slučajan uzorak od 18 učenika jedne srednje škole dao je sledeći rezultat o broju opravdanih izostanaka iz škole
u drugom polugodištu: 0,1,3,0,4,4,9,4,0,2,2,4,8,5,5,16,10,4.
a) Ispitajte na osnovu odnosa između srednjih vrednosti asimetričnost rasporeda. Prokomentarisati dobijeni
rezultat.
b) Ocenite uz rizik od 0,02 učešće učenika u celoj školi koji nemaju izostanaka, ako osnovni skup ima približno
normalan raspored, a stopa izbora je 0,08.
6. Proizvodnja tri poljoprivredne kulture na jednom posedu u 2005. godini data je u sledećoj tabeli:
Vrednost proizvodnje
u mil. din. (2005)
Pšenica
Kukuruz
Ječam
8
5
2
Individualni indeksi 2009
(2005=100)
Količina
Cena
Vrednost
160
170
272
120
115
138
135
200
270
a) Izračunajte ponderisane agregatne indekse cena, količina i vrednosti proizvodnje za 2009. godinu po metodu
agregata, koristeći ponder iz baznog perioda. Objasnite rezultate.
b) Koja poljoprivredna kultura ima najveći relativni, a koja apsolutni rast vrednosti u posmatranom preiodu?
7. Težina pakovanja jednog preparata za negu kose „Nivea“ ima približno normalan raspored sa nepoznatom
aritmetičkom sredinom i varijansom. Prost slučajan uzorak veličine 25 proizvoda dao je aritmetičku sredinu 250
grama, a 95% interval poverenja ima širinu 3 grama. Zaključujemo da varijansa uzorka / skupa (zaokružiti tačan
odgovor) iznosi približno _______________ .
51
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
8. Igra se sastoji u bacanju 2 kocke, pri čemu pratimo „zbir na dve kocke“ . Postupak bacanja kocke je ponovljen
300 puta i dobijeni su sledeći rezultati:
Pad parnog broja
0
1
2
Broj eksperimenata
120
80
100
Ispitati da li empirijski raspored ima karakteristike očekivanog rasporeda.
9. U cilju ispitivanja uticaja kretanja cene jednog proizvoda i troškova reklamiranja na tražnju, ocenjena je sledeća
linearna zavisnost tražnje (u 000 din) na osnovu uzorka od 10 opština:
Koeficijent
t
p-vrednost
110,2
1,89
/
Cena (u 00 din)
-1,3
-10,5
/
Troškovi reklame (u din)
11,3
4,5
/
Konstanta
Modelom je objašnjeno 96% varijacija tražnje. Sa pouzdanošću od 0,95 ocenite za koliko će se u proseku promeniti
tražnja pri povećanju cene od 50 dinara uz nepromenjene troškove reklame.
10. Broj sati koje studenti provode u sportskim centrima ima normalnu raspodelu (prosečni boravak je 80 sati
godišnje, a standardna devijacija je 15 sati). U prostom slučajnom uzorku iz ovog skupa dobijene su sledeće
vrednosti (broj sati boravka u centru):
66 80 95 100 70 98 111 86 107 81 78 68 30 25
55 60 74 82 90 112 140 45 76 32 88 92 54 67
a) sa nivoom pouzdanosti od 0,99 utvrdite da li je uzorak reprezentativan pri oceni učešća studenata koji godišnje
provedu više od 70 sati u sportskom centru
b) odredite relativnu meru disperzije ovog rasporeda u skupu i u uzorku
11. Na osnovu kvartalnih podataka o prodaji jednog artikla (u hiljadama dinara) u periodu 2007-2009 godina,
ocenjena je sledeća funkcija trenda: yˆ t 79 ,2 9,75 t i izračunati su specifični sezonski indeksi u 2007: III=1,5,
IV=0,631, u 2008: I=0,666, II=1,049, III=1,315, IV=0,952, u 2009: I=0,8, II=1,23. Prognozirajte prosečnu vrednost
prodaje u III kvartalu 2010 uzimajući u obzir uticaj sezone (sezonski ritam je stabilan).
12. Trgovinsko preduzeće „Moda“ ima u gradu 6 prodavnica. Ukupan broj kupaca je u njima raspoređen na sledeći
način: A:25%, B:20%, C:20%, D:15%, E:10%, F:10%. Ako je broj kupaca u periodu od 18-20h, jednog izabranog
radnog dana po prodavnicama iznosio: 50, 35, 25, 15, 10, 5, ispitajte (sa rizikom od 0,05) da li se raspodela kupaca
u tom periodu značajno razlikuje od njihove uobičajene strukture.
13. Verovatnoća da će proizvod biti oštećen prilikom transporta je 2%. Koliko treba da bude veličina slučajnog
uzorka, pa da sa verovatnoćom od 0,95 u njemu bude bar 90% neoštećenih proizvoda?
52
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
53
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
54
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
55
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
56
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
57
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
58
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
59
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
60
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
61
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
62
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
63
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
64
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
65
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
66
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
67
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
68
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
69
Obrazovni centar „Smart Basic“, Lomina 5, tel: 32-82-662
70
Download

I. Uvod - Škola stranih jezika Smart Basic