4. Třídění statistických dat – pořádek v datech
Základní členění statistických řad:
řada časová,
řada prostorová,
řada věcná
věcná slovní řada,
věcná číselná řada.
Základem statistického třídění je uspořádání hodnot jednoho statistického
znaku.
Z tohoto pohledu rozeznáváme:
x1 , x2 ,..., xi ,...xn ,
řada neuspořádaná (původní naměřená řada)
řada uspořádaná (variační) podle velikosti,
x(1) , x( 2) ,..., x(i ) ,..., x( n)
řada tříděná,
- jednoduché (prosté) třídění,
- skupinové (intervalové) třídění.
Index i souvisí s pořadím zjišťování, index (i) souvisí s velikostí hodnot,
přičemž x(1) x( 2) ,... x(i ) ...x( n ) a x(1) xmin , x( n) xmax .
Výsledkem všech druhů třídění je řada rozdělení četností v tabulkové nebo
grafické podobě.
Prosté (jednoduché) třídění je třídění prováděné podle každé hodnoty (obměny)
znaku samostatně.
Výhodné je v situaci, kdy statistický znak dosahuje jen omezeného počtu obměn.
Prosté třídění prezentujeme:
v tabulkové podobě — tabulky rozdělení četností,
v grafické podobě — sloupcové a výsečové grafy, polygony rozdělení
četností.
Skupinové (intervalové) třídění je rozdělení statistických jednotek podle hodnot
(obměn) statistického znaku shrnutých do společné skupiny (třídy, intervalu)
tak, aby co nejlépe vynikli charakteristické vlastnosti zkoumaných jevů.
Skupinové třídění prezentujeme:
v tabulkové podobě — tabulky rozdělení četností,
v grafické podobě — histogramy a výsečové grafy rozdělení četností.
1
4.1.
Jednoduché (prosté) třídění
Jednoduché třídění je typické pro:
třídění kvalitativních (slovních) znaků,
kvantitativních diskrétních (nespojitých) číselných znaků s malou
obměnou hodnot statistického znaku.
4.1.1. Třídění kvalitativních (slovních) znaků
Třídění kvalitativních (slovních) znaků se uskutečňuje podle obměn statistického
znaku
Na třídění požíváme třídící tabulku (5.1), která má standardní strukturu.
Pořadí obměn volíme prvotně podle následujících možností:
– obměny je možné seřadit podle významu (např. podle úrovně školy)
– obměny je možné vystupňovat (např. hodnocení studentů)
– obměny seřadíme podle abecedy,
– obměny seřadíme náhodně (barvy aut),
– obměny seřadíme náhodně podle subjektivního názoru řešitele.
Obměny můžeme seřadit druhotně podle absolutní početnosti sestupně anebo
vzestupně
Jednotlivým obměnám přiřadíme:
– příslušný počet výskytů v souboru — absolutní četnost ni
– podíl na celkovém rozsahu souboru — relativní četnost pi
– součtový počet od prvé po poslední třídu — kumulativní abs. četnost kni
– součtový podíl od prvé po poslední třídu — kumulativní rel. četnost kpi
Tabulka se doplňuje součtovým řádkem, který slouží na křížovou kontrolu
správnosti třídění.
Příklad na jednoduché třídění 155 studentů středních škol.
Tab. 4.1
Třídění studentů podle typu střední školy
Třída
k
Třídící
znak
(pořadové
číslo)
(typ střední
školy)
1
2
3
4
5
SUMA
OU
OUM
SŠ
G
RG
X
Absolutní
četnost
ni
(počet
studentů)
36
29
29
30
31
155
Relativní
četnost
pi [%]
(podíl
studentů)
23,2
18,7
18,7
19,4
20,0
100,0
2
Kumulativní
četnost
kni
(Součtový počet
studentů)
36
65
94
124
155
X
Kumulativní
relativní četnost
kpi [%]
(Součtový podíl
studentů)
23,2
41,9
60,6
80,0
100,0
X
Tabulková forma jednoduchého třídění kvalitativních (slovních) znaků se doplňuje
většinou:
– sloupcovým grafem1 absolutních početností anebo,
– kruhovým2 výsečovým grafem relativních četností vyjádřených v %.
Jednotlivé sloupce nebo výseče je vhodné doplnit konkrétní hodnotou.
Počet absolventů
Sloupcový graf početností absolventů
středních škol
36
40
30
29
29
30
31
OUM
SŠ
G
RG
20
10
0
OU
Typ střední školy
Obr. 4.1. Počty absolventů středních škol podle typu střední školy
Výsečový graf podielu absolventů
středních škol
20%
23%
OU
OUM
SŠ
19%
19%
G
RG
19%
Obr. 4.2. Podíl absolventů středních škol podle typu střední školy
1
Sloupcové grafy poskytují jednoduchý a srozumitelný způsob zobrazování nominálních a ordinálních dat, které chceme
zařadit do tříd. Četnost třídy se zobrazuje jako plocha sloupce sestrojeného nad příslušným intervalem (třídou). Třídění může
být podle jednoho znaku (kritéria) anebo podle dvou znaků (kritérií).
2
2. Kruhový výsečový diagram rozdělí kruh na více částí podle počtu tříd. Četnost třídy je vyjádřená velikostí plochy kruhového
výseku.
3
4.1.2. Třídění kvantitativních (číselných) diskrétních (nespojitých) znaků
V případě, že má kvantitativní (číselný) diskrétní (nespojitý) znak málo obměn
(obecně k) používá se jednoduché třídění.
Třídíme podle každé hodnoty znaku xi, přičemž hodnoty znaku v tabulce
uvedeme ve vzestupném pořadí.
Obměny můžeme seřadit stejně jako u slovních znaků druhotně podle absolutní
početnosti sestupně anebo vzestupně
Ke každé hodnotě xi přiřadíme příslušný počet výskytů v souboru — četnost ni.
Tab. 4.2
Třídění rodin podle počtu dětí
Třída
p.č.
k
1
2
3
4
5
SUMA
Třídící
znak
xi
(počet dětí)
1
2
3
4
5 a více
X
Absolutní
četnost
ni
(počet rodin)
460
404
101
30
5
1000
Relativní
četnost
pi [%]
(podíl rodin)
46,0
40,4
10,1
3,0
0,5
100,0
Kumulativní
četnost
kni
(Součtový počet
rodin)
460
864
965
995
1000
X
Kumulativní
relativní četnost
kpi [%]
(Součtový podíl
rodin)
46,0
86,4
96,5
99,5
100,0
X
Tabulková forma jednoduchého třídění kvalitativních (slovních) znaků se doplňuje
většinou:
– sloupcovým grafem3 absolutních početností anebo,
– kruhovým4 výsečovým grafem relativních četností vyjádřených v %.
Grafy mohou být i v podobě nepravých trojrozměrných grafů (pseudo 3G).
Jednotlivé sloupce nebo výseče je vhodné doplnit konkrétní hodnotou.
3
Sloupcové grafy poskytují jednoduchý a srozumitelný způsob zobrazování nominálních a ordinálních dat, které chceme
zařadit do tříd. Četnost třídy se zobrazuje jako plocha sloupce sestrojeného nad příslušným intervalem (třídou). Třídění může
být podle jednoho znaku (kritéria) anebo podle dvou znaků (kritérií).
4
2. Kruhový výsečový diagram rozdělí kruh na více částí podle počtu tříd. Četnost třídy je vyjádřená velikostí plochy kruhového
výseku.
4
Sloupcový graf počtu detí ve zkoumané
skupině 1000 rodin
P
o
č
e
t
460
r 500
o 400
d
i 300
n
200
404
101
30
100
5
0
1
2
3
4
5 a viac
Počet dětí v rodině
Obr. 4.3. Počty rodin podle počtu dětí v rodině
Výsečový pseudo 3G graf počtu detí ve
zkoumané skupině 1000 rodin
101
30 5
460
404
Obr. 4.4. Podíl rodin podle počtu dětí v rodině
Kruhový graf je potřebné doplnit vysvětlující legendou.
5
Všeobecný postup tvorby tabulkové formy jednoduchého (prostého) třídění je
uvedený v následující přehledné tabulce.
Třída
p.č.
Třídící Absolutní
znak
četnost
xi
ni
1.
2.
x1
x2
n1
n2
:
:
:
i
xi
ni
:
:
Relativní
četnost
pi
p1
Kumulativní
Kumulativní
absolutní četnost relativní četnost
kni
kpi
kn1
kp1
p2
kn2
kp2
:
:
:
ni
n
pi
:
i
kni
i
nj
kpi
j 1
:
:
:
k
xk
k
Součet
k
k
nj = n
kpk
pj
j 1
j 1


1
k
ni = n

knk
pk
nk
pj
j 1
i 1
pi
1
i 1
Absolutní četnost ni je číslo, které určuje kolik jednotek souboru má určitou hodnotu
k
přičemž platí
ni
n,
i 1
Relativní četnost pi je podíl absolutní četnosti ni a rozsahu souboru n
ni
n
pi
k
přičemž
platí
pi
1,
anebo
alternativně
v procentech
i 1
k
100 pi
100 (%) ,
i 1
Kumulativní (součtová) absolutní četnost kni udává postupný součet četností od
i
1. třídy až po danou třídu — kni
nj .
j 1
Kumulativní (součtová) relativní četnost kpi udává postupný podíl četností od 1.
i
třídy až po danou třídu — kpi
p j , alternativně opět v %.
j 1
6
4.1.3. Skupinové (intervalové) třídění
Skupinové (intervalové) třídění používáme v případě, že číselné znaky (spojité i
nespojité) vykazují velké množství obměn.
Skupinové třídění spočívá ve vytvoření k tříd (skupin, intervalů) ve variačním rozpětí
R souboru od minimální xi, min až po maximální ximax, hodnotu znaku.
Původní data se zařazují do těchto tříd (skupin, intervalů) a zjišťují se početnosti
jednotlivých tříd, čím se vytvoří rozdělení četností.
Vzniká tak tabulka četností podle základní úpravy na následujícím obrázku.
Třída
k
Hranice třídy
dolní
xd
horní
xh
Střed třídy
(třídní znak)
xi
Absolutní
četnost
Relativní
četnost
ni
pi
Kumulativní
četnost
absolutní relativní
kni
kpi
Tabulky četností mohou mít i jinou úpravu při zachování uvedených hodnot. Příklady
úprav jsou uvedeny v následujících příkladech.
Zásady platné pro skupinové třídění:
třídy mají vždy konstantní šířku,
počet tříd k musí být v rozmezí 6 až 15, počet intervalů nemá být ani příliš
malý (vede k hrubému, zjednodušenému pohledu), ani příliš velký (dělá třídění
nepřehledným),
všechny obměny znaku, které jsme zařadili do příslušné třídy nahrazujeme
tzv. reprezentativní hodnotou, za kterou se většinou volí střed intervalu xi,
tzv. třídní znak,
šířku h, dolní hranici xd, horní hranici xh a středy tříd xi volíme s ohledem na
maximální přehlednost,
hranice tříd musí mít nesporné (jednoznačné) vymezení,
Vymezení
celočíselný znak
hranic tříd
do 100
do 100
<15
až 20)
101—200
100—200 NEVHODNÉ
<20 až 25)
201—…..
200—…..
<25 až 30)
<30 až 35)
spojitý znak
Hranice třídy
<35 až 40)
dolní horní
<40 až 45)
<15
20)

<20
25)
<25
30)
<30
35)
<35
40)
<40
45)

7
Tvorba tabulky četností se skládá z těchto kroků:
1. Určete počet tříd k, které bude tabulka četností obsahovat. Počet tříd volíme
intuitivně v rozpětí 6-15 anebo vypočítáme podle Sturgersovho pravidla vzorce k = 1 + 3,322 log n, kde vypočítané číslo zaokrouhlujeme nahoru.
2. Vypočítejte variační rozpětí Rv jako rozdíl mezi největší a nejmenší hodnotou
variační řady Rv = xmax - xmin.
3. Vypočítejte šířku třídy h dělením variačního rozpětí počtem tříd h = Rv / k.
Výsledek se zaokrouhlí směrem nahoru tak, aby se dala do tabulky zařadit každá
hodnota znaku.
4. Vypočítáme středy tříd xi (i =1, 2, …, k).
5. Přiřaďte dolní a horní hranice jednotlivým třídám. Dolní hranice první třídy xd
bude rovná xmin. Horní hranice poslední třídy xh bude rovná xmax. Dbáme na
„nesporné vymezení“ hranic jednotlivých tříd.
6. Zařaďte jednotlivé hodnoty statistického znaku do příslušné třídy např.
s využitím čárkovací metody, čím dostanete absolutní četnosti jednotlivých
tříd ni.
7. Vypočítejte relativní četnosti pi a kumulativní četnosti absolutní kni
relativní kpi a zapište je do dalších sloupců.
a
Absolutní četnost ni u skupinového (intervalového) třídění je číslo, které určuje kolik
jednotek souboru má hodnotu, která padá do stanoveného rozpětí příslušné třídy,
k
přičemž platí
ni
n
i 1
Relativní četnost pi u skupinového (intervalového) třídění je stejně jako u
jednoduchého třídění podíl absolutní četnosti ni a rozsahu souboru n. pi = ni / n.
k
Opět platí
k
pi
1 , alternativně v procentech
100 pi
100 (%) ,;
i 1
i 1
Kumulativní četnost (absolutní, relativní) kni u skupinového (intervalového) třídění
dává informaci, kolik jednotek souboru resp. jaká poměrná část souboru má hodnotu
znaku menší nebo rovnou jako je střed třídy (třídní znak).
i
kni
i
n j , kpi
j 1
pj
j 1
k
Úhrn hodnot znaku u skupinového třídění lze jen odhadovat jako
xi ni ,
i 1
kde xi jsou středy tříd.
8
Příklad skupinového třídění:
Třídit soubor 80 tříčlenných zaměstnaneckých domácností podle výše měsíčních
příjmů v tis. Kč.
Neuspořádaná řada:
Uspořádaná (variační) řada:
x1 33,5, x2 24,7,....., x80 27,7
x(1) 15,9, x( 2) 17,3,....., x(80 ) 47,1
xmin = 15,9, xmax = 47,1
Počet tříd stanovený intuitivně
k = 6.
Rozpětí třídy
h = (47,1 - 15,9)/6 = 5,2, zaokrouhleně 5.
Tab. 4.3
Rozdělení domácností podle příjmových skupin
Střed
Počet
Podíl
Součtová četnost
Třída Hranice měsíčních
příjmové domácností domácností
domácností
příjmů [Čk]
hranice
[%]
absolutní relativní
[Čk]
[%]
k
xd - xh
xi
ni
pi
kni
kpi
1.
<15 až 20)
17,5
12
15
12
15,0
2.
<20 až 25)
22,5
32
40
44
55,0
3.
<25 až 30)
27,5
20
25
64
80,0
4.
<30 až 35)
32,5
8
10
72
90,0
5.
<35 až 40)
37,5
6
8
78
98,0
6.
<40 až 45)
42,5
2
2
80
100,0




80
100
9
Tabulková forma skupinového třídění se doplňuje:
histogramem nebo polygonem absolutních četností,
výsečovým grafem relativních četností vyjádřených v %,
polygonem absolutních nebo relativních početností
Histogram skupinového (intervalového) třídění je sloupcový graf tvořený
pravidelnými rovnoběžníky, kterých obsah (i nulový) je úměrný úhrnu hodnot znaku
příslušné třídy. Základy sloupců na ose x mají délku zvolených intervalů (šířky třídy)
h, pro všechny stejnou a příslušné výšky mají velikost odpovídající třídní četnosti.
Polygon absolutních četností je možné odvodit z histogramu.
Spojuje třídní znaky jednotlivých tříd (intervalů).
Polygon začíná a končí na vodorovné souřadnicové ose ve středu sousedních
prázdných tříd.
Polygon kumulativních absolutních nebo relativních početností začíná na ose x
u dolní hranice prvé třídy a pokračuje jako spojnice horních hranic jednotlivých tříd.
Relativní součtový počet domácností kpi
Grafy skupinového rozdělení četností (příklady)
100
32
Počet domácností
24
16
8
15
20 25 30 35 40
75
50
25
15
45
20 25 30 35 40
45
Příjmové rozpětí rodin [Čk]
Příjmové rozpětí rodin [Čk]
Obr. 4.5. Počet domácností v jednotlivých příjmových intervalech
10
Různé typické tvary histogramů:
symetrické
modální
extrémně
pravostranné
tvar “U”
levostranně
nesouměrné
rovnoměrné
dvouvrcholové
11
4.1.4. Řešení extrémů v datech – otevřená třída
Při statistickém zjišťování se můžeme často setkat s případy, že některá (některé)
hodnota (hodnoty) zkoumaného statistického znaku se vymyká ze zjištěných
hodnot směrem dolu anebo nahoru - extrém.
Příklad
Ve zkoumaném souboru 1000 mužů se vyskytl jeden, který měl hmotnost 42 kg a
jeden, který měl hmotnost 200 kg, přičemž další bližší hodnoty hmotnosti byly 65 kg
a 110 kg.
Uspořádaná
x(1) 42,0, x( 2 )
řada
hmotnosti
statistického
65,0,....., x 999 110,0, x 1000 200
vzorku
1000
mužů:
Je zřejmé, že tyto hodnoty v podobě lokálních extrémů by zkreslili všechny další
výpočty.
Tato situace se řeší tak, že při výpočtech počtu tříd k a rozpětí třídy h se tyto
hodnoty zanedbají a v tabulce rozdělení četnosti se neuvede dolní hranice xd první
třídy a horní hranice xh poslední třídy.
Forma zápisu takto upravené tabulky může být různorodá, ale vždy nám napovídá
o tom, že v zkoumaném statistickém souboru se takový extrém vyskytl
Vymezení
hranic tříd
do 20)
<20 až 25)
<25 až 30)
<30 až 35)
<35 až 40)
<40 a více

Hranice třídy
dolní
horní
do 20)
<20
25)
<25
30)
<30
35)
<35
40)
<40 a více

Vymezení
hranic tříd
- 20)
<20 až 25)
<25 až 30)
<30 až 35)
<35 až 40)
<40 
Hranice třídy
dolní
horní
20
21
25
26
30
31
35
36
40
41

Otevřenou dolní a horní třídu můžeme použít i samostatně, pokud se extrém
vyskytl jenom na jedné straně.
Otevřenou třídu můžeme použít i v případě, že se extrém nevyskytl, ale chceme
zdůraznit, že se ve spojitém prostředí mohou při zkoumání rozsáhlejšího souboru
vyskytnout hodnoty nižší nebo větší než byly zjištěné.
V tomto případě je, ale problematické správné stanovení dolní hranice 1. třídy xd
resp. horní hranice poslední třídy xd.
12
4.2. Třídění podle více statistických znaků
Klasifikace třídění podle více znaků:
Hierarchické třídění — třídění podle libovolného počtu znaků, prováděné
v libovolném pořadí. Uvnitř tříd jednoho znaku jsou vytvářeny třídy dalšího
(podřízeného znaku).
Typickým výsledkem třídění je hierarchický strom — dendrogram (evoluční
strom).
Např. studenti jsou nejprve tříděni podle počtu absolvovaných zkušebních termínů a
uvnitř každého termínu jsou tříděni podle dosažené klasifikace, ale možno třídit i při
opačném pořadí tříděných znaků.
Kombinační třídění — současné třídění podle dvou znaků.
Typickým výsledkem třídění jsou kombinační tabulky.
Podle charakteru tříděných znaků rozlišujeme tyto kombinační tabulky:
korelační tabulka
—
třídění podle dvou číselných znaků,
kontingenční tabulka —
třídění podle dvou slovních znaků,
asociační tabulka
—
třídění podle dvou alternativních slovních
znaků.
Kombinační třídění se používá zejména při zkoumání závislostí mezi dvěma
znaky.
Např. respondenti jsou současně tříděni podle stupně dosaženého vzdělání a jimi
preferované televizní stanice.
Kombinační třídění můžeme použít např. při zkoumání závislosti preferované
televizní stanice na vzdělání respondentů.
13
4.2.1. Třídění dvou číselných (kvantitativních) znaků – korelační tabulka
Při malém počtu statistických jednotek je základem třídění číselných
(kvantitativních) znaků pracovní (základní) tabulka, do které zaznamenáváme
hodnoty statistických znaků pro všechny statistické jednotky od i = 1 až po i = n.
Statistická jednotka
Hodnoty statistických znaků
Znak xi
Znak yi
1
x1
y1
2
x2
y2
.
.
.
n
xn
yn
V této podobě jde jen o záznam výsledků zjišťování za n členný statistický soubor.
Při velkém rozsahu dat je pracovní tabulka nepraktická a nepřehledná.
Výhodnější je v této situaci tzv. korelační tabulka, v které jsou uvedeny četnosti
kombinací obměn hodnot obou statistických znaků.
Pokud jde o nezávislé statistické znaky je možné proměnné x a y v tabulce i grafu
zaměnit.
Pokud je možné identifikovat jeden statistický znak jako nezávislý a druhý jako
závislý použijeme obměny nezávislého znaku jako záhlaví sloupců.
Znak xi
Znak yi
ni
y1
y2
…….
yl
x1
n11
n12
…….
n1l
nx1
x2
n12
n22
…….
n2l
nx2
x3
n13
n23
…….
n3l
nx3
.
.
.
…….
.
.
ny1
ny2
…….
.
n
V případě, že je počet obměn některého číselného (kvantitativního) statistického
znaku velký, musí být konkrétní obměny nahrazeny skupinami (intervaly).
Konstrukce intervalů je identická jako u skupinového třídění (4.1.3)
14
Příklad: Za 10 rodin máme údaje o počtu dětí v rodině (proměnná x) a velikosti bytu
(proměnná y) vyjádřené počtem místností.
Pracovní (základní) tabulka
Rodina
Počet dětí v rodině
(proměnná x)
Počet místností
(proměnná y)
1
1
2
1
3
0
4
2
5
0
6
1
7
2
8
0
9
3
10
2
2
3
3
3
1
2
3
2
4
4
Korelační tabulka absolutních početností
Počet dětí
(proměnná x)
0
1
2
3
Celkem
Počet rodin podle počtu místností (proměnná
y)
1
2
3
4
1
1
1
2
1
2
1
1
1
3
4
2
Celkem
3
3
3
1
10
Korelační tabulka relativních početností (podíl v [%])
Počet dětí
(proměnná x)
0
1
2
3
Celkem
Podíl rodin podle počtu místností [%]
(proměnná y)
1
2
3
4
10
10
10
20
10
20
10
10
10
30
40
20
Celkem
30
30
30
10
100
Sdružená korelační tabulka absolutních a relativních početností (podíl v [%])
Počet dětí
(proměnná x)
0
1
2
3
Celkem
1
1/10
1/10
Počet/podíl [%] rodin
podle počtu místností
(proměnná y)
2
3
1/10
1/10
2/20
1/10
2/20
3/30
4/40
15
Celkem
4
1/10
1/10
2/20
3/30
3/30
3/30
1/10
10/100
Prostředkem grafické prezentace úloh o měření závislostí číselných znaků je
korelační diagram.
Základním korelačním diagramem je korelační (bodový) diagram.
Body v grafu představují jednotlivé statistické jednotky.
Každému bodu (statistické jednotce) odpovídají hodnoty na osách (x, y):
prvá proměnná určuje souřadnici na svislé ose (y) – konkrétní obměna prvého
statistického znaku,
druhá proměnná určuje souřadnici na vodorovné ose (x) – konkrétní obměna
druhého statistického znaku,
Obměny nezávislého statistického znaku patří na osu x.
Obměny závislého statistického znaku patří na osu y.
Pokud jde o nezávislé statistické znaky je možné proměnné x a y v grafu zaměnit.
Počet letokruhů
Příklad: U nařezaných prken můžeme zkoumat závislost jejich síly a počtu letokruhů.
K interpretaci údajů může sloužit např. bodový korelační diagram.
12
10
8
6
4
2
0
1,0
1,2
1,4
1,6
1,8
2,0
2,2
2,4
2,6
Síla prkna [cm]
Obr. 4.6 Příklad bodového korelačního diagramu
Bodový korelační znak má nevýhodu v tom, že statistické jednotky se stejnými
obměnami statistických znaků se překrývají. V tomto případě je výhodnější použít
pseudo 3-D graf, kde jsou na osách x a z obměny statistických znaků a na ose y
počty statistických jednotek. Příklad je uvedený u třídění dvou slovních znaků (4.2.2)
16
4.2.2. Třídění dvou slovních (kvalitativních) znaků – kontingenční tabulka
Na třídění statistických jednotek podle dvou statistických slovních (kvalitativních)
znaků se používá stejný postup jako u číselných znaků, s výjimkou intervalové
konstrukce obměn statistických znaků.
Pořadí obměn statistických znaků v záhlaví sloupců a řádku se řídí stejnými
zásadami jako u jednoduchého třídění (4.1.1)
Tabulka třídění statistických jednotek podle dvou statistických slovních
(kvalitativních) znaků se nazývá kontingenční tabulka. Je základem na řešení
kontingenční úlohy a kontingenční závislosti.
Příklad:
Tab.4.4
Třídění domů v obci XY za posledních 50 let podle
druhu zabezpečovacího zařízení a počtu vykradení
Počet vykradených domů podle počtu vykradení
Typ zabezpečení domu
0x
1x
2x
3x
4x
5x
Celkem domů
Bez zabezpečení
94
25
5
2
2
1
129
Bezpečnostní zámek
30
5
3
1
1
1
41
Bezpečnostní dveře
10
3
2
0
0
0
15
Bezpečnostní okna a dveře
4
1
1
0
0
0
6
Kamerový systém
4
1
0
0
0
0
5
Komplexní zabezpečení
Celkem domů
4
0
0
0
0
0
4
146
35
11
3
3
2
200
Na grafické zobrazení kontingenční tabulky používáme nejčastěji pseudo 3-D graf,
kde jsou na osách x a z obměny statistických znaků a na ose y počty statistických
jednotek.
Obr. 4.7 Počet domov v obci XY za posledných 50 rokov rozdelených podľa typu zabezpečenia
a počtu vykradnutí domu
17
4.2.3. Třídění dvou slovních (kvalitativních) znaků – asociační tabulka
Speciálním případem třídění podle dvou statistických znaků je asociační tabulka,
kterou používáme v případě, že oba statistické znaky dosahují jen dvou obměn alternativ.
Příklad:
Soubor pracovníků podniku „B“, rok 2001, n = 450
alternativní znaky: A … očkování, B … onemocnění
Tab.4.5
Třídění pracovníků podle účinnosti očkování
Onemocnění (B)
Očkování (A)
ano
ne
ano
12
53
65
ne
323
62
385
4.2.4. Třídění podle tří a více statistických znaků
Třídění podle tří a více statistických znaků není předmětem předmětu.
18
335
115
450
Download

Úvod do studia statistiky