Kapitola2
Základní statistické pojmy
Dříve než se pustíme do výkladu vybraných statistických postupů a metod, je třeba se seznámit se základními statistickými pojmy, které jsou k porozumění nezbytné.
Začněme statistickou jednotkou, která je základním prvkem statistického pozorování. Statistickou jednotkou mohou být např. osoby, zvířata, věci, organizace či události. U statistických jednotek jsou sledovány různé vlastnosti, které nazýváme statistickými proměnnými. Pokud je statistickou jednotkou např. osoba, pak zkoumanými proměnnými mohou být její výška, váha, pohlaví, rodinný stav či věk. Statistické jednotky se ve svých znacích (vlastnostech) zpravidla liší, např. lidé mají různou výšku, váhu nebo věk.
Statistické proměnné se dále dělí podle určitých kritérií. Jedním z nich může být to, jakým způsobem lze vyjádřit obměny proměnné, zda číselně (např. výše mzdy) nebo slovně (např. rodinný stav). Správné členění statistických proměnných je velmi důležité s ohledem na vhodně zvolený statistický postup a výpočetní metody. Základní schéma rozčlenění statistických proměnných je zobrazeno na následujícím obrázku 1. Dále v textu bude toto třídění popsáno podrobněji.
Obr. 1. Schéma třídění statistických proměnných podle vztahu mezi hodnotami
Je-li možné vyjádřit obměny proměnné číselně, hovoříme o kvantitativní proměnné. S kvantitativními proměnnými nebo také číselnými proměnnými má smysl provádět aritmetické operace. Příklady kvantitativních proměnných mohou být výška, váha, spotřeba vody. Kvantitativní proměnné se dále dělí na spojité a nespojité. Nespojitá, resp. diskrétní proměnná může nabývat pouze celočíselných hodnot (např. počet dopravních nehod během dne, počet dětí v rodině). Naproti tomu spojitá proměnná může nabývat v rámci určitého intervalu libovolných hodnot (např. doba čekání ve frontě u pokladny, výška, váha).
Pokud je obměna proměnné vyjádřena slovně, pak se jedná o kvalitativní, resp. kategoriální proměnnou. S kvalitativními proměnnými se zpravidla neprovádí matematické operace. Příklady kvalitativních proměnných jsou např. pohlaví, obor studia, místo trvalého bydliště.
Poznámka
Při zápisu kategoriálních proměnných do výpočetního softwaru v počítači se zpravidla používají kódy, číselné nebo písmenné.
Kvalitativní proměnné dále dělíme na ordinální a nominální. Pokud je statistická proměnná vyjádřena slovně a o dvou hodnotách proměnné můžeme říci pouze to, zda se mezi sebou liší nebo ne, pak se jedná o nominální proměnnou. Hodnoty proměnné není možné uspořádat vzestupně ani sestupně. Příkladem těchto proměnných jsou pohlaví, rodinný stav. Ordinální nebo také pořadové proměnné, jak už z názvu vyplývá, je možné seřadit od nejnižší úrovně po nejvyšší. O hodnotách ordinálních proměnných můžeme tedy říci, zda je jedna hodnota větší než druhá, ale není možné stanovit o kolik nebo kolikrát je větší. Příkladem může být nejvyšší dosažené vzdělání, hodnocení ve škole.
Ve statistice se také můžeme setkat s označením alternativní či dichotomická proměnná. Jedná se o specifickou variantu kategoriální proměnné, která nabývá pouze dvou hodnot. Příkladem může být pohlaví (muž – žena), výsledek přijímacích zkoušek (přijat – nepřijat). Kategoriální proměnnou, která může nabývat více než dvou hodnot, označujeme jako množnou proměnnou.
Dalším pojmem, který potřebujeme, aby zde zazněl, je statistický soubor. Statistický soubor je tvořený statistickými jednotkami, u kterých sledujeme stejné statistické proměnné. Příkladem statistického souboru mohou být děti narozené v loňském roce na území České republiky a proměnné, které u nich sledujeme, jsou pohlaví, porodní délka nebo váha. Pokud zkoumáme u statistického souboru pouze jednu proměnnou, pak hovoříme o jednorozměrném souboru. Jestliže nás u jednotek souboru zajímají dvě a více proměnných, pak se jedná o dvourozměrný, resp. vícerozměrný soubor. Ovšem statistické soubory se ještě dělí na základní a výběrový soubor. Pro základní statistický soubor se používá také označení populace a jedná se o soubor všech statistických jednotek, u kterých nás zajímá zkoumaná statistická proměnná. Rozsah takového základního souboru bývá zpravidla veliký, proto se z úsporných důvodů provádí výběrové šetření. Při výběrovém šetření jsou ze základního souboru vybrány jen některé jednotky a u nich jsou pak zkoumány statistické proměnné. Těmto vybraným jednotkám říkáme výběrový soubor a na základě výsledků z něj získaných provádíme úsudky o celém základním souboru.
Správné vymezení statistického souboru, volba jednotek i zkoumaných proměnných jsou klíčové pro výsledky našeho zkoumání. Všechny tyto pojmy by měly být na začátku našeho zkoumání přesně definovány.
Souhrn
Statistická jednotka je základním prvkem statistického pozorování. U statistických jednotek jsou sledovány různé vlastnosti, které nazýváme statistickými proměnnými. Statistický soubor je tvořený statistickými jednotkami, u kterých sledujeme stejné statistické proměnné. Pokud je obměna proměnné vyjádřena slovně, pak se jedná o kvalitativní, resp. kategoriální proměnnou. Je-li možné vyjádřit obměny proměnné číselně, hovoříme o kvantitativní proměnné.
