Náhodné veličiny

Všechny proměnné, které měříme, jsou náhodnými veličinami (Lepš, 1996, s. 18 -20).

Veličinu chápeme jako vyjádření výsledku měření výskytu nějaké charakteristiky (označované jako znak) nějakého jevu vázaného na objekt mého výzkumu. Problémem je, že všechna měření všech znaků charakteristických pro všechny jevy jsou vždy ovlivněny spoustou faktorů, které měřit nejsem schopen, ani při největší snaze. Tyto faktory mají za následek, že veličina pak ze své podstaty nemůže být nikdy změřena absolutně správně. Za různých konstelací neměřitelných a nesledovatelných podmínek pak může mé měření dopadnout různě (viz Obr. 5-6, Lepš, 1996). To je důvod, proč se měřené veličiny označují jako veličiny náhodné.

Pravděpodobnost

Z výše uvedeného plyne, že to, co konkrétně změřím, je pouze konkrétní realizace (daná v podstatě náhodou) této náhodně měřené veličiny. My jsme si toho vědomi a tak víme, že to, co jsme aktuálně změřili, je pouhou jednou variantou z obvykle nekonečného množství teoreticky změřitelných hodnot – měření mohu opakovat tolikrát, kolik my zbývá sil, a pokaždé změřím něco jiného. Předpokládám ale, že různé konkrétní hodnoty mohu změřit s různou pravděpodobností. Jinak řečeno, určité hodnoty mohou být naměřeny častěji než hodnoty jiné.
Každá náhodná veličina tak má své rozdělení pravděpodobností měření konkrétních hodnot. Každá konkrétní hodnota je tak charakteristická pravděpodobností, že bude její hodnota změřena. Tuto skutečnost je pak teoreticky možné vyjádřit funkcí hustoty pravděpodobnosti, jež se často vyjadřuje grafem, který, vulgárně řečeno, vypadá jako funkční spojité vyjádření histogramu – na ose x jsou jednotlivé konkrétní hodnoty náhodné veličiny a na ose y je pak míra pravděpodobnosti výskytu takového hodnoty (vyjádřená v hodnotě funkce hustoty pravděpodobnosti). Plocha pod touto křivkou se pak rovná 100% pravděpodobnosti změření všech hodnot proměnné.

Distribuční funkce

Dalším typem vyjádření pravděpodobnosti výskytu hodnoty náhodné veličiny je distribuční funkce pro libovolnou měřenou hodnotu, která udává pravděpodobnost, že reálně měřená hodnota bude menší než hodnota libovolně stanovená. Hustota pravděpodobnosti je derivací distribuční funkce.

Přesnost odhadu

Náhodnou veličinou je mimo jiné i průměr z výběrového souboru – teoreticky ze základního souboru mohu udělat nekonečně mnoho výběrů a jejich průměry se budou lišit. Pokud neuvažuji existenci světa o sobě (viz Platón, Kant nebo Patočka), pak průměr základního souboru pro mě není náhodnou veličinou – je konečný a Božsky správný. Kromě variability průměru (= směrodatná odchylka) je tak další důležitou informací o výběrovém souboru dat přesnost odhadu průměru výběrového souboru = střední chyba průměru (Vz. 1-13, Lepš, 1996, s. 12), která udává přesnost odhadu našeho průměru (je závislá na počtu měření) a budeme ji používat v t-testech, a při konstrukci konfidenčních intervalů spolehlivosti průměru = obvykle rozsah, kde se může vyskytovat “reálná” hodnota našeho průměru na úrovni 95 % pravděpodobnosti (Lepš, 1996, s. 56), které jsou zásadní pro pochopení proč se mi od sebe statisticky neliší odlišné průměry v ANOVA.