Normální rozdělení

Parametrické metody hodnocení souborů dat předpokládají, mimo jiné, normální rozložení zpracovávaných dat. Použít je můžeme jen když máme poměrová (intervalová) data a dostatečný počet měření (u nízkých počtů měření obvykle nebudeme moci potvrdit normální rozdělení). V tomto měření by pak, vulgárně řečeno, měl být nízký počet velmi nízkých i velmi vysokých měřených hodnot. Četnosti měření by od velmi nízkých a velmi vysokých měly měly postupně růst k hodnotě průměru, která je velmi blízká mediánu a modu.

Toto rozdělení je základním rozdělením dat, nazývá se Gaussovým a má zvonovitý charakter. Platí, že hustota pravděpodobnosti je u něj symetrická. K výpočtu hustoty se používá Ludolfova čísla, základu přirozeného logaritmu a parametrů – průměru a rozptylu – průměr posouvá křivku po ose x a rozptyl udává “výšku” Gaussovy křivky.

Standardizované normální rozdělení

K tomu, abychom mohli v MS Excel posoudit i testovat, jestli naše data mají nebo nemají normální rozdělení, se musíme nejprve podívat na standardizované normální rozdělení. Standardizace je postup, jímž získáváme novou proměnnou, která je odvozena z měřených hodnot původní proměnné, ale její průměr je 0 a rozptyl se směrodatnou odchylkou jsou 1. Výpočet provedeme tak, že od každé měřené hodnoty proměnné odečteme průměrnou hodnotu všech měření proměnné a tento rozdíl vydělím směrodatnou odchylku průměru měřené proměnné (detailněji v navazujícím kurzu).

Posouzení normality pomocí MS Excel

  1. Okometrické posouzení histogramu, rychlého vytvoření histogramu lze docílit pomocí nástroje v nabídce Analýza dat, viz dále.
  2. Okometrické posouzení Q-Q grafu. Tvorba grafu je na videu.
  3. Posouzení šikmosti a špičatosti rozdělení, jejichž vysvětlení je uvedeno na tabuli. Za špičatá, respektive šikmá rozdělení, lze považována taková, jejichž hodnoty jsou nižší než -2 nebo vyšší než +2.
  • Šikmost se vypočítá jako podíl třetího centrálního momentu (= třetí mocniny rozdílu všech měřených hodnot a průměru) a třetí mocniny směrodatné odchylky, normální rozdělení má hodnotu 0, rozdíl mé hodnoty od nulové lze testovat a kritické hodnoty jsou pro různý počet n tabelovány např. zde,
  • Špičatost se vypočítá jako podíl čtvrtého centrálního momentu a čtvrté mocniny rozptylu od níž odečítáme hodnotu 3, pokud je hodnoty větší než 0, pak je rozdělení našich dat špičaté, jinak je ploché, opět lze hodnotu špičatosti testovat, kritické hodnoty zde.

4. Test normality rozdělení. Pro MS Excel je nejvýhodnější použít Kolmogorov-Smirnov test, což je neparametrický test, který je obdobou chí-kvadrát testu, více v neparametrických metodách. Na tomto konkrétním místě nám jde o techniku výpočtu – video. Doma můžete použít RealStatistics s těmito moduly.

Ve Vaší praxi budete tímto rozdělením aproximovat i diskrétní data, podmínkou použití ale bude, že k dispozici budete mít opravdu mnoho měřených hodnot.

V povinné literatuře naleznete informace zde: (Lepš, 1996, s. 41-43).