Více výběrů

Máme-li více výběrů než dva, nemůžeme řetězit dvouvýběrové t-testy ani jejich neparametrické varianty, ale musíme použít speciální metody výpočtu označované obecně jako ANOVA a její neparametrické obdoby.

ANOVA jednoduchého třídění (One-way ANOVA)

Tento test používáme, chceme-li posoudit hypotézu o rovnosti průměrných hodnot více než dvou výběrů. Předpoklady použití ANOVA jednoduchého třídění jsou:

  • nezávislost porovnávaných výběrů,
  • homogenita variancí výběrů, testujeme Leveneovým testem, jehož vzorec najdete např. v externím odkazu,
  • výběry pocházejí ze základních souborů s normálním rozdělením,
  • všechny výběry by měly mít stejný počet n, nebo alespoň srovnatelný.

Užití si můžeme demonstrovat na následujících příkladech:

  • Příklad z přírodních věd 1: v šetřeném území se vyskytuje větší počet typů vegetace vázané na mokřady – typ vegetace zjistím analýzou druhového složení (např. podle Chytrý et al., 2012 nebo s využitím nějaké sofistikované statistické metody) a zajímá mě, jestli se dané typy vyskytují na shodných stanovištních podmínkách, takže změřím např. pH, konduktivitu a výšku hladiny podzemní vody. Pro každou z těchto tří měřených proměnných pak mohu zjišťovat jestli se průměrné hodnoty měřené v jednotlivých typech vegetace liší nebo nikoliv.
  • Příklad z přírodních věd 2: Pěstujeme rostlinný druh ve třech typech substrátu. Liší se výška rostliny po roce pěstování? Všechny ostatní faktory byly designem eliminovány. Použijte soubor vice_vyberu.xlsx a proměnné substrat a vyska).
  • Příklad ze společenských věd: zajímá mě odpověď na otázku: “Liší se spokojenost s návštěvou zámku podle vztahu návštěvníka k historii?” Musím provést výběrové šetření, kde se budu návštěvníků ptát na jejich vztah k historii (5 kategorií – historie je pro mě velmi zajímavá, historie je pro mě zajímavá, historie je pro mě nezajímavá, historie je pro mě zcela nezajímavá, nedokážu se rozhodnout) a jejich míru spokojenosti, kterou budu měřit na 9-ti členné škále). Mezi pěti kategoriemi vztahu k historii pak budu hledat rozdíly v průměrných hodnotách odpovědí na spokojenost.
Analýza rozptylu se technicky provádí ve dvou krocích – na příkladu z přírodních věd 1 pro proměnnou pH1:

1. Nejprve testuji poměr variance uvnitř definovaných skupin (typ vegetace nebo typ návštěvníka hradu podle vztahu k historii) a rozptylu celkového souboru získaných dat. Jde tedy v podstatě o F-test. Rozptyly zde jsou označovány jako MS (F= MS(celek)/suma MS(ve skupinách)). Rozptyly jsou určeny jako podíly součtu čtverců odchylek od průměrů a počtu stupňů volnosti. Přehled informací k prvnímu kroku je na tabuli.

Vzorce pro výpočet hodnot pro F-test.

Postup řešení je na videu.

Výpočet One way ANOVA v MS Excel.

2. Pokud zjistím, že hodnota F je vyšší než kritická hodnota pro daný počet stupňů volnosti, pak vím, že v mém souboru dat existují rozdíly mezi skupinami, musím se proto dále ptát: “Jaké skupiny vegetace nebo jaké skupiny návštěvníků hradu se od sebe liší?” Následuje tedy fáze mnohonásobného srovnání, kdy se testuje rozdílnost skupin pomocí tzv. post-hoc testů (Lepš, 1996 uvádí termín a posteriori testy). K nim je obvykle nutné znát dosažené hodnoty rozptylů, stupně volnosti a počet měření pro jednotlivé testované skupiny. Doporučuji používat Tukeyho test, který je v učebnici (Lepš, 1996, s. 83) uveden ve své tvrdší variantě – tedy pro případ, kdy ve skupinách nemusí být splněna podmínka stejného počtu měření, což je u v terénu měřených dat obvykle pravidlem – stejné počty měření v jednotlivých skupinách máme obvykle jen u experimentů. Kritické hodnoty pro jeho q statistiku lze nalézt na externím odkazu. Přehled informací ke druhému kroku je na tabuli.

Vzorce pro výpočet Tukeyho post-hoc testu.

Postup je na videu.

Výpočet Tukeyho post-hoc testu v MS Excel.

Analogií Tukeyho post-hoc testu je Dunnettův post-hoc test, kterým porovnáváme nikoliv všechny skupiny mezi sebou, ale všechny skupiny s kontrolní skupinou. Použije jej tedy, pokud provádíme experiment, kde máme jednu bezzásahovou skupinu. Vzorce jsou analogické Tukeyho testu a dá se tak vypočítat i v MS Excel, jako je na externím videu. Ve STATISTICA jeje najdete v dialogovém okně ANOVA Results na kartě post-hoc úplně dole (pokud znáte směr, tak můžete použít jednostranného testu; nezapomeňte nastavit, která úroveň je kontrola).

Ostatní uváděné testy ANOVA v učebnici po Vás v základním kurzu nechceme. Budeme se jim věnovat v navazujícím kurzu.

RMANOVA = ANOVA pro opakovaná měření

Je-li One-way ANOVA analogií dvouvýběrového t-testu pro více výběrů, pak RMANOVA je obdobou pro párový t-test, kde máme více opakování než jedno. Tento test použijete v případech, když výběry nejsou vzájemně nezávislé – typicky, když měříte jeden objekt více než dvakrát.

  • Příklad z přírodních věd 1: Odebíráte vzorek tkáně z jednoho zvířete na čtyřech místech a ptáte se, jestli záleží na tom, ze kterého místa odběr provádíte.
  • Příklad z přírodních věd 2: Měříte fyzikálně chemické vlastnosti substrátu na jaře, v létě a na podzim a ptáte se, jestli se odběry v těchto třech termínech liší.

Použití MS Excel pro tento výpočet máte na externím zdroji.

Kruskal-Wallis test neboli Kruskal-Wallis ANOVA

Pokud jsou předpoklady pro použití ANOVA výrazně porušeny, používáme Kruskal Wallis test. Ten je neparametrickou obdobou testu ANOVA. Podobně jako Mann-Whitney test, je výpočet založen na pořadí. Používáme ho v případě, kdy je zjevně porušena normalita v rozložení měřených dat – což se v terénu obvykle stává často. Kruskal-Wallis test se běžně používá a v mnoha případech je jeho použití správnější než ANOVA jednoduchého třídění. Vše podstatné je na tabuli.

Kruskal-Wallis test

Tabulka kritických hodnot je na např. na externím odkazu 1 nebo externím odkazu 2. MS Excel tuto statistiku v rozšířeních nemá, nicméně vzorec není až tak komplikovaný (viz výše) a lze si jej ručně nastavit, proto se nebojte jej používat – společně si test vypočítáme.
Také v případě Kruskal-Walliso testu je v případě prokázání rozdílů mezi skupinami nutné provést test shody dvojic měřených úrovní. Existuje mnoho takových testů, ale nejčastěji se provádí Mann-Whitney testem pro jednotlivé páry s upraveným p podle Bonferoniho korekce – blíže na externím odkazu.

  • Příklad z přírodních věd 1: Liší se pH na stanovištích třech typů vegetace? Použijte stejný soubor a data, jako u videa k jednocestné ANOVA.

STATISTICA má tento test schován v nabídce karty “Nonparametrics” pod označením “Comparing multiple indep. samples (groups)”.

Friedmanův test

Je-li Kruskal-Wallis test analogií Mann-Whitney testu pro více výběrů, pak Friedmanův test je obdobou pro Wilcoxonův test, kde máme více opakování než jedno. Tento test použijete v případech, když výběry nejsou vzájemně nezávislé – typicky, když měříte jeden objekt více než dvakrát a zároveň máte porušeny pravidla pro použití RMANOVA (především nemáte “normální” data).
Příklady jsou stejné jako v případě RMANOVA, jen data nesplňují podmínky použití RMANOVA.

Použití MS Excel pro tento výpočet máte na externím zdroji.

Mnohonásobné porovnání umí např. package PMCMR pro R.