Parametrické metody

T-test = testování průměrů

V praktické statistice se normální rozdělení nahrazuje t-rozdělením, které je mu velmi podobné – blíže viz Lepš, 1996 (s. 52-54). Jeho charakteristiky umožňují testovat hypotézy, které jsou vázány na průměr. Ty nás zajímají nejčastěji, a proto patří metody testování založené na tomto rozdělení k nejvýznamnějším základním testovacím metodám, především pro dva výběrové soubory. Nicméně v podstatě můžeme rozlišit tři typy možností nulových hypotéz, které obvykle testujeme různými t-testy:

Jednovýběrový t-test (Lepš, 1996, Vz. 5-5)

Průměr proměnné z dat získaných našim měřením se testuje oproti průměru teoretickému (= očekávanému průměru či známému průměru základního souboru), jímž může být např. hodnota uváděná v literatuře. Tohoto testu používáme např. při srovnávání výsledků našeho výzkumu s výzkumem předchozím.
Podstatou testu je podíl dvou hodnot – v čitateli je rozdíl průměru našich hodnot a teoretického průměru (který jsem našel např. v literatuře – třeba v Květeně ČR), ve jmenovateli je střední chyba průměru vypočítaná z našich dat. Výpočet průměru a jeho střední chyby jsme si ukázali v sekci charakteristiky dat. Všechny výpočty jsou uvedeny na tabuli a vlastní postup uvažování jsme si představili, když jsme si představovali princip testování hypotéz.

  • Příklad z přírodních věd 1: Na náhodně vybraných lokalitách podle druhového složení definovaného typu rašelinišť jsme měřili reakci půdy. Liší se průměrná hodnota reakce půdy na mnou měřených lokalitách daného typu rašeliniště od v literatuře uváděné průměrné hodnoty reakce půdy stanovišť těchto rašelinišť, která je 3,9? Data jsou v souboru data1.xlsx, proměnná pH1, typ rašeliniště v proměnné typ=2.
  • Příklad z přírodních věd 2: V našem výzkumu jsme zjistili, že průměrná hodnota konduktivity podzemní vody na lokalitách s výskytem Dactylorhiza trausteineri je 54 a srovnávám tuto hodnotu s hodnotou uváděnou v literatuře pro tento druh. Tento test použiji, protože nemám k dispozici jiný údaj než je hodnota průměru. Pokud je v literatuře uveden i počet n a velikost směrodatné odchylky (což by být mělo, jak jsme si říkali v úvodu), pak použiji dvouvýběrové varianty t-testu.
  • Příklad ze společenských věd: V našem výzkumu jsme zjistili, že průměrná známka hodnocení přitažlivosti expozice zbraní na jistém zámku je 4,12 (hodnoceno na škále 1 až 9) a srovnávám tuto hodnotu s hodnotou přitažlivosti expozice zbraní uváděné v literatuře pro zámky v Bavorsku (předpokladem, že bylo použito stejné škály hodnocení). Tento test použiji, protože nemám k dispozici jiný údaj než je hodnota průměru. Pokud je v literatuře uveden i počet n a velikost směrodatné odchylky (což by být mělo, jak jsme si říkali v úvodu), pak použiji dvouvýběrové varianty t-testu.
Párový t-test (Lepš, 1996, Vz. 5-5, kde mí = 0)

Platí, že máme už dvě měření (na rozdíl od předchozí statistiky), ale obě měření nejsou vzájemně nezávislá – obvykle jde o dvoje měření na jednom objektu – je samozřejmé, že jde o měření jedné náhodné veličiny. Používá se např. při testování změny měřeného jevu na jedinci. Do testu ale v tomto případě nevstupují obě měření jako dva výběry, ale od jednoho měření (obvykle druhého) odečtu hodnotu druhého měření (obvykle se jedná o hodnoty z prvního měření). Pokud nedošlo ke změně mezi měřeními, pak by se tento rozdíl měl rovnat nule. Testuje se, jestli tomu tak opravdu je, tedy testuje se rozdíl měření (hodnoty rozdílu obou měření) oproti očekávanému průměru, jímž je v tomto případě 0 (tedy mí = 0). Vše podstatné je na tabuli.
Příklad v učebnici na reakci organismu na podání léku je snad dostatečně názorný (Lepš, 1996, Obr. 5-4). Zde testovali jen přírůstek – lék měl mít účinek na ve snížení hmotnosti, obecně ale mohu provést test oboustranný. Prozatím jen na okraj zmiňme, že v praxi takový výzkum zas až tak jednoduchý není, protože nevíme, co vše může být příčinnou změny – v příkladu podání léku může, ale nemusí, být jedinou příčinnou potenciální změny – pokus je třeba vždy plánovat a obvykle je třeba mít nějakou kontrolní skupinu, které lék podán nebyl – srovnávat by se pak měly rozdíly ve skupině před podáním a po podání léku a rozdíly ve skupině bez podání léku ve stejných termínech. V obou případech bychom měli vypočítat tyto rozdíly a teprve tyto dva rozdíly testovat dvouvýběrovým t-testem, nebo vybrat jinou sofistikovanější metodu z těch, které budeme řešit v navazujícím studiu např. zde nebo v některých případech i zde.

  • Příklad z přírodních věd: Zajímá mě, jestli záleží na tom, kdy měřím množství živin v substrátu (= podzemní vodě) na výzkumných plochách. Provedl jsem na každé ploše měření amoniakálního dusíku na jaře a na podzim. Testuji, jestli se rozdíl měření na každé ploše rovná nule (pokud není rozdíl v měření, pak se na každé ploše musí rovnat rozdíl jarního a podzimního měření nule). Na výpočtu tohoto příkladu se naučíme pracovat s Analytickými nástroji MS Excelvideo.
  • Příklad ze společenských věd: Testuji vliv návštěvy expozice historických zbraní na znalost návštěvníků. Před návštěvou dostanou návštěvníci deset úkolů, za správně zodpovězený úkol dostanou bod – a získají tak nějaký počet bodů. Po ukončení návštěvy dostanou stejné otázky a opět je jim sečtou body. Od bodů získaných po návštěvě odečteme body získané před návštěvou a testujeme jestli je jejich rozdíl nezvýšil – zde půjde jako v příkladu Obr 5-4 (Lepš, 1996) o jednostranný test, H0 tedy je mí je rovno nebo je větší než 0.
Dvouvýběrový t-test (vzorec: Lepš, 1996, Vz. 6-5)

Měřím jednu proměnnou ve dvou výběrech a testuji, jestli se neliší průměry těchto dvou výběrů (Lepš, 1996, s. 66-68). Oba výběry jsou na rozdíl od předchozího testu nezávislé. Kromě normality je dalším požadavkem, aby oba výběry měly stejnou varianci. Vzorec pro výpočet testu je odvozen od vzorce pro výpočet jednovýběrového t-testu. V čitateli je v tomto případě ale rozdíl průměrů obou výběrových souborů, ve jmenovateli je pak střední chyba průměru rozdílu obou průměrů. Výpočet této střední chyby je komplikovaný a vychází z podílů odhadované společné variance obou výběrů, jejíž výpočet je uveden ve Vz. 6-2 (Lepš, 1996). Počet stupňů volnosti se pak rovná součtu počtu měření v obou výběrech sníženém o 2. Vše podstatné je shrnuto na tabuli. Pokud je soubor měření dostatečně velký, tak není porušení pravidla stejné variance nijak zásadní, pokud je soubor malý a variance diametrálně odlišná, pak se počítá “přibližné t” (Vz. 6-6, Lepš, 1996) s přibližným počtem stupňů volnosti (Vz. 6-7, Lepš, 1996).

  • Příklad z přírodních věd 1: Měřil jsem reakci substrátu na jednot typu biotopu (rašeliniště) v geograficky uzavřené oblasti. Ze základního souboru druhově bohatých a druhově chudých rašelinišť byly vybrány náhodně lokality výzkumu. Zajímá mě jestli se liší průměrné hodnoty reakce půdy mezi stanovišti druhově bohatých a druhově chudých rašelinišť Vzhledem k náhodnosti výběru, předpokládané normalitě obou výběrů a nezávislosti obou výběrů, mohu požít dvouvýběrového t-testu – video pro řešení v MS Excel s pomocí Analytických nástrojů.
  • Příklad z přírodních věd 2: Sleduji reakci změn v růstu rdestu vzplývavého na použití vápence a dolomitu při vápnění rybníků. V pokusných nádobách změřím velikost jedinců, pak aplikuji na část vápenec a na část dolomit, po uplynutí stanovené doby změřím opět všechny jedince, zjistím pro každý rozdíl v přírůstcích a t-testem testuji rozdíl v průměrných přírůstcích mezi jedinci na něž byl aplikován vápenec a jedinci, na něž byl aplikován dolomit.
  • Příklad ze společenských věd: Liší se spokojenost s návštěvou turistické atraktivity mezi muži a ženami? Spokojenost je měřena na škále hodnot např. 1-5, předpokládám spojitost dat ve významu pro návštěvníka a zajistil jsem náhodným výběrem respondentů “normalitu” dat v odpovědích.

 

F-test = test rozptylu

Jde o dvouvýběrový test, kterým se testuje shoda rozptylů těchto dvou výběrů (Lepš, 1996, s. 64-65, Vz. 6-1). Používá se ve stejných případech, jako dvouvýběrový t-test. Rozdíl je v tom, že u t-testu se ptám na existenci rozdílu v průměru, ale u F-testu se ptám na existenci rozdílu ve variabilitě dvou výběrů. Základní informace k testu jsou shrnuty na tabuli – jen doplňme, že v čitateli je obvykle hodnota rozptylu, která je větší – výsledkem je tak hodnota větší než 1. Existují ale i tabulky, které počítají s vyšší hodnotou ve jmenovateli – pak ale nulovou hypotézu zamítáme, když je hodnota testovacího kritéria menší než hodnota kritická. MS Excel je schopen spočítat obě varianty zadání vstupních dat (vstupní data vypadají stejně jako vstupní data pro párový t-test). Vlastní F-test obvykle používáme méně často než t-test (průměry nás zajímají obvykle častěji než variance), přesto v ekologii má variabilita stejně velký význam jako vlatní střední hodnota proměnné

Nicméně význam F-testu je na úrovni našeho základního studia extrémní, pač F-test je podstatou porovnávání více než dvou výběrů v testu se jménem ANOVA (analýza rozptylu) – zde nahoře – a při testování lineárních regresních modelů.

 

POZOR!!!!! – mám-li více výběrů než dva (např. nemám samce a samice, ale mám čedič, vápenec a žulu), nemohu řetězit dvouvýběrové t-testy ani F-testy, ale musím použít metodu ANOVA. K tomu se ale ve výuce dostaneme až po přehledu neparametrických metod.