Parametrické metody

Na tomto místě se podíváme na základní parametrické metody pro jeden a dva výběry – těmi jsou t-test a F-test. Definovány jsou, jak bylo zmíněno dříve, na poměrových datech a předpokladem jejich použití je normalita dat. Testovanými parametry jsou průměr (t-test) s využitím střední chyby průměru a rozptyl (F-test). Výpočty všech těchto parametrů jsme řešili dříve.

T-test = testování průměrů

V praktické statistice se normální rozdělení nahrazuje t-rozdělením, které je mu velmi podobné. Jeho charakteristiky umožňují testovat hypotézy, které jsou vázány na průměr. Ty nás zajímají nejčastěji, a proto patří metody testování založené na tomto rozdělení k nejvýznamnějším základním testovacím metodám pro dva výběrové soubory. Nicméně v podstatě můžeme rozlišit tři typy možností nulových hypotéz, které obvykle testujeme různými t-testy.

T-test = testování průměrů

V praktické statistice se normální rozdělení nahrazuje t-rozdělením, které je mu velmi podobné. Jeho charakteristiky umožňují testovat hypotézy, které jsou vázány na průměr. Ty nás zajímají nejčastěji, a proto patří metody testování založené na tomto rozdělení k nejvýznamnějším základním testovacím metodám pro dva výběrové soubory. Nicméně v podstatě můžeme rozlišit tři typy možností nulových hypotéz, které obvykle testujeme různými t-testy.

Jednovýběrový t-test

Průměr proměnné z dat získaných našim měřením se testuje oproti průměru teoretickému (= očekávanému průměru či známému průměru základního souboru), jímž může být např. hodnota uváděná v literatuře. Tohoto testu používáme např. při srovnávání výsledků našeho výzkumu s výzkumem předchozím.
Podstatou testu je podíl dvou hodnot – v čitateli je rozdíl průměru našich hodnot a teoretického průměru (který jsem našel např. v literatuře – třeba v Květeně ČR), ve jmenovateli je střední chyba průměru vypočítaná z našich dat. Výpočet průměru a jeho střední chyby jsme si ukázali v sekci charakteristiky dat. Všechny výpočty jsou uvedeny na tabuli a vlastní postup uvažování jsme si představili, když jsme si představovali princip testování hypotéz.

Jednovýběrový t-test.

Výpočet jednovýběrového t-testu v R naleznete v šesté lekci R.

  • Příklad z přírodních věd 1: Na náhodně vybraných lokalitách podle druhového složení definovaného typu rašelinišť jsme měřili reakci půdy. Liší se průměrná hodnota reakce půdy na mnou měřených lokalitách daného typu rašeliniště od v literatuře uváděné průměrné hodnoty reakce půdy stanovišť těchto rašelinišť, která je 3,9? Data jsou v souboru data1.xlsx, proměnná pH1, typ rašeliniště v proměnné typ=2.
  • Příklad z přírodních věd 2: V našem výzkumu jsme zjistili, že průměrná hodnota konduktivity podzemní vody na lokalitách s výskytem Dactylorhiza trausteineri je 54 a srovnávám tuto hodnotu s hodnotou uváděnou v literatuře pro tento druh. Tento test použiji, protože nemám k dispozici jiný údaj než je hodnota průměru. Pokud je v literatuře uveden i počet n a velikost směrodatné odchylky (což by být mělo, jak jsme si říkali v úvodu), pak použiji dvouvýběrové varianty t-testu.
  • Příklad ze společenských věd: V našem výzkumu jsme zjistili, že průměrná známka hodnocení přitažlivosti expozice zbraní na jistém zámku je 4,12 (hodnoceno na škále 1 až 9) a srovnávám tuto hodnotu s hodnotou přitažlivosti expozice zbraní uváděné v literatuře pro zámky v Bavorsku (předpokladem, že bylo použito stejné škály hodnocení). Tento test použiji, protože nemám k dispozici jiný údaj než je hodnota průměru. Pokud je v literatuře uveden i počet n a velikost směrodatné odchylky (což by být mělo, jak jsme si říkali v úvodu), pak použiji dvouvýběrové varianty t-testu.
Párový t-test

Platí, že máme už dvě měření (na rozdíl od předchozí statistiky), ale obě měření nejsou vzájemně nezávislá – obvykle jde o dvoje měření na jednom objektu – je samozřejmé, že jde o měření jedné náhodné veličiny. Používá se např. při testování změny měřeného jevu na jedinci. Do testu ale v tomto případě nevstupují obě měření jako dva výběry, ale od jednoho měření (obvykle druhého) odečtu hodnotu druhého měření (obvykle se jedná o hodnoty z prvního měření). Pokud nedošlo ke změně mezi měřeními, pak by se tento rozdíl měl rovnat nule. Testuje se, jestli tomu tak opravdu je, tedy testuje se rozdíl měření (hodnoty rozdílu obou měření) oproti očekávanému průměru, jímž je v tomto případě 0 (tedy mí = 0). Vše podstatné je na tabuli.

Podstata párového t-testu.

Výpočet pérového t-testu v R naleznete v šesté lekci R.

  • Příklad z přírodních věd: Zajímá mě, jestli záleží na tom, kdy měřím množství živin v substrátu (= podzemní vodě) na výzkumných plochách. Provedl jsem na každé ploše měření amoniakálního dusíku na jaře a na podzim. Testuji, jestli se rozdíl měření na každé ploše rovná nule (pokud není rozdíl v měření, pak se na každé ploše musí rovnat rozdíl jarního a podzimního měření nule). Na výpočtu tohoto příkladu se naučíme pracovat s Analytickými nástroji MS Excel – video.

Výpočet párového t-testu v MS Excel pomocí analytických nástrojů.

  • Příklad ze společenských věd: Testuji vliv návštěvy expozice historických zbraní na znalost návštěvníků. Před návštěvou dostanou návštěvníci deset úkolů, za správně zodpovězený úkol dostanou bod – a získají tak nějaký počet bodů. Po ukončení návštěvy dostanou stejné otázky a opět je jim sečtou body. Od bodů získaných po návštěvě odečteme body získané před návštěvou a testujeme jestli je jejich rozdíl nezvýšil – zde půjde o jednostranný test, H0 tedy je mí je rovno nebo je větší než 0.

Prozatím jen na okraj zmiňme, že v praxi takové výzkumy zas až tak jednoduché nejsou, protože nevíme, co vše může být příčinnou změny – pokus je třeba vždy plánovat a obvykle je třeba mít nějakou kontrolní skupinu, kde nedošlo k žádnému zásahu. Navíc, pokud testuji rozdíly mezi dvěma skupinami, tak bychom měli nejprve vypočítat rozdíly v každé skupině a teprve tyto dva rozdíly testovat dvouvýběrovým t-testem, nebo vybrat jinou sofistikovanější metodu z těch, které budeme řešit v navazujícím studiu např. zde nebo v některých případech i zde.

Dvouvýběrový t-test

Měřím jednu proměnnou ve dvou výběrech a testuji, jestli se neliší průměry těchto dvou výběrů. Oba výběry jsou na rozdíl od předchozího testu nezávislé. Kromě normality je dalším požadavkem, aby oba výběry měly stejnou varianci. Vzorec pro výpočet testu je odvozen od vzorce pro výpočet jednovýběrového t-testu. V čitateli je v tomto případě ale rozdíl průměrů obou výběrových souborů, ve jmenovateli je pak střední chyba průměru rozdílu obou průměrů. Výpočet této střední chyby je komplikovaný a vychází z podílů odhadované společné variance obou výběrů. Počet stupňů volnosti se pak rovná součtu počtu měření v obou výběrech sníženém o 2. Vše podstatné je shrnuto na tabuli.

Dvouvýběrový t-test.

Pokud je soubor měření dostatečně velký, tak není porušení pravidla stejné variance nijak zásadní. Pokud je soubor malý a variance diametrálně odlišná, pak se počítá “přibližné t” s přibližným počtem stupňů volnosti. Oba výpočty umí přes Analýzu dat MS Excel vypočítat. My však pro výpočet dvouvýběrového t-testu použijeme R v šesté lekci R.

  • Příklad z přírodních věd 1: Měřil jsem reakci substrátu na jednot typu biotopu (rašeliniště) v geograficky uzavřené oblasti. Ze základního souboru druhově bohatých a druhově chudých rašelinišť byly vybrány náhodně lokality výzkumu. Zajímá mě jestli se liší průměrné hodnoty reakce půdy mezi stanovišti druhově bohatých a druhově chudých rašelinišť Vzhledem k náhodnosti výběru, předpokládané normalitě obou výběrů a nezávislosti obou výběrů, mohu požít dvouvýběrového t-testu – video pro řešení v MS Excel s pomocí Analytických nástrojů.

Výpočet dvouvýběrového t-testu v MS Excel.

  • Příklad z přírodních věd 2: Sleduji reakci změn v růstu rdestu vzplývavého na použití vápence a dolomitu při vápnění rybníků. V pokusných nádobách změřím velikost jedinců, pak aplikuji na část vápenec a na část dolomit, po uplynutí stanovené doby změřím opět všechny jedince, zjistím pro každý rozdíl v přírůstcích a t-testem testuji rozdíl v průměrných přírůstcích mezi jedinci na něž byl aplikován vápenec a jedinci, na něž byl aplikován dolomit.
  • Příklad ze společenských věd: Liší se spokojenost s návštěvou turistické atraktivity mezi muži a ženami? Spokojenost je měřena na škále hodnot např. 1-5, předpokládám spojitost dat ve významu pro návštěvníka a zajistil jsem náhodným výběrem respondentů “normalitu” dat v odpovědích.

F-test = test rozptylu

F-test je dvouvýběrovým testem, kterým se testuje shoda rozptylů těchto dvou výběrů. Používá se ve stejných případech, jako dvouvýběrový t-test. Rozdíl je v tom, že u t-testu se ptám po případné existenci rozdílu v průměru, ale u F-testu se ptám po případné existenci rozdílu ve variabilitě dvou výběrů.

Základní informace k testu jsou shrnuty na tabuli – jen doplňme, že v čitateli je obvykle hodnota rozptylu, která je větší – výsledkem je tak hodnota větší než 1. Existují ale i tabulky, které počítají s vyšší hodnotou ve jmenovateli – pak ale nulovou hypotézu zamítáme, když je hodnota testovacího kritéria menší než hodnota kritická. MS Excel je schopen spočítat obě varianty zadání vstupních dat (vstupní data vypadají stejně jako vstupní data pro párový t-test).

Výpočet F-testu v R naleznete v šesté lekci R.

F-test a jeho srovnání s t-testem.

Vlastní F-test obvykle používáme méně často než t-test (průměry nás zajímají obvykle častěji než variance), přesto v ekologii má variabilita stejně velký význam jako vlastní střední hodnota proměnné.

Nicméně význam F-testu je na úrovni našeho základního studia extrémní, pač F-test je podstatou porovnávání více než dvou výběrů v testu se jménem ANOVA (analýza rozptylu) – zde nahoře – a při testování lineárních regresních modelů.

POZOR!!!!! – mám-li více výběrů než dva (např. nemám samce a samice, ale mám čedič, vápenec a žulu), nemohu řetězit dvouvýběrové t-testy ani F-testy, ale musím použít metodu ANOVA. K tomu se ale ve výuce dostaneme až po přehledu neparametrických metod.

Shrnutí