Kanonická ordinační analýza

Principy kanonické ordinační analýzy (Haruštiaková et al., 2012, kap. 7.1 celá)

Tyto ordinace jsou označovány jako přímé gradientové analýzy. Od předchozích se liší především tím, že přímo do výpočtů, směřujících k eliminaci dimenzí, vstupují “environmental variables”, které už nejsou supplementary (a pasivně prokládány), ale jsou součástí výpočtu. Ve většině případů je chápeme jako větší množství proměnných, jimiž se snažíme vysvětlit větší množství proměnných na levé straně. Nejčastěji vysvětlujeme pomocí mnoha proměnných prostředí variabilitu druhového složení (zde opět co druh, to proměnná).

Kanonická korelační analýza – CCorA (Haruštiaková et al., 2012, kap 7.4 celá)

Cílem je vyhodnocení korelace dvou skupin proměnných přes objekty. V principu metoda nerozlišuje, která skupina je závislá a která nezávislá. Jde o korelační metodu, nicméně výsledky jsou uváděny skupina 1 versus skupina 2 i skupina 2 versus skupina 1, čili ji lze použít i jako vysvětlovaná – vysvětlující proměnná. Přestože není v biologických výzkumech často používaná, my ji uvádíme jako první, protože je jedinou kanonickou ordinační metodou, kterou umí se vším všudy STATISTICA.

Podmínkou pro analýzu je poměrový (alespoň kvantitativní) charakter vstupních dat a celkový počet proměnných musí být menší než je počet objektů. Latentní dimenze (faktory, zde označované jako kořeny – roots) jsou pak lineárními kombinacemi vstupních proměnných a jejich určení je analogické PCA. Závislosti mezi nimi jsou pak rozšířením mnohonásobné lineární regrese s tím rozdílem, že na Lhs není jedna proměnná, ale větší počet latentních proměnných. Hodnota korelačního koeficientu mezi latentními faktory je druhou odmocninou vlastní hodnoty matice. Celkově jsou výsledky CCorA hodně podobné výsledkům FA – korelační koeficienty odpovídají faktorovým zátěžím (loadings) a lze je použít pro pojmenování osy jako u FA. Počet vlastních hodnot je roven počtu původních proměnných ze skupiny, kde jich bylo méně. První kanonická osa je nejsilnější a ostatní jsou s ní nekorelované. Interpretují se jen signifikantní kořeny a to pomocí kanonických korelací pro jednotlivé proměnné a objekty. Pomocí kanonických vah (které jsou obdobou faktorových vah ve FA) lze sestavit ordinační diagram i biplot pro jednodušší interpretaci (ve STATISTICA si to budete ale muset udělat sami, pač ta jej v nabídce nemá, ale váhy si můžete vyexportovat).

STATISTICA má prokanonickou korelační analýzu výborný návod, pokud se ho budete držet, bez potíží analýzu zvládnete udělat.

  • Příklad z přírodních věd: stejná data jako v PCA, zajímá mě vazba fyzikálně chemických vlastností podzemní vody na druhové složení rašeliníků na rašeliništích. Druhové složení je vysvětlovanou proměnou, vlastnosti podzemní vody vysvětlující proměnnou. Řešení ve STATISTICA je na videu.

Redundanční analýza – RDA (Haruštiaková et al., 2012, kap. 7.3 celá)

Jde o lineární model přímé ordinační analýzy, který je založen na PCA. Předpokládá tedy krátký CA gradient a lineární odpovědi proměnných na ordinační osu. Je tak omezenou formou PCA a sdílí s ní předpoklady použití.

Je velmi podobná kanonické korelační analýze. Také do ní vstupují dvě sady proměnných, v tomto případě, ale jednoznačně rozdělena na sadu vysvětlovanou a sadu nezávislou. Cílem je sadou nezávislých proměnných vysvětlit maximum variability sady vysvětlovaných proměnných – vysvětlované jsou lineární kombinací vysvětlovaných.

Popis výpočtu ordinačních os, respektive polohy objektů a proměnných v jejich souřadnicovém systému uvádí Haruštiaková et al. (2012, s. 82-83).

Kanonické osy,na rozdíl od neomezených ordinačních lze testovat na statistickou významnost (permutačními Monte-Carlo testy) a jednotlivé proměnné tak lze zařazovat do modelu na principu “forward selection”. Do modelu vstupují jen proměnné, které jsou statisticky významné.

V praxi se používá často po PCA, kdy máme k dispozici i environemntální proměnné. Pak je cílem RDA popis vazby složení společenstev se současným započítám vlivu faktorů prostředí. Jak už bylo zmíněno výše, použít by se měla jen na krátké gradienty, které splňují podmínku linearity vazeb.

Interpretace ordinačního diagramu je stejná jako u PCA.

STATISTICA ji neumí, pokud ji potřebujete dělat, nahraďte ji kanonickou korelační analýzou. Pokud nechcete nebo nemůžete, musíte zvolit jiný software – doporučit se dá CANOCO nebo B-VegAna.

  • Příklad z přírodních věd: Projděte si článek kombinující přístupy DCA, PCA a následně RDA a CCA při řešení problému odpovědi druhového složení blatkových borů na různý typ disturbance.

Kanonická korespondenční analýza – CCA (Haruštiaková et al., 2012, kap. 7.2 celá)

V tomto případě jde o unimodální model přímé analýzy, který je založen na CA (DCA). Předpokládá tedy dlouhý CA gradient (větší než 3, obvykle i větší než 2) a unimodální odpovědi proměnných na ordinační osu. Je tak omezenou formou CA (DCA) a sdílí s ní předpoklady použití. Na rozdíl od CCorA a RDA lze použít jako vysvětlující proměnné i proměnné, které nemají normální rozdělení a mají i nižší charakter, např. nominální (pak je ale třeba je kódovat jako bivariátní dummy proměnné). Jde o suverénně nejčastěji používanou metodu, kdy na Lhs i Rhs je větší počet proměnných a mým cílem je určit mezi nimi vazbu za současného radikálnějšího snížení dimenzionality.

Stejně jako CCorA a RDA pracuje se sadou dvou typů proměnných. Cílem je ale určení takových lineárních kombinací, které nejlépe vysvětlují inerci ordinačních skóre ze závislých proměnných. Podíl vysvětlené inerce na celkové CA (DCA) inerci pak má vypovídací hodnotu o míře vysvětlení variability závislých proměnných použitými nezávislými proměnnými.

V praxi se používá často po CA (DCA), kdy máme k dispozici i environemntální proměnné. Pak je cílem CCA popis vazby složení společenstev se současným započítám vlivu faktorů prostředí. Jak už bylo zmíněno výše použít by se měla na dlouhé gradienty, které nesplňují podmínku linearity vazeb.

Interpretace ordinačního diagramu je stejná jako u CA.

STATISTICA ji neumí a není ji v ní čím nahradit. K tomu budete muset použít CANOCO nebo B-VegAna.

  • Příklad z přírodních věd: Projděte si článek, kde byla použita DCA a následně CCA k vysvětlení druhového složení rybničních rašelinišť na vybraných environmentálních faktorech. Ve Fig 1 i Fig 2 jsou body zobrazeny polohy objektů (=lokality) naklasifikované podle typu vegetace (což je výstup TWINSPANu). Ve Fig 1 jsou pasivně proloženy všechny environmetální proměnné (jako supplementary) – v Tab. 2 jsou pak korelace skórů těchto proměnných s 1. a 2. ordinační osou (požito je to pro popis os). Ve Fig 2 jde o kanonické osy a zobrazeny jsou signifikantní env. proměnné.

Na doplnění

  • RDA i CCA lze dělat i jako parciální – je možno odečíst vliv některé proměnné a sledovat odpověď jiné proměnné po odečtení jejich vlivu
  • výsledek (poloha objektů) v ordinačním diagramu by se u CCA měla srovnat s jejich polohou v CA, pokud je podobná, pak je výsledek CCA uspokojivý (znamená to, že mnou měřené faktory prostředí mají “opravdu” vztah k poloze objektů)
  • kanonické osy sice už nejsou teoretickými gradienty jako v CA nebo PCA, nýbrž jsou kombinací nezávislých proměnných (použitých v analýze), přesto vztahy v ordinačním digramu CCA i RDA zůstávají popisné a nejsou kauzální, pokud analyzovaná data nejsou výsledkem manipulace – kauzalitu prokazujeme jen experimentem !!!!!