Diskriminační analýza

Charakter a předpoklady (Haruštiaková et al., 2012, s. 85)

Diskriminační analýza je specifickou ordinační metodou jež zahrnuje řešení pro dva typy úloh:

  • ve větším množství proměnných hledáme takovou, která je rozhodující pro zařazení daného objektu do skupiny – víme, který objekt patří do jaké skupiny (objektem je muž nebo žena, objektem je jarní měření nebo letní měření, objektem je měření v ČR a v SR) = kanonická diskriminační analýza
  • máme objekt a ten chceme zařadit do skupiny = klasifikační diskriminační analýza

Předpoklady:

  • proměnné mají kvantitativní charakter s normálním rozdělením a nejsou svými vzájemnými lineárními kombinacemi
  • objekty musí být v každé skupině minimálně dva a objektů celkem by mělo být podstatně více než je
  • počet proměnných i počet znaků
  • proměnná nemůže být v žádné skupině konstantní

Kanonická diskriminační analýza (Haruštiaková et al., 2012, oddíl 7.5.1 celý)

Posuzují se jen proměnné, pro něž se liší střední hodnota mezi skupinami kategoriální proměnné. Metoda hledá lineární kombinace proměnných, které nejlépe identifikují příslušnost objektu ke skupině. Těchto nových dimenzí je p-1 a jde o kanonické osy. V potaz se bere maximální vzdálenost centroidů (těžišť) skupin. Pokud má vzorek více než dvě skupiny, diskriminačních funkcí je více. Vazbu původních proměnných na hodnotu diskriminační funkce určují nestandardizované a standardizované koeficienty. Tento větší počet je pak možné zobrazit v ordinačním diagramu. Souvislost diskriminačních os s původními proměnnými se vysvětluje pomocí korelačních koeficientů mezi původními funkcemi a diskriminačními funkcemi – a to bez vlivu ostatních původních proměnných. Významnost lze testovat.

Kanonická diskriminační analýza má ve STATISTICA kvalitní návod – při řešení zadání kanonické diskriminační analýzy postupujte podle něj. Na ukázku řešení použijeme příkladu z manuálu.

  • Příklad z přírodních věd: Zařazení kosatce do druhu podle délky a šířky kališních a korunních lístků, návod pro STATISTICA je na videu.

Klasifikační diskriminační analýza (Haruštiakové et al., 2012, oddíl 7.5.2 celý)

Určuje pravděpodobnost příslušnosti objektu do skupiny na základě klasifikační funkce. K dispozici musíme mít skupinu objektů u nichž máme kromě kvantitativních proměnných i proměnnou kódující příslušnost objektu do skupiny = trénovací výběr. Na něm jsou vybudovány klasifikační funkce. V nejjednodušším případě vychází metodika ze sestavení klasifikační funkce pro každou skupinu, pro kterou získá objekt nejvyšší hodnotu, do té bude zařazen. Účinnost klasifikačních kritérií lze testovat a z ní lze určit úspěšnost zařazení objektů.

  • Příklad z přírodních věd: Klasifikace objektů (květů kosatce) podle charakteru květů z příkladu kanonické diskriminační analýzy je na videu.

Formalizované klasifikace společenstev

Další možností jak lze na základě dosažených hodnot proměnných identifikovat skupinu, do které daný objekt patří je expertní systém. Tyto skupiny jsou vždy skupinami externími = existujícími mimo má data. Cílem je na základě formalizované definice určit skupinu, do které patří ten který objekt. Pokud typ nelze na základě definice určit, může být na základě indexů podobnosti určen nejpodobnější typ. Tyto typy jsou dopředu dány a my se ptáme “Do kterého typu naše případy patří?”

Na úrovni celé České republiky funguje takovýto systém pro vegetaci na základě fytocenologických snímků – existuje pro celý systém rostlinných společenstev do úrovně asociací. Tento systém si je možné naimportovat do software JUICE a zdarma si klasifikovat vlastní fytocenologické snímky.