Základní statistika

Pro základní kurz je povinnou učebnicí tento materiál, tedy část tohoto webu worldofplants.net věnovaná základnímu kurzu. Pokud potřebujete tištěný materiál, tak nejvýhodnější je použít skripta Lepš, J. (1996). Biostatistika. BF JU v Č.B. Ta je Vám dostupná v dostatečném množství v univerzitní knihovně (nebo ke stažení v elektronické podobě je zde). V roce 2014 vyšla tato učebnice v novém vydání, už s příklady řešení úloh ve STATISTICA, v roce 2016 vyšla jako kniha s výpočty ve STATISTICA a R. My budeme prozatím výpočty provádět v MS Excel, který je prozatím nejdostupnější variantou ve škole, doma i ve Vašem zaměstnání, nicméně už začínáme pracovat na převodu kurzu do R.

Vy ze sociálních a ekonomických věd se neděste – metodika zpracování Vašich dat je na úrovni kurzů, BP i DP stejná – příklady jsme se snažili uvést a jsou postupně doplňovány o další.

V úvodních hodinách se kromě teoretického představení problému zpracování dat budeme věnovat ovládání programu MS Excel. Pokud s ním neumíte dělat, nemělo by to tedy vadit, ale pro jistotu – základní tutoriál je tady, podobně můžete použít třeba i tohle. U části metod budeme v MS Excel potřebovat nainstalovat doplňky a zobrazit kartu Vývojář.

Požadavky k zápočtu a zkoušce ze základního kurzu jsou zde.

Základní pojmy

Absolutním základem pro práci s daty je poznání podstaty typu dat a charakteru výběrového souboru.

Testování hypotéz

Nejprve se podívejme na obecný úvod do problematiky testování hypotéz.

Parametrické metody

Parametrické metody jsou založeny na testování parametrů – těmi jsou nejčastěji průměr a rozptyl. Definovány tak jsou na poměrových typech dat. Přehled jejich základní problematiky je na tabuli.

Základní přehled přednášených parametrických metod.

Parametrické metody dále obvykle předpokládají normalitu rozdělení dat. Tento post Vás seznámí s posouzení normality Vašich dat.

Základní parametrické metody naleznete zde.

Neparametrické metody

Neparametrické metody jsou definovány na nižší úrovni dat – nominálních nebo ordinálních datech. Testovány tak nejsou parametry, ale nejčastěji počet (u nominálních dat) a pořadí (u ordinálních dat).

Kompletní přehled základních neparametrických metod naleznete zde.

Více výběrů

V předchozích částech jsme se seznámili s parametrickými a neparametrickými metodami určenými pro posouzení jednoho nebo dvou výběrů. Pro posouzení více výběrů než jsou dva musíme použít speciální metody určené pro posouzení většího množství výběrů.

Posouzení závislostí proměnných

Dalším typem zpracování kvantitativních dat, se kterým se seznámíme v základním kurzu, je posouzení vzájemných vazeb mezi proměnnými:

Mimo rozsah kurzu jsou pak ještě statistiky, jejichž cílem je posouzení velikosti účinku proměnných.