Základní statistika

Pro základní kurz je povinnou učebnicí pouze učebnice Lepš (1996). Biostatistika. BF JU v Č.B. Ta je Vám dostupná v dostatečném množství v univerzitní knihovně (nebo ke stažení v elektronické podobě je zde). Je psána lidsky a doplněna řadou konkrétních příkladů – nic lepšího, co by bylo česky, na jednom místě a zároveň dostupné, jsme prozatím nenašli. Jejím problémem ale je, že je tam spousta věcí, které nemá smysl (na rozdíl od přesvědčení autora) v základním kurzu probírat, proto ji použijeme jen z části. Vy, ze sociálních a ekonomických věd, se neděste – metodika zpracování Vašich dat je na úrovni kurzů, BP i DP stejná – příklady jsme se snažili uvést a jsou postupně doplňovány o další. V roce 2014 vyšla tato učebnice v novém vydání, už s příklady řešení úloh ve STATISTICA, v roce 2016 vyšla jako kniha s výpočty ve STATISTICA a R. My se ale v kurzu základní statistiky budeme držet starého vydání, není sebemenší důvod pracovat s novými. Výpočty budeme provádět v MS Excel, který je prozatím nejdostupnější variantou ve škole, doma i ve Vašem zaměstnání.

U pojmů je odkazováno na stránky, vzorce a obrázky z příslušné učebnice (předpokladem úspěšného studia je, že se na tyto odkazy podíváte a texty přečtete) a pak na návody ovládání daných prvků v MS Excel, který je Vaším primárním software pro řešení statistických úloh. Pokud s ním neumíte dělat, tak základní tutoriál je tady, podobně můžete použít třeba i tohle. U části metod budeme v MS Excel potřebovat nainstalovat doplňky a zobrazit kartu Vývojář.

Požadavky k zápočtu a zkoušce ze základního kurzu jsou zde.

Data pro práci jsou ke stažení zde.

Základní pojmy

Absolutním základem pro práci s daty je poznání podstaty typu dat a charakteru výběrového souboru.

Testování hypotéz

Nejprve se podívejme na obecný úvod do problematiky testování hypotéz.

Parametrické metody

Parametrické metody jsou založeny na testování parametrů – těmi jsou nejčastěji průměr a rozptyl. Definovány tak jsou na poměrových typech dat. Přehled jejich základní problematiky je na tabuli.

Parametrické metody dále obvykle předpokládají normalitu rozdělení dat. Tento post Vás seznámí s posouzení normality Vašich dat.

Základní parametrické metody naleznete zde.

Neparametrické metody

Neparametrické metody jsou definovány na nižší úrovni dat – nominálních nebo ordinálních datech. Testovány tak nejsou parametry, ale nejčastěji počet (u nominálních dat) a pořadí (u ordinálních dat).

Kompletní přehled základních neparametrických metod naleznete zde.

Více výběrů

V předchozích částech jsme se seznámili s parametrickými a neparametrickými metodami určenými pro posouzení jednoho nebo dvou výběrů. Pro posouzení více výběrů než jsou dva musíme použít speciální metody určené pro posouzení většího množství výběrů.

Posouzení závislostí proměnných

Dalším typem zpracování kvantitativních dat, se kterým se seznámíme v základním kurzu, je posouzení vzájemných vazeb mezi proměnnými:

Mimo rozsah kurzu jsou pak ještě statistiky, jejichž cílem je posouzení velikosti účinku proměnných.