Normální rozdělení

Parametrické metody hodnocení souborů dat předpokládají, mimo jiné, normální rozložení zpracovávaných dat. Použít je můžeme jen když máme poměrová (intervalová) data a dostatečný počet měření (u nízkých počtů měření obvykle nebudeme moci potvrdit normální rozdělení). V tomto měření by pak, vulgárně řečeno, měl být nízký počet velmi nízkých i velmi vysokých měřených hodnot. Četnosti měření by od velmi nízkých a velmi vysokých měly měly postupně růst k hodnotě průměru, která je velmi blízká mediánu a modu.

Toto rozdělení je základním rozdělením dat, nazývá se Gaussovým a má zvonovitý charakter. Platí, že hustota pravděpodobnosti je u něj symetrická. K výpočtu hustoty se používá Ludolfova čísla, základu přirozeného logaritmu a parametrů – průměru a rozptylu – průměr posouvá křivku po ose x a rozptyl udává “výšku” Gaussovy křivky.

Standardizované normální rozdělení

K tomu, abychom mohli v MS Excel posoudit i testovat, jestli naše data mají nebo nemají normální rozdělení, se musíme nejprve podívat na standardizované normální rozdělení. Standardizace je postup, jímž získáváme novou proměnnou, která je odvozena z měřených hodnot původní proměnné, ale její průměr je 0 a rozptyl se směrodatnou odchylkou jsou 1. Výpočet provedeme tak, že od každé měřené hodnoty proměnné odečteme průměrnou hodnotu všech měření proměnné a tento rozdíl vydělím směrodatnou odchylku průměru měřené proměnné (detailněji v navazujícím kurzu).

Posouzení normality pomocí MS Excel

  1. Okometrické posouzení histogramu, rychlého vytvoření histogramu lze docílit pomocí nástroje v nabídce Analýza dat, viz dále.
  2. Okometrické posouzení Q-Q grafu. Tvorba grafu je na videu.

Návod na vytvoření Q-Q grafu v MS Excel.

3. Posouzení šikmosti a špičatosti rozdělení, jejichž vysvětlení je uvedeno na tabuli. Za špičatá, respektive šikmá rozdělení, lze považována taková, jejichž hodnoty jsou nižší než -2 nebo vyšší než +2.

Špičatost a šikmost v porovnání s normálním rozdělením.

  • Šikmost se vypočítá jako podíl třetího centrálního momentu (= třetí mocniny rozdílu všech měřených hodnot a průměru) a třetí mocniny směrodatné odchylky, normální rozdělení má hodnotu 0, rozdíl mé hodnoty od nulové lze testovat a kritické hodnoty jsou pro různý počet n tabelovány např. zde,
  • Špičatost se vypočítá jako podíl čtvrtého centrálního momentu a čtvrté mocniny rozptylu od níž odečítáme hodnotu 3, pokud je hodnoty větší než 0, pak je rozdělení našich dat špičaté, jinak je ploché, opět lze hodnotu špičatosti testovat, kritické hodnoty zde.

4. Test normality rozdělení. Pro MS Excel je nejvýhodnější použít Kolmogorov-Smirnov test, což je neparametrický test, který je obdobou chí-kvadrát testu, více v neparametrických metodách. Na tomto konkrétním místě nám jde o techniku výpočtu – video. Doma můžete použít RealStatistics s těmito moduly.

Ve Vaší praxi budete tímto rozdělením aproximovat i diskrétní data, podmínkou použití ale bude, že k dispozici budete mít opravdu mnoho měřených hodnot.

Testování hypotéz

Podstata statistického testování hypotéz tkví ve filozofiích karteziánského racionalismu, pozitivismu a kritického racionalismu, tedy toho, co je označováno za “vědecký” přístup. Z toho poslední plyne tvrzení, že pravdivé hypotézy jsou pouze ty, které nelze falzifikovat – hypotézu nelze potvrdit, ale snažíme se o její vyvrácení, pokud ji vyvrátíme, není pravdivá, pokud ji nelze vyvrátit chováme se k ní jako k pravdivé (dokud nebude vyvrácena).

Statistické hypotézy tedy vycházejí z předpokladu, že hypotézu nelze na základě dat dokázat, nicméně ji lze vyvrátit. Proto se formulují hypotézy, které se označují H0, tedy nulové hypotézy, které jsou obvykle opakem toho, co se snažíme prokázat!!!!!!!! Proto H0 obvykle zní “není rozdíl mezi skupinou X a skupinou Y”. Pokud jsme schopni na základě dat nulovou hypotézu vyvrátit, mohu ji zamítnout a mohu přijmout ji negující hypotézu (alternativní, která se obvykle značí HA nebo H1).

Způsob uvažovaní při testování hypotéz a faktorů ovlivňujících jejich výstup si ukážeme na příkladu dvouvýběrového t-testu, ke kterému se dostaneme v konkrétní podobě za chvíli.

Přijmutí nebo zamítnutí nulové hypotézy vychází z porovnání vypočtené hodnoty statistické metody (což je nějaká funkce, vzorec, do kterého vstupují měřená data) a kritické hodnoty dané metody (hodnota je tabelována = najdu ji v tabulkách, statistické software ji znají a rovnou reportují). Princip je shrnut na tabuli.

Pravděpodobnostní podstata testu hypotézy.

Je-li hodnota vypočtená z našich dat menší než kritická, pak nulovou hypotézu nemohu zamítnout a opačně (toto neplatí vždy – výjimkou jsou např. Mann-Whitney a Wilcoxon, jejichž funkce mají obrácený charakter – tabule).

U Mann-Whitney a Wilcoxon je rozhodování “opačné” než u t-testu.

Kritická hodnota je závislá na pravděpodobnosti, kterou jsem ochoten přijmout pro platnost nulové hypotézy a odpovídá hodnotě dané pravděpodobnosti pod křivkou funkce hustoty rozdělení pravděpodobnosti (celkový obsah pod křivkou je 100% a já říkám, co je nepravděpodobné – nejčastěji 5 %, 1 %, nebo 0,1 %, pravděpodobnost platnosti H0 je tedy 95%, 99%, resp. 99,9%, nejčastěji se tato hodnota uvádí jako hladina významnosti, která se značí “p” a uvádí se v desetinách, tedy 0,05, 0,01 a 0,001). Čím je tato hodnota nižší, tím podstupuji větší riziko, že zamítnu skutečnost, která je pravdou (= chyba 1. druhu), na druhou stranu tím snižuji pravděpodobnost, že bych zamítl hypotézu, která by nebyla pravdou (= chyba 2. druhu). Samozřejmě to platí i opačně.

POZOR – nestanovuji její konkrétní kritickou hodnotu, ale pravděpodobnost – od ní se odvíjí konkrétní kritická hodnota. Je to proto, že tvar křivky se mění s počty stupňů volnosti a mohu testovat oboustrannou i jednostrannou rovnost – viz dále.

Kritická hodnota statistické metody je tedy závislá na počtu stupňů volnosti. Ty se odvíjejí od počtu měření a v mnoha testech i od počtu kategorií, pro něž se test provádí. U našeho modelového testu platí, že kolem nuly je křivka vyšší a celkově je vysoká část užší při vyšších hodnotách počtu stupňů volnosti, proto pak je kritická hodnota pro stejnou hladinu významnosti v absolutní hodnotě menší číslo než u nižšího počtu stupňů volnosti – v rámcích statistiky je to logické – mám více měření, jsem blíže základnímu souboru a tedy data jsou blíže “pravdě”. Vliv počtu stupňů volnosti je znázorněn na tabuli.

Vliv počtu stupňů volnosti.

Existují i případy, kdy nás nezajímá test shody dvou výběrů, ale H0 je postavena na nerovnosti (typicky mám dva výběry a vím, že jeden by měl dosahovat vyšších hodnot, pak nemá smysl testovat rovnost, ale bude nás zajímat jen jedna strana. Kritická hodnota je pak jiná při stejném počtu stupňů volnosti a hladině významnosti – vysvětlení proč je modrou barvou na tabuli.

Jednostranný test vs. oboustranný test.

Řešení projektu

Přednášená studijní literatura

  • zde – 5. a 7. kapitola, celé

Prezentace

Vybrané otázky a odpovědi

  • K základním nástrojům sledování projektu nepatří: výzvy
  • Zjišťování stavu projektových úkolů se v projektovém managementu označuje jako: kontrola

Studie proveditelnosti pro regionální projekty

Přednášená studijní literatura

  • zde – výběr podle info na přednášce

Prezentace

  • není a nebude, pač literatura je dost ilustrativní a není třeba ji transformovat do podoby prezentace

Vybrané otázky a odpovědi

  • K posouzení realizovatelnosti projektu a z hlediska finančního též k zhodnocení efektivnosti využití potenciálně vložených prostředků, tedy ověření smysluplnosti projektu slouží: studie proveditelnosti
  • Studie proveditelnosti se vypracovává v: předinvestiční fázi projektu
  • Dokument, který hodnotí projekt na základě různých finančních ukazatelů a zároveň do hodnocení často zahrnuje posouzení finančního zdraví investora (realizátora projektu) se označuje jako: Appraisal Report (Hodnotící zpráva)
  • Výpočet bodu zvratu je součástí studie proveditelnosti v části věnované: finanční plán a analýza

Vedení projektu

Přednášená studijní literatura

  • zde – 4. kapitola celá

Prezentace

Vybrané otázky a odpovědi

  • Organizační struktura, kdy pozice a vztahy nadřízenosti a podřízenosti jsou uspořádány a orientovány vertikálně (každý nadřízený má jasně přidělené podřízené a každý podřízený má jasně přiděleného nadřízeného) je označován jako: liniová
  • Označení pro všechny osoby podílející se na realizaci projektu je: projektový tým

Plánování projektu

Přednášená studijní literatura

  • zde – 3. kapitola celá

Prezentace

Vybrané otázky a odpovědi

  • V projektovém plánování se obvykle vymezují balíky prací (s příslušnými časovými termíny a rozpočty), které se musí provést, aby byly splněny specifikace provedení cílů projektu. Ty se rutinně označují jako: WBS
  • Explicitní (v absolutním slova smyslu) měřítko nemají které nástroje časového plánování? síťové grafy

Projekt a projektový management

Přednášená studijní literatura

  • zde – 2. kapitola celá

Prezentace

Vybrané otázky a odpovědi

  • Jakákoliv množina aktivit a úkolů, které mají specifický a jasný cíl, definovaný počátek a konec řešení, finanční limitaci (= stanovené finanční prostředky), spotřebovávají lidské zdroje i jiné než lidské zdroje je označení pro: projekt
  • Tzv. projektový trojúhelník je tvořen třemi problémovými okruhy, které je neustále při práci na předmětu projektu třeba řešit. K této trojici nepatří (byť má při řešení projektů svůj význam): administrativa

Informace o projektech a podávání žádostí

Přednášená studijní literatura

Prezentace

Vybrané otázky a odpovědi

  • Pro podání projektu financovaného z prostředků EU jsou základní rámce stanoveny v materiálu, který nese označení: projektový dokument
  • V problematice regionálního rozvoje ČR pojem MS 2014+ znamená: elektronický systém podávání žádostí o podporu projektů

Program rozvoje venkova 2014 – 2020

Přednášená studijní literatura

  • zde je jeho znění

Prezentace

Vybrané otázky a odpovědi

  • Která aktivita OP PRV 2014-2020 se bude podílet největší části na celkové dotaci OP PRV? zajištění udržitelného hospodaření s přírodními zdroji a opatření v oblasti klimatu
  • MAS mohou být v letech 2014-2020 podporovány z: IROP a OP PRV