
LIMDEP
Jde o software určený k analýze ekonomických dat a jeden z nejdůležitějších ekonometrických programů vůbec. Následující platí pro NLOGIT4 bežící s LIMDEP9 na platformě Windows10.
Prostředí
Filozoficky je založen na práci v projektech – koncovka *.LPJ. Projekt je primárně prostor správy dat, se kterými pracuji – nejdůležitější jsou data pro analýzu. Vlastní statistická práce se děje buď přes průvodce, kteří jsou podobní jako ve Statistica (k nim se dá dostat přes roletky a jednotlivé karty) nebo zadáváním příkazů ručně jako v R v “klasickém” textovém editoru (viz níže) – ty lze uložit jako *.LIM. Kromě těchto dvou součástí existuje ještě třetí, která nese název “Output” a je rozdělena do dvou částí – ve vrchní je Trace, kde jsou dokumentovány veškeré provedené kroky (především odeslané příkazy a stavy systému, ke kterým tyto příkazy vedly), ve spodní je vlastní Output, kde jsou postupně zobrazovány výsledky všech provedených příkazů. Uložit jej lze taktéž s koncovkou *.LIM. To je dost nešťastné a je třeba si odlišovat názvy, co jsou soubory s příkazy a co s výstupy.
Popis prostředí na videu zde.
POZOR – vše ukládáme pomocí panelu nabídky – ta se mění podle toho, jestli jsem nakliknut v projektu, v příkazech nebo výstupech – je třeba si dávat pozor na to, co ukládám – podobně jako ve Statistica.
Vstupní data
Existuje nekonečně mnoho způsobů jak dostat data do programu. V kombinaci s Windows10 mi však “normálně” funguje jediný postup.
Před importem dat je třeba nejprve nastavit “Work Areas”, primární je nastavit počet buněk a následně řádků tak, aby se mi do toho vešla veškerá data a proměnné, které hodlám dopočítávat. Postup je zde:
Přestože data lze v LIMDEP v podstatě jakkoliv upravit, důrazně doporučuji udělat veškeré úpravy dat v MS Excel a do LIMDEP importovat finální soubor. Postup je na videu.
Pravidla pro názvy proměnných:
- název proměnné může mít max. 8 znaků a z nich jen číslice, písmena a dolní podtržítko”_”
- vyhrazená slova jsou na s. R3-16 nahoře
Pravidla pro data:
- mohou nabývat pouze číselné hodnoty (s desetinnou tečkou) – nominální proměnné kódu pouze čísly
- čísla se oddělují mezerami a/nebo čárkami
- chybějící data musí být označeny něčím jiným než číslem – znamená to čímkoliv, nejlépe je na dané místo napsat “m”
- POZOR – Data Editor” zobrazuje jen 1900 případů – zkutečný počet pozorování se dozvíte v jeho okně na řádku vlevo nahoře, společně s počtem řádků a počtem obsazených proměnných.
Proměnné lze grupovat do různých skupin – k tomu slouží příkaz
Transformace dat
Panel data
Syntaxe
- specifikace lze psát na samostatné řádky
- pod sebe mohu napsat několik příkazů
- příkaz musí vždy začínat na novém řádku a končit symbolem “$”
- ignorovány jsou nadbytečné mezery i prázdné řádky
- komentáře, které program rozpozná jako něco, co není příkaz nebo specifikace, a nevadí mu to při vykonání, se píší na konec řádku za “?” – nesmí za ním ale následovat konec “$”, pač ho program nenajde
- blok komentářů (= textu ignorovaného programem) se píše tak, že na začátku řádku uvedeme “/*” a na konci “*/”, komentář může zahrnovat mnoho řádků a nesmí zasahovat žádnou svou částí na řádky, kde jsou příkazy
- některé specifikace nemají parametry, ale pouze říkají, že model má být takový, např. ; Panel
Drtivá většina příkazů má strukturu odvozenou on tohoto modelu:
Výstupy výpočtů
- ; All $, pak dostanete info k šikmosti a špičatosti
- ; Normality test, pak k tomu budete mít i test normality dat, což je největší výhoda tohoto software oproti Statistica
- ; Output = 1, pak dostanete i kovariační matici
- ; Output = 2, pak dostanete i korelační matici
- ; Output = 3, pak dostanete obě matice
- ; Quantiles, pak dostanete kvantily (decily)
- a pokud za ně zadáte ještě ; Plot, pak dostanete ještě Norm-Quantile Plot
- když místo toho zadáte ; Box Plots, pak dostanete krabicový graf
- místo specifikace ; Str lze použít ; Pds = číslo $, kterým se udává počet případů, které tvoří skupinu v balanced panel data
- nejzajímavější specifikace je pak ; FPC = počet členů základního souboru $, který Vám vrátí s.e. a 95% konfidenční intervaly upravené právě podle počtu celkové populace (což je výhodné u sociologických výzkumů)
- další možnou specifikací je ; Cluster = stratifikační proměnná $, která Vám dá stejný výsledek jako ; Str plus s.e.
LIMDEP
- dělá automaticky 40 intervalů, lze nastavit pomocí ; Int = počet skupin
- lze zadat levé hranice intervalů ; Limits = hranice oddělené čárkou a mezerou
- Limits a Int lze kombinovat
- lze vytvořit max 90 intervalů
- lze omezit jejich počtem podmínkou ; If [proměnná <= číslo] ; Rhs = jméno proměnné $
- lze dělat do počtu 4 proměnných, kde se všechny zadávají jako Rhs nebo stratifikací příkazem ; Group = stratifikační proměnná (kategorií může být max 4)
- počet proměnných a Group lze kombinovat
- pomocí ; Choice = kategorie z daní proměnné – lze tedy z proměnné zobrazit jen některé kategorie (ty lze například i dělit dále pomocí ; Group)
Regrese
- ; Keep = jméno nové proměnné – uloží očekávané hodnoty do proměnné zadaného jména
- ; Res = jméno nové proměnné – uloží reziduály do proměnné zadaného jména
- ; List – zobrazí obě předchozí a další informace k provedené regresi (viz R10-33 dole)
- ; Fill – zadá-li se ; Keep = jméno proměnné , pak dopočítá očekávané hodnoty i pro pozorování, která nebyla součástí výpočtu – výpočet byl proveden na “actual sample”, který netvořily všechny případy, jde tak o vanikající nástroj pro dopočítávání predikčního hodnot (příklad s regresemi ja na s. R10-32 a R10-33)