Svečias
Titulinis Mokymai Mokymų medžiaga Metodologiniai paketai Taikomoji regresija
Apie mokymus
Mokomieji duomenys
E. mokymai
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Pavyzdinis metodologinis mokomasis studijų paketas

TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Autorus Prof. habil. dr. Vydas Čekanavičius

Ankstesnis dokumentas Turinys  Literatūros sąrašas Duomenų šaltiniai Sekantis dokumentas

9. MODIFIKUOTI SKAIČIUOJAMIEJI MODELIAI
9.1. Perteklinių nulių Puasono regresijos modelis
       9.1.2. Perteklinių nulių Puasono regresija su STATA

Atliksime tą pačią analizę, kaip ir nagrinėdami neigiamą binominę regresiją. Tiriame Švedijos duomenis ESS4SE. Modeliuojame emplno (turimų darbuotojų skaičius) priklausomybę nuo regresorių

  • brwmny (ar sunku pasiskolinti pinigų išgyvenimui, 1 – labai sunku, ..., 5 – labai lengva),
  •  eduyrs (prasimokytų metų skaičius),
  • emplnof2 (tėvo turimų darbuotojų skaičius, 0 – neturi, 1 – turi).

Atidarius failą su STATA dar įvykdome: keep if emplno < 900 & emplnof < 4 & eduyrs < 88 & brwmny < 8.
Puasono modeliui pasirinksime tokius regresorius: brwmny, eduyrs, emplnof2. Logistiniame modelyje apsiribosime vienu regresoriumi – emplnof2. Regresorių parinkimas modeliams remiasi teoriniais samprotavimais ir praktiniais bandymais. Teoriškai bandome išmąstyti, nuo ko priklauso – turės respondentas darbuotojų, ar neturės (logistinis modelis) ir, nuo ko priklauso darbuotojų skaičius,  jeigu jų respondentas turi (Puasono modelis). Praktiniai bandymai reiškia, kad išbandomi keli variantai, ir renkamasis geriausias.  Perteklinių nulių Puasono regresija atliekama, įvykdant:

zip emplno eduyrs brwmny emplnof2 , inflate(  emplnof2) vuong


Didžiausio tikėtinumo chi kvadrato statistikos (3477,94) p reikšmė (0,000) daug mažesnė už 0,05. Tai rodo gerą modelio bendrąjį tinkamumą.
Pirmoji lentelės dalis skirta Puasono regresijai. Visos interpretacijos išlieka, kaip ir Puasono regresijos atveju. Pavyzdžiui,  teigiama emplnof2 regresoriaus koeficiento reikšmė rodo, kad daugiau darbuotojų turi tie respondentai, kurių tėvai irgi turi samdomų darbuotojų. Matome, kad pagal Voldo testą visi regresoriai statistiškai reikšmingi. Antroji lentelės dalis (inflate) yra skirta logistiniam modeliui, padedančiam atskirti nulinukus nuo likusiųjų respondentų. Matome, kad regresorius inflate  yra statistiškai reikšmingas. Lentelės pabaigoje pateikiamas Vuong testas, palyginantis nagrinėtąjį modelį su paprastu Puasono regresijos modeliu. Testo p reikšmė lygi 0,0169 < 0,05. Todėl hipotezę, kad modeliai nesiskiria atmetame.
Norėdami gauti išsamesnę informaciją apie koeficientų eksponentes ir kitas charakteristikas, galime įvykdyti:
listcoef


 
Pateikėme tik trumpą rezultatų fragmentą, skirtą ne nulinukų grupei. Kiekvieneri papildomai prasimokyti metai didina vidutinį turimų darbuotojų skaičių 1,203 karto.
Reikšmės prognozuojamos analogiškai Puasono regresijai. Pavyzdžiui, padarysime prognozes visoms (realiai pimoms dešimčiai) tikimybių, kai emplnof2 = 1. Kitų regresorių reikšmės bus paimtos lygios jų vidurkiui. Įvykdome:

prvalue, x(emplnof2 = 1)


Visos tikimybės įvertintos tam atvejui, kai emplnof2 = 1, eduyrs = 11,71 (eduyrs  vidurkis yra lygus 11,71), brwmny = 3.68. Vidutinis tikėtinas darbuotojų skaičius – 8,409. Tikimybė, kad respondentas yra iš nulinukų grupės, lygi 0,529. Tikimybė, kad respondentas turi aštuonis darbuotojus lygi 0,0021 ir t.t.

NAUJIEMS VARTOTOJAMS
NAUJIENOS
Naujienlaiškis

Nr.1  2009 07-11
Nr.2  2009 12-2010 02
Nr.3  2010 03-05
Nr.4  2010 06-08
Nr.5  2010 09-11
Nr.6  2010 12-2011 02
Nr.7 2011 03-05
Nr.8 2011 06-08
 
© KTU Politikos ir viešojo administravimo institutas
Atnaujinta 2018-05-02