Svečias
Titulinis Mokymai Mokymų medžiaga Metodologiniai paketai Taikomoji regresija
Apie mokymus
Mokomieji duomenys
E. mokymai
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Pavyzdinis metodologinis mokomasis studijų paketas

TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Autorus Prof. habil. dr. Vydas Čekanavičius

Ankstesnis dokumentas Turinys  Literatūros sąrašas Duomenų šaltiniai Sekantis dokumentas

9. MODIFIKUOTI SKAIČIUOJAMIEJI MODELIAI
9.3. Skaičiuojamų regresijos modelių palyginimas su STATA
       

Visi skaičiuojamieji regresijos modeliai (Puasono, perteklinių nulių Puasono, neigiamos binominės ir perteklinių nulių neigiamos binominės regresijos) turi labai nedaug tikimo duomenims rodiklių. STATA  programoje yra numatyta galimybė palyginti skirtingus modelius. Tam skirta komanda countfit.
Jau ne kartą modeliavome respondento darbuotojų skaičių (emplno), atsižvelgdami į jo prasimokytų metų skaičių (eduyrs), požiūrį į paskolas (brwmny, ar sunku pasiskolinti pinigų išgyvenimui, 1 – labai sunku, ..., 5 – labai lengva) ir tėvo turimų darbuotojų skaičių (emplnof2 (tėvo turimų darbuotojų skaičius, 0 – neturi, 1 – turi).  Modelis: emplno = f(eduyrs, brwmny, brwmny).

Kokius modelius norime lyginti, nurodome užrašydami:
  • prm – Puasono regresijai,
  • nbreg – neigiama binominė regresijai
  • zip – perteklinių nulių Puasono regresijai
  • zinb – perteklinių nulių neigiama binominė regresijai.

Atitinkamuose skyreliuose įsitikinome, kad šiems duomenims tinka ir perteklinių nulių Puasono regresijos  ir neigiamos binominės regresijos modeliai. Palyginsime tuos du modelius:

countfit  emplno eduyrs brwmny emplnof2 , inflate(  emplnof2)  zip nbreg

Visų pirma, aptarsime liekamųjų paklaidų grafikus. Kuo liekamosios paklaidos arčiau nulio (x-ų ašies, tuo modelis geresnis). Matome, kad abudu modeliai šiuo atžvilgiu pakankamai geri ir elgiasi panašiai. Nulius ir vienetus truputį geriau modeliuoja neigiama binominė regresija (NBRM).

Rezultatų išklotinės pradžioje pateikiama abiejų modelių koeficientų eksponentės (exp{b_j}) ir jų t – reikšmės. Pavyzdžiui, regresoriaus eduyrs toks eksponentinis koeficientas neigiamos binominės regresijos modelyje yra 1,332, o perteklinių nulių Puasono modelyje (ZIP) 1,203. Kai kurie koeficientai skiriasi radikaliai ( 5,1  ir 55,6). Kai kurios Voldo kriterijaus t reikšmės irgi skiriasi keletą kartų (-2,72 ir -34,81).


Neigiamos binominės regresijos (NBRM) atveju pateiktas parametro alpha logaritmo įvertis (5.327). Perteklinių nulių modeliui pateikti rezultatai apie logistinį (nulinukų) modelį.Įdomiausi rezultatai yra grafoje Statistics. Čia yra abiejų modelių didžiausio tikėtinumo funkcijos logaritmų išraiškos: -133,95 ir -598,82. Abi jos pakankamai didelės. Kuo didžiausio tikėtinumo funkcijos logaritmo reikšmė absoliutiniu didumu didesnė, tuo geriau modelis tinka. Pagal šį rodiklį geriau tiktų ZIP . Galų gale nurodytos informacinių indeksų BIC ir AIC reikšmės. Kuo šios reikšmės mažesnės, tuo modeliai geriau tinka. Pagal šį rodiklį žymiai geresnis būtų NBRM modelis.

Kitoje lentelėje išrašytos abiejų modelių didžiausios liekamosios paklaidos, kartu nurodant kur jos buvo. Šalia užrašytos liekamųjų paklaidų vidurkio absoliutinės reikšmės. Faktiškai ši lentelė pateikia tą pačią informaciją, kaip ir grafikas. Matyti, kad didžiausias neatitikimas buvo modeliuojant reikšmę 2. Vis dėlto abiejų modelių neatitikimai labai nedideli, mažos ir vidutinės paklaidos. Pagal šiuos rodiklius truputį geresnis atrodo NBRM modelis.



Dar vienoje lentelėje išrašytos stebimos 0 – 9  tikimybės (t.y. kurią dalį stebėjimų sudarė atitinkamos reikšmės) ir prognozuojamos, taikant vieną ir kitą metodus (regresorius, laikant lygiais jų vidutinėms reikšmėms). Kuo mažiau skiriasi tikimybės, tuo modelis geresnis. Vis dėlto, įžiūrėti tuos skirtumus sudėtinga, todėl jų absoliutiniai didumai pateikti stulpelyje |Diff|. Stulpelyje Perason išrašyta tų skirtumų indėliai į Pirsono statistikos reikšmę. Atmetant detales, galima pasakyti, kad kuo šio  reikšmė didesnė, tuo blogesnis tikimas. Užmetę akį į paskutinius du stulpelius, nustatome, kad NBRM modelis tikslesnis už ZIP modelį.
Paskutinėje lentelėje pateikiama reziume apie modelius, atsižvelgiant į informacinius indeksus. Matome, kad NBRM modelis atrodo daug geriau, nei ZIP.


Pastabos. Kartojant countfit komandą su kitais modeliais, reikia komandos gale pridėti replace. Priešingu atveju gausime pranešimą apie klaidą. Jeigu nenurodome, kuriuos modelius norime lyginti, tai palyginami visi keturi modeliai.

Galutinė lyginamosios analizės išvada – neigiamos binominės regresijos modelis tiko duomenims daug geriau, nei perteklinių nulių Puasono modelis.

 

NAUJIEMS VARTOTOJAMS
NAUJIENOS
Naujienlaiškis

Nr.1  2009 07-11
Nr.2  2009 12-2010 02
Nr.3  2010 03-05
Nr.4  2010 06-08
Nr.5  2010 09-11
Nr.6  2010 12-2011 02
Nr.7 2011 03-05
Nr.8 2011 06-08
 
© KTU Politikos ir viešojo administravimo institutas
Atnaujinta 2015-06-18