TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE
Pavyzdinis metodologinis mokomasis studijų paketas
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE
Autorus Prof. habil. dr. Vydas Čekanavičius |
|
9. MODIFIKUOTI SKAIČIUOJAMIEJI MODELIAI
9.3. Skaičiuojamų regresijos modelių palyginimas su STATA
Visi skaičiuojamieji regresijos modeliai (Puasono, perteklinių nulių Puasono, neigiamos binominės ir perteklinių nulių neigiamos binominės regresijos) turi labai nedaug tikimo duomenims rodiklių. STATA programoje yra numatyta galimybė palyginti skirtingus modelius. Tam skirta komanda countfit.
Jau ne kartą modeliavome respondento darbuotojų skaičių (emplno), atsižvelgdami į jo prasimokytų metų skaičių (eduyrs), požiūrį į paskolas (brwmny, ar sunku pasiskolinti pinigų išgyvenimui, 1 – labai sunku, ..., 5 – labai lengva) ir tėvo turimų darbuotojų skaičių (emplnof2 (tėvo turimų darbuotojų skaičius, 0 – neturi, 1 – turi). Modelis: emplno = f(eduyrs, brwmny, brwmny).
Kokius modelius norime lyginti, nurodome užrašydami:
- prm – Puasono regresijai,
- nbreg – neigiama binominė regresijai
- zip – perteklinių nulių Puasono regresijai
- zinb – perteklinių nulių neigiama binominė regresijai.
|
Atitinkamuose skyreliuose įsitikinome, kad šiems duomenims tinka ir perteklinių nulių Puasono regresijos ir neigiamos binominės regresijos modeliai. Palyginsime tuos du modelius:
countfit emplno eduyrs brwmny emplnof2 , inflate( emplnof2) zip nbreg |
Visų pirma, aptarsime liekamųjų paklaidų grafikus. Kuo liekamosios paklaidos arčiau nulio (x-ų ašies, tuo modelis geresnis). Matome, kad abudu modeliai šiuo atžvilgiu pakankamai geri ir elgiasi panašiai. Nulius ir vienetus truputį geriau modeliuoja neigiama binominė regresija (NBRM).
Rezultatų išklotinės pradžioje pateikiama abiejų modelių koeficientų eksponentės (exp{b_j}) ir jų t – reikšmės. Pavyzdžiui, regresoriaus eduyrs toks eksponentinis koeficientas neigiamos binominės regresijos modelyje yra 1,332, o perteklinių nulių Puasono modelyje (ZIP) 1,203. Kai kurie koeficientai skiriasi radikaliai ( 5,1 ir 55,6). Kai kurios Voldo kriterijaus t reikšmės irgi skiriasi keletą kartų (-2,72 ir -34,81).

Neigiamos binominės regresijos (NBRM) atveju pateiktas parametro alpha logaritmo įvertis (5.327). Perteklinių nulių modeliui pateikti rezultatai apie logistinį (nulinukų) modelį.Įdomiausi rezultatai yra grafoje Statistics. Čia yra abiejų modelių didžiausio tikėtinumo funkcijos logaritmų išraiškos: -133,95 ir -598,82. Abi jos pakankamai didelės. Kuo didžiausio tikėtinumo funkcijos logaritmo reikšmė absoliutiniu didumu didesnė, tuo geriau modelis tinka. Pagal šį rodiklį geriau tiktų ZIP . Galų gale nurodytos informacinių indeksų BIC ir AIC reikšmės. Kuo šios reikšmės mažesnės, tuo modeliai geriau tinka. Pagal šį rodiklį žymiai geresnis būtų NBRM modelis.
Kitoje lentelėje išrašytos abiejų modelių didžiausios liekamosios paklaidos, kartu nurodant kur jos buvo. Šalia užrašytos liekamųjų paklaidų vidurkio absoliutinės reikšmės. Faktiškai ši lentelė pateikia tą pačią informaciją, kaip ir grafikas. Matyti, kad didžiausias neatitikimas buvo modeliuojant reikšmę 2. Vis dėlto abiejų modelių neatitikimai labai nedideli, mažos ir vidutinės paklaidos. Pagal šiuos rodiklius truputį geresnis atrodo NBRM modelis.

Dar vienoje lentelėje išrašytos stebimos 0 – 9 tikimybės (t.y. kurią dalį stebėjimų sudarė atitinkamos reikšmės) ir prognozuojamos, taikant vieną ir kitą metodus (regresorius, laikant lygiais jų vidutinėms reikšmėms). Kuo mažiau skiriasi tikimybės, tuo modelis geresnis. Vis dėlto, įžiūrėti tuos skirtumus sudėtinga, todėl jų absoliutiniai didumai pateikti stulpelyje |Diff|. Stulpelyje Perason išrašyta tų skirtumų indėliai į Pirsono statistikos reikšmę. Atmetant detales, galima pasakyti, kad kuo šio reikšmė didesnė, tuo blogesnis tikimas. Užmetę akį į paskutinius du stulpelius, nustatome, kad NBRM modelis tikslesnis už ZIP modelį.
Paskutinėje lentelėje pateikiama reziume apie modelius, atsižvelgiant į informacinius indeksus. Matome, kad NBRM modelis atrodo daug geriau, nei ZIP.

Pastabos. Kartojant countfit komandą su kitais modeliais, reikia komandos gale pridėti replace. Priešingu atveju gausime pranešimą apie klaidą. Jeigu nenurodome, kuriuos modelius norime lyginti, tai palyginami visi keturi modeliai.
Galutinė lyginamosios analizės išvada – neigiamos binominės regresijos modelis tiko duomenims daug geriau, nei perteklinių nulių Puasono modelis. |
