Svečias
Titulinis Mokymai Mokymų medžiaga Metodologiniai paketai Taikomoji regresija
Apie mokymus
Mokomieji duomenys
E. mokymai
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Pavyzdinis metodologinis mokomasis studijų paketas

TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Autorus Prof. habil. dr. Vydas Čekanavičius

Ankstesnis dokumentas Turinys  Literatūros sąrašas Duomenų šaltiniai Sekantis dokumentas

10. PROBIT REGRESIJA
10.3. Probit regresinė analizė su STATA
       10.3.2. Modelio tyrimas

Tirsime modelį Y = f(K35_1, K33_2, K37_1). Modelyje yra vienas kategorinis regresorius K35_1. Įvykdome komandą:

xi: probit  Y  i.K35_1 K33_2 K37_1

Regresorius K35_1 buvo kategorinis, įgyjantis keturias reikšmes. Todėl jis modelyje keičiamas trimis dichotominiais regresoriais, kurie įtraukiami į kintamųjų sąrašą. Kintamasis _IK35_1_2  atitinka K35_1 = 2,  _IK35_1_3  atitinka K35_1 = 3, _IK35_1_4  atitinka K35_1 = 4.

Didžiausio tikėtinumo Chi kvadrato kriterijaus statistika ir p reikšmė pateikiamos lentelės viršuje dešinėje pusėje. Matome, kad chi kvadrato statistka yra didelė (lygi 163,85) ir statistiškai reikšminga (jos p reikšmė 0,000..).  Faktiškai tai informacija, kad su pasirinktais regresoriais modelis gerai tinka duomenims, nors neaišku, ar visi kintamieji modelyje reikalingi. Kuo chi kvadrato reikšmė didesnė, tuo labiau tikėtina, kad logistinės regresijos modelis tinka. Ji ypač informatyvi tada, kai turime labai daug duomenų. Tada net ir statistiškai reikšminga, bet maža chi kvadrato reikšmė, kelia įtarimų dėl modelio gerumo.

Determinacijos pseudokoeficiento reikšmė pakankama (Pseudo R2 = 0.41) ir gerokai viršija 0,20 – tradicinę determinacijos koeficientams taikomą tinkamumo ribą. STATA pateikia Makfadeno determinacijos pseudokoeficientą.

Lentelėje yra modelio koeficientų įverčiai, tų įverčių 95% pasikliautinieji intervalai ir Voldo kriterijaus reikšmės.

STATA probit regresija sudaroma tikimybei Y = 1.

Taigi, sudarysime modelį dažnam studijų žinių naudojimui darbe. Norėdami gauti modelį retam žinių naudojimui, turėtume tiesiog perkoduoti Y (pakeisti 0 į 1, o 1 – į 0).

Gavome keturis modelius, kurie skiriasi tik konstanta. Juos galim užrašyti taip:

Įsitikinsime, kad modelio koeficientų ženklai atitinka sveiko proto reikalavimus. Koeficientas prie  K37_1 yra teigiamas. Jeigu respondentas renkasi didesnę K37_1 reikšmę (yra labiau patenkintas darbu), tai  labiau tikėtina, kad jis dažnai  naudoja studijų žinias darbe. Analogiškai darome išvadą, kad kuo labiau suvokia studijų žinių reikšmę, tuo didesnė tikimybė dažnai naudoti tas žinias darbe.

Norėdami gauti klasifikacinę lentelę, įvykdome komandą:

estat clas

D kategorija žymi dažną žinių naudojimą ( Y  = 1). Matome, kad iš 222 tokių respondentų teisingai atpažinti 205. Tai sudaro 92,34 % teisingų klasifikavimų. Analogiškai nustatome, kad iš 100 retai naudojančių studijų žinias teisingai klasifikuoti 66 (66%). Bendrasis teisingų klasifikavimų procentas  yra 84,16%. Tai rodo gerą modelio tikimą duomenims.

Galima papildomai suskaičiuoti  Pirsono chi kvadrato statistika. Jeigu p reikšmė ≥ 0,05, tai rodo gerą modelio tikimą. Tuo įsitikiname, įvykdę :

estat gof

Norėdami gauti informacinių kriterijų AIC ir BIC reikšmes (jie taikomi, kai lyginami du modeliai. Geresnis tas modelis, kurio AIC ir BIC mažesni), įvykdome
Norėdami gauti klasifikacinę lentelę, įvykdome komandą:

fitstat

Matome, kad ir visi pseudodeterminacijos koeficientai rodo pakankamai gerą modelio tikimą duomenims.

NAUJIEMS VARTOTOJAMS
NAUJIENOS
Naujienlaiškis

Nr.1  2009 07-11
Nr.2  2009 12-2010 02
Nr.3  2010 03-05
Nr.4  2010 06-08
Nr.5  2010 09-11
Nr.6  2010 12-2011 02
Nr.7 2011 03-05
Nr.8 2011 06-08
 
© KTU Politikos ir viešojo administravimo institutas
Atnaujinta 2018-05-02