Svečias
Titulinis Mokymai Mokymų medžiaga Metodologiniai paketai Taikomoji regresija
Apie mokymus
Mokomieji duomenys
E. mokymai
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Pavyzdinis metodologinis mokomasis studijų paketas

TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Autorus Prof. habil. dr. Vydas Čekanavičius

Ankstesnis dokumentas Turinys  Literatūros sąrašas Duomenų šaltiniai Sekantis dokumentas

2. TIESINĖ REGRESINĖ ANALIZĖ
2.3. Tiesinė regresinė analizė su STATA
     
2.3.9. Žingsninė regresija

Parodysime, kaip atliekama žingsninė (pažingsninė, keliaetapė) regresija, nagrinėdami ESS4 Lietuvos duomenis. Tiriame visus 20 – 30 metų respondentus. Norime išsiaiškinti, nuo ko priklauso pasitikėjimas Seimu. Tirsime modelį

trstprl = f( stfeco, stflife, stfgov, stfdem, stfedu, stfhlth).

Čia trstprl  yra pasitikėjimas parlamentu,  stfeco, stflife, stfgov, stfdem, stfedu, stfhlth atitinkamai – pasitenkinimas ekonomika, gyvenimu apskritai, vyriausybe, demokratijos padėtimi, švietimo būkle, sveikatos apsauga. Visi kintamieji intervaliniai (0-9 arba 10), didesnė reikšmė rodo palankesnį požiūrį. Norima sužinoti, kuri sritis daro didesnę įtaką parlamento autoritetui. Panaudosime žingsninę regresiją. Žingsniuoti galima ir į priekį ir atgal (akumuliuojant, kaupiant kintamuosius arba eliminuojant, šalinant kintamuosius). Todėl ir atitinkamų regresijų yra ne viena. Išbandysime du tokių regresijų modelius.

Duomenis dta  formatu išsaugojome, naudodami SPSS programą. Todėl, norėdami išvengti neteisingo praleistų reikšmių traktavimo paliekame tik reikiamus respondentus:

keep if agea >= 20 & agea <= 30 & stfeco < 11 & trstprl < 11&  stflife < 11 & stfgov < 11
&  stfdem < 11 & stfedu < 11 &  stfhlth < 11

Tyrimą pradėsime nuo regresijos, kai „žingsniuojama pirmyn ir tik pirmyn“, t.y., kai į modelį  įtraukiami vis nauji statistiškai reikšmingi regresoriai (akumuliujančioji, kaupiamoji regresija, angl. forward stepwise regression). Procesas baigiamas, kai neįtraukti lieka tik statistiškai nereikšmingi regresoriai. Įvykdome komandą:

sw reg  trstprl  stflife stfeco stfgov stfdem stfedu stfhlth, pe(0.05) beta

Parinktis pe(0.05) reiškia, kad į modelį bus įtraukti tik tie regresoriai, kuriems t kriterijaus p reikšmė mažesnė už 0,05.

Matome, kad modelis vis buvo pildomas, pridedant naują regresorių. Į galutinį modelį nepakliuvo stfedu ir stfeco.  Determinacijos koeficientas R2 = 0,41. Galutinis modelis:

trstprl =  0,70 + 0,44 stfgov + 0,17 stfdem – 0,09 stflife + 0,09 stfhlth.

Tūlas politikas tokį rezultatą (neteisingai) gali interpretuoti taip: norint, kad jauno amžiaus rinkėjai labiau gerbtų parlamentą, reikia rūpinantis sveikatos apsauga, puoselėti demokratiją ir prižiūrėti, kad gerai dirbtų vyriausybė (koeficientai prie šių regresorių yra teigiami) . Be to, nėra ko labai stengtis, kad žmonės jaustųsi laimingi (koeficientas prie stflife) neigiamas. Na, o ekonomikos ir švietimo būklė požiūrio į parlamentą neveikia (kintamieji buvo statistiškai nereikšmingi). Prie šios interpretacijos dar grįšime, o dabar tiems patiems duomenims pritaikykime kitą modelį.

Pasirinksime regresiją, kai „žingsniuojama atgal ir tik atgal“, t.y., kai pradedama nuo modelio su visais regresoriais, palaipsniui po vieną vis šalinant statistiškai nereikšmingus iš jų (eliminuojančioji, šalinamoji regresija, angl. backward stepwise regression). Procesas baigiamas, kai modelyje lieka tik statistiškai reikšmingi regresoriai. Įvykdome komandą:

sw reg  trstprl  stflife stfeco stfgov stfdem stfedu stfhlth, pr(0.05) beta

Parinktis pr(0.05) reiškia, kad iš modelio bus šalinami tie regresoriai, kuriems t kriterijaus p reikšmė nemažesnė už 0,05.

Matome, kad modelis vis buvo siaurinamas, šalinant regresorius. Gautasis modelis niekuo nesiskiria nuo ankstesnio (taip būna ne visada). Ramybės dėlei patikriname multikolinearumą. Įvykdome:

estat vif

Visų regresorių VIF < 4. Taigi, formaliai žiūrint, jokio kintamųjų multikolinearumo nėra.
Dabar įsitikinsime, kad modelis nėra teisingas. Pažiūrėkime kintamųjų koreliacijas. Įvykdome

corr  trstprl  stflife stfeco stfgov stfdem stfedu stfhlth

Matome, kad trstprl su visais kintamaisiai koreliuoja teigiamai. Taigi, regresijos modelyje ženklas prie stflife yra neteisingas (ir politiko išvada, kad geriau, kai respondentai nelaimingi). Mes susidūrėme su tipine multikolinearumo problema. Visi kintamieji stipriai koreliuoja, nors VIF jiems ir nėra labai dideli (apie tai žr. ankstesnį skyrelį). Įdomu, kad pašainus iš modelio kintamąjį stflife, jis lieka visai tinkamas: R2 = 0,395 (o buvo R2 = 0,407).

Dabar pažiūrime, kaip atrodo modelis, kai trstprl regresuojame pagal stfedu:


Nors šis modelis ir blogiau tinka, nei ankstesnieji, bet visai jo atmesti negalima. Jeigu politikas tyrimą būtų pradėjęs nuo šio modelio, tai darytų išvadą, kad pasitikėjimas parlamentu auga, kai gerėja ekonominė situacija.
Kokią išvadą galimą padaryti iš pateiktųjų pavyzdžių? Kokią regresiją bepasirinktume, gautą modelį reikia įvertinti kritiškai, būtina pažiūrėti koreliacijas, ir pamąstyti apie modelio suderinamumą su sveiku protu (žinoma teorija, ankstesniais tyrimais ir pan.)

Atlikus žingsninę regresiją, būtina patikrinti modelio logiškumą. Neapsiriboti tik formaliais statistikos rodikliais.

 

NAUJIEMS VARTOTOJAMS
NAUJIENOS
Naujienlaiškis

Nr.1  2009 07-11
Nr.2  2009 12-2010 02
Nr.3  2010 03-05
Nr.4  2010 06-08
Nr.5  2010 09-11
Nr.6  2010 12-2011 02
Nr.7 2011 03-05
Nr.8 2011 06-08
 
© KTU Politikos ir viešojo administravimo institutas
Atnaujinta 2015-06-18