Svečias
Titulinis Mokymai Mokymų medžiaga Metodologiniai paketai Taikomoji regresija
Apie mokymus
Mokomieji duomenys
E. mokymai
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Pavyzdinis metodologinis mokomasis studijų paketas

TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Autorus Prof. habil. dr. Vydas Čekanavičius

Ankstesnis dokumentas Turinys  Literatūros sąrašas Duomenų šaltiniai Sekantis dokumentas

2. TIESINĖ REGRESINĖ ANALIZĖ
2.1. Tiesinės regresijos modelis
     
2.1.6. Modelio tobulinimas

Beveik visada  modelio tobulinimas reiškia kintamųjų šalinimą arba jų transformaciją.


Pašalinus bent vieną regresorių, keičiasi visos modelio charakteristikos: R2p reikšmės, VIF, Kuko mato reikšmės.

Modelis tobulinamas, jeigu yra problemų:

  • R2  < 0,20. Regresorių šalinimas šiuo atveju nelabai padeda. Juos prasmingiau keisti kitais regresoriais. Dalis statistikų mano, kad ir mažiems R2( 0,15 – 0,19) dar galima modelio neatmesti. Ypač, jeigu modelio ryšiai puikiai atitinka ekonominę (ar kitokią) logiką.

  • Yra statistiškai nereikšmingas kintamasis (t testo p reikšmė didesnė už 0,05). Kintamasis pašalinamas iš modelio ir regresinė analizė pakartojama be jo. Viskas gerai, jeigu R2 daug nesumažėjo (ką reiškia daug – sprendžia pats tyrėjas). Pristatydami galutinį modelį, tada rašysime, kad modelyje liko tik statistiškai reikšmingi kintamieji. Jeigu R2  stipriai sumažėjo (pvz., nuo 0,35 iki  0,20), tai kintamąjį į modelį grąžiname, o aprašyme konstatuojame, kad „kintamasis buvo statistiškai nereikšmingas. Vis  dėlto, jis paliktas modelyje, nes be jo labai sumažėja determinacijos koeficientas“.

  • Yra multikolinearumo problema (yra VIF > 4 arba modelis neteisingai atspindi Y ir regresoriaus priklausomybę).  Tada, arba kintamąjį šaliname ir tikriname R2 sumažėjimą, arba kelis, stipriai koreliuojančius regresorius, keičiame jų vidurkiu. Žinoma, keičiame tik tada, jeigu toks vidurkis prasmingas.  Pavyzdžiui, jeigu modeliuosime mokinio valstybinio egzamino pažymį atsižvelgdami į keturių lygiaverčių ekspertų nuomones, tai multikolinearumo neišvengsime (nebus taip, kad tas pats mokinys vienam ekspertui atrodys Einšteino reinkarnacija, o kitam – alternatyviai protingas). Tada logiškiau sudaryti modelį, atsižvelgiant į visų keturių ekspertų nuomonių vidurkį, o ne  į kažkurio vieno eksperto nuomonę.

  • Imtyje yra išskirčių (yra didelių Kuko mato arba DFB reikšmių). Gali būti, kad duomenyse tiesiog pasitaikė duomenų įvedimo klaida, arba sugebėjome praleistos reikšmės kodą (pvz. atvejį, kai kintamojo  vaikų skaičius reikšmė  99 tereiškia, kad respondentui klausimas netaikytinas nes jis vienuolis, o ne itin daugiavaikis tėvas) traktuoti, kaip eilinį stebėjimą. Šiaip jau išskirties šalinti vien todėl, kad ji netinka regresijos modeliui  negalima. Rekomenduojama, radus išskirtį, pakartoti regresinę analizę be jos. Jeigu gavome labai panašų modelį, tai išskirtis nėra kenksminga, ir dėl jos nėra ko sukti galvos. Kitu atveju, išeitimi gali tapti atsparioji  regresija (žr. atitinkamą skyrelį).

  • Duomenys heteroskedastiški. Gero heteroskedastiškumo problemos sprendimo nėra. Neretai duomenys transformuojami, pavyzdžiui, visos kintamųjų reikšmės logaritmuojamos. Dar dažniau (ypač socialiniuose tyrimuose) duomenų heteroskedastiškumas paprasčiausiai ignoruojamas. Net netiriamas.

  • Yra autokoreliacija. Jeigu buvo galima įtarti, kad stebėjimai susiję ir Durbino – Vatsono statistikos reikšmė artima nuliui arba keturiems, tai turime autokoreliuotus stebėjimus. Tada regresijos modelis netinka ir reikia taikyti sudėtingesnius laiko eilučių metodus, kurių čia neaptarsime.

NAUJIEMS VARTOTOJAMS
NAUJIENOS
Naujienlaiškis

Nr.1  2009 07-11
Nr.2  2009 12-2010 02
Nr.3  2010 03-05
Nr.4  2010 06-08
Nr.5  2010 09-11
Nr.6  2010 12-2011 02
Nr.7 2011 03-05
Nr.8 2011 06-08
 
© KTU Politikos ir viešojo administravimo institutas
Atnaujinta 2015-06-18