Svečias
Titulinis Mokymai Mokymų medžiaga Metodologiniai paketai Taikomoji regresija
Apie mokymus
Mokomieji duomenys
E. mokymai
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Pavyzdinis metodologinis mokomasis studijų paketas

TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Autorus Prof. habil. dr. Vydas Čekanavičius

Ankstesnis dokumentas Turinys  Literatūros sąrašas Duomenų šaltiniai Sekantis dokumentas

2. TIESINĖ REGRESINĖ ANALIZĖ
2.2. Tiesinė regresinė analizė su SPSS
     
2.2.3. Pirminio modelio tyrimo rezultatai

Rezultatų išklotinė prasideda nuo lentelėje Descriptive Statistics pateikiamos informacijos apie visų modelio kintamųjų vidurkius is standartinius nuokrypius. Matome, kad imtyje buvo 212 respondentų. Prisiminę kintamųjų kodus, galime konstatuoti, kad respondentai nelabai pasitiki visomis institucijomis, išskyrus Jungtines tautas.

Tiesinės regresijos modelyje visi intervalinai regresoriai turi koreliuoti su priklausomu modeliujamuoju kintamuoju. Kita vertus, tarpusavyje regresoriai neturėtų stipriai koreliuoti. Koreliacijų lentelė Correalations rodo, kad visi regresoriai su kintamuoju satisfaction koreliuoja statistiškai reikšmingai, o koreliacijos vidutinio stiprumo. Be to, visos koreliacijos yra teigiamos. Koreliacijų ženklai svarbūs tuo, kad nurodo, kokios turi būti priklausomybės pačiame regresijos modelyje. Tiriamu atveju, visi regresijos modelio koeficientai turi būti teigiami. Vis dėlto, matome, kad regresoriai stipriai koreliuoja vieni su kitais. Todėl galima tikėtis, kad gali kilti multikolinearumo problema (regresoriai pradės vienas kitam trukdyti).

Lentelėje Model Summary randame determinacijos koeficientą R2sub> = 0,596. Primename, kad modelis nelabai tinkamas, jeigu R2< 0,20. Darome išvadą, kad  determinacijos koeficientas pakankamai didelis ir tiesinės regresijos modelio atmesti, kaip netinkamo, dar negalima. Koreguotasis R2  šiam modeliui neaktualus, nes respondentų  yra keliasdešimt kartų daugiau, nei regresorių.

ANOVA  kriterijaus p reikšmė yra mažesnė už 0,05 (mažesnė net už 0,01). Todėl darome išvadą, kad modelyje yra bent vienas regresorius, nuo kurio priklauso satisfaction.

Lentelėje  Coefficients pateikiama pagrindinė informacija apie modelio koeficientus.

Patys koeficientų įverčiai yra stulpelyje Unstandardized Coefficients B. Visų pirma išsiaiškinsime, kaip užrašyti matematinį regresijos modelio pavidalą, kurį galima naudoti prognozėms. Reikia koeficientus padauginti iš šalia parašytų kintamųjų ir sudėti. Konstanta pridedama tokia, koks yra jos įvertis. Gauname tokį modelį:

Visų koeficientų ženklai teigiami, kaip ir turėjo būti, sprendžiant pagal koreliacijas. Norėdami suprasti, kuris kintamasis modelyje svarbesnis, pasižiūrime į Standardized Coefficients Beta. Matome, kad mažiausiai modelyje svarbus kintamasis trstprt, nes jo standartizuotasis beta koeficientas lygus 0,034. Stulpelyje t pareikiamos Stjudento kriterijaus reikšmės, o stulpelyje Sig.  – Stjudento kriterijaus p reikšmės kiekvienam koeficientui. Jeigu p < 0,05, tai sakome, kad atitinkamas kintamasis statistiškai reikšmingas. Matome, kad kintamieji trstprl, trstlgl, trstun ir happy yra statistiškai reikšmingi, o kintamieji trstplt ir trstun statistiškai nereikšmingi. Todėl modelį reikės tobulinti. Vis dėlto parodysime, kur pateikiama likusi modelio informacija. Stulpelyje VIF yra surašyti dispersijos mažėjimo daugikliai. Kadangi kintamajam trstplt  gauta, kad VIF > 4, tai darome išvadą, kad modelyje yra multikolinearumo problema. Ši išvada  tik patvirtina įtarimus, kurie kilo peržiūrėjus pradines regresorių koreliacijas. Gavome dar vieną patvirtinimą, kad modelį reikia tobulinti.

Išskirčių buvimą nustatome peržiūrėję Kuko matus ir DFB kiekvienam respondentui. Informaciją apie Kuko matą galima rasti lentelėje Residual Statistics. Priešpaskutinėje eilutėje yra informacija apie tai, kad Kuko mato maksimumas yra 0,091. Iš to išplaukia, kad ir visos Kuko mato reikšmės neviršja vieneto. Sprendžiant pagal Kuko matą, išskirčių nėra. Šis būdas naudotinas, jeigu DFB netiriame.

Kiekvienam respondentui Kuko mato ir DFB reikšmės atsirado duomenyse: nauji stulpeliai COO_1 ir DFB0_1 – DFB6_1 (nes buvo konstanta ir penki kintamieji) .

Galima tiesiog peržiūrėti visas eilutes, ieškant reikšmių viršijančių vienetą. Vis dėlto, tai nelabai patogu, nes eilučių daug. Alternatyviai galima panaudoti komandą Analyze  Descriptive Statistics Descriptives. Sukeliame visus kintamuosius į Variable(s). Pasirenkame Options ir paliekame pažymėtą tik parinktį Maximum. Renkamės Continue ir OK. Matome, kad visi maksimumai buvo mažesni už vienetą. Todėl darome išvadą, kad duomenyse išskirčių nebuvo.

Informacija apie modelio standartizuotuojų liekamųjų paklaidų normalumą pateikiama dviejuose grafikuose. Histogramos grafike dar nubraižyta ir normalioji kreivė, t.y. tai, į ką turėtų būti panaši histograma, jeigu liekamosios paklaidos būtų normalios. Matome, kad histograma nedaug skiriasi nuo normaliosios kreivės. Antrajame grafike atidėti standartizuotojų liekamųjų paklaidų ir normaliojo atsitiktinio kintamojo santykiniai procentinai dažniai (angl. P-P plot). Kuo taškai arčiau nubrėžtos tiesės (idealiu atveju visi taškai yra ant tiesės), tuo duomenys normalesni. Antrasis grafikas irgi rodo, kad standartizuotojų liekamųjų paklaidų normalumo reikalavimas  tenkinamas. 

Ar duomenys nėra heteroskedastiški sprendžiame, žiūrėdami į grafiką Scatterplot. Nors grafiko kraštuose ir mažiau taškų, negalima įžiūrėti kažkokio standartizuotųjų liekamųjų paklaidų reguliarumo, o pats grafikas primena tolygio storio debesėlį. Tėra tik keletas nuo bendro debesėlio nutolusių taškų. Darome išvadą, kad duomenys pakankamai homoskedastiški.

Papildoma informacija apie kiekvieno kintamojo tinkamumą modeliui yra grafikuose Partial Regression Plot. Kintamasis tuo geriau tinka modeliui, kuo grafike taškų išsibarstymo „debesėlis“ labiau primena tiesę. Dėl didelio regresorių tarpusavio koreliuotumo šie grafikai nėra patikimi, todėl pateikiame tik vieną pavyzdį. Ką nors nuspręsti apie kintamojo trstprl tikimą modeliui pagal pateiktąjį grafiką yra sunku.

Galutinė pirminio modelio tyrimo išvada: nors determinacijos koeficientas ir pakankamai didelis, modelyje yra statistiškai nereikšmingų ir multikolinearių kintamųjų, todėl modelis netinkamas. Jį reikia tobulinti.

 

 

NAUJIEMS VARTOTOJAMS
NAUJIENOS
Naujienlaiškis

Nr.1  2009 07-11
Nr.2  2009 12-2010 02
Nr.3  2010 03-05
Nr.4  2010 06-08
Nr.5  2010 09-11
Nr.6  2010 12-2011 02
Nr.7 2011 03-05
Nr.8 2011 06-08
 
© KTU Politikos ir viešojo administravimo institutas
Atnaujinta 2015-06-18