Svečias
Titulinis Mokymai Mokymų medžiaga Metodologiniai paketai Taikomoji regresija
Apie mokymus
Mokomieji duomenys
E. mokymai
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Pavyzdinis metodologinis mokomasis studijų paketas

TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Autorus Prof. habil. dr. Vydas Čekanavičius

Ankstesnis dokumentas Turinys  Literatūros sąrašas Duomenų šaltiniai Sekantis dokumentas

4. DVINARĖ LOGISTINĖ REGRESINĖ ANALIZĖ
4.2. Dvinarė logistinė regresinė analizė su SPSS
       4.2.10. Žingsninė logistinė regresija

Pastabose minėjome, kad pagrindinį dėmesį sutelksime ties logistinės regresijos modelio tyrimu, kai kintamuosius šalina arba keičia pats tyrėjas. SPSS yra realizuota galimybė, kai iš pateiktų regresorių sudaromas geriausias modelis. Tai atliekama formaliai, atsižvelgus į jų statistinį reikšmingumą, bet ne į prasmę. Yra du principiniai žingsninės regresijos metodai. Kaupiamojoje (angl. forward)  žingsninėje regresijoje pradedama nuo trivialaus modelio, sudaryto iš konstantos. Šis modelis palaipsniui pildomas kitais regresoriais. Alternatyviai (angl. backward) šalinamojoje žingsninėje regresijoje pradedamai nuo modelio su visais regresoriais, palaipsniui vis mažinant regresorių skaičių. Žinoma, tai tik principiniai metodų skirtumai. Iš tikro, dalis regresorių gali būti viename žingsnyje pašalinti, o kitame grąžinti atgal. SPSS yra realizuota keletas tokių algoritmų. Dažniausiai atsižvelgiama į  didžiausio tikėtinumo funkcijos reikšmes. Pademonstruosime vieną iš tokių metodų.

Pasirinksime pradinį tirtą modelį, t.y.  tirsime, ar skiriasi 20 – 30 m vyrai iš Portugalijos nuo tokio paties amžiaus vyrų iš Estijos, jeigu atsižvelgsime į kintamųjų stfedu, happy, freehms ir imsclbn reikšmes. Sąlyginai modelį galima užrašyti taip:

cntry = f(stfedu, happy, freehms, imsclbn).

Visas opcijas pasirenkame taip, kaip aprašyta 3.2.2 skyrelyje. Vienintelis skirtumas tas, kad pagrindiniame meniu pasirenkame Method: Forward LR.

Pasirinkome metodą, kai pradinis modelis vis papildomas naujais regresoriais. Rezultatų išklotinė prasideda jau matyta informacija apie kintamųjų kodus ir klasifikavimą, kai aklai spėjama priklausomybė Estijai. Po to pateikiama informacija apie pradinį modelį, kurį sudaro tik konstanta. Tai a priori blogas modelis, nes jis teigia, kad joks regresorius nepadės rasti skirtumų tarp portugalų ir estų. Iš tikro įsitikiname, kad jis statistiškai nereikšmingas (Voldo statistikos  p  = 0,899 > 0,05).

Variables in the Equation

 

B

S.E.

Wald

df

Sig.

Exp(B)

Step 0

Constant

-.016

.127

.016

1

.899

.984

Lentelėje Variables not in the Equation išvardyti visi regresoriai, kartu pateikiant jų Roa statistikos (Voldo statistikos tam tikras analogas) reikšmes stulpelyje Score ir p reikšmes stulpelyje Sig.  Visi regresoriai statistiškai reikšmingi ir juos galima bandyti įtraukti į modelį.

Variables not in the Equation

 

Score

df

Sig.

Step 0

Variables

freehms

34.961

1

.000

happy

7.024

1

.008

stfedu

46.378

1

.000

imsclbn

39.756

4

.000

imsclbn(1)

14.248

1

.000

imsclbn(2)

.028

1

.866

imsclbn(3)

7.143

1

.008

imsclbn(4)

31.529

1

.000

Overall Statistics

99.531

7

.000

Iš kitų lentelių matyti, kad regresoriai į modelį buvo įtraukiami keturiais etapais (keturi regresijos žingsniai). Po kiekvieno žingsnio svarbiausios modelio charakteristikos rodė, kad naujasis modelis gerai tinka duomenims. Chi kvadrato statistikos p reikšmės < 0,05; Hosmerio –  Lemešou statistikos p reikšmės > 0,05. Determinacijos pseudokoeficientų reikšmės vis didėjo.


Model Summary

Step

-2 Log likelihood

Cox & Snell R Square

Nagelkerke R Square

1

293.600a

.183

.244

2

251.174b

.312

.416

3

232.530b

.361

.482

4

221.738b

.389

.518

 

Hosmer and Lemeshow Test

Step

Chi-square

df

Sig.

1

4.313

6

.634

2

10.556

8

.228

3

4.928

8

.765

4

5.846

8

.665

Omnibus Tests of Model Coefficients

 

Chi-square

df

Sig.

Step 1

Step

50.185

1

.000

Block

50.185

1

.000

Model

50.185

1

.000

Step 2

Step

42.426

1

.000

Block

92.611

2

.000

Model

92.611

2

.000

Step 3

Step

18.644

4

.001

Block

111.255

6

.000

Model

111.255

6

.000

Step 4

Step

10.792

1

.001

Block

122.047

7

.000

Model

122.047

7

.000

Jungtinė klasifikacinė lentelė rodo, kad naujų kintamųjų įtraukimas, pradedant antruoju žingsniu, klasifikavimą nelabai gerino.

Classification Tablea

 

Observed

Predicted

 

cntry Country

Percentage Correct

 

EE Estonia

PT Portugal

Step 1

cntry Country

EE Estonia

92

33

73.6

PT Portugal

40

83

67.5

Overall Percentage

 

 

70.6

Step 2

cntry Country

EE Estonia

98

27

78.4

PT Portugal

30

93

75.6

Overall Percentage

 

 

77.0

Step 3

cntry Country

EE Estonia

96

29

76.8

PT Portugal

27

96

78.0

Overall Percentage

 

 

77.4

Step 4

cntry Country

EE Estonia

97

28

77.6

PT Portugal

26

97

78.9

Overall Percentage

 

 

78.2

Galų gale gauname visų žingsnių logistinės regresijos modelius. Matome, kad kiekvienas įtrauktas tolydus kintamasis buvo statistiškai reikšmingas. Kadangi kategorinio kintamojo imsclbn kai kurie pseudokintamieji irgi buvo statistiškai reikšmingi, tai ir jis modelyje buvo paliktas. 

Rezultatų išklotinėje dar pateikiama lentelė Model if Term Removed, kuri rodo, kad visi regresoriai modelyje reikalingi ( Sig. of the Change visiems regresoriams yra < 0,05).

Galutinis, tokiu būdu gautas modelis, sutampa su 4.2.2 skyrelyje nagrinėtuoju modeliu, kurį sąlyginai (tikslus užrašas užimtų daug vietos, nes reikėtų išvardyti visas imsclbn kategorijas) galima užrašyti taip:

cntry = f(freehms, happy,stfedu, imsclbn).

Šiame modelyje liko statistiškai nereikšmingų pseudokintamųjų. Žinome, kad toks modelis nėra geras, nes duomenyse tiesiog nėra pakankamai daug visų imsclbn  kategorijų reikšmių. Mes modelį patobulinome, transformuodami (perkoduodami) kintamąjį imsclbn. Žingsninė regresija čia pagelbėti negali.
Kita vertus, mes galime panaudoti žingsninę regresiją visų modelių analizei ir apsiriboti antruoju modeliu, kuris yra visai neblogas:

cntry = 5,145 -0,899freehms – 0,539stfedu.

Variables in the Equation

 

B

S.E.

Wald

df

Sig.

Exp(B)

95% C.I.for EXP(B)

Lower

Upper

Step 1a

stfedu

-.463

.074

39.518

1

.000

.630

.545

.727

Constant

2.511

.431

33.974

1

.000

12.317

 

 

Step 2b

freehms

-.899

.155

33.588

1

.000

.407

.300

.551

stfedu

-.539

.084

40.802

1

.000

.584

.495

.688

Constant

5.145

.711

52.408

1

.000

171.531

 

 

Step 3c

freehms

-.781

.156

25.149

1

.000

.458

.338

.622

stfedu

-.511

.087

34.832

1

.000

.600

.506

.711

imsclbn

 

 

15.886

4

.003

 

 

 

imsclbn(1)

1.990

1.197

2.761

1

.097

7.312

.700

76.418

imsclbn(2)

.260

1.116

.054

1

.816

1.296

.146

11.552

imsclbn(3)

.511

1.037

.243

1

.622

1.667

.218

12.732

imsclbn(4)

-.737

1.081

.465

1

.495

.479

.058

3.981

Constant

4.378

1.233

12.608

1

.000

79.652

 

 

Step 4d

freehms

-.730

.160

20.938

1

.000

.482

.352

.659

happy

.314

.099

10.025

1

.002

1.369

1.127

1.663

stfedu

-.564

.092

37.329

1

.000

.569

.475

.682

imsclbn

 

 

15.751

4

.003

 

 

 

imsclbn(1)

1.849

1.284

2.075

1

.150

6.354

.513

78.647

imsclbn(2)

-.039

1.197

.001

1

.974

.962

.092

10.046

imsclbn(3)

.195

1.123

.030

1

.862

1.215

.134

10.977

imsclbn(4)

-1.057

1.168

.819

1

.366

.347

.035

3.430

Constant

2.599

1.422

3.341

1

.068

13.445

 

 

a. Variable(s) entered on step 1: stfedu.
b. Variable(s) entered on step 2: freehms.
c. Variable(s) entered on step 3: imsclbn.
d. Variable(s) entered on step 4: happy.

NAUJIEMS VARTOTOJAMS
NAUJIENOS
Naujienlaiškis

Nr.1  2009 07-11
Nr.2  2009 12-2010 02
Nr.3  2010 03-05
Nr.4  2010 06-08
Nr.5  2010 09-11
Nr.6  2010 12-2011 02
Nr.7 2011 03-05
Nr.8 2011 06-08
 
© KTU Politikos ir viešojo administravimo institutas
Atnaujinta 2018-05-02