Svečias
Titulinis Mokymai Mokymų medžiaga Metodologiniai paketai Taikomoji regresija
Apie mokymus
Mokomieji duomenys
E. mokymai
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Pavyzdinis metodologinis mokomasis studijų paketas

TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Autorus Prof. habil. dr. Vydas Čekanavičius

Ankstesnis dokumentas Turinys  Literatūros sąrašas Duomenų šaltiniai Sekantis dokumentas

10. PROBIT REGRESIJA
10.2. Probit regresinė analizė su SPSS
       10.2.3. Rezultatai

Rezultatų išklotinė prasideda informacija, kad modelis sudaromas tikimybei P(Y = 0):

Model Information

Dependent Variable

Ya

Probability Distribution

Binomial

Link Function

Probit

a. The procedure models .00 as the response, treating 1.00 as the reference category.

Lentelėje Categorical Variable Information pateikiama informacija apie kategorinių kintamųjų reikšmes. Primename, kad duomenyse negali dominuoti nė viena ir priklausomo kintamojo kategorijų. Nedažnai (Y = 0) studijų žiniomis naudojasi 31,1% respondentų, dažnai (Y = 1) – 68,9%  respondentų. Primename, kad minimalus kiekvienos kategorijos procentas turi būti bent 20%. Šis reikalavimas išpildytas. Šiuos procentus prisiminsime, kai tirsime klasifikacinę lentelę. Gerame modelyje, turi būti geresni teisingų klasifikavimų procentai.

Regresoriaus K35_1 reikšmes verta peržiūrėti tuo pačiu tikslu – jeigu, kai kurių reikšmių nedaug, tai vertėtų regresoriaus kategorijas sustambinti. Matome, kad tokių atsakymų nėra. Regresoriaus transformuoti nereikia.

Categorical Variable Information

 

N

Percent

Dependent Variable

Y

.00

100

31.1%

1.00

222

68.9%

Total

322

100.0%

Factor

K35_1 |Esamo darbo atitikimas bakalauro (vientisųjų) studijų krypčiai

1 Tikrai taip

153

47.5%

2 Greičiau taip

95

29.5%

3 Greičiau ne

36

11.2%

4 Tikrai ne

38

11.8%

Total

322

100.0%

Didžiausio tikėtinumo chi kvadrato statistika ir jos p reikšmė yra lentelėje Omnibus Test. Matome, p = 0,00...< 0,05. Taigi vienas svarbiausių rodiklių rodo gerą modelio tikimą duomenims.

Omnibus Testa

Likelihood Ratio Chi-Square

df

Sig.

163.847

5

.000

Dependent Variable: Y
Model: (Intercept), K35_1, K37_1, K33_2

Lentelėje Parameter Estimates yra modelio koeficientų įverčiai, tų įverčių 95% pasikliautinieji intervalai ir Voldo kriterijaus reikšmės. Kategorinis kintamasis K35_1  buvo pakeistas į keturis pseudokintamuosius. Vienas iš šių pseudokintamųjų, atitinkantis reikšmę K35_1 = 3 yra statistiškai nereikšmingas. Vis dėlto, dėl vienos tokios reikšmės neverta modelį tobulinti.

Parameter Estimates

Parameter

B

Std. Error

95% Wald Confidence Interval

Hypothesis Test

Lower

Upper

Wald Chi-Square

df

Sig.

(Intercept)

4.853

.7092

3.463

6.243

46.832

1

.000

[K35_1=1]

-1.577

.3272

-2.218

-.936

23.229

1

.000

[K35_1=2]

-1.018

.3226

-1.650

-.385

9.953

1

.002

[K35_1=3]

-.261

.3722

-.991

.468

.493

1

.482

[K35_1=4]

0a

.

.

.

.

.

.

K37_1

-.273

.1141

-.496

-.049

5.720

1

.017

K33_2

-.780

.1151

-1.005

-.554

45.859

1

.000

(Scale)

1b

 

 

 

 

 

 

Dependent Variable: Y
Model: (Intercept), K35_1, K37_1, K33_2

a. Set to zero because this parameter is redundant.
b. Fixed at the displayed value.

Gavome keturis modelius, kurie skiriasi tik konstanta. Juos galim užrašyti taip:

 Įsitikinsime, kad modelio koeficientų ženklai atitinka sveiko proto reikalavimus. Koeficientas prie  K37_1 yra neigiamas. Jeigu respondentas renkasi didesnę K37_1 reikšmę (yra labiau patenkintas darbu), tai  mažiau tikėtina, kad jis retai  naudoja studijų žinias darbe. Analogiškai darome išvadą, kad kuo labiau suvokia studijų žinių reikšmę, tuo didesnė tikimybė dažnai naudoti tas žinias darbe (mažiau tikėtina, kad tai įvyksta retai). Kuo K35_1 įgyja didesnę reikšmę (darbo pobūdis labiau atitinka studijų kryptį), tuo labiau tikėtina, kad žinias darbe naudos dažnai. Trumpai kalbant, respondentai labiau vertinantys studijų žinias ir  labiau patenkinti savo darbu,  dažniau studijų žinias naudoja savo darbe. Ir ši tendencija stipresnė tiems, kurių darbo pobūdis labiau atitinka studijų kryptį.
Kadangi probit regresiją tyrėme, kaip apibendrintąjį tiesinį modelį, tai lentelėje Goodness of Fit galima peržiūrėti deviacijos ir laisvės laipsnių santykį. Gerai, kai jis arti vieneto. Matome, kad jis toks ir yra (1,156). Pažymėtina, kad probit regresijai svarbesnis rodiklis yra didžiausio tikėtinumo chi kvadrato maža p reikšmė. Jeigu deviacijos ir laisvės laipsnių santykis daug skiriasi nuo vieneto, bet visos kitos charakteristikos (įskaitant klasifikacinę lentelę) geros, tai modelis laikytinas geru.

Goodness of Fitb

 

Value

df

Value/df

Deviance

49.722

43

1.156

Scaled Deviance

49.722

43

 

Pearson Chi-Square

48.218

43

1.121

Scaled Pearson Chi-Square

48.218

43

 

Log Likelihooda

-47.932

 

 

Akaike's Information Criterion (AIC)

107.865

 

 

Finite Sample Corrected AIC (AICC)

108.131

 

 

Bayesian Information Criterion (BIC)

130.512

 

 

Consistent AIC (CAIC)

136.512

 

 

Dependent Variable: Y
Model: (Intercept), K35_1, K37_1, K33_2

a. The full log likelihood function is displayed and used in computing information criteria.
b. Information criteria are in small-is-better form.

Norint nustatyti, ar imtyje nėra išskirčių reikia patikrinti, ar duomenyse (ne rezultatų išklotinėje) atsiradusio stulpelio CooksDistance visos reikšmės mažesnės už vienetą. Panaudojame komandą Analyze  Descriptive Statistics Descriptives. Perkeliame CooksDistance į Variable(s). Pasirenkame OK.

Descriptive Statistics

 

N

Minimum

Maximum

Mean

Std. Deviation

CooksDistance Cook's Distance

322

.000

.039

.00324

.006749

Valid N (listwise)

322

 

 

 

 

Matome, kad maksimali Kuko mato reikšmė 0,039 < 1. Todėl darome išvadą, kad duomenyse išskirčių nėra.
Norėdami gauti klasifikacinę lentelę, renkamės Analyze  Descriptive Statistics Crosstabs. Į Row(s) perkeliame Y, į Column(s)   PredictedValue. Pasirenkame Cells ir pažymime Row. Renkamės Continue  ir OK.

Y * PredictedValue Predicted Category Value Crosstabulation

 

PredictedValue Predicted Category Value

Total

.00

1.00

Y

.00

Count

66

34

100

% within Y

66.0%

34.0%

100.0%

1.00

Count

17

205

222

% within Y

7.7%

92.3%

100.0%

Total

Count

83

239

322

% within Y

25.8%

74.2%

100.0%

Iš 100 respondentų, kurie retai naudojasi studijų metu gautomis žiniomis, teisingai klasifikuoti 66 ( 66%). Iš 222 respondentų, kurie dažnai naudojasi studijų metu gautomis žiniomis, teisingai klasifikuoti 205 (92,3%). Prisiminę lentelės Categorical Variable Information procentus (atitinkamai 31,1% ir 68,9% ), įsitikiname, kad taikomas modelis geras.

Galutinė išvada: probit regresijos modelis gerai tinka duomenim.

NAUJIEMS VARTOTOJAMS
NAUJIENOS
Naujienlaiškis

Nr.1  2009 07-11
Nr.2  2009 12-2010 02
Nr.3  2010 03-05
Nr.4  2010 06-08
Nr.5  2010 09-11
Nr.6  2010 12-2011 02
Nr.7 2011 03-05
Nr.8 2011 06-08
 
© KTU Politikos ir viešojo administravimo institutas
Atnaujinta 2018-09-27