Svečias
Titulinis Mokymai Mokymų medžiaga Metodologiniai paketai Taikomoji regresija
Apie mokymus
Mokomieji duomenys
E. mokymai
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Pavyzdinis metodologinis mokomasis studijų paketas

TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Autorus Prof. habil. dr. Vydas Čekanavičius

Ankstesnis dokumentas Turinys  Literatūros sąrašas Duomenų šaltiniai Sekantis dokumentas

7. PUASONO REGRESINĖ ANALIZĖ
7.2. Puasono regresinė analizė su SPSS
       7.2.4. Rezultatai

Rezultatų išklotinė prasideda nuo informacijos apie tolydžiuosius kintamuosius. Atkreipiame dėmesį, kad, lyginant su preliminariu tyrimu, kintamojo numbhh vidurkis ir standartinis nuokrypis kiek pasikeitė. Taip atsitiko todėl, kad 27 atrinktieji respondentai neatsakė į cldcrsv klausimą, todėl iš tyrimo buvo automatiškai pašalinti. Vis dėlto stebėjimų  liko pakankamai daug – 254 .

Continuous Variable Information

 

N

Minimum

Maximum

Mean

Std. Deviation

Dependent Variable

Numbhh

254

.00

10.00

1.0472

1.24385

Covariate

agea

254

15

93

63.10

16.153

cldcrsv

254

0

10

5.26

2.170

Lentelėje Goodness of Fit yra surašytos deviacijos reikšmė, Pirsono chi kvadrato statistika  ir t.t. Normuotos (angl. scaled) deviacijos ir jos laisvės laipsnių santykis tinkamo Puasono regresijos modelio atveju turi būti artimas vienetui. Matome, kad šis santykis yra 0,919. Gavome patvirtinimą, kad apskritai modelis tinka duomenims. Dar liko nustatyti regresorių svarbą. Beje Pirsono chi kvadrato statistika, padalinta iš savo laisvės laipsnių, irgi turi būti arti vieneto. Vis dėlto, manoma, kad ši modelio tikimo charakteristika yra mažiau svarbi, nei deviacija. Lentelėje surašytos informacinių kriterijų reikšmės (AIC, BIC ir pan.) naudojamos kelių modelių palyginimui. Geresnis būtų tas modelis, kurio informacinių kriterijų reikšmės mažesnės. 

Goodness of Fitb

 

Value

df

Value/df

Deviance

230.635

251

.919

Scaled Deviance

230.635

251

 

Pearson Chi-Square

188.314

251

.750

Scaled Pearson Chi-Square

188.314

251

 

Log Likelihooda

-301.040

 

 

Akaike's Information Criterion (AIC)

608.080

 

 

Finite Sample Corrected AIC (AICC)

608.176

 

 

Bayesian Information Criterion (BIC)

618.692

 

 

Consistent AIC (CAIC)

621.692

 

 

Lentelėje Omnibus Test yra didžiausio tikėtinumo santykio chi kvadrato statistika ir jos p reikšmė. Gerai, kai p < 0,05, nes tada modelyje yra bent vienas reikalingas (statistiškai reikšmingas) regresorius. Kadangi p = 0,000..., tai galime teigti, kad regresijos modelio tinkamumą patvirtina ir didžiausio tikėtinumo chi kvadrato kriterijus.

Omnibus Testa

Likelihood Ratio Chi-Square

df

Sig.

112.919

2

.000

Lentelėje  Tests of Model Effects yra informacija apie Voldo kriterijų. Kadangi visos p = 0,000 < 0,05, tai darome išvadą, kad abudu kintamieji (agea ir cldcrsv) yra statistiškai reikšmingi ir modelyje reikalingi.

Tests of Model Effects

Source

Type III

Wald Chi-Square

df

Sig.

(Intercept)

41.188

1

.000

agea

105.703

1

.000

cldcrsv

14.395

1

.000

        Lentelėje Parameter Estimates pasikartoja informacija apie Voldo kriterijų. Taip pat surašyti parametrų įverčiai. Parametrų įverčių ženklai ir Exp(B)  suteikia informaciją apie tai, kaip keisis vidutinis kitų namų ūkio gyventojų skaičius, keičiantis kintamiesiems agea ir cldcrsv.

Parameter Estimates

Parameter

B

Std. Error

95% Wald Confidence Interval

Hypothesis Test

Exp(B)

95% Wald Confidence Interval for Exp(B)

Lower

Upper

Wald Chi-Square

df

Sig.

Lower

Upper

(Intercept)

1.535

.2392

1.066

2.004

41.188

1

.000

4.642

2.905

7.419

agea

-.035

.0034

-.042

-.028

105.703

1

.000

.966

.959

.972

cldcrsv

.099

.0261

.048

.150

14.395

1

.000

1.104

1.049

1.162

(Scale)

1a

 

 

 

 

 

 

 

 

 

        Kintamojo agea koeficientas lygus -0,035 < 0. Tai reiškia, kad didėjant atsakinėjusio respondento amžiui, vidutinis kitų namų ūkio narių skaičius mažėja. Stulpelyje Exp(B) užrašyta reikšmė 0,966 rodo, kad vieneri papildomi respondento amžiaus metai sumažina tikėtiną kitų namų ūkio narių skaičių  0,966 karto (narių skaičių reikia dauginti iš 0,966). Stulpeliuose Lower ir Upper nurodyti Exp(B) pasikliautinųjų intervalų rėžiai. Pasikliautiniai intervalai naudojami, norint patikslinti informaciją apie koeficiento įvertį. Pavyzdžiui, pasikliautinis intervalas kintamojo agea daugiklio eksponentei Exp(B) yra [0,959; 0,972] ir  interpretuotinas taip: labai tikėtina, kad vieneri papildomi respondento amžiaus metai sumažina tikėtiną kitų namų ūkio narių skaičių nuo 0,959 iki 0,972 karto.
Matematinis modelio užrašas atrodo taip:

Čia žymi vidutinį kitų namų ūkio narių skaičių.
Atrodytų viskas modelyje gerai. Vis dėlto, nors abudu regresoriai statistiškai reikšmingi, Voldo statistikos reikšmės (105,7 ir 14,39)  skiriasi septynis kartus. Kuo Voldo statistika didesnė, tuo  koeficientas statistiškai reikšmingesnis.  Todėl ramybės dėlei išbandome Puasono regresiją be regresoriaus cldcrsv.  Nebepateiksime visų lentelių tik konstatuosime, kad

  • deviacijos ir laisvės laipsnių santykis yra 0,958;
  • didžiausio tikėtinumo chi kvadrato p = 0,000...< 0,05;
  • Voldo kriterijaus  p = 0,000...< 0,05;
  • modelis  .

Darome išvadą, kad naujasis modelis tinkamesnis, nei pradinis. Parodysime, kaip šį modelį taikyti konkrečioms prognozėms. Tarkime, kad respondentui 50 metų. Kiek dar yra narių jo namų ūkyje? Įstatę kintamųjų reikšmes į aukščiau pateiktą modelio lygtį, gauname

Darome prognozę, kad  penkiasdešimtmečių namų ūkiuose be pačių respondentų  dar turi būti  vidutiniškai 2,17 narys.

NAUJIEMS VARTOTOJAMS
NAUJIENOS
Naujienlaiškis

Nr.1  2009 07-11
Nr.2  2009 12-2010 02
Nr.3  2010 03-05
Nr.4  2010 06-08
Nr.5  2010 09-11
Nr.6  2010 12-2011 02
Nr.7 2011 03-05
Nr.8 2011 06-08
 
© KTU Politikos ir viešojo administravimo institutas
Atnaujinta 2018-05-02