Svečias
Titulinis Mokymai Mokymų medžiaga Metodologiniai paketai Taikomoji regresija
Apie mokymus
Mokomieji duomenys
E. mokymai
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Pavyzdinis metodologinis mokomasis studijų paketas

TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Autorus Prof. habil. dr. Vydas Čekanavičius

Ankstesnis dokumentas Turinys  Literatūros sąrašas Duomenų šaltiniai Sekantis dokumentas

6. RANGINĖ LOGISTINĖ REGRESINĖ ANALIZĖ
6.1. Ranginės logistinės regresijos modelis
        6.1.5. Modelio tinkamumas

Modelio tikimą duomenims parodo:

  • Modelio tikimo didžiausio tikėtinumo santykio chi kvadrato statistika (angl. model fit likelihood ratio Chi-square test) . Vertinamas bendrasis modelio tikimas duomenims. Gerai duomenims tinkančiam modeliui p < 0,05.  Jeigu p ≥ 0,05, tai regresijos modelio tinkamumas labai abejotinas.

  • Pirsono ir deviacijos chi kvadrato statistikos. Tai alternatyvos didžiausio tikėtinumo kriterijui. Modelis gerai tinka duomenimis, kai Pirsono ir deviacijos chi kvadratų p reikšmės yra didelės (p ≥ 0,05). Kai modelyje yra intervalinių regresorių, Pirsono ir deviacijos chi kvadratų p reikšmės beveik visada yra nepatikimas modelio gerumo indikatorius. Be to,  šios charakteristikos jautrios imties didumui. Didelėms imtims p reikšmės gali būti nepagrįstai mažos. Todėl į šias charakteristikas atsižvelgiama toli gražu ne visada.

  • Voldo testas. Voldo testas padeda nuspręsti, kurie kintamieji modelyje reikalingi (yra statis-tiškai reikšmingi, jų p < 0,05). Gerame modelyje visi kintamieji yra statistiškai reikšmingi. Kaip taisyklė, konstantai šio kriterijaus netaikome ir iš modelio nešaliname, net ir statistiškai nereikšmingos konstantos.

  •  Determinacijos (pseudo) koeficientai (angl. R square). Parodo bendrąjį modelio tikimą.  Įgyja  reikšmes iš intervalo  [0, 1].  Kuo koeficiento reikšmė didesnė, tuo modelis geriau tinka duomenims. Nelabai gerai, kai R2 < 0,20. Ranginėje logistinėje regresijoje determinacijos koeficientai vaidina tik pagalbinį vaidmenį. Jų yra net keli (Kokso-Snelo, Nagelkerkės, Makfadeno). Kurį iš jų naudoti dažniausiai nusprendžia (sufantazuoja) pats tyrėjas.  Privalu nurodyti tikslų determinacijos  koeficiento pavadinimą.

  • Tiesių lygiagretumo hipotezės chi kvadrato statistika.  Tiesių lygiagretumo prielaida galioja, kai statistikos  p reikšmė ≥ 0,05. Geruose modeliuose tiesių lygiagretumo prielaida galioja.

  • Y reikšmių įgijimo tikimybės ir klasifikacinė lentelė. Konkretiems stebėjimams prognozuojamos Y reikšmės įgijimo tikimybės, pasirenkama ta Y reikšmė, kurios įgijimo tikimybė didžiausia ir tikrinama, ar spėjimas sutapo su tikrąja Y reikšme. Kuo daugiau sutapimų, tuo modelis geresnis. Ranginėje logistinėje regresijoje ši charakteristika nelaikoma labai svarbia. Kai kurie paketai jos net neskaičiuoja. Vis dėlto, jeigu visos kategorijos vienodai svarbios, tai kiekvienos jų teisingų atpažinimų procentas neturi būti mažesnis už tos kategorijos duomenų procentą imtyje.

Apibendrindami galime nusakyti, kokie turi būti gero regresijos modelio rodikliai.

Labai gerai duomenims tinkančiame modelyje:

  • Didžiausio tikėtinumo chi kvadrato kriterijaus p < 0,05.
  • Visų regresorių Voldo kriterijaus p < 0,05.
  • Tiesių lygiagretumo testo chi kvadrato p ≥ 0,05.
  • Klasifikacinėje lentelėje teisingų kiekvienos kategorijos klasifikavimų procentas ne mažesnis už tos kategorijos duomenų procentą imtyje.
  • Nelabai didelėms imtims, turinčioms nedaug (arba neturinčioms) intervalinių regresorių deviacijos chi kvadrato testo ir Pirsono chi kvadrato testo p ≥ 0,05.

 

NAUJIEMS VARTOTOJAMS
NAUJIENOS
Naujienlaiškis

Nr.1  2009 07-11
Nr.2  2009 12-2010 02
Nr.3  2010 03-05
Nr.4  2010 06-08
Nr.5  2010 09-11
Nr.6  2010 12-2011 02
Nr.7 2011 03-05
Nr.8 2011 06-08
 
© KTU Politikos ir viešojo administravimo institutas
Atnaujinta 2018-05-02