Svečias
Titulinis Mokymai Mokymų medžiaga Metodologiniai paketai Taikomoji regresija
Apie mokymus
Mokomieji duomenys
E. mokymai
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Pavyzdinis metodologinis mokomasis studijų paketas

TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Autorus Prof. habil. dr. Vydas Čekanavičius

Ankstesnis dokumentas Turinys  Literatūros sąrašas Duomenų šaltiniai Sekantis dokumentas

4. DVINARĖ LOGISTINĖ REGRESINĖ ANALIZĖ
4.1. Dvinarės logistinės regresijos modelis
       4.1.5. Modelio tinkamumas

Modelio tikimą duomenims parodo tokie rodikliai:

  1. Klasifikacinė lentelė. Tai bene svarbiausia modelio tikimo charakteristika.Jeigu jau sudarėme logistinės regresijos modelį duomenims, kuriems žinomos Y reikšmės, tai natūralu pasitikrinti, ar gerai veikia klasifikavimas. Konkretiems stebėjimams prognozuojama Y reikšmė, ir žiūrima, ar spėjimas sutapo su tikrąja Y reikšme. Kuo daugiau sutapimų, tuo modelis geresnis. Kiekvienos kategorijos stebėjimų turi būtu suklasifikuota daugiau, nei gautume atsitiktinai spėdami. Jeigu abiejų Y reikšmių imtyje yra panašus kiekis, tai tinkami modeliai kiekvienos iš Y kategorijų teisingai klasifikuos ne mažiau, kaip po 50 procentų. 
  2. Didžiausio tikėtinumo chi kvadrato statistika. Parodo ar modelyje yra bent vienas reikalingas regresorius. Jeigu statistikos p reikšmė ≥ 0,05, tai regresijos modelio tinkamumas labai abejotinas (gavome, kad visi regresoriai nereikalingi).  Jeigu p  < 0,05, tai gavome patvirtinimą, jog modelis nėra beviltiškas (o gal ir visai geras – reikia tirti toliau).
  3. Hosmerio – Lemešou chi kvadrato statistika. Hosmerio – Lemešou kriterijus yra žymiai mažiau populiari alternatyva aukščiau minėtam didžiausio tikėtinumo chi kvadrato kriterijui. Modelis gerai tinka duomenims, kai Hosmerio – Lemešou chi kvadrato statistikos p reikšmė ≥ 0,05. Hosmerio – Lemešou kriterijų rekomenduojama taikyti tik nedidelėms imtims (iki 200 stebėjimų taikyti galima drąsiai, virš 500 stebėjimų – jau labai atsargiai).
  4. Voldo testai regresoriams. Padeda nuspręsti ar kintamasis šalintinas iš modelio. Jeigu  regresoriui Voldo testo p reikšmė < 0,05, tai sakome, kad regresorius yra statistiškai reikšmingas ir dažniausiai jį modelyje paliekame. Jeigu p ≥ 0,05, tai regresorius yra statistiškai nereikšmingas ir modelyje jis paliekamas tik ypatingais atvejais (žr. kitą skyrelį). Dažniausiai modelio konstanta  C paliekama net ir tada, kai ji statistiškai nereikšminga. Voldo kriterijus nelaikomas labai patikimu kintamojo svarbos rodikliu – pasitaiko, kad itin svarbų regresorių jis rodo esant statistiškai nereikšmingą.
  5. Determinacijos (pseudo) koeficientai (angl. R square, pseudo - R2). Rodo bendrąjį modelio tikimą duomenims. Įgyja  reikšmes iš intervalo  [0, 1].  Kuo koeficiento reikšmė didesnė, tuo modelis geriau tinka duomenims.  Ne itin gerai, kai  R2 yra labai mažas. Vis dėlto, priešingai tiesinei regresijai logistinėje regresijoje R2vaidina tik labai menką pagalbinį vaidmenį. Jeigu R2 yra mažas, bet pagal visus kitus rodiklius logistinė regresija tinka,  tai vis tiek tariama, kad modelis tinkamas. Determinacijos pseudokoeficientų yra net keli. Galima naudoti bet kurį. Tiesa, privalu nurodyti tikslų determinacijos koeficiento pavadinimą.
  6. Kuko matas. Parodo ar duomenų imtyje yra išskirčių. Išskirčiai Kuko matas viršija 1. Skaičiuojamas kiekvienam respondentui. Modelis su išskirtimis –  nepatikimas.
  7. DFB statistika. Tai alternatyva Kuko matui, padedanti surasti tas duomenų išskirtis, kurios daro įtaką koeficientų b įverčiams. Išskirčiai DFB > 1. DFB statistika skaičiuojama kiekvienam regresoriui atskirai. Modelis su išskirtimis – nepatikimas.
  8. Prognozuotų tikimybių grafikas. Tai tikrai nėra labai svarbus tikimo rodiklis (ir itin negražus). Vis dėlto, kai kada toks grafikas pridedamas. Jame matyti, ar teisingai klasifikuotų stebėjimų Y = 1 modelio tikimybės buvo didelės, o teisingai klasifikuotų stebėjimų Y = 0  tikimybės buvo mažos. Taip turi būti geriems modeliams.

Yra ir kitų rodiklių, pavyzdžiui, standartizuotosios liekamosios paklaidos, į kuriuos galima atsižvelgti, tikrinant liekamųjų paklaidų normalumą.

NAUJIEMS VARTOTOJAMS
NAUJIENOS
Naujienlaiškis

Nr.1  2009 07-11
Nr.2  2009 12-2010 02
Nr.3  2010 03-05
Nr.4  2010 06-08
Nr.5  2010 09-11
Nr.6  2010 12-2011 02
Nr.7 2011 03-05
Nr.8 2011 06-08
 
© KTU Politikos ir viešojo administravimo institutas
Atnaujinta 2015-06-18