Svečias
Titulinis Mokymai Mokymų medžiaga Mokymų kursai Antrinė kiekybinė analizė
Apie mokymus
Mokomieji duomenys
E. mokymai
ANTRINĖ KIEKYBINIŲ DUOMENŲ ANALIZĖ
ANTRINĖ KIEKYBINIŲ DUOMENŲ ANALIZĖ

Mokymo kurso medžiaga

ANTRINĖ KIEKYBINIŲ DUOMENŲ ANALIZĖ

Autoriai: dr. Eglė BUTKEVIČIENĖ ir dokt. Aida VAICEKAUSKAITĖ

Ankstesnis dokumentas Turinys  Literatūros sąrašas Sekantis dokumentas

3. Duomenų statistinė analizė panaudojant SPSS

    3.4. Požymių priklausomumo analizė

Priklausomybės tarp vardinių ir rangų skalės kintamųjų analizei SPSS naudojamos požymių dažnių lentelės (Crosstabs), taip pat yra didelė testų įvairovė priklausomybės laipsniui tarp kintamųjų įvertinti. Plačiausiai taikomas iš neparametrinių kriterijų yra Chi-kvadrato (χ 2) kriterijus, kuris naudojamas hipotezėms apie kintamojo skirstinį populiacijoje tikrinti. Chi-kvadrato kriterijus parodo, ar empirinio ir teorinio skirstinių skirtumas yra reikšmingas, t.y. tikrinama, ar turimas empirinis skirstinys yra suderintas su teoriniu modeliu (Čekanavičius ir Murauskas, 2000).

SPSS pakete Chi-kvadrato kriterijus yra skaičiuojamas trejopai: pagal Pirsono (Pearson) formulę, pagal tikėtinumo santykio (Likelihood Ratio) formulę bei pagal Mantelio-Haenzelio (Linear-by-Linear) formulę. Kai duomenys aprašomi keturlauke (2x2) dažnių lentele ir kai nors vienas tikėtinas stebėjimų skaičius mažiau penkių, papildomai skaičiuojamas tikslus Fišerio (Fisher’s) kriterijus (Pukėnas,2009). Matuojamiems pagal intervalų skalę kintamiesiems yra skaičiuojamas Pirsono (Pearson) koreliacijos koeficientas. Kai stebimi kategoriniai kintamieji matuojami pagal rangų arba vardinę skalę naudojami kiti ryšio stiprumo matai (Čekanavičius ir Murauskas, 2000).

Vardinių kintamųjų ryšio matai

  • Phi – φ koeficientas skaičiuojamas χ 2 pagrindu eliminuojant imties dydžio įtaką. Naudojamas tada, kai duomenys aprašomi keturlaukėmis (2x2) kontingencijos lentelėmis, t. y. taikomas binariniams kintamiesiems. Didesnių lentelių atveju didžiausia φ reikšmė priklauso nuo lentelės dydžio ir gali viršyti 1.
  • Contingency Coefficient – kontingencijos koeficientas yra φ modifikacija, pritaikyta didesnėms kontingencijos lentelėms. Kai kurie tyrėjai rekomenduoja šį koeficientą taikyti 5x5 ir didesnėms lentelėms.
  • Cramer’s V – Kramerio V koeficientas yra dažniausiai naudojamas vardinių kintamųjų ryšio matas, skaičiuojamas χ 2 pagrindu. Jis nepriklauso nuo lentelės dydžio, kai eilučių skaičius lygus stulpelių skaičiui. Keturlaukėms lentelėms Kramerio V koeficientas sutampa su φ koeficientu (Pukėnas, 2009).

Ranginių kintamųjų ryšio matai

Be dažniausiai taikomo Spearman‘o ranginės koreliacijos koeficiento dar naudojami Kendall'o τ ir Gamma ranginės koreliacijos koeficientai. Spearman‘o ir Kendall'o τ koeficientai interpretuojami skirtingai – Spearman‘o koeficientas analogiškas Pirsono (Pearson), tik skaičiuojamas ranginiams duomenims (o jei duomenys yra intervaliniai – jie paverčiami ranginiais).

SPSS yra pateikiami du Kendall'o ranginės koreliacijos koeficiento skaičiavimo variantai Kendall’s tau-b ir Kendall’s tau-c. Kendall'o tau-b koeficientas dažniausiai naudojamas keturlaukių (2x2) lentelių atveju, Kendall'o tau-c koeficientas naudojamas didesnių negu 2x2 dimensijų lentelių atveju.

SPSS požymių priklausomumo lentelės sudaromos pasirinkus komandą Analyze Descriptive Statistics Crosstabs... Į laukelius Row(s) ir Colum(s) įkeliame kintamuosius, kurių požymių priklausomumo lentelę norime sudaryti. Dialogo langelyje Statistics pasirenkame Chi-square (χ 2 testą) ir spaudžiame Continue. Lukelio Cells komandų grupėje Percentages pažymime Row, Colums ir Total (žr. 3.4.1 pav.):

  • Row (pagal eilutes): procentinės reikšmės skaičiuojamos pagal eilutes, t. y., kiekvienos ląstelės reikšmė atžvilgiu eilutės sumos.
  • Column (pagal stulpelius): procentinės reikšmės skaičiuojamos pagal stulpelius, t.y., kiekvienos ląstelės reikšmė atžvilgiu stulpelio sumos.
  • Total (viso): kiekvienos ląstelės reikšmė atžvilgiu bendro stebėjimų skaičiaus. Įkėlus į laukelį Row(s) kintamąjį, nurodantį respondentų priklausomybę konkrečiai populiacijai, paprastai užtenka pažymėti Column laukelį – turėsime kiekvieno atsakymo procentinę dalį atskirai kiekvienai populiacijai (Pukėnas, 2009).



3.4.1 pav. SPSS požymių priklausomumo lentelių sudarymas

1 pavyzdys. Norime atsakyti į klausimą: Ar yra priklausomybė tarp lyties ir požiūrio į seksualines mažumas? Sudarome kintamųjų “Lytis” ir pritarimo teiginiui “Gėjai ir lesbietės gali gyventi gyventi taip, kaip nori” požymių priklausomumo lentelę. SPSS gauti rezultatai pateikti 3.4.1 – 3.4.2 lentelėse.

3.4.1 lentelė. Kintamųjų „Lytis“ ir „Gėjai ir lesbietės gali gyventi taip kaip nori“ požymių priklausomumo

Išvados:

  • 25 respondentai (1,3 proc.) iš 1863 atsakiusių į abu klausimus yra vyrai, kurie labai pritaria, jog gėjai ir lesbietės gali gyventi taip kaip nori.
  • 2,7 proc. respondentų vyrų labai pritaria teiginiui, jog ėjai ir lesbietės gali gyventi taip kaip nori.
  • 47,2 proc. Respondentų, labai pritariančių teiginiui, jog gėjai ir lesbietės gali gyventi taip kaip nori, yra vyrai.

Tikriname hipotezę:

Ho: „Atsitiktinai dydžiai X ir Y yra nepriklausomi“
Ha: „Atsitiktinai dydžiai X ir Y nėra nepriklausomi“

Nepriklausomumo hipotezės tikrinimo rezultatai pateikti 3.4.2 lentelėje.

3.4.2 lentelė. Chi-kvadrato testo rezultatai

Išvada:Nulinės hipotezės atmesti neturime pagrindo, kadangi p=0,760>0,05 (Pearson‘o Chi-Square). Stebėti dydžiai nėra statistiškai reikšmingai priklausomi.

Pastaba!!! Chi-kvadrato kriterijaus taikymas turi apribojimų. Norint taikyti Chi-kvadratą reikia patikrinti ar tenkinamos tam tikros sąlygos. Chi-kvadrato kriterijaus taikymo schema pateikta 3.4.2 pav.



3.4.2 pav. Chi-kvadrato taikymo schema (Janilionis, 1999-2001)

2 pavyzdys.Duota kintamųjų pora „Domėjimasis politika“ ir „Politika atrodo labai sudėtinga“. Norime patikrinti hipotezę, kad besidomintys politika pritaria teiginiui, kad politika atrodo nesudėtingai. Rezultatai pateikti 3.4.3 – 3.4.5 lentelėse.

Geriau suprasti priklausomybę tarp kintamųjų padeda teoriškai tikėtinas (expected) stebėjimų skaičius (pasirodymo dažnis). Lyginant tikėtiną stebėjimų skaičių su eksperimentiniu būdu (observed) nustatytu galima padaryti tam tikras išvadas apie vieno kintamojo reikšmių priklausomybę nuo kito kintamojo (Pukėnas, 2009).

3.4.3 lentelė. Kintamųjų „Domėjimasis politika“ ir „Politika atrodo labai sudėtingai“ požymių priklausomumo lentelė

Išvada: Tikėtinos (Expected) reikšmės nėra artimos gautoms (Count) — tai rodo, kad požymiai yra priklausomi. Kadangi stebėtų dažnių skaičius yra didesnis už tikėtiną dažnį – tai galime teigti, jog tie, kuriems politika atrodo nesudėtingai, labiau domisi politika.

Patikriname kintamųjų priklausomumo hipotezę.

3.4.4 lentelė. Chi-kvadrato rezultatai

3.4.5 lentelė. Kintamųjų ryšio stiprumo matai

Išvada:Kadangi p=0,000<0,05, tai Ho atmetame ir galime teigti, kad kintamieji yra statistiškai reikšmingai priklausomi, nors tarp jų yra silpnas ryšys Kramerio (Cramer‘s V) ryšio stiprumo koeficientas lygus 0,302. Žmonės, kuriems politika atrodo nesudėtingai, statistiškai reikšmingai daugiau ja ir domisi.

NAUJIEMS VARTOTOJAMS
NAUJIENOS
Naujienlaiškis

Nr.1  2009 07-11
Nr.2  2009 12-2010 02
Nr.3  2010 03-05
Nr.4  2010 06-08
Nr.5  2010 09-11
Nr.6  2010 12-2011 02
Nr.7 2011 03-05
Nr.8 2011 06-08
 
© KTU Politikos ir viešojo administravimo institutas
Atnaujinta 2015-02-16