Svečias
Titulinis Mokymai Mokymų medžiaga Metodologiniai paketai Taikomoji regresija
Apie mokymus
Mokomieji duomenys
E. mokymai
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE
TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Pavyzdinis metodologinis mokomasis studijų paketas

TAIKOMOJI REGRESINĖ ANALIZĖ SOCIALINIUOSE TYRIMUOSE

Autorus Prof. habil. dr. Vydas Čekanavičius

Ankstesnis dokumentas Turinys  Literatūros sąrašas Duomenų šaltiniai Sekantis dokumentas

1.  ĮVADAS
1.1. Kintamieji ir jų charakteristikos
      1.1.2. Svarbiausios  kintamųjų skaitinės charakteristikos

Statistiniuose tyrimuose, naudojamos specialios, tiriamus kintamuosius apibūdinančios, skaitinės charakteristikos. Aptarsime penkias tokias charakteristikas: vidurkį, dispersiją (ir jos ekvivalentą -  standartinį nuokrypį), koreliaciją ir medianą.

Vidurkis yra vidutinė kintamojo reikšmė.  Toks maždaug komunistinis pasidalijimo principas – kas būtų, jeigu visi savo turimus matavimus (pinigus, pragyventus metus, egzamino pažymius) sumestų į bendrą katilą ir draugiškai pasidalintų po lygiai. Formaliai – visų stebėjimų suma padalinta iš respondentų skaičiaus.

Vidurkis – pati populiariausia skaitinė charakteristika statistikoje. Vis dėlto, kai duomenyse yra labai išsiskiriančių reikšmių, jis nėra itin informatyvus. Jeigu B.Geitsas savo gyvenama vieta deklaruos Adutiškį, kiekvieno adutiškiečio vidutinis turtas viršys milijoną dolerių, nors realiai jie nepraturtės.

Dispersija yra statistikoje naudojama skaitinė kintamojo reikšmių išsibarstymo charakteristika. Didelė dispersija reiškia, kad reikšmės labai skiriasi.  Dispersija aktuali, kai norima pagal imtį spręsti apie visą populiaciją. Natūralu, kad patikimoms išvadoms apie populiacijas, kurių respondentai labai skiriasi, reikia didesnės imties. Jeigu išmatavus dešimties vyrų ūgius, radome ir 1,5 m,  ir 2,5 m, ir 1,79 m ir dar kitokių pačių įvairiausių ūgių, tai tikrai padaryta išvada apie vidutinį to regiono vyrų ūgį bus mažiau patikima, nei tuo atveju, kai visi respondentai yra 1,60 m. Todėl, darant statistines išvadas, į dispersiją atsižvelgiama. Dažnai vietoje dispersijos naudojamas standartinis nuokrypis. Standartinis nuokrypis – tai kvadratinė šaknis ištraukta iš dispersijos. Informatyvumo prasme abu rodikliai lygiaverčiai. Tradiciškai aprašomojoje statistikoje pateikiami  standartiniai nuokrypiai, o statistinėse išvadose labiau taikoma dispersija.

Koreliacija (koreliacijos koeficientas) yra kintamųjų tiesinės priklausomybės matas. Kaip ir vidurkis ir dispersija, jis turi savo teorinį atitikmenį tikimybių teorijoje. Statistikoje koreliacija naudojama, kai reikia išmatuoti dviejų intervalinių kintamųjų priklausomybę. Koreliacijos koeficientas nematuoja netiesinės

priklausomybės.

 

Koreliacijos koeficientas gali įgyti reikšmes  nuo -1 iki 1. Kuo koreliacijos koeficientas absoliutiniu didumu didesnis (toliau nuo nulio), tuo priklausomybė stipresnė. Pažymėkime imties duomenims suskaičiuotą koreliaciją raide r. Sprendžiant apie koreliacijos stiprumą „iš akies“, dažniausiai laikomasi tokio vertinimo:

 

  • | r | < 0.3  koreliacija labai silpna,
  • 0.3 ≤| r | < 0.5  silpna koreliacija,
  • 0.5 ≤| r | < 0.7  vidutinė koreliacija,
  • 0.7 ≤ | r | < 0.9  stipri koreliacija,
  • 0.9 ≤ | r | ≤ 1 labai stipri koreliacija.

Koreliacijos koeficiento ženklas irgi informatyvus. Jeigu koreliacija tarp X ir Y  teigiama, tai didesnes X reikšmes atitinka didesnės Y reikšmės. Jeigu neigiama – didesnes X reikšmes atitinka mažesnės Y reikšmės. Pavyzdžiui, jeigu augant darbo stažui, atlyginimas irgi augs, tai darbo stažo ir atlyginimo koreliacija bus teigiama. Koreliacija galima  tarp visiškai skirtingos prigimties kintamųjų: tarp laiko ir pažymių, tarp amžiaus ir atlyginimo, tarp IQ ir TV žiūrėjimo ir pan.

Koreliacija nepaaiškina priežastingumo.

Koreliacija atsako į klausimą – ar tarp kintamųjų yra tiesinis ryšys, bet nepaaiškina, kodėl tas ryšys atsirado. Priežastingumui paaiškinti reikia remtis giliomis tiriamo dalyko žiniomis ir vaizduote. Stipri koreliacija tarp chemijos ir fizikos pažymių rodo, kad mokiniai, geriau mokantys chemiją, geriau ir fiziką išmoksta. Bet tai dar nereiškia, kad fiziką išmoksta todėl, kad geriau moka chemiją.

Tarkime, kad įvertinome koreliaciją tarp išlaidų duonkepių reklamai ir  gautų pajamų. Gavome r = 0,999. Koreliacija teigiama ir labai stipri. Daugiau išleidžiame pinigų reklamai – didesnės ir pajamos. Atrodytų, kad reklama labai naudinga duonkepių pardavėjams. Vis dėlto tokia išvada gali būti net labai klaidinga! Iš tikro, didėjant išlaidoms reklamai, didės ir gaunamos pajamos. Bet tai nereiškia, kad augs ir pelnas = pajamos – išlaidos. Pažvelkime į du galimus priklausomybės grafikus.

Abiejuose grafikuose išlaidų reklamai (x-ašis) ir gautų pajamų (y-ašis) priklausomybę pavaizdavome ištisine tiese, nes koreliacija beveik 1. Matome, kad a) atveju kiekvienas reklamai papildomai išleistas litas duos keliolika litų papildomų pajamų ir pelnas augs. Tuo tarpu iš  b) grafiko matyti, kad kiekvienas reklamai papildomai išleistas litas duos tik kelis centus papildomų pajamų, ir pelnas mažės (išleidžiame daugiau, nei uždirbame). Dar kartą norime pabrėžti, kad abiem atvejais koreliacija yra tokia pati – stipri ir teigiama. Šis pavyzdys rodo, kad tyrimuose vien koreliacijos  gali ir nepakakti. Aptartuoju atveju visus reikiamus atsakymus (įskaitant ir tai, kiek padidės pajamos, išaugus išlaidoms reklamai vienu litu) padėtų gauti tiesinės regresijos modelis. 

Mediana – tai vidurinė pagal didumą iš visų galimų reikšmių. Jeigu visas reikšmes išrikiuosime nuo mažiausios iki didžiausios, tai mediana bus tos eilutės viduryje esanti reikšmė (lyginės imties atveju – dviejų vidurinių reikšmių vidurkis). Mediana nėra nei tokia informatyvi, nei turi tokias geras matematines savybes, kaip vidurkis. Statistiniuose tyrimuose ji naudojama tada, kai duomenyse gali būti išskirčių. Mediana nepasikeis, jeigu vienas stebėjimas staiga taps milžinišku. Jeigu turtingiausią Adutiškio gyventoją pakeisime B.Geitsu, tai adutiškiečių turto mediana nepasikeis. Jeigu jau galima kalbėti apie vidurinę pagal didumą reikšmę, tai galima ir apie dešimtąją pagal didumą ir pan. Atitinkamos charakteristikos vadinamos kvantiliais.

NAUJIEMS VARTOTOJAMS
NAUJIENOS
Naujienlaiškis

Nr.1  2009 07-11
Nr.2  2009 12-2010 02
Nr.3  2010 03-05
Nr.4  2010 06-08
Nr.5  2010 09-11
Nr.6  2010 12-2011 02
Nr.7 2011 03-05
Nr.8 2011 06-08
 
© KTU Politikos ir viešojo administravimo institutas
Atnaujinta 2015-06-18