• Rezultati Niso Bili Najdeni

Kontingenca in probit model

1 Uvod

1.4 Uporabljena metodologija

1.4.2 Kontingenca in probit model

Iz APG, ki jo izvaja SURS, sem za obdobje osmih referenčnih let pridobil podatke o vključenosti posameznikov v visokošolsko izobraževanje ter podatke o različnih demografskih in premoženjskih lastnostih ter značilnostih porabe sredstev posameznika in njegovega gospodinjstva. S pomočjo kontingence ali asociacije sem prikazal najprej enostavno analizo odvisnosti vključenosti v visokošolsko izobraževanje od izbranega dejavnika, ki ga opisuje določena nominalna spremenljivka iz APG. Nato pa sem z probit analizo podrobneje analiziral vpliv posameznega dejavnika na verjetnost posameznikove vključitve v visokošolsko izobraževanje.

S kontingenco in pomočjo pearsonovega χ2-preizkusa sem testiral domnevo o neodvisnosti med vključenostjo v visokošolsko izobraževanje ter posamezno pojasnjevalno spremenljivko (lastnostjo posameznika ali njegovega gospodinjstva).

Kadar proučujemo odvisnost med dvema nominalnima spremenljivkama, od katerih ima vsaj ena več kot dve vrednosti, govorimo o kontingenci (Košmelj 2000). Veliko lastnosti obravnavanih posameznikov in gospodinjstev iz APG je nominalnih, saj so njihove vrednosti izražene z opisi, ali pa jih v takšno obliko po potrebi lahko prevedem.

Računalniški program je razvrstil enote, ki so bile izbrane v vzorec APG, v kombinacijsko tabelo glede na vrednosti nominalnih spremenljivk. Tako dobljene dejanske frekvence sem primerjal s teoretičnimi (pričakovanimi), ki odražajo stanje neodvisnosti med nominalnima spremenljivkama. Pri preverjanju ničelne domneve o neodvisnosti med nominalnima spremenljivkama sem uporabil χ2-preizkus. Kritično območje oziroma območje zavrnitve ničelne hipoteze, da spremenljivki nista povezani (torej, da so pričakovane frekvence enake dejanskim), je na desni strani χ2-porazdelitve.

Če je bila vrednost χ2 enaka ali večja od kritične vrednosti, potem sem lahko ničelno hipotezo zavrnil ob stopnji značilnosti, ob kateri je izračunana kritična vrednost in na podlagi vzorčnih podatkov sprejel sklep, da sta spremenljivki ob dani stopnji značilnosti (ob dani stopnji tveganja napake prve vrste), med seboj povezani. Napaka prve vrste je zavrnitev ničelne hipoteze, ki drži. Ničelna hipoteza se glasi: H0: fij=f'ij – alternativna pa:

H1: fij≠f'ij.

Probit model spada med tako imenovane modele z dvojnim izidom (binary response models). O takšnih modelih govorimo takrat, ko lahko odvisna spremenljivka zavzame le dve vrednosti, navadno označeni kot 0 in 1 (Verbeek 2002). V raziskavi na podlagi anketnih podatkov iz APG sem namreč proučeval dejavnike, ki vplivajo na večjo ali manjšo verjetnost, da odvisna spremenljivka (povpraševanje po visokošolskem izobraževanju) zavzame vrednost 1 in ne 0; torej, da oseba študira na enem od visokošolskih programov. Izbrana odvisna spremenljivka namreč zavzema vrednost 0, če oseba ni vključena v visokošolsko izobraževanje ali pa vrednost 1, če je oseba vključena v visokošolsko izobraževanje. Pričakovano vrednost takšne odvisne spremenljivke lahko zapišem tudi z izrazom:

E(yi)=0*P(yi=0)+1*P(yi=1)=P(yi=1),

kar pa je pravzaprav enako verjetnosti, da tako definirana (dihotomna) odvisna spremenljivka zavzame vrednost 1, se pravi, da oseba študira na enem od visokošolskih programov. Navadne (ordinary least square – OLS) linearne metode najmanjših kvadratov v teh primerih ne morem uporabiti kot primerne statistične metode, saj lahko pričakovana vrednost E(yi│xi)=x'i zavzame vrednosti izven [0, 1] ter posledično ne more predstavljati verjetnosti. Poleg tega so napake heteroskedastične, saj je var (εi│xi)=x'iβ(1-x'iβ) odvisna od xi (Schmidheiny 2005, 1). Te težave, ki onemogočajo uporabo OLS, je mogoče odpraviti s primerno transformacijsko funkcijo, ki preslika (v parametrih) linearno indeksno funkcijo x'iβ v [0, 1]:

P(yi=1│xi)=F(x'iβ).

Ta funkcija je pravzaprav tako imenovana F-porazdelitvena funkcija (cumulative distribution function – CDF). Za CDF velja, da je F(-∞)=0, F(∞)=1 ter ∂F(z)/∂z>0. V praksi sta uporabljeni dve CDF, in sicer standardizirana normalna ter logistična porazdelitev. V probit modelu je transformacijska funkcija standardizirano normalna, kar pomeni, da je probit model predstavljen z:

P(yi=1│xi)=Φ(x'iβ)=

kjer Φ(.) predstavlja CDF, _φ(.) pa gostoto verjetnosti (probability density function-PDF). Probit model lahko predstavimo tudi s pomočjo latentne spremenljivkey*i, predstavljene v modelu:

*

y =x'i iβ+εi,

kjer za ostanke v njem velja, da so porazdeljeni z normalno porazdelitvijo εi~N(0, σ2). Kot primer si lahko predstavljamo, da nam latentna spremenljivka meri spremembo koristnosti zaradi vključenosti v visokošolsko izobraževanje. Tako bo posameznik izbral yi=1 (oseba študira na katerem od visokošolskih programov), v primeru, day*izavzema pozitivno vrednost ter yi=0 (oseba ne študira na katerem od visokošolskih programov), če latentna spremenljivka zavzema negativno vrednost. To lahko zapišem tudi kot:

yi=

Vendar pa pri raziskovanju izmerimo le vrednosti yi in tako je verjetnost, da bo posameznik i izbral yi=1 (študiral na katerem od visokošolskih programov) predstavljena z (Schmidheiny 2005, 3):

P(yi=1│xi)=P(y >0│x*i i)

=P(x'iβ+εi>0│xi)

=P(εi>-x'iβ│xi)

=1-Φ(-x'iβ/σ)=Φ(-x'iβ/σ).

V primeru, da je σ2=1, dobimo probit model. Vsekakor pa tako β kot σ nista določeni, saj lahko ocenimo zgolj njuno razmerje β/σ. Nazorna grafična predstavitev je podana v Schmidheiny (2005, 4).

Za razliko od linearnega regresijskega modela, v primeru probit modela parametrov ne moremo neposredno razlagati kot mejnih učinkov na odvisno spremenljivko yi. V splošnem je za določitev mejnega učinka spremenljivke xik na pričakovano vrednost opazovane spremenljivke yi uporaben naslednji izraz:

k

Z vsako enoto i so mejni učinki različni, zato je potrebno pri interpretaciji rezultatov opredeliti, na kakšno oziroma katero enoto se nanašajo rezultati oziroma razlaga. Pogosto za tako imenovano referenčno enoto vzamemo povprečno, mediansko, ekstremno ali kakšno drugo značilno enoto. Na podlagi analize anketnih podatkov iz APG in s pomočjo probit modela sem ugotovil, za koliko odstotnih točk se spremeni verjetnost, da bo izbrana referenčna oseba vključena v visokošolsko izobraževanje, če se določen dejavnik povpraševanja (udeležbe) v visokošolskem izobraževanju xi poveča za 1 enoto. V primeru, da je pojasnjevalna spremenljivka diskretna, po podobni logiki razlagam vpliv diskretne spremembe pojasnjevalne spremenljivke na verjetnost, da bo odvisna spremenljivka zavzela vrednost 1.

Probit model je ocenjen z metodo največjega verjetja (maximum likelihood – ML).

Pri tej metodi vemo, da so po predpostavki opazovanja med seboj neodvisna in da preko odvoda funkcije verjetja po iskanih parametrih ter enačenja tega odvoda z nič, pridemo navadno preko numeričnih metod do rezultata, se pravi do takšnih vrednosti parametrov, ki maksimizirajo funkcijo verjetja. V probit modelu je rezultat predstavljen z naslednjim izrazom:

Cenilka metode največjega verjetja (βˆ ) je konsistentna in asimptotično normalno porazdeljena. Porazdelitev te cenilke pa je v velikih vzorcih podana z izrazom:

βˆ ~AN(β,I(β)1).

Obstaja več postopkov ocene matrike informacije I(β)-1 (na primer pričakovana Hessejeva matrika drugih odvodov, BHHH, postopek Huber-White in podobno).

Cenilka metode največjega verjetja pa je nekonsistentna v prisotnosti heteroskedastičnosti, torej ML ocene probit modela temeljijo na predpostavki o normalni porazdelitvi latentnih napak.

Preverjanje domnev o statistični značilnosti vrednosti posameznih koeficientov sem izvedel s pomočjo običajnega Waldovega testa ali pa s pomočjo razmerja verjetij (likelihood ratio – LR) oziroma Lagrangejevega multiplikatorja (Lagrange multiplier test – LM). Test na podlagi razmerja verjetnosti (LR) ima naslednjo obliko:

2

kjer logL(θˆR)predstavlja ocenjeno logaritemsko verjetje modela z omejitvami. Na primer, če testiram hipotezo H0: βз = 0, gre za model z vsemi spremenljivkami, razen s spremenljivko 3, računalniški statistični paket pa poda vrednosti logaritemskega verjetja za takšen model. Dalje pa računalniško podani logL(θˆML)predstavlja logaritem verjetja

za osnovni, celoten model. J pomeni število omejitev (Dillon 1984; Harnet 1982;

Jobson 1992a; Jobson 1992b; Maddala 1977; Verbeek 2002).