Studie notater om Chi-Square Test

Denne artikkelen gir en studie notat om chi-square test.

X ² (gresk bokstav X ² Pronounced as Ki-square) test er en metode for å vurdere om frekvenser som har vært empirisk observerte, avviger vesentlig fra de som ville forventes under et bestemt sett av teoretiske antagelser. Anta for eksempel at politisk preferanse og bosted eller nativitet er blitt kryssklassifisert og dataene oppsummert i følgende 2 × 3 beredskapstabell.

Det ses i tabellen at andelen av urbane mennesker er 38/48 = 0, 79, 20/46 = 0, 34 og 12/18 = 0, 67 (avrundet til to desimaler) for de tre politiske partiene i landet. Vi vil da vite om disse forskjellene er statistisk signifikante.

Til dette formål kan vi foreslå en null hypotese som antar at det ikke er noen forskjeller mellom de tre politiske partiene med hensyn til fødsel. Dette betyr at proporsjonene av urbane og landlige mennesker bør forventes å være de samme for hver av de tre politiske partiene.

På grunnlag av antagelsen om at nullhypotesen er riktig, kan vi beregne et sett med frekvenser som forventes gitt disse marginale totalene. Med andre ord kan vi beregne antall personer som viser preferanse for kongresspartiet som vi forventer på grunnlag av ovenstående antagelsen om å være urbanites og sammenligne denne figuren med den som faktisk er observert.

Hvis nullhypotesen er sant, kan vi beregne en felles andel som:

38 + 20 + 12/48 + 46 + 18 = 70/112 = 0, 625

Med denne estimerte andelen vil vi forvente 48 x (0, 625) = 30 personer tilknyttet kongres, 46 _x (0, 625) = 28, 75 personer tilknyttet Janata Party og 18 x (0, 625) = 11, 25 personer tilknyttet Lok Dal fra ut av 70 bymennesker. Ved å trekke disse tallene fra de respektive observerte tallene fra de respektive størrelsene av de tre prøvene finner vi 48 - 30 = 18 tilknyttet kongressen, 46 - 28, 75 = 17, 25 tilknyttet Janata og 18 - 11, 25 = 6, 25 personer tilknyttet Lok Dal fra 42 personer fra landlige områder.

Disse resultatene er vist i følgende tabell, hvor forventede frekvenser er. vist i parentes.

For å teste evnen til nullhypotesen, sammenligner vi de forventede og observerte frekvensene. Sammenligningen er basert på følgende X ^2- statistikk.

X ² = Σ (O-E) ² / E

hvor O står for observerte frekvenser og E for de forventede frekvensene.

Frihetsgrader :

Antall grader av frihet betyr antall uavhengige begrensninger som er pålagt oss i et beredskapstabell.

Følgende eksempel illustrerer konseptet:

La oss anta at de to attributtene A og B er uavhengige, i hvilket tilfelle,

forventet frekvens eller celle AB vil være 40 × 30/60 = 20. Når dette er identifisert, blir frekvensene av de resterende tre cellene automatisk fikset. For celle, aB må den forventede frekvensen være 40 - 20 = 20, tilsvarende, for cellen AB må den være 30 - 20 = 10 og for aB må den være 10.

Dette betyr at for 2 × 2 bord har vi bare ett eget valg, mens vi ikke har frihet i de resterende tre cellene. Dermed kan grader av frihet (df) beregnes med formelen:

df - (c - 1) (r - 1)

hvor df står for graden av frihet, c for antall kolonner og r for antall rader.

Dermed i 2 x 3 bord (tabell 18.54)

df = (3 - 1) (2 - 1) = 2 x 1 = 2

Nivå av betydning :

Som tidligere nevnt brukes chi-kvadrat-testen til å undersøke om forskjellen mellom observerte og forventede frekvenser skyldes prøvetakningsfluktuasjonene og som sådan ubetydelig eller motsatt, om forskjellen skyldes en annen grunn og som sådan er signifikant.

Før du tegner avstanden om at forskjellen er betydelig forskere oppretter en hypotese, ofte referert som en nullhypotese (symbolisert som H _o ) i motsetning til forskningshypotesen (H ₁ ) som er opprettet som et alternativ til H _o .

Vanligvis, men ikke alltid, sier nullhypotesen at det ikke er forskjell mellom flere grupper eller ingen sammenheng mellom variabler, mens en forskningshypotes kan forutsi enten et positivt eller negativt forhold.

Med andre ord antar null hypotesen at det mangler ikke-prøvefeil, og forskjellen skyldes tilfeldighet alene. Deretter er sannsynligheten for forekomsten av en slik forskjell bestemt.

Sannsynligheten angir omfanget av tillit som vi kan plassere på inngangen som er tegnet. Tabellverdiene til chi-square er tilgjengelige på ulike sannsynlighetsnivåer. Disse nivåene kalles nivåer av betydning. Vi kan finne ut av bordet verdiene til chi-square på visse nivåer av betydning.

Vanligvis (i samfunnsvitenskapelig problem) er verdien av chi-kvadrat på 0, 05 eller 0, 001 nivåer av betydning fra de givne grader av frihet sett fra bordet og sammenlignet med observert verdi av chi-square. Hvis den observerte verdien eller y ¹ er mer enn tabellverdien på 0, 05, betyr det at forskjellen er signifikant.

Frihetsgraden :

For å bruke chi-kvadratprøven, er neste trinn å beregne grader av frihet: Anta at vi har et 2 x 2 beredskapstabell som det i figur 1.

Vi kjenner raden og kolonnen totals r _t ¹ og r _t ² - og c _t ¹ og c _t ² . Antall grader av frihet kan defineres som antall celleverdier som vi fritt kan spesifisere.

I figur 1, når vi spesifiserer en verdi av rad 1 (betegnet ved å sjekke inn i figuren) er den andre verdien i den raden og verdiene av andre rad (betegnet med X) allerede bestemt; Vi kan ikke spesifisere disse fordi vi kjenner radtallene og kolonnotallene. Dette viser at i et 2 x 2 beredskapstabell er det gratis å spesifisere kun én verdi.

Prosedyre :

Beregning for Chi-square:

Chi-square som en test av godhet av passform:

I den forrige delen brukte vi chi-plassen som en test av uavhengighet; det er om å akseptere eller avvise en null hypotese. X-tester kan også brukes til å bestemme om det er en signifikant forskjell mellom en observert frekvensfordeling og en teoretisk frekvensfordeling.

På denne måten kan vi bestemme hvor god passformen er for de observerte og forventede frekvensene. Det vil si at passformen ville bli vurdert godt hvis det ikke er vesentlig avvik mellom de observerte og forventede dataene når kurven til de observerte frekvensene er superpålagt på kurven av forventede frekvenser.

Vi må imidlertid huske at selv om proporsjoner i cellene forblir uendret, varierer chi-kvadratverdien direkte med det totale antall tilfeller (N). Hvis vi dobler antall tilfeller blir chi-kvadratverdien doblet; hvis vi tredobler antall saker vi også trippel chi-square og så videre.

Implikasjonene av dette faktum kan illustreres med et eksempel gitt nedenfor:

I det foreliggende eksempel er chi-kvadratverdien 3, 15. På dette grunnlag vil vi naturlig konkludere at forholdet ikke er en signifikant.

Anta nå at data hadde blitt samlet på 500 saker med følgende resultater:

Chi-kvadratverdi som beregnet fra figurene, er nå 6, 30, noe som er dobbeltverdien ankommet i forrige eksempel. Verdien 6, 30 er statistisk signifikant. Hadde vi uttrykt resultatene i prosent av prosentandeler, hadde det ikke vært en forskjell i tolkning.

Ovennevnte eksempler illustrerer et veldig viktig punkt, nemlig at kuplen er direkte proporsjonal med N. Derfor trenger vi et tiltak som ikke påvirkes bare av en endring i antall tilfeller. Målet phi (ǿ) gir dette anlegget, det vil si eiendommen vi ønsker i vårt mål. Dette tiltaket er bare et forhold mellom chi-kvadratverdien og den numeriske summen av de undersøkte sakene.

Målet phi (ø) er definert som:

Ø = √x ² / n

det vil si kvadratroten til chi-kvadrat dividert med antall tilfeller.

Ved å anvende denne formelen på de to ovenfor nevnte eksemplene får vi i det første tilfellet:

Tilsvarende måles øet i motsetning til chi-kvadratet, gi det samme resultatet når proporsjonene i de sammenlignbare cellene er identiske.

G. Udny Yule har foreslått enda en foreningskoeffisient som vanligvis betegnes som "Q" (mer kjent som Yule's Q) som måler foreningen i? x 2 bord. Foreningskoeffisienten (Q) er oppnådd ved å beregne forholdet mellom forskjellen og summen av korsproduktene til diagonalcellene, dersom celler i 2 × 2-tabellen er angitt som i følgende tabell:

ac- cc / ad + be

hvor a, b, c og d refererer til cellefrekvensene.

Foreningskoeffisient Q varierer mellom minus en og pluss en (+1) som være mindre enn eller større enn ad. Q oppnår grenser for +1 når noen av cellene er null, dvs. foreningen er fullført (korrelasjonen er perfekt). Q er null når variablene er uavhengige (det vil si når det ikke er noen tilknytning), dvs. når annonse. = være og. Q = 0.

Påføring av den ovennevnte formel er illustrert i følgende eksempel:

La oss beregne Yule's koeffisient mellom sivilstand og prestasjon i eksamen på grunnlag av dataene som presenteres i følgende tabell:

Ved å erstatte de ovennevnte verdiene i Yules formel:

Dermed er det en liten negativ tilknytning mellom sivilstatus og prestasjon i eksamen.

Vi kan se på problemet fra et annet synspunkt også.

Andelen giftede studenter som feilet er = 60 × 100/150 = 40.

Andelen ugifte studenter som feilet, er = 100 × 100/350 = 28, 57 (Ca.

Således mislyktes 40 prosent av de giftede studentene og nesten 29 prosent av de ugifte elevene i undersøkelsen. Derfor kan studentens dårlige ytelse tilskrives sivilstand.

Årsakssammenhenger kan være veldig sikkert etablert i en eksperimentell situasjon. Vi har vurdert dette problemet når det gjelder eksperimentelle design. I samfunnsvitenskap er det svært vanskelig å sette opp et eksperiment, så de fleste av studiene er ikke-eksperimentelle. Analytiske prosedyrer har imidlertid blitt utarbeidet for å tegne avledninger om årsakssammenheng i ikke-eksperimentelle studier.

I så mye som de fleste samfunnsforskningene innebærer en undersøkelse av prøvene hentet fra "befolkningen" og forsøker å tegne generaliseringer til denne "befolkningen", er det i vitenskapens interesse nødvendig å vite hvorvidt generaliseringer som derved er trukket er berettiget.

Anta at i en studie på prøver av mannlige og kvinnelige studenter viser resultatene våre betydelige forskjeller mellom de to prøvene i forhold til antall timer de bruker til studier.

Vi kan spørre om forskjellene som observeres, gjenspeiler de sanne forskjellene mellom de mannlige og kvinnelige elevene, eller om de to populasjonene av studentene faktisk er like i forhold til timene de bruker til studier, men prøvene hentet fra disse "populasjonene" for studien kan ha endret seg i denne grad av "sjanse".

En rekke statistiske prosedyrer er utformet slik at vi kan svare på et slikt spørsmål når det gjelder sannhetserklæringer.

Når vi sammenligner prøver eller studerer forskjellen mellom eksperimentelle og kontrollgrupper, ønsker vi normalt å teste en hypotese om arten av den sanne forskjellen mellom "populasjonene" som skal representert av prøvene som er studert.

I samfunnsvitenskap er vi vanligvis opptatt av relativt grov hypotese (for eksempel bruker de kvinnelige studentene mer tid til sine studier enn de mannlige studentene gjør).

Vi er vanligvis ikke i stand til å vurdere mer spesifikk eller eksakt hypotese (f.eks. Som spesifiserer nøyaktig forskjellen mellom de to populasjonene). Anta at våre data viser at prøven av kvinnelige studenter bruker i gjennomsnitt fire timer til studier mens prøven av mannlige studenter, bare to timer.

Det er klart at funnene av våre prøver er i tråd med hypotesen, dvs. kvinnelige studenter bruker mer tid til sine studier enn sine mannlige kolleger. Men vi må hele tiden huske på muligheten for at funnene basert på våre prøver ikke kan være nøyaktig det samme som funnene vi kunne ha oppnådd hadde vi studert to "populasjoner" i toto.

Nå vil vi estimere om vi fortsatt ville ha observert mer tid brukt på studier blant kvinnelige studenter, hadde vi studert den totale befolkningen. Et slikt estimat er mulig hvis vi tester "nullhypotesen".

Nulhypotesen sier at "populasjonene" ikke er forskjellig når det gjelder egenskaper under studien. I dette tilfellet vil en null hypotese si at i de større «befolkningene» av studentene som helhet, er ikke undergrupper av kvinnelige og mannlige studenter forskjellig med hensyn til tiden de bruker til studiet.

Forskjellige statistiske teknikker kalt tester av betydning, har blitt uttalt som hjelper oss å estimere sannsynligheten for at våre to prøver kan ha avviket i den utstrekning de gjør ved en tilfeldighet, selv om det ikke er noen forskjell mellom de to tilsvarende "populasjonene" av mann og kvinnelige studenter med hensyn til tid viet til studier.

Blant de forskjellige metodene for å teste betydning, vil avgjørelsen om hvilken metode som passer for en bestemt studie, avhenge av arten av målingene som brukes og fordelingen av karakteristikkene (f.eks. Studietid, antall barn, lønnsforventninger etc. ).

De fleste av disse tester av betydning antar at målingene utgjør intervallskala og at fordelingen av karakteristikken nærmer seg en normal kurve. I sosial forskning svarer disse antagelsene sjelden til virkeligheten. Nylige statistiske utviklinger har imidlertid kommet ut med en slags løsning på dette, i form av ikke-parametriske tester som ikke hviler på disse antagelsene.

Vi bør forsøke å forstå på dette punktet grunnen til at null-hypotesen skal testes når vår egentlige interesse er å teste en hypotese (alternativ hypotese, som det kalles) som sier at det er forskjell mellom de to populasjonene representert av prøvene.

Årsaken er lett å sette pris på. Siden vi ikke kjenner det sanne bildet i "befolkningen", er det best vi kan gjøre, er å lage avledninger om det på grunnlag av vårt utvalgsoppdagelse.

Hvis vi sammenligner to prøver, er det selvsagt to muligheter:

(1) Enten er populasjonene representert av prøven like eller

(2) De er forskjellige.

Våre prøver fra to "populasjoner" er forskjellige med hensyn til noen attributter; timer viet til studier i vårt eksempel. Dette kan tydeligvis skje hvis de to "populasjonene" som prøvene representerer, faktisk er forskjellige i forhold til nevnte attributt.

Dette utgjør imidlertid ikke et definitivt bevis på at disse "populasjonene" er forskjellige, siden det alltid er mulighet for at prøvene ikke akkurat svarer til de "befolkningene" de påstår å representere.

Vi må derfor tillate rom for muligheten for at det tilfeldige elementet som er involvert i utvelgelsen av en prøve, kan ha gitt oss prøver som avviger fra hverandre, selv om de to "populasjonene" som de trekkes ut, faktisk ikke er forskjellige.

Spørsmålet vi kanskje vil spørre er derfor:

"Kunne vi muligens få prøver som er forskjellig fra hverandre i den utstrekning de gjør, selv om de" befolkningene "de trekkes fra, ikke adskiller seg?" Dette er nettopp det spørsmålet som en null hypotese svarer på.

"Nulhypotesen" hjelper oss å estimere hva sjansene er for at de to prøvene som er forskjellige i denne grad ville ha blitt trukket fra to "populasjoner" som faktisk er like: 5 i 100? 1 på 100? eller hva som helst.

Hvis den statistiske testen av betydning tyder på at det er usannsynlig at to prøver som er forskjellig i denne grad kunne ha blitt trukket fra "populasjoner" som faktisk er like, kan vi konkludere med at de to "populasjonene" sannsynligvis er forskjellig fra hverandre.

Et poeng å huske på her er at alle statistiske tester av betydning og dermed alle generaliseringer fra prøvene til populasjonene hviler på antagelsen om at prøvene ikke er valgt på en måte som forspenning kunne ha inngått i prosessen med å tegne prøvene.

Med andre ord antas det at prøven vi har valgt, er tegnet på en slik måte at alle tilfeller eller elementer i "befolkningen" hadde en like eller spesifisert sjanse til å bli med i prøven.

Hvis denne antagelsen ikke er begrunnet, blir tester av betydning blitt meningsløse og uanvendelige. Med andre ord gjelder tester av betydning bare når sannsynlighetsprinsippet hadde vært ansatt ved valg av prøven.

For å gå tilbake til vår illustrasjon, antar, våre funn viser ingen forskjell mellom de to prøvene: som betyr at både mannlige og kvinnelige studenter i vår prøve er funnet å tilbringe like tid til studiene.

Kan vi da si at de to populasjonene av mannlige og kvinnelige studenter er like i forhold til dette attributtet? Selvfølgelig kan vi ikke si dette med noen sikkerhet, siden det er en mulighet for at prøvene kan være like når populasjonene faktisk er forskjellige.

Men for å gå tilbake til saken der de to prøvene er forskjellige, kan vi bekrefte at de to populasjonene de representerer, sannsynligvis er forskjellige hvis vi kan avvise "nullhypotesen"; det vil si hvis vi kan vise at forskjellen mellom de to prøvene er usannsynlig å vises hvis de ovennevnte "populasjonene" ikke var forskjellige.

Men igjen er det en viss sjanse for at vi kan være gale ved å avvise "nullhypotesen", da det er i form av sannsynlighet at selv svært usannsynlige hendelser noen ganger kan finne sted.

Det er også en annen side. Akkurat som vi kanskje har galt i å avvise "nullhypotesen", er det også sannsynlig at vi kan ha feil når vi aksepterer null-hypotesen. Det vil si, selv om vår statistiske test av betydning tyder på at prøveforskjeller lett kan oppstå ved en tilfeldighet, selv om "populasjonene" er like, kan det likevel være sant at "populasjonene" faktisk varierer.

Med andre ord står vi alltid overfor risikoen for å gjøre noen av de to typer feil:

(1) Vi kan avvise "null hypotesen" når det faktisk er sant,

(2) Vi kan akseptere "null hypotesen" når det faktisk er feil.

Den første typen feil, vi kan kalle type I-feilen. Dette innebærer at de to "populasjonene" er forskjellige når de faktisk er like.

Den andre typen feil kan kalles Type II-feilen. Dette innebærer at de to "populasjonene" er like når de faktisk er forskjellige.

Risikoen for å gjøre type I-feilen bestemmes av nivået av betydning vi er villige til å akseptere i vår statistiske test, f.eks. 0, 05, 0, 01, 0, 001, etc. (det vil si 5 på 100, 1 på 100 og 1 i 1000 . Hvis vi for eksempel bestemmer at populasjonene virkelig er forskjellig når en test av betydning viser at forskjellen mellom de to prøvene forventes å forekomme tilfeldigvis ikke mer enn 5 ganger på 100.

Dette betyr at hvis de to populasjonene representert av prøven faktisk var like (i form av et bestemt attributt), aksepterer vi 5 sjanser i 100 at vi vil gå galt ved å avvise "nullhypotesen". Vi kan selvsagt minimere risikoen for å gjøre type I-feil ved å gjøre vårt kriterium for å avvise nullhypotesen, strengere og strengere.

Vi kan for eksempel bestemme nivået på betydning ved 0, 01, det vil si at vi ville avvise "nullhypotesen" bare hvis testen viser at forskjellen i de to "prøvene" kanskje har dukket opp ved en tilfeldighet bare en gang i hundre.

I hovedsak er det vi sier at vi vil forkaste null-hypotesen hvis testen viser at ut av hundre prøver av en bestemt størrelse valgt fra de respektive populasjonene ved å benytte sannsynlighetsprinsippet, vil bare en prøve vise forskjell i form av attributter i den utstrekning dette er sett i de to prøvene under studien.

Kriteriet for å avvise "nullhypotesen" kan gjøres enda strengere ved ytterligere å heve nivået av betydning. Men vanskeligheten er at feilene i type I og type II tilfeldigvis er så relaterte til hverandre at jo mer vi beskytter oss mot å lage en type I-feil, jo mer sårbare er vi å lage en type II-feil.

Etter å ha fastslått omfanget av risiko for type I-feilen vi er villige til å løpe, er den eneste måten å redusere muligheten for type II-feil til å ta større prøver og bruke statistiske tester som gjør maksimal bruk av tilgjengelig relevant informasjon.

Situasjonen i forhold til type II-feilen kan illustreres på en veldig presis måte ved hjelp av en "åpnings karakteristisk kurve." Denne kurvens oppførsel avhenger av hvor stor prøven er. Jo større prøven er, desto mindre sannsynlig er det at vi vil akseptere en hypotese som tyder på en tilstand av ekstremt langt fra virkelighetsstaten.

I det omfang forholdet mellom type I og type II-feilene er omvendt, er det nødvendig å finne en rimelig balanse mellom de to typer risiko.

I samfunnsvitenskap er det nesten blitt en etablert praksis eller konvensjon å avvise "nullhypotesen" når testen indikerer at forskjellen mellom prøvene ikke ville forekomme tilfeldigvis mer enn 5 ganger ut av 100. Men konvensjonene er nyttige når det er ingen annen rimelig guide.

Beslutningen om hvordan balansen mellom de to typer feil skal treffes må gjøres av forskeren. I noen tilfeller er det viktigere å være sikker på å avvise en hypotese når det er feil enn å ikke akseptere det når det er sant. I andre tilfeller kan omvendt være sant.

For eksempel er det i enkelte land ansett som viktigere å avvise en hypotese om skyld når det er feil enn å ikke akseptere denne hypotesen når det er sant, det vil si at en person anses å være uskyldig så lenge det er en rimelig tvil om hans skyld. I enkelte andre land anses en person som er begått av en forbrytelse skyldig til en slik tid som han har påvist sin mangel på skyld.

I mye forskning er det selvsagt ingen klar grunnlag for å avgjøre om en Type I eller Type II feil ville være dyrere, og så bruker etterforskeren det konvensjonelle nivået ved å bestemme statistisk signifikans. Men det kan være noen studier der en type feil klart ville være dyrere og mer skadelig enn den andre.

Anta at i en organisasjon har det blitt foreslått at en ny arbeidsfordelingsmetode ville være mer effektiv og anta også at denne metoden ville kreve mye bekostning.

Hvis et eksperiment utgjøres av to grupper av personell - en operasjon som eksperimentell gruppe og den andre som kontrollgruppe - er satt opp for å teste om den nye metoden egentlig er gunstig for de organisatoriske målene og hvis det forventes at den nye metoden vil innebære Mange utgifter ville organisasjonen ikke ønske å vedta det med mindre det var betydelig sikkerhet for overlegenheten.

Med andre ord ville det være dyrt å lage en Type 1-feil, det vil si at den nye metoden er bedre når den ikke er så faktisk.

Hvis den nye metoden medførte utgifter som var omtrent det samme som den gamle metoden, ville type II-feilen være uønsket og mer skadelig siden det kan føre til at ledelsens manglende evne til å vedta den nye metoden når den faktisk er overlegen og som sådan har mange fordeler i butikken for organisasjonen.

Eventuelle generaliseringer fra prøven til "befolkningen" er bare en uttalelse av statistisk sannsynlighet. La oss si, vi har bestemt oss for å jobbe med et 0, 05 nivå av betydning. Dette betyr at vi bare skal avvise "nullhypotesen" hvis prøveforskjellen av størrelsen vi har observert, kan forventes å forekomme tilfeldigvis ikke mer enn 5 ganger i 100.

Selvfølgelig vil vi akseptere "nullhypotesen" hvis en slik forskjell kan forventes å forekomme tilfeldigvis mer enn 5 ganger ut av 100. Nå er spørsmålet: Viser vår oppfatning en av disse 5 ganger når en slik forskjell kan ha dukket opp ved en tilfeldighet?

Dette spørsmålet kan ikke besvares definitivt på grunnlag av et isolert funn. Det kan imidlertid være mulig for oss å si noe om dette når vi undersøker mønstrene i våre funn.

Anta at vi er interessert i å teste effektene av en film om holdninger til et bestemt regjeringsprogram, sier familieplanlegging. Vi har, la oss si, tatt godt vare på å holde de ønskede betingelsene for eksperimentering på det maksimale.

Anta nå at vi bruker som en måling av holdninger til programmet, bare ett element, nemlig holdningen til avstandsbarn og finne at de som så filmen, er mer positivt tilbøyelige til dette problemet enn de som ikke så filmen.

Anta nå, den statistiske testen viser at forskjellen ikke ville ha oppstått ved en tilfeldighet på grunn av tilfeldige samplingsfluktuasjoner mer enn en gang i tjue. Logisk betyr det også at det kanskje har dukket opp en tilfeldighet en gang i tjue (eller 5 ganger på 100). Som vi har påpekt, har vi ingen bestemt måte å vite om vår prøve er en av de fem i 100. Nå, hva kan vi gjøre best?

La oss si at vi har spurt 40 ulike spørsmål til respondentene, som er rimelige indikatorer på holdningen til familievennlige regjeringsprogrammet. Hvis vi bruker et konfidensnivå på 5%, og hvis vi stiller 100 spørsmål, kan vi forvente å finne statistisk signifikante forskjeller som kan henføres til sjansen på fem av dem.

På grunn av de 40 spørsmålene vi har om ulike elementer, kan vi derfor forvente å finne statistisk signifikante forskjeller på 2 av dem. Men antar vi faktisk at det på 25 av 40 spørsmål på de som så filmen, hadde gunstigere holdninger enn de som ikke så filmen.

Vi kan, da dette er tilfellet, føle seg mye tryggere ved å konkludere med at det er en sann forskjell i holdninger (selv om den statistiske testen indikerer at forskjellen kan ha oppstått ved en tilfeldighet på hvert spørsmål 5 ganger på 100).

La oss nå anta at ut av de 40 spørsmålene, viste svar på bare en, dvs. om avstanden mellom barn, en statistisk signifikant forskjell mellom de to gruppene de utsatt for film og de ikke). Denne forskjellen kan også ha skjedd ved en tilfeldighet.

På den annen side kan det hende at innholdet i filmen faktisk påvirket meninger på dette punktet, men ikke på noen andre (som for eksempel om sterilitetsoperasjoner). Men med mindre vår hypotese har spesifikt spådd på forhånd at filmen ville være mer sannsynlig å påvirke holdninger til avstand mellom barn enn holdninger til noen av de andre 39 spørsmålene, er vi ikke berettiget til å gjøre denne tolkningen.

En slik tolkning, det vil si en påtalte å forklare funnene etter at de er overflatt, kalles "etterfaktum" -fortolkningen, fordi dette innebærer forklaringer som er gitt for å begrunne funnene uansett hva de er. Det avhenger av forskerens oppfinnsomhet, om hvilken forklaring han kan oppfinne for å rettferdiggjøre disse funnene. Han kan derfor rettferdiggjøre selv de motsatte funnene.

Merton har meget tydelig påpekt at post-factum tolkningen er utformet for å "forklare" observasjoner. Metoden for etter faktum forklaring er helt fleksibel. Hvis forskeren finner at de arbeidsledige har en tendens til å lese færre bøker enn tidligere, kan dette bli "forklart" av hypotesen om at angst som følge av arbeidsledighet påvirker konsentrasjonen og at lesing blir vanskelig.

Hvis det imidlertid observeres at de arbeidsløse leser flere bøker enn tidligere (når de er i arbeid), kan en ny etterfaktorforklaring påberopes; Forklaringen er at de arbeidsløse har mer fritid og derfor leser de flere bøker.

Den kritiske testen på 'et oppnådd forhold (blant variabler) er ikke post-factum rasjonalitet og forklaring på det; Det er heller evnen til å forutsi det eller å forutsi andre forhold på grunnlag av det. Dermed kan vår tidligere uforutsette funn av en forskjell i holdninger til avstand mellom barn, selv om det er statistisk signifikant, ikke betraktes som etablert av studien vi har utført.

Siden statistiske utsagn er sannsynlighetserklæringer, kan vi aldri helt stole på det statistiske beviset alene for å avgjøre hvorvidt vi vil akseptere en hypotese som sann eller ikke.

Tillit til tolkingen av et forskningsresultat krever ikke bare statistisk tillit til funnets pålitelighet (det vil si at forskjellene ikke sannsynligvis har funnet sted ved en tilfeldighet), men i tillegg noen bevis på gyldigheten av forutsetninger for forskningen.

Dette beviset er nødvendigvis indirekte. Det kommer fra kongruensen til de oppgitte forskningsresultatene med annen kunnskap som har bestått testen av tid og dermed om hvilken det er stor sikkerhet.

Selv i den strengest kontrollerte undersøkelsen krever etableringen av tillit til tolkningen av ens resultater eller i påvirkningen av årsaksforhold forholdet mellom forskningens replikasjon og sammenhengen mellom funnene og andre studier.

Det er nødvendig å merke seg at selv om statistiske tester og funnene fra en rekke studier tyder på at det faktisk er en konsistent forskjell mellom to grupper eller konsistent forhold mellom to variabler, er dette fortsatt ikke bevis på årsaken til forholdet.

Hvis vi ønsker å tegne årsakssammenheng (f.eks. X produserer Y), må vi oppfylle forutsetninger utover de som kreves for å etablere eksistensen av et forhold. Det er også verdt å merke seg at et resultat ikke er sosialt eller psykologisk signifikant bare fordi det er statistisk signifikant. Mange statistisk signifikante forskjeller kan være trivielle i praktisk sosial oversikt.

For eksempel kan en gjennomsnittlig forskjell på mindre enn ett IQ-punkt mellom urbane og landlige mennesker være betydelig statistisk, men ikke slik i det praktiske hverdagen. I motsetning til det er tilfeller der en liten, men pålitelig forskjell har stor praktisk betydning.

I en storskalaundersøkelse kan for eksempel en forskjell på halvparten eller en prosent representere flere hundre tusen mennesker, og bevissthet om forskjellen kan være viktig for viktige politiske beslutninger. Derfor skal forskeren i tillegg til å være opptatt av den statistiske betydningen av hans funn også være opptatt av deres sosiale og psykologiske betydninger.

Inferring årsakssammenheng:

På grunn av åpenbare vanskeligheter kan slike stive eksperimentelle design sjelden utarbeides i samfunnsvitenskapelige undersøkelser. De fleste av henvendelsene i samfunnsvitenskap er ikke-eksperimentelle karakter.

I slike studier er det visse empiriske hindringer i veien for å avgjøre hvorvidt forholdet mellom variabler er kausal eller ikke. Det er gjentatte ganger nevnt at en av de vanskeligste oppgavene i analysen av data om sosial atferd er etablering av årsakssammenheng.

En problematisk situasjon skyldes opprinnelsen og prosessen med å bli, ikke bare til en faktor, men til et kompleks av forskjellige faktorer og sekvenser.

Prosessen med disentangling av disse elementene utgjør en stor utfordring for den sosiologiske fantasi og setter for å teste forskernes ferdigheter. Det er farlig å følge en "en-spor" forklaring som fører til årsaken. Det er viktig å se etter et helt batteri med årsaksfaktorer som generelt spiller en viktig rolle for å få komplekse sosiale situasjoner.

Som Karl Pearson påpeker, "ingen fenomen eller scene i rekkefølge har bare en årsak; alle antecedent stadier er suksessive årsaker; når vi vitenskapelige stater forårsaker, beskriver vi virkelig de påfølgende trinnene i en rutine med erfaring. "

Yule og Kendall har anerkjent det faktum at statistikk "må akseptere for analyse, data som er påvirket av en rekke årsaker og må forsøke å finne ut av dataene selv hvilke årsaker er de viktigste og hvor mye av den observerte effekten skyldes operasjonen av hver. "

Paul Lazarsfeld har sporet faser involvert i teknikken han kaller "kresne." Han fortaler sin bruk for å bestemme årsakssammenheng mellom variabler. Lazarsfeld legger ned denne prosedyren:

(a) Verifisere en påstått forekomst som under:

For å bekrefte denne forekomsten er det nødvendig å fastslå om personen faktisk har opplevd de påståtte situasjonene. Hvis ja, hvordan manifesterer forekomsten seg og under hvilke forhold, i sitt nærmeste liv?

Hvilke grunner er avanserte for troen på at det er en bestemt sammenkobling mellom to variabler, for eksempel tap av sysselsetting og tap av myndighet? Hvor riktig er personens resonnement i denne spesielle forekomsten?

(b) Forsøk på å oppdage om den påståtte tilstanden er i samsvar med objektive fakta i denne personens siste liv.

(d) Ruling ut de forklaringene som ikke er i samsvar med mønsteret av hendelser.

Det er ganske forståelig at de fleste vanskeligheter eller hindringer for å etablere årsakssammenheng truer ikke-eksperimentelle studier mest skarpt. I ikke-eksperimentelle studier hvor interessen er å etablere årsakssammenheng mellom to variabler, må etterforskeren finne erstatninger for beskyttelser som er patentert innbygget i forsøksstudiene.

Mange av disse beskyttelsene er inngått ved planlegging av datainnsamling, i form av å samle inn informasjon om en rekke variabler som kan være de alternative forholdene for å produsere den hypoteseeffekten.

Ved å innføre slike tilleggsvariabler i analysen, nærmer forskeren noen av kontrollene som er iboende i eksperimenter. Ikke desto mindre forblir tegningen av årsakssammenheng alltid noe farlig i ikke-eksperimentelle studier.

Vi skal nå diskutere noen av problemene og strategiene for å overvinne dem, knyttet til tegning avferdigheter om årsakssammenheng i ikke-eksperimentelle studier. Hvis en ikke-eksperimentell studie peker på et forhold eller forening mellom to variabler, sier X og Y, og hvis forskningsinteressen er i årsakssammenheng snarere enn i det enkle forholdet mellom variabler, har analysen bare tatt sitt første skritt.

Forskeren må videre vurdere (foruten tilknytning mellom X og Y) om Y (effekt) kan ha oppstått før X (den hypotese årsaken), i hvilket tilfelle Y ikke kan være effekten av X.

I tillegg til denne vurderingen må forskeren tenke over spørsmålet om andre faktorer enn X (den hypotese årsaken) kan ha produsert Y (den hypoteseeffekten). Dette er generelt tatt vare på ved å introdusere flere variabler i analysen og undersøke hvordan forholdet mellom X og Y påvirkes av disse ytterligere variablene.

Hvis forholdet mellom X og Y vedvarer, selv om andre antagelig effektive og muligens alternative variabler innføres, er hypotesen om at X er årsaken til Y fortsatt holdbar.

For eksempel, hvis forholdet mellom å spise en bestemt sesongfrukt (X) og kaldt (Y) ikke endres selv når andre variabler som alder, temperatur, fordøyelsestilstand, etc. blir introdusert i analysen, kan vi akseptere hypotesen om at X fører til Y som holdbar.

Men det er ikke mulig i noen få tilfeller at innføringen av andre tilleggsvariabler kan endre forholdet mellom X og Y. Det kan redusere for å eliminere forholdet mellom X og Y helt eller det kan forbedre forholdet i en gruppe og redusere det i en annen.

Hvis forholdet mellom X (spising av sesongfrukt) og Y (kald) blir forbedret i en undergruppe karakterisert ved Z (dårlig fordøyelsestilstand) og redusert i undergruppe ikke preget av Z (normal fordøyelsestilstand), vil vi kan konkludere med at Z er betinget betingelse for forholdet mellom X og Y.

This means, in other words, that we have been able to specify condition (Z) under which the relation between X and Y holds. Now if introduction of Z in the analysis reduces or totally eliminates the relationship between X and Y, we shall be safe in concluding either that X is not a producer of Y, that is, the relation between X and Y is 'spurious' or that we have traced the process by which X leads to Y (ie, through Z).

Let us turn to consider the situation in which we can legitimately conclude that the relation between X and Y is spurious.

An apparent relationship between two variables X and Y is said to be spurious if their concomitant variation stems not from a connection between them but from the fact that each of them (X and Y) is related to some third variable (Z) or a combination of variables that does not serve as a link in the process by which X leads to Y.

The situation characterizing spurious relationship may be diagrammed as under:

The objective here is to determine the cause of Y, the dependent variable (let us say, the monetary expectation by college graduates). The relationship (broken line) between X the independent variable (let us say, the grades obtained by students) and the monetary expectation of graduates (Y) has been observed in the course of the analysis of data.

Another variable (Z) is introduced to see how the relation between X and Y behaves with the entry of this third factor. Z is the third factor (let us say, the income-level of the parents of students). We find that the introduction of this factor reduces the relationship between X and Y.

That is, it is found that the relation between higher grade in the examination and higher monetary expectations does not hold itself up, but is considerably reduced when we introduce the third variable, ie, the level of parents' income.

Such an introduction of Z brings to light the fact that not X but Z may probably be a determining factor of Y. So the relationship between X and Y (shown in the diagram by a dotted line) is a spurious one, whereas the relation between Z and Y is a real one. Let us illustrate this with the help of hypothetical data.

Suppose, in the course of the analysis of data in a study, it was seen that there is a significant correlation between the grades or divisions (I, II, III) that students secured in the examination and the salary they expect for a job that they might be appointed to.

It was seen, for instance, that generally the first divisioners among students expected a higher remuneration compared to the second divisioners and the second divisioners expected more compared to the third divisioners.

The following table illustrates the hypothetical state of affairs:

It is clearly seen from the table that there is a basis for hypothesizing that the grades of the students determine their expectations about salaries. Now, let us suppose that the researcher somehow hits upon the idea that the income-level of the parents (X) could be one of the important variables determining or influencing the students' expectations about salaries (Y). Thus, Z is introduced into the analysis.

Suppose, the following table represents the relationship among the variables:

Merk:

HML in the horizontal row, dividing each category of the students' grades, stand respectively for high parental level of income, moderate parental level of income and low parental level of income. The above table clearly shows that the relation between X and Y has become less significant compared to the relation between Z and Y. '

To get a clearer picture, let us see the following table (a version of Table B omitting the categories of X) showing the relationship between Z and, ie, parental income level and students' monetary expectations:

We can very clearly see from the table that, irrespective of their grades, the students' monetary expectations are very strongly affected by the parental levels of income (Z).

We see that an overwhelming number of students (ie, 91.5%) having high monetary expectations are from the high parental income group, 92% having moderate monetary expectations are from moderate parental income group and lastly, 97% having low monetary expectations are from the low parental income group.

Comparing this picture with the picture represented by Table A, we may say that the relation between X and Y is spurious, that is, the grade of the students did not primarily determine the level of the monetary expectations of the students.

It is noted in Table A that students getting a higher grade show a significant tendency toward higher monetary expectations whereas the lower grade students have a very marked concentration in the lower monetary expectation bracket.

But when we introduce the third variable of parental income, the emerging picture becomes clear enough to warrant the conclusion that the real factor responsible differential levels of monetary expectations is the level of parental income.

I tabell C ser vi en svært sterk og formidabel konsentrasjon av tilfeller av studenter som svarer til de tre nevnte kombinasjonene, dvs. av høyere pengepåventede forventninger og høyere foreldrenes inntekt, moderate pengeforventninger og moderat foreldreinntekt og lavere pengepolitiske forventninger og lavere foreldreinntekt, det vil si henholdsvis 5%, 92, 1% og 1%.

Sporing av prosessen involvert og et forhold blant variabler: Som tidligere nevnt, kan en tredje faktor Z redusere eller eliminere forholdet mellom den uavhengige variabel X og den avhengige variabelen Y, og det kan vi enten konkludere med at forholdet mellom X og Y er falskt, eller at vi har kunnet spore prosessen som X fører til Y.

Vi skal nå vurdere omstendighetene som ville berettige konklusjonen om at prosessen med forholdet mellom X og Y har blitt sporet gjennom en tredje faktor Z.

Anta at i undersøkelser fant utrederne at mindre samfunn hadde en høyere gjennomsnittlig intimitetspoengsum, intimitetspoenget som et mål for intimiteten til tilknytning mellom medlemmer av et samfunn ankom ved å bruke en intimitetsskala.

Anta at de også fant at de mellomstore fellesskapene hadde en mindre intimitetspoengsum i forhold til de små samfunnene og de store samfunnene hadde minst gjennomsnittlig intimitetspoengsum. Et slikt funn tyder på at samfunnets størrelse bestemmer foreningen av foreningen blant medlemmer av samfunnet.

Med andre ord begrunner observasjonene konklusjonen om at medlemmene som bor i et mindre samfunn, har større tilknytning til foreningen, mens de store samfunnene er preget av en mindre tilknytning mellom medlemmene.

Tabellen nedenfor viser hypotetiske data:

I den andre kolonnen i tabellen er det vist prøver som svarer til hvert av lokalsamfunnene.

I den andre kolonnen i tabellen er det vist prøver som svarer til hvert av lokalsamfunnene. I kolonne 3 er de gjennomsnittlige intimitetspoengene som svarer til typer samfunn, beregnet på grunnlag av svarene gitt til enkelte elementer på en skala relatert til de daglige foreningene blant medlemmer, vist.

Det fremgår av tabellen at gjennomsnittlige intimitetspoengene varierer omvendt med størrelsen på fellesskapet, dvs. mindre størrelse, jo større intimitetspoeng og omvendt, større størrelse, desto lavere er intimitetspoengene.

Nå antar at etterforskerne fikk ideen om at de tre typer fellesskap ville ha forskjellig når det gjelder muligheter de tilbyr for samhandling mellom medlemmer, så vel som leveordninger, boligmønster, fellesforetak etc. vil fremme en slik tilknytning.

Dermed vil etterforskerne introdusere den tredje faktoren i analysen av interaksjonspotensialet, dvs. i hvilken utstrekning de omstendighetene personene lever i, sannsynligvis vil gi muligheter for interaksjon mellom seg selv.

For å sjekke hypotesen om at det var i stor grad gjennom forskjeller i boligmønster, levearrangementer, fellesforetrukne fasiliteter etc., at de tre typer samfunn produserte forskjeller i samhandling mellom medlemmer av et samfunn, ville etterforskerne vurdere størrelsen på fellesskap og interaksjon-potensial i fellesskap i forhold til gjennomsnittlig intimitetspoengsum.

Infraksjonspotensialet er således den tredje variabelen Z introdusert i analysen. Interaksjon-potensialet er klassifisert, la oss si til et interaktivt potensial (b) medium interaksjonspotensial, og (c) høyt interaksjonspotensial.

Følgende tabell representerer hypotetiske data:

Leser på tvers av radene i tabellen ser vi at samspillet-potensialet er sterkt knyttet til intimitetspoengene til fellesskapsmedlemmene, uansett størrelsen på fellesskapet.

Det vil si om vi vurderer raden for små grupper, for de mellomstore fellesskapene, eller for de store fellesskapene, er det i hvert tilfelle en økning i gjennomsnittlig intimitetspoengsum med en økning i samspillingspotensial. Videre blir det klart at størrelsen på fellesskapet og interaksjonspotensialet har en signifikant korrelasjon ved å lese oppføringene på tvers av radene.

For eksempel lever omtrent to tredjedeler av respondentene i et mindre samfunn under forhold med høyt interaksjonspotensiale; Vi finner også at en mye mindre andel av de moderate samfunnets beboere lever under høye samspill - potensielle forhold og en svært liten andel av de store samfunnsboerne under høye samspill - potensielle forhold.

Nå leser vi intimitetspoengene bare i kolonnene for å finne ut at forholdet mellom type fellesskap og tilknytningsintensitet er blitt betydelig redusert. Faktisk, for folk som lever under høye interaksjonspotensielle forhold, oppnår det ikke noe bestemt forhold mellom størrelsen på samfunnet og intimitetspoengene.

Fra dette settet av forhold kan etterforskerne konkludere med at det omvendte forholdet mellom samfunnets størrelse og intimitetspoengene holder seg bra, men at en av de store måtene som en bestemt type samfunn oppmuntrer til intimitet blant sine medlemmer, er ved å tilby muligheter som øker interaksjonsgraden blant dem.

Med andre ord kjennetegnes de små samfunnene av en høyere gjennomsnittlig intimitetspoeng fordi deres lille størrelse gir en ramme for mange muligheter for høy grad av samhandling mellom medlemmer. Stor-store fellesskap, derimot, preges av en relativt lavere intimitetspoengsum.

Men den lavere intimitetspoengsummen kan tilskrives ikke størrelsen på samfunnet i seg selv, men til det faktum at et stort fellesskap ikke kan tilby muligheter for høyere samhandling mellom medlemmer som de små samfunnene gjør.

Forskerne i stedet for å konkludere med at forholdet mellom størrelsen på fellesskapet og den gjennomsnittlige intimitetspoengsummen blant medlemmene er falsk, kan konkludere med at de har vært i stand til å spore prosessen som X (dvs. typen av fellesskap) påvirker Y (intimitetspoengsummen).

Den førstnevnte berettiget konklusjonen om at forholdet mellom variablene X og Y var falskt, og sistnevnte konkluderte med at prosessen fra X til Y kan spores gjennom Z (X til Z til Y). I begge tilfeller reduserte eller eliminerte innføringen av en tredje variabel Z forholdet mellom dem (X og Y).

En forskjell kan imidlertid noteres. I det første eksemplet var variablen Z (dvs. foreldrenes inntektsnivå) tydeligvis tidligere i tid til de andre to variablene (studentens karakter i eksamen og studenters økonomiske forventninger).

I det andre eksempelet oppsto ikke den tredje variabelen Z (interaksjonspotensial som ble gitt av samfunnene) før den antatte årsakssvariabelen (størrelsen på fellesskapet). Det var samtidig med det og kan tenkes som å starte etter det.

Tidssekvensen av variablene er således et viktig hensyn når det gjelder å avgjøre om et tilsynelatende årsakssammenheng er falskt. Det vil si at hvis den tredje variabelen Z, som fjerner eller eliminerer forholdet mellom de opprinnelig relaterte variablene X og Y, konkluderer vi vanligvis at det tilsynelatende årsakssammenheng mellom variabler X og Y er falskt.

Men hvis den tredje variabelen Z er kjent eller antatt å ha oppstått på samme tid som X eller etter X, kan det være for å konkludere at prosessen som X fører til Y, er sporet. For å ha et visst mål på tillit til årsakssammenheng utledet fra studier som ikke er eksperimentelle, er det nødvendig å underkaste dem den kritiske testen for å eliminere de andre eventuelt relevante variablene.

Av denne grunn er det viktig å samle i løpet av studiet data om slike mulig innflytelsesrike variabler annet enn de som hypotesen av studien er sentralt opptatt av.

Det ble tidligere sagt at innføringen av en tredje variabel i analysen kan føre til å intensivere forholdet i en undergruppe og å redusere det samme i en annen undergruppe. Hvis det er tilfelle, sier vi at vi har angitt en tilstand (Z) der forholdet mellom X og Y holder.

La oss nå illustrere prosessen med spesifikasjon. Anta at vi i et samfunnsstudium skaper et forhold mellom inntekt og utdanningsnivå.

Dette er vist i tabellen nedenfor:

Vi ser i tabellen at forholdet mellom utdanning og inntekt er ganske markert. Høyere utdanning, generelt, øker andelen tilfeller som gir en årlig inntekt på Rs.5000 / - og over. Vi kan imidlertid bestemme at forholdet krever ytterligere spesifikasjon.

Det vil si at vi kanskje ønsker å vite mer om forholdene der dette forholdet oppnås. Anta at tanken slår oss fram at faktumet til respondentene som bor i urbane industrielle samfunn, positivt kan påvirke fordelene med utdanning for lønnsomt arbeid og dermed dens refleksjon i inntekt.

På denne forutsetningen introduserer vi den tredje faktoren Z, det vil si de respondentene som bor i bysamfunnet og de som bor i landlige ikke-industrielle samfunn, inn i analysen og ser hvordan det påvirker det opprinnelige forholdet mellom X og Y ( dvs. utdanning og inntekt).

Anta at vi får et bilde som vist i følgende tabell:

Vi kan se tydelig at tabell B gjenspeiler et svært forskjellig forhold mellom inntekt og utdanning for de som bor i landsbygdens ikke-industrielle samfunn, sammenlignet med dem som bor i det urbane industrielle samfunnet. Vi ser at for de som bor i industribyene, er forholdet mellom utdanning og inntekt noe høyere enn det opprinnelige forholdet.

Men for de som bor i landlige ikke-industrielle samfunn, er forholdet i tabellen ovenfor betydelig lavere enn det opprinnelige forholdet.

Således har introduksjonen av den tredje faktoren og nedbrytingen av det opprinnelige forholdet på grunnlag av den tredje faktor (Z) bidratt til å spesifisere en tilstand under hvilken forholdet mellom X og Y er mer uttalt som også tilstanden under hvilken forholdet er mindre uttalt.

På samme måte antar vi at det i en studie er at personer som tilhører den høyere inntektskategorien generelt har mindre antall barn sammenlignet med de som har lavere inntektskategori. Anta at vi føler (på grunnlag av en teoretisk orientering) at byboens faktor kan være viktig for å påvirke forholdet.

Å innføre denne faktoren, anta at vi finner at det opprinnelige forholdet mellom inntektsnivå og antall barn blir mer uttalt i byen, og at det blir mindre uttalt blant landbefolkningen enn vi har identifisert en tilstand Z (dvs. bybo ) der relasjonen blir avgjørende forbedret eller uttalt.

Tolke resultatene av en studie:

Hittil har vi først og fremst vært opptatt av prosedyrene som sammen består av, det vi kalder vanligvis, analysen av data. Forskerens oppgave er imidlertid ufullstendig hvis han stopper ved å presentere sine funn i form av empiriske generaliseringer som han kan komme frem til gjennom analyse av data.

En forsker som for eksempel winds opp sin forskningsøvelse bare ved å si at "ugifte mennesker har en høyere forekomst av selvmord i forhold til det gifte folk", oppfyller neppe sin overordnede forpliktelse til vitenskap, selv om den empiriske generalisering han har lagt fram har noen verdi av seg selv.

Forskeren i vitenskapens større interesse må også forsøke å vise at hans observasjon peker på visse underliggende relasjoner og prosesser som i utgangspunktet er skjult for øyet. Forskeren må med andre ord vise at hans observasjon har en mening, mye bredere og dypere enn den som det ser ut til å ha på overflatenivå.

For å gå tilbake til vårt eksempel på selvmord, bør forskeren kunne vise at hans observasjon om at "ugifte mennesker er preget av selvmord", reflekterer faktisk det dypere forholdet mellom sosial samhørighet og selvmordshastighet (Durkheims teori).

Når forskeren er i stand til å avsløre forhold og prosesser som ligger til grunn for sine konkrete funn, kan han etablere abstrakte forhold mellom hans funn og forskjellige andre.

I hovedsak går forskerens arbeid godt utover samlingen og analysen av data. Hans oppgave strekker seg til å tolke funnene av hans studie. Det er gjennom fortolkning at forskeren kan forstå den virkelige betydningen av hans funn, det vil si at han kan sette pris på hvorfor funnene er hva de er.

Som det ble sagt tidligere, er tolkning søket etter bredere og mer abstrakte betydninger av forskningsresultatene. Dette søket innebærer å se forskningsresultater i lys av annen etablert kunnskap, en teori eller et prinsipp. Dette søket har to hovedaspekter.

Det første aspektet innebærer innsatsen for å etablere kontinuitet i forskning ved å knytte resultatene av en gitt studie med en annen. Det er gjennom fortolkning at forskeren kan rase eller forstå det abstrakte prinsippet under konkrete empiriske observasjoner.

Denne abstrakte fellesnevneren har blitt oppdaget, forskeren kan enkelt fortsette å knytte sine funn opp med de andre studier utført i ulike innstillinger, mangfoldig i detaljer, men reflekterer det samme abstrakte prinsippet på funnnivået.

Det er unødvendig å si at forskeren på grunnlag av anerkjennelsen av det abstrakte teoretiske prinsippet som ligger til grund for hans funn, kan gjøre ulike spådommer om den konkrete verden av hendelser som ikke er relatert til tilsynelatende området for hans funn. Dermed kan friske henvendelser utløses for å teste forutsigelser og forståelig nok, ville slike studier ha et forhold til forskerens første studie.

I en noe annen forstand er tolkning nødvendigvis involvert i overgangen fra forsøkende til eksperimentell forskning. Fortolkningen av funnene fra den tidligere kategorien av undersøkelser fører ofte til hypoteser for sistnevnte.

Siden en utforskende studie ikke har en hypotese å begynne med, må funnene eller konklusjonene av en slik studie tolkes på en "etterfaktum" tolkning er ofte et farlig spill med farlige implikasjoner. En slik tolkning innebærer et søk etter en gudfar i form av noen teori eller prinsipp som vil vedta (dvs. forklare) funnene av studien.

Denne søken viser seg ofte å være en øvelse fra forskerens side for å rettferdiggjøre sine funn ved å finne noen egnet teori for å passe hans funn. Som et resultat kan ganske ofte motstridende konklusjoner finne sine "gudfedre" i ulike teorier.

Dette aspektet av post-factum-tolkning, som omfatter forsøk på å rasjonalisere forskningsresultater, bør tydelig holdes i bakhodet når man fortsetter med det. Ved anledninger er det imidlertid ikke noe annet alternativ til det.

For det andre fører tolkningen til etablering av forklarende begreper. Som det er påpekt, innebærer tolkning av funn anstrengelser for å forklare hvorfor observasjoner eller funn er, hva de er. I å utføre denne oppgaven er teorien viktig.

Det er en sensibilisator og en veiledning til de underliggende faktorene og prosessene (forklarende grunnlag) under funnene. Under forskerens observasjoner i løpet av en studie ligger et sett med faktorer og prosesser som kan forklare hans observasjoner av den empiriske verden. Teoretisk tolkning avslører disse faktorene.

Forskerens oppgave er å forklare forholdet han har observert i løpet av studiet ved å avsløre de underliggende prosessene som gir ham en dypere forståelse av disse relasjonene og peker på rollen som visse grunnleggende faktorer som opererer i problemområdet av studien.

Således tjener tolkning et todelt formål. For det første gir det en forståelse av de generelle faktorene som synes å forklare hva som er observert i løpet av en studie, og for det andre gir den en teoretisk oppfatning som kan tjene som en guide for videre forskning.

Det er på denne måten at vitenskapen kommer til å kumulativt frigjøre de vellykkede grunnleggende prosessene som danner den delen av den empiriske verden som en forsker er opptatt av.

Tolkning er så uløselig sammenflettet med analyse at det bedre skal utfattes som et spesielt aspekt ved analyse enn en separat eller distinkt operasjon. Til slutt er vi fristet til å sitere prof. C. Wright Mills som har uttalt selve essensen av hva alt er involvert i analysen (involvering av tolkning) av data.

Says Mills, "Så du vil oppdage og beskrive, sette opp typer for å bestille hva du har funnet ut, fokusere og organisere erfaring ved å skille elementer etter navn. Dette søket etter ordre vil føre til at du søker mønstre og trender og finner relasjoner som kan være typiske og årsakssammenhengende. Du vil søke kort, for meningen med hva du har kommet over, eller hva som kan tolkes som et synlig tegn på noe som virker involvert i hva du prøver å forstå; du vil pare det ned til nødvendighet; så omhyggelig og systematisk vil du forholde disse til hverandre for å danne en slags arbeidsmodell .... "

"Men alltid blant alle detaljer, vil du søke etter indikatorer som kan peke på hoveddriften, til de underliggende former og tendenser i samfunnets rekkevidde i sin spesielle tidsperiode." Etter at en undersøkelse er avsluttet, erklæringen som reiser en rekke nye spørsmål og problemer kan bli gjort.

Noen av de nye spørsmålene utgjør grunnlaget for nye forskningsforetak og formulering av nye teorier som enten vil modifisere eller erstatte gamle. Dette er faktisk hva forskningen betyr. Den tjener til å åpne nye og bredere veier av intellektuelt eventyr, og simulerer søket etter mer kunnskap og større visdom i bruk.