Eksempelstørrelse: Problem og matematikk

Etter å ha lest denne artikkelen vil du lære om problem og matematikk av prøvestørrelse.

Problemet med prøveformat:

Vi skal nå vurdere en av de vanskeligste problemene knyttet til prøvetaking, dvs. problemet med prøvestørrelse. "Hva skal være tilstrekkelig størrelse på prøven i forhold til befolkningens størrelse?" "Hvor stor burde være et utvalg?" Er spørsmål som ofte blir spurt av forskerstuderende. Xo avgjørende svar på dette spørsmålet kan gis.

Dette skyldes at spørsmålet om størrelse kun kan besvares når vi er prøvetakingselementer for befolkningen på en slik måte at hvert element har samme sjanse til å bli inkludert i prøven, dvs. når vi vedtar sannsynlighetsdesign av prøvetaking.

Bare sannsynlighetsdesign muliggjør formulering av representative prøvetakingsplaner. Dermed gjør det mulig å formulere representative prøvetakingsplaner.

Derfor spørsmålet "hvor stor prøven skal være for å være representativ for befolkningen av en bestemt størrelse?" Forutsetter sannsynlighetsprøveprosedyren. Manglende denne prosedyren, representativiteten av prøven, uansett hvor stor det er, kan bare være et spørsmål om håp og formodning.

De generelle misforståelsene med hensyn til størrelsen på prøven er at størrelsen på universet som prøven trekkes av, bestemmer antall tilfeller som trengs for å gi et tilstrekkelig eller representativt utvalg av det universet.

Vi skal gjøre det bra å merke seg med en gang at vekten ikke bør plasseres på antall tilfeller i universet, men på deres nummer i prøven.

Matematikk av prøveformat:

Det grunnleggende praktiske spørsmålet "Hvordan bestemme prøvestørrelsen som vil gi den ønskede grad av presisjon som forskeren fastsetter for en gitt studie?" Prøvetaksproblemet er selvsagt det samme i alle studier, dvs. å estimere eller Forutsi noe om befolkningen på grunnlag av kunnskap om noe om prøven.

Forskeren må vite hva slags statistikk på prøven vil tjene formålet, f.eks. Prosenter, gjennomsnitt, standardavvik, etc. for en slik estimering. Dette er viktig fordi ulike typer statistikk er nyttige, avhengig av ønsket grader av presisjon i utvalgsavkastning som i sin tur blir gitt av forskjellige utvalgsstørrelser.

Gjennomsnitt og prosentandel er den mest vanlige statistikken, og vi skal derfor behandle spørsmålet om utvalgsstørrelser som svarer til de ønskede grader av presisjon med hensyn til gjennomsnitt og prosentandel.

Siden prøven tegnet av forskeren er bare en av de mange mulige prøvene av universet som han kanskje har skjedd å velge, må han vite hvor mye tillit han kan plassere på prøven som representant for "universet" som han ønsker å vite noe eller med henvisning til hvilken han ønsker å generalisere.

Han trenger å vite hvor stor prøven skal være for å gi ham et tilfredsstillende nivå av presisjon. Denne beregningen er mulig ved bruk av matematikk siden i tilfeldig prøvetaking (sannsynlighetsprøvetaking) hvor hvert element i universet har en spesifisert sannsynlighet for inkludering i prøven, er presisjonen eller estimatets presisjon knyttet til kvadratroten av antall elementer i prøven.

Før du fortsetter å beregne den nødvendige størrelsen på prøven for en gitt studie, er det i praksis nødvendig å sikre noen foreløpig informasjon om befolkningen eller universet.

Hvis forskeren har til hensikt å bruke prøven for å gjøre et estimat av gjennomsnittlig måling av spesiell egenskap i universet, må han ha et foreløpig estimat til standardavviket (dispersjon) i fordelingen av verdiene av elementer i universet med respekt til den oppgitte egenskapen.

Forskeren som kommer til å kjenne spekteret av verdier (spredningen) med hensyn til et bestemt karakteristikk i universet, kan få et foreløpig estimat av standardavviket ved å dividere dette området med 6, siden standardavviket til det (endelige) universet kan for alle praktiske formål bli tatt til å være rundt 1/6 av hele spekteret av variasjon.

Med andre ord kan spredningsområdet for en fordeling bli tatt til å omfatte 6 standardavviks-enheter. Den foreløpige informasjonen om universet kan ha blitt gjennomført ved hjelp av en pilotstudie, resultater fra tidligere undersøkelser, fra rapporter utgitt av statistiske byråer, reckoning av eksperter på feltet etc.

Forskeren må, før man fortsetter å beregne størrelsen på prøven, bestemme det forventede nivået av presisjonen av estimatene. Denne forventningen er i hovedsak basert på formålet med studien.

Forskeren må med andre ord bestemme:

(a) Hvor mye feil i estimatet som skal utledes fra prøven (i forhold til den sanne verdien, dvs. verdien av "universet") kan tolereres (kalt feilmargin eller nøyaktighetsgrense) og

(b) Med hvor stor sikkerhet kan det sies at estimatet vil falle innenfor denne feilmarginen (kalt nivå av tillit eller sannsynlighet).

Det vil imidlertid være riktig å vurdere disse i større detalj, for tiden:

(a) Feilmargin eller Nøyaktighetsgrense:

Det grunnleggende spørsmålet her er: 'Hvor mye er prosentandelen eller gjennomsnittet som skal sikres fra studien av prøven, som sannsynligvis vil variere fra den sanne middelverdien (av befolkningen) og kan fortsatt tolereres?' Forskeren kan tolerere 5% feil, eller han kan kreve nøyaktighet innenfor en grense på 2%.

Alt avhenger av hvor nøyaktig eller nøyaktig han vil vite visse fakta. La oss anta at forskeren ønsker å vite på forhånd hvilken av de to kandidatene som bestrider valget skal vinne setet. Hvis avstemningen kommer til å være tett, har forskeren råd til å tolerere bare en mindre feil hvis han skal være praktisk sikker.

Han kan for eksempel angi den tillatte feilen på mindre enn 2%. På den annen side, hvis valget ser ut til å være ensidig og ganske partisk til fordel for en bestemt kandidat, kan forskeren muligens forutsi resultatene selv med en mye større feil i estimatet.

Hvis prøveundersøkelsen skjedde for å vise at 60% av stemmene ville gå til fordel for en kandidat, kan en feil så høy som 9% tolereres. I dette tilfelle, selv om prøveundersøkelsen hadde trukket den mest uheldig prøven som avviker 9% fra sann verdi, ville den virkelige verdien fortsatt være 51%, dvs. 1% over 50% som er kritisk punkt.

Således vil både estimert verdi på 60% og sann verdi på 51% være over det kritiske punktet (dvs. 50%) og prediksjonen ville være pålitelig.

(b) Sannsynlighet eller konfidensnivå:

I tillegg til begrensning av nøyaktighet må forskeren også bestemme med henvisning til studien hvor mye tillit han vil gjerne plassere i utvalgsestimatene, være like nær det sanne estimatet som å være innenfor grensene for toleranse eller nøyaktighet satt av Han for studien.

I enkelte situasjoner vil han kanskje være overbevist om at hans estimater (basert på prøven) vil ligge innenfor 51% av den sanne verdien, mens han i visse andre situasjoner kan være fornøyd med en litt mindre grad av sikkerhet.

I samfunnsvitenskapelig forskning er to grader av sannsynlighet eller selvtillit svært kjent og ofte brukt.

En av disse er 0, 95 nivå av sannsynlighet, det vil si 95 sjanser ut av 100 at prøvesammensetningen ikke vil overstige grensene for toleranse eller feilmargin, og andre nivå er 0.99 nivået, sannsynligheten, det vil si det Det er sannsynlig at i 99 sjanser ut av 100 vil prøveestimatet ikke overstige feilmarginen rettet mot.

Nivået på selvtillit kan til og med settes til 0.999, det vil si at prospektestimatet ikke ville avvike fra den sanne verdien (av universet) utenfor toleransegrenser i 999 sjanser ut av 1000. For visse formål kan forskeren sikte mot lave og sett sannsynlighetsnivået på 0, 67 (dvs. 2 av 3).

Sjansene for at et bestemt utvalg tegnet for en undersøkelse vil gi et estimat av universet som ligger innenfor feilmarginen, avhenger av variasjonen blant prøvene som kan trekkes fra universet. Hvis verdiene som er sikret fra prøvene, har en tendens til å avvike betydelig fra den sanne verdien, er sjansene for en gitt prøveverdi som ligger innenfor de tillatte feilgrenser dårlig.

Standardfeilen er målet som forteller oss hva sjansene for en prøve som ligger innenfor de tillatte grensene er. Det er et mål på variasjon i prøvetakingsestimat som kan forventes i tilfeldig prøvetaking. Tilfeldige prøver har en tendens til å følge sannsynlighetsloven, og proeveestimatene har en tendens til å klare seg rundt den sanne verdien av universet.

Disse estimatene kan representeres av en klokkeformet eller normal kurve. Midtpunktet til denne kurven representerer den sanne verdien (av universet) og den maksimale variasjonen eller avviket til et tilfeldig utvalgsestimat fra denne sanne verdien er omtrent tre ganger standardfeilen.

Standardfeilen er således omtrent 1/6 av hele spekteret av tilfeldig utvalgsvariasjon. For alle praktiske formål blir standardfeilen imidlertid tatt som 1/4 av variasjonsområdet, da de ekstreme variasjonene oppstår svært sjelden.

Sannsynlighetstabeller viser at 95 ut av 100 utvalgsestimater kan forventes å falle innenfor grensen +2 og -2 standardfeil. Dette betyr at hvis vi har satt nivået på selvtillit eller sannsynlighet på 0, 95, vil vårt problem være å tegne et tilfeldig utvalg med en standardfeil som er omtrent halvparten av feilmarginen vår.

For et høyere sannsynlighetskriterium må vi tegne et utvalg med en standardfeil, som er en enda mindre del av feilmarginen.

Det skal bemerkes at standardfeilen blir mindre (høyere presisjon) ettersom prøvene blir større. For å doble presisjonen må prøvestørrelsen multipliseres med 4, dvs. økt fire ganger; å diskantere det, må prøve-størrelsen multipliseres med 9; å firedoble det, med 16 og så videre.

Dette betyr bare at presisjonen øker som kvadratroten av antall tilfeller i prøven. Statistikere har utarbeidet tabeller som viser sannsynligheten for at prospekt estimater kommer innenfor de ulike standardfeilgrensene.

Disse grensene er vanligvis oppgitt som + (pluss) og - (minus). Slike tabeller viser for eksempel at 95% av de tilfeldige utvalgsestimatene faller innenfor grensen på +1, 96 og -1, 96 standardfeil. Om lag 68% av estimatene faller innenfor grensene for + 1 og -1 standardfeil og 99% av estimatene. estimatene faller innenfor rekkevidde av +2.57 og -2.57 standardfeil, og så videre.

Ved full vurdering av (1) feilmarginen og (2) sannsynligheten eller konfidensnivået, kan forskeren fortsette med beregningen av en ønsket prøvestørrelse. Mildred Parten har gitt følgende formel for å beregne utvalgsstørrelsen, når statistikken som skal estimeres er prosentandelen. Dette er åpenbart en gjennomført variasjon av en standardfeilformel.

Størrelse på prøven = PC (100-PC) Z 2 / T 2

I den ovennevnte formelen betyr PC det foreløpige estimatet av prosentandelen (fra universet).

Z betyr antall standardfeilenheter som er funnet (fra den normale sannsynlighetstabellen) for å korrespondere med det nødvendige sannsynlighetsnivået.

T betyr feilmarginen som kan tolereres (5% eller 2%).

Parten har gitt følgende formel for å beregne prøvestørrelsen for å forutsi eller estimere gjennomsnittsverdien av universet i forhold til en spesifisert egenskap ved et visst nivå av tillit og rettet mot en gitt margin eller feil eller toleransegrense.

Eksempelstørrelse = (δ + Z / T) 2

Hvor 8 står for det foreløpige estimatet av standardavviket til universet.

Z står for antall standard feilenheter som tilsvarer den nødvendige sannsynligheten eller konfidensnivået.

La oss ta et konkret eksempel og utarbeide prøvestørrelsen. Anta at vi ønsker å anslå gjennomsnittlig årlig inntekt for familier som bor i en bestemt "middelklasse" lokalitet i en by.

La oss si at vi har satt vår feilmargin på Rs.100 / -, det vil si at vi vil tolerere prøveestimatet innen pluss eller minus 100 fra det sanne gjennomsnittet av befolkningen med hensyn til inntekt. Anta at vi har satt sannsynligheten eller konfidensnivået til 0, 95.

Anta også at fra en undersøkelse gjennomført noen år tilbake, anslår vi standardavviket med hensyn til årlig inntekt for befolkningen (lokalitet) til Rs.500 / -. Verdien av Z, dvs. standardfeilenhetene som tilsvarer sannsynligheten for 0, 95 er 1, 96.

Ved å erstatte disse verdiene i formelen gitt ovenfor, har vi

Størrelse på enkelt = (500 × 1, 96 / 100) 2

= (9, 8) 2

= 95

Dette betyr at en tilfeldig prøve på 95 tilfeller (familier, som er prøveenhetene) skal gi oss et estimat av gjennomsnittet av det gitte "universet" innenfor den angitte feilmarginen og på ønsket nivå av tillit eller sannsynlighet, av Rs. 100 / - og 0, 95.

Hvis vi strammer feilmarginen og stiller den på Rs. 50 / - Antallet tilfeller i prøven, dvs. den nødvendige størrelsen på prøven, vil være fire ganger så stor (dvs. 380) som størrelsen som kreves for den tidligere feilmarginen (Rs. 100 / -).

Hvis en annen lokalitet preges av større homogenitet med hensyn til inntekt og anta at standardavviket i inntektsbetingelser bare er 100, vil størrelsen på prøven for den ovennevnte feilmarginen bli mye lavere.

Med andre ord illustrerer bruken av formelen leksjonen, jo større homogeniteten reduserer prøven som kreves og større nøyaktigheten etterspørres, desto større er prøven størrelse.

Den gjentatte bruken av slike uttrykk som feilmarginen og konfidensnivået og andre numeriske uttrykk for sannsynligheter og utvalgsstørrelser, kan ha en tendens til å skape inntrykk av at en prøvestørrelse beregnet av en formel vil garantere ønsket presisjon.

Det skal imidlertid huskes at forholdene vist i de sannsynlige statistiske tabellene representerer normale forventninger i et ideelt tilfeldig utvalg. Men så mye som den faktiske prøvetaking er sjelden ideell, kan forholdene uttrykt i tabeller ikke forventes å holde.

Den generelle vanskeligheten og sjeldenheten av ideell sampling bør forståelig nok gjøre en skeptisk til resultater som er nøyaktig i henhold til forventningene.

Dette betyr imidlertid ikke at forskeren ikke skal bruke eller foretrekke den eksakte prøvestørrelsen beregnet på grunnlag av sannsynlighetsformelen. Faktisk er dette nettopp det han burde gjøre fordi det er hans beste innsats. Han bør imidlertid ikke insistere på denne nøyaktige størrelsen hvis praktiske hensyn gjør det uheldig.

En vesentlig annen tilnærming til problemet med å bestemme den ønskede prøvestørrelse er "stabilitetstesten." Dette består i å samle data for relativt små delprøver og holde en løpende oversikt over fordelingen av avkastningen.

Når etter et punkt, endres ikke flere delprøver resultatene vesentlig, kan forskeren antar at den totale prøven som er trukket så langt, har blitt tilstrekkelig, størrelsevis. Men denne prosedyren kan vel betraktes som sløsing med tid, fordi den faktisk utgjør en forsker som deltar i en rekke separate undersøkelser spredt over en betydelig tidsperiode.

Det har blitt hevdet at denne prosedyren er uøkonomisk ved at flere tidsplaner samles inn enn det egentlig trengs, siden den avsmalende avstanden til omtrentlig stabilitet ikke kan lokaliseres med noen viss sikkerhet før kurven har opprettholdt sitt nivå for en stund.

Men dette ser ikke ut til å være en seriøs begrensning sammenlignet med konservativ praksis av mange anerkjente studier som samler mer enn det nødvendige / minste antall elementer som et utvalg.

Hovedfordelen ved denne type stabilitetstest er at i stedet for å avhenge av beregninger basert på foreløpig informasjon, øker man bare den samlede prøvestørrelsesenheten som det er observert å være tilstrekkelig. Den empiriske kontrollen med å se tilbake og stoppe når de stabiliserer, virker enkelt og overbevisende.

Den største faren for denne prosedyren ligger i det faktum at de påfølgende oppsamlede delprøvene ikke sannsynligvis vil spre seg over universet. Resultatene kan stabilisere seg selv om de ikke representerer befolkningen.

Faktisk er jo mindre representativ delprøven, jo mer sannsynlig er tillegg av flere tilfeller for å gi det samme resultatet og kaste opp utseendet på stabilisering. Med mindre sub-prøven er et tverrsnitt av universet, vil det ikke være en overfølsom prøve som skal observere den nærliggende stabiliseringen.

Det grunnleggende kravet i denne prosedyren er at en voksende representativ prøve må være tilgjengelig for observasjon. Utgifter og vanskeligheter med å samle suksessive delprøver som er spredt over universet, er de viktigste årsakene til at dette ikke sannsynligvis vil være representativt.

Den empiriske stabilitetstesten kan imidlertid være svært effektiv, når delprøvene er riktig tegnet og samlet. Metoden er mest hensiktsmessig for intervjuundersøkelser som dekker relativt små områder eller fellesskap som en by eller en by, fordi det ikke er så vanskelig eller dyrt å gjøre hver delprøve til en tilfeldig prøve av befolkningen.

En mer raffinert form av empirisk kontroll sammenlignet med stabilitetstest er en relativt ny utvikling som kalles sekvensiell analyse. Den generelle prosedyren som er involvert her er å fortsette å legge til prøven og samtidig holde prøven for signifikans til betydning, inntil minimumsprøven er akkumulert som vil gi det nødvendige nivået av betydning.