Standard feil i gjennomsnittet

Etter å ha lest denne artikkelen vil du lære om standarden på gjennomsnittet.

Statistisk inferens hjelper oss også til å teste hypotesen om at "statistikken basert på prøven ikke er vesentlig forskjellig fra populasjonsparameteren, og at forskjellen hvis det er nevnt bare skyldes tilfeldige variasjoner" .

Standard Feil av gjennomsnittet (SE M eller σ M )

Standard Feil av Middelet (SE M ) er ganske viktig for å teste representativiteten eller påliteligheten eller betydningen av middelverdien.

Anta at vi har beregnet gjennomsnittlig poengsum på 200 gutter av 10. klasse i Delhi i Numerical Ability Test til å være 40. Således er 40 gjennomsnittet av bare en prøve trukket fra befolkningen (alle guttene som leser i klasse X i Delhi).

Vi kan også trekke forskjellige tilfeldige prøver på 200 gutter fra befolkningen. Anta at vi tilfeldigvis velger 100 forskjellige prøver, hver prøve bestående av 200 gutter fra samme befolkning og beregne gjennomsnittet av hver prøve.

Selv om 'n' er 200 i hvert tilfelle, er 200 gutter valgt tilfeldig for å utgjøre de forskjellige prøvene, ikke like, og så på grunn av svingninger i prøvetaking, vil vi få 100 gjennomsnittlige verdier fra disse 100 forskjellige prøvene.

Disse middelverdiene vil ha en tendens til å skille seg fra hverandre, og de vil danne en serie. Disse verdiene danner prøvefordelingsfordelingen av midler. Det kan uttrykkes matematisk at disse prøvemidlene distribueres normalt.

De 100 middelverdiene (i vårt eksempel) vil falle i en normal fordeling rundt M pop, M- popen er gjennomsnittet av prøvetaksfordelingen av midler. Standardavviket til disse 100 prøveinnretningene kalles SE M eller Standardfeil av middelet som vil være lik standardavviket for befolkningen dividert med kvadratroten av (prøveformat).

SE M viser spredningen av prøvemidlene rundt M pop . Dermed er SE M et mål for variabilitet av prøveinnretningene. Det er et mål for divergens av prøveinnretninger fra M pop . SE M er også skrevet som σ M.

Standardfeil av gjennomsnittet (SE M eller σ M ) beregnes ved å bruke formelen (for store prøver)

(A) Beregning av SE M i store prøver :

hvor σ = standardavvik av befolkningen og

n = antall tilfeller inkludert i prøven

(Som vi sjelden har SD av en befolkning, for σ bruker vi verdien av SD på prøveinnretningen).

Konfidensintervall:

De to konfidensintervallene, dvs. 95% og 99%, er generelt brukt. RA Fisher heter grensene for konfidensintervallet som inneholder parameteren som "fidusiære grenser" og kalt tilliten som er plassert i intervallet som fidusiær sannsynlighet.

(a) 95% av konfidensintervall:

Med henvisning til tabellen over området under normal kurve finner vi at 95% av tilfellene ligger mellom M ± 1, 96 SE M. At vi er 95% sikre eller korrekte å si at M pop ville ligge i intervallet M + 1, 96 SE M og M + 1, 96 SE M og vi er 5% feil for å si at M- pop vil ligge ut siden dette intervallet.

Med andre ord sannsynligheten for at M pop er i området M ± 1, 96 SE M er 95% (eller .95) og sannsynligheten for at M pop ligger utenfor rekkevidde er 5% (eller .05). Verdien, 1, 96 er den kritiske verdien ved .05 nivå av betydning.

(b) 99% av konfidensintervall:

Med henvisning til tabellen over området under normal kurve finner vi at 99% av tilfellene ligger mellom M ± 2, 58 SE M. At vi er 99% sikre eller korrekt å si at M pop ville ligge i intervallet M - 2.58 SE M og M + 2.58 SE M og vi er 1% feil for å si at M pop vil ligge utenfor dette intervallet.

Med andre ord sannsynligheten for at M pop er i området M ± 2, 58 SE M er 99% (eller .99), og sannsynligheten for at M pop ligger utenfor rekkevidde er 1% (eller .01). Verdien, 2, 58, er kritisk verdi ved .01-nivå av betydning.

Her finner vi at nivået av betydning er omvendt knyttet til omfanget av presisjon. I 05 nivå av betydning ville vi være nøyaktige i 95% av tilfellene og i .01-nivå av betydning ville vi være nøyaktige i 99% av lettere.

Tabellen som er angitt nedenfor, vil foregå ytterligere:

Eksempel 1:

Gjennomsnittet og SD på 225 gutter av klasse XII i Delhi i en test av Numerical Ability var henholdsvis 48 og 6. Hvor godt betyr dette representerer M- popen eller anslår M pop . (n = 225, σ = 6, middel = 48]

Ved å referere til tabellen over normalfordeling (Tabell A) finner vi at alle de fleste (99, 7) tilfeller ligger i ± 3σ. I tilfelle av vårt eksempel vil alle prøveinnretninger ligge mellom M pop + 3σ m og M pop - 3σ M. Så, vil noen prøvemiddel være best 3σ m mindre enn M pop på 3σ M mer enn M pop .

Dermed hvis vi vet verdien av σ M, kan vi utlede om M- popen fra vår sample mean. Her er 4 standardavviket for fordelingen av prøveinnretninger som vår gjennomsnitt er en. Alle prøveinnretningene som er normalt fordelt rundt M pop vil ligge mellom M pop + 3 SE M og M pop - 3 SE M.

3 SE M = 3 x .4 = 1, 2

Selv om vi ikke vet nøyaktig verdien av M pop, kan vi i det minste si med tillit at M pop ligger i mellom

(48 -1, 2) og (48 + 1, 2) eller 46, 8 → 49, 2

Fra Tabell A finner vi at 95% av lettere ligger mellom ± 1, 96 σ. I tilfelle av vårt eksempel, er 95% konfidensintervall for M popspekter fra M - 1, 96 SE M til M + 1, 96 SE M.

Nå, 1, 96 SE M = 1, 96 x .4 = .78

. . . M-1, 96 SE M = 48 - .78 = 47, 22 og M + 1, 96 SE M = 48 + .78 = 48, 78

. . . 95% konfidensintervall varierer fra 47, 22 til 48, 78. 99% konfidensintervallet for M pop varierer fra M - 2.58 SE M til M + 2.58 SE M.

Nå er 2, 58 SE M = 2, 58 X .4 = 1, 03

. . . M - 2, 58 SE M = 48 -1, 03 = 46, 97 og M + 2, 58 SE M = 48 + 1, 03 = 49, 03

. . . 99% konfidensintervall for M popspekter fra 46, 97 til 49, 03.

Eksempel 2:

Gjennomsnittet og SD på 400 studenter i en test ble funnet å være 42 og 8. Kan du anslå gjennomsnittlig poengsum for befolkningen med både 99% og 95% konfidensintervall?

Løsning:

(i) 95% konfidensintervall for M popområder fra M - 1, 96 SE M til M + 1, 96 SE M.

Nå 1, 96 SE M = 1, 96 x .4 = .784

. . . M-1, 96 SE M = 42 -784 = 41, 22

og M + 1, 96 SE M = 42 + .784 = 42, 78 (opptil to desimaler).

Således ligger 95% konfidensintervall fra 41, 22 til 42, 78. Vi er 95% nøyaktige at M pop ligger mellom 41, 22 til 42, 78.

(ii) 99% konfidensintervall for M popområder fra M - 2, 58 SE M til M + 2, 58 SE M

Nå er 2, 58 SE M = 2, 58 x 4 = 1, 03

. . . M - 2, 58 SE M = 42-1, 03 = 40, 97

og M + 2, 58 SE M = 42 + 1, 03 = 43, 03

Dermed varierer 99% konfidensintervall fra 40, 97 til 43, 03. Vi er 99% sikre på at M pop ligger mellom 40, 97 og 43, 03.

Eksempel 3:

Midlene og SD for en prøve på 169 gutter i en test av Numerical Ability er henholdsvis 50 og 6:

(i) Bestem 95% intervallet for populasjonsmiddelet og tolk det.

(ii) Bestem den akseptable samplingsfeilen ved .05 og .01 nivå av betydning.

(iii) Bestem 99% konfidensintervall for M pop .

Løsning:

M = 50

(i) 95% konfidensintervall for Mp 0p varierer fra M - 1, 96 SE M til M + 1, 96 SE M.

Nå 1, 96 SE m = 1, 96 x .46 = .90

Dermed er M-1, 96 SE M = 50 -90 = 49, 10

og M + 1, 96 SE M = 50 +90 = 50, 90

. . . 95% konfidensintervall for M popspekter fra 49, 10 til 50, 90. Fra prøveinnretningen på 50 anslår vi M- popen til å være noen fast verdi mellom 49, 10 og 50, 90 og med å si at vi er 95% sikre.

Med andre ord, vil vår sample gjennomsnitt på 50 ikke gå glipp av M- popen med mer enn .90, og dette vil være tilfelle for 95 tilfeller i 100. Alternativt vil bare i 5 tilfeller på 100 vår sample gjennomsnitt på 50 gå glipp av M- popen ved mer enn .90.

(ii) Kritisk verdi ved .05 nivå av betydning = 1, 96

Kritisk verdi ved .01 nivå av betydning = 2, 58

"Samplingsfeil = Kritisk verdi x SE M "

Dermed er prøvefeil ved .05-nivå av betydning 1, 96 SE M og at ved .01-nivå av betydning er 2, 58 SE M

Godtagbar prøvetakingsfeil ved .05 nivå = 1, 96 SE M = 1, 96 x .46 = .90

Tillatte prøvetakingsfeil ved .01 nivå = 2, 58 SE M = 2, 58 X .46 = 1, 19

(iii) 99% konfidensintervallet varierer fra M - 2, 58 SE M til M + 2, 58 SE M

Nå er 2, 58 SE M = 2, 58 X .46 = 1, 19

Dermed er M-2, 58 SE M = 50-1, 19 = 48, 81

og M + 2, 58 SE M = 50 + 1, 19 = 51, 19

99% konfidensintervall varierer fra 48, 81 til 51, 19.

Eksempel 4:

For en gitt gruppe på 500 soldater er gjennomsnittlig AGCT-poengsum 95, 00 og SD er 25.

(ii) Bestem .99 konfidensintervall for ekte gjennomsnitt.

(ii) Det er usannsynlig at det sanne midlet er større enn hvilken verdi?

Løsning:

(i) 99% konfidensintervallet varierer fra M - 2, 58 SE M til M + 2, 58 SE M.

Nå er 2, 58 SE M = 2, 58 x 1, 12 = 2, 89

Dermed er M-2, 58 SE M = 95, 0-2, 89 = 92, 11

og M + 2, 58 SE M = 95, 0 + 2, 89 = 97, 89

. . . 99% konfidensintervall varierer fra 92, 11 til 97, 89.

Fra vårt prøvemiddel på 95, 0 estimerer vi det sanne gjennomsnittet for å være en viss fast verdi mellom 92, 11 og 97, 89, og i så fall er vi 99% sikre.

(ii) Vår sample gjennomsnitt på 95, 0 vil ikke gå glipp av det sanne gjennomsnittet med mer enn 2, 89 dvs. den sanne er ikke større enn 97, 89.

(B) Beregning av SE M i liten prøve:

Det er vanlig å kalle noen prøve større enn 30 som stor prøve. Når N er stor, er det ikke verdt å gjøre korreksjonen. Men når N er "liten" (mindre enn 30), er det tilrådelig å bruke (N - 1), og det er viktig når N er ganske liten - si mindre enn 10.

Studentene må huske (i) at teoretisk (N - 1) alltid skal brukes når SD skal være et estimat av befolkningen a; og at (ii) skillet mellom "stor utvalgsstatistikk" og "liten utvalgsstatistikk" i form av et skjæringspunkt på N = 30 er vilkårlig og delvis er et spørsmål om bekvemmelighet.

Når N er mindre enn ca. 30, bør formelen for σ M eller SE M lese:

Eksempel 5:

Etter fem studenter har sikret score i en test:

Bestem grensene for 95% konfidensgrense for populasjonsmiddelet.

Resultatene er - 11, 13, 9, 12, 15:

Løsning:

M = 12

Her df = n-1 = 5-1 = 4

Ved å referere til tabell D, med df = 4, er t- verdien ved .05-nivået av betydning (dvs. 95% konfidensnivå) 2, 78.

95% konfidensintervall definerer M ± 2, 78 SE M

2, 78 SE M = 2, 78 x 1, 0 = 2, 78

M - 2, 78 SE M = 12 - 2, 78 x1, 0 = 9, 22 og

M + 2, 78 SE M = 12 + 2, 78 x 1, 0 = 14, 78

. . . Grensen for 95% konfidensintervall er 9, 22 og 14, 78.

Dette betyr at P = .95 at M pop ligger i intervallet 9.22 til 14.78.

Eksempel 6:

Ti tiltak av reaksjonstid til lys tas fra en praktisert observatør. Gjennomsnittet er 175, 50 ms (millisekunder) og S er 582 ms. Bestem .95-konfidensintervallet for M- popen ; .99-konfidensintervallet.

Løsning:

n = 10, S = 5, 82 ms, M = 175, 50 ms

Df (grader av frihet) tilgjengelig for å bestemme t er (n - 1) eller (10 - 1) = 9

(i) Fastsettelse av 95% (eller 95) konfidensintervall:

Ved å skrive inn tabell D med 9 df, leser vi at t = 2.26 ved .05 punktet.

95% konfidensintervall for M popområder fra M - 2.26 SE M til M + 2.26 SE M.

Nå 2, 26 SE M = 2, 26 x 1, 84 = 4, 16

Dermed er M - 2, 26 SE M = 175, 50 -4, 16 = 171, 34

og M + 2, 26 SE M = 175, 50 + 4, 16 = 179, 66

. . . 95% konfidensintervall for M popspekter fra 171, 34 til 179, 66. P er .95 at M- popen er minst 171, 34 eller høyere enn 179, 66. Hvis vi fastslår at M pop ligger innenfor dette intervallet, skal vi over 95% av tiden og feil 5% over en lang rekke eksperimenter.

(ii) Bestemme 99% (eller .99) konfidensintervall:

Inntasting Tabell D med 9 df leser vi at t = 3, 25 ved .01 punkt. 99% konfidensintervall for M pop- områder fra M - 3.25 SE M til M + 3.25 SE M.

Nå 3, 25 SE M = 3, 25 x 1, 84 = 5, 98

Dermed er M - 3, 25 SE M = 175, 50 - 5, 98 = 169, 52

og M + 3, 25 SE M = 175, 50 + 5, 98 = 181, 48

. . . 99% konfidensintervall for M pop- områder fra 169, 52 til 181, 48.

P er .99 at M- popen er minst 169, 52 eller høyere enn 181, 48. Hvis vi fastslår at M pop ligger innenfor dette intervallet, bør vi over en lang rekke eksperimenter være riktig -99% av tiden og feil 1%.

Avledninger angående annen statistikk:

Siden all statistikk har samplingsfordelinger og standardfeil kan betydningen av median, kvartilavvik, standardavvik, prosenter og annen statistikk tolkes som gjennomsnittet, og vi kan estimere parameteren.

(i) Standardfeil for medianen (eller SE Mdn -):

Når det gjelder SD og Q, kan SE av medianen for store prøver beregnes ved hjelp av følgende formler:

hvor σ = SD av prøven, n = størrelse på prøven og Q = kvartilavvik av prøven.

Et eksempel vil illustrere bruk og tolkning av formlene:

Eksempel 7:

På Trabue Language Scale A gjorde 801 elleve år gamle gutter følgende post:

Median = 21, 40 og Q = 4, 90. Hvor godt representerer denne medianen medianen av befolkningen fra hvilken denne prøven er tegnet?

Løsning:

n = 801, Mdn = 21, 40, Q = 4, 90.

Ved å bruke den andre formelen,

Siden N er stor, kan prøvetakingsfordelingen bli tatt til å være normal og konfidensintervallet funnet fra den siste linjen i tabell D. 99-konfidensintervallet for Mdn- popen er 21, 40 ± 2, 58 x .32 eller 21, 40 ± .83.

Vi kan være sikre på at medianen av befolkningen ikke er mindre enn 20, 57 eller mer enn 22, 23. Dette smale området viser en høy grad av pålitelighet i utvalgsmediet.

(ii) Standardfeil for standardavvik (SE σ ):

Standardfeilen for standardavviket, som SE M, er funnet ved å beregne den sannsynlige divergensen av prøven SD fra dens parameter (populasjon SD). Formelen for SE σ er

Eksempel 8:

n = 400, a = 6

Hvor godt representerer dette SD SD for befolkningen som prøven trekkes fra?

Løsning:

Når prøver er store og trukket tilfeldig fra deres befolkning, kan over formel brukes og tolkes på samme måte som SE M.

Siden N er stor, kan .99-konfidensintervallet for SD pop sikkert tas ved grensene ± 2, 58 σ σ . Ved å erstatte σ σ har vi 6 ± 2, 58 x .21 dvs. grensene mellom (6 - .54) og (6 + .54) eller 5, 46 og 6, 54.

Hvis vi antar at SD- popen ligger mellom grensene 5, 46 og 6, 54, bør vi ha rett 99% av tiden og feil 1%.

(iii) Standardfeil for kvartilavviket (eller SE Q eller a q ):

SE Q kan finnes fra formlene:

Eksempel 9:

n = 801, Q = 4, 90

Hvor godt representerer Q denne befolkningen Quartile Avvik?

Løsning:

Ved å bruke formelen

.99-konfidensintervallet for Q- popen er fra 4, 90 ± 2, 58 x .203 dvs. fra 4, 38 til 5, 42. Dette området viser at prøven Q er en høyt pålitelig statistikk.

(iv) Standard feil av prosentandel (eller SE% eller σ%):

Gi den prosentvise forekomsten av en oppførsel, spørsmålet oppstår ofte av hvor mye selvtillit vi kan plassere i figuren. Hvor pålitelig en indeks er vår prosentandel av forekomsten av atferden vi er interessert i? For å svare på dette spørsmålet,

Vi må beregne SE av en prosentandel med formelen:

i hvilken

p = prosentvis forekomst av oppførelsen, q = (1 - p)

n = antall tilfeller.

Eksempel 10:

I en undersøkelse av utroskap blant barn med grunnskole ble 100 eller 25% av de 400 barna fra boliger med høy sosioøkonomisk status funnet å ha utro på ulike tester. Hvor godt representerer det befolkningstallet?

Løsning:

p = 25% (prosentvis forekomst)

q = 75% (100% - 25%)

99% konfidensintervall for populasjonsprosent varierer fra

25% ± 2, 58 x 2, 17%.

25% - 2, 58 x 2, 17% = 25% - 5, 60% = 19, 4%

og 25% + 2, 58 x 2, 17% = 25% + 5, 60 = 30, 60%

Vi kan anta 99% selvsikkerhet om at grunnskolebarn med høy sosioøkonomisk status vil jukse med minst 19, 4% og vil ikke være større enn 30, 60%.

(v) Standardfeil for korrelasjonskoeffisienten (SE r eller σ r ):

Den klassiske formelen for SE av a-er

(SE av korrelasjonskoeffisient r når N er stor)

Eksempel 11:

n = 120, r = .60.

Hva er grensene for 99% konfidensintervall for befolkning r

Løsning:

99% konfidensintervall

= r ± 2, 58 SE r = .60 ± 2, 58 SE r

= .60 ± .15 eller .45 til .75

Viktige statistiske vilkår:

(i) Nivåer:

0, 05:

Sannsynlighet for å gå galt i 5 prøver ut av 100 prøver.

0, 01:

Sannsynlighet for å gå galt i 1 prøve ut av 100 prøver.

(ii) Tillit:

I .05 nivå av betydning har eksperimentet 95% tillit til at dataene skal representere befolkningen.

I .01 nivå av betydning har eksperimentet 99% tillit til at statistikkprøven må representere befolkningen.

(iii) Nivåer av betydning:

Før vi tester hypotesen, må vi bestemme hvilke kriterier vi vil akseptere eller forkaste nullhypotesen. Vi må sette opp nivået av betydning før testen. To nivåer av betydning er generelt bruk, nemlig .05 nivå og .01 nivå.

(a) .05 nivå av betydning:

Vi leser fra tabell A at 95% av tilfellene i en normal fordeling faller innenfor grensene ± 1, 96 SE M. Hvis vi tar grensene angitt av M ± 1, 96 SE M, definerer vi et intervall for hvilket konfidensnivået er .95. Basert på dommen vår som størrelsen på M pop på disse grensene, står vi for å være rett 95% av tiden og feil 5%.

Området mellom - 1, 96 SE M og + 1, 96 SE M er kjent som akseptasjonsområdet for H o og området utenfor - 1, 96 SE M og + 1, 96 SE M er kjent som avstandsområdet. Hvis noen eksempler betyr løgner innenfor akseptabelt område, aksepterer vi H o . Ved å avvise H o innrømmer vi at prøven betyr at det kan falle utenfor ± 1, 96 SE M.

Således ved å avvise H o gjør vi 5% feil, fordi i 5% av 100 lettelser kan en slik prøve forekomme. Vi er villige til å ta så mye som 5% risiko ved å avvise H o når det skjer å være sant. Kriteriene for å avvise H o er således sporet nivået av betydning.

(b) .01 nivå av betydning:

Vi leser fra tabell A at 99% av lettelsen i en normal fordeling faller innenfor grensene ± 2, 58 SE M. Hvis vi la grensene angitt av M ± 2, 58 SE M, definerer vi et intervall for hvilket konfidensnivået er .99. Basere vår vurdering av størrelsen på M pop på disse grensene, står vi for å være rett 99% av tiden og feil 1%.

Området mellom - 2, 58 SE M og + 2, 58 SE M ville være området for aksept av H 0 og området utenfor det ville være området for avvisning av H o . Vi er villige til å ta så mye som 1% risiko ved å avvise H o når det skjer å være sant.

.01 nivå av betydning er mer krevende enn .05 nivå fordi i .01 nivå feilen i å avvise H o er 1% mens i .05 nivå en slik feil er 5%.

(iv) t-Fordeling:

Når N er mindre enn ca. 30, dvs. når prøven er liten, kalles prøvetaksfordelingen " t- distribusjon".

T-fordelingen avviger ikke sterkt fra det normale, med mindre N er ganske liten. Når N øker i størrelse, nærmer t- formen mer og mer nær den normale form.

Egenskaper for t-distribusjon:

1. Det ser ut som en klokkeformet kurve. Men fordelingen er mer variabel med null skewness og 'Ku' større enn 3.

2. Det er symmetrisk om linjen t = 0.

3. Det er unimodalt med maksimal ordinat ved t = 0.

4. Når N er liten, ligger t- fordelingen under normalkurven, men kurvens haler eller ender er høyere enn de tilsvarende delene av normalkurven.

5. Enhetene langs grunnlinjen til t- distribusjonen er faktisk σ score, dvs.

(v) Frihetsgrader (df):

Begrepet grader av frihet er svært viktig i liten utvalgsstatistikk. Det er også viktig i analysen av varians og i andre prosedyrer. Frihetsgrader betyr frihet til å variere.

La oss velge fem poeng, hvorav middelene skal være 15. Nå antar de fire poengene er 18, 10, 20, 15. For gjennomsnittet å være lik 15, må femte poenget være 12. Vi har selvsagt frihet til å velge noen fire poeng.

Men vi har ingen frihet til å velge den femte poengsummen fordi den femte poengsummen gjør justeringer i variasjonen som følger med de første fire poengene og med en antagelse at gjennomsnittet vil være 15. Her legges N = 5 og en restriksjon, dvs. mener må være 15. Derfor er frihetsgraden N - 1 eller 4.

Hvis vi har 5 score 5, 6, 7, 8 og 9, er gjennomsnittet 7; og avvikene fra våre score fra 7 er - 2, - 1, 0, 1 og 2. Summen av disse avvikene er null. Av de 5 avvikene kan bare 4 (N - 1) velges "fritt" som betingelsen om at summen like null begrenser verdien av den femte avvik umiddelbart.

SD er selvfølgelig basert på kvadrater av avvikene som er tatt rundt gjennomsnittet. Det er N df for å beregne gjennomsnittet, men bare (N - 1) tilgjengelig for 'S' (SD) da en df går tapt i beregning av gjennomsnittet.

I et annet eksempel, hvor N = 10, ble df tilgjengelig for estimering av M- popen gitt som 9 eller (N - 1), dvs. en mindre enn antall observasjoner, nemlig 10. En df går tapt i beregning av M og følgelig bare 9 er igjen for å estimere M- popen ved hjelp av 'S' og t-distribusjonen.

Når en statistikk er brukt til å estimere en parameter, er regelen at df tilgjengelig er N, men antall parametere som allerede er estimert fra prøven. M er et estimat av M pop og ved beregning av det mister vi 1 df .

Ved estimering av pålitelighet av en r, for eksempel (som avhenger av avvikene fra to måter), er df (N - 2). I tilfelle av chi-kvadratprøver og variansanalyse, følges separate prosedyrer ved bestemmelse av df .

(vi) null hypotesen:

Null hypotesen er et nyttig verktøy for å teste betydningen av forskjeller. Denne hypotesen hevder at det ikke er noen ekte forskjell mellom to populasjonsmidler, og at forskjellen som finnes mellom prøveinnretninger, er derfor uheldig og ubetydelig.

Nulhypotesen er knyttet til det juridiske prinsippet om at "en mann er uskyldig til han er blitt skyldig." Det utgjør en utfordring, og funksjonen av et eksperiment er å gi fakta en mulighet til å motbevise (eller ikke motbevise) denne utfordringen.

For å illustrere, anta at det er hevdet at "instruksjonsstandarder for enkeltskiftskoler er bedre enn dobbeltskiftskolene". Denne hypotesen er svakt oppgitt og kan ikke testes nøyaktig.

Hvis vi hevder at "single shift skoler ikke gir bedre instruksjonsstandarder enn doble skift skole" (den sanne forskjellen er null). Denne nullhypotesen er nøyaktig og kan testes. Hvis null null hypotesen er ubeskattet, må den avvises. Ikke-forskjellen erklæring antar at de to gruppene vil bli testet og funnet å være like.

Null form er foretrukket av de fleste erfarne forskningspersonell. Denne formuleringsformen definerer lettere den matematiske modellen som skal benyttes i den statistiske hypotesen.

En null hypotese blir aldri bevist eller disproved. Det kan bli akseptert eller avvist med viss grad av selvtillit (eller på et visst nivå).

Før du tester en hypotese må vi ta hensyn til følgende:

1. Hvorvidt prøven er stor eller liten.

2. Hva er nivået av betydning.

3. Om testen er en to-tailed test eller en-tailed test.

(vii) Feil ved å lage avledninger:

Mens du aksepterer eller avviser nullhypotesen, er det mulighet for å begå to typer feil og lyst regnes med av forskerarbeidet.

Hva heter Type I og Type II feil kan forklares nedenfor:

Type I-feil:

Slike feil er Committed når vi avviser en nullhypotes ved å markere en forskjell betydelig, selv om det ikke er noen ekte forskjell. Anta at forskjellen mellom to populasjonsmidler (M pop -M pop = 0) faktisk er null. (For eksempel kan gutter og jenter betraktes som den samme befolkningen i forhold til de fleste mentale tester). Hvis test av betydning av to prøveinnretninger reflekterer et faktum at forskjellen i populasjonsmidler er signifikant, begår vi Type I-feil.

Type II feil:

En slik type feil er begått når vi aksepterer en nullhypotes ved å markere en forskjell som ikke er signifikant, selv om det er en sann forskjell. Anta at det er en sann forskjell mellom de to befolkningsmidlene.

Hvis vår test av betydning som er brukt på de to prøveinnretningene, fører oss til å tro at forskjellen i populasjonsmidler ikke er signifikant, begår vi en Type II-feil.

Forskjellige forholdsregler kan tas for å unngå begge typer feil. Hvis vi setter opp et lavt nivå av betydning (P er større enn .05), øker vi sannsynligheten for Type I-feil; mens hvis vi oppretter et høyt nivå av betydning (P er mindre enn .05), vil Type I-feilene være mindre. Muligheten for å tegne feilaktige avledninger av type II-typen er forbedret når vi setter et meget høyt nivå av betydning.

(viii) To-tailed og One-tailed tester av betydning:

I nullhypotesen kan forskjeller mellom oppnådde midler (dvs. M 1 - M 2 ) være enten pluss eller minus. Ved å bestemme sannsynligheten tar vi begge haler av prøvetakingsfordelingen.

(ix) kritisk forhold (CR):

Kritisk forhold (CR) er funnet ved å dividere forskjellen mellom prøveinnretningene ved sin standardfeil (CR = D / SE D ). Når N er av prøvene er store (30 eller mer er "stor"), er distribusjonen av CRs kjent for å være normal rundt den sanne forskjellen mellom populasjonsmidler, t er et kritisk forhold hvor et mer nøyaktig estimat av σ D benyttes. Prøvetaksfordelingen av t er ikke normal når N er liten (mindre enn 30, si), t er en CR; men alle CR er ikke t.

To-tailed test:

1. I to-tailed test tar vi hensyn til begge haler av den normale kurven.

2. I tilfelle ikke-tailed alternative hypoteser foretar vi en to-tailed test.

3. Eksempel:

En interessetest administreres til bestemte gutter i en yrkesrettet. Treningsklasse og til enkelte gutter i latinsklasse. Er den betydelige forskjellen mellom de to gruppene signifikant på .05-nivået?

4. Prøveverdien avviker fra M- pop i enten retning + eller -.

5. H 0 : M 1 - M 2 = 0

H A : M 1 = M 2

6. Verdi å være betydelig:

1, 96 ved .05 nivå

2, 58 på .01 nivå

7. Avkastningsområdet er delt i begge endene (haler) av normal kurve (dvs. 05 til .025 og .025, 01 til .005 og .005).

En-tailed test:

1. Vi må ta en høy, dvs. på venstre eller høyre side av normal kurve.

2. I tilfelle av retningsmessig alternativ hypotese gjør vi en-tailed test viz., M 1 > M 2 . I så fall er retningen veldig klar, ensidig.

3.Example:

Ti emner blir gitt 5 påfølgende stier på en siffer-symboltest, hvorav bare resultatene for stier 1 og 5 er vist. Er gjennomsnittlig gevinst fra første til siste prøve betydelig?

4. Prøveverdien avviker fra populasjonsmiddelet i en retning.

5. H 0 : M 1 = M 2

H A : M 1 > M 2 eller M 1 <m 2

6. Verdi å være betydelig:

1, 62 på .05 nivå

2, 33 på .01 nivå

7. Det er ett avkastningsområde ved høyre hale av fordelingen eller venstre hale av fordelingen.