Chi-Square Test: Betydning, applikasjoner og bruksområder

Etter å ha lest denne artikkelen vil du lære om: - 1. Betydning av Chi-Square-test 2. Nivåer av betydning for Chi-Square-test 3. Chi-Square-test under null-hypotesen 4. Vilkår for gyldigheten 5. Tilleggsegenskaper 6. Programmer 7. Bruk.

Betydning av Chi-Square-test:

Chi-torget (χ 2 ) -prøven representerer en nyttig metode for å sammenligne eksperimentelt oppnådde resultater med de som forventes teoretisk på en viss hypotese.

Derfor er Chi-square et mål for faktisk divergens av de observerte og forventede frekvensene. Det er veldig tydelig at betydningen av et slikt tiltak ville være veldig flott i prøvetakingsstudier der vi alltid må studere divergensen mellom teori og faktum.

Chi-square som vi har sett er et mål for divergens mellom forventede og observerte frekvenser, og som sådan hvis det ikke er forskjell mellom forventede og observerte frekvenser, er verdien av Chi-square 0.

Hvis det er forskjell mellom de observerte og forventede frekvensene, vil verdien av Chi-kvadrat være over 0. Det vil si jo større Chi-firkanten er jo større sannsynligheten for en reell divergens av eksperimentelt observert fra forventede resultater.

Hvis den beregnede verdien av chi-kvadrat er svært liten i forhold til tabellverdien, indikerer det at divergensen mellom faktiske og forventede frekvenser er svært lite og følgelig passer passformen bra. Hvis den beregnede verdien av chi-kvadrat derimot er veldig stor sammenlignet med tabellverdien, indikerer det at divergensen mellom forventede og observerte frekvenser er meget stor og følgelig er passformen dårlig.

For å evaluere Chi-kvadratet, legger vi inn tabell E med den beregnede verdien av kvadratet og det riktige antallet frihetsgrader. Antallet df = (r - 1) (c - 1) hvor r er antall rader og c antall kolonner der dataene er tabulert.

Dermed er i 2 x 2 tabellgrader av frihet (2 - 1) (2 - 1) eller 1. På samme måte i 3 x 3 bord er frihetsgrader (3 - 1) (3 - 1) eller 4 og i 3 x 4 bord Grader av frihet er (3 - 1) (4 - 1) eller 6.

Nivåer av betydning for ki-firkantetest:

De beregnede verdiene til x2 (Chi-kvadrat) sammenlignes med tabellverdiene, for å avgjøre hvorvidt differansen mellom forventede og observerte frekvenser skyldes samplingsfluktuasjonene og som sådan signifikant eller om differansen skyldes en annen grunn og som så signifikant. Divergensen mellom teori og fakta blir alltid testet når det gjelder visse sannsynligheter.

Sannsynlighetene indikerer omfanget av tillit som vi kan plassere på den konklusjonen som er trukket. Tabellverdiene til χ 2 er tilgjengelige på ulike sannsynlighetsnivåer. Disse nivåene kalles nivåer av betydning. Vanligvis er verdien av χ 2 på .05 og .01 nivå av betydning for de givne grader av frihet sett fra tabellene.

Hvis den beregnede verdien av x2 er større enn tabellverdien, sies den å være signifikant. Med andre ord kan uoverensstemmelsen mellom de observerte og forventede frekvensene ikke tilskrives sjansen, og vi avviser nullhypotesen.

Dermed konkluderer vi at eksperimentet ikke støtter teorien. På den annen side, hvis beregnet verdi av x2 er mindre enn den tilsvarende tabulerte verdien, sies det at den ikke er signifikant ved det nødvendige nivå av betydning.

Dette innebærer at avviket mellom observerte verdier (eksperiment) og forventede verdier (teori) kan tilskrives sjanse, dvs. svingninger i prøvetaking.

Chi-Square test under null hypotesen:

Anta at vi får et sett med observerte frekvenser oppnådd under noen eksperimenter, og vi vil teste om de eksperimentelle resultatene støtter en bestemt hypotese eller teori. Karl Pearson i 1990 utviklet en test for å teste betydningen av uoverensstemmelsen mellom eksperimentelle verdier og de teoretiske verdiene som ble oppnådd under en teori eller hypotese.

Denne testen er kjent som χ 2- test og brukes til å teste om avviket mellom observasjon (eksperiment) og teori kan tilskrives sjanse (fluktuasjoner i prøvetaking) eller hvis det egentlig skyldes at teksten ikke er tilstrekkelig til å passe den observerte data.

Under Null-hypotesen står det at det ikke er noen signifikant forskjell mellom de observerte (eksperimentelle) og de teoretiske eller hypotetiske verdiene, det vil si at det er god kompatibilitet mellom teori og eksperiment.

Ligningen for chi-kvadrat (χ 2 ) er angitt som følger:

hvor f o = frekvens av forekomst av observerte eller eksperimentelt bestemte fakta

f e = forventet forekomstfrekvens på en viss hypotese.

Chi-kvadrat er således summen av verdiene som oppnås ved å dividere kvadratet av forskjellen mellom observerte og forventede frekvenser med de forventede frekvensene i hvert tilfelle. Med andre ord er forskjellene mellom observerte og forventede frekvenser firkantet og divisjonert med det forventede tallet i hvert tilfelle, og summen av disse kvotientene er χ 2 .

Flere illustrasjoner av chi-square testen vil klargjøre diskusjonen gitt ovenfor. Forskjellene mellom f o og f e er alltid skrevet + ve.

1. Test av divergensen av observerte resultater fra de som forventes på hypotesen om like sannsynlighet (null hypotese):

Eksempel 1:

Ninety-six subjects blir bedt om å uttrykke sin holdning til forslaget "Skal AIDS-utdanning integreres i læreplanen på høyere videregående trinn" ved å markere F (gunstig), jeg (likegyldig) eller U (ugunstig).

Det ble observert at 48 merket 'F', 24 'I' og 24 'U':

(i) Test om de observerte resultatene avviger vesentlig fra resultatene som kan forventes dersom det ikke er noen preferanser i gruppen.

(ii) Test hypotesen om at "det er ingen forskjell mellom preferanser i gruppen".

(iii) Tolk funnene.

Løsning:

Følgende trinn kan følges for beregning av x 2 og trekke konklusjonene:

Trinn 1:

Beregn de forventede frekvensene (f e ) som svarer til de observerte frekvensene i hvert tilfelle under noen teori eller hypoteser.

I vårt eksempel er teorien av like sannsynlighet (null hypotese). I den andre raden er fordelingen av svar som skal forventes på nullhypotesen valgt like.

Steg 2:

Beregn avvikene (f o - f e ) for hver frekvens. Hver av disse forskjellene er kvadret og delt med dens f e (256/32, 64/32 og 64/32).

Trinn 3:

Legg til disse verdiene for å beregne:

Trinn 4:

Graden av frihet i tabellen beregnes ut fra formelen df = (r - 1) (c - 1) for å være (3 - 1) (2 - 1) eller 2.

Trinn 5:

Se opp de beregnede (kritiske) verdiene på χ 2 for 2 df på et visst nivå, vanligvis 5% eller 1%.

Med df = 2, er χ 2 verdien for å være signifikant på .01 nivå 9.21 (Tabell E). Den oppnådde χ 2 verdien av 12> 9.21.

Jeg. Derfor er den markerte divergensen signifikant.

ii. Null hypotesen avvises.

iii. Vi konkluderer med at vår gruppe virkelig favoriserer forslaget.

Vi avviser "like svar" -hypotesen og konkluderer med at vår gruppe favoriserer proposisjonen.

Eksempel 2:

Antall bilulykker per uke i et bestemt samfunn var som følger:

12, 8, 20, 2, 14, 10, 15, 6, 9, 4

Er disse frekvensene i samsvar med troen på at ulykkesforholdene var de samme i denne 10-ukers perioden?

Løsning:

Null-hypotesen - Sett opp nullhypotesen om at de oppgitte frekvensene (antall ulykker per uke i et bestemt samfunn) er i samsvar med troen på at ulykkesforholdene var de samme i løpet av 10-ukers perioden.

Siden totalt antall ulykker over 10 uker er:

12 + 8 + 20 + 2 + 14 + 10 + 15 + 6 + 9 + 4 = 100.

Under nullhypotesen bør disse ulykkene fordeles jevnt fordelt over 10 ukers periode, og dermed forventes antall ulykker for hver av de 10 ukene 100/10 = 10.

Siden beregnet verdi av χ 2 = 26, 6 er større enn tabellverdien, 21.666. Det er signifikant og nullhypotesen avvist på .01-nivå av betydning. Derfor konkluderer vi at ulykkesforholdene er absolutt ikke ensartede (samme) i løpet av 10-ukers perioden.

2. Testing av divergensen av observerte resultater fra de som forventes på hypotesen om en normal fordeling:

Hypotesen, i stedet for å være like sannsynlig, kan følge normalfordelingen. Et eksempel illustrerer hvordan denne hypotesen kan bli testet av chi-square.

Eksempel 3:

To hundre selgere har blitt klassifisert i tre grupper, veldig gode, tilfredsstillende og fattige - etter konsensus fra salgsforvaltere.

Betyr denne fordeling av rating vesentlig fra det som kan forventes dersom salgsmuligheter normalt distribueres i vår befolkning av selgere?

Vi setter opp hypotesen om at salgsmuligheter normalt fordeles. Den normale kurven strekker seg fra - 3σ til + 3σ. Hvis salgsevnen er normalt fordelt, kan baselinjen deles inn i tre like segmenter, dvs.

(+ 1σ til + 3σ), (- 1σ til + 1σ) og (- 3σ til - 1σ) som representerer gode, tilfredsstillende og dårlige selgere. Ved å se Tabell A finner vi at 16% av tilfellene ligger mellom + 1σ og + 3σ, 68% mellom - 1σ og + 1σ og 16% mellom - 3σ og - 1σ. I tilfelle av vårt problem 16% av 200 = 32 og 68% av 200 = 136.

df = 2. P er mindre enn .01

Den beregnede χ 2 = 72, 76

Den beregnede χ 2 av 72, 76> 9, 21. Derfor er P mindre enn .01.

.˙. Forskjellen mellom observerte frekvenser og forventede frekvenser er ganske signifikant. På denne måten må hypotesen om en normal fordeling av salgsevne i denne gruppen avvises. Derfor konkluderer vi at fordelingen av karakterer avviger fra det som kan forventes.

3. Chi-square test når våre forventninger er basert på forhåndsbestemte resultater:

Eksempel 4:

I et forsøk på avl av erter oppnådde en forsker følgende data:

Teorien forutsier andelen bønner, i fire grupper A, B, C og D skal være 9: 3: 3: 1. I et forsøk på 1600 bønner var tallene i fire grupper 882, 313, 287 og 118. Gjør Eksperimentresultater støtter den genetiske teorien? (Test på .05 nivå).

Løsning:

Vi satte opp nullhypotesen at det ikke er noen signifikant forskjell mellom eksperimentelle verdier og teorien. Med andre ord er det god korrespondanse mellom teori og eksperiment, dvs. teorien støtter eksperimentet.

Siden den beregnede χ 2 verdien av 4, 726 <7, 81 er den ikke signifikant. Derfor kan null hypotesen aksepteres ved .05 nivå av betydning, og vi kan konkludere med at de eksperimentelle resultatene støtter den genetiske teorien.

4. Chi-square testen når tabelloppføringene er små:

Når tabelloppføringene er små og når bordet er 2 x 2 ganger, dvs. df = 1, χ 2 er utsatt for betydelig feil, med mindre en korrigering for kontinuitet (kalt Yates 'Correction) blir gjort.

Eksempel 5:

Fyrre rotter ble tilbudt mulighet til å velge mellom to ruter. Det ble funnet at 13 valgte lyste ruter (dvs. ruter med mer belysning) og 27 valgte mørke ruter.

(i) Test hypotesen om at belysning ikke gir noen forskjell i rotternes preferanse for ruter (Test ved .05-nivå).

(ii) Test om rotter foretrekker mørke ruter.

Løsning:

Hvis belysning ikke gir noen forskjell i preferanse for ruter, dvs. hvis H 0 er sant, vil den forholdsmessige preferansen være 1/2 for hver rute (dvs. 20).

I vårt eksempel skal vi trekke fra .5 fra hver (f o - f e ) forskjell av følgende grunn:

Dataene kan tabelliseres som følger:

Når de forventede oppføringene i 2 x 2-foldsbord er de samme som i vårt problem, kan formelen for chi-square skrives i en noe kortere form som følger:

(i) Den kritiske verdien av χ 2 på .05 nivå er 3, 841. Den oppnådde χ 2 på 4, 22 er mer enn 3, 841. Derfor null-hypotesen blir avvist på .05 nivå. Tilsynelatende er lys eller mørk en faktor i rotternes valg for ruter.

(ii) I vårt eksempel må vi lage en one-tailed test. Inntasting av tabell E finner vi at χ 2 på 4, 22 har en P = .043 (ved interpolering).

.˙. P / 2 = .0215 eller 2%. Det er med andre ord 2 sjanser i 100 at en slik divergens ville oppstå.

Derfor markerer vi divergensen for å være signifikant på 02 nivå.

Derfor konkluderer vi med at rottene har en preferanse for mørke ruter.

5. Chi-firkantet test av uavhengighet i beredskapstabeller:

Noen ganger kan vi møte situasjoner som krever at vi tester om det er noe forhold (eller forening) mellom to variabler eller attributter. Med andre ord kan χ 2 gjøres når vi ønsker å undersøke forholdet mellom egenskaper eller attributter som kan klassifiseres i to eller flere kategorier.

For eksempel kan vi bli pålagt å teste om fargenes øyenfarge er assosiert med øyas farger, om familiens samfunnsøkonomiske status er knyttet til preferansen til ulike merker av en vare, om utdanningen av par og familie størrelse er relatert, om en bestemt vaksine har en kontrollerende effekt på en bestemt sykdom etc.

For å lage en test utarbeider vi en beredskapstabellende for å beregne f e (forventet frekvens) for hver celle i beredskapstabellen og beregne deretter x 2 ved å bruke formel:

Nullhypotesen:

χ 2 beregnes med en antagelse at de to attributter er uavhengige av hverandre, det vil si at det ikke er noen sammenheng mellom de to attributter.

Beregningen av forventet frekvens av en celle er som følger:

Eksempel 6:

I et bestemt utvalg på 2000 familier er 1400 familier forbrukere av te hvor 1236 er hinduistiske familier og 164 er ikke-hinduer.

Og 600 familier er ikke forbrukere av te hvor 564 er hinduistiske familier og 36 er ikke-hinduer. Bruk χ 2 - test og oppgi om det er noen signifikant forskjell mellom teforbruket blant hinduistiske og ikke-hinduistiske familier.

Løsning:

Ovennevnte data kan ordnes i form av et 2 x 2 beredskapstabell som angitt nedenfor:

Vi oppretter nullhypotesen (H 0 ) at de to attributter, for eksempel 'forbruk av te' og 'samfunnet' er uavhengige. Det er med andre ord ingen signifikant forskjell mellom forbruket av te blant hinduistiske og ikke-hinduiske familier.

Siden den beregnede verdien av χ 2, nemlig 15, 24 er mye større enn tabellen verdien av χ 2 på .01 nivå av betydning; verdien av χ 2 er svært signifikant og nullhypotesen avvises.

Derfor konkluderer vi med at de to samfunnene (hinduistiske og ikke-hinduer) avviger vesentlig når det gjelder forbruket av te blant dem.

Eksempel 7:

Tabellen nedenfor viser dataene som ble oppnådd under en koleraepidemi.

Test effektiviteten av inokulering for å forhindre angrep av kolera.

Løsning:

Vi satt opp nullhypotesen (H 0 ) at de to attributter, dvs. inokulering og fravær av angrep fra kolera ikke er assosiert. Disse to attributter i det oppgitte tabellen er uavhengige.

Basert på vår hypotese kan vi beregne de forventede frekvensene som følger:

Beregning av (f e ):

Den fem prosentverdien av χ 2 for 1 df er 3, 841, som er mye mindre enn den beregnede verdien av χ 2 . Så i lys av dette er konklusjonen tydelig at hypotesen er feil og inokulering og fravær av angrep fra kolera er forbundet.

Vilkår for gyldigheten av Chi-Square-testen:

Chi-firkanteteststatistikken kan brukes hvis følgende betingelser er oppfylt:

1. N, den totale frekvensen, skal være rimelig stor, si større enn 50.

2. Prøveobservasjonene skal være uavhengige. Dette innebærer at ingen enkelt gjenstand skal inkluderes to ganger eller mer i prøven.

3. Begrensningene på cellefrekvensene, hvis noen, skal være lineære (dvs. de bør ikke innebære firkantede og høyere krefter i frekvensene) som Σf o = Σf e = N.

4. Ingen teoretisk frekvens bør være liten. Små er en relativ sikt. Fortrinnsvis bør hver teoretisk frekvens være større enn 10, men i alle fall ikke mindre enn 5.

Hvis noen teoretisk frekvens er mindre enn 5, kan vi ikke bruke χ 2- test som sådan. I så fall bruker vi "pooling" teknikken som består i å legge til frekvensene som er mindre enn 5 med den foregående eller etterfølgende frekvensen (frekvenser) slik at den resulterende summen er større enn 5 og justere for frihetsgraden tilsvarende.

5. Den oppgitte distribusjonen skal ikke erstattes av relative frekvenser eller proporsjoner, men dataene skal oppgis i originale enheter.

6. Yates 'korreksjon bør brukes under spesielle omstendigheter når df = 1 (dvs. i 2 x 2 tabeller) og når celleoppføringene er små.

7. χ 2- test er for det meste brukt som en ikke-retningsbestemt test (dvs. vi gjør en to-tailed test.). Det kan imidlertid være tilfeller når χ 2 tester kan brukes til å lage en en-tailed test.

I en-tailed test dobler vi P-verdien. For eksempel med df = 1 er den kritiske verdien av χ 2 ved 05 nivå 2.706 (2.706 er verdien skrevet under .10 nivå) og den kritiske verdien av; χ 2 på .01 nivå er 5, 412 (verdien er skrevet under .02 nivået).

Tilleggsegenskapen til Chi-Square-testen:

χ 2 har en veldig nyttig egenskap ved tillegg. Hvis en rekke prøveundersøkelser har blitt utført i samme felt, kan resultatene bli samlet sammen for å få en presis ide om den virkelige posisjonen.

Anta at ti eksperimenter har blitt utført for å teste om en bestemt vaksine er effektiv mot en bestemt sykdom. Nå skal vi ha ti forskjellige verdier av χ 2 og ti forskjellige verdier av df.

Vi kan legge til ti χ 2 for å oppnå en verdi og tilsvarende kan ti verdier av df også legges til sammen. Dermed skal vi ha en verdi på χ 2 og en verdi av grader av frihet. Nå kan vi teste resultatene av alle disse ti eksperimenter kombinert sammen og finne ut verdien av P.

Anta at fem uavhengige eksperimenter har blitt gjennomført i et bestemt felt. Anta at i hvert tilfelle var det en df og følgende verdier av χ 2 ble oppnådd.

Nå ved 5% nivå av betydning (eller for P - .05) er verdien χ 2 for en df 3, 841. Fra de beregnede verdier av χ 2 gitt ovenfor oppdager vi at i bare en enkelhet, dvs. eksperiment nr. 3, er den observerte verdien av χ 2 mindre enn tabellverdien på 3, 841.

Det betyr at for så vidt som dette eksperimentet angår, er forskjellen ubetydelig, men i de gjenværende fire tilfellene er den beregnede verdien av x 2 mer enn 3, 841 og som sådan ved 5% nivå av betydning er differansen mellom de forventede og de faktiske frekvensene signifikant .

Hvis vi legger til alle verdiene av χ 2, får vi (4.3 + 5.7 + 2.1 + 3.9 + 8.3) eller 24.3. Summen av graden av frihet er 5. Det betyr at den beregnede verdien av χ 2 for 5 df er 24, 3.

Hvis vi ser i tabellen på χ 2, finner vi at ved 5% nivå av betydning for 5 df er verdien av χ 2 11.070. Den beregnede verdien av χ 2 som er 24, 3 er mye høyere enn tabellverdien, og som sådan kan vi konkludere med at forskjellen mellom observerte og forventede frekvenser er signifikant.

Selv om vi tar 1% nivå av betydning (eller P = .01) er tabellverdien til χ 2 kun 15.086. Dermed er sannsynligheten for å få en verdi på χ 2 lik eller mer enn 24, 3 som følge av sampling fluktuasjoner mye mindre enn til og med .01 eller med andre ord forskjellen er signifikant.

Applikasjoner av Chi-Test:

Søknadene til χ 2- teststatistikken kan diskuteres som angitt nedenfor:

1. Testing av divergensen av observerte resultater fra forventede resultater når våre forventninger er basert på hypotesen om like sannsynlighet.

2. Chi-square test når forventningene er basert på normal fordeling.

3. Chi-square test når våre forventninger er basert på forhåndsbestemte resultater.

4. Korreksjon for diskontinuitet eller Yates 'korreksjon ved beregning χ 2 .

5. Chi-square test av uavhengighet i beredskapstabeller.

Bruk av Chi-Square-test:

1. Selv om testen utføres i form av frekvenser, kan den best settes konseptuelt som en prøve om proporsjoner.

2. χ 2 test brukes til å teste hypotesen og er ikke nyttig for estimering.

3. Chi-square test kan brukes på komplekse beredskapstabell med flere klasser.

4. Chi-square test har en veldig nyttig egenskap, dvs. 'additiv egenskapen'. Hvis en rekke utvalgsstudier utføres i samme felt, kan resultatene bli samlet sammen. Dette betyr at χ 2 -verdier kan legges til.