Ikke-parametriske test: Konsepter, forholdsregler og fordeler

Etter å ha lest denne artikkelen vil du lære om: - 1. Begreper av ikke-parametriske test 2. Forutsetninger for ikke-parametriske test 3. Forholdsregler 4. Noen ikke-parametriske test 5. Fordeler 6. Ulemper.

Begreper av ikke-parametriske test:

Litt mer nylig har vi sett utviklingen av et stort antall engasjementsteknikker som ikke gjør mange eller strenge antagelser om befolkningen som vi har samplet dataene fra. Disse fordelingsfrie eller ikke-parametriske teknikkene resulterer i konklusjoner som krever færre kvalifikasjoner.

Etter å ha brukt en av dem, kan vi kanskje si det, "Uansett befolkningens form, kan vi konkludere med at ...."

De to alternative navnene som ofte blir gitt til disse testene er:

Distribution-Free:

Ikke-parametriske tester er "distribusjonsfrie". De antar ikke at resultatene under analyse er trukket fra en befolkning fordelt på en bestemt måte, f.eks. Fra en normalt distribuert befolkning.

Når vi gjør tester av betydningen av forskjellen mellom to måter (i forhold til CR eller t for eksempel), antar vi at poengene som vår statistikk er basert på, er normalt fordelt i befolkningen. Det som egentlig gjør - under nullhypotesen - er å estimere fra vår utvalgsstatistikk sannsynligheten for en sann forskjell mellom de to parametrene.

Når N er ganske liten eller dataene er dårlig skjev, slik at antagelsen om normalitet er tvilsom, er "parametriske metoder" tvilsom eller ikke i bruk. Det vi trenger i slike tilfeller er teknikker som gjør det mulig for oss å sammenligne prøver og å lage inferanser eller tester av betydning uten å anta normalitet i befolkningen.

Slike metoder kalles ikke-parametrisk eller distribusjonsfri. Eksempelvis er den kvadratiske test X 2- test en ikke-parametrisk teknikk. Betydningen av X 2 er bare avhengig av graden av frihet i bordet; Det må ikke gis antagelse om distribusjonsform for variablene som er klassifisert i kategoriene i X 2- tabellen.

Rangeringsforskjellen korrelasjonskoeffisienten (rho) er også en ikke-parametrisk teknikk. Når p beregnes fra score rangert i verdien av verdien, vil fordelingen som resultatene tas fra, være dårlig skjeve og N er nesten alltid liten.

Rangeringstester:

Alternativt er mange av disse testene identifisert som "rangeringstester", og denne tittelen antyder deres andre hovedverdier: ikke-parametriske teknikker kan brukes med score som ikke er nøyaktige i noen numerisk forstand, men som faktisk er rett og slett.

Forutsetninger for ikke-parametriske test:

En ikke-parametrisk statistisk test er basert på en modell som bare angir svært generelle forhold og ingen angående den spesifikke formen for fordelingen som prøven ble trukket fra.

Visse antagelser er knyttet til de fleste ikke-parametriske statistiske tester, nemlig:

1. At observasjonene er uavhengige;

2. Variabelen under studien har underliggende kontinuitet;

3. Ikke-parametriske prosedyrer, ikke en annen hypotes om befolkning enn parametriske prosedyrer;

4. I motsetning til parametriske tester, er det ikke parametriske tester som kan brukes på riktig måte til data målt i ordinær skala, og andre til data i nominell eller kategorisk skala.

Forholdsregler ved bruk av ikke-parametriske test:

Ved bruk av ikke-parametriske tester blir studenten advart mot følgende bortfall:

1. Når målingene er i forhold til intervaller og forholds skalaer, vil omformingen av målingene på nominelle eller ordinære skalaer føre til tap av mye informasjon. Derfor bør parametriske tester i slike situasjoner så langt som mulig brukes. Ved å bruke en ikke-parametrisk metode som en snarvei, kaster vi bort dollar for å spare pennies.

2. I situasjoner der forutsetningene som ligger bak en parametrisk test er tilfredsstillende, og både parametriske og ikke-parametriske tester kan brukes, bør valget være på parametriske testen fordi de fleste parametriske tester har større effekt i slike situasjoner.

3. Ikke-parametriske tester gir uten tvil et middel for å unngå antagelsen om normalitet av distribusjon. Men disse metodene gjør ingenting for å unngå forutsetninger om uavhengighet på homoscedasticitet hvor det er aktuelt.

4. Behavioralforsker skal spesifisere nullhypotesen, alternativ hypotesen, statistisk test, prøvetakingsfordeling og nivå av betydning før datainnsamlingen. Jakt rundt for en statistisk test etter at dataene er samlet, har en tendens til å maksimere effekten av eventuelle tilfeldighetsforskjeller som favoriserer en test over en annen.

Som et resultat, øker muligheten for å avvise nullhypotesen når den er sant (type I-feil) kraftig økt. Denne forsiktigheten gjelder imidlertid også for parametriske og ikke-parametriske tester.

5. Vi har ikke problemer med å velge statistiske tester for kategoriske variabler. Ikke-parametriske tester alene er egnet for talende data.

6. F- og t-tester anses generelt for å være robuste test fordi brudd på de underliggende forutsetningene ikke ugyldiggjør inferansen.

Det er vanlig å rettferdiggjøre bruken av en normal teoritest i en situasjon der normalitet ikke kan garanteres, ved å hevde at den er robust under ikke-normalitet.

Noen ikke-parametriske test:

Vi skal diskutere noen få vanlige ikke-parametriske tester.

1. Sign Test:

Tegnetesten er den enkleste av all distribusjonsfri statistikk og har et meget høyt nivå av generell anvendelighet. Det er aktuelt i situasjoner der kritisk forhold, t, test for korrelerte prøver ikke kan brukes fordi forutsetningene om normalitet og homoscedasticitet ikke er oppfylt.

Studentene er klar over det faktum at visse forhold i oppsettet av forsøket innfører elementet av forholdet mellom de to settene av data.

Disse forholdene er generelt en pre-test, post-test situasjon; en test og re-test situasjon; testing av en gruppe fag på to tester; dannelse av "matchede grupper" ved å sammenkoble noen utenlandske variabler som ikke er gjenstand for etterforskning, men som kan påvirke observasjonene.

I skiltest tester vi signifikansen av tegn på forskjell (som pluss eller minus). Denne testen brukes når N er mindre enn 25.

Følgende eksempel vil gjøre oss tydelige om skiltest:

Eksempel:

Resultatene blir ofte under to forskjellige forhold, A og B er gitt nedenfor. Påfør sign-test og test hypotesen om at A er overlegen B.

Utelukkende 0 (null) har vi ni forskjeller, hvorav syv er pluss.

Vi må nå utvide binomialet, (p + q) 9

(p + q) 9 = p 9 + 9p 8 q + 36p 7 q 2 + 84 p 6 q 3 + 126 p 5 q 4 + 126 p 4 q 5 + 84 p 3 q 6 + 36 p 2 q 7 + 9 pq 8 + q 9 .

Det totale antallet kombinasjoner er 2 9 eller 512. Vi har totalt 46 kombinasjoner (dvs. 1 av 9, 9 av 8), og legger til de første 3 betingelsene (nemlig p 9 + 9p 8 q + 36 p 7 q 2 )., og 36 av 7) som inneholder 7 eller flere pluss tegn.

Noen 46 ganger i 512 forsøk 7 eller flere pluss tegn ut av 9 vil oppstå når gjennomsnittlig antall + tegn under nullhypotesen er 4, 5. Sannsynligheten for 7 eller flere + tegn er derfor 46/512 eller .09, og er tydeligvis ikke signifikant.

Dette er en-tailed test, siden vår hypotese sier at A er bedre enn B. Hvis hypotesen i begynnelsen hadde vært at A og B er forskjellig uten å spesifisere hvilken som er overlegen, ville vi ha hatt en 2-tailed test som P = 0, 18.

Tabeller er tilgjengelige som gir antall tegn som er nødvendige for betydning på forskjellige nivåer, når N varierer i størrelse. Når antall par er så store som 20, kan normalkurven brukes som en tilnærming til binomial ekspansjonen eller den anvendte x 2- testen.

2. Median Test:

Median testen brukes til å sammenligne ytelsen til to uavhengige grupper som for eksempel en eksperimentell gruppe og en kontrollgruppe. For det første kastes de to gruppene sammen og en felles median beregnes.

Hvis de to gruppene er trukket tilfeldig fra samme populasjon, skal 1/2 av resultatene i hver gruppe ligge over og 1/2 under den felles medianen. For å teste denne nullhypotesen må vi lage et 2 x 2 bord og beregne x 2 .

Metoden er vist i følgende eksempel:

Eksempel:

En klinisk psykolog ønsker å undersøke effekten av et beroligende stoff ved håndskrem. Fjorten psykiatriske pasienter får legemidlet, og 18 andre pasienter får ufarlig dose. Den første gruppen er den eksperimentelle, den andre kontrollgruppen.

Øker stoffet stabilitet - som vist ved lavere score i eksperimentell gruppe? Som vi er bekymret bare hvis stoffet reduserer tremor, er dette en en-tailed test.

Median test brukes til eksperimentelle og kontrollgrupper. Pluss tegn angir score over den vanlige medianen, minus tegn skårer under den vanlige medianen.

N = 14 N = 18

Vanlig median = 49, 5

Den vanlige medianen er 49, 5. I eksperimentell gruppe 4 er scoreene over og 10 under den vanlige medianen i stedet for de 7 ovenfor og 7 nedenfor for å kunne forventes ved en tilfeldighet. I kontrollgruppen er 12 poeng over og 6 under vanlig median i stedet for de forventede 9 i hver kategori.

Disse frekvensene er oppgitt i følgende tabell og X 2 beregnes med formelen (angitt nedenfor) med korreksjon for kontinuitet:

AX 2 c på 3, 17 med 1 frihetsgrad gir ap som ligger på .08 omtrent midtveis mellom .05 og .10. Vi ønsket å vite om medianen i forsøksgruppen var signifikant lavere enn kontrollen (dermed indikerer mer stabilitet og mindre tremor).

For denne hypotesen er en en-tailed test, p / 2, omtrent .04 og X2c er signifikant på 0, 5-nivået. Hadde vår hypotese vært at de to gruppene er forskjellige uten å spesifisere retningen, ville vi ha hatt en to-tailed test og X 2 ville vært merket ikke signifikant.

Vår konklusjon, gjorde noe forsiktig, er at stoffet gir litt reduksjon i tremor. Men på grunn av de små prøvene og mangelen på et meget betydelig funn, ville klinisk psykolog nesten helt sikkert gjenta eksperimentet - kanskje flere ganger.

X 2 er generelt anvendelig i median testen. Men når N 1 og N 2 er små (f.eks. Mindre enn ca. 10) og X 2- testen ikke er nøyaktig, og den nøyaktige metoden for beregningssannsynligheter skal brukes.

Fordeler ved ikke-parametriske test:

1. Hvis prøvestørrelsen er svært liten, kan det ikke være noe alternativ til å bruke en ikke-parametrisk statistisk test, med mindre populasjonsfordelingens natur er kjent nøyaktig.

2. Ikke-parametriske tester gir vanligvis færre forutsetninger om dataene og kan være mer relevante for en bestemt situasjon. I tillegg kan hypotesen som er testet av den ikke-parametriske testen, være mer hensiktsmessig for forskningsundersøkelsen.

3. Ikke-parametriske statistiske tester er tilgjengelige for å analysere data som er iboende i rekker, samt data hvis tilsynelatende numeriske poeng har styrken i rekkene. Det vil si at forskeren bare kan si om sine emner at man har mer eller mindre karakteristikk enn en annen, uten å kunne si hvor mye mer eller mindre.

For eksempel ved å studere en slik variabel som angst, kan vi kanskje angi at emnet A er mer engstelig enn emne B uten å vite nøyaktig hvor mye mer engstelig A er.

Hvis data er iboende i rekker, eller om de bare kan kategoriseres som pluss eller minus (mer eller mindre, bedre eller verre), kan de behandles med ikke-parametriske metoder, mens de ikke kan behandles ved parametriske metoder, med mindre usikker og Det blir kanskje gjort urealistiske antagelser om de underliggende fordelingene.

4. Ikke-parametriske metoder er tilgjengelige for å behandle data som bare er klassifiserende eller kategoriske, dvs. målt i nominell skala. Ingen parametrisk teknikk gjelder for slike data.

5. Det finnes egnede ikke-parametriske statistiske tester for behandling av prøver som består av observasjoner fra flere forskjellige populasjoner. Parametriske tester kan ofte ikke håndtere slike data uten å kreve at vi gjør tilsynelatende urealistiske antagelser eller krever besværlige beregninger.

6. Ikke-parametriske statistiske tester er vanligvis mye lettere å lære og å søke enn parametriske tester. I tillegg er deres tolkning ofte mer direkte enn tolkningen av parametriske tester.

Ulemper ved ikke-parametriske test:

1. Hvis alle forutsetninger av en parametrisk statistisk metode faktisk er møtt i dataene og forskningshypotesen kan testes med en parametrisk test, så er ikke-parametriske statistiske tester sløsing.

2. Graden av sløsing er uttrykt av effektiviteten til den ikke-parametriske testen.

3. En annen innsigelse mot ikke-parametriske statistiske tester er at de ikke er systematiske, mens parametriske statistiske tester har blitt systematisert, og forskjellige tester er ganske enkelt variasjoner på et sentralt tema.

4. En annen innsigelse mot ikke-parametriske statistiske tester har å gjøre med bekvemmelighet. Tabeller som er nødvendige for å implementere ikke-parametriske tester, er spredt vidt og vises i forskjellige formater.