Gyldighet av en test: 6 Typer

Følgende seks typer gyldigheter er populært i bruk, f.eks. Ansiktgyldighet, Innholdsvaliditet, Prediktiv gyldighet, Samtidig, Konstruksjon og Faktorell gyldighet. Ut av disse er innholdet, prediktiv, samtidig og konstruktiv validitet de viktigste som brukes innen psykologi og utdanning.

Disse diskuteres nedenfor:

Type # 1. Ansiktsgyldighet:

Ansiktsgyldighet i den grad testen ser ut til å måle hva som skal måles.

Ansiktsgyldighet refererer til om en test ser ut til å være gyldig eller ikke, dvs. fra utvendig utseende om elementene ser ut til å måle det nødvendige aspektet eller ikke. Hvis en test måler hva testforfatteren ønsker å måle, sier vi at testen har gyldighet. Således refererer ansiktets gyldighet ikke til hva testen måler, men hva testen ser ut til å måle. Innholdet av testen skal ikke åpenbart synes å være upassende, irrelevant.

For eksempel må en test for å måle "Ferdighet i tillegg" bare inneholde elementer på tillegg. Når man går gjennom elementene og føler at alle elementene ser ut til å måle ferdighetene i tillegg, så kan det sies at testen er validert av ansikt.

Selv om det ikke er en effektiv metode for å vurdere gyldigheten av en test og som sådan ikke vanligvis brukes, kan den brukes som et første skritt i valideringen av testen. Når testen er validert i ansiktet, kan vi fortsette videre for å beregne validitetskoeffisienten.

Videre hjelper denne metoden en testmaker til å revidere testelementene som passer til formålet. Når en test skal bygges raskt eller når det er et presserende behov for en test, og det ikke er tid eller omfang for å bestemme gyldigheten ved hjelp av andre effektive metoder, kan ansiktets gyldighet bestemmes.

Denne typen gyldighet er ikke tilstrekkelig da den opererer på ansiktsnivå og kan derfor brukes som en siste utvei.

Type # 2. Innhold Gyldighet:

Innhold Gyldighet en prosess for å matche testelementene med instruksjonsmålene.

Innholdsgyldighet er det viktigste kriteriet for bruken av en test, spesielt av en prestasjonstest. Det kalles også som rasjonell gyldighet eller logisk gyldighet eller kurrikulær gyldighet eller intern gyldighet eller intrinsisk gyldighet.

Innholdsgyldighet refererer til graden eller omfanget av en test består av elementer som representerer oppføringene som testmakeren ønsker å måle. I hvilken utstrekning en prøve er sant representativ for hele innholdet og målene for undervisningen, kalles testens innholdsvaliditet.

Innholdsvaliditet estimeres ved å vurdere relevansen av testelementene; dvs. testelementene må dekke alle innholds- og adferdsområder av egenskapen som skal måles. Det gir ide om emne eller endring i atferd.

På denne måten refererer innholdsvaliditet til i hvilken grad en test inneholder elementer som representerer oppførselen som vi skal måle. Testens gjenstander skal inneholde alle relevante karakteristika for hele innholdsområdet og målene i riktig proporsjon.

Før oppbyggingen av testen utarbeider prøveprodusenten en toveis tabell med innhold og mål, populært kjent som "Spesifikasjonstabell".

Anta at en prestasjonstest i matematikk er utarbeidet. Det må inneholde elementer fra Algebra, Aritmetikk, Geometri, Mensuration og Trigonometri, og i tillegg må elementene måle de ulike oppførselsmålene som kunnskap, forståelse, ferdigheter, søknad etc. Det er derfor viktig at det legges vekt på ulike innholdsområder og mål.

Et eksempel på 'spesifikasjonstabell' i matematikk er vist i følgende tabell:

Tabellen gjenspeiler prøven av læringsoppgaver som skal måles. Jo nærmere testelementene samsvarer med den angitte prøven, jo større er muligheten for å ha tilfredsstillende innholdsvaliditet. Derfor er det ønskelig at elementene i en test blir screenet av et team av eksperter. De bør sjekke om plasseringen av de forskjellige elementene i tabellens celler er hensiktsmessig, og om alle cellene i tabellen har et tilstrekkelig antall elementer.

Tilstrekkigheten skal vurderes i forhold til vekten som er gitt til den forskjellige innholdsbaserte tabellen i henhold til ekspertgruppen som har utformet læreplanen.

Noen generelle poeng for å sikre innholdsvaliditet er gitt nedenfor:

1. Testen skal tjene det nødvendige nivået av studenter, hverken over eller under deres standard.

2. Språket skal være opp til nivået av studenter.

3. Alt som ikke er i læreplanen, bør ikke inkluderes i testelementene.

4. Hver del av læreplanen skal gis nødvendig vekt. Flere elementer skal velges fra viktige deler av læreplanen.

begrensninger:

1. Vekten som skal gis til ulike deler av innholdet er subjektiv.

2. Det er vanskelig å konstruere den perfekte objektivprøven.

3. Innholdsgyldighet er ikke tilstrekkelig eller tilstrekkelig for tester av Intelligens, Achievement, Attitude og til en viss grad tester av Personlighet.

4. Vekting gitt på forskjellig atferdsendring er ikke objektiv.

Type # 3. Forutsigbar Gyldighet:

Prediktiv Gyldighet i hvilken grad testen forutser fremtidens prestasjon av studentene.

Prediktiv validitet er opptatt av en prediktiv kapasitet. Det indikerer effektiviteten av en test i prognoser eller forutsi fremtidige resultater i et bestemt område. Testbrukeren ønsker å prognose en persons fremtidige ytelse. Testresultater kan brukes til å forutsi fremtidig oppførsel eller ytelse og dermed kalt som prediktiv validitet.

For å finne prediktiv validitet korrelerer testeren testresultatene med testens etterfølgende ytelse, teknisk kjent som "Kriterium". Kriteriet er et uavhengig, eksternt og direkte mål for det som testen er utformet for å forutsi eller måle. Derfor er det også kjent som "kriterium-relatert gyldighet".

Den prediktive eller empiriske gyldigheten er definert av Cureton (1965) som et estimat av korrelasjonskoeffisienten mellom testresultatene og det sanne kriteriet.

Et eksempel kan klargjøre konseptet bedre.

Eksempel:

Medisinsk inngangstest er konstruert og administrert for å velge kandidat for opptak til MBBS-kurs. Basere på poengene som kandidatene har gjort på denne testen, innrømmer vi kandidatene.

Etter avsluttet kurs vises de ved den endelige MBBS-eksamenen. Resultatene av endelig MBBS-eksamen er kriteriet. Resultatene av inngangstest og slutteksamen (kriterium) er korrelert. Høy korrelasjon innebærer høy prediktiv validitet.

Lignende eksempler som andre rekrutteringstester eller opptaksprøver i Landbruk, Engineering, Banking, Jernbane etc. kan her nevnes som må ha høy prediktiv validitet.

Det er tester som brukes til rekruttering, klassifisering og opptaksprøve må ha høy prediktiv validitet. Denne typen gyldighet er noen ganger referert til som "Empirisk gyldighet" eller "Statistisk gyldighet" som vår vurdering er primært empirisk og statistisk.

begrensning:

Hvis vi får et passende kriteriemål som våre testresultater skal korreleres til, kan vi bestemme prediktiv validitet av en test. Men det er veldig vanskelig å få et godt kriterium. Videre kan vi ikke få kriterie tiltak for alle typer psykologiske tester.

Type nr. 4. Samtidig gyldighet:

Samtidig gyldighet korrelerer testresultatene med et annet sett med kriteriepoeng.

Samtidig gyldighet refererer til hvorvidt testresultatene samsvarer med allerede etablert eller akseptert ytelse, kjent som kriterium. For å vite gyldigheten av en nybygd test, er den korrelert eller sammenlignet med noen tilgjengelig informasjon.

Dermed er en test validert mot noen samtidig tilgjengelig informasjon. Resultatene fra en nybygget test er korrelert med forhåndsdefinert testprestasjon. Anta at vi har utarbeidet en test av etterretning.

Vi administrerer den til elever. Stanford-Binet-testen administreres også til samme gruppe. Nå testresultater gjort på vår nybygde test og testresultater laget av elever på Stanford-Binet Intelligence Test er korrelerte. Hvis korrelasjonskoeffisienten er høy, sies vår intelligens test å ha høy samtidig gyldighet.

Ordboksens betydning av begrepet "samtidige" er "eksisterende" eller "gjort samtidig". Dermed er begrepet "samtidig gyldighet" brukt til å indikere prosessen med å validere en ny test ved å korrelere sine score med noen eksisterende eller tilgjengelig informasjonskilde (kriterium) som kunne ha blitt oppnådd kort tid før eller kort tid etter den nye testen er gitt.

For å fastslå den samtidige gyldigheten av en prestasjonstest konstruert fersk, er resultatene korrelert med resultatene som ble oppnådd av de samme studentene i sin siste første terminal eller terminal eksamen. Dermed er en test validert mot noen samtidig tilgjengelig informasjon. For å få et kriterium må vi ikke vente lenge.

Den prediktive gyldigheten er forskjellig fra samtidig gyldighet i den forstand at vi i tidligere gyldighet venter på fremtiden for å få kriteriummål. Men med tanke på samtidig gyldighet trenger vi ikke vente på lengre hull.

Begrepet "samtidige" her innebærer følgende egenskaper:

1. De to testene - den som har gyldighet undersøkt og den som har bevist gyldighet - skal dekke det samme innholdsområdet på et gitt nivå og det samme målet;

2. Befolkningen for begge testene forblir den samme og de to testene administreres i nesten like miljøer; og

3. Ytelsesdataene på begge testene er oppnåelig nesten samtidig.

Denne typen gyldighet er også kjent som "Ekstern gyldighet" eller "Funksjonell gyldighet". Samtidig gyldighet er relevant for tester som brukes til diagnose, ikke for å forutse fremtidig suksess.

Type # 5. Konstruer Gyldighet:

Konstruer Gyldighet omfanget er som testen kan sies å måle en teoretisk konstruksjon eller psykologisk variabel.

En konstruksjon er hovedsakelig psykologisk. Vanligvis refererer det til en egenskap eller mental prosess. Konstruksvalidering er prosessen med å bestemme i hvilken grad en bestemt test måler de psykologiske konstruksjonene som testmakeren har til hensikt å måle.

Det indikerer i hvilken grad en test måler abstrakte attributter eller kvaliteter som ikke er operativt definert.

Gronlund og Linn sier, "Konstruksvalidering er kanskje definert som prosessen med å bestemme i hvilken grad testprestasjonen kan tolkes når det gjelder en eller flere psykologiske konstruksjoner."

Ebel og Frisbie beskriver, "Construct validering er prosessen med å samle bevis for å støtte påstanden om at en gitt test faktisk måler den psykologiske konstruksjonen som testmakerne hadde til hensikt å måle."

Konstruksjonsgyldighet er også kjent som "Psychological Validity" eller "Trait Validity" eller "Logical Validity". Konstruksjonsgyldighet betyr at testresultatene undersøkes i form av en konstruksjon. Den studerer konstruksjonen eller psykologiske egenskaper som en test måler.

I hvilken utstrekning testen måler personlighetstrekkene eller mentale prosesser som definert av testmaskinen, er kjent som testens konstruksjonsgyldighet.

Mens du bygger tester på intelligens, holdning, matematisk evne, kritisk tenkning, studiekompetanse, angst, logisk resonnement, leseforståelse etc. må vi gå for konstruktiv validitet. Ta for eksempel 'en test av oppriktighet'.

Før konstruksjon av slike typer test, blir testmaskinen konfrontert med spørsmålene:

1. Hva bør definisjonen av begrepet oppriktighet være?

2. Hvilke typer oppførsel kan forventes fra en person som er oppriktig?

3. Hvilken type oppførsel skiller mellom oppriktighet og uendelighet?

Hver konstruksjon har en underliggende teori som kan bli båret i å beskrive og forutsi en elevs oppførsel.

Gronlund (1981) foreslår følgende tre trinn for å bestemme konstruktiv validitet:

(i) Identifisere konstruksjonene som antas å ta hensyn til testytelsen.

(ii) Utled hypoteser angående testprestasjon fra teorien som ligger til grund for hver konstruksjon.

(iii) Bekreft hypotesene ved hjelp av logiske og empiriske midler.

Det må bemerkes at konstruksjonsgyldigheten er inferensiell. Den brukes først og fremst når andre typer gyldigheter er utilstrekkelige for å indikere testens gyldighet. Konstruksjonsgyldighet er vanligvis involvert i eksempelvis studievaner, takknemlighet, ærlighet, følelsesmessig stabilitet, sympati etc.

Type nr. 6. Faktorell gyldighet:

Faktorisk gyldighet omfanget av korrelasjon av de ulike faktorene med hele testen.

Faktorisk validitet bestemmes av en statistisk teknikk kjent som faktoranalyse. Den bruker metoder for å forklare interkorrelasjoner for å identifisere faktorer (som kan bli verbalisert som evner) som utgjør testen.

Metoder for interkorrelasjon og andre statistiske metoder brukes med andre ord til å estimere faktorial validitet. Korrelasjonen av testen med hver faktor beregnes for å bestemme vekten bidratt av hver slik faktor til totalprestasjonen av testen.

Dette forteller oss om faktorbelastningene. Dette forholdet mellom de ulike faktorene med hele testen kalles den faktoriske gyldigheten. Guilford (1950) foreslo at faktorial validitet er den klareste beskrivelsen av hva en test måler og på alle måter bør gis preferanse over andre typer validitet.