Forutsigelse av jobbsuccess (med diagram og statistikk)

Forutsigelsen av jobbsuccess innebærer å bestemme i hvilken grad prediktoren er relatert til kriteriet. Anta for eksempel at man var interessert i å sette opp et utvalgsprogram for å ansette nye filklienter. Anta videre at det hadde blitt bestemt å bruke en papir-og-blyant-test av klientalitet som en potensiell prediktor for filistens effektivitet, og at effektiviteten skulle bestemmes av vurderinger fra veiledere. Tabell 2.3 viser noen hypotetiske data for denne antatte situasjonen, og gir score for tolv filklienter på både den klare testen og effektivitetskriteriet. Figur 2.5 viser en graf av dataene i Tabell 2.3.

Legg merke til at det ser ut til å være en systematisk trend. Generelt, jo høyere en person scoret på den administrative testen, desto høyere scorte hun på målet om arbeidsferdighet. Vi kan derfor utlede at det er et klart forhold mellom testprestasjon (prediktor) og arbeidsferdighet (kriteriet). Vi kan også utlede at hvis vi velger de som scorer høyere på testen, er vi bedre egnet til å ansette folk som vil være dyktige enn hvis vi ansetter folk uavhengig av testresultat.

Etablere graden av forhold:

Graden av forhold mellom to variabler kan defineres som i hvilken grad disse to variablene varierer sammen på en systematisk måte. Jo mer teknisk term for dette er graden av kovarians som eksisterer mellom variabler. Et formelt mål for graden av kovarians mellom noen to sett av poeng er gitt av en statistikk kjent som korrelasjonskoeffisienten. Når to sett med score er svært relaterte, sier vi at de er høyt korrelerte. Det vanligste mål for korrelasjon er Pearson Product Moment Correlation Coefficient som er betegnet med symbolet r.

Som et forhold på forholdet varierer r mellom + 1, 00 og -1, 00. Når r er + 1, 00, er de to settene av poeng positivt og perfekt knyttet til hverandre. Når r er -1, 00, er de to settene av poeng negativt og perfekt knyttet til hverandre. Når r = 0, 00, har de to settene ikke noe forhold til hverandre i det hele tatt. Figur 2.6 viser grafer av forskjellige størrelser på r.

Ved å forutsi jobbsuccess er tegn på korrelasjonskoeffisienten ikke viktig, men størrelsen er. Jo større absolutt størrelse r er, desto bedre er prediksjonen av kriteriet score på grunnlag av informasjon hentet fra prediktoren.

For å forstå begrunnelsen for korrelasjon kan det være nyttig å vurdere en billedlig fremstilling av kovarians og forholdet til r. Et hvilket som helst sett med score vil ha en viss variasjon, faktisk, som vi allerede har sett, følger antall personer på mange trekk en normal fordeling med et lite antall svært høy score, et lite antall svært lave score og de fleste av resultatene som skjer midt i distribusjonen.

Anta at vi representerer denne variansen i et sett med kriteriepoeng som vist ovenfor, hvor totalområdet er definert som 1.00. Vi kan gjøre dette, siden det er mulig å transformere et sett med rå poeng, slik at deres varians blir lik 1, 00 ved å bruke det som er kjent som az score transformasjon.

På samme måte antar vi at vi har et sett med prediktor score som også varierer og blir normalt fordelt, og igjen er området definert som å være lik mengden 1, 00. Vi kan nå representere r geometrisk som å være relatert til mengden overlapping (kovarians) av de to settene av score.

En mer presis definisjon av r som en statistikk er at det er forholdet mellom mengden av kovarians mellom to variabler til kvadratroten av produktet av de respektive avvikene (noen ganger kalt et geometrisk gjennomsnitt) som kan bli diagrammet som vist nedenfor:

Tilbake til dataene gitt i Tabell 2.3, er det mulig å beregne sammenhengen mellom disse to settene ved å bruke formelen

Leseren er oppmerksom på at r ikke kan tolkes som en prosentandel. Hvis r = 0, 50, betyr dette ikke at 50 prosent av variansen i kriteriet er forutsigbar fra utvalgsvariabelen. Torget av r kan imidlertid tolkes så. En korrelasjon på 0, 50, når den er kvadratisk, gir r ² = 0, 25, som kan tolkes som prosentandelen av variansen i kriteriet forutsatt av utvalgsvariabelen.

Statistikken r ² kalles noen ganger bestemmelseskoeffisienten fordi den representerer mengden varians i en variabel som kan "bestemmes" ved å kjenne poengene på en andre variabel. Figur 2.7 viser forholdet mellom r (forholdet mellom forholdet) og r ² . Legg merke til at det er mulig å oppnå r som er ganske stor størrelse og fortsatt står for bare en liten del av kriterievarianansen.

regresjon:

Som vi har sett, måler korrelasjonskoeffisienten graden av forholdet mellom to variabler. I seg selv gir det imidlertid ikke oss en prosedyre som vi kan forutsi et sett med score fra et annet sett. Teknikken der dette gjøres kalles regresjonsanalyse. Regresjon kan anses å være relatert til korrelasjon som følger: Korrelasjon måler størrelsen eller graden av forholdet mellom to variabler, mens regresjon gir en beskrivelse av typen forhold mellom variabler som igjen kan brukes til å gjøre spådommer.

For å illustrere regresjon, vurder poengene som er skissert i figur 2.8a. Åpenbart er det et betydelig positivt forhold som eksisterer mellom prediktoren og kriteriet i dette tilfellet. Dessverre gir figur 2.8a oss ingen informasjon om det nøyaktige forholdet annet enn det faktum at det er en lineær (r måler bare bare graden av lineær, i motsetning til krøllete forhold mellom to variabler). Hvis vi vil forutsi kriteriepoeng fra noen utvalgsenhet, er det klart at vi må spesifisere det observerte forholdet mellom prediktor og kriterium.

Dette oppnås ved å finne linjen eller funksjonen som best beskriver datapunktene. Dette kalles tilpasse en "linje best egnet" til dataene. Siden vi antar at forholdet skal være lineært (vi brukte r for å måle størrelsen), må den typen linje vi bruker være rett, det vil si at ingen buede linjer er tillatt. Denne best passende rette linjen kalles regresjonslinjen og kan brukes til å forutsi kriteriet fra prediktoren.

Figur 2.8b viser to forskjellige linjer som passer best hvis vi ba om to forskjellige personer å undersøke dataene og deretter tegne en linje gjennom punktene som etter deres mening synes best å beskrive trenden eller forholdet mellom variablene. Mens den generelle trenden er lik, finner vi at de to menneskene ikke helt enig i deres estimat av forholdet.

Denne uenigheten vil igjen føre til uenighet i den forutsagte kriteriepoengsatsen, avhengig av hvilken estimert regresjonslinje ble brukt. Gitt en jobbsøker med en poengsum x på utvalgsinstrumentet, ville vi forutsi en kriteriepoengsum på y ₁ for denne søkeren hvis vi skulle bruke den første persons regresjonslinje; hvis vi brukte den andre persons regresjonslinje, ville vi forutse y ₂ som den mest sannsynlige kriteriepoengsummen. Hvilken regresjon er riktig?

Dette er et vanskelig spørsmål å svare med mindre det er grunnlag for å bestemme hva en "best egnet" egentlig er. Heldigvis har statistikere generelt enige om at en best passende linje er en som går gjennom punktene, slik at den minimerer summen av de kvadratiske avstandene (i y-dimensjonen) av punktene fra linjen som vist i figur 2.9.

En linje som oppnår minimering av Σd ² kalles en "minst kvadrater" regresjonslinje. Slike regresjonslinjer er matematisk direkte relatert til r. Ved å bruke den minste kvadratmetoden for å oppnå vår prediksjonslinje, sikrer vi at ulike personer vil ende opp med samme linje (forutsatt at de ikke gjør feil i beregningen). På samme måte vil det forutsagte kriteriesultatet for en bestemt x-verdi ikke variere avhengig av hvem som passer til prediksjonslinjen (se figur 2.8c).

På dette punktet kan leseren spørre: "Hvorfor må vi forutsi kriteriescorer når vi allerede har dem?" Svaret er ganske enkelt. Den første måling av omfanget av forholdet mellom prediktor og kriterium krever åpenbart både sett av poeng eller ellers forholdet kunne ikke ha blitt etablert. Skal utvelgelsesenheten vise seg nyttig, kan den da brukes sammen med alle nye søkere for hvem det kan være en prediktor score, men for hvem en kriteriepoengsum ikke eksisterer.

Vårt mål er å forutsi kriterieprestasjonen til fremtidige søkere. Hvis en ny søker vurderer høyt på en test som ble funnet å ha et høyt positivt forhold til kriteriet, bør vi forvente at han har stor sannsynlighet for å vise seg å være en vellykket ansettelse.