3 trinn med normalisering av data

Noen av de viktige stadiene som er involvert i prosessen med normalisering av data, er som følger:

Det finnes flere måter å gruppere dataelementer i tabeller på. Databasedesigneren ville være interessert i å velge måten som sikrer ingen uregelmessigheter i datagruppering. Disse uregelmessighetene inkluderer data redundans, tap av data og falske relasjoner i data.

Image Courtesy: 4.bp.blogspot.com/-MTnjMQCPoRI/Tu4HGFKjV2I/AAAAAAAAAHQ/md1Cz89KH1U/s1600/2service.jpg

Normalisering tar sikte på å eliminere anomaliene i data. Normaliseringsprosessen innebærer tre trinn, hvert trinn genererer et bord i vanlig form.

1. Første normal form:

Det første trinnet i normalisering er å sette alle gjentatte felt i separate filer og tilordne passende taster til dem.

Med eksemplet på innkjøpsordrebehandling kan følgende dataelementer identifiseres i en innkjøpsordre:

Leverandør ID

Leverandørens navn

Adresse

Innkjøpsordrenummer

Dato

Betalingsbetingelser

Fraktbetingelser

S. nr.

Produktkode

Beskrivelse

Måleenhet

Pris

Antall bestilt

Beløp

Som beskrevet ovenfor gjentas forsendelsesvilkårene for hver S. nr. Og det vil være flere av poster for det i hver innkjøpsordre. I første trinn av normalisering plasseres de gjentatte dataelementene i separate tabeller. Dermed deler vi dataelementene i to tabeller som vist nedenfor:

Nøkkeldataelementene vises i store bokstaver. Tabellen er nå i den første vanlige formen (INF) fordi alle gjentatte dataelementer (feltene) er i et eget bord (tabell 1.2) og hentingstastene er tildelt til hver tabell. Siden det er to nøkkelelementer i begge tabellene, kan det sies at hver tabell har sammensatte / komposittnøkler. Denne prosessen med normalisering har forenklet dataene.

2. Andre normale form:

I dette stadium av normalisering er alle ikke-nøkkelelementer som er fullt spesifisert av noe annet enn den komplette nøkkelen, plassert i et eget bord. Normalt er disse ikke-nøkkelelementene avhengig av bare en del av en sammensatt nøkkel.

Tatt i betraktning Tabell 1.1, en sammensatt nøkkel bestående av leverandør ID og innkjøpsordre nr. blir brukt. De ikke-nøkkelelementene som leverandørens navn og adresse er imidlertid bare avhengig av leverandør-ID og ikke på innkjøpsordre nr. Dermed er disse ikke-nøkkelde dataelementene plassert i separate tabeller sammen med nøkkeldataelement-leverandør-ID.

På samme måte er ikke-nøkkeldataelementene som dato, betalingsbetingelser og fraktbetingelser bare avhengig av bestillingsnummer. og dermed plasseres i et separat bord sammen med kjøpsordrenummer. som nøkkelelement. Nå har vi tre tabeller i stedet for tabell 1.1:

På samme måte kan vi dele tabell 1.2 ved å skille mellom nøkkelelementer som beskrivelse, måleenhet og pris, som bare er avhengig av en produktkode i et bord. På samme måte er produktkoden, mengden og mengden avhengig av bestillingsnummer og S. nr. Plassert i et eget bord.

Den andre normale form (2NF) er klar nå, og det er fem tabeller.

3. Tredje vanlig form:

Dette trinn av normalisering gjør det mulig å eliminere overflødige dataelementer og tabeller som er delsett av andre tabeller. De overflødige elementene er de ikke-nøkkelde dataelementene som er plassert i mer enn ett bord av de virtuelle dataelementene.

De virtuelle dataelementene er de elementene hvis verdi kan beregnes ved hjelp av andre elementer når og når verdien kreves. Verdien av mengden data element i tabell 1.2.2 kan beregnes ved å multiplisere mengden med prisen og dermed eliminere slike redundante dataelementer.

Hvis en annen tabell som heter leverandørens hovedtabell også opprettholdes i databasen, er det sannsynlig at tabell 1.1.2 vil være en del av leverandørens hovedtabell. Dermed kan også denne tabellen elimineres.

Den tredje normale formularen (3NF) tilbyr gruppering av data som er enkel, lett vedlikeholdbar og med minimum redundans.

Dermed kan normalisering bidra til å redusere redundans, samt eliminere andre anomalier i data. Tre-trinns normaliseringsprosessen diskutert ovenfor er bare suggestiv. Ytterligere forsøk kan utføres ved utforming av databaser, om nødvendig basert på dataens natur.