Prosess av Gene Prediction og Counting

Prosess av Gene Prediction og Counting!

Annonse er en prosess som identifiserer gener, deres regulatoriske sekvenser og mulige funksjoner. Annonasjon indikerer de ikke-proteinkoding gener, kodende gener for r RNA, t RNA og nukleære RNAer, mobile genetiske elementer og repetitive sekvensfamilier tilstede i genom.

Oppgaveoppgave starter bare etter at genomsekvensen er oppnådd. Gene-prediksjon er et viktig problem for beregningsbiologi, og det finnes ulike logaritmer som kan brukes til genspåddelse ved å benytte identifiserte gener som et treningsdatasett.

Telling av gener blir vanskelig til tross for å vite posisjonen for gener av gener i et genom. Tilstedeværelse av overlappende gener og spleisvarianter gjør oppgaven vanskeligere. Det blir vanskelig å forutsi hvilke deler av DNA som skal betraktes som samme eller mange forskjellige gener.

Fig.6.70. En SNP-kart

Mange gener i eukaryoter bærer et mønster av exoner (kodende regioner) etterfulgt av introner (ikke-kodende regioner). På grunn av disse generene er ikke organisert som kontinuerlige ORFer (åpne leserammer). En ORF har en rekke kodoner som angir en aminosyresekvens.

Andre gener i eukaryoter er vanligvis vidt spredt, og derved har flere sjanser til å lokalisere falske gener. Men nye teknikker for ORF-skanningsprogramvare for eukaryotiske gener gjør skanning mer effektiv. Nå kan vi telle gener av en organisme (med noen eksperimentelle feil).

Det er sagt at ca 99, 8% av 3, 2 milliarder basepar mellom to mennesker er de samme og bare 0, 2% forskjellige. For hver 500 nukleotider er det bare ett nukleotid som er forskjellig mellom to personer. Det betyr at variasjon på noen få steder i DNA-sekvensen kan føre til alvorlig sykdom og forskjellige tegn hos mennesker.

Genomlikhet, SNP og Comparative Genomics:

Som allerede fortalt at 99, 8% av hvert menneskelig genom er lik alle andre menneskelige genom og 0, 2% forskjellige. Dette betyr at to personer bare er forskjellig på 6 millioner steder på 3, 2 milliarder steder.

Hvis disse stedene har liten effekt, vil to mennesker være identiske. Mennesker er mer enn 98% lik sjimpanser. Dermed vil forskjellen på få steder i DNA føre til at individet er unikt. For hver 500-1000 nukleotider varierer ett nukleotid mellom to individer.

Viktige variasjoner i individuelle genomene er enkelt nukleotidpolymorfier eller SNP, som er observert i både kodende og ikke-kodende regioner av genom. SNP er i utgangspunktet endring i enkeltbase dvs. A, C, G eller T som fører til DNA-variasjoner som fører til eksistensen av forskjellige bokstaver ved slike stillinger. Type nukleotid eller base tilstede ved et gitt sted på kromosom kan variere med varierende personer.

Det sies at - 90% av sekvensvariasjonen hos mennesker skyldes tilstedeværelse av SNPs. Således gir SNPer en molekylær markør som er tilstede i høy tetthet.

I DNA-fingerutskrift i spesielt ikke-kodende deler av genom utnyttes slike genetiske variasjoner mellom forskjellige mennesker.

Slike genetiske variasjoner er også ansvarlige for alvorlighetsgraden av sykdom og respons fra kroppen til behandling. En enkelt baseforskjell i Apo E-genet fører til Alzheimers sykdom og en sletting i CCRS (kjemokinreceptorgen) er ansvarlig for resistens av HW og AIDS.

SNPs brukes til å kartlegge gener som er involvert i menneskelige sykdommer. Ved å bruke SNP som markører, kan hvert gen i menneskelig genom bli kartlagt. SNP er enten plassert i genet eller kan vise stramt kobling.

Sekvensdata lagres i databaser og analyseres for å kjenne SNPene. DNA-chips og mikroarrays er utviklet for å identifisere SNPs. Leger ved hjelp av DNA-prøver av pasienter kan identifisere mønsteret av SNP genotype profil. Dermed er de i stand til å fortelle pasientens respons til bestemt type medisin.

Forgreningen av medisin som studerer effekten av genetisk variasjon på sykdomsfølsomhet og medisinrespons kalles farmakogenomikk.

Fordi få SNP er forskjellig i frekvens i forskjellige populasjoner, kan SNP-analyse brukes til studier av populasjonsgenetikk.

Det er interessant å merke seg at genomene av mus og mann ligner mye på hverandre (ca 97, 5%). Sjimpanse og humant genom skilles bare i forholdet 1 - 3%. Så det kan konkluderes med at det skyldes deling av felles forfed 100 millioner år siden, og ikke mye endring i genom har skjedd.

Fra disse små genetiske forskjellene oppstår det menneskelige variasjon som forskjeller i øyesyn, hårfarge, fotstørrelse etc. Noen av SNPene er knyttet til bestemte menneskelige populasjoner og gir informasjon om menneskelige migrasjoner som skjedde for flere år siden og om mer fjern evolusjonær fortid .