Årsaker og metoder for genomsekvensering

Sekvensering av genomene er sofistikert, kompleks og krever spesialisert teknologi. Et segment på 500-800 bp kan sekvenseres. Men genomene er veldig store, f.eks. E. coli med 4, 2 x 10 6 bp og 3, 2 x 10 9 bp for mennesker.

Derfor er det nødvendig med små segmenter for sekvensering. Slike segmenter blir produsert ved å bryte genomisk DNA i små fragmenter tilfeldig. Slike fragmenter overlapper vanligvis andre fragmenter i sine ender. Fragmenter klones i en vektor for å generere et genomisk bibliotek av organisme.

Grunner til fullstendig sekvensering av et genom:

(i) Den gir informasjon som grunnlag for oppdagelsen av gener og gir oversikt over gener.

(ii) Det representerer mulige forhold mellom gener.

(iii) Sequencing av genomene gir et sett med verktøy for videre eksperimentering.

(iv) Genetisk informasjon av en organisme er gjort tilgjengelig fra gensekvens.

(v) Fullstendig genetisk sekvensering av en organisme gir all genetisk informasjon som kreves for å danne en organisme.

Metoder som brukes til genomsekvensering:

(i) Direkte sekvensering av Bacterial Artificial Chromosome (BAC) contigs:

Bakterielle kunstige kromosomer er bare plasmider designet for kloning av svært lange segmenter (dvs. 100.000 til 300.000 bp) av DNA. Disse vektorene brukes til å lage genomiske biblioteker der innsatsstørrelsen er 80-100 kb. DNA-fragmenter av tusenvis av basepar klones inn i BAC-vektoren.

Det genomiske biblioteket screenes ved å lokalisere vanlige restriksjonskloner som kalles contigs. Medlemmene av contig inneholder noen overlappende regioner for å tillate presis bestemmelse av deres plassering i contig.

Det endelige målet med fysiske kartleggingsmetoder er å motta en komplett contig for hvert kromosom av genomet. De kartlagte contigs sekvenseres ved å bryte store DNA-fragmenter i små segmenter. Hver klon av contig er sekvensert. Nukleotidsekvensen identifiseres alene på klonbasis til fullstendig genom blir sekvensert.

(ii) Tilfeldig haglgevangssekvensering eller Bottom up-tilnærming:

Det er mulig å klone i en organisme et hvilket som helst ønsket gen fra en annen organisme ved å skytte. For dette hele genomet av første organisme fordøyes med restriksjonsendonuklease for å produsere en tilfeldig blanding av fragmenter.

Tilfeldige (shotgim) biblioteker av genomisk DNA er konstruert i små dvs. 2, 0 kb og medium, dvs. 10 kb sette inn plasmidvektorer sammen med BAC-biblioteket med genomisk haglgevær (80-100 kb). Fragmenter settes inn i plasmidvektor og de rekombinante plasmider transformert til den ønskede vertscelle.

I skuddpistol-sekvensering sekventeres utvalgte kloner til kloner i det genomiske biblioteket analyseres. Med andre ord kan vi si at i tilfeldig skudd pistol sekvensering kromosomer er delt inn i seksjoner og deretter er delen av genomisk DNA brutt inn i millioner av små segmenter og alle segmentene er sekvensert på en upartisk måte.

Områder med overlappende DNA matches som dannet større og større segmenter av genomisk DNA. DNA-sekvensering utføres i begge ender av innsatsene av tilfeldig valgte kloner fra både små og mellomstore insert-plasmidbiblioteker for å gi minst tre ganger dekning av genomet.

Små DNA-fragmenter settes tilfeldig inn i forskjellige plasmidmolekyler. Ved overlappende innsatser kommer de alle fra samme genomiske plassering, men fra forskjellige regioner skiftes enten til venstre eller til høyre i forhold til hverandre.

De overlappende fragmentene er justert enten i coting eller i en sekvens for den berørte regionen (shot gun-metoden). Prokaryotiske genomene har lite respektive DNA- og skuddpistol-sekvensering gir gode resultater. Eukaryoter bærer mange gjentatte sekvenser.

Alt dette fører til forvirring. Overlapping av fragmenter utnyttes imidlertid i samlingsfasen ved beregningsøvelse. Dataprogram identifiserer de overlappende sekvensene og knytter dem til en kontinuerlig strekk. Denne prosessen har blitt brukt for å sekvensere alle mikrobielle genomsekvenser publisert av Celera Genomics.