Genomics: Strukturelle og funksjonelle studier av genomforskning

Genomics: Strukturelle og funksjonelle studier av genomforskning!

Begrepet genom ble introdusert av H. Winkler (1920) for å betegne det komplette settet av kromosomale og ekstra kromosomale gener som er tilstede i en organisme, inkludert et virus.

Begrepet genomics utarbeidet av TH Roderick (1987) betyr kartlegging og sekvensering for å analysere strukturen og organisasjonen av genomene. Men for tiden genomics inkluderer sekvensering av genomer, bestemmelse av det komplette settet av proteiner kodet av en organisme, og funksjonen av gener og metabolske veier i en organisme.

Studien av genomikk er delt inn i følgende to domener:

1. Strukturell genomikk omhandler bestemmelsen av den komplette sekvensen av genomene eller det komplette settet av proteiner fremstilt av en organisme. De forskjellige trinnene involvert er: (i) konstruksjon av genetisk og fysisk kart med høy oppløsning, (ii) sekvensering av genomet, og (iii) bestemmelse av det komplette settet av proteiner i en organisme. Det inkluderer også bestemmelsen av de tredimensjonale strukturer av de berørte proteinene.

2. Funksjonell genomikk undersøker funksjonen av gener og metabolske veier, dvs. genuttrykksmønstre i organismer.

Sekvensering av genomene:

Sekvensering av genomene er en svært sofistikert og teknisk krevende prosess. På en gang kan et fragment på 500-600 bp sekvenseres. I motsetning er genomene ekstremt store, f.eks. 4, 2 x 10 6 for E. coli og 3, 2 x 10 9 bp for mennesker. Derfor må sekvensen av genoksne oppnås i et ekstremt stort antall små stykker, og disse bitene blir deretter samlet i en sekvens for genomet.

Brikkene som brukes for sekvensering, genereres ved å bryte det genomiske DNA i fragmenter ved tilfeldige punkter. Som et resultat må plasseringen av fragmentet i genomet være eksperimentelt bestemt. Alle fragmentene oppnådd fra genomisk DNA av en organisme klones i en passende vektor, dette genererer et genomisk bibliotek av organismen. De to tilnærmingene til sekvensering av genomene er: (a) klon-for-klon-sekvensering og (b) shot-gun-sekvensering.

(a) Clone-by Clone Sequencing:

I denne metoden blir fragmentene først justert i contigs også kalt som rettet sekvensering av BAC contigs. En contig består av en serie kloner som inneholder overlappende stykker DNA som konverterer en spesifikk region av et kromosom eller til og med hele kromosomet. De er vanligvis konstruert ved hjelp av BAC (bakteriell kunstig kromosom) og kosmidkloner.

Den generelle tilnærmingen ved dannelsen av contigs er å identifisere klonene som har tilstøtende DNA-segmenter fra kromosomet, for eksempel kromosomvandring, kromosomhopping etc. Dermed må medlemmene av en contig inneholde samme overlappende region for å tillate nøyaktig bestemmelse av deres plassering - i kontingenten Det endelige målet med fysiske kartleggingsprosedyrer er å oppnå en komplett contig for hvert kromosom av genomet.

De klonede DNA-fragmentene av en contig kan korreleres med steder langs et kromosom oppnådd fra binding eller cytogenetisk kartlegging. Dette kan oppnås ved å identifisere medlemmer av contig som inneholder innlegg som har slike gener som allerede er kartlagt ved kobling eller cytologiske metoder. Dette ville muliggjøre tilpasningen av de andre medlemmer av sammenføyningen langs kromosomet. Alternativt kan RFLP (restriksjon fragment lengde polymorphism) og andre DNA markører brukes til å korrelere plasseringene i et koblings kart med medlemmer av en contig.

(b) Shot-Gun Sequencing:

I denne tilnærmingen sekvenseres utvalgte kloner til alle kloner i det genomiske biblioteket analyseres. Assembler-programvare organiserer nukleotidsekvensinformasjonen slik oppnådd i en genomsekvens. Denne strategien fungerer veldig bra med prokaryotiske genomer som har lite repeterende DNA. Men eukaryotiske genomene har mange gjentatte sekvenser som skaper forvirring i tilpasningen av sekvensen. Disse problemene løses ved å bruke enorme databehandlingskrefter, spesialisert programvare og unngå slike regioner som er rikt på repeterende DNA (f.eks. Sentromeriske og telomeriske regioner).

Genom sekvens kompilering:

Genomsekvenseringsprosjekter nødvendiggjorde utvikling av høye gjennomstrømningsteknologier som genererer data med en meget rask hastighet. Dette nødvendiggjorde bruken av datamaskiner til å håndtere denne flom av informasjon og har født en ny disiplin kalt bioinformatikk. Bioinformatikk omhandler lagring, analyse, tolkning og utnyttelse av informasjonen om biologiske systemer (aktiviteter som kompilering av genometsekvenser, identifikasjon av gener, tildeling av funksjoner til identifiserte gener, utarbeidelse av databaser, etc.).

For å sikre at nukleotidsekvensen av et genom er fullstendig og feilfritt, sekvenseres sekvensen mer enn en gang. Når genomet av en organisme er sekvensert, kompilert og korrekturleset (korrigering av feilene), begynner neste fase av genomikk, nemlig annotasjon.

Gene Prediction and Counting:

Etter at en genomsekvens er oppnådd og kontrollert for nøyaktighet, er neste oppgave å finne alle gener som koder for proteiner. Dette er det første trinnet i annotasjonen. Annotasjon er en prosess som identifiserer gener, deres regulatoriske sekvenser og deres funksjon (er). Den identifiserer også ikke-proteinkoding gener, inkludert de som kodes for r-RNA, t-RNA og små kjernefysiske RNAer. I tillegg er mobile genetiske elementer og repeterende sekvensfamilier identifisert og karakterisert.

Locating protein-kodende gener er gjort ved å inspisere sekvensen, ved hjelp av en dataprogramvare eller ved øyet. Protein-kodende gener identifiseres ved åpne leserammer (ORFer). En ORF har en serie en kodon som angir en aminosyresekvens, den begynner med et initieringskodon (vanligvis ATG) og slutter med en termineringskodon (TAA) TAG eller TGA). ORF-er identifiseres vanligvis av en datamaskin og er en effektiv metode for bakterielle genomer.

Gener i eukaryotiske genomene (inkludert det menneskelige genomet) har flere funksjoner som gjør direkte søk mindre nyttig. For det første har de fleste eukaryote gener et mønster av exoner (kodende regioner) vekslet med introner (ikke-kodende regioner). Som et resultat er disse gener ikke organisert som kontinuerlige ORFer. For det andre er gener i mennesker og andre eukaryoter ofte vidt spredt og øker dermed sjansene for å finne falske gener. Men nyere versjoner av ORF-skanningsprogramvare for eukaryotiske genomer gjør skanning mer effektiv.

Etter at en genomisk sekvens er analysert og gener er spådd, blir hvert gen undersøkt en om gangen for å identifisere funksjonen til det kodede genprodukt og klassifisert i funksjonelle grupper. Denne analysen omfatter flere programmer. For eksempel kan man søke databaser som Gene Bank, for å finne lignende gener som er isolert fra andre organismer. De forutsagte ORFene kan sammenlignes med de fra kjente, godt karakteriserte bakteriegener. Til slutt kan man se etter slike nukleotidsekvenser for funksjonsmotiver som koder for proteindomener som er involvert i bestemte funksjoner.

Dermed er målet med genomanalyse å bestemme funksjonene til alle genene og å forstå hvordan disse generene samhandler med organismens utvikling og funksjon.

Funksjonell genomikk:

Det kan defineres som bestemmelse av funksjonen til alle genprodukter kodet av genomet av en organisme. Den inneholder følgende parametere: (1) når og hvor bestemte gener uttrykkes (uttrykksprofilering), (ii) funksjonene til spesifikke gener ved selektivt mutasjon av de ønskede gener, og (iii) interaksjonene som finner sted mellom proteiner og mellom protein og andre molekyler. Funksjonell genomikk forsøker å undersøke alle de gener som er tilstede i genomet på en gang. Derfor tillater teknikkene som brukes i funksjonell genomikk analyse av høy gjennomstrømning som muliggjør en meget rask dataakkumulering.

(i) Ekspresjonsprofilering:

Bestemmelse av celletyper / vev hvor et gen uttrykkes, samt når genet uttrykkes, kalles uttrykksprofilering. Formålet med funksjonell genomikk er å studere uttrykksmønsteret for alle de gener som er tilstede i genomet samtidig; dette kalles global uttrykk profilering. Dette kan gjøres enten på RNA-nivå eller på proteinnivå. På RNA-nivået kan man enten bruke direkte sekvensprøvetaking eller DNA-arrays.

På proteinnivået kan man bruke enten todimensjonal elektroforese, etterfulgt av massespektrometri eller proteinarrayer. Global uttrykksprofilering gir innsikt i komplekse biologiske fenomener, inkludert differensiering, respons på stress, sykdomsutbrudd etc. Det gir også en ny måte å definere cellulære fenotyper på.

(ii) Gene Funksjon Bestemmelse:

Et viktig aspekt ved funksjonell genomikk er å bestemme funksjonen til bestemte gener / anonyme sekvenser. En potensiell måte er å oppnå dette er å klone genet, mutere det in vitro og gjeninnføre det muterte genet i vertsorganismen og analysere dens effekt. Genom under mutantbiblioteker er utviklet i flere modellorganismer som bakterier, gjær, planter og pattedyr. Dette er noen ganger referert til som mutasjonell genomikk. Et slikt bibliotek kan genereres på en av følgende tre måter:

(a) Systematisk mutasjon av hvert enkelt gen en til tid som vil generere en bank med spesifikke mutantstammer.

(b) I tilfeldige tilnærmingen blir gener mutert, uavhengig av hverandre, individuelle mutasjoner karakteriseres og katalogiseres deretter.

(c) I denne tilnærmingen brukes en gruppe teknikker for å forhindre ekspresjon av spesifikke / grupper av gener.

(iii) Proteininteraksjoner:

Gene-funksjonen gjenspeiler oppførselen til proteiner kodet av dem. Denne oppførselen kan sees som en serie interaksjoner mellom forskjellige proteiner, og mellom proteiner og andre molekyler. Proteininteraksjoner studeres ved bruk av høye gjennomstrømningsteknikker. En rekke biblioteksbaserte proteininteraksjonsmapping-metoder tillater at hundrevis eller tusenvis av proteiner blir screenet om gangen. Disse interaksjonene kan analyseres in vitro eller in vivo. Proteininteraksjonsdata fra forskjellige kilder assimileres i databaser.