7.2C: Size Variation and ORF Contents in Genomes

Leerdoelen

  • Klarin prokaryotic genome size variation and ORFs

In de moleculaire genetica is een open leesframe (ORF) het deel van een leesframe dat geen stopcodons bevat. De pauzeplaats voor het beëindigen van de transcriptie bevindt zich na het ORF, voorbij het stopcodon voor translatie, want als de transcriptie vóór het stopcodon zou stoppen, zou tijdens de translatie een onvolledig eiwit worden gemaakt.

Normaal gesproken veroorzaken inserts die het leesraam van een volgende regio na het startcodon onderbreken, een frameshift-mutatie van de sequentie en worden de sequenties voor stopcodons ontwricht.

Open leesramen worden gebruikt als een bewijsstuk om te helpen bij genvoorspelling. Lange ORF’s worden, samen met ander bewijsmateriaal, vaak gebruikt om in eerste instantie kandidaat-eiwitcoderende regio’s in een DNA-sequentie te identificeren. De aanwezigheid van een ORF betekent niet noodzakelijk dat de regio ooit vertaald wordt. Bijvoorbeeld, in een willekeurig gegenereerde DNA sequentie met een gelijk percentage van elke nucleotide, zou een stop-codon verwacht worden eens in de 21 codons. Een eenvoudig genvoorspellingsalgoritme voor prokaryoten zou kunnen zoeken naar een startcodon gevolgd door een open leesraam dat lang genoeg is om een typisch eiwit te coderen, waarbij het codongebruik van die regio overeenkomt met de frequentie die kenmerkend is voor de coderende regio’s van het gegeven organisme. Zelfs een lang open leesraam op zich is geen afdoend bewijs voor de aanwezigheid van een gen.

image
Figuur: Open leesramen: Frame +1 is de ORF waarvan in de database is voorspeld dat hij een eiwit codeert. +2 en +3 zijn de andere twee potentiële ORF’s in dezelfde streng en -1, -2 en -3 zijn de drie potentiële ORF’s in de antisense streng.

Als een deel van een genoom gesequenced is (bijv. 5′-ATCTAAAATGGGTGCC-3′), kunnen ORF’s worden gelokaliseerd door elk van de drie mogelijke leesramen op elke streng te onderzoeken. In deze sequentie zijn twee van de drie mogelijke leesramen volledig open, wat betekent dat ze geen stopcodon bevatten:

…A TCT AAA ATG GGT GCC…

…AT CTA AAA TGG GTG CC…

…ATC TAA AAT GGG TGC C…

Mogelijke stopcodons in DNA zijn “TGA”, “TAA”, en “TAG”. Het laatste leesraam in dit voorbeeld bevat dus een stopcodon (TAA), in tegenstelling tot de eerste twee.

Bacteriële genomen vertonen variatie in grootte, zelfs tussen stammen van dezelfde soort. Deze micro-organismen hebben zeer weinig niet-coderend of repeterend DNA, zodat de variatie in hun genoomgrootte meestal een weerspiegeling is van verschillen in genrepertoire. Sommige soorten, met name bacteriële parasieten en symbionten, hebben een massale genoomverkleining ondergaan en bevatten slechts een subset van de genen die in hun voorouders aanwezig waren.

Bij vrijlevende bacteriën echter kan een dergelijk genverlies de waargenomen verschillen in genoomgrootte niet verklaren, omdat de voorouderlijke genomen dan onwaarschijnlijk grote aantallen genen zouden moeten bevatten. Verrassend genoeg is een substantieel deel van het verschil in geninhoud in vrij levende bacteriën te wijten aan de aanwezigheid van ORFans, dat wil zeggen open leesramen (ORFs) waarvan geen homologs bekend zijn en die bijgevolg geen bekende functie hebben.

De grote aantallen ORF’s in bacteriële genomen wijzen erop dat, met uitzondering van soorten met sterk gereduceerde genomen, veel van de waargenomen diversiteit in geninventarissen niet het gevolg is van het verlies van voorouderlijke genen of de overdracht van goed gekarakteriseerde organismen (processen die resulteren in een fragmentarische verdeling van orthologe maar niet in unieke genen) of van recente duplicaties (die waarschijnlijk homologe genen zouden opleveren binnen hetzelfde of een nauw verwant genoom).

Kernpunten

  • Open reading frames worden gebruikt als één bewijsstuk om te helpen bij genvoorspelling.
  • Als een deel van een genoom gesequenced is, kunnen ORF’s worden gelokaliseerd door elk van de drie mogelijke reading frames op elke streng te onderzoeken.
  • Bacteriële genomen vertonen variatie in grootte, zelfs tussen stammen van dezelfde soort.

Key Terms

  • gen: Een eenheid van erfelijkheid; een segment van DNA of RNA dat van de ene generatie op de volgende wordt overgedragen. Het draagt genetische informatie, zoals de volgorde van aminozuren voor een eiwit.
  • codons: De genetische code is de reeks regels waarmee informatie die is gecodeerd binnen genetisch materiaal (DNA- of mRNA-sequenties) door levende cellen wordt vertaald in eiwitten (aminozuursequenties). Biologische decodering wordt bereikt door het ribosoom, dat aminozuren verbindt in een door het mRNA gespecificeerde volgorde, met behulp van transfer RNA (tRNA) moleculen om aminozuren te dragen en het mRNA drie nucleotiden per keer te lezen. De genetische code is zeer vergelijkbaar tussen alle organismen, en kan worden uitgedrukt in een eenvoudige tabel met 64 entries.
  • open reading frame: Een sequentie van DNA tripletten, tussen de initiator en terminator codons, die kan worden getranscribeerd in mRNA en later vertaald in eiwit.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *