7.2C: Größenvariation und ORF-Inhalte in Genomen

Lernziele

  • Erläutern Sie die Größenvariation prokaryotischer Genome und ORFs

In der Molekulargenetik ist ein offenes Leseraster (ORF) der Teil eines Leserasters, der keine Stoppcodons enthält. Die Pausenstelle für die Transkription befindet sich nach dem ORF, jenseits des Stoppcodons für die Translation, denn würde die Transkription vor dem Stoppcodon enden, würde bei der Translation ein unvollständiges Protein entstehen.

Normalerweise führen Inserts, die das Leseraster einer nachfolgenden Region nach dem Startcodon unterbrechen, zu einer Frameshift-Mutation der Sequenz und verlagern die Sequenzen für die Stoppcodons.

Offene Leseraster werden als ein Beweismittel zur Unterstützung bei der Genvorhersage verwendet. Lange ORFs werden oft zusammen mit anderen Beweisen verwendet, um zunächst kandidierende proteincodierende Regionen in einer DNA-Sequenz zu identifizieren. Das Vorhandensein eines ORFs bedeutet nicht unbedingt, dass die Region jemals übersetzt wird. In einer zufällig generierten DNA-Sequenz mit gleichem prozentualem Anteil jedes Nukleotids würde man beispielsweise alle 21 Codons ein Stopp-Codon erwarten. Ein einfacher Algorithmus zur Genvorhersage für Prokaryonten könnte nach einem Startcodon suchen, gefolgt von einem offenen Leserahmen, der lang genug ist, um ein typisches Protein zu kodieren, wobei die Codon-Nutzung dieser Region mit der für die kodierenden Regionen des gegebenen Organismus charakteristischen Häufigkeit übereinstimmt. Selbst ein langer offener Leserahmen allein ist kein schlüssiger Beweis für das Vorhandensein eines Gens.

Bild
Abbildung: Open Reading Frames: Frame +1 ist der ORF, von dem in der Datenbank vorhergesagt wird, dass er für ein Protein kodiert. +2 und +3 sind die anderen beiden potentiellen ORFs im gleichen Strang und -1, -2 und -3 sind die drei potentiellen ORFs im Antisense-Strang.

Wenn ein Teil eines Genoms sequenziert wurde (z.B. 5′-ATCTAAAATGGGTGCC-3′), können die ORFs lokalisiert werden, indem jeder der drei möglichen Leserahmen auf jedem Strang untersucht wird. In dieser Sequenz sind zwei der drei möglichen Leserahmen vollständig offen, das heißt, sie enthalten kein Stoppcodon:

…A TCT AAA ATG GGT GCC…

…AT CTA AAA TGG GTG CC…

…ATC TAA AAT GGG TGC C…

Mögliche Stoppcodons in der DNA sind „TGA“, „TAA“ und „TAG“. Das letzte Leseraster in diesem Beispiel enthält also ein Stoppcodon (TAA), im Gegensatz zu den ersten beiden.

Bakterielle Genome zeigen Variationen in der Größe, sogar zwischen Stämmen der gleichen Spezies. Diese Mikroorganismen haben sehr wenig nicht-kodierende oder repetitive DNA, da die Variation in ihrer Genomgröße normalerweise Unterschiede im Genrepertoire widerspiegelt. Einige Arten, vor allem bakterielle Parasiten und Symbionten, haben eine massive Genomreduktion durchgemacht und enthalten nur eine Untermenge der Gene, die in ihren Vorfahren vorhanden waren.

Bei freilebenden Bakterien kann ein solcher Genverlust die beobachteten Unterschiede in der Genomgröße jedoch nicht erklären, da die Genome der Vorfahren eine unwahrscheinlich große Anzahl von Genen enthalten mussten. Überraschenderweise ist ein erheblicher Teil der Unterschiede in den Geninhalten freilebender Bakterien auf das Vorhandensein von ORFans zurückzuführen, d. h. von offenen Leserahmen (ORFs), die keine bekannten Homologe haben und folglich keine bekannte Funktion besitzen.

Die hohe Anzahl von ORFans in bakteriellen Genomen deutet darauf hin, dass – mit Ausnahme der Arten mit stark reduzierten Genomen – ein Großteil der beobachteten Vielfalt im Geninventar weder aus dem Verlust von Vorläufergenen noch aus dem Transfer von gut charakterisierten Organismen (Prozesse, die zu einer lückenhaften Verteilung von Orthologen, aber nicht zu einzigartigen Genen führen) oder aus rezenten Duplikationen (die wahrscheinlich Homologe innerhalb desselben oder eng verwandten Genoms ergeben würden) resultiert.

Schlüsselpunkte

  • Offene Leserahmen werden als ein Beweismittel zur Unterstützung der Genvorhersage verwendet.
  • Wenn ein Teil eines Genoms sequenziert wurde, können ORFs durch die Untersuchung jedes der drei möglichen Leserahmen auf jedem Strang lokalisiert werden.
  • Bakterielle Genome variieren in ihrer Größe, sogar zwischen Stämmen der gleichen Spezies.

Schlüsselbegriffe

  • Gen: Eine Einheit der Vererbung; ein Segment der DNA oder RNA, das von einer Generation zur nächsten weitergegeben wird. Es trägt die genetische Information, wie z.B. die Sequenz der Aminosäuren für ein Protein.
  • Codons: Der genetische Code ist der Satz von Regeln, nach denen die im genetischen Material (DNA- oder mRNA-Sequenzen) kodierte Information von lebenden Zellen in Proteine (Aminosäuresequenzen) übersetzt wird. Die biologische Dekodierung erfolgt durch das Ribosom, das die Aminosäuren in einer von der mRNA vorgegebenen Reihenfolge miteinander verknüpft, wobei Transfer-RNA-Moleküle (tRNA) zum Transport der Aminosäuren und zum Ablesen der mRNA drei Nukleotide auf einmal verwendet werden. Der genetische Code ist bei allen Organismen sehr ähnlich und kann in einer einfachen Tabelle mit 64 Einträgen ausgedrückt werden.
  • open reading frame: Eine Sequenz von DNA-Tripletts zwischen dem Initiator- und Terminator-Codon, die in mRNA transkribiert und später in Protein übersetzt werden kann.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.