7.2C: Size Variation and ORF Contents in Genomes

Cele nauczania

  • Wyjaśnić zmienność wielkości genomu prokariotycznego i ORF-y

W genetyce molekularnej, otwarta ramka odczytu (ORF) jest częścią ramki odczytu, która nie zawiera kodonów stop. Miejsce pauzy zakończenia transkrypcji znajduje się za ORF, poza kodonem stopu translacji, ponieważ gdyby transkrypcja ustała przed kodonem stopu, podczas translacji powstałoby niekompletne białko.

Normalnie inserty, które przerywają ramkę odczytu kolejnego regionu po kodonie startu, powodują mutację frameshift sekwencji i dyslokację sekwencji dla kodonów stopu.

Otwarte ramki odczytu są używane jako jeden z dowodów pomocnych w przewidywaniu genów. Długie ORF-y są często używane, wraz z innymi dowodami, do wstępnej identyfikacji regionów kodujących białka w sekwencji DNA. Obecność ORF nie musi oznaczać, że region ten jest kiedykolwiek tłumaczony. Na przykład, w losowo wygenerowanej sekwencji DNA o równym udziale procentowym każdego nukleotydu, kodon stop byłby oczekiwany raz na 21 kodonów. Prosty algorytm przewidywania genów u prokariotów może szukać kodonu startowego, po którym następuje otwarta ramka odczytu, wystarczająco długa, by zakodować typowe białko, gdzie użycie kodonów w tym regionie odpowiada częstotliwości charakterystycznej dla regionów kodujących danego organizmu. Nawet długa otwarta ramka odczytu sama w sobie nie jest rozstrzygającym dowodem na obecność genu.

image
Figure: Otwarte ramki odczytu: Ramka +1 to ORF przewidywany w bazie danych jako kodujący białko. +2 i +3 to pozostałe dwa potencjalne ORF-y w tej samej nici, a -1, -2 i -3 to trzy potencjalne ORF-y w nici antysensowej.

Jeśli część genomu została zsekwencjonowana (np. 5′-ATCTAAAATGGTGCC-3′), ORF-y mogą być zlokalizowane poprzez zbadanie każdej z trzech możliwych ramek odczytu na każdej nici. W tej sekwencji dwie z trzech możliwych ramek odczytu są całkowicie otwarte, co oznacza, że nie zawierają kodonu stop:

…A TCT AAA ATG GGT GCC…

…AT CTA AAA TGG GTG CC…

…ATC TAA AAT GGG TGC C…

Prawdopodobnymi kodonami stopu w DNA są „TGA”, „TAA” i „TAG”. Tak więc ostatnia ramka odczytu w tym przykładzie zawiera kodon stop (TAA), w przeciwieństwie do dwóch pierwszych.

Genomy bakterii różnią się wielkością, nawet wśród szczepów tego samego gatunku. Mikroorganizmy te mają bardzo mało niekodującego lub powtarzającego się DNA, a różnice w wielkości ich genomów zwykle odzwierciedlają różnice w repertuarze genów. Niektóre gatunki, szczególnie pasożyty bakteryjne i symbionty, przeszły masową redukcję genomu i zawierają po prostu podzbiór genów obecnych u ich przodków.

Jednakże u bakterii żyjących w stanie wolnym taka utrata genów nie może wyjaśnić obserwowanych różnic w wielkości genomu, ponieważ genomy przodków musiałyby zawierać nieprawdopodobnie dużą liczbę genów. Co zaskakujące, znaczna część różnic w zawartości genów u bakterii żyjących na wolności jest spowodowana obecnością ORFanów, czyli otwartych ramek odczytu (ORF), które nie mają znanych homologów i w konsekwencji nie mają znanej funkcji.

Wysoka liczba ORFanów w genomach bakterii wskazuje, że z wyjątkiem gatunków o bardzo zredukowanych genomach, duża część obserwowanej różnorodności w wykazach genów nie wynika ani z utraty genów przodków, ani z transferu z dobrze scharakteryzowanych organizmów (procesy, które skutkują nierównomiernym rozmieszczeniem ortologów, ale nie unikalnych genów), ani z niedawnych duplikacji (które prawdopodobnie dałyby homologi w obrębie tego samego lub blisko spokrewnionego genomu).

Kluczowe punkty

  • Otwarte ramki odczytu są wykorzystywane jako jeden z dowodów pomocnych w przewidywaniu genów.
  • Jeśli część genomu została zsekwencjonowana, ORF-y mogą być zlokalizowane poprzez zbadanie każdej z trzech możliwych ramek odczytu na każdej nici.
  • Genomy bakterii wykazują zróżnicowanie pod względem wielkości, nawet wśród szczepów tego samego gatunku.

Kluczowe pojęcia

  • gen: Jednostka dziedziczności; odcinek DNA lub RNA, który jest przekazywany z jednego pokolenia na następne. Przenosi on informację genetyczną, taką jak sekwencja aminokwasów dla białka.
  • kodony: Kod genetyczny to zestaw reguł, według których informacje zakodowane w materiale genetycznym (sekwencje DNA lub mRNA) są tłumaczone na białka (sekwencje aminokwasów) przez żywe komórki. Biologiczne dekodowanie jest dokonywane przez rybosom, który łączy aminokwasy w kolejności określonej przez mRNA, używając cząsteczek transferowego RNA (tRNA) do przenoszenia aminokwasów i odczytywania mRNA po trzy nukleotydy na raz. Kod genetyczny jest bardzo podobny u wszystkich organizmów i może być wyrażony w prostej tabeli zawierającej 64 pozycje.
  • otwarta ramka odczytu: Sekwencja trójek DNA, pomiędzy kodonami inicjatora i terminatora, która może być przepisana na mRNA, a następnie przetłumaczona na białko.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *