7.2C: Variación de tamaño y contenido de los ORF en los genomas

Objetivos de aprendizaje

  • Explicar la variación de tamaño del genoma procariota y los ORF

En genética molecular, un marco de lectura abierto (ORF) es la parte de un marco de lectura que no contiene codones de parada. El sitio de pausa para la terminación de la transcripción se encuentra después del ORF, más allá del codón de parada de la traducción, porque si la transcripción cesara antes del codón de parada, se haría una proteína incompleta durante la traducción.

Normalmente, las inserciones que interrumpen el marco de lectura de una región posterior al codón de inicio provocan una mutación de desplazamiento de marco de la secuencia y dislocan las secuencias para los codones de parada.

Los marcos de lectura abiertos se utilizan como una pieza de evidencia para ayudar en la predicción de genes. Los ORF largos se utilizan a menudo, junto con otras pruebas, para identificar inicialmente las regiones candidatas a codificar proteínas en una secuencia de ADN. La presencia de un ORF no significa necesariamente que la región se traduzca. Por ejemplo, en una secuencia de ADN generada aleatoriamente con un porcentaje igual de cada nucleótido, se esperaría un código de parada cada 21 codones. Un simple algoritmo de predicción de genes para procariotas podría buscar un codón de inicio seguido de un marco de lectura abierto lo suficientemente largo como para codificar una proteína típica, donde el uso de codones de esa región coincide con la frecuencia característica de las regiones codificantes del organismo en cuestión. Incluso un marco de lectura abierto largo por sí mismo no es una prueba concluyente de la presencia de un gen.

image
Figura: Marcos de lectura abiertos: El marco +1 es el ORF predicho en la base de datos para codificar una proteína. +2 y +3 son los otros dos ORF potenciales en la misma cadena y -1, -2 y -3 son los tres ORF potenciales en la cadena antisentido.

Si se ha secuenciado una parte de un genoma (por ejemplo, 5′-ATCTAAAATGGGTGCC-3′), los ORF pueden localizarse examinando cada uno de los tres posibles marcos de lectura en cada cadena. En esta secuencia, dos de los tres posibles marcos de lectura están completamente abiertos, lo que significa que no contienen un codón de parada:

…A TCT AAA ATG GGT GCC…

…AT CTA AAA TGG GTG CC…

…ATC TAA AAT GGG TGC C…

Los posibles codones de parada en el ADN son «TGA», «TAA» y «TAG». Así, el último marco de lectura de este ejemplo contiene un codón de parada (TAA), a diferencia de los dos primeros.

Los genomas bacterianos presentan variaciones de tamaño, incluso entre cepas de la misma especie. Estos microorganismos tienen muy poco ADN no codificante o repetitivo, ya que la variación del tamaño de su genoma suele reflejar diferencias en el repertorio de genes. Algunas especies, en particular los parásitos y simbiontes bacterianos, han sufrido una reducción masiva del genoma y simplemente contienen un subconjunto de los genes presentes en sus ancestros.

Sin embargo, en las bacterias de vida libre, esta pérdida de genes no puede explicar las disparidades observadas en el tamaño del genoma, ya que los genomas ancestrales habrían tenido que contener un número improbable de genes. Sorprendentemente, una fracción sustancial de la diferencia en el contenido de los genes en las bacterias de vida libre se debe a la presencia de ORFans, es decir, marcos de lectura abiertos (ORFs) que no tienen homólogos conocidos y que, en consecuencia, no tienen función conocida.

El elevado número de ORFans en los genomas bacterianos indica que, con la excepción de aquellas especies con genomas muy reducidos, gran parte de la diversidad observada en los inventarios de genes no es resultado ni de la pérdida de genes ancestrales ni de la transferencia desde organismos bien caracterizados (procesos que dan lugar a una distribución irregular de ortólogos pero no a genes únicos) ni de duplicaciones recientes (que probablemente darían lugar a homólogos dentro del mismo genoma o de otros estrechamente relacionados).

Puntos clave

  • Los marcos de lectura abiertos se utilizan como una prueba para ayudar a la predicción de genes.
  • Si se ha secuenciado una parte de un genoma, los ORF pueden localizarse examinando cada uno de los tres marcos de lectura posibles en cada cadena.
  • Los genomas bacterianos presentan variaciones de tamaño, incluso entre cepas de la misma especie.
Términos clave

  • Gen: Una unidad de la herencia; un segmento de ADN o ARN que se transmite de una generación a otra. Lleva información genética, como la secuencia de aminoácidos de una proteína.
  • Codones: El código genético es el conjunto de reglas por las que la información codificada dentro del material genético (secuencias de ADN o ARNm) es traducida en proteínas (secuencias de aminoácidos) por las células vivas. La descodificación biológica la realiza el ribosoma, que une los aminoácidos en un orden especificado por el ARNm, utilizando moléculas de ARN de transferencia (ARNt) para transportar los aminoácidos y leer el ARNm de tres en tres nucleótidos. El código genético es muy similar entre todos los organismos, y puede expresarse en una simple tabla con 64 entradas.
  • Marco de lectura abierto: Secuencia de tripletes de ADN, entre los codones iniciador y terminador, que puede ser transcrita a ARNm y posteriormente traducida a proteína.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *