7.2C: Variação de Tamanho e Conteúdo ORF em Genomas

Objectivos de Aprendizagem

  • Explicar variação de tamanho do genoma procariótico e ORFs

Na genética molecular, um quadro de leitura aberto (ORF) é a parte de um quadro de leitura que não contém códones de paragem. O sítio de pausa de terminação da transcrição está localizado após o ORF, para além do códão de paragem da tradução, porque se a transcrição terminasse antes do códão de paragem, seria feita uma proteína incompleta durante a tradução.

Normalmente, as inserções que interrompem a moldura de leitura de uma região subsequente após o códão de início provocam a mutação de frameshift da sequência e deslocam as sequências para os códões de paragem.

Os frames de leitura abertos são utilizados como uma peça de prova para ajudar na previsão genética. Os ORF longos são frequentemente utilizados, juntamente com outras evidências, para identificar inicialmente as regiões candidatas à codificação de proteínas numa sequência de ADN. A presença de uma ORF não significa necessariamente que a região seja alguma vez traduzida. Por exemplo, numa sequência de ADN gerada aleatoriamente com uma percentagem igual de cada nucleótido, seria de esperar um codão de paragem uma vez em cada 21 códones. Um algoritmo simples de previsão genética para procariotas poderia procurar um códão de início seguido de um quadro de leitura aberto, suficientemente longo para codificar uma proteína típica, onde a utilização do códão dessa região corresponda à característica de frequência para as regiões codificadoras do organismo em questão. Mesmo um longo quadro de leitura aberto por si só não é prova conclusiva da presença de um gene.

image
Figure: Quadros de Leitura Abertos: A moldura +1 é a ORF prevista na base de dados para codificar uma proteína. +2 e +3 são os outros dois ORFs potenciais na mesma vertente e -1, -2, e -3 são os três ORFs potenciais na vertente antisense.

Se uma parte de um genoma tiver sido sequenciada (por exemplo 5′-ATCTAAAATGGGTGCC-3′), os ORFs podem ser localizados examinando cada um dos três quadros de leitura possíveis em cada vertente. Nesta sequência, dois dos três quadros de leitura possíveis estão totalmente abertos, o que significa que não contêm um códon de paragem:

…A TCT AAA ATG GGT GCC…

…AT CTA AAA TGG GTG CC…

…ATC TAA AAT GGG TGC C…

Códones de paragem possíveis no ADN são “TGA”, “TAA”, e “TAG”. Assim, o último quadro de leitura neste exemplo contém um códão de paragem (TAA), ao contrário dos dois primeiros.

Genomas bacterianos apresentam variação no tamanho, mesmo entre estirpes da mesma espécie. Estes microrganismos têm muito pouco DNA não codificante ou repetitivo, uma vez que a variação no tamanho do seu genoma reflecte geralmente diferenças no repertório genético. Algumas espécies, particularmente parasitas bacterianos e simbiontes, sofreram uma redução maciça do genoma e contêm simplesmente um subconjunto dos genes presentes nos seus antepassados.

No entanto, em bactérias de vida livre, tal perda de genes não pode explicar as disparidades observadas no tamanho do genoma porque os genomas ancestrais teriam de conter um número improvavelmente grande de genes. Surpreendentemente, uma fracção substancial da diferença no conteúdo de genes em bactérias de vida livre deve-se à presença de ORFans, ou seja, quadros de leitura abertos (ORFs) que não têm homólogos conhecidos e que, consequentemente, não têm nenhuma função conhecida.

Os números elevados de ORFans em genomas bacterianos indicam que, com excepção das espécies com genomas altamente reduzidos, grande parte da diversidade observada nos inventários de genes não resulta nem da perda de genes ancestrais nem da transferência de organismos bem caracterizados (processos que resultam numa distribuição desigual de ortologs mas não em genes únicos) ou de duplicações recentes (que provavelmente produziriam homólogos dentro do mesmo genoma ou de genomas estreitamente relacionados).

Pontos-chave

  • Abrir quadros de leitura são utilizados como uma prova para ajudar na previsão genética.
  • Se uma parte de um genoma tiver sido sequenciada, os ORFs podem ser localizados examinando cada um dos três quadros de leitura possíveis em cada filamento.
  • genomas bacterianos apresentam variação no tamanho, mesmo entre estirpes da mesma espécie.

Key Terms

  • gene: Uma unidade de hereditariedade; um segmento de ADN ou RNA que é transmitido de uma geração para a seguinte. Transporta informação genética tal como a sequência de aminoácidos para uma proteína.
  • codões: O código genético é o conjunto de regras pelas quais a informação codificada dentro do material genético (sequências de ADN ou mRNA) é traduzida em proteínas (sequências de aminoácidos) por células vivas. A descodificação biológica é realizada pelo ribossoma, que liga aminoácidos numa ordem especificada pelo mRNA, utilizando moléculas de transferência de RNA (tRNA) para transportar aminoácidos e para ler os três nucleótidos do mRNA de cada vez. O código genético é altamente semelhante entre todos os organismos, e pode ser expresso numa tabela simples com 64 entradas.
  • quadro de leitura aberto: Uma sequência de trigémeos de ADN, entre os códones iniciador e terminador, que pode ser transcrita em mRNA e posteriormente traduzida em proteínas.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *