Obiettivi di apprendimento
- Spiegare la variazione delle dimensioni dei genomi procarioti e le ORF
In genetica molecolare, una cornice di lettura aperta (ORF) è la parte di una cornice di lettura che non contiene codoni di stop. Il sito di pausa per la terminazione della trascrizione si trova dopo l’ORF, oltre il codone di stop della traduzione, perché se la trascrizione dovesse cessare prima del codone di stop, durante la traduzione verrebbe prodotta una proteina incompleta.
Normalmente, gli inserti che interrompono il frame di lettura di una regione successiva al codone di inizio causano una mutazione frameshift della sequenza e dislocano le sequenze per i codoni di stop.
I frame di lettura aperti sono usati come un elemento di prova per assistere nella predizione del gene. Le ORF lunghe sono spesso usate, insieme ad altre prove, per identificare inizialmente le regioni candidate a codificare le proteine in una sequenza di DNA. La presenza di un ORF non significa necessariamente che la regione sia mai tradotta. Per esempio, in una sequenza di DNA generata a caso con una percentuale uguale di ogni nucleotide, ci si aspetterebbe un codone di stop una volta ogni 21 codoni. Un semplice algoritmo di predizione dei geni per i procarioti potrebbe cercare un codone iniziale seguito da un frame di lettura aperto abbastanza lungo da codificare una proteina tipica, dove l’uso del codone di quella regione corrisponde alla frequenza caratteristica delle regioni codificanti dell’organismo dato. Anche un lungo frame di lettura aperto da solo non è una prova conclusiva della presenza di un gene.
Se una porzione di genoma è stata sequenziata (ad esempio 5′-ATCTAAAATGGGTGCC-3′), gli ORF possono essere localizzati esaminando ciascuno dei tre possibili frame di lettura su ciascun filamento. In questa sequenza due delle tre possibili cornici di lettura sono interamente aperte, il che significa che non contengono un codone di stop:
…A TCT AAA ATG GGT GCC…
…AT CTA AAA TGG GTG CC…
…ATC TAA AAT GGG TGC C…
I possibili codoni di stop nel DNA sono “TGA”, “TAA” e “TAG”. Così, l’ultimo frame di lettura in questo esempio contiene un codone di stop (TAA), a differenza dei primi due.
I genomi batterici mostrano variazioni di dimensioni, anche tra ceppi della stessa specie. Questi microrganismi hanno pochissimo DNA non codificante o ripetitivo, poiché la variazione nella dimensione del loro genoma di solito riflette le differenze nel repertorio genico. Alcune specie, in particolare i parassiti e i simbionti batterici, hanno subito una massiccia riduzione del genoma e contengono semplicemente un sottoinsieme dei geni presenti nei loro antenati.
Tuttavia, nei batteri a vita libera, tale perdita genica non può spiegare le disparità osservate nelle dimensioni del genoma perché i genomi ancestrali avrebbero dovuto contenere un numero improbabile di geni. Sorprendentemente, una frazione sostanziale della differenza nel contenuto dei geni nei batteri viventi liberi è dovuta alla presenza di ORFans, cioè cornici di lettura aperte (ORFs) che non hanno omologhi noti e di conseguenza non hanno funzioni note.
L’alto numero di ORFans nei genomi batterici indica che, con l’eccezione di quelle specie con genomi altamente ridotti, gran parte della diversità osservata negli inventari genici non deriva dalla perdita di geni ancestrali o dal trasferimento da organismi ben caratterizzati (processi che risultano in una distribuzione disomogenea di ortogoni ma non in geni unici) o da duplicazioni recenti (che probabilmente produrrebbero omologhi all’interno dello stesso genoma o di geni strettamente correlati).
Punti chiave
- Le cornici di lettura aperte sono usate come un elemento di prova per assistere nella predizione del gene.
- Se una porzione di genoma è stata sequenziata, le ORF possono essere localizzate esaminando ciascuna delle tre possibili cornici di lettura su ogni filamento.
- I genomi batterici mostrano variazioni di dimensioni, anche tra ceppi della stessa specie.
Termini chiave
- gene: Un’unità dell’ereditarietà; un segmento di DNA o RNA che viene trasmesso da una generazione alla successiva. Trasporta informazioni genetiche come la sequenza di aminoacidi per una proteina.
- codoni: Il codice genetico è l’insieme delle regole con cui le informazioni codificate nel materiale genetico (sequenze di DNA o mRNA) sono tradotte in proteine (sequenze di amminoacidi) dalle cellule viventi. La decodifica biologica è compiuta dal ribosoma, che collega gli aminoacidi in un ordine specificato dall’mRNA, usando molecole di RNA di trasferimento (tRNA) per trasportare gli aminoacidi e leggere l’mRNA tre nucleotidi alla volta. Il codice genetico è molto simile tra tutti gli organismi e può essere espresso in una semplice tabella con 64 voci: Una sequenza di triplette di DNA, tra i codoni iniziatore e terminatore, che può essere trascritta in mRNA e successivamente tradotta in proteine.