Cada minuto en 2018, Google realizó 3,88 millones de búsquedas, y la gente vio 4,33 millones de vídeos en YouTube, envió 159.362.760 correos electrónicos, tuiteó 473.000 veces y publicó 49.000 fotos en Instagram, según la empresa de software Domo. Se calcula que en 2020 se crearán 1,7 megabytes de datos por segundo y por persona en todo el mundo, lo que se traduce en unos 418 zettabytes en un solo año (418.000 millones de discos duros de un terabyte de información), suponiendo una población mundial de 7.800 millones. Los sistemas de almacenamiento de datos magnéticos u ópticos que actualmente contienen este volumen de 0s y 1s no pueden durar más de un siglo, si es que lo hacen. Además, el funcionamiento de los centros de datos requiere enormes cantidades de energía. En resumen, estamos a punto de tener un grave problema de almacenamiento de datos que sólo se agravará con el tiempo.
Una alternativa a los discos duros está progresando: El almacenamiento de datos basado en el ADN. El ADN -que consiste en largas cadenas de nucleótidos A, T, C y G- es el material de almacenamiento de información de la vida. Los datos pueden almacenarse en la secuencia de estas letras, lo que convierte al ADN en una nueva forma de tecnología de la información. Ya se puede secuenciar (leer), sintetizar (escribir) y copiar con precisión con facilidad. Además, el ADN es increíblemente estable, como ha demostrado la secuenciación completa del genoma de un caballo fósil que vivió hace más de 500.000 años. Y almacenarlo no requiere mucha energía.
Pero es la capacidad de almacenamiento lo que brilla. El ADN puede almacenar con precisión cantidades masivas de datos a una densidad que supera con creces la de los dispositivos electrónicos. La simple bacteria Escherichia coli, por ejemplo, tiene una densidad de almacenamiento de unos 1019 bits por centímetro cúbico, según los cálculos publicados en 2016 en Nature Materials por George Church, de la Universidad de Harvard, y sus colegas. Con esa densidad, todas las necesidades actuales de almacenamiento del mundo durante un año podrían quedar bien satisfechas con un cubo de ADN de aproximadamente un metro de lado.
La perspectiva del almacenamiento de datos de ADN no es meramente teórica. En 2017, por ejemplo, el grupo de Church en Harvard adoptó la tecnología de edición de ADN CRISPR para grabar imágenes de una mano humana en el genoma de E. coli, que se leyeron con una precisión superior al 90%. Y los investigadores de la Universidad de Washington y Microsoft Research han desarrollado un sistema totalmente automatizado para escribir, almacenar y leer datos codificados en el ADN. Varias empresas, entre ellas Microsoft y Twist Bioscience, están trabajando en el avance de la tecnología de almacenamiento de ADN.
Mientras tanto, el ADN ya está siendo utilizado para gestionar datos de una manera diferente, por los investigadores que luchan por dar sentido a enormes volúmenes de datos. Los recientes avances en las técnicas de secuenciación de nueva generación permiten leer fácil y simultáneamente miles de millones de secuencias de ADN. Con esta capacidad, los investigadores pueden emplear la codificación de barras -el uso de secuencias de ADN como «etiquetas» de identificación molecular- para hacer un seguimiento de los resultados experimentales. La codificación de barras de ADN se utiliza ahora para acelerar drásticamente el ritmo de la investigación en campos como la ingeniería química, la ciencia de los materiales y la nanotecnología. En el Instituto de Tecnología de Georgia, por ejemplo, el laboratorio de James E. Dahlman está identificando rápidamente terapias genéticas más seguras; otros están averiguando cómo combatir la resistencia a los medicamentos y prevenir la metástasis del cáncer.
Entre los retos para que el almacenamiento de datos de ADN se convierta en algo común se encuentran los costes y la velocidad de lectura y escritura del ADN, que tienen que bajar aún más si se quiere competir con el almacenamiento electrónico. Aunque el ADN no se convierta en un material de almacenamiento omnipresente, es casi seguro que se utilizará para generar información a escalas totalmente nuevas y preservar ciertos tipos de datos a largo plazo.