Elke minuut in 2018 voerde Google 3,88 miljoen zoekopdrachten uit, en bekeken mensen 4,33 miljoen video’s op YouTube, verstuurden 159.362.760 e-mails, tweetten 473.000 keer en plaatsten 49.000 foto’s op Instagram, volgens softwarebedrijf Domo. Tegen 2020 zal er wereldwijd naar schatting 1,7 megabyte aan gegevens per seconde per persoon worden gecreëerd, wat neerkomt op ongeveer 418 zettabytes in één jaar (418 miljard harde schijven van één terabyte aan informatie), uitgaande van een wereldbevolking van 7,8 miljard. De magnetische of optische gegevensopslagsystemen die momenteel deze hoeveelheid 0’s en 1’s bevatten, kunnen doorgaans niet langer dan een eeuw meegaan, als dat al het geval is. Bovendien kost het runnen van datacentra enorme hoeveelheden energie. Kortom, we staan op het punt een ernstig data-opslagprobleem te krijgen, dat in de loop der tijd alleen maar groter zal worden.
Een alternatief voor harde schijven is in opkomst: Op DNA gebaseerde gegevensopslag. DNA – dat bestaat uit lange ketens van de nucleotiden A, T, C en G – is het informatie-opslagmateriaal van het leven. Gegevens kunnen worden opgeslagen in de volgorde van deze letters, waardoor DNA een nieuwe vorm van informatietechnologie wordt. Het wordt al routinematig gesequenced (gelezen), gesynthetiseerd (beschreven) en nauwkeurig gekopieerd met gemak. DNA is ook ongelooflijk stabiel, zoals is aangetoond door de volledige sequentiebepaling van het genoom van een fossiel paard dat meer dan 500.000 jaar geleden leefde. En het opslaan ervan vergt niet veel energie.
Maar het is de opslagcapaciteit die schittert. DNA kan nauwkeurig enorme hoeveelheden gegevens opslaan met een dichtheid die veel groter is dan die van elektronische apparaten. De eenvoudige bacterie Escherichia coli, bijvoorbeeld, heeft een opslagdichtheid van ongeveer 1019 bits per kubieke centimeter, volgens berekeningen gepubliceerd in 2016 in Nature Materials door George Church van Harvard University en zijn collega’s. Bij die dichtheid zou in alle huidige opslagbehoeften van de wereld voor een jaar goed kunnen worden voorzien door een kubus DNA van ongeveer een meter aan een kant.
Het vooruitzicht van DNA-gegevensopslag is niet louter theoretisch. In 2017, bijvoorbeeld, gebruikte Church’s groep aan Harvard CRISPR DNA-editing technologie om beelden van een menselijke hand vast te leggen in het genoom van E. coli, die werden uitgelezen met een nauwkeurigheid van meer dan 90 procent. Onderzoekers van de Universiteit van Washington en Microsoft Research hebben een volledig geautomatiseerd systeem ontwikkeld voor het schrijven, opslaan en lezen van in DNA gecodeerde gegevens. Een aantal bedrijven, waaronder Microsoft en Twist Bioscience, werkt aan de verbetering van de DNA-opslagtechnologie.
DNA wordt intussen al op een andere manier gebruikt om gegevens te beheren, namelijk door onderzoekers die worstelen met de betekenis van enorme hoeveelheden gegevens. Recente ontwikkelingen op het gebied van next-generation sequencing-technieken maken het mogelijk miljarden DNA-sequenties gemakkelijk en gelijktijdig af te lezen. Hierdoor kunnen onderzoekers gebruik maken van streepjescodering – het gebruik van DNA-sequenties als moleculaire identificatie-“labels” – om de experimentele resultaten bij te houden. DNA-barcodes worden nu gebruikt om het onderzoek op gebieden zoals chemische engineering, materiaalwetenschappen en nanotechnologie drastisch te versnellen. Aan het Georgia Institute of Technology, bijvoorbeeld, identificeert het laboratorium van James E. Dahlman snel veiliger gentherapieën; anderen zoeken uit hoe ze resistentie tegen geneesmiddelen kunnen bestrijden en uitzaaiingen bij kanker kunnen voorkomen.
Een van de uitdagingen om DNA-gegevensopslag gemeengoed te maken zijn de kosten en de snelheid van het lezen en schrijven van DNA, die nog verder moeten dalen als de aanpak wil concurreren met elektronische opslag. Zelfs als DNA geen alomtegenwoordig opslagmateriaal wordt, zal het vrijwel zeker worden gebruikt voor het genereren van informatie op geheel nieuwe schalen en voor het langdurig bewaren van bepaalde soorten gegevens.