W każdej minucie 2018 roku Google przeprowadził 3,88 mln wyszukiwań, a ludzie obejrzeli 4,33 mln filmów na YouTube, wysłali 159 362 760 e-maili, tweetowali 473 000 razy i zamieścili 49 000 zdjęć na Instagramie, według firmy programistycznej Domo. Szacuje się, że do 2020 roku na całym świecie będzie powstawać 1,7 megabajta danych na sekundę na osobę, co przekłada się na około 418 zettabajtów w ciągu jednego roku (418 miliardów informacji wartych jeden terabajt na dysku twardym), przy założeniu, że populacja świata wynosi 7,8 miliarda. Magnetyczne lub optyczne systemy przechowywania danych, które obecnie przechowują taką ilość 0 i 1, zazwyczaj nie mogą przetrwać dłużej niż sto lat, jeśli w ogóle. Co więcej, prowadzenie centrów danych wymaga ogromnych ilości energii. Krótko mówiąc, czeka nas poważny problem z przechowywaniem danych, który z czasem stanie się jeszcze poważniejszy.
Rozwija się alternatywa dla dysków twardych: Przechowywanie danych w oparciu o DNA. DNA – składające się z długich łańcuchów nukleotydów A, T, C i G – jest życiowym materiałem do przechowywania informacji. Dane mogą być przechowywane w sekwencji tych liter, przekształcając DNA w nową formę technologii informacyjnej. Już teraz jest ono rutynowo sekwencjonowane (odczytywane), syntetyzowane (zapisywane) i z łatwością precyzyjnie kopiowane. DNA jest również niewiarygodnie stabilne, co zostało udowodnione przez sekwencjonowanie kompletnego genomu kopalnego konia, który żył ponad 500 000 lat temu. A przechowywanie go nie wymaga wiele energii.
Ale to właśnie zdolność do przechowywania błyszczy. DNA może precyzyjnie przechowywać ogromne ilości danych w gęstości znacznie przekraczającej gęstość urządzeń elektronicznych. Prosta bakteria Escherichia coli, na przykład, ma gęstość przechowywania około 1019 bitów na centymetr sześcienny, zgodnie z obliczeniami opublikowanymi w 2016 roku w Nature Materials przez George’a Churcha z Uniwersytetu Harvarda i jego kolegów. Przy takiej gęstości, wszystkie obecne potrzeby świata w zakresie przechowywania danych przez rok mogłyby zostać dobrze zaspokojone przez sześcian DNA o wymiarach około jednego metra na bok.
Perspektywa przechowywania danych w DNA nie jest jedynie teoretyczna. W 2017 r. na przykład grupa Churcha na Harvardzie zaadaptowała technologię edycji DNA CRISPR do zapisu obrazów ludzkiej dłoni w genomie E. coli, które zostały odczytane z dokładnością przekraczającą 90 procent. Natomiast naukowcy z Uniwersytetu Waszyngtońskiego i Microsoft Research opracowali w pełni zautomatyzowany system zapisu, przechowywania i odczytu danych zakodowanych w DNA. Szereg firm, w tym Microsoft i Twist Bioscience, pracuje nad rozwojem technologii przechowywania DNA.
Mimo to DNA jest już wykorzystywane do zarządzania danymi w inny sposób, przez badaczy, którzy zmagają się z nadawaniem sensu ogromnym ilościom danych. Ostatnie postępy w technikach sekwencjonowania następnej generacji pozwalają na łatwe i jednoczesne odczytywanie miliardów sekwencji DNA. Dzięki tej możliwości badacze mogą stosować kodowanie paskowe – wykorzystanie sekwencji DNA jako molekularnych „znaczników” identyfikacyjnych – w celu śledzenia wyników eksperymentów. Kod kreskowy DNA jest obecnie wykorzystywany do radykalnego przyspieszenia tempa badań w takich dziedzinach jak inżynieria chemiczna, materiałoznawstwo i nanotechnologia. W Georgia Institute of Technology, na przykład, laboratorium Jamesa E. Dahlmana szybko identyfikuje bezpieczniejsze terapie genowe; inni zastanawiają się, jak zwalczać oporność na leki i zapobiegać przerzutom nowotworów.
Pośród wyzwań związanych z upowszechnieniem przechowywania danych w DNA są koszty i szybkość odczytu i zapisu DNA, które muszą jeszcze bardziej spaść, jeśli to podejście ma konkurować z elektronicznym przechowywaniem danych. Nawet jeśli DNA nie stanie się wszechobecnym materiałem do przechowywania danych, prawie na pewno będzie wykorzystywany do generowania informacji w zupełnie nowych skalach i długoterminowego przechowywania pewnych typów danych.