REKLAMA

DNA jako medium do przechowywania ogromnych danych komputerowych: rzeczywistość już wkrótce?

Przełomowe badanie stanowi znaczący krok naprzód w dążeniu do opracowania DNAoparty na systemie przechowywania danych cyfrowych.

Cyfrowy dane rośnie obecnie w wykładniczym tempie ze względu na naszą zależność od gadżetów i wymaga solidnego, długoterminowego przechowywania. Przechowywanie danych powoli staje się wyzwaniem, ponieważ obecna technologia cyfrowa nie jest w stanie zapewnić rozwiązania. Przykładem może być fakt, że w ciągu ostatnich dwóch lat utworzono więcej danych cyfrowych niż w całej historii komputeryw rzeczywistości każdego dnia na świecie powstaje 2.5 tryliona bajtów {1 trylion bajtów = 2,500,000 2,500,000,000 XNUMX terabajtów (TB) = XNUMX XNUMX XNUMX XNUMX gigabajtów (GB)} danych. Obejmuje to dane dotyczące serwisów społecznościowych, transakcji bankowości internetowej, rejestrów firm i organizacji, dane z satelitów, dane z monitoringu, badań, rozwoju itp. Dane te są ogromne i nieustrukturyzowane. Dlatego też sprostanie ogromnym wymaganiom w zakresie przechowywania danych i ich wykładniczemu wzrostowi stanowi obecnie duże wyzwanie, szczególnie dla organizacji i korporacji, które wymagają solidnego, długoterminowego przechowywania danych.

Dostępne obecnie opcje to dysk twardy, dyski optyczne (CD), karty pamięci, napędy flash i bardziej zaawansowane napędy taśmowe lub optyczne dyski BluRay, które przechowują około 10 terabajtów (TB) danych. Takie urządzenia do przechowywania danych, chociaż są powszechnie używane, mają wiele wad. Po pierwsze, mają niski lub średni okres trwałości i muszą być przechowywane w idealnych warunkach temperatury i wilgotności, aby mogły przetrwać wiele dziesięcioleci, a tym samym wymagają specjalnie zaprojektowanych fizycznych przestrzeni magazynowych. Prawie wszystkie z nich zużywają dużo energii, są nieporęczne i niepraktyczne oraz mogą ulec uszkodzeniu podczas zwykłego upadku. Niektóre z nich są bardzo drogie, często obarczone błędami danych, przez co nie są wystarczająco wytrzymałe. Powszechnie zaakceptowaną przez organizację opcją jest przetwarzanie w chmurze – rozwiązanie, w którym firma w zasadzie wynajmuje „zewnętrzny” serwer do obsługi wszystkich swoich wymagań w zakresie IT i przechowywania danych, określany mianem „chmury”. Jedną z głównych wad przetwarzania w chmurze są kwestie bezpieczeństwa i prywatności oraz podatność na ataki hakerów. Istnieją również inne problemy, takie jak wysokie koszty, ograniczona kontrola organizacji nadrzędnej i zależność platformy. Przetwarzanie w chmurze jest nadal postrzegane jako dobra alternatywa dla długoterminowego przechowywania. Wygląda jednak na to, że cyfrowe informacje generowane na całym świecie z pewnością wyprzedzają nasze możliwości ich przechowywania i potrzebne są jeszcze bardziej niezawodne rozwiązania, aby sprostać temu zalewowi danych, zapewniając jednocześnie skalowalność uwzględniającą również przyszłe potrzeby w zakresie przechowywania.

Czy DNA może pomóc w przechowywaniu komputera?

Autonomiczne DNA (Kwas dezoksyrybonukleinowy) jest uważany za ekscytujący alternatywny nośnik cyfrowego przechowywania danych. DNA to samoreplikujący się materiał obecny w prawie wszystkich żywych organizmach i stanowiący naszą informację genetyczną. Sztuczny lub syntetyczny DNA jest trwałym materiałem, który można wytworzyć przy użyciu dostępnych na rynku maszyn do syntezy oligonukleotydów. Podstawową zaletą DNA jest jego długowieczność DNA wytrzymuje 1000 razy dłużej niż krzem (chip krzemowy – materiał używany do budowy komputery). O dziwo, tylko jeden milimetr sześcienny DNA może pomieścić trylion bajtów danych! DNA to także ultrakompaktowy materiał, który nigdy nie ulega degradacji i można go przechowywać w chłodnym, suchym miejscu przez setki lat. Pomysł wykorzystania DNA do przechowywania istnieje już od dawna, już w 1994 roku. Głównym powodem jest podobny sposób przechowywania informacji w komputerze i w naszym organizmie. DNA – ponieważ oba przechowują plany informacji. Komputer przechowuje wszystkie dane jako zera i jedynki, a DNA przechowuje wszystkie dane żywego organizmu przy użyciu czterech zasad – tyminy (T), guaniny (G), adeniny (A) i cytozyny (C). Dlatego DNA można nazwać standardowym urządzeniem przechowującym, podobnie jak komputer, jeśli te zasady można przedstawić jako 0 (podstawy A i C) i 1 (podstawy T i G). DNA jest wytrzymałe i trwałe, a najprostsze odzwierciedlenie jest takie, że nasz kod genetyczny – wzór wszystkich informacji przechowywanych w DNA – jest skutecznie przekazywany z pokolenia na pokolenie w powtarzalny sposób. Wszyscy giganci oprogramowania i sprzętu chętnie wykorzystują syntetyczne DNA do przechowywania ogromnych ilości, aby osiągnąć swój cel, jakim jest rozwiązanie długoterminowej archiwizacji danych. Pomysł polega na tym, aby najpierw przekształcić kod komputerowy 0 i 1 w kod DNA (A, C, T, G). Przekonwertowany kod DNA jest następnie wykorzystywany do produkcji syntetycznych nici DNA, które można następnie umieścić w chłodni. W razie potrzeby nici DNA można wyjąć z chłodni, a zawarte w nich informacje są dekodowane za pomocą maszyny do sekwencjonowania DNA, a sekwencja DNA jest ostatecznie tłumaczona z powrotem do binarnego formatu komputerowego składającego się z jedynek i zer, które można odczytać na komputerze.

Zostało to pokazane1 że zaledwie kilka gramów DNA może przechowywać kwintylion bajtów danych i zachować je w nienaruszonym stanie nawet przez 2000 lat. Jednak to proste zrozumienie napotkało pewne wyzwania. Po pierwsze, zapisywanie danych do DNA, czyli faktyczna konwersja zer i jedynek na zasady DNA (A, T, C, G) jest dość kosztowne i boleśnie powolne. Po drugie, gdy dane zostaną „zapisane” w DNA, znalezienie i odzyskanie plików jest trudne i wymaga zastosowania techniki zwanej DNA sekwencjonowanie – proces ustalania dokładnej kolejności zasad w obrębie a DNA cząsteczka - po czym dane są dekodowane z powrotem do 0 i 1.

Ostatnie badania2 przez naukowców z Microsoft Research i University of Washington osiągnęli „losowy dostęp” do przechowywania DNA. Aspekt „dostępu losowego” jest bardzo ważny, ponieważ oznacza, że ​​informacje mogą być przesyłane do lub z miejsca (na ogół pamięci), w którym każda lokalizacja, bez względu na to, gdzie w sekwencji jest dostępna bezpośrednio. Korzystając z tej techniki losowego dostępu, pliki mogą być pobierane z magazynu DNA w sposób selektywny w porównaniu z wcześniejszymi, gdy takie pobieranie wymagało sekwencjonowania i dekodowania całego zestawu danych DNA w celu znalezienia i wyodrębnienia kilku żądanych plików. Znaczenie „dostępu losowego” wzrasta wraz ze wzrostem ilości danych i staje się ogromne, ponieważ zmniejsza ilość sekwencjonowania, które należy wykonać. Po raz pierwszy losowy dostęp został pokazany na tak dużą skalę. Naukowcy opracowali również algorytm do wydajniejszego dekodowania i przywracania danych z większą tolerancją na błędy danych, dzięki czemu procedura sekwencjonowania jest również szybsza. W badaniu tym zakodowano ponad 13 milionów syntetycznych oligonukleotydów DNA, które były danymi o wielkości 200 MB, składającymi się z 35 plików (zawierających wideo, audio, obrazy i tekst) o wielkości od 29 KB do 44 MB. Te pliki zostały pobrane pojedynczo bez błędów. Ponadto autorzy opracowali nowe algorytmy, które są bardziej niezawodne i odporne na błędy podczas pisania i odczytywania sekwencji DNA. To badanie opublikowane w Nature Biotechnology w znaczący postęp pokazujący żywotny, wielkoskalowy system przechowywania i wyszukiwania DNA.

System przechowywania DNA wygląda bardzo atrakcyjnie, ponieważ charakteryzuje się dużą gęstością danych, wysoką stabilnością i jest łatwy do przechowywania, ale oczywiście czeka go wiele wyzwań, zanim będzie można go powszechnie zastosować. Do kilku czynników zalicza się czasochłonne i pracochłonne dekodowanie DNA (sekwencjonowanie), a także synteza DNA. Technika ta wymaga większej dokładności i szerszego zasięgu. Mimo że w tej dziedzinie poczyniono postępy, dokładny format, w jakim dane będą przechowywane w perspektywie długoterminowej, tj DNA wciąż ewoluuje. Microsoft obiecał ulepszyć produkcję syntetycznego DNA i stawić czoła wyzwaniom w zakresie zaprojektowania w pełni funkcjonalnego DNA DNA system przechowywania do 2020 roku.

***

{Możesz przeczytać oryginalną pracę naukową, klikając link DOI podany poniżej na liście cytowanych źródeł}

Źródło (s)

1. Erlich Y i Zieliński D 2017. Fontanna DNA zapewnia solidną i wydajną architekturę pamięci masowej. Nauka. 355(6328). https://doi.org/10.1126/science.aaj2038

2. Organik L et al. 2018. Dostęp losowy w przechowywaniu danych DNA na dużą skalę. Biotechnologia przyrodnicza. 36. https://doi.org/10.1038/nbt.4079

Zespół SCIEU
Zespół SCIEUhttps://www.ScientificEuropean.co.uk
Scientific European® | SCIEU.com | Znaczący postęp w nauce. Wpływ na ludzkość. Inspirujące umysły.

Zapisz się do naszego newslettera

Aby być na bieżąco z najnowszymi wiadomościami, ofertami i specjalnymi ogłoszeniami.

Najpopularniejsze artykuły

Kultura Chinchorro: najstarsza sztuczna mumifikacja ludzkości

Najstarsze dowody na sztuczną mumifikację na świecie pochodzą...

Pierwsza udana edycja genów u jaszczurek przy użyciu technologii CRISPR

Ten pierwszy przypadek manipulacji genetycznej u jaszczurki...

Cefiderocol: nowy antybiotyk do leczenia złożonych i zaawansowanych infekcji dróg moczowych

Nowo odkryty antybiotyk działa według unikalnego mechanizmu w...
- Reklama -
94,418FaniJak
47,664ObserwujeObserwuj
1,772ObserwujeObserwuj
30abonenciZapisz się!