REKLAMA

DNA jako medium do przechowywania ogromnych danych komputerowych: rzeczywistość już wkrótce?

A breakthrough study takes significant step forward in the quest to develop a DNA-based storage system for digital data.

Cyfrowy dane is growing at an exponential rate today because of our dependency on gadgets and it requires robust long-term storage. Data storage is slowly becoming challenging because current digital technology is not able to provide a solution. An example being that more digital data has been created in the past two years than in all of history of komputery, in fact 2.5 quintillion byte {1 quintillion byte = 2,500,000 Terabytes (TB) = 2,500,000,000 Gigabytes (GB)} of data is being created every day in the world. This includes data on social networking sites, online banking transactions, records of companies and organization, data from satellites, surveillance, research, development etc. This data is huge and unstructured. Therefore, it is now a big challenge to tackle huge storage requirements for data and its exponential growth, especially for organizations and corporations who require robust long-term storage.

Dostępne obecnie opcje to dysk twardy, dyski optyczne (CD), karty pamięci, napędy flash i bardziej zaawansowane napędy taśmowe lub optyczne dyski BluRay, które przechowują około 10 terabajtów (TB) danych. Takie urządzenia do przechowywania danych, chociaż są powszechnie używane, mają wiele wad. Po pierwsze, mają niski lub średni okres trwałości i muszą być przechowywane w idealnych warunkach temperatury i wilgotności, aby mogły przetrwać wiele dziesięcioleci, a tym samym wymagają specjalnie zaprojektowanych fizycznych przestrzeni magazynowych. Prawie wszystkie z nich zużywają dużo energii, są nieporęczne i niepraktyczne oraz mogą ulec uszkodzeniu podczas zwykłego upadku. Niektóre z nich są bardzo drogie, często obarczone błędami danych, przez co nie są wystarczająco wytrzymałe. Powszechnie zaakceptowaną przez organizację opcją jest przetwarzanie w chmurze – rozwiązanie, w którym firma w zasadzie wynajmuje „zewnętrzny” serwer do obsługi wszystkich swoich wymagań w zakresie IT i przechowywania danych, określany mianem „chmury”. Jedną z głównych wad przetwarzania w chmurze są kwestie bezpieczeństwa i prywatności oraz podatność na ataki hakerów. Istnieją również inne problemy, takie jak wysokie koszty, ograniczona kontrola organizacji nadrzędnej i zależność platformy. Przetwarzanie w chmurze jest nadal postrzegane jako dobra alternatywa dla długoterminowego przechowywania. Wygląda jednak na to, że cyfrowe informacje generowane na całym świecie z pewnością wyprzedzają nasze możliwości ich przechowywania i potrzebne są jeszcze bardziej niezawodne rozwiązania, aby sprostać temu zalewowi danych, zapewniając jednocześnie skalowalność uwzględniającą również przyszłe potrzeby w zakresie przechowywania.

Czy DNA może pomóc w przechowywaniu komputera?

Autonomiczne DNA (Deoxyribonucleic acid) is being considered as an exciting alternative medium for digital data storage. DNA is the self-replicating material present in nearly all living organisms and is what constitutes our genetic information. An artificial or synthetic DNA is a durable material which can be made using commercially available oligonucleotide synthesis machines. The primary benefit of DNA is its longevity as a DNA lasts 1000 times longer than silicon (silicon-chip – the material used for building komputery). O dziwo, tylko jeden milimetr sześcienny DNA can hold a quintillion of bytes of data! DNA is also an ultracompact material which never degrades and can be stored in a cool, dry place for hundreds of centuries. The idea of using DNA for storage has been around for a long time way back to 1994. The main reason is the similar fashion in which information is being stored in a computer and in our DNA – since both store the blueprints of information. A computer stores all data as 0s and 1s and DNA stores all data of a living organism using the four bases – thymine (T), guanine (G), adenine (A) and cytosine (C). Therefore, DNA could be called a standard storage device, just like a computer, if these bases can be represented as 0s (bases A and C) and 1s (bases T and G). DNA is tough and long-lasting, the simplest reflection being that our genetic code – the blueprint of all our information stored in DNA – is efficiently transmitted from one generation to next in a repeated manner. All software and hardware giants are keen on using synthetic DNA for storing vast amounts to achieve their goal of solving long-term archival of data. The idea is to first convert the computer code 0s and 1s into the DNA code (A, C, T, G), the converted DNA code is then used to produce synthetic strands of DNA which can then be put into cold storage. Whenever required, DNA strands can be removed from cold storage and their information decoded using DNA sequencing machine and DNA sequence is finally translated back to binary computer format of 1s and 0s to be read on the computer.

Zostało to pokazane1 that just a few grams of DNA can store quintillion byte of data and keep it intact for up to 2000 years. However, this simple understanding has faced some challenges. Firstly, it is quite expensive and also painfully slow to write data to DNA i.e. the actual conversion of 0s and 1s to the DNA bases (A, T, C, G). Secondly, once the data is “written” onto the DNA, it is challenging to find and retrieve files and requires a technique called DNA sequencing – process of determining the precise order of bases within a DNA molecule -after which the data is decoded back to 0s and 1s.

Ostatnie badania2 przez naukowców z Microsoft Research i University of Washington osiągnęli „losowy dostęp” do przechowywania DNA. Aspekt „dostępu losowego” jest bardzo ważny, ponieważ oznacza, że ​​informacje mogą być przesyłane do lub z miejsca (na ogół pamięci), w którym każda lokalizacja, bez względu na to, gdzie w sekwencji jest dostępna bezpośrednio. Korzystając z tej techniki losowego dostępu, pliki mogą być pobierane z magazynu DNA w sposób selektywny w porównaniu z wcześniejszymi, gdy takie pobieranie wymagało sekwencjonowania i dekodowania całego zestawu danych DNA w celu znalezienia i wyodrębnienia kilku żądanych plików. Znaczenie „dostępu losowego” wzrasta wraz ze wzrostem ilości danych i staje się ogromne, ponieważ zmniejsza ilość sekwencjonowania, które należy wykonać. Po raz pierwszy losowy dostęp został pokazany na tak dużą skalę. Naukowcy opracowali również algorytm do wydajniejszego dekodowania i przywracania danych z większą tolerancją na błędy danych, dzięki czemu procedura sekwencjonowania jest również szybsza. W badaniu tym zakodowano ponad 13 milionów syntetycznych oligonukleotydów DNA, które były danymi o wielkości 200 MB, składającymi się z 35 plików (zawierających wideo, audio, obrazy i tekst) o wielkości od 29 KB do 44 MB. Te pliki zostały pobrane pojedynczo bez błędów. Ponadto autorzy opracowali nowe algorytmy, które są bardziej niezawodne i odporne na błędy podczas pisania i odczytywania sekwencji DNA. To badanie opublikowane w Nature Biotechnology w znaczący postęp pokazujący żywotny, wielkoskalowy system przechowywania i wyszukiwania DNA.

DNA storage system looks very appealing because it is having high data density, high stability and is easy to store but it obviously has many challenges before it can be universally adopted. Few factors are time and labour-intensive decoding of the DNA (the sequencing) and also synthesis of DNA. The technique requires more accuracy and broader coverage. Even though advances have been made in this area the exact format in which data will be stored in the long-term as DNA is still evolving. Microsoft has vowed to improve production of synthetic DNA and address the challenges to design a fully operational DNA system przechowywania do 2020 roku.

***

{Możesz przeczytać oryginalną pracę naukową, klikając link DOI podany poniżej na liście cytowanych źródeł}

Źródło (s)

1. Erlich Y i Zieliński D 2017. Fontanna DNA zapewnia solidną i wydajną architekturę pamięci masowej. Nauka. 355(6328). https://doi.org/10.1126/science.aaj2038

2. Organik L et al. 2018. Dostęp losowy w przechowywaniu danych DNA na dużą skalę. Biotechnologia przyrodnicza. 36. https://doi.org/10.1038/nbt.4079

Zespół SCIEU
Zespół SCIEUhttps://www.ScientificEuropean.co.uk
Scientific European® | SCIEU.com | Znaczący postęp w nauce. Wpływ na ludzkość. Inspirujące umysły.

Zapisz się do naszego newslettera

Aby być na bieżąco z najnowszymi wiadomościami, ofertami i specjalnymi ogłoszeniami.

Najpopularniejsze artykuły

Pierwsza strona internetowa na świecie

Pierwszą stroną internetową na świecie była/jest http://info.cern.ch/ To był...

SARAH: Pierwsze generatywne narzędzie WHO do promocji zdrowia oparte na sztucznej inteligencji  

Aby wykorzystać generatywną sztuczną inteligencję na potrzeby zdrowia publicznego,...

Warianty koronawirusa: co wiemy do tej pory

Koronawirusy to wirusy RNA należące do rodziny koronawirusów. Wirusy te wyświetlają się wyjątkowo wysoko...
- Reklama -
94,476FaniJak
47,680ObserwujeObserwuj
1,772ObserwujeObserwuj
30abonenciZapisz się!