Microsoft и Western Digital создадут систему хранения файлов на ДНК
Внешние диски для хранения данных больше не понадобятся.
На днях компании Western Digital, Microsoft, Twist Bioscience и Illumina объединили силы, чтобы разработать экосистему для записи информации с помощью ДНК. С этой целью они создали Альянса по хранению данных на ДНК (DNA Data Storage Alliance), передает издание blocksandfiles.com. Альянс планирует разработать не только технологию, но и необходимые устройства для записи и считывания информации с ДНК.
Идея возникла после того, как аналитики Western Digital опубликовали прогноз, согласно которому через 10 лет 50% носителей будет использоваться в качестве архива данных. Дальше — больше. Люди будут тратить огромные средства на сохранение данных, однако плотность носителей будет увеличиваться недостаточно быстро. Именно поэтому нужна качественно новая технология записи и хранения файлов. К примеру, на ДНК. А все потому, что ДНК может обеспечить высокую плотность хранения — 1 г носителя ДНК может хранить порядка 1 зеттабайта данных (зеттабайт соответствует триллиону гигабайтов). Вся имеющаяся на сегодняшний день информация "весит" 40 зеттабайт, а это значит, что для ее записи понадобится около 40 г носителя. Теоретически, хранить записанную таким образом информацию можно на протяжении нескольких тысячелетий.
Участники Альянса четко распределили работу. Так, Twist BioScience предоставит фрагменты ДНК и технологии записи. Illumina будет работать над технологией считывания информации. Microsoft проверит технологии в работе экспериментальным путем. К Альянсу также присоединились ученые из Лаборатории молекулярных информационных систем Вашингтонского университета, исследователи и разработчики таких компаний, как Ansa Biotechnologies, The Claude Nobs Foundation, DNA Script, EPFL, ETH Zurich, Imec, Iridia, Molecular Assemblies и др.
В Альянсе отмечают, что записи данных на ДНК не будут использовать двоичный код, зато применят кодирование на базе 4-х символов, обозначающих основания нуклеиновых кислот: аденина (A), гуанина (G), цитозина (C) и тимина (T). Например, 00 = A, 01 = C, 10 = G и 11 = T. Закодированные с помощью кислот данные будут записываться в короткие фрагменты ДНК, а после — упаковываться в контейнер для дальнейшего хранения.
На данный момент технология записи уже тестируется, хотя работает весьма медленно: 5 байт информации заносятся в ДНК в течение 24-х часов. Но этот недочет обязательно исправят.
Ранее стало известно, что в Калифорнийском Университете создали суперкомпьютерный кластер для борьбы с Covid-19.