Дина Зилински
1,706,216 views • 12:54

Я могла бы поместить все существующие кинофильмы внутрь этой пробирки. Даже если вы ничего там не видите, в этом и есть фокус.

(Смех)

До того как мы поймём, каким образом это осуществимо, важно осознать ценность данного достижения. В настоящее время все наши мысли, действия, даже спортивная активность, хранятся в цифровом формате в виде фото- и видеофайлов. Помимо ситуаций, когда нам не хватает памяти в смартфонах, мы редко задумываемся о нашем цифровом следе. Но за последние несколько лет человечество создало больше информации, чем за всю предыдущую историю.

Большие данные создали большие проблемы. Хранение в цифровом формате на самом деле дорогое удовольствие, и вряд ли какое-то из нынешних устройств выдержит испытание временем. Есть такой некоммерческий сайт — Internet Archive. Он даёт доступ не только к бесплатным книгам и фильмам, но и к веб-страницам, созданным в далёком 1996 году. Было трудно удержаться, и я решила посмотреть на самые истоки сайта TED. Очевидно, что за последние 30 лет он претерпел существенные изменения. Это привело меня к самому первому TED, аж в 1984 год. Это оказлось выступление исполнительного директора Sony, объяснявшего, как устроен компакт-диск.

(Смех)

Совершенно невероятно иметь возможность вернуться назад в прошлое в тот самый момент. Также удивительно и то, что спустя 30 лет после первой конференции TED мы всё ещё обсуждаем хранение цифровых данных.

А за 30 лет до этого, ещё в 1956 году, IBM выпустила свой первый жёсткий диск. Вот здесь его отгружают с целью показать небольшой аудитории. Он содержал объём информации, эквивалентный одной песне в формате MP3, и весил более тонны. При цене 10 тысяч долларов за мегабайт вряд ли кто-то из присутствующих захотел бы его приобрести, если только вы не коллекционер. Но это лучшее, что было создано в то время.

Мы прошли долгий путь в развитии способов хранения данных. Произошёл грандиозный скачок в развитии электронных устройств. Однако в конце концов все носители информации устаревают. Если кто-то вручит вам дискету для хранения вашей презентации, вы посмотрите на него как на чудака, в крайнем случае, посмеётесь, но никоим образом не сможете воспользоваться этой штуковиной. Эти устройства стали абсолютно непригодны для хранения информации, хотя некоторые из них можно использовать для других целей. Все технологии умирают или утрачиваются вместе с нашими данными, нашими воспоминаниями. Заблуждение — считать, что проблема хранения информации уже решена. На самом деле мы лишь признали её существование. Мы не беспокоимся о хранении наших электронных писем или фото. Мы просто отправляем их в облако.

Но проблема никуда не уходит. Не стоит забывать, что облако — всего лишь множество жёстких дисков. Можно утверждать, что большая часть цифровой информации не настолько важна. Конечно, мы можем просто её удалить. Но как мы узнаем, что сегодня представляет наибольшую важность? Мы столько узнали об истории человечества благодаря наскальным рисункам в пещерах и каменным скрижалям. Мы расшифровали языки Розеттского камня. И мы всё равно никогда не узнаем всю историю. Наши данные — это наша история, а в настоящее время особенно. Мы не будем сохранять записи на камнях, и нам не нужно выбирать, что сейчас важно. Есть способ сохранить всё. Оказывается, решение проблемы миллиарды лет было рядом с нами. И оно в этой пробирке.

ДНК — самое старое устройство для хранения, созданное самой природой. Ведь она содержит всю информацию, необходимую для создания и существования человека. Так что же придаёт ей такие невероятные свойства? Для примера возьмём наш собственный геном. Если бы нам было нужно напечатать три миллиарда букв A, T, C и G стандартным шрифтом на листе стандартного формата и сложить листы бумаги вместе, высота пачки составила бы 130 метров, что-то среднее между статуей Свободы и монументом Вашингтону. Если перевести все эти A, T, С и G в цифровой вид, в единицы и нули, получилось бы несколько гигабайт. И так в каждой клеточке нашего организма. А всего в нас более 30 триллионов клеток. Только представьте: ДНК, занимающая крошечное пространство, вмещает в себя тонну информации.

Кроме того, ДНК долговечна, для её хранения не нужно электричество. Нам это известно благодаря учёным, восстановившим ДНК первобытных людей, живших сотни тысяч лет назад. Один из них Этци, Ледяной человек. Как оказалось, он австриец.

(Смех)

Он хорошо сохранился, его нашли высоко в горах на границе Италии и Австрии. Его генетические потомки проживают в настоящее время в Австрии. Так что кто-то из вас может быть кузеном Этци.

(Смех)

Суть в том, что у нас больше шансов извлечь информацию из древнего человека, чем из старого телефона. Кроме того, менее вероятно, что мы утратим способность читать ДНК, в отличие от устройств, созданных человеком. Каждый новый формат хранения данных требует нового способа чтения. Мы всегда сможем прочитать ДНК. Если мы больше не сможем секвенировать данные, значит, нам уже будет не до беспокойства по поводу хранения этой самой информации.

Хранение данных в ДНК не ново. Природа умеет это делать уже несколько миллиардов лет. По сути, каждое живое существо является ДНК-устройством для хранения данных. Так как же информация хранится в ДНК? Это фото номер 51. Самое первое фото ДНК, сделанное почти 60 лет назад. Приблизительно в то же самое время IBM создала свой первый жёсткий диск. Наше понимание цифрового хранения и ДНК развивались одновременно. Сначала мы научились секвенировать, или читать ДНК, а вскоре после этого — записывать и синтезировать. Это очень похоже на изучение нового языка. И сейчас мы можем читать, записывать и копировать ДНК. Мы всё время делаем это в лабораториях. Поэтому всё, абсолютно всё, что можно хранить в виде нулей и единиц, можно хранить в ДНК.

Чтобы сохранить что-то в цифровом формате, например это фото, мы преобразуем его в биты или двоичные единицы. Каждый пиксель на чёрно-белой фотографии представляет собой ноль или единицу. И мы можем записать ДНК так же, как принтер может печатать буквы на бумаге. Нам остаётся всего лишь конвертировать наши данные, эти нули и единицы, в буквы А, Т, С и G. А затем синтезировать их. Итак, мы записываем информацию, можем её хранить, и когда мы захотим ею воспользоваться, просто считываем её.

И самое интересное — это решить, какие файлы хранить. Мы серьёзные учёные, и мы должны сохранить манускрипт для потомков. Мы также включили 50-долларовую подарочную карту Amazon — сильно не радуйтесь, они уже потрачены, кто-то её активировал. А также операционную систему, один из первых фильмов и пластинки «Пионера». Возможно, кто-то из вас уже их видел. На них изображены мужчина и женщина и наше приблизительное местоположение в Солнечной системе, на случай если корабль «Пионер» когда-нибудь встретит инопланетян.

Мы придумали, какую именно информацию хотим закодировать, запаковали её, конвертировали нули и единицы в буквы А, Т, С и G, а затем просто синтезировали эти файлы. И вот что мы получили в итоге. Наши файлы были помещены в эту пробирку. Осталось только их секвенировать. Кажется, всё достаточно просто, но отличие действительно замечательной идеи от того, что мы можем использовать, в том, чтобы преодолеть проблемы с реализацией на практике.

Хотя ДНК и надёжнее, чем любое рукотворное устройство, она несовершенна. Есть некоторые слабые стороны. Мы восстанавливаем наше сообщение путем секвенирования ДНК, но каждый раз, когда данные извлекаются, мы теряем ДНК. Это одна из особенностей процесса секвенирования. Мы не хотим терять данные, но к счастью, есть способ копирования ДНК, который дешевле и легче её синтезирования. Мы уже протестировали способ создания 200 триллионов копий наших файлов, и нам удалось извлечь информацию без её повреждения. Секвенирование также приводит к ошибкам в нашей ДНК, в А, Т, С и G. Природа научилась справляться с этим в наших клетках. Но наши данные хранятся в искусственной ДНК в пробирке. Мы должны были придумать собственный способ справиться с этой проблемой. Мы решили использовать тот же алгоритм, который применяется в потоковом видео. Когда вы транслируете видео, вы фактически пытаетесь восстановить оригинальное видео, первоначальный файл. Когда мы это делаем, мы просто секвенируем. Оба этих процесса подразумевают восстановление нулей и единиц с целью собрать всю нашу информацию. И благодаря такому способу кодирования мы смогли запаковать все данные так, чтобы можно было создать миллионы и триллионы копий, которые в любой момент можно извлечь.

Вот фильм, который мы закодировали. Один из первых, который был снят, а теперь он первый, который был скопирован на ДНК более 200 триллионов раз.

Вскоре после того как наша работа была опубликована, мы приняли участие в «Спроси меня о чём угодно» на сайте Reddit. Если вы тот ещё ботаник, то хорошо знаете, что это за сайт. Некоторые вопросы были содержательные, но были и смешные. Например, один пользователь хотел узнать, когда у нас появится настоящая флешка. Дело в том, что наша ДНК уже содержит всю необходимую информацию о нас. Хранить данные на ДНК гораздо безопаснее в синтетической ДНК в пробирке.

Очевидно, что запись и чтение данных из ДНК занимает намного больше времени, чем просто сохранение всех ваших файлов на жёстком диске. Пока что. Перво-наперво мы должны сосредоточиться на возможности длительного хранения. Большинство данных эфемерны. Действительно трудно понять, что важно сегодня, а что будет важно для будущих поколений. Но дело в том, что решать необязательно. Есть замечательная программа ЮНЕСКО под названием «Память мира». Она была создана с целью сохранить исторические материалы, которые представляют ценность для всего человечества. Был составлен список того, что необходимо включить, в том числе фильм, который мы закодировали. Хотя это и замечательный способ сохранить человеческое наследие, но мы не должны стоять перед выбором. Вместо того чтобы спрашивать нас, современное поколение, что может быть важно в будущем, мы могли бы сохранить всё в ДНК.

Смысл не только в количестве сохранённых байтов, а в том, насколько хорошо мы можем их сохранять и извлекать. Существует проблема того, сколько информации мы сможем сгенерировать, сколько восстановить и сколько сохранить. Каждый новый способ создания данных потребовал новый способ их чтения. Мы больше не можем читать старые носители. У кого из присутствующих в ноутбуке есть дисковод, не говоря уже о флоппи-дисководе? В случае с ДНК такой проблемы не возникнет. Пока существуем мы, существует и ДНК, и мы найдём способ её секвенировать.

Архивирование мира вокруг нас — часть человеческой природы. Это прогресс, которого мы достигли в цифровом хранении за 60 лет, с момента, когда мы только начали понимать ДНК. Однако мы добились подобного прогресса с ДНК-секвенаторами в два раза быстрее, и пока человечество существует, ДНК никогда не устареет.

Спасибо.

(Аплодисменты)