ПЕРСПЕКТИВЫ СОВРЕМЕННЫХ СИСТЕМ ХРАНЕНИЯ ЦИФРОВЫХ ДАННЫХ

Статья опубликована в рамках: Международной научно-практической интернет-конференции «Актуальные проблемы методики обучения информатике в современной школе» (Россия, г.Москва, МПГУ,16 — 17 февраля 2016г.)

ПЕРСПЕКТИВЫ СОВРЕМЕННЫХ СИСТЕМ ХРАНЕНИЯ ЦИФРОВЫХ ДАННЫХ

Живайкина Наталия Викторовна
МБОУ гимназия №11
Россия, г.Королёв
e-mail: zhivaykina@inbox.ru

Проведен анализ надежности и долговечности систем хранения цифровых данных. Обоснован метод хранения цифровых файлов в виде двухмерных графических штрих-кодов. Ключевые слова: системы хранения цифровых данных, надежность и долговечность, микрофильмирование, СОМ-система, штрих-код. На сегодняшний день информационное общество находится на стадии, характеризующейся наличием огромного массива информации в цифровом виде и одновременно с этим отсутствием надежных технологий ее долговременного хранения (более 30 лет). Ни одна из существующих систем хранения цифровых данных большого объема (более 64 Гб) (HDD (Hard Disk Drive), SSD (Solid State Drive) (рис. 1) на данном этапе технологического развития не гарантирует продолжительности надежного хранения однажды записанных данных более 5 лет.

носители_цифр_инф

Рис. 1. Носители цифровой информации

Рассмотрим каждую из них с точки зрения «надежности» более подробно. Накопитель на жестком диске (HDD) относится к наиболее совершенным и сложным устройствам современных систем хранения цифровой информации, характеризующийся значимым объемом хранимой информации при низкой себестоимости. Однако, исходя из исследований доктора Бианки Шредер и Google, в силу своих конструктивных особенностей и элементов (качество магнитного покрытия пластин, способы защиты считывающей головки, особенности механизмов позиционирования и элементной базы управляющей всем этим платы контроллера) количество отказов после 3-го года работы стабильно увеличивается (рис.2). При начальной разметке и тестировании современного винчестера на заводе почти всегда обнаруживаются дефектные сектора, которые заносятся в специальную таблицу переназначения. При обычной работе конроллер винчестера подменяет эти сектора резервными, которые специально оставляются для этой цели на каждой дорожке, группе дорожек или выделенной зоне диска. Благодаря этому новый винчестер создает видимость полного отсутствия дефектов поверхности, хотя на самом деле они есть почти всегда. Рис. 2. Отказы HDD «потребительского» и Enterprise-класс.

     Результаты исследования, проведенного университетом Карнеги – Меллона, говорят о том, что показатели надежности жестких дисков, обозначенные в спецификациях производителей, существенно расходятся с действительностью. Утверждается, что основной показатель надежности – среднее время наработки на отказ (mean-time before failure, MTBF), завышается приблизительно в 15 раз.  Для получения статистики исследователями была изучена практика эксплуатации около 100 тыс. жестких дисков от разных производителей, задействованных в самых различных приложениях. Серьезное завышение MTBF демонстрируется на примере накопителей серии Seagate Cheetah X15, для которых этот показатель номинально равен 1,5 млн часов, или более чем 171 году эксплуатации. Статистика реального использования позволяет говорить о том, что на самом деле эти устройства имеют время наработки на отказ ближе к 9-11 годам. Наиболее простой способ повышения надёжности данных — использование зеркалированного массива RAID 1. В этом случае два винчестера работают как один, дублируя содержимое друг друга. При установке двух дисков в RAID 1 следствием является потеря объёма и стоимости в два раза, но при отказе любого из них, система сохранит состояние работоспособности и имеется время для резервного копирования и замены жёстких дисков. Исследование Шредера охватывает диски Enterprise-класса, задействованных в больших RAID-массивах одной из крупнейших лабораторий по высокопроизводительным вычислениям. Согласно отчёту  Шредера распределение времени между заменами диска показывает снижение частоты отказов, означающее, что ожидаемый промежуток времени до очередной замены диска постепенно увеличивается с тех пор, как был заменён предыдущий диск. Таким образом, отказ одного накопителя в массиве повышает вероятность отказа другого накопителя. Чем больше времени прошло с последней замены диска, тем больше времени пройдёт до замены другого. Конечно, это имеет последствия с точки зрения реконструкции RAID- массива.

     По законам термодинамики электроны стремятся со временем равномерно распределиться по всему объему кристалла. При достижении равновесия все содержимое памяти утрачивается; каждый цикл записи понемногу «подтачивает» слой, отделяющий затвор от остальной массы кристалла. Кроме того, со временем неизбежно происходит деградация самого материала и р-n-переходов. Из-за этого срок жизни ячейки ограничен некоторым числом циклов записи-перезаписи. Продолжительность надежного хранения однажды записанных данных составляет не менее 5 лет. Число циклов перезаписи тоже иногда оговаривается. Например, ранние модели Kingston Compact Flash были рассчитаны на 300 000 циклов перезаписи, Transcend Compact Flash — на 1 000 000, а флеш-диски USB Transcend объемом 1 Gb образца 2006 года — всего на 100 000. Многие модели после 2010 года преодолели рубеж в 2 000 000 циклов. Однако SSD дают преимущества, которые нельзя получить на обычных механических жёстких дисках. На 2011 год хостинг «No Support Linux» в вопросах преимущества при применении твердотельных дисков в серверах, придерживается следующего мнения: «В сочетании с ZFS и гибридными системами хранения, применение SSD-накопителей позволяет получить существенный прирост производительности, по сравнению с традиционными дисками на магнитных пластинах. В качестве основного хранилища мы по-прежнему используем жёсткие диски.

Существует гибридная система хранения ZFS (Zettabyte File System) – файловая система, изначально созданная в Sun Microsystems для операционной системы Solaris.  Это файловая система поддерживает большие объёмы данных, объединяет концепции файловой системы и менеджера логических дисков (томов) и физических носителей, новаторскую структуру данных на дисках, легковесные файловые системы (англ. lightweight filesystems), а также простое управление томами хранения данных. ZFS является проектом с открытым исходным кодом.

     Одна из самых главных возможностей ZFS — это RAID-Z. Это массив, состоящий из блоков фиксированного размера, с которого может происходить чтение или запись.  Принципиальным отличием RAID-Z является ключевая составляющая — категория — переменной ширины. С существующими реализациями RAID, она составляет либо 1 байт (например, каждый нечетный байт будет записан на диск 1, каждый четный — на диск 2, а каждый сравнимый по модулю — на диск 3). С тех пор, как ZFS транзакционна, категория либо записывается корректно и мета- данные обновляются, либо нет. Таким образом, поскольку категория содержит только данные, состоящие на записи, никогда не понадобится считывать что-то с диска для осуществления записи. Применительно к системам хранения информации в аналоговом виде, можно утверждать, что единственной надежной среди всех сущестующих сегодня технологий долговременного хранения является технология микрофильмирования (500 лет).

Выводы:   Проблематика долговременного хранения и одновременного обеспечения оперативного доступа к большим объемам цифровых данных приобретает наилучшее решение в свете применения гибридных технологий, таких как СОМ-технологии (Computer Output Microfilm), разработанных на основе микрофильмирования. Гибридные системы совмещают в себе функции сканирования и микрофильмирования, позволяя переводить бумажную документацию одновременно в электронную для оперативного доступа (используя неформализованные данные с компьютерных систем) и микрографическую форму для обеспечения сохранности – т.е. создают два типа архивов — цифро- вой и микрографический, при экономном расходе времени и усилий, обеспечивая надежное долговременное хранение данных, практически исключая аспект устаревания оборудования и смену форматов носителей.

     Таким образом, данный способ сохранения позволяет значительно приблизиться к решению проблемы долгосрочного страхового сохранения цифровых данных при значительном снижении показателей трудоемкости.

ЛИТЕРАТУРА

  1. Investigation: Is Your SSD More Reliable Than A Hard Drive? // [сайт]. [1999]. URL: http://www.tomshardware.com/reviews/ssd-reliabilityfailure-rate,2923.html (дата обращения: 19.03.2013).
  2. Гаврилин А.П. Применение электронно-микрографических технологий для сохранения и оперативного доступа к документированной информации // Успехи современного естествознания. 2008. № 11. С. 62-64.
  3. Гаврилин А.П., Завалишин П.Е. Основные направления современных зарубежных исследований по проблеме сохранения цифровой информации на микрофильмах // РАЕ. Фундаментальные исследования. 2012. № 3. С. 72-77.

Отправить ответ

Уведомить о
avatar
Sort by:   newest | oldest | most voted
Т.Б. Захарова

Уважаемая Наталия Викторовна! Действительно, сейчас предлагаются учеными пути и механизмы решения этой проблемы. Полагаю, что эти вопросы надо освещать и в образовательном процессе по информатике. Считаю, что включение этих вопросов на уроках информатики будет повышать познавательный интерес обучающихся.

wpDiscuz