© Валерий Аксак, 2008-2011.

Копирование материалов сайта допускается только при установке активной гиперссылки на данный сайт.
Реклама:

домен net.ua
Жилой комплекс Садовые кварталы. Садовые кварталы купить апартаменты

Технологии резервного копирования и хранения данных: RAID, NAS, SAN и другие

(Валерий Аксак / журнал "Мой компьютер", название статьи в журнале: "Back-up back-up’у рознь!")

Наверное, не зря сегодня на всех углах кричат, что мы живем в эпоху информационных технологий. Этот период не случайно носит именно такое название – переоценка ценностей человеческой цивилизации в глобальном масштабе привела к тому, что общество признало первостепенность информации во всех ее проявлениях. И если еще чуть более полвека назад люди соперничали за золото и землю, то сейчас на кону – биты и байты. Сегодня мы поговорим о современных технологиях, которые призваны тщательно хранить и оберегать это «виртуальное золото».

Данная статья вряд ли имеет какую-то практическую ценность для среднестатического пользователя персонального компьютера, поэтому если вы надеетесь увидеть в ней описания новых методов домашнего back-up’а собственных архивов, должен вас разочаровать. Тематика этого материала сопряжена с более серьезным уровнем компьютерной индустрии, направленным на так называемый корпоративный сектор. Но если вы хотите узнать, что позволяет небольшим организациям сохранять тысячи, а огромным фирмам вроде Microsoft – миллионы условных единиц ежегодно – читайте дальше. Надеюсь, вам будет интересно.

Для сохранности электронных файлов создан целый спектр устройств, которые в той или иной комбинации образуют систему резервного копирования. Мы рассмотрим только те технологии и устройства, которые сегодня пользуются наибольшей популярностью. Начнем с самой простой структуры.

RAID-массивы

Технология RAID (Redundant Array of Independent Disks – избыточный массив независимых дисков) была разработана еще в 1987 году, но, не смотря на столь солидный с точки зрения информационных технологий возраст, и сегодня пользуется большой популярностью. Создание RAID-массива максимально приближено к организации обычной дисковой подсистемы персонального компьютера. В основе такого массива могут лежать стандартные накопители на жестких дисках, вроде тех, что находятся в вашем системном блоке, что делает этот метод создания системы резервного копирования максимально доступным широкому кругу пользователей. Жесткие диски (минимум два HDD) с помощью RAID-контроллера (он может быть интегрирован в материнскую плату или подсоединяется отдельным устройством в один из слотов расширения) объединяются в определенную систему (про их разновидности мы поговорим позже) и функционируют в виде одного виртуального целого диска, с которым можно работать практически так же, как и с обычным HDD.

RAID-массивы различаются между собой уровнями организации, от RAID 0 до RAID 5. RAID 0, по большому счету, к резервному копированию никакого отношения не имеет. Основная цель использования подобных систем – ускорение доступа к данным, что особенно актуально при работе с графикой и мультимедийными приложениями. Принцип его функционирования состоит в равномерном разделении записываемых данных на два или более физических носителя (чем их больше, тем лучше) в виде небольших порций (блоков). Например, если вы записываете файл объемом N гигабайт, то его обработка на RAID-массиве нулевого уровня может происходить таким образом: первые x мегабайт файла записываются на первый физический диск, следующие x мегабайт – на второй, n-ые x мегабайт – на n-ый диск. После полного прохода цикла по всем имеющимся в системе жестким дискам запись блоков продолжается по следующему кругу за аналогичной формулой: (n*x)+x мегабайт на первый жесткий диск и так далее. Когда же производится вызов записанного таким образом файла, он считывается практически одновременно со всех дисков, что приводит к солидному увеличению скорости доступа к нему. Но в то же время такой способ организации массива теоретически наиболее подвержен опасности потери данных, так как с разорванным звеном цепь работать уже не будет. А значит, при использовании RAID 0 нужно позаботиться о подключении к компьютеру или сети какой-то внешней системы резервного копирования. Кроме этого следует учесть, что во избежание потерь физического места на жестких дисках следует формировать RAID 0 из устройств одинакового объема, так как форматирование всего массива производится по пределу вместительности наименее емкого HDD.

RAID 1 – практически полная противоположность RAID 0. Он состоит из парного количества жестких дисков и работает по методу зеркалирования, когда записываемые в массив данные в одинаковом виде записываются на одну пару HDD (второй винчестер в паре формально считается запасным), создавая при этом две копии данных. То есть содержимое одного винчестера как бы отражается в другом – отсюда и термин «mirroring». Подобная система имеет два преимущества: во-первых, считывание данных происходит в два раза быстрее, чем с одного винчестера (но скорость записи остается неизменной); во-вторых, поломка одного HDD не является фатальной для всей системы – контроллер просто полностью переключается на запасной носитель и, как ни в чем не бывало, продолжает считывать данные. Но в то же время у RAID 1 имеется один и, пожалуй, единственный серьезный недостаток – низкий коэффициент использования пространства жесткого диска (50%) и, как следствие, высокая себестоимость хранения удельной единицы информации. Системы RAID 1 могут работать параллельно с RAID 0, обеспечивая совместными усилиями высокую скорость и максимальную надежность файлооборота (так называемые системы RAID 0+1). Ну а о стоимости такого ансамбля можно сказать только одно: дорого.

RAID 2, RAID 3 и RAID 4 являются по сути разновидностью одной и той же системы. В их основе лежит принцип использования дополнительного физического диска для избыточного хранения, на который записываются контрольные суммы блоков данных, размещаемых на основных HDD равномерными порциями, аналогичными RAID 0. В случае сбоя одного из активных носителей в цепочке, информацию на испорченном устройстве можно полностью восстановить через контрольные суммы на избыточном диске. Если же выйдет из строя сам избыточный носитель, то считывание информации будет все так же доступно (для этого контрольные суммы не нужны, что дает возможность считывания данных на довольно высоких скоростях, так как избыточный носитель не задействуется), а вот за надежность их сохранности поручиться уже нельзя. Самым распространенным типом массивов из этой троицы является RAID 3. RAID 2 менее популярен, так как применение специфического кода Хемминга требует несколько избыточных носителей (минимум 2), что приводит к, в принципе, совершенно неоправданному подорожанию всей системы. RAID 4 отличается от RAID 3 только большим размером используемых блоков. Для всех трех систем требуется как минимум 3 HDD.

RAID 5 является, пожалуй, самым удачным RAID-решением из всех существующих. Работая по системе блоков и контрольный сумм, такой массив не нуждается в дополнительном избыточном диске, располагая файлы с контрольными суммами на те же физических дисках, что и сами блоки. Например, на диске №2 хранятся контрольные суммы блоков, размещенных на дисках №1 и №3, на диске №1 – контрольные суммы блоков с дисков №n (где n – последний физический диск в цепочке) и №2 и т.д. В случае поломки одного из HDD восстановить утерянные данные можно с помощью соседних носителей. RAID 5 хорошо подходит для организации web-серверов и тому подобных баз массового хранения данных, так как обладает хорошей скорость оборота информации, при этом практически не имея избыточного пространства. Для организации RAID 5 нужно подключить как минимум 3 физических диска.

Все описанные RAID-системы могут быть как внутренними, так и внешними, оформленными в виде независимого файл-сервера. В плане обслуживания внешние блоки более удобны и практичны, но в то же время они обладают сравнительно высокой стоимостью.

Для полной картины упомянем еще такое понятие, как программный RAID – система, эмулирующая RAID-массив при использовании обычных IDE/SCSI-контроллеров. Толку от таких изысков немного, ведь все равно все усилия по обработке данных ложатся на центральный процессор, а поэтому ни о каком ускорении файлооборота не может быть и речи. Подобная возможность для организации RAID есть, к примеру, в Windows NT 4.0 Server.

Магнитооптические, оптические и ленточные накопители

В отличие от описанных выше RAID-систем, данные устройства в большей мере предназначены для длительного (вплоть до десятилетий) хранения информации, которая имеет статус архивной. Их высокая популярность легко объясняется соответствующим качеством и надежностью. Кроме всего этого они имеют еще один огромный плюс: возможность объединения в роботизированные библиотеки с автоматизированными системами контроля работы и замены носителей практически исключают из цепочки процесса резервирования человеческий фактор, что очень важно при функционировании в особо напряженных ситуациях и практически сводит на нет возможность случайной потери важных данных. К тому же такие библиотеки могут иметь вместительность в несколько терабайт и обладают гибкой системой размещения файлов, которая упрощает доступ к ним и увеличивает скорость передачи данных.

За пальму первенства в этом секторе с примерно равным успехом состязаются магнитооптические и ленточные (стримеры) накопители. Оптические же из-за своей медлительности и малой вместимости в основном используются только для создания резервных копий важной информации, которая уже больше не будет подвержена дальнейшей модификации. Но при всем при этом нельзя не выделить низкую стоимость их эксплуатации вообще и стоимость хранения удельной единицы информации на одном диске в частности.

Магнитооптические системы позволяют резервировать данные на извлекаемый из магнитооптического привода картридж большой вместимости (от 230 мегабайт до нескольких гигабайт). Они характеризуются неплохой скоростью работы и высоким коэффициентом многоразового использования – один и тот же картридж может выдержать до нескольких миллионов записей! Долговременность «жизни» некоторых картриджей очень высока – более 50 лет, а в среднем этот показатель составляет свыше 30 лет. Причем все это время они могут успешно выдерживать арктический мороз и суринамскую жару, пустынные ветра и тропические дожди – ничего с зарезервированными данными не случится. Все магнитооптические дисководы поддерживают стандарты обратной совместимости, то есть если привод поддерживает чтение/запись 2,6-гигабайтных устройств, то он сможет работать и с менее емкими картриджами или, как их еще называют, дискетами. Приводы могут подключаться как к IDE, так и к SCSI-контроллеру.

Ленточные накопители работают на основе старой, как электронный мир системы записи на магнитной ленте. Естественно, сегодняшние технологии в этой области уже практически не имеют ничего общего с теми кассетами, на которых вы бережно хранили «Бейсик» и подборку любимых игр к «Спектруму». С того времени в разы увеличены все параметры ленточной записи: скорость записи/считывания данных, объем, надежность, отказоустойчивость. Новые технологии гарантируют стримерной ленте максимальную защиту. Даже активная головка уже не касается к ленте, циркулирующей в картридже, что способствует еще большей продолжительности срока службы таких устройств. Главный недостаток стримерных систем – отсутствие единого формата записи, что является непреодолимой преградой при формировании макрогетерогенной сети.

WORM

Технология WORM (Write once read many – одноразовая запись и многократное чтение) когда-то выглядела очень перспективной. Она представлялась в виде CD-привода, который записывал компакт-диски повышенной емкости (до нескольких гигабайт). Но сейчас на нее уже мало кто обращает свое внимание, так как нацеленные на тот же сектор DVD-диски большинству специалистов представляются более привлекательными.

ZIP

Динозавр, который по всем канонам жизни должен умереть. Объемы, поддерживаемые ZIP-drive сегодня можно назвать разве что смехотворными, да и выгода от использования такого устройства не окупает вложенные средства. Поэтому целесообразности организации системы резервного копирования на основе ZIP сегодня нет.

NAS

NAS (Network Attached Storage – присоединенное к сети устройство хранения данных) является одной из самых перспективных разработок в области систем резервного копирования. Оно представляет собой так называемый «тонкий сервер», который содержит в себе только накопители информации и контроллеры, гарантирующие автономность существования устройства. NAS не нуждается в привычных для стационарных ПК атрибутах вроде клавиатуры, монитора или мыши, но в то же время не является и полноценным файловым сервером – оно выполняет одну единственную функцию, заключающуюся в записи, хранении и считывании файлов.

NAS может свободно работать не зависимо от центрального сервера, при этом будучи доступным для всех компьютеров в сети. Управление таким устройством организовано с помощью облегченных спецмодификаций FreeBSD или Linux, которые контролирую только обслуживание файлов. Сравнительно небольшие габариты при поистине гигантской вместимости и расширяемости делают такие «тонкие сервера» удачным решением для художников, дизайнеров, архитекторов и конструкторов, работающих в САПР-системах. Ведь им часто требуется обмениваться огромными файловыми массивами, и вот тут-то NAS подходит как нельзя лучше.

Скоростные качества NAS намного выше, чем у стримерных или магнитооптических устройств, но ниже, чем у специализированных файловых серверов. Включение NAS в сеть производится элементарно: устройство подключается к концентратору и получает персональный IP-адрес, после чего становится доступным для любой сетевой машины.

Если верить прогнозам специалистов, со временем NAS может полностью вытеснить устоявшиеся серверные стандарты в организации роутинга и сетевого доступа к файлам. Причем подобные предпосылки имеются уже сейчас.

SAN

SAN (Storage Area Network – выделенная сеть для хранения данных) являет собой разновидность локальной сети, которая предназначена исключительно для совершения файлооборота и резервного копирования информации. Архитектура SAN очень проста: она объединяет в себе в сходной с локальными сетями архитектуре все доступные устройства резервного копирования, RAID-массивы, стримерные и магнитооптические библиотеки и т.д. в замкнутое кольцо, в котором все устройства связаны по системе перекрестных ссылок, то есть все без исключения имеют доступ ко всем и каждому. Вокруг этого кольца строится традиционное серверное кольцо со всеми маршрутизаторами и хабами, которое с одной стороны соединено высокоскоростным каналом с SAN, а с противоположной – с обычными рабочими ПК. Обмен файлами в самой SAN возможен без задействования серверов, что, к примеру, очень важно при активизации функции резервного копирования. Подключение к SAN организуется по протоколу Fibre Channel.

Очень важно и то, что благодаря Fibre Channel SAN позволяет организовать монолитную сеть на больших расстояниях: до 30 метров при использовании медных кабелей и до 10 километров с оптоволоконными соединениями.

Выводы

В этом небольшом обзоре охвачено большинство современных технологий резервного копирования данных. Как видите, у каждого сектора есть как свои преимущества, так и недостатки. Баланс между желаемым и имеющимся можно составить только составив конкретные требования, а это в каждом случае сугубо индивидуально. Но если делать максимально обобщенные выводы, можно предположить, что для небольшого офиса будет достаточно RAID 1 или RAID 5 (впрочем, магнитооптические, оптические и стримерные устройства тоже никто не отменял), в то время как солидным организациям следует повнимательнее присмотреться к NAS и SAN. Тем более что за ними будущее в сфере систем резервного копирования.