Описание raid 50: Сравнение типов RAID, используемых в серверах и СХД
Когда использовать RAID 50
Что обычно знают о RAID 5? Отличный универсальный представитель RAID-массивов, имеющий некоторые ограничения в отношении емкости.
При использовании стандартных RAID-контроллеров (Adaptec, LSI и т.п.) максимальное количество дисков в RAID 5 составляет 32. Сейчас уже есть по-настоящему большие диски (HGST 10tb, полезная ёмкость равна 9313 Гигабайт/ 9,1 Терабайт). Взяв 32 таких диска по 10 Тбайт, получим RAID 5 с 281,8 Тбайт полезного объема. При этом объем, равный одному из дисков RAID 5, будет потрачен на контрольные суммы для обеспечения отказоустойчивости.
Такого объема домашний сервер интересует немногих. Однако с огромными массивами архивных, статистических и крупномасштабных данных все активнее работают компании, поэтому не исключено, что кому-то потребуется и такой монстр.
Даже если взять более реальный вариант, когда крупный сервер создают из меньших дисков, потому что большие слишком дороги, принципы создания такого сервера останутся теми же.
Обратимся к проблемам массива на 32 диска по 10 Тбайт.
Основные вопросы связаны с построением (build) и восстановлением (rebuild) RAID. Рассмотрим некоторые показатели для контроллера, работающего с дисками такого объема в подобном массиве.
- Размер блока данных (на диск, так называемого малого страйпа) — 256 Кбайт.
- Количество блоков на одном диске — 38 146 972.
- В большой блок (большой страйп, проходящий через все диски массива) входит 32 элемента по 256Кбайт (8 Мбайт).
- Для записи одной контрольной суммы RAID-массиву нужно будет прочитать данные с 31 диска, просчитать контрольную сумму и записать на 1 диск — по блокам.
- Умножаем на 38 миллионов блоков.
Нагрузка на диски получается очень высокой – из-за этого повышается вероятность выхода из строя еще одного диска и всего массива.
Проблема в том, что в операции задействованы все 31 диск. С одной стороны, это неплохая потоковая скорость чтения, с другой — длительное перестроение. Чтобы перестроить массив за 24 часа, диски должны считывать/записывать данные со скоростью как минимум 115 Мбайт/с. И хотя сейчас диски SATA и SAS уже близки к таким показателям считывания, до соответствующей скорости записи весьма далеко, поэтому на перестройку уйдет гораздо больше суток.
Если в процессе перестройки RAID 5 откажет еще один диск – придётся обращаться в компанию по восстановлению данных.
Выход – организация RAID 50 — комбинации массивов RAID 5, объединенных в RAID 0.
Рассмотрим принципы работы такого массива. В стандартном RAID 0 из группы единичных дисков формируют быстрый массив, где отдельные диски выступают его участниками. При этом каждый из них ничем не защищен — RAID 0 не предусматривает отказоустойчивости, которая реализуется двойным хранением блоков данных в RAID1/RAID10 или контрольными суммами в RAID5/RAID6. Если один из дисков выйдет из строя, результатом станет отказ всего массива.
В массиве RAID 50 каждый из участников RAID 0 верхнего уровня представляет собой массив RAID 5. Поэтому при отказе диска участник не выходит из строя, как в случае с RAID 0, а просто работает немного медленнее, поскольку массив меняет статус на «degraded».
Приведенные выше расчеты остаются теми же для отдельных дисков, зато количество дисков в большом блоке массива становится существенно ниже (как минимум наполовину), поэтому возрастает скорость во всех зонах.
Почему-то считается, что участников верхнего уровня для массивов RAID 10, 50 и 60 может быть только два. На самом деле, в указанных конфигурациях RAID это количество выбирается — 2, 3, 4. Как правило, чем их больше, тем лучше. С этой информацией вернемся к конфигурации на 32 диска.
Вместо того, чтобы собирать 32 диска в один массив RAID 5, создадим RAID 50 из двух RAID 5 по 16 дисков с RAID 0 верхнего уровня. Общая емкость будет на один диск меньше, зато существенно вырастут и производительность, и скорость перестроения.
Покажем это. На практике оказывается, что 32 дисков слишком много для эффективной работы алгоритма RAID 5. По скорости такой вариант уступает оптимальному – RAID 5 на 8–16 дисков. Поэтому RAID 5 на 16 дисков всегда быстрее той же конфигурации на 32 диска. А у нас теперь два массива RAID 5, объединенных в один.
Преимуществ сразу несколько. При перестроении RAID (при отказе диска) задействованы только 16 из 32 дисков. Вторая половина RAID 50 (еще 16 дисков в массиве RAID 5) в процессе не участвует. Поэтому перестроение идет намного быстрее, а производительность массива в целом не страдает так, как в случае с RAID 5 из 32 дисков.
Недостатки RAID 50 по сравнению с единым большим массивом RAID 5: при двух участниках массива верхнего уровня теряется объем еще одного диска.
Анализируя конфигурации RAID 50/60, опираемся на математику. Рассмотрим несколько вариантов.
RAID 50 с тремя участниками на 32 диска – не реализуется. Оптимальный вариант RAID 50 на трех участников— 30 дисков (3 участника по 10). Полезная емкость составит 27 дисков, зато массив будет (а) быстрее и (б) весьма быстрее в перестроении, чем любая из рассмотренных выше конфигураций.
RAID 50 на 32 диска с четырьмя участниками – реализуется. 4 диска придется выделить под контрольные суммы. При этом каждый массив RAID 5 (каждый участник) будет иметь 8 дисков и отличную скорость.Система обладает фантастической производительностью. Нет претензий и к скорости перестроения, а ее влияние на сервер сведено до минимума. Недостатки – стоимость выше, а емкость чуть ниже.
Итак, RAID 50 — это всегда компромисс: чем больше участников верхнего уровня, тем выше затраты и меньше емкость, зато заметно растет производительность. (Что с 32 дисками сделал бы автор ? Массив RAID 50 на 30 дисков и 3 участника, а два последних диска оставил бы в качестве резервных с горячей заменой).
Ответим на вопрос, вынесенный в заголовок. Насколько и когда целесообразно использование RAID 50? RAID 50 на большом количестве дисков большого объема – надежней, чем RAID 5, и экономичней, чем RAID 10.
Какой уровень RAID мне выбрать? — Энигма Энтер
Сегодня данные — самый ценный актив любого бизнеса. Потеря данных означает его конец. Даже если вы регулярно делаете резервирование, вы нуждаетесь в способе предохранения, который бы гарантировал, что ваши данные надежно защищены, и к ним можно постоянно обращаться, даже в случае отказа диска. Добавление RAID в вашу среду хранения данных — один из самых рентабельных способов обеспечить защиту данных и постоянный доступ к ним.
Введение
Описания уровней RAID
RAID 0 (Striping — чередование)
RAID 1 (Mirroring — зеркалирование)
RAID 1E (Striped Mirroring — зеркалирование с чередованием)
RAID 5 (Striping with parity — чередование с четностью)
RAID 5EE (Hot Space)
RAID 6 (Striping with dual parity — чередование с двойной четностью)
RAID 10 (RAID 1 с чередованием)
RAID 50 (RAID 5 с чередованием)
RAID 60 (RAID 6 с чередованием)
Сравнение уровней RAID
Об Adaptec RAID
Введение
Не смотря на то, что множество компаний предлагают RAID-решения, не все RAID одинаковы. Только Adaptec, благодаря более чем 24-м годам опыта развития SCSI, предлагает самую надежную RAID-защиту данных, доступную сегодня. Эта защита основана на RAID-коде, проверенном за годы использования в критичных окружающих средах и перепродающимся большинством лидирующих производителей компьютеров.
Чтобы выбирать правильный уровень RAID, начните c рассмотрения факторов, изложенных ниже. Каждый из этих факторов становится компромиссным решением для другого:
— Стоимость дисковых накопителей
— Требуемая защита данных или доступность данных (низкая, средняя, высокая)
— Требуемая производительность (низкая, средняя, высокая)
Стоимость решения всегда является результатом компромисса между объемом дискового пространства и доступностью данных или производительностью. Например, RAID 1/10 и RAID 6 при небольшом количестве дисков являются дорогостоящим решением, если рассматривать объем потерянного дискового пространства (50%), но оптимальным для обеспечения доступности данных.
Производительность также зависит от модели доступа (случайный/последовательный, чтение/запись, длинный/ короткий) и числа пользователей. Эта статья является кратким общим обзором производительности и доступности при различных уровнях RAID и не является точным отражением всевозможных сценариев использования.
Описания уровней RAID
RAID 0 (Striping — чередование)
Обеспечивает низкую стоимость и максимальную производительность, но не обеспечивает защиту от сбоев; отказ даже одного из дисков приводит к полной потере ВСЕХ данных. Бизнес использует RAID 0 обычно для задач, требующих быстрого доступа к большим объемам временных данных на дисках (таких как видео/аудио пост-продакшн, обсчет мультимедиа-данных, САПР, регистрация данных и пр.), где данные могут быть просто загружены заново без ущерба для бизнеса. При RAID 0 дисковое пространство используется на 100%, так как используются все доступные диски.
RAID 1 (Mirroring — зеркалирование)
Экономичное решение для двух дисков с высокой защитой от сбоев. RAID 1 состоит из двух дублирующих наборов данных, расположенных на двух отдельных дисках. Он также обеспечивает высочайшую доступность данных за счет поддержания двух одинаковых копий всех данных. В конфигурации должно быть как минимум два диска, недостатком, с точки зрения финансов, является то, что используемая емкость составляет всего половину емкости доступных дисков. RAID 1 обеспечивает защиту данных для всех сред, где абсолютная избыточность данных, доступность и производительность являются ключевыми факторами, а стоимость хранения гигабайта данных является вторичным фактором.
При RAID 1 емкость дискового пространства, пригодного для хранения, составляет 50% от емкости доступных дисков в RAID-массиве.
RAID 1E (Striped Mirroring — зеркалирование с чередованием)
Объединяет чередование данных RAID 0 с зеркалированием данных RAID 1. Данные, записанные на полосу на одном диске, зеркалируются на полосу на следующем диске массива. Основным преимуществом по сравнению с RAID 1 является то, что массивы RAID 1E могут создаваться при нечетном числе дисков.
При RAID 1E емкость дискового пространства, пригодного для хранения, составляет 50% от емкости доступных дисков в RAID-массиве.
Примечание: При четном числе дисков предпочтительным является использование RAID 10, который допускает отказы нескольких дисков. При нечетном числе дисков RAID 1E допускает отказ только одного диска.
RAID 5 (Striping with parity — чередование с четностью)
Технология с чередованием данных, созданная для обеспечения безотказного хранения данных, но без дублирования данных как RAID 1 и RAID 1E. Данные записываются с чередованием по всем дискам в массиве, но для каждой полосы данных (stripe) массива (один блок данных с каждого диска), один блок данных этой полосы зарезервирован для хранения четности, вычисленной для других блоков данных в этой полосе данных. Скорость чтения, поэтому очень хороша, однако есть проигрыш в скорости записи, т.к. четность должна пересчитываться и записываться при записи новых данных. Что бы преодолеть это узкое место, информация о четности для последовательных полос чередуется с данными по всем дискам массива.
RAID 5 является стандартом для серверных сред, требующих безотказной работы. Обеспечение четности RAID требует одного диска для набора RAID, так что емкость, пригодная для использования, будет всегда меньше на емкость одного диска, чем емкость всех доступных дисков. Это лучше, чем RAID 1, который имеет только 50% полезной емкости.
RAID 5 требует как минимум три диска, максимальное число дисков составляет 16. Полезная емкость при RAID 5 составляет от 67% до 94%, в зависимости от числа дисков в наборе RAID.
RAID 5EE (Hot Space):
Обеспечивается уровень защиты, как и при RAID 5 с более высокой скоростью ввода/вывода в секунду за счет использования дополнительного диска (hot spare), при этом данные эффективно распределяются на этом запасном диске, что улучшает ввод/вывод.
RAID 5EE распределяет емкость по N+1 дискам и представляет собой массив RAID 5 плюс стандартный диск hot spare. Это означает, что в нормальном режиме работы hot spare является активным участником, вместо того, чтобы крутиться вхолостую. Добавление диска hotspare к обычному массиву RAID 5 позволяет улучшить защиту данных за счет уменьшения времени на восстановление. Эта технология не предполагает максимального использования диска hot-spare, т.к. он работает вхолостую до момента отказа. Часто проходят многие годы, прежде чем диск hot-spare будет задействован. В частности, для небольших массивов RAID 5 использование дополнительного диска (например, четыре диска вместо трех) может существенно повысить скорость чтения.
Например, переход от RAID 5 с четырьмя дисками и hot spare к RAID 5EE с пятью дисками даст прирост производительности примерно в 25%.
Другой стороной RAID 5EE является то, что диск hotspare не может быть совместно использован несколькими физическими массивами как стандартный RAID 5 с hot-spare. Технология RAID 5 является более рентабельной для нескольких массивов, потому что она позволяет страховать одним диском hot-spare несколько физических массивов. Эта конфигурация уменьшает стоимость использования диска hot spare, обратной стороной является неспособность устранить одновременный отказ отдельных дисков на нескольких массивах. Этот уровень RAID способен выдержать отказ только одного диска.
Полезная емкость RAID 5EE составляет от 50% до 88%, в зависимости от числа дисков в наборе RAID. RAID 5EE требует как минимум четырех дисков, максимальное число дисков составляет 16.
RAID 6 (Striping with dual parity — чередование с двойной четностью)
Данные распределяются по нескольким дисковым накопителям, при этом для хранения и восстановления данных используется схема двойной четности. Это допускает отказ двух дисков в массиве, обеспечивая лучшую отказоустойчивость, чем RAID 5. Это также позволяет использовать более дешевые диски ATA и SATA для хранения критически важных данных.
Этот уровень RAID похож на RAID 5, но при этом включает вторую схему четности, которая распределяется по разным дискам и поэтому обеспечивает высочайшую защиту от ошибок и отказов дисков. RAID 6 может выдержать отказ двух дисков.
RAID 6 требует как минимум четыре диска и допускает использование максимально до 16 дисков. Полезная емкость всегда меньше на 2 диска, чем доступное число дисков в наборе RAID.
Примечание: в конфигурации с менее дорогими, но менее надежными дисками SATA, использующей RAID 6, возможно достичь гораздо более высокого уровня доступности, чем массив Fibre Channel, использующий RAID 5. Это потому, что диск второй четности в RAID 6 поможет выстоять при втором отказе во время восстановления. В RAID 5, ухудшенное состояние (состояние после отказа диска) и/или во время восстановления на диск hot spare является самым предрасположенным к потере данных. Если в этот момент происходит отказ второго диска, то данные уже невозможно восстановить. С RAID 6 нет никаких окон уязвимости, поскольку второй диск четности защищает от этого.
RAID 10 (RAID 1 с чередованием)
Объединяет чередование RAID0 и зеркалирование RAID1. Этот уровень обладает улучшенной производительностью чередования и избыточностью зеркалирования.
RAID 10 — это результат формирования массива RAID 0 из двух и более массивов RAID 1. Этот уровень RAID обеспечивает отказоустойчивость — допускается отказ одного диска для каждого суб-массива без потери данных.
Полезная емкость массива RAID 10 составляет 50% объема доступных дисковых накопителей.
RAID 50 (RAID 5 с чередованием)
Это комбинация нескольких наборов RAID 5 с RAID 0 (чередование). Чередование помогает увеличить емкость и производительность без добавления дисков в каждый массив RAID 5 (который бы ухудшал доступность данных и оказывал негативное влияние на производительность при ухудшенном режиме).
RAID 50 включает чередование RAID 0 на массивы RAID 5 нижнего уровня. Преимущества RAID 5 усиливаются RAID 0, позволяя объединять много дисков в единый логический диск. Допускается до одного отказа диска в каждом суб-массиве без потери данных. Также время восстановления гораздо меньше, чем при большом едином массиве RAID 5.
Полезная емкость RAID 50 колеблется от 67% до 94%, в зависимости от числа дисков в массиве RAID.
RAID 60 (RAID 6 с чередованием)
Это комбинация нескольких наборов RAID 6 с RAID 0 (чередование). Двойная четность допускает отказ двух дисков в каждом массиве RAID 6. Чередование помогает увеличить емкость и производительность без добавления дисков в каждый массив RAID 6 (который бы ухудшал доступность данных и оказывал негативное влияние на производительность при работе в ухудшенном режиме).
Данные и информация о четности записываются с чередованием по всем массивам RAID 6. Чтение может производиться одновременно с каждого диска в массиве.
Сравнение уровней RAID
Характеристики | Мин. число дисков | Защита данных | Произв. чтения | Произв. записи | Произв. чтения (ухудш. режим) | Произв. чтения (ухудш. режим) | Использ. емкости | Типичные приложения |
RAID 0 | 2 | Нет защиты | Высокая | Высокая | Не применимо | Не применимо | 100% | Высоко- производительные рабочие станции, регистрация данных, рендеринг в реальном времени, временные данные |
RAID 1 | 2 | Отказ одного диска | Высокая | Средняя | Средняя | Высокая | 50% | Операционная система, транзакционные базы данных |
RAID 1E | 3 | Отказ одного диска | Высокая | Средняя | Высокая | Высокая | 50% | Операционная система, транзакционные базы данных |
RAID 5 | 3 | Отказ одного диска | Высокая | Низкая | Низкая | Низкая | 67% — 94% | Хранилища данных, web- серверы, архивация |
RAID 5EE | 4 | Отказ одного диска | Высокая | Низкая | Низкая | Низкая | 50% — 88% | Хранилища данных, web- серверы, архивация |
RAID 6 | 4 | Отказ двух дисков | Высокая | Низкая | Низкая | Низкая | 50% — 88% | Архивация данных, резервирование на диски, решения с высокой доступностью, серверы, требующие больших емкостей |
RAID 10 | 4 | До одного отказа диска в каждому суб- массиве | Высокая | Средняя | Высокая | Высокая | 50% | Быстрые базы данных, серверы приложений |
RAID 50 | 6 | До одного отказа диска в каждому суб- массиве | Высокая | Средняя | Средняя | Средняя | 67% — 94% | Большие базы данных, файловые серверы, серверы приложений |
RAID 60 | 8 | До двух отказов дисков в каждом суб- массиве | Высокая | Средняя | Средняя | Низкая | 50% — 88% | Архивация данных, резервирование на диски, решения с высокой доступностью, серверы, требующие больших емкостей |
Типы RAID
Типы RAID | Software-Based | Hardware-Based | Внешнее аппаратное обеспечение |
Описание | Лучше использовать для приложений с большими блочными данными, такими как хранилища данных или потоковое видео. А также для серверов, в которых центральный процессор загружен не полностью, для обработки интенсивных операций ввода-вывода, что требуется для некоторых уровней RAID. Входят в состав ОС, таких как Windows(r), Netware и Linux. Все функции RAID выполняются центральным процессором хоста, что накладывает серьезные ограничения на его способность выполнять другие вычисления. | Лучше использовать для приложений с небольшим блочными данными, таких как транзак-ционные базы данных и web-серверы. Центральный процессор хоста освобождается от выполнения операций RAID, что увеличивает его производительность. Батарея резервирования write back cache (cache с отложенной записью) может существенно увеличить производительность без дополнительного риска потери данных. | Подключаются к серверу через стандартный контроллер. Функции RAID выполняются микропроцессором, находящемся во внешнем RAID-контроллере, не зависящим от хоста. |
Преимущества | Низкая цена Необходим стандартный контроллер | Защита данных и преимущества производительности RAID Больше мощных функций для обеспечения безотказности и увеличения производительности по сравнения с software-based RAID | Не зависит от ОС Создание систем хранения данных с высокой емкостью для высокопроизводительных серверов |
Об Adaptec RAID
Программное обеспечение RAID от Adaptec — это полностью протестированное, проверенное и заслужившее доверие программное решение, которое используется в миллионах важных бизнес-задач во всем мире. Также, наш закаленный программный код RAID это наиболее мощное и надежное программное обеспечение для защиты данных, доступное сегодня. Фактически, микросхемы Adaptec RAID используются в большинстве популярных бренд-серверов — более чем 1.5 миллионов серверов каждый год!
Adaptec, Inc. Adaptec — Россия
691 South Milpitas Boulevard Тел.: (+7) 495 956 9459
Milpitas, California 95035, USA Email: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Tel: (+1) 408 945-8600 Web: www.adaptec.com/ru Fax: (+1) 408 262-2533
Восстановление данных из поврежденного массива RAID 50 / Хабр
Многим компаниям требуются сервера с высокопроизводительной дисковой подсистемой большой емкости, которая достигается за счет использования большого количества высокопроизводительных дисков. Имеем случай, когда компания использовала решение из 10 HDD с интерфейсом SAS емкостью 600 GB, организованных в массив RAID 50 (полезная емкость массива 600*8=4800 GB). Данный RAID 50 представляет из себя комбинированный массив, который рассматриваем как два массива RAID 5, объединенных в массив RAID 0. Данное решение позволяет получить более высокую скорость записи на массив в сравнении с обычным RAID 5 с таким же количеством дисков-участников, потому что для формирования блока четности требуется меньшее число операций чтения с дисков участников (скоростью расчета самого блока четности можно пренебречь в силу того, что он представляет весьма малую нагрузку для современных RAID контроллеров). Также в RAID 50 в некоторых случаях отказоустойчивость будет выше, так как допустима потеря до двух дисков (при условии, что диски из разных массивов RAID 5, входящих в данный RAID). В рассматриваемом нами случае со слов системного администратора произошел отказ 2 дисков, которые привели к остановке RAID массива. Затем последовали действия системного администратора и сервисного отдела компании продавца сервера, которые не могут быть описаны в силу сбивчивых и противоречащих друг другу показаний.
В нашем случае диски пронумерованы представителем заказчика от 0 до 9 со словами: «именно в таком порядке они были использованы в массиве, и никто их местами не менял». Данное утверждение подлежит обязательной проверке. Также мы были поставлены в известность, что данный массив использовался в качестве хранилища для ESXi сервера, и на нем должно содержаться несколько десятков виртуальных машин.
Перед тем, как начать любые операции над дисками из массива, необходимо проверить их физическую целостность и исправность, а также создать копии и далее работать исключительно с копиями для безопасного проведения работ. При наличии серьезно поврежденных накопителей рассмотреть необходимость проведения работ по извлечению данных, то есть если серьезно поврежден только один накопитель, то необходимо выяснить посредством анализа массива, собранного из оставшихся дисков, содержал ли проблемный HDD актуальные данные, или им нужно пренебречь и получить недостающие данные за счет XOR операции над остальными участниками одного из RAID 5, в который входил данный диск.
Было выполнено создание копий, в результате которого выяснилось, что 4 накопителя имеют дефекты между LBA 424 000 000 и LBA 425 000 000, выражается это в виде нечитаемых нескольких десятков секторов на каждом из проблемных дисков. Непрочитанные сектора в копиях заполняем паттерном 0xDE 0xAD для того, чтобы потом была возможность идентификации пострадавших данных.
Первичный анализ подразумевает идентификацию RAID контроллера, к которому были подключены диски, точнее идентификацию расположения метаданных RAID контроллера, чтобы эти области не включать при сборке в массив.
В данном случае в последнем секторе каждого из дисков обнаруживаем характерные 0xDE 0x11 0xDE 0x11 c дальнейшей пометкой бренда RAID контроллера. Метаданные данного контроллера располагаются исключительно в конце LBA диапазона, какие-либо буферные зоны в середине диапазона данным контроллером не используются. На основании этого и предыдущих данных следует вывод, что сбор массива должен начинаться с LBA 0 каждого из дисков.
Зная, что суммарная емкость массива более 2 TB, проводим поиск в LBA 0 каждого из дисков таблицы разделов (защитной MBR)
и GPT заголовка в LBA 1.
В этом случае данных структур не обнаружено. Данные структуры обычно становятся жертвами необдуманных действий обслуживающего сервер персонала, который не отрабатывал ситуации отказа системы хранения данных и не изучал особенностей работы конкретного RAID контроллера.
Для дальнейшего анализа особенностей массива необходимо произвести на одном из дисков поиск регулярных выражений монотонно возрастающих последовательностей. Это могут быть как таблицы FAT или достаточно большой фрагмент MFT, так и иные удобные для анализа структуры. Зная, что на данном массиве содержались виртуальные машины с ОС Windows, мы можем предположить, что внутри данных машин использовалась файловая система NTFS. На основании этого проводим поиск записей MFT по характерному регулярному выражению 0x46 0x49 0x4C 0x45 с нулевым смещением относительно 512-байтного блока (сектора). В нашем случае после LBA 2 400 000 (1,2GB) обнаруживается достаточно протяженный (более 5000 записей) фрагмент MFT. В нашем случае размер записи MFT стандартный и составляет 1024 байт (2 сектора).
Локализуем границы найденного фрагмента с записями MFT и проверим наличие фрагмента с записями MFT в этих границах на остальных дисках-участниках массива (границы могут чуть-чуть отличаться, но не более чем на размер блока, используемого в RAID массиве). В нашем случае наличие записей MFT подтверждается. Листаем записи с анализом номеров (номер DWORD располагается по смещению 0x2C). Анализируем количество блоков, где возрастание номера записи MFT происходит с изменением на единицу, на основании этого рассчитываем размер блока, используемого в данном RAID массиве. В нашем случае размер составляет 0x10000 байт (128 секторов или 64KiB). Далее выберем среди записей MFT какое-либо из мест, где записи MFT или результат их XOR операции симметрично располагаются на всех дисках-участниках и составим матрицу с номерами записей, с которых начинаются блоки массива с удвоенным количеством строк.
По номерам записей определим какие из дисков входят в первый RAID 5, а какие во второй. Проверку корректности выполняем посредством XOR операции. В нашем случае согласно таблицы мы видим, что нумерация дисков представителем заказчика была сделана неверно, так как матрицы обоих массивов отличаются по расположению блока четности (обозначенного как “XOR”). Также видим, что в данном массиве нет задержки четности, так как с каждой строкой меняется положение блока четности.
Заполнив таблицу номерами записей MFT по указанным смещениями с каждого из дисков, можно перейти к заполнению удвоенной матрицы использования дисков. Удвоена она из-за того, что формировать матрицу мы начали в произвольном месте. Следующей задачей ставится определить с какой строки начинается правильная матрица. Задача легко выполнима, если взять первые пять смещений, указанные на рисунке выше и умножить на 8. Далее решить простой пример в виде а=a+b где стартовые значения a=0x0 b=0x280000 (0x280000=0x10000*0x28, где 0x28 является количеством блоков с данными, которые содержатся в матрице использования дисков) и решать его в цикле, пока он не достигнет одного из значений смещений умноженного на 8.
После построения матрицы использования дисков мы можем произвести сбор массива любыми доступными для этого средствами, умеющими работать с матрицей произвольного размера. Но такой вариант сбора массива не будет учитывать актуальности данных на всех дисках, в связи с чем необходимы дополнительные анализы для исключения диска содержащего неактуальные данные (он был первым исключен из массива).
Для определения неактуального диска обычно не требуется полный сбор массива. Достаточно собрать первые 10-100GB и проанализировать найденные структуры. В нашем случае оперируем началом массива из 20GB. Как уже писалось, защитная MBR и GPT на дисках отсутствуют, и, естественно, их нет в собранном массиве, но при поиске достаточно быстро можно найти magic блок VMFS, отняв от его позиции 0x100000 (2048 секторов), получим точку начала VMFS раздела. Определив положение fdc.sf (file descriptor system file), проведем анализ его содержимого. Во многих случаях анализ этой структуры позволит найти место, где присутствуют ошибочные записи. Сопоставив его с матрицей использования дисков, получим номер диска, содержащего неактуальные данные. В нашем случае этого оказалось достаточно и дополнительные аналитические мероприятия не потребовались.
Выполнив сбор массива целиком с компенсацией недостающих данных за счет XOR операции, получили полный образ массива. Зная локализацию дефектов и локализацию файлов виртуальных машин в образе, возможно установить, на какие именно файлы виртуальных машин приходятся дефекты. Выполнив копирование файлов виртуальных машин из VMFS хранилища, можем смонтировать их в ОС как отдельные диски и выполнить проверку целостности файлов, содержащихся в виртуальных машинах посредством поиска файлов, содержащих сектора с паттерном 0xDE 0xAD. Сформировав список поврежденных файлов работу по восстановлению информации из поврежденного RAID 50 можно считать завершенной.
Обращаю внимание, что в данной публикации намеренно не упомянуты профессиональные комплексы для восстановления данных, которые позволяют упростить работу специалиста.
Следующая публикация: Восстановление базы 1С Предприятие (DBF) после форматирования
Поддерживаемые уровни для RAID-контроллеры Intel®
Эти контроллеры Поддержка избыточный массив независимых дисков (RAID) уровней 0, 1, 5, 6, 10, 50 и 60. Ниже приведено краткое описание этих типов RAID. Вы можете найти дополнительные подробности в IT/IR, интегрированное Программное обеспечение Stack 3 Руководство пользователя.
Уровень 0 : Этот уровень, часто называемый чередованием, представляет собой метод сопоставления данных, ориентированный на производительность. Данные, записываемые в массив, делятся на полосы и записываются через диски массива. Эта процедура обеспечивает высокую производительность ввода-вывода при низкой стоимости, но не обеспечивает избыточности.
Уровень 1 : Этот уровень, часто называемый зеркальным отображением, обеспечивает избыточность, записывая идентичные данные каждому диску-члену массива. Уровень 1 работает с двумя дисками, которые могут использовать параллельный доступ для высокой скорости передачи данных при чтении, но чаще работает независимо, чтобы обеспечить высокую скорость операций ввода-вывода. Уровень 1 обеспечивает очень хорошую надежность данных и улучшает производительность для приложений с интенсивным считыванием, но при сравнительно высокой стоимости. Минимальное количество дисков — два.
Уровень 5 : RAID уровня 5 является наиболее распространенным типом RAID. При распределении четности по некоторым или всем дискам-членам массива RAID уровня 5 устраняет узкое место записи, присущее уровню 4. Как и на уровне 4, результатом является Асимметричная производительность, при этом операции чтения значительно превышены. Уровень 5 часто используется с кэшированием обратной записи для уменьшения асимметрии. Так как данные четности должны быть пропущены на каждом диске во время операций чтения, производительность для операций чтения, как правило, значительно ниже, чем в массиве уровня 4. Минимальное количество дисков — три.
Уровень 6 : RAID уровня 6 расширяет RAID 5, добавив блок контроля четности. Поэтому он использует чередование на уровне блоков с двумя блоками четности, распределенными по всем дискам-членам. Цель этого дублирования заключается в повышении отказоустойчивости; RAID 6 может обрабатывать сбой любых двух дисков в массиве, в то время как другие одиночные уровни RAID могут обрабатывать не более одного сбоя. Производительность-мудрый, RAID 6, как правило, немного хуже, чем RAID 5 с точки зрения записи из-за добавленной накладной больше расчетов четности, но может быть немного быстрее в случайных чтений из-за распространения данных на еще один диск. Минимальное количество жестких дисков — три.
Уровень 10 : RAID уровня 10 использует функции уровней 1 и 0. Преимуществом является более быстрый доступ к данным (например, RAID 0) и отказоустойчивость одного диска (например, RAID 1). RAID 10 требует в два раза больше дисков (например, RAID 1), но он предлагает некоторые улучшения производительности за счет чередования, а затем зеркального отображения чередующихся массивов. RAID 10 обшивки блоков данных на каждый массив RAID 1. Каждый массив RAID 1 затем дублирует свои данные на другой диск. Минимальное количество дисков — четыре.
Уровень 50 : Уровень RAID 50 использует функции уровней 5 и 0. RAID 50 включает в себя как четность, так и чередование дисков между несколькими группами дисков. RAID 50 лучше всего реализуется на двух дисковых массивах RAID 5 с данными, чередующихся по обоим массивам. RAID 50 может поддерживать от одного до четырех сбоев дисков при сохранении целостности данных, если каждый неисправный диск находится в другом массиве RAID 5. Минимальное количество дисков — шесть.
Уровень 60 : Уровень RAID 60 использует функции уровней 6 и 0. Массив RAID 60 объединяет прямую чередование блочного уровня RAID 0 с распределенным двойным паритетом RAID 6. То есть массив RAID 0, чередующийся между элементами RAID 6. Виртуальный диск RAID 60 может пережить потерю двух дисков в каждом из наборов RAID 6 без потери данных. Он лучше всего работает с данными, требующими высокой надежности, высокой скоростью запросов, высокой передачей данных и емкостью от среднего до большого. Минимальное количество дисков — восемь.
Уровни «RAID» 0, 1, 2, 3, 4, 5, 6, 7 и что они означают
Хранение данных требует наличия безопасного и защищенного хранилища, обладающего значительным доступным внутренним дисковым пространством и способного уберечь любую информацию от повреждения или случайной потери. Массив «RAID» в полной мере отвечает предъявляемым требованиям, и далее мы подробнее остановимся на его описании, принципах работы, доступных вариантах конечного конструктивного исполнения, преимуществах и отдельных недостатках.
Содержание
Введение
Стремительное развитие компьютерных технологий послужило стимулом не только к созданию и повсеместному внедрению в разнообразные сферы деятельности пользователей современных образцов персональных компьютерных устройств, но и привело к развитию новейших образцов различных комплектующих.
Применение усовершенствованных элементов для внутреннего наполнения компьютерных устройств позволило существенно увеличить потенциал и, заложенные производителями, функциональные способности конечных изделий, совокупно позволяющие значительно увеличить как уровень взаимодействия пользователей, так и производительность при исполнении любых высоко затратных и трудоемких вычислительных операций, сводя время поиска, обработки и ввода-вывода данных к минимуму.
Массовое задействование компьютерных устройств привело к стремительному росту, регулярно используемых пользователи для решения востребованных задач, информационных материалов, вариант представления которых представляет собой электронно-цифровой формат. Существующие ресурсы переводятся, а новые изначально создаются в поддерживаемом компьютерными устройствами виде отображения. Доступный объем пользовательских цифровых данных постоянно увеличивается и требует наличия универсальных и безопасных способов хранения, способных обеспечить прямой непосредственный мгновенный доступ к любым востребованных электронным ресурсам без задержек и сбоев.
Возможностей внутреннего набора запоминающих устройств, используемых в персональных компьютерах и ноутбуках для хранения данных часто становиться недостаточно. И пользователи вынуждены задействовать новые технологические решения, позволяющие организовать сохранность данных на высоком уровне защищенности и доступа при соответствующем обращении.
Одной из востребованных технологий, доступной на данный момент, безусловно является методология «RAID» (избыточный массив независимых дисков) – это способ хранения одних и тех же данных в разных местах на нескольких жестких дисках или твердотельных накопителях, предотвращающий возможную утрату пользовательских материалов в случае непредвиденного сбоя одного из запоминающих дисковых носителей. Система, состоящая из избыточного числа запоминающих устройств, подразумевает разную форму организации массива дисков и представлена отличительными вариантами уровневого построения «RAID», каждый из которых имеет свои преимущества и недостатки. Несмотря на то, что основной целью технологии виртуализации дисков «RAID» является обеспечение надежного способа хранения информации, не все модели массивов настроены на обеспечение избыточности, позволяющей возвращать утраченные компоненты. И далее мы подробнее рассмотрим принципы функционирования и доступные варианты представления «RAID».
Как работает
«RAID»?
Главный основополагающий принцип работы «RAID» заключается в размещении пользовательских данных на нескольких дисках. Данный подход позволяет операциям ввода-вывода («I / O»), напрямую связанными с передачей данных на компьютер или с компьютера, сбалансированным образом перекрывать друг друга, существенно улучшая итоговую производительность. Поскольку использование нескольких дисков, технологическое условие заложено в системе «RAID» по умолчанию, увеличивает среднее время между отказами «MTBF» («Mean Time Between Failures» – это показатель надежности аппаратного продукта или компонента, значение которого для большинства элементов обычно составляет тысячи или даже десятки тысяч часов между отказами, например, для жестких дисков среднее время наработки на отказ может варьироваться в пределах 300000 часов), избыточное хранение данных как следствие повышает отказоустойчивость. Данный критерий надежности имеет огромное значение, так как отвечает за способность системы обеспечивать бесперебойное обслуживание «RAID» и предотвращать катастрофический сбой, несмотря на отказ одного или нескольких компонентов.
«RAID-массивы» отображаются в операционной системе в виде единого логического диска и, в зависимости от выбранной спецификации, используют методы зеркалирования или чередования дисков. Функция зеркалирования копирует идентичные данные на более чем один диск доступного массива, что позволяет при поломке отдельного накопителя вернуть утраченные данные. Чередование разделов помогает распределять информационные материалы по нескольким дискам. Дисковое пространство каждого диска, непосредственно предназначенное для хранения, разделено на блоки в соответствии с единым размером от сектора («512 байт») до нескольких мегабайт. И заполнение информацией блоков происходит адресно и поочередно, вследствие чего значительно повышается общая скорость и производительность. Варианты зеркалирования и чередования могут выступать как отдельными уровнями «RAID», так и объединены в единый общий массив с различными внутренними характерными параметрами.
В однопользовательской системе, где хранятся большие записи, блоки обычно устанавливаются небольших размеров (возможно, «512 байт»), чтобы одна запись была расположена на всех доступных дисках и к ней можно было быстро получить доступ, осуществляя операцию чтения одновременно сразу со всех дисков.
В многопользовательской системе, для повышения производительности, требуется достаточно большой единичный блок, позволяющий размещать записи типичного или максимального размера и разрешающий осуществлять перекрывающиеся, между задействованными накопителями, дисковые операции ввода-вывода данных.
«RAID-контроллер»
Контроллер «RAID» представляет собой специализированное устройство, применяемое для управления жесткими дисками в воссозданном массиве хранения. Он может использоваться как инструмент взаимодействия между операционной системой и физическими дисками, представляя группы задействованных накопителей в качестве логических единиц. Использование контроллера «RAID» может повысить производительность и помочь защитить данные в случае сбоя или поломки отдельного носителя.
«RAID-контроллер» может быть представлен как в виде аппаратного средства, так и реализован программно с помощью соответствующих сервисных системных приложений. В аппаратном варианте исполнения «RAID», физический контроллер непосредственно напрямую управляет массивом, поддерживает разнообразные стандарты физического подключения и передачи данных, такие как «SATA» и интерфейс «SCSI».
В программном «RAID-массиве» контроллер использует ресурсы аппаратной системы, такие как центральный процессор и оперативная память. Несмотря на то, что он выполняет те же функции, что и аппаратный «RAID-контроллер», программный «RAID-контроллер» не всегда способен обеспечить значительное повышение производительности, и в свою очередь может влиять на производительность других приложений на сервере.
Поскольку программный «RAID» обрабатывается за счет внутренних способностей устройства, он медленнее аппаратного «RAID». Однако, поскольку аппаратный вариант требует приобретения дополнительного оборудования, программный «RAID» стоит дешевле.
Если программная реализация дискового пространства «RAID» не совместима с загрузочным процессом системы, а аппаратные «RAID-контроллеры» слишком дороги, то в качестве приемлемого варианта можно рассмотреть организацию «RAID» массива на основе драйверов или микропрошивки.
В микропрограммном варианте, «RAID-контроллер» встроен в материнскую плату сервера и все операции выполняются центральным процессором, аналогично программному «RAID», и после загрузки операционной системы драйвер контроллера переходит на обеспечение функций «RAID». Встроенный «RAID-контроллер» не такой дорогой, как его аппаратный аналог, вынесенный в отдельное устройство, но он увеличивает нагрузку на процессор компьютера, что может сказаться на общей производительности.
Уровни
«RAID»
«RAID» устройства, согласно установленной спецификации, будут использовать разные версии организации совместного дискового пространства, называемые уровнями. В оригинальной классификации, которая описывает непосредственно термин «RAID» и концепцию его установки, определены шесть уровней «RAID» – от «0» до «5». Подобная простая пронумерованная система позволила компьютерным специалистам различать между собой версии построения массивов «RAID». Однако количество существующих уровней с тех пор увеличилось и, для удобства, варианты уровней «RAID» были разделены на три основные категории: «базовые», «комбинированные» и «нестандартные». И далее мы рассмотрим каждую категорию более подробно и ознакомимся с ее основными представителями.
Базовые уровни
«RAID»
«RAID 0»
«RAID 0» (чередование дисков) – данный уровень задействует процесс разделения массива данных на единичные блоки с последующим их распределением по нескольким устройствам хранения, таким как жесткие диски («HDD») или твердотельные накопители («SSD»), объединенных в совокупную группу. Блоки распределяются последовательно и содержат каждый свою часть данных на отдельном диске.
Поскольку чередование распределяет данные по большему количеству физических дисков, несколько дисков могут получить доступ к содержимому файла, что позволяет быстрее выполнять операции записи и чтения соответственно. Однако, в отличие от других уровней, «RAID 0» не имеет четности. Чередование дисков без данных четности в свою очередь не имеет избыточности или отказоустойчивости. Это означает, что в случае сбоя диска все данные на нем будут потеряны.
Системы хранения выполняют чередование дисков по-разному. Система может чередовать данные на уровне байтов, блоков или разделов, или чередовать данные на всех или некоторых дисках кластера. Например, система хранения с десятью жесткими дисками может разделить блок размером «64 килобайта» («КБ») на первом, втором, третьем, четвертом и пятом дисках, а затем начать снова с первого диска. Другая система может удалить «1 мегабайт» («МБ») данных на каждом из десяти дисков, прежде чем вернуться на первый диск, чтобы повторить процесс.
«RAID 0» лучше всего использовать для хранилища, наличие защиты от потери данных в котором не критично, но требуется поддержка высокоскоростного режима чтения и записи. Кэширование потокового видео в реальном времени и редактирование видео композиций – основные области применения уровня построения массива «RAID 0» по причине востребованности в повышенных показателях скорости и производительности. Чередование дисков без избыточности данных также может быть использовано для временных данных или в ситуациях, когда основная копия данных легко восстанавливается с другого устройства хранения.
«RAID 1»
Зеркальное отображение дисков, также известное как «RAID 1», представляет собой обязательное размещение данных на два или более дисков, составляющих единый массив, с последующей синхронизацией содержимого копий. Однако функция чередования в данном варианте построения массива запоминающих устройств отсутствует. Зеркальное отображение диска – хороший выбор для приложений, требующих высоких значений производительности и доступности, например, ответственных за финансовые операции, отправку и получение электронной почты, функционирование операционной системы. Зеркальное отображение успешно работает как с жесткими дисками, так и с твердотельными накопителями.
Поскольку каждый диск, из входящих в массив, находится в рабочем состоянии, данные могут считываться с них одновременно, что значительно увеличивает скорость чтения. Массив «RAID 1» будет полноценно функционировать даже если останется работоспособным только один диск. Операции записи, однако, медленнее, потому что каждая операция записи выполняется отдельно для каждого диска (в случае наличия массива из двух дисков запись будет выполнена дважды).
Зеркальное копирование дисков особенно полезно для сценариев аварийного восстановления, поскольку обеспечивает мгновенное восстановление требуемых, для критически важных приложений, данных сразу после отказа диска. Если первичные диски в массиве повреждены или не могут быть использованы, произойдет переключение на вторичные или зеркальные резервные диски, обладающие работоспособными копиями, и функционирование приложений, обращающихся к востребованным данным, не будет нарушено.
«RAID 2»
Данная конфигурация хранилища данных использует чередование дисков, в дополнение к которому выделены некоторые отдельные диски, хранящие информацию о проверке и исправлении ошибок («ECC»). Данный код исправления ошибок позволяет производить анализ данных, которые считываются или пересылаются, и, при необходимости, исправлять их непосредственно во время процесса передачи. «RAID 2» также использует выделенную четность кода Хемминга для обнаружения и коррекции ошибок. Но поскольку современные жесткие диски также используют само контролирующийся код Хемминга, то уровень «RAID 2» теперь считается устаревшим. В дополнение стоит отметить, что «RAID 2» не имеет преимуществ перед следующим вариантом организации дискового массива «RAID 3», и поэтому больше не используется.
«RAID 3»
Данный единый формат организации дискового массива использует чередование и выделяет один диск, из доступного объединения накопителей, для хранения информации о четности, которая ответственна за проверку целостности посредством определения, были ли данные потеряны или перезаписаны при непосредственном перемещении из одного места хранилища в другое или в момент передачи между компьютерами. Встроенная информация «ECC» используется для обнаружения ошибок, а восстановление данных осуществляется путем расчета эксклюзивной информации, записанной на других дисках.
Поскольку информация о четности находится на отдельном диске, а операция ввода-вывода обращается ко всем дискам одновременно, то при выполнении многочисленных небольших запросов данных «RAID 3» не работает должным образом. По этой причине данный массив лучше всего подходит для однопользовательских систем с длительной последовательной передачей данных, таких как обработка и передача потоковых мультимедийных ресурсов, графических материалов или исполнение операций по редактированию видео композиций.
«RAID 4»
Данная конфигурация массива «RAID» использует выделенный диск четности и чередование на уровне блоков между несколькими дисками, что позволяет пользователям осуществлять операции чтения записей с любого отдельного диска. Однако, поскольку все записи должны идти на выделенный диск четности, производительность данного процесса существенно снижена. Варианты «RAID 4», а также представленные ранее «RAID 3» и «RAID 2» в современных системах обычно не используются.
«RAID 5»
Избыточный массив конфигурации независимых дисков подобного формата основан в соответствии с принципом чередования на уровне блоков четности. Данные и информация о четности распределяются равномерно по всем дискам, что влечет за собой снижение критичной уязвимости отдельного запоминающего накопителя из организованного объединения, и позволяет массиву «RAID 5» функционировать даже в случае сбоя какого-нибудь одного диска, а также даже восстановить данные за счет чередования, утраченные с проблемного устройства. В «RAID 5» информация о четности хранится по диагонали на всех дисках массива. В случае отказа одного из дисков исходные данные рассчитываются на основе информации о четности, оставшейся на остальных действующих запоминающих устройствах набора.
Преимущества «RAID 5» в первую очередь заключаются в его совместном использовании чередования дисков и четности, что позволяет добиться существенного повышения пропускной способности и продуктивности совместно с высоким уровнем надежности.
Архитектура массива «RAID 5» позволяет равномерно и сбалансированно выполнять операции чтения и записи на нескольких дисках, и, в настоящее время, данный вид массива является одним из наиболее часто используемых форматов организации «RAID». Он имеет более полезное хранилище, чем конфигурации «RAID 1» и «RAID 10», и обеспечивает уровень работоспособности, эквивалентный параметрам массива «RAID 0». Группы «RAID 5» имеют минимум три жестких диска («HDD»), но часто, из соображений эффективности, рекомендуется использовать как минимум пять дисков. Поскольку данные о четности распределены по всем дискам, «RAID 5» считается одной из самых безопасных конфигураций «RAID».
Массивы «RAID 5» обычно считаются плохим выбором для использования в системах с интенсивной записью из-за влияния на производительность, связанного с записью данных четности. Когда диск выходит из строя, восстановление массива «RAID 5» может занять довольно много времени.
«RAID 6»
Данный формат организационного построения объединенного дискового пространства, также известный как «RAID с двойным контролем четности», очень похож на предыдущий уровень «RAID 5», но дополнительно включает в себя вторую схему четности, диагонально распределенную по дискам в массиве. Архитектурное построение «RAID 6» представляет собой одну из нескольких схем «RAID», которая функционирует, размещая данные на нескольких дисках и позволяя операциям ввода/вывода («I / O») перекрываться сбалансированным образом. Использование дополнительной четности позволяет массиву продолжать свое функционирование, даже если два диска выходят из строя одновременно. Однако повышенный уровень защищенности влияет в сторону снижения на производительность массива, которая ниже чем в формате хранилища «RAID 5».
Избыточный массив дисков «RAID 6» обеспечивает очень высокую отказоустойчивость и может использоваться в средах, где требуется длительный период хранения данных, таких как архивирование.
Комбинированные уровни
«RAID»
Некоторые уровни «RAID» относятся, согласно установленной классификации, к категории комбинированных «RAID». Данные образцы организационного и конструктивного построения запоминающих устройств в формате единого массива представляют собой вариативное сочетание уже существующих базовых уровней «RAID». И далее мы рассмотрим несколько примеров распространенных и популярных комбинированных массивов.
«RAID 10» («RAID 1 + 0»)
«RAID 10», также известный как «RAID 1 + 0», представляет собой конфигурацию «RAID», которая объединяет для защиты данных зеркалирование диска и чередование дисков. Требуется минимум четыре диска, в которых данные чередуются на зеркальных парах. Пока один диск в каждой зеркальной паре функционирует, данные могут быть извлечены. В случае сбоя двух дисков в одной зеркальной паре все данные будут потеряны из-за отсутствия четности в чередующихся наборах.
Конфигурация «RAID 1» обеспечивает только защиту данных путем копирования всей информации с одного диска на другой. Данные полностью защищены, так как зеркальная копия доступна, если исходный диск отключен или поврежден. Поскольку данные полностью дублируются, массив «RAID 1» требует в два раза больше емкости, чем необходимо для исходных данных. «RAID 0» не обеспечивает никакой защиты данных, и его основная единственная цель заключается в повышении производительности. Это достигается путем распределения данных по двум или более дискам, чтобы несколько головок чтения / записи на дисках могли одновременно записывать или получать доступ к частям данных, что ускоряет общую обработку.
«RAID 10» обеспечивает избыточность данных и повышает продуктивность, и безусловно является хорошим вариантом для приложений с интенсивным вводом-выводом данных, включая электронную почту, удаленные хранилища и базы данных, операций, требующих высокой производительности диска, и организаций, простои в функционировании которых исключены.
Высокая эффективность «RAID 10» и его способность ускорять как операции записи, так и чтения, делают его подходящим для часто используемых, критически важных, серверов баз данных. Однако минимальные требования по комплектации в количестве четырех дисков делают «RAID 10» дорогостоящим выбором для небольших вычислительных сред, поскольку это влечет за собой стопроцентную нагрузку на хранилище, что может быть слишком затратно для малого бизнеса или для персонального личного использования.
«RAID 01» («RAID 0 + 1»)
Комбинированный формат конструкционного построения дискового пространства «RAID 0 + 1» аналогичен, ранее представленному, «RAID 1 + 0» за исключением того, что данный метод организации данных обладает одним существенным отличием. Вместо чередования зеркалированных массивов, совокупный уровень «RAID 0 + 1» создает массив типа «RAID 1», состоящий из двух вложенных массивов типа «RAID 0». Данный формат представления подразумевает использование четного количества дисков. Общий уровень продуктивности и, заложенной возможностями массива, эффективности объединения запоминающих устройств «RAID 01», в сравнении с образцом «RAID 10», при одинаковых параметрах практически идентичен, но отказоустойчивость варианта «RAID 01» несколько ниже, поэтому данный вид массива практически не задействуется.
«RAID 03» («RAID 0 + 3», также известный как «RAID 53» или «RAID 5 + 3»)
Представленный уровень комбинированного массива дисков использует чередование (в стиле базового уровня «RAID 0») для блоков виртуальных дисков конструктивного формата «RAID 3». Данный метод совокупной организации обеспечивает более высокую производительность, чем у массива «RAID 3», однако существенно влияет на конечную стоимость в сторону ее увеличения.
«RAID 50» (другое известное название «RAID 5 + 0»)
Данная конфигурация сочетает в себе распределенную четность «RAID 5» с чередованием «RAID 0» для повышения производительности задействованного варианта «RAID 5» без снижения защиты данных. Конструктивно, архитектура массива требует для полноценного функционирования наличия минимум шести дисков. Порядок организации совокупного дискового пространства на основе массива «RAID 50» обеспечивает гораздо лучшую производительность записи, повышенную защиту данных и более быстрое восстановление, чем базовый уровень «RAID 5». Продуктивность и суммарная эффективность не снижаются так сильно, как в массиве «RAID 5», поскольку один сбой влияет только на один массив. Совокупно, можно преодолеть до четырех отказов дисков, если каждый не отвечающий диск находится в отдельном массиве «RAID 5». Недостатком «RAID 50» является лишь тот факт, что массиву нужен сложный контроллер. Наилучший вариант использования «RAID 50» подразумевает его задействование для приложений, требующих высокой надежности.
Нестандартные уровни
«RAID»
Главной отличительной особенностью указанных уровней массивов от базовых типов «RAID» безусловно является их непосредственные разработка, отдельными компаниями или организациями, и последующее использование уникальной конфигурации «RAID», являющейся авторской собственностью создателей, в проприетарных целях. И далее мы представим несколько таких примеров.
«RAID 7»
Нестандартный уровень «RAID», торговая марка которого принадлежит компании «Storage Computer Corporation». Массив конструктивно исполнен на основе базовых уровней «RAID 3» и «RAID 4» с добавлением операции кеширования. «RAID 7» включает в себя встроенную операционную систему реального времени в качестве контроллера, ответственную за запуск кода для исполнения заложенных функций, кеширование по высокоскоростной шине с использованием оперативной памяти и другие характеристики для управления доступом к диску и потоком данных.
Адаптивный
«RAID»
Данный вариант организационного построения массива наделяет «RAID-контроллер» приоритетным правом определять порядок сохранения четности на дисках. Принятие решения будет основываться на сравнении двух уровней «RAID 3» и «RAID 5», и напрямую зависеть от того, какой тип «RAID-набора» будет работать лучше с типом данных, записываемых на диски.
«Linux MD RAID 10»
Предлагаемый уровень, предоставляемый ядром «Linux», поддерживает создание комбинированных и нестандартных «RAID-массивов» и позволяет управлять «RAID-устройствами» с помощью соответствующего прикладного функционального инструментария. Программный «RAID» для «Linux» также может поддерживать создание стандартных конфигураций, таких как «RAID 0», «RAID 1», «RAID 4», «RAID 5» и «RAID 6».
Преимущества
«RAID»
Безусловно, технология избыточных массивов независимых дисков «RAID» обладает рядом преимуществ, и далее мы выделим перечень основных из них.
Повышение экономической эффективности, поскольку в больших количествах используются недорогие накопители на жестких магнитных дисках.
Совокупное использование нескольких жестких дисков позволяет «RAID» повысить производительность каждого единичного элемента итогового массива.
Увеличение скорости и надежности компьютера, а также защищенности данных после сбоя одного из дисковых составляющих «RAID-хранилища», в зависимости от конфигурации.
Операции чтения и записи данных с использованием массива формата «RAID 0» могут выполняться значительно быстрее, чем на одиночном жестком диске. Увеличение и прирост скоростных показателей достигается за счет конструктивной организации массива, позволяющей равномерно распределять и разделять по дискам информационные блоки данных с последующим совместным к ним обращением.
При использовании массива «RAID 5» повышается доступность, выраженная в увеличении продолжительности безошибочной работы, и отказоустойчивость.
Задействование функции зеркалирования позволяет «RAID-массивам» иметь полностью идентичную копию оригинальных данных на отдельном диске и гарантирует, что один из накопителей продолжит работать, в случае сбоя или необратимого повреждения другого.
Недостатки использования
«RAID»
Несмотря на наличие многих действительно востребованных и важных преимуществ, у «RAID-массивов» также присутствуют и отдельные недостатки. Некоторые из них представлены далее в следующем упорядоченном списке.
Комбинированные уровни «RAID» более дорогие в реализации, чем традиционные базовые уровни «RAID», поскольку для их организации требуется большее количество дисков.
Стоимость комбинированного варианта «RAID-массива» в пересчете на единицу хранения данных (гигабайт) выше, поскольку многие диски используются для резервирования.
Когда происходит сбой диска, вероятность того, что другой диск в массиве также скоро выйдет из строя возрастает, что может привести к существенной потере данных. Данное следствие вытекает из утверждения, что все диски в «RAID-массиве» часто монтируются одновременно, принадлежат одной партии и имеют единые функциональные характеристики, поэтому подвержены одинаковому износу и обладают идентичным временным и ресурсным интервалом безотказной работы.
Некоторые уровни «RAID» (например, «RAID 1» и «RAID 5») могут выдержать отказ только одного накопителя.
Массивы «RAID» и расположенные там данные находятся в уязвимом состоянии до тех пор, пока неисправный диск не будет заменен, а новый диск не заполнен соответствующим информационным наполнением.
Поскольку современные образцы запоминающих устройств теперь обладают гораздо большей изначальной емкостью, чем в период первого внедрения массивов «RAID», то для восстановления неисправных дисков, составляющих конструктивную основу массива, уже требуется гораздо больше времени.
Если происходит сбой диска, то существует вероятность, что оставшиеся накопители массива могут содержать поврежденные сектора или нечитаемые данные, способные привести к дальнейшей невозможности осуществить полное восстановление утраченной информации.
Несмотря на потенциальные недостатки, комбинированные уровни «RAID» способны решать перечисленные проблемы за счет обеспечения большей степени избыточности, тем самым значительно снижая вероятность сбоя на уровне массива из-за одновременных отказов дисков.
История
«RAID»
Термин «RAID» был внедрен и впервые задействован в 1987 году Дэвидом Петтерсоном (David A. Patterson), Рэнди Кацем (Randy H. Katz) и Гартом А. Гибсоном (Garth A. Gibson). В своем техническом отчете от 1988 года «A Case for Redundant Arrays of Inexpensive Disks (RAID)» они утверждали, что массив недорогих дисков может превысить производительность лучших дисков того времени и существенно превзойти по объему, скорости и устойчивости работы самые дорогие экземпляры. А используя избыточность, «RAID-массив» может быть более надежным, чем любой другой диск.
В то время данный отчет был первым свидетельством, где официально упоминается общее название концепции «RAID». Однако использование избыточных дисков уже обсуждалось ранее другими специалистами. Гас Герман и Тед Грунау из «Geac Computer Corporation» впервые упомянули идею и представили ее в формате «MF-100». Норман Кен Оучи из «IBM» подал патент в 1977 году на технологию, которая впоследствии получила название «RAID 4». В 1983 году «Digital Equipment Corporation» представила диски, которые затем получат наименование «RAID 1», а в 1986 году был подан еще один патент «IBM» на формат, который станет уровнем «RAID 5». Петтерсон, Кац и Гибсон также дополнительно изучали, что предлагают такие компании, как «Tandem Computers», «Thinking Machines» и «Maxstor», для определения понятия и параметров спецификации «RAID».
Несмотря на то, что уровни «RAID», перечисленные в отчете 1988 года, по существу дают названия технологиям, которые уже используются, создание общей терминологии для данной концепции помогло стимулировать рынок хранения данных к разработке большего количества продуктов для «RAID-массивов».
По словам Каца, термин «недорогой» («Inexpensive») в начальном варианте аббревиатуры («Redundant Array of Inexpensive Disks») вскоре был заменен на «независимый» («Independent») отраслевыми продавцами, потому как диапазон применяемых дисков был существенно расширен и представлен разнообразными, по своим возможностям и характеристикам, образцами.
Будущее
«RAID»
Избыточный массив независимых дисков «RAID» не совсем утратил свою актуальность, но многие аналитики сходятся во мнении, что в последние годы данная технология виртуализации данных устарела. По мере увеличения емкости диска, которая постоянно возрастает за счет внедрения новых технологий и конструкционных решений, автоматически повышается вероятность развития разнообразных видов ошибок с массивом «RAID». С целью устранения возможных недостатков массивов используются другие альтернативные варианты, одним из которых является технология «Стирающий код» («Erasure code»), обеспечивающая лучшую защиту данных (хотя и по более высокой цене) и предоставляющая возможность восстановить данные в случае их повреждения или потери.
Рост числа твердотельных накопителей («SSD») также влияет на снижение востребованности пользователями массивов «RAID». «SSD» не имеют движущихся частей и не выходят из строя так часто, как жесткие диски. В массивах на основе дисков «SSD» часто используются такие алгоритмы, как например, выравнивание износа, следящий за равномерностью распределения нагрузки на блоки при записи информации, а не задействуются возможности «RAID» для защиты данных. Инфраструктура гипермасштабных вычислений, устанавливающая высочайшие стандарты производительности и доступности, часто ассоциирующаяся с облачными вычислениями и огромными центрами обработки данных, также устраняет необходимость в «RAID» массивах, предоставляя резервные сервера в качестве альтернативной замены избыточных дисков.
Тем не менее, «RAID» остается укоренившейся частью хранилища данных, и крупные поставщики технологий все еще выпускают продукты «RAID». «IBM» выпустила технологию «IBM Distributed RAID» со своим программным обеспечением «Spectrum Virtualize V7.6», который обещает повысить производительность массива и эффективность хранения данных в средах, где сервер «IBM» является основным хранилищем. Последняя версия технологии «Intel Rapid Storage» поддерживает «RAID 0», «RAID 1», «RAID 5» и «RAID 10», а программное обеспечение для управления «NetApp ONTAP» использует «RAID» для защиты от трех одномоментных отказов дисков. Платформа «Dell EMC Unity» также поддерживает «RAID 1/0», «RAID 5» и «RAID 6».
Заключение
Стремительное развитие компьютеризированных технологий повлияло не только на массовость и распространенность разнообразных образцов персональных компьютерных устройств, максимально полно задействованных в настоящее время для исполнения востребованных пользовательских операций, но и послужило стимулом к воссозданию информационных материалов в электронно-цифровом формате представления.
Объем регулярно используемых пользователями данных неуклонно растет, и требует безопасных и надежных способов хранения с мгновенным прямым доступом к востребованной информации при соответствующей необходимости.
В полной мере обеспечить достижение озвученных целей способна технология виртуализации данных «RAID», объединяющая несколько физических дисковых накопителей в единый логический модуль, и обеспечивающая высокие уровни отказоустойчивости, производительности и защищенности расположенных там данных.
Технология «RAID» стремительно развивается и дополняется новыми образцами готовых массивов дисков, обладающие каждый собственными преимуществами и недостатками, а также рассчитанными на использование в определенных приоритетных областях возможного применения.
Используя сведения из данного руководства, пользователи смогут разобраться в понятии избыточного массива дисков, получить представление о разнообразии доступных уровней «RAID» и определить для себя наиболее приемлемый вариант конечного конструкционного исполнения массива, исходя из персональных потребностей и доступных возможностей.
RAID для «чайников» и не только
KDV, iBase.ru, 26.11.2004, последнее обновление – 27.02.2009.
Со времени первой публикации статьи, на forum.ibase.ru в ее обсуждении появилась масса интересных сообщений. Так что после чтения статьи рекомендую обязательно просмотреть топик на форуме.
В интернете есть масса статей с описанием RAID. Например, эта описывает все очень подробно. Но как обычно, читать все не хватает времени, поэтому надо что-нибудь коротенькое для понимания – а надо оно или нет, и что лучше использовать применительно к работе с СУБД (InterBase, Firebird или что то иное – на самом деле все равно). Перед вашими глазами – именно такой материал.
Примечание. Сейчас есть хорошая статья о RAID в Википедии.
В первом приближении RAID это объединение дисков в один массив. SATA, SAS, SCSI, SSD – неважно. Более того, практически каждая нормальная материнская плата сейчас поддерживает возможность организации SATA RAID. Пройдемся по списку, какие бывают RAID и зачем они. (Хотел бы сразу заметить, что в RAID нужно объединять одинаковые диски. Объединение дисков от разных производителей, от одного но разных типов, или разных размеров – это баловство для человека, сидящего на домашнем компьютере).
RAID 0 (Stripe)
Грубо говоря, это последовательное объединение двух (или более) физических дисков в один «физический» диск. Годится разве что для организации огромных дисковых пространств, например, для тех, кто работает с редактированием видео. Базы данных на таких дисках держать нет смысла – в самом деле, если даже у вас база данных имеет размер 50 гигабайт, то почему вы купили два диска размером по 40 гигабайт, а не 1 на 80 гигабайт? Хуже всего то, что в RAID 0 любой отказ одного из дисков ведет к полной неработоспособности такого RAID, потому что данные записываются поочередно на оба диска, и соответственно, RAID 0 не имеет средств для восстановления в случае сбоев.
Конечно, RAID 0 дает ускорение в работе из-за чередования чтения/записи.
RAID 0 часто используют для размещения временных файлов.
RAID 1 (Mirror)
Зеркалирование дисков. Если Shadow в IB/FB это программное зеркалирование (см. Operations Guide.pdf), то RAID 1 – аппаратное зеркалирование, и ничего более. Упаси вас от использования программного зеркалирования средствами ОС или сторонним ПО. Надо или «железный» RAID 1, или shadow.
При сбое тщательно проверяйте, какой именно диск сбойнул. Самый частый случай погибания данных на RAID 1 – это неверные действия при восстановлении (в качестве «целого» указан не тот диск).
Насчет производительности – по записи выигрыш 0, по чтению – возможно до 1.5 раз, т. к. чтение может производиться «параллельно» (поочередно с разных дисков) . Для баз данных ускорение мало, в то время как при параллельном обращении к разным (!) частям (файлам) диска ускорение будет абсолютно точно.
RAID 1+0
Под RAID 1+0 имеют в виду вариант RAID 10, когда два RAID 1 объединяются в RAID 0. Вариант, когда два RAID 0 объединяются в RAID 1 называется RAID 0+1, и «снаружи» представляет собой тот же RAID 10.
RAID 2-3-4
Эти RAID являются редкими, т. к. в них используются коды Хэмминга, либо разбиение байт на блоки + контрольные суммы и т. п., но общее резюме таково – эти RAID дают только надежность, при 0-вом увеличении производительности, и иногда даже ее ухудшении.
RAID 5
Для него нужно минимально 3 диска. Данные четности распределяются по всем дискам массива
Обычно говорится, что «RAID5 использует независимый доступ к дискам, так что запросы к разным дискам могут выполняться параллельно». Следует иметь в виду, что речь идет, конечно, о параллельных запросах на ввод-вывод. Если такие запросы идут последовательно (в SuperServer), то конечно, эффекта распараллеливания доступа на RAID 5 вы не получите. Разумеется, RAID5 даст прирост производительности, если с массивом будут работать операционная система и другие приложения (например, на нем будет находиться виртуальная память, TEMP и т. п.).
Вообще RAID 5 раньше был наиболее часто используемым массивом дисков для работы с СУБД. Сейчас такой массив можно организовать и на SATA дисках, причем он получится существенно дешевле, чем на SCSI. Цены и контроллеры вы можете посмотреть в статьях
Причем, следует обратить внимание на объем покупаемых дисков – например, в одной из упомянутых статей RAID5 собирается из 4-х дисков объемом 34 гиг, при этом объем «диска» получается 103 гигабайта.
Тестирование пяти контроллеров SATA RAID – http://www.thg.ru/storage/20051102/index.html.
Adaptec SATA RAID 21610SA в массивах RAID 5 – http://www.ixbt.com/storage/adaptec21610raid5.shtml.
Почему RAID 5 — это плохо — https://geektimes.ru/post/78311/
Внимание! При закупке дисков для RAID5 обычно берут 3 диска, по минимуму (скорее из-за цены). Если вдруг по прошествии времени один из дисков откажет, то может возникнуть ситуация, когда не удастся приобрести диск, аналогичный используемым (перестали выпускаться, временно нет в продаже, и т. п.). Поэтому более интересной идеей кажется закупка 4-х дисков, организация RAID5 из трех, и подключение 4-го диска в качестве резервного (для бэкапов, других файлов и прочих нужд).
Объем дискового массива RAID5 расчитывается по формуле (n-1)*hddsize, где n – число дисков в массиве, а hddsize – размер одного диска. Например, для массива из 4-х дисков по 80 гигабайт общий объем будет 240 гигабайт.
Есть интересное мнение по поводу «непригодности» RAID5 для баз данных. Как минимум его можно рассматривать с той точки зрения, что для получения хорошей производительности RAID5 необходимо использовать специализированный контроллер, а не то, что есть по умолчанию на материнской плате.
Статья RAID-5 must die. И еще о потерях данных на RAID5.
Примечание. На 05.09.2005 стоимость SATA диска Hitachi 80Gb составляет 60 долларов.
RAID 10, 50
Дальше идут уже комбинации из перечисленных вариантов. Например, RAID 10 это RAID 0 + RAID 1. RAID 50 – это RAID 5 + RAID 0.
Интересно, что комбинация RAID 0+1 в плане надежности оказывается хуже, чем RAID5. В копилке службы ремонта БД есть случай сбоя одного диска в системе RAID0 (3 диска) + RAID1 (еще 3 таких же диска). При этом RAID1 не смог «поднять» резервный диск. База оказалась испорченной без шансов на ремонт.
Для RAID 0+1 требуется 4 диска, а для RAID 5 – 3. Подумайте об этом.
RAID 6
В отличие от RAID 5, который использует четность для защиты данных от одиночных неисправностей, в RAID 6 та же четность используется для защиты от двойных неисправностей. Соответственно, процессор более мощный, чем в RAID 5, и дисков требуется уже не 3, а минимум 5 (три диска данных и 2 диска контроля четности). Причем, количество дисков в raid6 не имеет такой гибкости, как в raid 5, и должно быть равно простому числу (5, 7, 11, 13 и т. д.)
Допустим одновременный сбой двух дисков, правда, такой случай является весьма редким.
По производительности RAID 6 я данных не видел (не искал), но вполне может быть, что из-за избыточного контроля производительность может быть на уровне RAID 5.
См. неплохую статью про RAID 6.
Rebuild time
У любого массива RAID, который остается работоспособным при сбое одного диска, существует такое понятие, как rebuild time. Разумеется, когда вы заменили сдохший диск на новый, контроллер должен организовать функционирование нового диска в массиве, и на это потребуется определенное время.
Во время «подключения» нового диска, например, для RAID 5, контроллер может допускать работу с массивом. Но скорость работы массива в этом случае будет весьма низкой, как минимум потому, что даже при «линейном» наполнении нового диска информацией запись на него будет «отвлекать» контроллер и головки диска на операции синхронизации с остальными дисками массива.
Время восстановления функционирования массива в нормальном режиме напрямую зависит от объема дисков. Например, Sun StorEdge 3510 FC Array при размере массива 2 терабайта в монопольном режиме делает rebuild в течение 4.5 часов (при цене железки около $40000). Поэтому, при организации массива и планировании восстановления при сбое нужно в первую очередь думать именно о rebuild time. Если ваша база данных и бэкапы занимают не более 50 гигабайт, и рост в год составляет 1-2 гигабайта, то вряд ли имеет смысл собирать массив из 500-гигабайтных дисков. Достаточно будет и 250-гигабайтных, при этом даже для raid5 это будет минимум 500 гигабайт места для размещения не только базы данных, но и фильмов. Зато rebuild time для 250 гигабайтных дисков будет примерно в 2 раза меньше, чем для 500 гигабайтных.
Резюме
Получается, что самым осмысленным является использование либо RAID 1, либо RAID 5. Однако, самая частая ошибка, которую делают практически все – это использование RAID «подо все». То есть, ставят RAID, на него наваливают все что есть, и … получают в лучшем случае надежность, но никак не улучшение производительности.
Еще часто не включают write cache, в результате чего запись на raid происходит медленнее, чем на обычный одиночный диск. Дело в том, что у большинства контроллеров эта опция по умолчанию выключена, т.к. считается, что для ее включения желательно наличие как минимум батарейки на raid-контроллере, а также наличие UPS.
Текст
В старой статье hddspeed.htmLINK (и в doc_calford_1.htmLINK) показано, как можно получить существенное увеличение производительности путем использования нескольких физических дисков, даже для IDE. Соответственно, если вы организуете RAID – положите на него базу, а остальное (temp, OS, виртуалка) делайте на других винчестерах. Ведь все равно, RAID сам по себе является одним «диском», пусть даже и более надежным и быстродействующим.
признан устаревшим. Все вышеупомянутое вполне имеет право на существование на RAID 5. Однако перед таким размещением необходимо выяснить – каким образом можно делать backup/restore операционной системы, и сколько по времени это будет занимать, сколько времени займет восстановление «умершего» диска, есть ли (будет ли) под рукой диск для замены «умершего» и так далее, т. е. надо будет заранее знать ответы на самые элементарные вопросы на случай сбоя системы.
Я все-таки советую операционную систему держать на отдельном SATA-диске, или если хотите, на двух SATA-дисках, связанных в RAID 1. В любом случае, располагая операционную систему на RAID, вы должны спланировать ваши действия, если вдруг прекратит работать материнская плата – иногда перенос дисков raid-массива на другую материнскую плату (чипсет, raid-контроллер) невозможен из-за несовместимости умолчательных параметров raid.
Размещение базы, shadow и backup
Несмотря на все преимущества RAID, категорически не рекомендуется, например, делать backup на этот же самый логический диск. Мало того что это плохо влияет на производительность, но еще и может привести к проблемам с отсутствием свободного места (на больших БД) – ведь в зависимости от данных файл backup может быть эквивалентным размеру БД, и даже больше. Делать backup на тот же физический диск – еще куда ни шло, хотя самый оптимальный вариант – backup на отдельный винчестер.
Объяснение очень простое. Backup – это чтение данных из файла БД и запись в файл бэкапа. Если физически все это происходит на одном диске (даже RAID 0 или RAID 1), то производительность будет хуже, чем если чтение производится с одного диска, а запись – на другой. Еще больше выигрыш от такого разделения – когда backup делается во время работы пользователей с БД.
То же самое в отношении shadow – нет никакого смысла класть shadow, например, на RAID 1, туда же где и база, даже на разные логические диски. При наличии shadow сервер пишет страницы данных как в файл базы так и в файл shadow. То есть, вместо одной операции записи производятся две. При разделении базы и shadow по разным физическим дискам производительность записи будет определяться самым медленным диском.
Обсудить статью на форуме
Производительность RAID
Делая аудит производительности систем на базе 1С, мы очень
часто сталкиваемся со значительными проблемами в дисковой системе, вызванными
неправильной ее архитектурой. Поэтому мы решили создать специальный RAID-калькулятор, который позволяет просчитать потенциальную производительность
дисковой подсистемы и облегчить процесс ее проектирования. Конечно же, кроме
дисковой подсистемы важно правильно подобрать и другие компоненты серверной
платформы, процесс подбора которых хорошо описан в статье Проектирование сервера 1С.
RAID-калькулятор
Реализация дисковых подсистем может быть довольно
разнообразная: могут использоваться локальные диски, подключенные к встроенному
контроллеру, или использоваться внешний контроллер, а также могут использоваться
системы SAN (СХД, Storage). Но во всех способах реализации диски объединяются в
логические пулы, которые называются RAID-массивами. Такое объединение решает в
основном вопрос сохранности данных, т.е. в случае выхода из строя одного из
дисков логического массива – он продолжает работать без остановки сервиса, а
главное без потери данных. А также объединение дисков в пул может решать вопрос
производительности пула, например, RAID 0 значительно увеличивает скорость
чтения, но при этом увеличивает вероятность выхода из строя массива.
Итак, RAID – это технология виртуализации данных,
которая объединяет несколько дисков в логический элемент для повышения
отказоустойчивости и повышения производительности.
IOPS
Важным показателем производительности дисковой подсистемы
является количество элементарных операций в единицу времени (IOPS), которые
может выполнить диск. Для дисковой подсистемы это операции чтения и записи
данных. При планировании нагрузки для дисковой подсистемы важно представлять,
какую нагрузку будет давать тот или иной сервис на дисковую подсистему. Обычно
такие значения выводятся эмпирическим путем согласно уже полученного опыта на
подобных проектах.
Поэтому рассчитывая количество дисков и тип RAID-массива,
важно обращать внимание на нагрузку по IOPS. Важно заметить, что считается общее
количество IOPS, которые потом нужно разделить на операции чтения и операции
записи, так, например, на СУБД серверах разделение будет 80% на запись и 20% на
чтение, а на файловых серверах наоборот 70% чтения и 30% записи, но все зависит
от сервиса, который будет размещаться. Также стоит заметить, что значение IOPS
для каждого диска, приведенные ниже в Таблице 1, приблизительные, поскольку
разные операции дают разную нагрузку, например, последовательная запись блоками
данных по 4к даст значительно больший показатель IOPS, чем случайное чтение
блоками по 128К. Кроме того, производительность дисковой подсистемы измеряется
не только количеством IOPS, но и очередью диска, откликом и другими счетчиками,
о которых мы расскажем чуть ниже.
Диск | Количество IOPS |
SATA 7200 | 100 |
SAS 10000 | 140 |
SAS 15000 | 210 |
SSD | 8600 |
Таблица 1. Примерное значение IOPS в разрезе дисков
Также в расчете IOPS для RAID-массивов использовались
пенальти для каждого типа массива. Например, в RAID 1 для записи данных
происходит две операции на один диск и на второй диск, поэтому такой массив
имеет пенальти 2. В RAID 5 для записи данных происходит 4 операции: чтение
данных, чтение четности RAID, запись данных, запись четности, поэтому пенальти
составляет 4. Для массивов 50, 60, 61 рассчитывался кумулятивный эффект для
составляющих RAID массивов. Значение пенальти Raid приведены в Таблице 2.
Виды RAID-массивов
Существует несколько распространенных разновидностей RAID
Массивов (см. Таблицу 2).
Таблица 2. Наиболее распространенные типы RAID-массивов
RAID 60 и 61 являются комбинированием RAID-массивов 0 и 1
соответственно, сегментами которого вместо отдельных дисков являются массивы
RAID 6. Такие массивы наследуют все преимущества и недостатки составляющих их
RAID-массивов. На практике наиболее распространенными RAID-массивами являются
RAID 1, RAID 5 и RAID 10.
Показатели производительности дисковой подсистемы
Проверка производительности дисковой подсистемы должна
проводиться на основе следующих показателей:
% Активности диска
Показывает процент общей загруженности диска. Представляет из
себя сумму значений счетчиков — процент активности диска при чтении и процент
активности диска при записи. При использовании RAID-массивов часто можно увидеть
значения этого счетчика больше 100%.
% Бездействия диска
Показывает время простоя диска, т.е. время, в течении
которого диск оставался в состоянии покоя, не обрабатывая операции чтения
\записи. В отличии от предыдущего показателя лежит строго в диапазоне от 100%
(полный покой) до 0% (полная загрузка).
Обращений к диску
Этот показатель как раз и показывает количество IOPS.
Предельные значения как раз и указаны в расчетах. Показатель можно
детализировать на обращения к диску при записи и при чтении.
Среднее время обращения к диску
Среднее время в секундах, требуемое для выполнения диском
одной операции чтения или записи. Складывается из значений времени на обращение
при чтении и времени на обращение при записи.
Средняя длина очереди диска
Средняя длина очереди диска отображает количество операций
диска, поставленное в очередь за определенный интервал времени. Это значение
рассчитывается на основе закона Литтла, согласно которому количество запросов,
ожидающих обработки, в среднем равняется частоте поступления запросов,
умноженной на время обработки запроса.
Текущая длина очереди диска
Показывает количество операций с диском, которые ожидают
обработки на текущий момент времени.
Скорость обмена с диском
Значение, которое показывает среднее количество байт на
чтение/запись, отправленных на диск за одну секунду.
Средний размер одного обмена с диском
Количество байт, передаваемое за одну IOPS. Определяется как
среднеарифметическое за период времени.
Расщеплений ввода/вывода на диск
Частота разбиения операций записи/чтения на несколько
операций. В случае большой фрагментации диска будут запрашиваться большие блоки
и вызывать увеличение показателя.
Таким образом, для правильной архитектуры дисковой подсистемы
важно сформировать требования к отказоустойчивости массива, которые зависят от
важности размещенной на дисках информации, а также спрогнозировать
приблизительную нагрузку в IOPS для формирования надежной и производительной
масштабируемой системы.
Сервисы на базе платформы 1С при работе с диском генерируют
значительно большее количество операций записи, чем чтения, поэтому для
максимального быстродействия дисковая подсистема должна иметь наибольшее
количество IOPS и наименьшее значение пенальти для RAID-массива.
Мы в своей работе рекомендуем использовать следующие RAID
массивы:
- RAID 1 для формирования дисковой подсистемы для ОС.
- RAID 10 для хранения 1С баз и данных, требования к скорости записи у которых
высокие. - RAID 5 для хранения файловых данных.
EFSOL
Системная интеграция. Консалтинг
RAID 50 предлагает баланс производительности, емкости хранилища и целостности данных
RAID 50 — это часто упускаемый из виду уровень RAID, который может преодолеть разрыв, когда дело доходит до выбора между RAID 5, RAID 6 и RAID 10. Скотт Лоу объясняет, почему RAID 50 является его любимым уровнем RAID.
RAID 50 — мой любимый уровень RAID. Хотя поддержка RAID 50 есть не в каждом продукте (например, мой EMC AX4 в Вестминстерском колледже не поддерживает RAID 50), я считаю, что RAID 50 обеспечивает отличный баланс между производительностью хранилища, емкостью хранилища и целостностью данных, который не обязательно находится в другие уровни RAID.
Если вы раньше не использовали RAID 50, вас ждет угощение. Являясь одним из множества существующих многоуровневых вариантов RAID, RAID 50 работает путем разделения (RAID 0) данных между несколькими наборами RAID 5 (, рис. A, ).
Рисунок A
Схема RAID 50
Как вы можете видеть на диаграмме, существует три набора RAID 5, которые охватывают всего 12 дисков. Каждый набор RAID 5 состоит из четырех дисков, при этом емкость одного диска предназначена для информации о четности. В приведенном выше примере это означает, что каждый набор RAID потеряет 25% своей общей емкости из-за информации о четности, как это было бы в случае развертывания одного набора RAID 5 с четырьмя дисками.Красота RAID 50 заключается в «0» части уровня RAID; здесь информация распределяется по каждому из этих базовых отдельных наборов RAID 5.
Есть ряд причин, по которым мне нравится RAID 50, но есть также компромиссы с использованием этого уровня RAID. Вот некоторые плюсы и минусы использования RAID 50.
Место на диске
RAID 5 требует 1 / # дискового пространства на каждый RAID-массив. На рисунке A это означало бы, что если бы все 12 дисков были в одном наборе RAID 5, у вас осталось бы 11 дисков.При использовании RAID 50 вам необходимо выделить один диск для каждого базового массива для обеспечения четности, поэтому у вас останется меньше полезного пространства, чем было бы, если бы вы просто использовали RAID 5.
Однако, если вы сравните RAID 50 и RAID 10, вы увидите явного победителя в RAID 50 с точки зрения емкости. С RAID 10 вы всегда теряете 50% своей емкости из-за зеркалирования. Поскольку для каждого базового массива RAID 5 требуется как минимум три диска (правила RAID 5), и вы теряете емкость одного диска из-за четности, вы никогда не «потеряете» более 33% своей общей емкости при использовании RAID 5.По мере увеличения размера каждого набора RAID 5 этот процент потерь уменьшается. На рисунке A с четырьмя дисками, используемыми в каждом наборе RAID 5, 25% емкости используется для накладных расходов на четность; если вы сделаете это пять дисков на набор RAID 5, этот процент упадет до 20%. По мере того, как этот процент падает, ваш риск увеличивается.
Для
RAID 50 требуется массив как минимум из шести дисков — два массива RAID 5 по три диска в каждом. Мне нравится использовать три или четыре набора дисков RAID 5 в массивах RAID 50.
Риск
При использовании RAID 5 по мере увеличения количества дисков в массиве повышается вероятность полного отказа массива, поскольку одновременно выходит из строя более одного диска.По мере того, как вы переходите на территорию RAID 50, это дополнительное дисковое пространство, от которого вы отказываетесь, напрямую приводит к снижению риска, поскольку системы RAID 50 могут страдать от нескольких сбоев дисков — до тех пор, пока эти сбои дисков происходят в нужных местах.
С RAID 50, если вы столкнетесь с множественными сбоями диска в любом из базовых массивов RAID 5, весь RAID 50 будет поджарен; однако каждый отдельный массив RAID 5 может выдержать потерю одного диска. Вы никогда не захотите, чтобы одновременно выходило из строя более одного диска, независимо от конфигурации RAID, но, по крайней мере, с RAID 50 ваши шансы гораздо выше, что сбой второго диска не произойдет в том же массиве, что и первый сбой.Это одна из причин, по которой имеет смысл сохранять отдельные массивы RAID 5 небольшими (максимум три или четыре диска). Чем больше дисков вы добавите в отдельные массивы RAID 5, тем выше риск потери двух дисков в одном массиве.
Помните, что «0» в RAID 50 обеспечивает отказоустойчивость без ; вся отказоустойчивость происходит на индивидуальном уровне RAID 5. Часть RAID 0 действительно помогает с производительностью.
Производительность
RAID 50 не работает так же хорошо, как RAID 10, когда дело доходит до производительности в ухудшенном состоянии (т.е.е., во время перестройки), но RAID 50, по крайней мере теоретически, работает намного лучше, чем RAID 5, по общей производительности записи; это помещает RAID 50 между RAID 10 (победитель по производительности) и RAID 5 (иногда низкая производительность, в зависимости от рабочей нагрузки) в спектре производительности. Фактическая производительность обычно зависит от выбора RAID-контроллера и типа обрабатываемой информации.
Подобно RAID 10 и RAID 5, RAID 50 обеспечивает отличную производительность чтения.
Сводка
Когда дело доходит до достижения баланса между стоимостью хранилища, риском и производительностью, немногие уровни RAID доходят до RAID 50 по следующим причинам:
- Хранение. Хотя RAID 50 использует больше служебного пространства, чем RAID 5, он требует гораздо меньше служебных данных, чем RAID 10, что делает его хорошим промежуточным выбором.
- Риск. Используя только RAID 5, организации рискуют выйти из строя второго диска, который может поставить под угрозу весь массив. RAID 50 смягчает эту проблему, поскольку несколько дисков могут выйти из строя, если они правильные.
- Производительность. Хотя общая производительность чтения / записи сильно зависит от ряда факторов, RAID 50 должен обеспечивать лучшую производительность записи, чем только RAID 5.
Хотите быть в курсе сообщений Скотта Лоу на TechRepublic?
Выбор правильных конфигураций RAID
Выбор правильных конфигураций RAID — какой уровень RAID вам подходит?
»Введение >>
» Что такое RAID? >>
»Аппаратный RAID и программный RAID >>
» Как работает RAID? >>
»RAID-совместимые жесткие диски и твердотельные накопители >>
» Гибридный RAID >>
»Кому следует использовать RAID? >>
»Выбор правильного уровня RAID >>
» RAID 0 (чередование) >>
»RAID 1 (зеркалирование) >>
» RAID 1E (чередование зеркал) >>
»RAID 5 (чередование с контролем четности) >>
»RAID 6 (чередование с двойной четностью) >>
» RAID 10 (чередование и зеркалирование) >>
»RAID 50 (чередующиеся наборы RAID 5) >>
» RAID 60 (чередующиеся наборы RAID 6) >>
»Когда какой уровень RAID использовать >>
»Размер диска >>
» Размер массива в зависимости от размера дисков >>
»Время восстановления и большие массивы RAID >>
» Настройки RAID по умолчанию >>
»SSD и кэш чтения / записи >>
»О Microsemi Adaptec® RAID
» Резюме >>
Введение
Для любой организации, будь то малый бизнес или центр обработки данных, потеря данных означает потерю бизнеса.Существует два распространенных метода защиты этих данных: резервное копирование (защита данных от полного сбоя системы, вирусов, повреждения и т. Д.) И RAID (защита данных от сбоя диска). Оба необходимы для обеспечения безопасности ваших данных.
В этом техническом документе обсуждаются различные типы доступных конфигураций RAID, их использование и способы их внедрения в серверы данных.
ПРИМЕЧАНИЕ. RAID не заменяет регулярное резервное копирование по расписанию. У всех организаций и пользователей всегда должна быть надежная стратегия резервного копирования.
Что такое RAID?
RAID (избыточный массив недорогих дисков) — это структура хранения данных, которая позволяет системному администратору / проектировщику / строителю / пользователю объединить два или более физических запоминающих устройства (жесткие диски, твердотельные накопители или и то, и другое) в логическую единицу (массив), которая воспринимается подключенной системой как один диск.
Есть три основных элемента RAID:
- Чередование (RAID 0) записывает некоторые данные на один диск, а некоторые данные на другой, сводя к минимуму время доступа для чтения и записи и улучшая производительность ввода-вывода.
- Mirroring (RAID 1) реплицирует данные на два диска, предотвращая потерю данных в случае сбоя диска.
- (RAID 5 и 6) обеспечивает отказоустойчивость, проверяя данные на двух дисках и сохраняя результаты на третьем. При замене неисправного диска потерянные данные восстанавливаются с оставшихся дисков.
Контроль четности
Эти уровни RAID можно сконфигурировать в виде комбинированных уровней, называемых RAID 10, 50 и 60.
Контроллер RAID обрабатывает объединение дисков в эти различные конфигурации, чтобы максимизировать производительность, емкость, избыточность (безопасность) и стоимость в соответствии с потребностями пользователя.
Сравнение аппаратного RAID и программного RAID
RAID может быть аппаратным или программным. Аппаратный RAID находится на плате контроллера PCIe или на встроенном в материнскую плату RAID-on-Chip (ROC). Контроллер обрабатывает все функции RAID в собственном аппаратном процессоре и памяти. ЦП сервера не загружен рабочей нагрузкой хранилища, поэтому он может сосредоточиться на обработке требований к программному обеспечению операционной системы и приложений сервера.
Плюсы: | »Лучшая производительность, чем у программного RAID. »Платы контроллера можно легко заменить для замены и обновления. |
Минусы: | »Дороже программного RAID. |
Программный RAID
полностью работает на ЦП системы главного компьютера.
Плюсы: | »Более низкая стоимость из-за отсутствия выделенного оборудования для RAID. |
Минусы: | »Более низкая производительность RAID, поскольку ЦП также поддерживает ОС и приложения. |
Как работает RAID?
В программном RAID реализация RAID — это приложение, работающее на хосте. В этом типе RAID используются диски, подключенные к компьютерной системе через встроенный интерфейс ввода-вывода или безпроцессорный адаптер главной шины (HBA). RAID становится активным, как только ОС загружает программное обеспечение драйвера RAID.
В аппаратном RAID контроллер RAID имеет процессор, память и разъемы для нескольких дисков, которые позволяют подключать диски напрямую к контроллеру или размещать их в объединительных панелях с возможностью горячей замены.
В обоих случаях система RAID объединяет отдельные диски в один логический диск. ОС обращается с диском как с любым другим диском в компьютере — она не знает разницы между одним диском, подключенным к материнской плате, или массивом RAID, представленным контроллером RAID.
Учитывая преимущества в производительности и гибкости, аппаратный RAID лучше подходит для типичной современной серверной системы.
RAID-совместимые жесткие диски и твердотельные накопители
СХД производители предлагают множество моделей накопителей.Некоторые из них обозначены как «настольные» или «потребительские» диски, а другие — как диски «RAID» или «корпоративные». Есть большая разница: потребительский диск не предназначен для подключения к группе дисков и не подходит для RAID. С другой стороны, RAID-массивы или корпоративные диски предназначены для связи с RAID-контроллером и работают в унисон с другими дисками, образуя стабильный RAID-массив для работы вашего сервера.
С точки зрения RAID жесткие диски и твердотельные накопители различаются только своей производительностью и емкостью.Для RAID-контроллера все они являются дисками, но важно принять во внимание рабочие характеристики RAID-контроллера, чтобы убедиться, что он способен полностью соответствовать производительным возможностям SSD. Большинство современных RAID-контроллеров достаточно быстры, чтобы позволить твердотельным накопителям работать в полную силу, но медленный RAID-контроллер может ограничить данные и отрицательно повлиять на производительность системы.
Гибридный RAID
Hybrid RAID — это решение для хранения данных с резервированием, которое сочетает в себе недорогие жесткие диски SATA или SAS высокой емкости с низкой задержкой, твердотельные накопители с высоким числом операций ввода-вывода в секунду и адаптерную карту RAID с поддержкой SSD (рис. 1).В гибридном RAID операции чтения выполняются с более быстрого SSD, а операции записи происходят как на SSD, так и на HDD в целях резервирования.
Гибридные RAID-массивы
предлагают огромный прирост производительности по сравнению со стандартными массивами жестких дисков при гораздо более низкой стоимости, чем RAID-массивы только на твердотельных накопителях. По сравнению с RAID-массивами только с жесткими дисками, гибридные массивы ускоряют IOP и сокращают задержку, позволяя любой серверной системе размещать больше пользователей и выполнять больше транзакций в секунду на каждом сервере, что сокращает количество серверов, необходимых для поддержки любой заданной рабочей нагрузки.
Простой взгляд на функциональность гибридного RAID не сразу показывает его общие варианты использования, которые включают создание простых зеркал на рабочих станциях и высокопроизводительные приложения с интенсивным чтением для малого и среднего бизнеса. Гибридный RAID также широко используется в центрах обработки данных для увеличения емкости серверов хранения и обеспечения быстрой загрузки этих серверов. Чтобы узнать больше о гибридном RAID, посетите Hybrid RAID Solutions.
Кому следует использовать RAID?
Любой сервер или высокопроизводительная рабочая станция, а также любая компьютерная система, где требуется постоянное время безотказной работы, являются подходящим кандидатом для RAID.
В какой-то момент жизни сервера по крайней мере один диск выйдет из строя. Без какой-либо формы защиты RAID данные отказавшего диска пришлось бы восстанавливать из резервных копий, вероятно, с потерей некоторых данных и значительного количества времени.
При наличии в системе RAID-контроллера неисправный диск можно просто заменить, и RAID-контроллер автоматически восстановит недостающие данные с остальных дисков на вновь вставленном диске. Это означает, что ваша система может выдержать отказ диска без сложной и долгой задачи восстановления данных из резервных копий.
Выбор правильного уровня RAID
Существует несколько различных конфигураций RAID, называемых «уровнями», например RAID 0, RAID 1, RAID 10 и RAID 5. Хотя их названия мало отличаются, есть большие различия в их характеристиках и в том, где и когда они должны использоваться.
Факторы, которые следует учитывать при выборе правильного уровня RAID, включают:
- Вместимость
- Производительность
- Резервирование (надежность / безопасность)
- Цена
Не существует универсального подхода к RAID, поскольку акцент на одном факторе обычно происходит за счет другого.На некоторых уровнях RAID диски используются для резервирования, что означает, что они не могут использоваться для увеличения емкости. Другие уровни RAID ориентированы на производительность, но не на избыточность. Большой, быстрый массив с высокой степенью резервирования будет дорогостоящим. И наоборот, небольшой резервный массив со средней скоростью не будет стоить дорого, но и близко не будет так быстр, как предыдущий дорогой массив.
Имея это в виду, рассмотрим различные уровни RAID и их соответствие вашим требованиям.
RAID 0 (чередование)
В RAID 0 все диски объединены в один логический диск (рисунок 2).Эта конфигурация обеспечивает низкую стоимость и максимальную производительность, но не обеспечивает защиты данных — отказ одного диска приводит к полной потере данных.
Таким образом, RAID 0 не рекомендуется. По мере того как твердотельные накопители становятся более доступными и увеличиваются в емкости, популярность RAID 0 снижается. Преимущества быстрого доступа для чтения / записи намного перевешиваются угрозой потери всех данных в случае сбоя диска.
Использование: Подходит только для ситуаций, когда данные не являются критически важными, таких как пост-обработка видео / аудио, обработка мультимедийных изображений, САПР, регистрация данных и т. Д.где можно потерять весь диск, потому что данные можно быстро повторно скопировать из источника. Вообще говоря, RAID 0 не рекомендуется.
Плюсы: | »Быстро и недорого. »Доступна вся емкость диска. »Быстрая установка. Несколько жестких дисков, разделяющих загрузку данных, делают его самым быстрым из всех массивов. |
Минусы: | »RAID 0 вообще не обеспечивает защиты данных. »При выходе из строя одного диска все данные будут потеряны без возможности восстановления. |
RAID 1 (зеркалирование)
RAID 1 поддерживает повторяющиеся наборы всех данных на двух отдельных дисках, отображая только один набор данных в виде логического диска (рисунок 3). RAID 1 — это защита, а не производительность или емкость.
Поскольку каждый диск содержит копии одних и тех же данных, полезная емкость составляет 50% от доступных дисков в наборе RAID.
Использование: Обычно используется только в тех случаях, когда не требуется большой емкости, но пользователь хочет убедиться, что данные можно восстановить на 100% в случае сбоя диска, например, в системах учета, редактировании видео, играх и т. Д.
Плюсы: | »Высокая степень резервирования — каждый диск является копией другого. »При выходе из строя одного диска система продолжает работать в обычном режиме без потери данных. |
Минусы: | »Емкость ограничена 50% доступных дисков, а производительность ненамного лучше, чем у одного диска. |
ПРИМЕЧАНИЕ. С появлением жестких дисков SATA большой емкости можно получить массив RAID 1 размером приблизительно 8 ТБ, используя два жестких диска по 8 ТБ.Хотя это может обеспечить достаточную емкость для многих серверов малого бизнеса, производительность все равно будет ограничена тем фактом, что в массиве работают только два шпинделя. Поэтому рекомендуется переходить на массивы RAID, которые используют больше вращающихся носителей, когда требуется такая емкость.
RAID 1E (полосовое зеркалирование)
RAID 1E сочетает чередование данных с RAID 0 с зеркалированием данных с RAID 1, предлагая при этом большую производительность, чем RAID 1 (рисунок 4).Данные, записанные в полосе на одном диске, отражаются в полосе на следующем диске в массиве.
Как и в RAID 1, полезная емкость диска в RAID 1E составляет 50% от общей доступной емкости всех дисков в наборе RAID.
Использование: Небольшие серверы, высокопроизводительные рабочие станции и другие среды, не требующие большой емкости, но в которых пользователь хочет убедиться, что данные можно восстановить на 100% в случае сбоя диска.
Плюсы: | »Резервирование с лучшей производительностью и емкостью, чем у RAID 1.Фактически, RAID 1E является зеркалом нечетного количества дисков. |
Минусы: | »Стоимость высока, поскольку доступна только половина емкости физических дисков. |
ПРИМЕЧАНИЕ. RAID 1E лучше всего подходит для систем с тремя дисками. Для сценариев с четырьмя или более дисками рекомендуется RAID 10.
RAID 5 (чередование с контролем четности)
Являясь наиболее распространенным и лучшим универсальным уровнем RAID, RAID 5 разделяет блоки данных на все диски в массиве (от 3 до 32), а также распределяет данные четности по всем дискам (рисунок 5).В случае отказа одного диска система считывает данные четности с рабочих дисков, чтобы восстановить потерянные блоки данных.
Производительность чтения
RAID 5 сравнима с производительностью чтения RAID 0, но есть штраф за запись, поскольку система должна записать и блок данных, и данные четности до завершения операции.
Для контроля четности RAID требуется емкость одного диска на набор RAID, поэтому полезная емкость всегда будет на один диск меньше, чем общее количество дисков в конфигурации.
Использование: Часто используется на файловых серверах, серверах хранения общего назначения, серверах резервного копирования, потоковой передаче данных и других средах, требующих высокой производительности, но с наилучшим соотношением цены и качества. Не подходит для приложений баз данных из-за низкой производительности произвольной записи.
Плюсы: | »Хорошее соотношение цены и качества и хорошие универсальные характеристики. |
Минусы: | »Емкость одного диска потеряна для паритета. »Может выдержать сбой только одного диска за один раз. »Если сразу два диска выйдут из строя, все данные будут потеряны. |
ПРИМЕЧАНИЕ. Настоятельно рекомендуется установить «горячий» резерв с RAID 5, чтобы снизить вероятность сбоя нескольких дисков.
ПРИМЕЧАНИЕ. Хотя твердотельные накопители становятся дешевле, а их улучшенная производительность по сравнению с жесткими дисками делает возможным их использование в массивах RAID 5 для приложений баз данных, общий характер небольших случайных записей в RAID 5 по-прежнему означает, что этот уровень RAID не следует использовать. в системе с большим количеством мелких случайных записей.Вместо этого следует использовать массив без контроля четности, такой как RAID 10.
RAID 6 (чередование с двойной четностью)
В RAID 6 данные распределяются по нескольким дискам, а для хранения и восстановления данных используется двойная четность (рисунок 6). Он похож на RAID 5 по производительности и емкости, но вторая схема четности распределена по разным дискам и, следовательно, обеспечивает чрезвычайно высокую отказоустойчивость и способность выдерживать одновременный отказ двух дисков в массиве.
Для
RAID 6 требуется минимум 4 диска и максимум 32 диска. Полезная емкость всегда на два меньше, чем количество доступных дисков в наборе RAID.
Использование: Аналогично RAID 5, включая файловые серверы, серверы общего хранения, серверы резервного копирования и т. Д. Низкая производительность произвольной записи делает RAID 6 непригодным для приложений баз данных.
Плюсы: | »Разумное соотношение цены и качества с хорошими универсальными характеристиками. »Может выдержать отказ двух дисков одновременно или отказ одного диска, а затем сбоя второго диска во время восстановления данных. |
Минусы: | »Дороже, чем RAID 5, из-за потери емкости двух дисков до паритета. »Немного медленнее, чем RAID 5 в большинстве приложений. |
RAID 10 (чередование и зеркалирование)
RAID 10 (иногда называемый RAID 1 + 0) объединяет RAID 1 и RAID 0, чтобы предложить несколько наборов зеркал, чередующихся вместе (рисунки 7 и 8).RAID 10 предлагает очень хорошую производительность с хорошей защитой данных и без вычислений четности.
RAID 10 требует как минимум четырех дисков, а полезная емкость составляет 50% от доступных дисков. Однако следует отметить, что RAID 10 может использовать более четырех дисков, кратно двум. Каждое зеркало в RAID 10 называется «ветвью» массива. Массив RAID 10, использующий, скажем, восемь дисков (четыре «ножки» с четырьмя дисками в качестве емкости) обеспечит исключительную производительность как в средах с вращающимися носителями, так и в средах SSD, поскольку существует гораздо больше дисков, разделяющих операции чтения и записи на более мелкие блоки на каждом диске. .
Использование: Идеально подходит для серверов баз данных и любой среды с множеством небольших случайных операций записи данных.
Плюсы: | »Быстро и с резервированием. |
Минусы: | »Дорого, потому что требуется четыре диска, чтобы получить емкость двух. »Не подходит для больших объемов из-за ограничений по стоимости. »Не так быстро, как RAID 5, в большинстве потоковых сред. |
RAID 50 (чередование с контролем четности)
RAID 50 (иногда называемый RAID 5 + 0) объединяет несколько наборов RAID 5 (чередование с четностью) с RAID 0 (чередование) (рисунки 9 и 10). Преимущества RAID 5 достигаются, в то время как составной RAID 0 позволяет объединить гораздо больше дисков в один логический диск. До одного диска в каждом субмассиве могут выйти из строя без потери данных. Кроме того, время восстановления существенно меньше, чем у одного большого массива RAID 5.
Конфигурация RAID 50 может вместить 6 или более дисков, но должна использоваться только с конфигурациями из более чем 16 дисков. Полезная емкость RAID 50 составляет 67–94%, в зависимости от количества дисков с данными в наборе RAID.
Следует отметить, что у вас может быть более двух ветвей в RAID 50. Например, с 24 дисками у вас может быть RAID 50 из двух ветвей по 12 дисков в каждой или RAID 50 из трех ветвей по восемь дисков в каждой. Первый из этих двух массивов будет предлагать большую емкость, так как только два диска теряются из-за четности, но второй массив будет иметь более высокую производительность и гораздо более быстрое восстановление, поскольку только диски в ветви с отказавшим диском участвуют в функции восстановления весь массив.
Использование: Хорошая конфигурация для случаев, когда много дисков должно быть в одном массиве, но емкость слишком велика для RAID 10, например, в серверах очень большой емкости.
Плюсы: | »Приемлемая стоимость расхода. »Очень хорошая всесторонняя производительность, особенно для потоковой передачи данных, и очень высокая емкость. |
Минусы: | »Требуется много дисков. »Емкость одного диска в каждом наборе RAID 5 потеряна для четности. »Немного дороже RAID 5 из-за потери емкости. |
RAID 60 (чередование с двойной стороной)
RAID 60 (иногда называемый RAID 6 + 0) объединяет несколько наборов RAID 6 (чередование с двойной четностью) с RAID 0 (чередование) (рисунки 11 и 12). Двойная четность допускает отказ двух дисков в каждом массиве RAID 6, в то время как чередование увеличивает емкость и производительность без добавления дисков в каждый массив RAID 6.
Как и RAID 50, конфигурация RAID 60 может вмещать 8 или более дисков, но должна использоваться только с конфигурациями из более чем 16 дисков. Полезная емкость RAID 60 составляет от 50% до 88%, в зависимости от количества дисков с данными в наборе RAID.
Обратите внимание, что все вышеперечисленные конфигурации с несколькими ветвями, которые возможны с RAID 10 и RAID 50, также возможны с RAID 60. Например, с 36 дисками у вас может быть RAID 60, состоящий из двух ветвей по 18 дисков в каждой, или RAID 60 из трех ножек по 12 дисков в каждой.
Использование: RAID 60 аналогичен RAID 50, но предлагает большую избыточность, что делает его подходящим для серверов очень большой емкости, особенно тех, для которых не требуется резервное копирование (т. Е. Серверы видеонаблюдения, обслуживающие большое количество камер).
Плюсы: | »Может выдерживать отказ двух дисков на каждый массив RAID 6 в наборе, поэтому это очень безопасно. »Очень большой размер и разумное соотношение цены и качества, учитывая, что этот уровень RAID не будет использоваться, если нет большого количества дисков. |
Минусы: | »Требуется много дисков. »Немного дороже, чем RAID 50, из-за потери большего количества дисков при расчетах четности. |
Какой уровень RAID использовать
Мы можем разделить данные на два основных типа: случайные и потоковые. Как указывалось ранее, существует два основных типа RAID-массивов: без четности (RAID 1, 10) и с четностью (RAID 5, 6, 50, 60).
Случайные данные обычно имеют небольшой размер (то есть маленькие блоки) с большим количеством небольших операций чтения и записи, составляющих структуру данных. Это типично для данных типа базы данных.
Потоковые данные имеют большой размер и характеризуются такими типами данных, как видео, изображения, общие большие файлы.
Хотя невозможно точно определить использование всех данных сервером, и серверы часто меняют свои модели использования с течением времени, общее практическое правило состоит в том, что случайные данные лучше всего подходят для RAID без контроля четности, в то время как потоковые данные работают лучше всего и является наиболее экономичным на RAID с контролем четности.
Обратите внимание, что можно настроить оба типа RAID на одном контроллере, и даже можно настроить одинаковые типы RAID на одном и том же наборе дисков. Так, если, например, у вас есть восемь дисков по 2 ТБ, вы можете создать RAID 10 размером 1 ТБ для данных типа базы данных и RAID 5 из емкости, оставшейся на дисках для общих данных и / или данных потокового типа ( примерно 12 ТБ). Наличие этих двух разных массивов, охватывающих одни и те же диски, не повлияет на производительность, но ваши данные улучшатся с точки зрения производительности, если они будут расположены на правильном уровне RAID.
Размер привода
Несмотря на то, что жесткие диски становятся больше, они не становятся быстрее — жесткий диск емкостью 1 ТБ и жесткий диск 6 ТБ из одного семейства продуктов будут иметь одинаковые характеристики производительности. Это влияет на построение / восстановление массивов, так как запись всех недостающих данных на новый заменяющий диск может занять много времени.
И наоборот, твердотельные накопители часто имеют большую емкость, поэтому твердотельные накопители емкостью 80 ГБ и твердотельные накопители 800 ГБ из одного семейства продуктов будут иметь совершенно разные характеристики производительности.Это следует тщательно сверить с техническими характеристиками продукта от поставщика накопителя, чтобы убедиться, что вы получаете ту производительность, которую, как вы думаете, вы получаете от своих накопителей.
С жесткими дисками обычно лучше создать массив с большим количеством дисков, чем с меньшим их количеством. RAID 5 из трех жестких дисков по 6 ТБ (емкость 12 ТБ) не будет иметь такой же производительности, как массив RAID 5, состоящий из пяти жестких дисков по 3 ТБ (емкость 12 ТБ).
Однако с твердотельными накопителями желательно достичь требуемой емкости с минимально возможным количеством накопителей за счет использования твердотельных накопителей большей емкости.Они будут иметь более высокую пропускную способность, чем их меньшие аналоги, и обеспечат лучшую производительность системы.
Размер массива и размер дисков
Это малоизвестный факт, что вам не нужно использовать всю емкость диска при создании RAID-массива. Например, при создании массива RAID в BIOS контроллера контроллер покажет вам максимально возможный размер массива на основе дисков, выбранных для его создания.
В процессе создания вы можете изменить размер массива на меньший.Неиспользуемое пространство на дисках будет доступно для создания дополнительных RAID-массивов.
Хорошим примером этого может быть создание большого сервера и хранение операционной системы и данных на отдельных RAID-массивах. Обычно вы создаете RAID 10 размером, скажем, 200 ГБ для установки вашей ОС, распределенным по всем дискам на сервере. Это потребует минимального объема емкости каждого диска. Затем вы можете создать RAID 5 для общих данных на неиспользуемом пространстве на дисках.
Это дает дополнительное преимущество, заключающееся в обходе ограничений размера диска для загрузочных массивов на серверах без UEFI, поскольку при установке операционной системы ОС будет полагать, что имеет дело только с диском 200 ГБ.
Время восстановления и большие массивы RAID
Чем больше дисков в массиве и чем больше жесткие диски в массиве, тем дольше время восстановления, когда диск выходит из строя, заменяется или срабатывает горячий резерв. Хотя в массиве RAID 5 можно иметь 32 диска. , это становится непрактичным для больших прядильных сред.
Например, RAID 5, состоящий из 32 дисков по 6 ТБ (186 ТБ), будет иметь очень плохое время сборки и восстановления из-за размера, скорости и количества дисков.В этом сценарии было бы целесообразно построить RAID 50 с двумя ножками от этих дисков (емкость 180 ТБ). Когда диск выходит из строя и заменяется, только 16 дисков (15 существующих плюс новый диск) будут задействованы в восстановлении. Это повысит производительность восстановления и снизит влияние на производительность системы во время процесса восстановления.
Обратите внимание, однако, что независимо от того, что вы делаете, когда дело доходит до восстановления массивов с дисками 6 ТБ + SATA, время восстановления увеличится до 24 часов в абсолютно идеальной среде (без нагрузки на сервер).В реальной среде с сильно загруженной системой время восстановления будет еще больше.
Конечно, время восстановления массивов SSD значительно меньше из-за того, что диски меньше, а скорость записи SSD намного выше, чем у их аналогов с вращающимся носителем.
Настройки RAID по умолчанию
При создании массива RAID в BIOS или управляющем программном обеспечении вам будут представлены значения по умолчанию, которые контроллер предлагает для настроек RAID.Самый важный из них — это «размер полосы». Несмотря на то, что для определения наилучшего размера полосы для вашего массива требуется много научных, математических и общих знаний, в подавляющем большинстве случаев лучше всего работают значения по умолчанию, поэтому используйте размер полосы 256 КБ, рекомендованный контроллером.
SSD и кэш чтения / записи
В массиве RAID, состоящем только из SSD, отключение кэша чтения и записи в подавляющем большинстве случаев повысит производительность. Однако вам может потребоваться проверить, повысит ли производительность включение кеша чтения и записи еще больше.Обратите внимание, что можно отключить и включить кэш чтения и записи на лету, не затрагивая или не перенастраивая массив или не перезагружая сервер, поэтому рекомендуется протестировать обе конфигурации.
О Microsemi Adaptec RAID
Хотя многие компании предлагают RAID, не все реализации RAID одинаковы. Благодаря почти 35 годам защиты, ускорения и кондиционирования данных по мере их прохождения по пути ввода-вывода, решения Adaptec от Microsemi предлагают самую надежную защиту данных RAID, доступную на сегодняшний день, включая поддержку уровней RAID: 0, 1, 1E, 5, 6 , 10, 50 и 60, а также гибридные RAID 1 и 10.
Сводка
Таблица 1 • Сравнение уровней RAID
Функции | RAID 0 | RAID 1 | RAID 1E | RAID 5 | RAID 6 | RAID 10 | RAID 50 | RAID 60 |
---|---|---|---|---|---|---|---|---|
Минимальное количество дисков 90 | 2 | 2 | 3 | 3 | 4 | 4 | 6 | 8 |
Защита данных | Нет | Отказ одного диска | Отказ одного диска | Отказ одного диска | Отказ двух дисков Сбой до одного диска в каждом подмассиве | Отказ до одного диска в каждом подмассиве | Отказ до одного диска в каждом подмассиве | Отказ до двух дисков в каждом подмассиве |
Чтение производительности | Высокая | Средний | Средний | Высокая | Высокая | Высокая | Высокая | Высокая |
Скорость записи | Высокая | Средний | Средний | Средний (зависит от типа данных) | Низкий | Высокая | Средний | Средний |
Скорость чтения (пониженная) | Низкий | Высокая | Средний | Средний | Низкий | Высокая | Средний | Низкий |
Скорость записи (пониженная) | НЕТ | Средний | Средний | Низкий | Низкий | Высокая | Средний | Низкий |
Использование производственных мощностей | 100% | 50% | 50% | 67% — 94% | 50% — 88% | 50% | 67% — 94% | 67% — 94% |
Типичное использование | Некритичные данные, такие как постпродакшн видео / аудио, обработка мультимедийных изображений, САПР, регистрация данных и т. Д.где можно потерять весь диск, потому что данные можно быстро скопировать из источника. ОБЩЕЕ ГОВОРИТ, RAID 0 НЕ РЕКОМЕНДУЕТСЯ. | Случаи, когда не требуется большой емкости, но пользователь хочет убедиться, что данные можно восстановить на 100% в случае сбоя диска, например, системы учета, редактирования видео, игр и т. Д. | Небольшие серверы, высокопроизводительные рабочие станции и другие среды, где нет требований к большой емкости, но где пользователь хочет убедиться, что данные можно восстановить на 100% в случае сбоя диска. | Файловые серверы, общие серверы хранения, серверы резервного копирования, потоковые данные и другие среды, требующие хорошей производительности, но с наилучшим соотношением цены и качества. Не подходит для приложений баз данных из-за низкой производительности произвольной записи. | Аналогично RAID 5, включая файловые серверы, серверы общего хранения, серверы резервного копирования и т. Д. Низкая производительность произвольной записи делает RAID 6 непригодным для приложений баз данных. | Идеально подходит для серверов баз данных и любой среды с множеством небольших случайных записей данных. | Хорошая конфигурация для случаев, когда в одном массиве должно быть много дисков, но емкость слишком велика для RAID 10, например, в серверах очень большой емкости. | RAID 60 похож на RAID 50, но предлагает большую избыточность, что делает его подходящим для серверов очень большой емкости, особенно тех, для которых не требуется резервное копирование (например, серверы видеонаблюдения, обслуживающие большое количество камер). |
Плюсы | Быстро и недорого. Доступна вся емкость диска.Быстрая установка. Несколько жестких дисков, разделяющих загрузку данных, делают его самым быстрым из всех массивов. | Высокая степень резервирования — каждый диск является копией другого. Если один диск выходит из строя, система продолжает работать в обычном режиме без потери данных. | Избыточный, с лучшей производительностью и емкостью, чем RAID 1. Фактически, RAID 1E является зеркалом нечетного числа дисков. | Хорошее соотношение цены и качества и отличные характеристики. | Разумное соотношение цены и качества с хорошими универсальными характеристиками.Может выдержать отказ двух дисков одновременно или отказ одного диска, а затем сбоя второго диска во время восстановления данных. | Быстро и с резервированием. | Разумная стоимость расхода. Очень хорошая всесторонняя производительность, особенно для потоковой передачи данных, и возможности очень большой емкости. | Может выдерживать отказ двух дисков на каждый массив RAID 6 в наборе, поэтому это очень безопасно. Разумное соотношение цены и качества, учитывая, что этот уровень RAID не будет использоваться, если нет большого количества дисков. |
Минусы | RAID 0 вообще не обеспечивает защиты данных. Если один диск выйдет из строя, все данные будут потеряны без возможности восстановления. | Емкость ограничена 50% доступных дисков, а производительность ненамного лучше, чем у одного диска. | Стоимость высока, потому что доступна только половина емкости физических дисков. | Емкость одного диска потеряна для четности. Может выдержать только отказ одного диска за один раз.Если сразу два диска выйдут из строя, все данные будут потеряны. | Дороже, чем RAID 5, из-за потери емкости двух дисков до паритета. Немного медленнее, чем RAID 5 в большинстве приложений. | Дорого, так как требуется четыре диска, чтобы получить емкость двух. Не подходит для больших мощностей из-за ограничений по стоимости. Не так быстро, как RAID 5 в потоковой среде. | Требуется много приводов. Емкость одного диска в каждом наборе RAID 5 теряется до четности. Немного дороже, чем RAID 5, из-за потери емкости. | Требуется много приводов. Немного дороже, чем RAID 50, из-за потери большего количества дисков при расчетах четности. |
Таблица 2 • Типы RAID
Типы RAID | На основе программного обеспечения | На основе материнской платы | На основе адаптера |
---|---|---|---|
Описание | Включено в ОС, например Windows® и Linux. Все функции RAID обрабатываются центральным процессором, что может серьезно снизить его способность выполнять другие вычисления. | Операции RAID, интенсивно использующие процессор, выгружаются с центрального процессора на процессор RAID, встроенный в материнскую плату. | Операции RAID, интенсивно использующие процессор, выгружаются с центрального процессора на внешний адаптер PCIe. Кэш с обратной записью с резервной батареей может значительно повысить производительность без увеличения риска потери данных. |
Типичное использование | Лучше всего использовать для приложений с большими блоками, таких как хранилища данных или потоковое видео.Также там, где у серверов есть доступные циклы ЦП для управления операциями с интенсивным вводом-выводом, которые требуются для определенных уровней RAID. | Недорого. | Лучше всего использовать для небольших блочных приложений, таких как транзакционно-ориентированные базы данных и веб-серверы. |
Плюсы | Более низкая стоимость из-за отсутствия оборудования, выделенного для RAID. | Более низкая стоимость, чем RAID на основе адаптера. | Снимает нагрузку на задачи RAID с хост-системы, обеспечивая лучшую производительность, чем программный RAID.Карты контроллера можно легко заменить для замены и обновления. Данные могут быть скопированы, чтобы предотвратить потерю в случае сбоя питания. |
Минусы | Более низкая производительность RAID, поскольку ЦП также поддерживает ОС и приложения. | Нет возможности обновить или заменить процессор RAID в случае отказа оборудования. Может поддерживать только несколько уровней RAID. | Дороже программного обеспечения и встроенного RAID. |
Что такое RAID 50: два в одном RAID
Эта статья предоставит вам подробную информацию о том, что такое RAID 50, обсудит его отдельные, комбинированные функции и его компоненты.
Определение RAID-массива остается средством надежной защиты и хранения данных на нескольких устройствах хранения. С этой целью были определены различные типы уровней RAID, такие как RAID 5, RAID 1 и RAID 2, которые используются для улучшения хранения данных. Один из этих типов уровней RAID будет обсуждаться в этой статье.
Эта статья предоставит вам подробную информацию о компонентах RAID 50, обсуждая его индивидуальные и комбинированные функции.Вы также узнаете конфигурацию уровня RAID и присущие ему достоинства и недостатки.
Введение в RAID 50
Что такое RAID 50? Это уровень RAID, который объединяет два разных уровня RAID, RAID 5 и RAID 0. RAID 50 сочетает в себе функции и преимущества этих двух уровней RAID, чтобы дать пользователям повышенную производительность их устройств хранения. RAID 50 — это тип вложенного уровня RAID, что означает, что это комбинация двух разных массивов.
RAID 50 — это комбинация RAID 5 и RAID 0 . Он использует возможность чередования дисков RAID 0 с функцией распределенной четности RAID 5, чтобы гарантировать, что ваши диски работают в оптимальных условиях. Массив RAID 0 используется для обеспечения лучшей производительности чтения и записи с помощью устройств хранения, что является результатом чередования данных между несколькими дисками в массиве. С другой стороны, массив RAID 5 используется для повышения отказоустойчивости и избыточности данных, полученных с помощью функции распределенной четности, присущей RAID 5.
Комбинация этих двух массивов RAID (RAID 5 и 0) позволяет использовать преимущества обоих типов RAID, тем самым повышая общую производительность дисков. Для массива RAID 5 требуется минимум шесть дисков, поскольку он распределяет данные по нескольким дискам RAID 5, а для RAID 0 требуется минимум два.
[/ section_title]
[section_title] Конфигурация RAID 50
Скорость чтения и записи
Известное применение RAID 50 — увеличение емкости ваших дисков для чтения и записи. Это связано с тем, что он позволяет комбинировать массив RAID 0, который хорошо известен своей функцией качественного высокопроизводительного RAID. Эта функция в сочетании с распределенной четностью RAID 5 делает массив RAID 50 одним из самых эффективных RAID-массивов.
Однако…
Следует отметить, что RAID 50 — не единственный вложенный или обычный уровень RAID с улучшенной производительностью чтения и записи. Другие включают RAID 5, RAID 10, RAID 2, RAID 15 и многие другие.Ваши предпочтения и предпочтения вашей организации определят наиболее подходящий из этих уровней RAID для использования.
Это когда можно рассмотреть такие сравнения, как RAID 5 и RAID 10, RAID6 и RAID5, RAID 10 и RAID 6 и т. Д. Это связано с тем, что эти RAID-массивы имеют разные функции, помимо уровня производительности, и это определит их пригодность для вашей организации.
Дисковое пространство
Что касается дискового пространства , RAID 50 использует меньше дискового пространства по сравнению с другими уровнями RAID, включая RAID 5. Это может быть связано с наличием RAID 0 в массиве RAID 50. Его функция чередования данных позволяет выделить один диск для каждого массива для данных четности. Следовательно, используемое дисковое пространство сведено к минимуму.
Дисковое пространство может быть основным фактором при выборе RAID-массива. Поскольку RAID 10 также является одним из самых эффективных RAID-массивов, вы обнаружите, что RAID 50 превосходит RAID 10, когда дело касается дискового пространства. Это связано с тем, что RAID 10 использует зеркальное отображение, которое сокращает полезное дисковое пространство вдвое по сравнению с RAID 50, в котором используется чередование данных.
Повреждение данных неизбежно, но его можно предотвратить. Свяжитесь с нашими экспертами по восстановлению RAID, чтобы узнать больше о способах защиты диска от сбоев.
Первое заметное преимущество RAID 50 — это оптимизация дискового пространства. Хотя он использует больше дисков, чем RAID 5, RAID-массивы, такие как RAID 10, используют больше, чем RAID 50.
Еще одно преимущество, о котором стоит упомянуть, — это улучшенная производительность чтения и записи данных, полученных из RAID 50.Это повышение производительности RAID по сравнению с использованием только массива RAID 5.
RAID 50 также обеспечивает защиту данных в случае выхода из строя дисков. Это лучше, чем RAID 5, который защищает данные только от сбоя одного диска, что делает RAID 50 лучшим выбором по сравнению с RAID 5.
RAID 50 можно назвать дорогим , так как он стоит дорого при минимальных требованиях в шесть дисков. Ему нужно больше дисков, чем массиву RAID 5.
Еще один недостаток, о котором стоит упомянуть, — это необходимость в сложном оборудовании в виде RAID-контроллера. Это требование, которое также отмечается в RAID 5, требует синхронизации дисков. Это, в свою очередь, ограничивает количество используемых дисков, поскольку не все диски можно синхронизировать.
Последний недостаток RAID 50 — это потеря дисков. Это отвечает на вопрос: «Сколько дисков вы можете потерять в RAID 50?». Простой ответ на этот вопрос заключается в том, что вы можете потерять по одному диску в каждом подмассиве.
Однако следует отметить, что эта потеря диска может сопровождаться потерей данных.Как только это произойдет, немедленно вызовите специалиста по восстановлению данных, чтобы избавиться от головной боли.
Таблица уровней RAID — CRU
RAID означает избыточный массив независимых дисков и представляет собой форму управления / резервного копирования данных, которая распределяет данные по нескольким жестким дискам. Чтобы узнать больше о том, что такое RAID, посетите эту страницу.
Таблица различных уровней RAID
Уровень RAID | Описание | Преимущества | Недостатки |
---|---|---|---|
RAID 0 (чередование) | Объединяет два или более жестких диска вместе и обрабатывает их как один большой том.Например, два диска по 250 ГБ, объединенные в конфигурации RAID 0, создают единый том 500 ГБ. RAID 0 используется теми, кому нужна максимальная скорость из двух или более дисков. | Поскольку данные распределяются между обоими дисками, скорость чтения и записи данных увеличивается по мере добавления дисков. | Каждый диск имеет ограниченный срок службы, и каждый диск добавляет еще одну точку отказа RAID. Каждый диск в RAID 0 имеет решающее значение — потеря любого из них означает потерю всего RAID (и всех данных). |
RAID 1 (зеркальное отображение) | Зеркальное отображение создает точную копию диска. Каждый раз, когда вы записываете информацию на один диск, точная информация записывается на другой диск в вашем зеркале. Важные файлы (бухгалтерские, финансовые, личные) обычно копируются с помощью RAID 1. | Это самый безопасный вариант для ваших данных. Если один диск потерян, ваши данные по-прежнему существуют в полной форме и не требуют времени для восстановления. | Ваши вложения в безопасность данных увеличивают расходы на диски, поскольку для каждого тома RAID 1 требуется два диска. |
RAID 2 | Устаревшая реализация чередования, аналогичная RAID 0 — чередование выполняется на уровне битов, а не по блокам. | ||
RAID 3 | Редкая реализация чередования четности. Его ограничение состоит в том, что он не может обслуживать несколько запросов. | ||
RAID 4 | Редкая реализация чередования четности на уровне блоков с целым диском, выделенным для данных четности. Аналогично RAID 5. | ||
RAID 5 (чередование четности) | Обычная настройка RAID для томов, которые больше, быстрее и безопаснее, чем любой отдельный диск. Ваши данные распределены по всем дискам в RAID вместе с информацией, которая позволит восстановить ваши данные в случае сбоя одного диска. Для RAID 5 требуется как минимум три диска. Независимо от того, сколько дисков используется, количество, равное одному из них, будет использовано для данных восстановления и не может быть использовано для пользовательских данных. | Вы можете потерять любой диск без потери данных резервной копии. Просто замените диск на новый. | Ваши вложения в безопасность данных увеличивают расходы на диски, поскольку необходимо как минимум три диска. |
RAID 6 | Очень похож на RAID 5, но добавляет дополнительный блок четности информации для восстановления. | Позволяет одновременно вывести из строя два диска без потери данных. | Немного медленнее, чем в RAID 5 при записи, но нет дополнительной задержки для чтения. |
RAID 10 (RAID 1 + 0) | RAID 10 работает путем чередования и зеркалирования данных как минимум на двух дисках. | RAID 10 безопасен, поскольку при зеркалировании дублируются все ваши данные. Это быстро, потому что данные распределяются по двум или более дискам, что означает, что фрагменты данных могут быть прочитаны и записаны на разные диски | |
RAID 50 (RAID 5 + 0) | RAID 50 сочетает в себе прямое чередование на уровне блоков RAID 0 с распределенной четностью RAID 5.Это массив RAID 0, чередующийся по элементам RAID 5. Требуется минимум 6 дисков. | Обеспечивает отличный баланс между производительностью хранилища, емкостью хранилища и целостностью данных, который не обязательно встречается на других уровнях RAID. Один диск из каждого набора RAID 5 может выйти из строя без потери данных. | Время, затраченное на восстановление (обнаружение сбоя диска и реагирование на него, а также процесс восстановления вновь вставленного диска) представляет собой период уязвимости набора RAID. |
RAID 60 (RAID 6 + 0) | RAID 60 сочетает в себе прямое чередование на уровне блоков RAID 0 с распределенной двойной четностью RAID 6. То есть массив RAID 0 с чередованием по элементам RAID 6. Требуется как минимум восемь дисков. | Прекрасно подходит, когда вам нужна более высокая полезная емкость и надежность. | Незначительное снижение скорости записи и производительности. |
Хотите узнать больше?
Посмотрите эти резервные буклеты, предназначенные для малого и среднего бизнеса и фотографов.
Или свяжитесь с нами, если у вас возникнут вопросы. Мы будем рады поговорить с вами.
Поддерживаемые уровни
для RAID-контроллеров Intel®
Эти контроллеры поддерживают избыточный массив независимых дисков (RAID) уровней 0, 1, 5, 6, 10, 50 и 60. Краткое описание этих типов RAID см. Ниже. Дополнительную информацию можно найти в Руководстве пользователя для IT / IR, Integrated Software Stack 3.
Уровень 0 : Этот уровень, который часто называют чередованием, представляет собой метод отображения данных, ориентированный на производительность.Данные, записываемые в массив, делятся на полосы и записываются на диски массива. Эта процедура обеспечивает высокую производительность ввода-вывода при невысокой стоимости, но не обеспечивает избыточности.
Уровень 1 : Этот уровень, который часто называют зеркалированием, обеспечивает избыточность путем записи идентичных данных на каждый диск-член массива. Уровень 1 работает с двумя дисками, которые могут использовать параллельный доступ для высоких скоростей передачи данных при чтении, но чаще работают независимо, чтобы обеспечить высокую скорость транзакций ввода-вывода.Уровень 1 обеспечивает очень хорошую надежность данных и повышает производительность приложений с интенсивным чтением, но при относительно высокой стоимости. Минимальное количество дисков — два.
Уровень 5 : RAID Уровень 5 является наиболее распространенным типом RAID. Распределяя четность по некоторым или всем дискам, входящим в массив, уровень RAID 5 устраняет узкое место записи, присущее уровню 4. Как и на уровне 4, результатом является асимметричная производительность, при которой операции чтения существенно превосходят операции записи.Уровень 5 часто используется с кэшированием с обратной записью, чтобы уменьшить асимметрию. Однако, поскольку данные четности должны пропускаться на каждом диске во время чтения, производительность чтения имеет тенденцию быть значительно ниже, чем у массива уровня 4. Минимальное количество дисков — три.
Уровень 6 : Уровень RAID 6 расширяет RAID 5 путем добавления блока четности. Следовательно, он использует чередование на уровне блоков с двумя блоками четности, распределенными по всем дискам-членам. Целью такого дублирования является повышение отказоустойчивости; RAID 6 может обрабатывать отказ любых двух дисков в массиве, в то время как другие отдельные уровни RAID могут обрабатывать не более одной ошибки.С точки зрения производительности RAID 6, как правило, немного хуже, чем RAID 5, с точки зрения записи из-за дополнительных накладных расходов на большее количество вычислений четности, но может быть немного быстрее при случайном чтении из-за распределения данных по еще одному диску. Минимальное количество жестких дисков — три.
Уровень 10 : Уровень RAID 10 использует функции уровней 1 и 0. Преимуществами являются более быстрый доступ к данным (например, RAID 0) и отказоустойчивость одного диска (например, RAID 1). Для RAID 10 требуется вдвое больше дисков (например, RAID 1), но он предлагает некоторые улучшения производительности за счет чередования, а затем зеркалирования чередующегося массива.RAID 10 разделяет блоки данных на каждый массив RAID 1. Затем каждый массив RAID 1 копирует свои данные на другой диск. Минимальное количество дисков — четыре.
Уровень 50 : Уровень RAID 50 использует функции уровней 5 и 0. RAID 50 включает как четность, так и чередование дисков между несколькими группами дисков. RAID 50 лучше всего реализовать на двух дисковых массивах RAID 5 с чередованием данных по обоим массивам. RAID 50 может выдержать отказ от одного до четырех дисков при сохранении целостности данных, если каждый отказавший диск находится в другом массиве RAID 5.Минимальное количество дисков — шесть.
Уровень 60 : Уровень RAID 60 использует функции уровней 6 и 0. Массив RAID 60 сочетает прямое блочное чередование уровня RAID 0 с распределенной двойной четностью RAID 6. То есть RAID 0 массив, чередующийся по элементам RAID 6. Виртуальный диск RAID 60 может выдержать потерю двух дисков в каждом из наборов RAID 6 без потери данных. Он лучше всего работает с данными, требующими высокой надежности, высокой скорости запросов, высокой передачи данных и средней или большой емкости.Минимальное количество дисков — восемь.
Что такое RAID 50 — два в одном RAID
В этой статье представлена подробная информация о RAID 50, а также информация об отдельных и комбинированных функциях и компонентах.
Определение массива RAID остается надежным средством защиты и хранения данных на нескольких устройствах хранения. Для этого определяются различные уровни RAID, такие как RAID 5, RAID 1 и RAID 2, и используются для улучшения хранения данных.Один из этих типов уровней RAID обсуждается в этой статье.
В этой статье представлена подробная информация о компонентах RAID 50 и информация об отдельных и комбинированных функциях RAID 50. В ней также рассказывается, как настроить уровень RAID, а также его преимущества и недостатки.
ВВЕДЕНИЕ В RAID 50
Что такое RAID 50? Это уровень RAID, который объединяет два разных уровня RAID, RAID 5 и RAID 0. Он сочетает в себе функции и преимущества двух уровней RAID, чтобы предоставить пользователям улучшенное представление их устройств хранения.RAID 50 — это вложенный уровень RAID. Он объединяет два разных массива.
КОМПОНЕНТЫ RAID 50
RAID 50 представляет собой комбинацию RAID 5 и RAID 0. Он использует преимущества чередующейся емкости дисков RAID 0 вместе с функцией распределенной четности RAID 5 для обеспечения максимальной производительности ваших дисков. Массив RAID 0 используется для повышения производительности чтения и записи с помощью устройств хранения. Это результат распределения данных по нескольким жестким дискам в массиве.Массив RAID 5 используется для повышения отказоустойчивости и избыточности данных за счет функции RAID 5, присущей распределенной четности.
Объединив эти два массива RAID (RAID 5 и 0), вы можете воспользоваться функциями обоих типов RAID и, таким образом, повысить общую производительность дисков. Для массива RAID 5 требуется минимум шесть жестких дисков, поскольку он распределяет данные по нескольким жестким дискам RAID 5. Хотя для RAID 0 требуется как минимум два.
КОНФИГУРАЦИЯ
— ПРОИЗВОДИТЕЛЬНОСТЬ ЧТЕНИЯ И ЗАПИСИ
Исключительное применение RAID 50 увеличивает емкость чтения и записи ваших дисков.Действительно, он может объединить массив RAID 0, известный своей качественной функцией RAID. Эта функциональность в сочетании с распределенной четностью RAID 5 делает массив RAID 50 одним из самых мощных доступных массивов RAID.
Следует отметить, что RAID 50 — не единственный вложенный или нормальный уровень RAID с улучшенной производительностью чтения и записи. Другие включают RAID 5, RAID 10, RAID 2, RAID 15 и другие. Ваши предпочтения и предпочтения вашей ассоциации будут определять наиболее подходящий из этих уровней RAID.
В этом случае можно рассмотреть такие сравнения, как RAID 5 с RAID 10, RAID6 с RAID5, RAID 10 с RAID 6 и т. Д. Помимо уровня производительности, эти RAID-массивы имеют несколько функций, которые определяют их пригодность для вашего бизнеса.
ХРАНЕНИЕ ЖЕСТКОГО ДИСКА
Что касается дискового пространства, RAID 50 требует меньше дискового пространства, чем другие уровни RAID, включая RAID 5. Это может быть связано с наличием RAID 0 в массиве RAID 50. Имея данные, вы можете назначить диск для каждой разновидности данных четности.Таким образом, пространство для хранения, которое будет использоваться, сводится к минимуму.
Объем памяти может быть важным фактором при выборе RAID-массива. Поскольку RAID 10 является одним из самых эффективных RAID-массивов, вы обнаружите, что RAID 50 превосходит RAID 10 с точки зрения дискового пространства. RAID 10 использует зеркалирование, которое вдвое сокращает полезное пространство по сравнению с ним, в котором используется чередование данных. Повреждение данных неизбежно, но его можно избежать. Свяжитесь с нашими специалистами по восстановлению RAID, чтобы узнать больше о том, как защитить свой диск от сбоя.
ПРЕИМУЩЕСТВА
Первым заметным преимуществом RAID 50 является оптимизация дискового пространства. Хотя используется больше жестких дисков, чем RAID 5, RAID-массивы, такие как RAID 10, используют больше, чем RAID 50. Еще одно преимущество, о котором стоит упомянуть, — это улучшенное чтение и запись данных, полученных из RAID 50. Это повышение производительности RAID с использованием только массива RAID 5.
RAID также обеспечивает защиту данных в случае сбоя диска. Он лучше, чем RAID 5, который защищает данные только от сбоя жесткого диска и делает RAID 50 лучшим выбором по сравнению с RAID 5.
Также читайте: Как загрузить сохранения в Steam?
НЕДОСТАТКИ
Возможно, это дорого, потому что он стоит как минимум с шестью дисками. Для этого требуется больше жестких дисков, чем для массива RAID 5.
Еще один недостаток, о котором следует упомянуть, — это необходимость в сложном оборудовании в виде RAID-контроллера. Это требование, которое также соблюдается в RAID 5, требует синхронизации жестких дисков. Это, в свою очередь, ограничивает количество используемых жестких дисков, поскольку не все жесткие диски можно синхронизировать.
Последний недостаток — потеря дисков. Он отвечает на вопрос: «Сколько дисков вы можете потерять в нем?» Скромный ответ на этот вопрос заключается в том, что вы можете потерять диск в каждом подмассиве. Однако он отмечает, что эта потеря диска может сопровождаться потерей данных. Если это произойдет, немедленно вызовите специалиста по восстановлению данных, чтобы обезопасить себя от многих головных болей.
Таблица сравнения уровней RAID
| Услуги по восстановлению данных RAID
Характеристики | RAID 0 | RAID 1 | RAID 1E | RAID 5 | RAID 5EE |
Минимальное количество дисков | 2 | 2 | 3 | 3 | 4 |
Защита данных | Нет Защита | Отказ одного диска | Отказ одного диска | Отказ одного диска | Отказ одного диска |
Чтение производительности | Высокая | Высокая | Высокая | Высокая | Высокая |
Скорость записи | Высокая | Средний | Средний | Низкий | Низкий |
Скорость чтения (пониженная) | НЕТ | Средний | Высокая | Низкий | Низкий |
Скорость записи (пониженная) | НЕТ | Высокая | Высокая | Низкий | Низкий |
Использование производственных мощностей | 100% | 50% | 50% | 67% — 94% | 50% — 88% |
Типичные области применения | Рабочие станции высокого класса, регистрация данных, рендеринг в реальном времени, очень кратковременные данные | Операционная система, базы данных транзакций | Операционная система, базы данных транзакций | Хранилище данных, Интернет сервировка, архивирование | Хранилище данных, Интернет сервировка, архивирование |
Свободный внешний жесткий диск или USB-флеш-память с
каждого завершенного восстановления
Характеристики | RAID 6 | RAID 10 | RAID 50 | RAID 60 |
Минимальное количество дисков | 4 | 4 | 6 | 8 |
Защита данных | Отказ двух приводов | До сбой одного диска в каждом подмассиве | до сбой одного диска в каждом подмассиве | до сбой двух дисков в каждом подмассиве |
Чтение производительности | Высокая | Высокая | Высокая | Высокая |
Скорость записи | Низкий | Средний | Средний | Средний |
Скорость чтения (пониженная) | Низкий | Высокая | Средний | Средний |
Производительность записи (пониженная) | Низкий | Высокая | Средний | Низкий |
Использование производственных мощностей | 50% — 88% | 50% | 67% — 94% | 50% — 88% |
Типичные области применения | Архив данных, резервное копирование на диск, решения высокой доступности, серверы с большой емкостью требования | Быстрые базы данных, серверы приложений | Большие базы данных, файл серверы, серверы приложений | Архив данных, резервное копирование на диск, решения высокой доступности, серверы с большой емкостью требования |
Типы RAID-массивов
Типы RAID | На основе программного обеспечения | Аппаратная | Внешнее оборудование |
Описание | Лучше всего использовать для больших блокировать приложения, такие как хранилища данных или потоковое видео.Также где у серверов есть доступные циклы ЦП для управления интенсивным вводом-выводом операции, требуемые для определенных уровней RAID. Включено в ОС, например Windows®, Netware и Linux. Все RAID | Лучше всего использовать для небольших блокировать приложения, такие как транзакционно-ориентированные базы данных и веб- серверы. Операции RAID, интенсивно использующие процессор, выгружаются с центрального процессора на Кэш с обратной записью с обратной записью может значительно повысить производительность | Подключается к серверу через стандартный контроллер. Функции RAID выполняются на микропроцессор, расположенный на внешнем RAID-контроллере, независимо от гостья. |
Преимущества | Низкая цена Требуется только стандартный контроллер | Защита данных и Преимущества производительности RAID Более надежные отказоустойчивые функции и повышенная производительность по сравнению с | Независимость от ОС Создание систем хранения большой емкости для высокопроизводительных серверов |
RAID-массивы с разной архитектурой могут быть похожими, но у каждого типа также есть свои «любимые» сбои и разные методы обработки.При резервной конфигурации RAID 5 один диск может отключиться, и распределенная четность может быть рассчитана на лету, а пользовательские данные будут представлены так, как будто все в порядке, это называется «критическим состоянием».
При критическом запуске производительность сервера снизится, но он продолжит работу. В большинстве случаев это состояние будет обнаружено, и подозрительный диск будет заменен, а RAID будет перестроен по проекту. Если работа критическая и второй диск отключается, значит для расчета недостаточно информации о четности, и RAID рухнет, и все данные в массиве станут недоступны.Первый способ предотвратить безвозвратную потерю ваших данных из-за неправильной перестройки — это периодически проверять состояние вашего RAID. Вы должны убедиться, что все диски работают, и устранить любые проблемы, которые вы заметите, пока массив все еще функционирует. Если у вас есть дополнительные резервные копии критических данных, рекомендуется регулярно их проверять, особенно перед попыткой восстановления
поврежден RAID .
Минимальное время восстановления RAID зависит от нескольких переменных, включая емкость жесткого диска, скорость передачи данных жесткого диска, пропускную способность шины данных, количество жестких дисков на шине и текущую нагрузку ввода-вывода на массив.Восстановление жесткого диска емкостью 2 ТБ может занять 40 часов или более.
Производители RAID сильно различаются по конструкции внутренних компонентов и схемотехники своего оборудования, и глубокое знание этих конструкций имеет решающее значение для успешного восстановления данных. Но поскольку производители не раскрывают эту информацию, методы восстановления RAID требуют многих лет разработки и обратного проектирования, чтобы определить, какие из них наиболее эффективны.
.