Storage systems for IT infrastructure
A review of modern data storage architectures was conducted, the advantages and disadvantages of each of them were given. The data storage systems of the IBM FlashSystem family were analyzed, as well as Spectrum Virtualize software, which is responsible for virtualization, compression, distribution...
Збережено в:
| Дата: | 2020 |
|---|---|
| Автор: | |
| Формат: | Стаття |
| Мова: | Ukrainian |
| Опубліковано: |
PROBLEMS IN PROGRAMMING
2020
|
| Теми: | |
| Онлайн доступ: | https://pp.isofts.kiev.ua/index.php/ojs1/article/view/400 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Problems in programming |
| Завантажити файл: | |
Репозитарії
Problems in programming| id |
pp_isofts_kiev_ua-article-400 |
|---|---|
| record_format |
ojs |
| resource_txt_mv |
ppisoftskievua/be/2738424d25941f39220636de3fb4ddbe.pdf |
| spelling |
pp_isofts_kiev_ua-article-4002020-12-07T11:42:42Z Storage systems for IT infrastructure Системы хранения данных для ИТ инфраструктуры Системи збереження даних для ІТ інфраструктури Punda, S.Yu. data storage system; synchronous data replication; IOPS; Fiber Channel; data compression; business user; business process УДК 004.337 система хранения данных; синхронная репликация данных; IOPS; Fibre Channel; компрессия данных; бизнес-пользователь; бизнес-процесс УДК 004.337 система збереження даних; синхронна реплікація даних; IOPS; Fibre Channel; компресія даних; бізнес-користувач; бізнес процес УДК 004.337 A review of modern data storage architectures was conducted, the advantages and disadvantages of each of them were given. The data storage systems of the IBM FlashSystem family were analyzed, as well as Spectrum Virtualize software, which is responsible for virtualization, compression, distribution and replication of data stored on the storage system. A mathematical model of the data storage system of IBM Storwize v5030E was developed. Well-known metrics are used to evaluate its performance when using spindle and solid-state drives. The effect of hardware and software data compression on system performance has been experimentally revealed. Recommendations are formulated by which it is possible to determine which media and which technology stack should be used by a business user to complete the tasks assigned to him.Problems in programming 2020; 2-3: 82-93 Проведен обзор современных архитектур хранения данных, были приведены преимущества и недостатки каждой из них. Проанализированы системы хранения данных семейства IBM FlashSystem, а также программного обеспечения Spectrum Virtualize которое отвечает за виртуализацию, компрессию, распределения и репликацию данных, которые хранятся на системе хранения. Разработана математическая модель системы сохранения данных компании IBM Storwize v5030E. Применены известные метрики для оценки её производительности при использовании шпиндельных и твердотельных накопителей. Экспериментально выявлено влияние аппаратной и программной компрессии данных на быстродействие системы. Сформулированы рекомендации по которым можно определить какие носители и какой стек технологий следует использовать бизнес-пользователю для выполнения поставленных перед ним задач.Problems in programming 2020; 2-3: 82-93 Проведено огляд сучасних архітектур збереження даних, було наведено переваги та недоліки кожної з них. Проаналізовано системи збереження даних сімейства IBM FlashSystem, а також програмного забезпечення Spectrum Virtualize, яке відповідає за віртуалізацію, компресію, розподілення та реплікацію даних які зберігаються на системі збереження. Розроблено математичну модель системи збереження даних компанії IBM Storwize v5030E. Застосовано відомі метрики для оцінки її продуктивності при використанні шпиндельних та твердотільних накопичувачів. Експериментально виявлено вплив апаратної та програмної компресії даних на швидкодію системи. Сформульовано рекомендації за якими можна визначити, які носії та який стек технологій слід використовувати бізнес-користувачу для виконання поставлених перед ним завдань.Problems in programming 2020; 2-3: 82-93 PROBLEMS IN PROGRAMMING ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ ПРОБЛЕМИ ПРОГРАМУВАННЯ 2020-09-16 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/400 10.15407/pp2020.02-03.082 PROBLEMS IN PROGRAMMING; No 2-3 (2020); 82-93 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 2-3 (2020); 82-93 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 2-3 (2020); 82-93 1727-4907 10.15407/pp2020.02-03 uk https://pp.isofts.kiev.ua/index.php/ojs1/article/view/400/403 Copyright (c) 2020 PROBLEMS IN PROGRAMMING |
| institution |
Problems in programming |
| baseUrl_str |
https://pp.isofts.kiev.ua/index.php/ojs1/oai |
| datestamp_date |
2020-12-07T11:42:42Z |
| collection |
OJS |
| language |
Ukrainian |
| topic |
data storage system synchronous data replication IOPS Fiber Channel data compression business user business process УДК 004.337 |
| spellingShingle |
data storage system synchronous data replication IOPS Fiber Channel data compression business user business process УДК 004.337 Punda, S.Yu. Storage systems for IT infrastructure |
| topic_facet |
data storage system synchronous data replication IOPS Fiber Channel data compression business user business process УДК 004.337 система хранения данных синхронная репликация данных IOPS Fibre Channel компрессия данных бизнес-пользователь бизнес-процесс УДК 004.337 система збереження даних синхронна реплікація даних IOPS Fibre Channel компресія даних бізнес-користувач бізнес процес УДК 004.337 |
| format |
Article |
| author |
Punda, S.Yu. |
| author_facet |
Punda, S.Yu. |
| author_sort |
Punda, S.Yu. |
| title |
Storage systems for IT infrastructure |
| title_short |
Storage systems for IT infrastructure |
| title_full |
Storage systems for IT infrastructure |
| title_fullStr |
Storage systems for IT infrastructure |
| title_full_unstemmed |
Storage systems for IT infrastructure |
| title_sort |
storage systems for it infrastructure |
| title_alt |
Системы хранения данных для ИТ инфраструктуры Системи збереження даних для ІТ інфраструктури |
| description |
A review of modern data storage architectures was conducted, the advantages and disadvantages of each of them were given. The data storage systems of the IBM FlashSystem family were analyzed, as well as Spectrum Virtualize software, which is responsible for virtualization, compression, distribution and replication of data stored on the storage system. A mathematical model of the data storage system of IBM Storwize v5030E was developed. Well-known metrics are used to evaluate its performance when using spindle and solid-state drives. The effect of hardware and software data compression on system performance has been experimentally revealed. Recommendations are formulated by which it is possible to determine which media and which technology stack should be used by a business user to complete the tasks assigned to him.Problems in programming 2020; 2-3: 82-93 |
| publisher |
PROBLEMS IN PROGRAMMING |
| publishDate |
2020 |
| url |
https://pp.isofts.kiev.ua/index.php/ojs1/article/view/400 |
| work_keys_str_mv |
AT pundasyu storagesystemsforitinfrastructure AT pundasyu sistemyhraneniâdannyhdlâitinfrastruktury AT pundasyu sistemizberežennâdanihdlâítínfrastrukturi |
| first_indexed |
2025-07-17T10:06:05Z |
| last_indexed |
2025-07-17T10:06:05Z |
| _version_ |
1850411127352066048 |
| fulltext |
Освітні та навчальні аспекти програмування
© С.Ю. Пунда, 2020
82 ISSN 1727-4907. Проблеми програмування. 2020. № 2–3. Спеціальний випуск
УДК 004.337 https://doi.org/10.15407/pp2020.02-03.082
СИСТЕМИ ЗБЕРЕЖЕННЯ ДАНИХ
ДЛЯ ІТ ІНФРАСТРУКТУРИ
С.Ю. Пунда
Проведено огляд сучасних архітектур збереження даних, було наведено переваги та недоліки кожної з них. Проаналізовано
системи збереження даних сімейства IBM FlashSystem, а також програмного забезпечення Spectrum Virtualize, яке відповідає за
віртуалізацію, компресію, розподілення та реплікацію даних які зберігаються на системі збереження. Розроблено математичну
модель системи збереження даних компанії IBM Storwize v5030E. Застосовано відомі метрики для оцінки її продуктивності при
використанні шпиндельних та твердотільних накопичувачів. Експериментально виявлено вплив апаратної та програмної
компресії даних на швидкодію системи. Сформульовано рекомендації за якими можна визначити, які носії та який стек
технологій слід використовувати бізнес-користувачу для виконання поставлених перед ним завдань.
Ключові слова: система збереження даних, синхронна реплікація даних, IOPS, Fibre Channel, компресія даних, бізнес-користувач,
бізнес процес.
Проведен обзор современных архитектур хранения данных, были приведены преимущества и недостатки каждой из них.
Проанализированы системы хранения данных семейства IBM FlashSystem, а также программного обеспечения Spectrum Virtualize
которое отвечает за виртуализацию, компрессию, распределения и репликацию данных, которые хранятся на системе хранения.
Разработана математическая модель системы сохранения данных компании IBM Storwize v5030E. Применены известные метрики
для оценки её производительности при использовании шпиндельных и твердотельных накопителей. Экспериментально выявлено
влияние аппаратной и программной компрессии данных на быстродействие системы. Сформулированы рекомендации по которым
можно определить какие носители и какой стек технологий следует использовать бизнес-пользователю для выполнения
поставленных перед ним задач.
Ключевые слова: система хранения данных, синхронная репликация данных, IOPS, Fibre Channel, компрессия данных, бизнес-
пользователь, бизнес-процесс.
A review of modern data storage architectures was conducted, the advantages and disadvantages of each of them were given. The data
storage systems of the IBM FlashSystem family were analyzed, as well as Spectrum Virtualize software, which is responsible for
virtualization, compression, distribution and replication of data stored on the storage system. A mathematical model of the data storage
system of IBM Storwize v5030E was developed. Well-known metrics are used to evaluate its performance when using spindle and solid-
state drives. The effect of hardware and software data compression on system performance has been experimentally revealed.
Recommendations are formulated by which it is possible to determine which media and which technology stack should be used by a business
user to complete the tasks assigned to him.
Key words: data storage system, synchronous data replication, IOPS, Fiber Channel, data compression, business user, business process.
Вступ
Системи збереження даних (СЗД) є важливою складовою інформаційних технологій. Кожну
секунду генеруються величезні обсяги інформації, які у сьогоденні зберігаються на спеціалізованих
системах збереження даних. Саме СЗД забезпечують захист та віртуалізацію даних, готуючи їх до подальшої
роботи.
За останнє десятиліття технології збереження даних пройшли величезний шлях. Не так давно сховище
інформації представлялись лише у вигляді звичайних магнітних або стрічкових накопичувачів підключених до
комп’ютера з метою збереження даних, але у зв’язку з постійним збільшенням кількості інформації та з появою
нових технологій, з’явилася потреба у спеціалізованому обладнанні, головним призначенням якого є робота з
даними та їх збереження.
У сьогоденні в комерційних організаціях спостерігається експоненціальне зростання кількості
інформації, потребуючого ефективного збереження, захисту, оптимізації і контролю. Під ефективним
збереженням мається на увазі наступне:
- своєчасна передача інформації бізнес-користувачам: будь-яка інформація має бути доступна
користувачу в будь який момент часу;
- інтеграція інформаційної інфраструктури з бізнес-процесами: системи збереження даних повинні
інтегруватися з різноманітними бізнес-процесами без загрози до безпеки та цілісності інфраструктури;
- гнучка та відмовостійка архітектура сховищ: інфраструктура сховища має забезпечувати
гнучкість і відмовостійкість з можливістю до адаптації під різноманітні вимоги. Сховище повинно мати
можливість до масштабування без зниження продуктивності додатків, які використовують ресурси даних
систем збереження.
Огляд архітектур збереження даних
На сьогодні можна виділити три основні архітектури збереження даних:
пряма мережа системи збереження (DAS);
Освітні та навчальні аспекти програмування
83
файлова мережа системи зберігання даних (NAS);
блочна мережа зберігання даних (SAN).
Технологія DAS (direct attached storage), має на увазі пряме підключення накопичувачів до серверу або
персонального комп’ютера (ПК). При цьому, накопичувачі можуть бути як і внутрішніми, так і зовнішніми.
Найпростіший випадок DAS-системи – це один диск, який інтегрований у сервер чи ПК. Варто відмітити, що
не зважаючи на формальну можливість використання терміну DAS-системи щодо одиночного диску, або
внутрішнього масиву дисків, потрібно розуміти, що в першу чергу під терміном DAS-системи прийнято
розуміти зовнішню стійку, або корзину з накопичувачами, яку варто розглядати, як автономну систему
збереження даних (рис. 1). Для підключення накопичувачів до хосту в технології DAS можуть виступати
інтерфейси: SCSI (Small Computer Systems Interface), SATA (Serial ATA), PATA (Parallel ATA) і Fibre Channel.
Якщо інтерфейси SCSI, PATA, SATA використовуються як правило для підключення внутрішніх
накопичувачів, то Fibre Channel служить виключно для підключення зовнішніх накопичувачів і автономних
СЗД [1].
Рис. 1. DAS архітектура
До переваг DAS можна віднести:
низьку вартість;
простоту розгортання;
високу швидкість передачі даних.
Саме через вищеперераховані переваги DAS-архітектура користується чималим попитом у бізнес-
користувачів, які мають невеликі корпоративні мережі. Водночас DAS-системи мають свої недоліки, такі як:
вимушений простій мережі в момент додавання нових дисків; складність масштабування.
NAS (Network Attached Storage) – мережева система зберігання даних. Мережеві сховища являють собою
зовнішні жорсткі диски, які підключаються до мережі і дозволяють декільком користувачам працювати з
загальними файлами.
Архітектура NAS максимально оптимізована для конкретного завдання, а саме – файловий сервіс
(рис. 2). В основу проектування NAS-продуктів лежить ключове правило: вся обчислювальна потужність
зосереджена на єдиному і головному завданні - обслуговування і зберігання файлів. Обмежившись ключовим
завданням, NAS-продукти дозволяють організувати роботу групи користувачів із загальними файлами
максимально ефективно з точки зору швидкодії і витрат.
Завдяки NAS користувач отримує просте і зручне адміністрування, можливість нарощування обсягів
даних без відключення основної системи, використання стандартних комунікаційних протоколів і мережевих
підключень. Для під'єднання NAS-пристроїв до мережі не потрібно якихось специфічних інтерфейсів або
спеціального обладнання. Досить підключити файловий сервер до мережі, як всі його ресурси стають
доступними для користувачів.
Мережева система зберігання даних використовує спрощені операційні системи (ОС). Такі ОС
позбавлені всіх непотрібних служб і модулів і водночас вони максимально оптимізовані для обслуговування
файлової системи. Проста архітектура програмного забезпечення дозволяє отримати високу швидкість передачі
даних і максимально швидкий відгук на запити користувачів, при цьому не вимагаючи будь-яких серйозних
обчислювальних потужностей. Як правило, такі операційні системи зашиті у флеш-пам'ять пристрою і
встановлюються фірмою-виробником, проте є і програмне забезпечення, яке вільно розповсюджується в
інтернеті.
https://uk.wikipedia.org/w/index.php?title=%D0%97%D0%B1%D0%B5%D1%80%D1%96%D0%B3%D0%B0%D0%BD%D0%BD%D1%8F_%D0%B4%D0%B0%D0%BD%D0%B8%D1%85&action=edit&redlink=1
Освітні та навчальні аспекти програмування
84
Рис. 2. NAS архітектура
SAN (Storage Area Network) – це спеціалізована мережева інфраструктура для зберігання даних (рис. 3).
Ці мережі інтегруються у вигляді окремих спеціалізованих підмереж, які входять до складу локальної або
глобальної мережі. По суті, SAN-мережі пов'язують один або кілька серверів, з одним або декількома
пристроями зберігання даних. SAN-мережі дозволяють будь-якому серверу отримувати доступ, до будь-якого
пристрою зберігання даних, не завантажуючи при цьому ні інші сервери, ні локальну мережу. Крім того,
можливий обмін даними між пристроями зберігання даних без участі серверів. SAN-мережі дозволяють дуже
великому числу користувачів зберігати інформацію в одному місці з швидким централізованим доступом та
спільно використовувати її. СЗД можуть застосовувати наступні технології для керування дисковими масивами:
масиви RAID (Redundant Array of Independent Disks), магнітні бібліотеки, а також JBOD-системи (Just a bunch of
disks). Для побудови мереж SAN використовується стандарт Fibre Channel (FC), або стандарт iSCSI (Internet
Small Computer System Interface) [2].
Рис. 3. SAN архітектура
Освітні та навчальні аспекти програмування
85
До основних переваг SAN можна віднести практично всі її особливості:
незалежність топології SAN від системи збереження та серверів;
зручне централізоване управління;
відсутність конфлікту з трафіком LAN (Local Area Network) / WAN (Wide Area Network);
зручне резервування даних без завантаження локальної мережі і серверів;
високу швидкодію;
високу масштабованість;
високу гнучкість;
високу готовність і відмовостійкість.
Системи збереження даних компанії IBM
Одним із найпотужніших виробників систем збереження даних, є компанія IBM (рис. 4). На
сьогоднішній день портфоліо СЗД складається з наступних систем:
системи початкового рівня: FlashSystem 5010, FlashSystem 5030;
системи середнього рівня: FlashSystem 5100, FlashSystem 7200;
корпоративні флеш системи: FlashSystem 9200, FlashSystem 9200R.
Рис. 4. IBM FlashSystem
Моделі початкового рівня IBM FlashSystem 5010 і IBM FlashSystem 5030, раніше відомі як Storwize
V5010E і Storwize V5030E. Це гібридні флеш-системи, які підтримують функціональність програмного
забезпечення (ПЗ) для віртуалізації: IBM Spectrum Virtualize і аналітичну платформу управління даними: IBM
Storage Insights. Системи зберігання FlashSystem 5000, дають можливість впровадити сучасні технології і
зробити їх доступними для підприємств будь-якого масштабу [3].
FlashSystem 5100, FlashSystem 7200, FlashSystem 9200 – це потужні, економічні рішення в форм-
факторі 2U, що поєднують у собі швидкодію флеш пам'яті і технології NVMe (Non-Volatile Memory Host
Controller Interface Specification). У всіх системах, окрім FlashSystem 5010 і IBM FlashSystem 5030
підтримується технологія IBM FlashCore Module (FCM), що дозволяє використовувати носії об'ємом до 38,4
ТБ. Дані накопичувачі унікальні тим, що використовують апаратну компресію даних на самому носії, тим
самим підвищуючи продуктивність СЗД і знижуючи навантаження на процесор системи [4]. Також доступна
технологія енергонезалежної пам'яті Storage Class Memory (SCM), яка по продуктивності в кілька разів
перевершує стандартні SSD накопичувачі і забезпечує більш низькі затримки і високий експлуатаційний
ресурс [5].
На сьогодні, програмне забезпечення Spectrum Virtualize налічує такий функціонал:
Шифрування для віртуалізації сховища.
Шифрування даних забезпечує захист інформації в разі несанкціонованого доступу.
Графічний користувальницький інтерфейс (GUI).
Графічний веб-інтерфейс з можливостями управління зі свого робочого місця, що значно підвищує
продуктивність праці ІТ-фахівців.
Easy Tier.
Забезпечення автоматичного переносу часто використовуваних фрагментів даних на високопродуктивне
сховище на основі флеш-пам'яті.
Real-time Compression.
Підвищення ефективності за рахунок п'ятикратного збільшення обсягу зберігання активних, первинних
даних без збільшення фізичного обсягу дискової пам'яті. Даний функціонал дає можливість скоротити витрати
на зберігання, завдяки більш високій ефективності збереження.
Освітні та навчальні аспекти програмування
86
Тонке резервування.
Підтримка бізнес-додатків, яким потрібно динамічне розширення. При цьому споживається тільки
використовуваний обсяг пам'яті.
Metro Mirror і Global Mirror;
Підтримка синхронної і асинхронної реплікації даних між системами, для максимальної гнучкості і
ефективності резервного копіювання. Підтримка мережі Fibre Channel, Fibre Channel over Ethernet (FCoE) і IP
(Internet Protocol).
FlashCopy.
Створення практично миттєвої копії активних даних, яку можна використовувати для резервного
копіювання, або для операцій паралельної обробки.
HyperSwap.
Підтримка конфігурацій високої готовності для відмовостійких віртуалізованих сховищ, які працюють на
віддалених майданчиках [6].
Дослідження впливу накопичувачів на СЗД
Для дослідження впливу різноманітного типу накопичувачів на систему збереження, використовувалось
спеціалізоване програмне забезпечення Disk Magic (рис. 5).
Disk Magic – це інструмент для моделювання роботи дискових систем. Він виконує точне планування
продуктивності та аналізу для систем зберігання даних компанії IBM. Disk Magic дозволяє проводити роботи з
планування потужностей та аналізу продуктивності, до придбання нового обладнання.
Тестування проводилось на системі збереження даних IBM Storwize v5030E. Дана система підтримує
накопичувачі двох типів:
Hard Disk Drive (HDD) 7к, 10к, 15к;
Solid State Drive (SSD).
Для точного виміру продуктивності системи, необхідно визначитись з кінцевою конфігурацією, вона
повинна бути однаковою для обох тестів.
Кінцева конфігурація корпусу управління Storwize V5030E:
дві вузлові каністри, кожна з 6 ядерним процесором;
кеш-пам'ять 64 гігабайт (ГБ) на систему;
16 Гб/c (Гігабіти в секунду) Fibre Channel;
19-дюймовий корпус для кріплення в стійку з джерелами живлення змінного струму 100-240 Ват.
Рис. 5. Налаштування конфігурації СЗД в Disk Magic
Після налаштування конфігурації системи збереження, необхідно вибрати адаптери передачі даних, які
використовуються для з’єднання СЗД з сервером. В тесті використано 8 портів FC 16Гб/с зі сторони системи
збереження та 4 порти FC 16Гб/с зі сторони сервера (рис. 6, 7).
Освітні та навчальні аспекти програмування
87
Рис. 6. Налаштування кількості портів зі сторони сервера
Рис. 7. Налаштування кількості портів зі сторони СЗД
Після налаштування кількості портів необхідно налаштувати RAID-масив, а саме кількість та тип дисків,
які будуть входити до нього. Оскільки об’єми SSD і HDD дисків відрізняються один від одного, необхідно
підрахувати кількість накопичувачів, які слід використовувати, щоб забезпечити однаковий об’єм RAID-
масивів. Для цього використаємо ще одне ПЗ, а саме Capacity Magic. Дане програмне забезпечення дозволяє
підрахувати необхідну кількість накопичувачів для досягнення бажаного об’єму RAID-масиву (рис. 8, 9)..
Припустимо, що бажаний об’єм RAID-масиву 30 терабайт (ТБ) при використанні RAID 6. Для цього
необхідно створити розділ в Capacity Magic з відповідними параметрами.
Рис. 8. Створення RAID-масиву обсягом 30ТБ на SSD накопичувачах
Освітні та навчальні аспекти програмування
88
Рис. 9. Створення RAID-масиву обсягом 30ТБ на накопичувачах HDD
Отже, для того щоб досягти 30 ТБ в рамках одного RAID-массиву, необхідно використати дев’ятнадцять
SSD накопичувачів об’ємом 1.92 ТБ, або шістнадцять HDD дисків об’ємом 2.4 ТБ. Після підрахунку необхідної
кількості дисків, необхідно створити відповідні розділи в Disk Magic (рис. 10).
Рис. 10. Створення розділу в Disk Magiс
Після створення необхідних розділів, можна переходити до самого виміру (рис. 11, 12, 13, 14). Всі
налаштування залишаються базовими, а саме:
блок передачі інформації обсягом 4 Кіb (кілобіт);
кількість операцій зчитування з диску – 70 %;
кількість операцій запису на диск – 30 %.
Продуктивність системи збереження даних вимірюється в IOPS. IOPS (Input/output operations per
second) – кількість операцій введення-виведення, виконуваних системою зберігання даних, за одну секунду. Це
один з ключових параметрів, використовуваних для порівняння систем зберігання даних, і оцінки їх
продуктивності [7].
Освітні та навчальні аспекти програмування
89
Рис. 11. Вимірювання системи з дисками HDD
Рис. 12. Графік залежності кількості IOPS від часу обслуговування для накопичувачів HDD
Рис. 13. Вимірювання системи з дисками SSD
Освітні та навчальні аспекти програмування
90
Рис. 14. Графік залежності кількості IOPS від часу обслуговування для SSD накопичувачів
Аналізуючи результати вимірів можна висловити наступні рекомендації:
- продуктивність системи збереження даних, яка використовує накопичувачі SSD показала
продуктивність майже в 50 разів краще, ніж таж сама система збереження, яка використовує носії HDD. Саме
тому, твердотільні носії варто використовувати для завдань, які потребують швидкої обробки запиту,
наприклад бази даних Oracle, MongoDB, PostgreSQL;
- незважаючи на те, що носії HDD не такі продуктивні як SSD, існує ряд завдань для яких
використовувати твердотільні накопичувачі не раціонально. Завдання такого роду як правило потребують від
носія не швидкодії, а здатності вміщувати великі обсяги інформації в рамках одного диску. Саме тому, перед
складанням кінцевої конфігурації, бізнес-користувач повинен обов’язково знати, яка кількість IOPS йому
необхідна, щоб не переплачувати за носії, які не будуть утилізовані мінімум ніж на 80 % [8].
У зв’язку з тим, що високоємкісні SSD є досить дорогими, використовуються технології компресії та
дедублікації даних для збільшення логічної ємкості накопичувача. У сьогоденні, компресія даних має досить
серйозний вплив на швидкодію СЗД, оскільки навантаження, які вона створює, напряму впливають на роботу
центрального процесора. Задачі, які пов’язанні з компресією даних можуть бути винесені на додаткові апаратні
контролери FPGA (Field-Programmable Gate Array), однак не всі моделі підтримують технологію апаратної
компресії даних. У такому випадку, існує можливість реалізувати компресію даних програмним шляхом.
Промоделюємо вищезгадану конфігурацію СЗД з накопичувачами SSD та ввімкненою програмною
компресією даних (рис. 15, 16, 17).
Рис. 15. Вимірювання системи з дисками SSD та программною компресією
Освітні та навчальні аспекти програмування
91
Рис. 16. Графік залежності кількості IOPS від часу обслуговування для SSD накопичувачів з програмною
компресією
Рис. 17. Вимірювання системи з дисками SSD та апаратною компресією
Дивлячись на результати досліджень, можна зробити висновок, що використання програмної компресії
приводить до швидкого завантаження процессора. Це приводить до того, що час обслуговування одного запиту
на 10000 тисячах IOPS дорівнює трьом мілісекундам. Нормою для бази даних Oracle в свою чергу, є час до
однієї мілісекунди. Для порівняння зробимо аналогічні досліди з системою, яка використовує апаратну
компресію даних [9].
Провівши порівняння графіків залежності кількості IOPS від часу обслуговування для накопичувачів
SSD з апаратною та програмною компресією, можна висловити наступні рекомендації (рис. 18):
- варто використовувати програмну компресію даних лише для задач, які не потребують великої
кількості IOPS, адже порівнюючи результати вимірів СЗД IBM v5030E з програмною компресією та без неї,
можна спостерігати зниження продуктивності системи збереження приблизно в 4 рази при використанні
програмної компресії.
Освітні та навчальні аспекти програмування
92
- апаратна компресія є доцільним рішенням навіть при роботі з базами даних. Однак необхідно
розраховувати на системи вищого рівня. Наприклад, IBM FlashSystem 7200. Дана система має два 8 ядерних
процесори на контролер, це означає, що пікове завантаження процесора при включеній компресії відбудетеся
приблизно на позначці в 200 тисяч IOPS.
Рис. 18. Графік залежності кількості IOPS від часу обслуговування для накопичувачів SSD
з апаратною компресією
Висновки
Проведено огляд існуючих архітектур збереження даних, наведено їх переваги та недоліки.
Проаналізовано системи збереження даних компанії IBM, яка на сьогодні є одним із лідерів в сфері розробки
систем збереження. Визначено набір функцій, які впровадила вищезгадана компанія в програмне
забезпечення IBM Spectrum Virtualize, а саме віртуалізацію, компресію, розподілення та реплікацію даних.
Завдяки спеціалізованому ПЗ: Disk Magic, Capacity Magic було розроблено математичну модель СЗД, на
основі якої були проведені експерименти, які дозволили визначити вплив носіїв на продуктивність системи
збереження. Для аналізу експериментів використовувалися вже відомі метрики: кількість операцій вводу
виводу на секунду та час обслуговування запиту. В результаті було визначено, що накопичувач SSD
демонструє майже в 50 разів більшу кількість IOPS ніж носій HDD. Незважаючи на це магнітні диски
займають одну із ключових позицій в сфері збереження завдяки свої низькій собівартості і водночас
здатності зберігати великі обсяги інформації в рамках одного диски. Також було проведено додаткові
експерименти для вивчення впливу програмної та апаратної компресії на продуктивність СЗД та завдяки
вищезгаданим метрикам було оцінено продуктивність системи збереження. Сформульовано рекомендації за
якими можна визначити, які носії та який стек технологій слід використовувати бізнес-користувачу для
виконання поставлених перед ним завдань.
Література
1. Exploring Windows Storage Technologies: DAS, NAS and SAN-Based Solutions [Електронний ресурс]. BWW Media Group. 2020. Режим
доступу до ресурсу: https://www.petri.com/das-nas-san-storage-technologies.
2. Шрівастава А. От хранения данных к управлению информации. Санкт-Питербург: Питер. 2016. 543 с.
3. Enders F., Kubin S., Tate J. IBM FlashSystem 5000 Family Products. 2020. 38 p.
4. Tate J., Armstrong J., Bastos T., Brodacki P., Enders F., Kubin S., Miyasiro D., Suzuki R. Implementing the IBM System Storage SAN Volume
Controller with IBM Spectrum Virtualize GA. 2019. V8.2.1. Р. 37–59.
5. Hughes G. Hard Drive! (As the Disc Turns). 2007. 310 с. (Createspace Publishing).
6. Comparing IOPS for SSDs and HDDs [Електронний ресурс]. 2015. Режим доступу до ресурсу:
https://www.tvtechnology.com/opinions/comparing-iops-for-ssds-and-hdds.
7. Профессиональный тест SSD-накопителей Kingston DC500R и DC500M [Електронний ресурс]. 2013. Режим доступу до ресурсу:
https://prohoster.info/blog/administrirovanie/po-vashim-zayavkam-professionalnyj-test-ssd-nakopitelej-kingston-dc500r-i-dc500m.
https://www.petri.com/das-nas-san-storage-technologies
https://www.tvtechnology.com/opinions/comparing-iops-for-ssds-and-hdds
Освітні та навчальні аспекти програмування
93
8. What is Storage Class Memory (SCM)? [Електронний ресурс]. 2020. Режим доступу до ресурсу:
https://www.intellimagic.com/products/intellimagic-direction-for-san/.
9. Smith M. IBM FlashCore Module Cryptographic Erase. 2020. 8 p. (REDP-5529-00).
References
1. Exploring Windows Storage Technologies: DAS, NAS and SAN-Based Solutions [Electronic resource]. BWW Media Group. 2020. Access
mode to the resource: https://www.petri.com/das-nas-san-storage-technologies.
2. Shrivastava A. From data storage to information management. St. Petersburg: Peter. 2016. 543 p.
3. Enders F., Kubin S., Tate J. IBM FlashSystem 5000 Family Products. 2020. 38 p.
4. Tate J., Armstrong J., Bastos T., Brodacki P., Enders F., Kubin S., Miyasiro D., Suzuki R. Implementing the IBM System Storage SAN Volume
Controller with IBM Spectrum Virtualize GA. 2019. V8.2.1. Р. 37–59.
5. Hughes G. Hard Drive! (As the Disc Turns). 2007. 310 с. (Createspace Publishing).
6. Comparing IOPS for SSDs and HDDs [Electronic resource]. 2015. Access mode to the resource:
https://www.tvtechnology.com/opinions/comparing-iops-for-ssds-and-hdds.
7. Professional test SSD-drives Kingston DC500R and DC500M [Electronic resource]. 2013. Access mode to the resource:
https://prohoster.info/blog/administrirovanie/po-vashim-zayavkam-professionalnyj-test-ssd-nakopitelej-kingston-dc500r-i-dc500m.
8. What is Storage Class Memory (SCM)? [Electronic resource]. 2020. Access mode to the resource:
https://www.intellimagic.com/products/intellimagic-direction-for-san/.
9. Smith M. IBM FlashCore Module Cryptographic Erase. 2020. 8 p. (REDP-5529-00).
Одержано 02.03.2020
Про автора:
Пунда Сергій Юрійович,
магістр факультету інформаційної та обчислювальної техніки.
https://orcid.org/0000-0002-1068-494X
Місце роботи автора:
Національний технічний університет України
«КПІ імені Ігоря Сікорського»,
03056, Київ, проспект Перемоги, 37.
E-mail: serhiipunda@gmail.com
https://www.petri.com/das-nas-san-storage-technologies
https://www.tvtechnology.com/opinions/comparing-iops-for-ssds-and-hdds
https://orcid.org/0000-0002-1068-494X
https://uk.wikipedia.org/wiki/%D0%A1%D1%96%D0%BA%D0%BE%D1%80%D1%81%D1%8C%D0%BA%D0%B8%D0%B9_%D0%86%D0%B3%D0%BE%D1%80_%D0%86%D0%B2%D0%B0%D0%BD%D0%BE%D0%B2%D0%B8%D1%87
mailto:serhiipunda@gmail.com
|