Storage systems for IT infrastructure

A review of modern data storage architectures was conducted, the advantages and disadvantages of each of them were given. The data storage systems of the IBM FlashSystem family were analyzed, as well as Spectrum Virtualize software, which is responsible for virtualization, compression, distribution...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2020
Автор: Punda, S.Yu.
Формат: Стаття
Мова:Ukrainian
Опубліковано: PROBLEMS IN PROGRAMMING 2020
Теми:
Онлайн доступ:https://pp.isofts.kiev.ua/index.php/ojs1/article/view/400
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Problems in programming
Завантажити файл: Pdf

Репозитарії

Problems in programming
id pp_isofts_kiev_ua-article-400
record_format ojs
resource_txt_mv ppisoftskievua/be/2738424d25941f39220636de3fb4ddbe.pdf
spelling pp_isofts_kiev_ua-article-4002020-12-07T11:42:42Z Storage systems for IT infrastructure Системы хранения данных для ИТ инфраструктуры Системи збереження даних для ІТ інфраструктури Punda, S.Yu. data storage system; synchronous data replication; IOPS; Fiber Channel; data compression; business user; business process УДК 004.337 система хранения данных; синхронная репликация данных; IOPS; Fibre Channel; компрессия данных; бизнес-пользователь; бизнес-процесс УДК 004.337 система збереження даних; синхронна реплікація даних; IOPS; Fibre Channel; компресія даних; бізнес-користувач; бізнес процес УДК 004.337 A review of modern data storage architectures was conducted, the advantages and disadvantages of each of them were given. The data storage systems of the IBM FlashSystem family were analyzed, as well as Spectrum Virtualize software, which is responsible for virtualization, compression, distribution and replication of data stored on the storage system. A mathematical model of the data storage system of IBM Storwize v5030E was developed. Well-known metrics are used to evaluate its performance when using spindle and solid-state drives. The effect of hardware and software data compression on system performance has been experimentally revealed. Recommendations are formulated by which it is possible to determine which media and which technology stack should be used by a business user to complete the tasks assigned to him.Problems in programming 2020; 2-3: 82-93 Проведен обзор современных архитектур хранения данных, были приведены преимущества и недостатки каждой из них. Проанализированы системы хранения данных семейства IBM FlashSystem, а также программного обеспечения Spectrum Virtualize которое отвечает за виртуализацию, компрессию, распределения и репликацию данных, которые хранятся на системе хранения. Разработана математическая модель системы сохранения данных компании IBM Storwize v5030E. Применены известные метрики для оценки её производительности при использовании шпиндельных и твердотельных накопителей. Экспериментально выявлено влияние аппаратной и программной компрессии данных на быстродействие системы. Сформулированы рекомендации по которым можно определить какие носители и какой стек технологий следует использовать бизнес-пользователю для выполнения поставленных перед ним задач.Problems in programming 2020; 2-3: 82-93 Проведено огляд сучасних архітектур збереження даних, було наведено переваги та недоліки кожної з них. Проаналізовано системи збереження даних сімейства IBM FlashSystem, а також програмного забезпечення Spectrum Virtualize, яке відповідає за віртуалізацію, компресію, розподілення та  реплікацію даних які зберігаються на системі збереження. Розроблено математичну модель системи збереження даних компанії IBM Storwize v5030E. Застосовано відомі метрики для оцінки її продуктивності при використанні шпиндельних та твердотільних накопичувачів. Експериментально виявлено вплив апаратної та програмної компресії даних на швидкодію системи. Сформульовано рекомендації за якими можна визначити, які носії та який стек технологій слід використовувати бізнес-користувачу для виконання поставлених перед ним завдань.Problems in programming 2020; 2-3: 82-93  PROBLEMS IN PROGRAMMING ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ ПРОБЛЕМИ ПРОГРАМУВАННЯ 2020-09-16 Article Article application/pdf https://pp.isofts.kiev.ua/index.php/ojs1/article/view/400 10.15407/pp2020.02-03.082 PROBLEMS IN PROGRAMMING; No 2-3 (2020); 82-93 ПРОБЛЕМЫ ПРОГРАММИРОВАНИЯ; No 2-3 (2020); 82-93 ПРОБЛЕМИ ПРОГРАМУВАННЯ; No 2-3 (2020); 82-93 1727-4907 10.15407/pp2020.02-03 uk https://pp.isofts.kiev.ua/index.php/ojs1/article/view/400/403 Copyright (c) 2020 PROBLEMS IN PROGRAMMING
institution Problems in programming
baseUrl_str https://pp.isofts.kiev.ua/index.php/ojs1/oai
datestamp_date 2020-12-07T11:42:42Z
collection OJS
language Ukrainian
topic data storage system
synchronous data replication
IOPS
Fiber Channel
data compression
business user
business process
УДК 004.337
spellingShingle data storage system
synchronous data replication
IOPS
Fiber Channel
data compression
business user
business process
УДК 004.337
Punda, S.Yu.
Storage systems for IT infrastructure
topic_facet data storage system
synchronous data replication
IOPS
Fiber Channel
data compression
business user
business process
УДК 004.337
система хранения данных
синхронная репликация данных
IOPS
Fibre Channel
компрессия данных
бизнес-пользователь
бизнес-процесс
УДК 004.337
система збереження даних
синхронна реплікація даних
IOPS
Fibre Channel
компресія даних
бізнес-користувач
бізнес процес
УДК 004.337
format Article
author Punda, S.Yu.
author_facet Punda, S.Yu.
author_sort Punda, S.Yu.
title Storage systems for IT infrastructure
title_short Storage systems for IT infrastructure
title_full Storage systems for IT infrastructure
title_fullStr Storage systems for IT infrastructure
title_full_unstemmed Storage systems for IT infrastructure
title_sort storage systems for it infrastructure
title_alt Системы хранения данных для ИТ инфраструктуры
Системи збереження даних для ІТ інфраструктури
description A review of modern data storage architectures was conducted, the advantages and disadvantages of each of them were given. The data storage systems of the IBM FlashSystem family were analyzed, as well as Spectrum Virtualize software, which is responsible for virtualization, compression, distribution and replication of data stored on the storage system. A mathematical model of the data storage system of IBM Storwize v5030E was developed. Well-known metrics are used to evaluate its performance when using spindle and solid-state drives. The effect of hardware and software data compression on system performance has been experimentally revealed. Recommendations are formulated by which it is possible to determine which media and which technology stack should be used by a business user to complete the tasks assigned to him.Problems in programming 2020; 2-3: 82-93
publisher PROBLEMS IN PROGRAMMING
publishDate 2020
url https://pp.isofts.kiev.ua/index.php/ojs1/article/view/400
work_keys_str_mv AT pundasyu storagesystemsforitinfrastructure
AT pundasyu sistemyhraneniâdannyhdlâitinfrastruktury
AT pundasyu sistemizberežennâdanihdlâítínfrastrukturi
first_indexed 2025-07-17T10:06:05Z
last_indexed 2025-07-17T10:06:05Z
_version_ 1850411127352066048
fulltext Освітні та навчальні аспекти програмування © С.Ю. Пунда, 2020 82 ISSN 1727-4907. Проблеми програмування. 2020. № 2–3. Спеціальний випуск УДК 004.337 https://doi.org/10.15407/pp2020.02-03.082 СИСТЕМИ ЗБЕРЕЖЕННЯ ДАНИХ ДЛЯ ІТ ІНФРАСТРУКТУРИ С.Ю. Пунда Проведено огляд сучасних архітектур збереження даних, було наведено переваги та недоліки кожної з них. Проаналізовано системи збереження даних сімейства IBM FlashSystem, а також програмного забезпечення Spectrum Virtualize, яке відповідає за віртуалізацію, компресію, розподілення та реплікацію даних які зберігаються на системі збереження. Розроблено математичну модель системи збереження даних компанії IBM Storwize v5030E. Застосовано відомі метрики для оцінки її продуктивності при використанні шпиндельних та твердотільних накопичувачів. Експериментально виявлено вплив апаратної та програмної компресії даних на швидкодію системи. Сформульовано рекомендації за якими можна визначити, які носії та який стек технологій слід використовувати бізнес-користувачу для виконання поставлених перед ним завдань. Ключові слова: система збереження даних, синхронна реплікація даних, IOPS, Fibre Channel, компресія даних, бізнес-користувач, бізнес процес. Проведен обзор современных архитектур хранения данных, были приведены преимущества и недостатки каждой из них. Проанализированы системы хранения данных семейства IBM FlashSystem, а также программного обеспечения Spectrum Virtualize которое отвечает за виртуализацию, компрессию, распределения и репликацию данных, которые хранятся на системе хранения. Разработана математическая модель системы сохранения данных компании IBM Storwize v5030E. Применены известные метрики для оценки её производительности при использовании шпиндельных и твердотельных накопителей. Экспериментально выявлено влияние аппаратной и программной компрессии данных на быстродействие системы. Сформулированы рекомендации по которым можно определить какие носители и какой стек технологий следует использовать бизнес-пользователю для выполнения поставленных перед ним задач. Ключевые слова: система хранения данных, синхронная репликация данных, IOPS, Fibre Channel, компрессия данных, бизнес- пользователь, бизнес-процесс. A review of modern data storage architectures was conducted, the advantages and disadvantages of each of them were given. The data storage systems of the IBM FlashSystem family were analyzed, as well as Spectrum Virtualize software, which is responsible for virtualization, compression, distribution and replication of data stored on the storage system. A mathematical model of the data storage system of IBM Storwize v5030E was developed. Well-known metrics are used to evaluate its performance when using spindle and solid- state drives. The effect of hardware and software data compression on system performance has been experimentally revealed. Recommendations are formulated by which it is possible to determine which media and which technology stack should be used by a business user to complete the tasks assigned to him. Key words: data storage system, synchronous data replication, IOPS, Fiber Channel, data compression, business user, business process. Вступ Системи збереження даних (СЗД) є важливою складовою інформаційних технологій. Кожну секунду генеруються величезні обсяги інформації, які у сьогоденні зберігаються на спеціалізованих системах збереження даних. Саме СЗД забезпечують захист та віртуалізацію даних, готуючи їх до подальшої роботи. За останнє десятиліття технології збереження даних пройшли величезний шлях. Не так давно сховище інформації представлялись лише у вигляді звичайних магнітних або стрічкових накопичувачів підключених до комп’ютера з метою збереження даних, але у зв’язку з постійним збільшенням кількості інформації та з появою нових технологій, з’явилася потреба у спеціалізованому обладнанні, головним призначенням якого є робота з даними та їх збереження. У сьогоденні в комерційних організаціях спостерігається експоненціальне зростання кількості інформації, потребуючого ефективного збереження, захисту, оптимізації і контролю. Під ефективним збереженням мається на увазі наступне: - своєчасна передача інформації бізнес-користувачам: будь-яка інформація має бути доступна користувачу в будь який момент часу; - інтеграція інформаційної інфраструктури з бізнес-процесами: системи збереження даних повинні інтегруватися з різноманітними бізнес-процесами без загрози до безпеки та цілісності інфраструктури; - гнучка та відмовостійка архітектура сховищ: інфраструктура сховища має забезпечувати гнучкість і відмовостійкість з можливістю до адаптації під різноманітні вимоги. Сховище повинно мати можливість до масштабування без зниження продуктивності додатків, які використовують ресурси даних систем збереження. Огляд архітектур збереження даних На сьогодні можна виділити три основні архітектури збереження даних:  пряма мережа системи збереження (DAS); Освітні та навчальні аспекти програмування 83  файлова мережа системи зберігання даних (NAS);  блочна мережа зберігання даних (SAN). Технологія DAS (direct attached storage), має на увазі пряме підключення накопичувачів до серверу або персонального комп’ютера (ПК). При цьому, накопичувачі можуть бути як і внутрішніми, так і зовнішніми. Найпростіший випадок DAS-системи – це один диск, який інтегрований у сервер чи ПК. Варто відмітити, що не зважаючи на формальну можливість використання терміну DAS-системи щодо одиночного диску, або внутрішнього масиву дисків, потрібно розуміти, що в першу чергу під терміном DAS-системи прийнято розуміти зовнішню стійку, або корзину з накопичувачами, яку варто розглядати, як автономну систему збереження даних (рис. 1). Для підключення накопичувачів до хосту в технології DAS можуть виступати інтерфейси: SCSI (Small Computer Systems Interface), SATA (Serial ATA), PATA (Parallel ATA) і Fibre Channel. Якщо інтерфейси SCSI, PATA, SATA використовуються як правило для підключення внутрішніх накопичувачів, то Fibre Channel служить виключно для підключення зовнішніх накопичувачів і автономних СЗД [1]. Рис. 1. DAS архітектура До переваг DAS можна віднести:  низьку вартість;  простоту розгортання;  високу швидкість передачі даних. Саме через вищеперераховані переваги DAS-архітектура користується чималим попитом у бізнес- користувачів, які мають невеликі корпоративні мережі. Водночас DAS-системи мають свої недоліки, такі як: вимушений простій мережі в момент додавання нових дисків; складність масштабування. NAS (Network Attached Storage) – мережева система зберігання даних. Мережеві сховища являють собою зовнішні жорсткі диски, які підключаються до мережі і дозволяють декільком користувачам працювати з загальними файлами. Архітектура NAS максимально оптимізована для конкретного завдання, а саме – файловий сервіс (рис. 2). В основу проектування NAS-продуктів лежить ключове правило: вся обчислювальна потужність зосереджена на єдиному і головному завданні - обслуговування і зберігання файлів. Обмежившись ключовим завданням, NAS-продукти дозволяють організувати роботу групи користувачів із загальними файлами максимально ефективно з точки зору швидкодії і витрат. Завдяки NAS користувач отримує просте і зручне адміністрування, можливість нарощування обсягів даних без відключення основної системи, використання стандартних комунікаційних протоколів і мережевих підключень. Для під'єднання NAS-пристроїв до мережі не потрібно якихось специфічних інтерфейсів або спеціального обладнання. Досить підключити файловий сервер до мережі, як всі його ресурси стають доступними для користувачів. Мережева система зберігання даних використовує спрощені операційні системи (ОС). Такі ОС позбавлені всіх непотрібних служб і модулів і водночас вони максимально оптимізовані для обслуговування файлової системи. Проста архітектура програмного забезпечення дозволяє отримати високу швидкість передачі даних і максимально швидкий відгук на запити користувачів, при цьому не вимагаючи будь-яких серйозних обчислювальних потужностей. Як правило, такі операційні системи зашиті у флеш-пам'ять пристрою і встановлюються фірмою-виробником, проте є і програмне забезпечення, яке вільно розповсюджується в інтернеті. https://uk.wikipedia.org/w/index.php?title=%D0%97%D0%B1%D0%B5%D1%80%D1%96%D0%B3%D0%B0%D0%BD%D0%BD%D1%8F_%D0%B4%D0%B0%D0%BD%D0%B8%D1%85&action=edit&redlink=1 Освітні та навчальні аспекти програмування 84 Рис. 2. NAS архітектура SAN (Storage Area Network) – це спеціалізована мережева інфраструктура для зберігання даних (рис. 3). Ці мережі інтегруються у вигляді окремих спеціалізованих підмереж, які входять до складу локальної або глобальної мережі. По суті, SAN-мережі пов'язують один або кілька серверів, з одним або декількома пристроями зберігання даних. SAN-мережі дозволяють будь-якому серверу отримувати доступ, до будь-якого пристрою зберігання даних, не завантажуючи при цьому ні інші сервери, ні локальну мережу. Крім того, можливий обмін даними між пристроями зберігання даних без участі серверів. SAN-мережі дозволяють дуже великому числу користувачів зберігати інформацію в одному місці з швидким централізованим доступом та спільно використовувати її. СЗД можуть застосовувати наступні технології для керування дисковими масивами: масиви RAID (Redundant Array of Independent Disks), магнітні бібліотеки, а також JBOD-системи (Just a bunch of disks). Для побудови мереж SAN використовується стандарт Fibre Channel (FC), або стандарт iSCSI (Internet Small Computer System Interface) [2]. Рис. 3. SAN архітектура Освітні та навчальні аспекти програмування 85 До основних переваг SAN можна віднести практично всі її особливості:  незалежність топології SAN від системи збереження та серверів;  зручне централізоване управління;  відсутність конфлікту з трафіком LAN (Local Area Network) / WAN (Wide Area Network);  зручне резервування даних без завантаження локальної мережі і серверів;  високу швидкодію;  високу масштабованість;  високу гнучкість;  високу готовність і відмовостійкість. Системи збереження даних компанії IBM Одним із найпотужніших виробників систем збереження даних, є компанія IBM (рис. 4). На сьогоднішній день портфоліо СЗД складається з наступних систем:  системи початкового рівня: FlashSystem 5010, FlashSystem 5030;  системи середнього рівня: FlashSystem 5100, FlashSystem 7200;  корпоративні флеш системи: FlashSystem 9200, FlashSystem 9200R. Рис. 4. IBM FlashSystem Моделі початкового рівня IBM FlashSystem 5010 і IBM FlashSystem 5030, раніше відомі як Storwize V5010E і Storwize V5030E. Це гібридні флеш-системи, які підтримують функціональність програмного забезпечення (ПЗ) для віртуалізації: IBM Spectrum Virtualize і аналітичну платформу управління даними: IBM Storage Insights. Системи зберігання FlashSystem 5000, дають можливість впровадити сучасні технології і зробити їх доступними для підприємств будь-якого масштабу [3]. FlashSystem 5100, FlashSystem 7200, FlashSystem 9200 – це потужні, економічні рішення в форм- факторі 2U, що поєднують у собі швидкодію флеш пам'яті і технології NVMe (Non-Volatile Memory Host Controller Interface Specification). У всіх системах, окрім FlashSystem 5010 і IBM FlashSystem 5030 підтримується технологія IBM FlashCore Module (FCM), що дозволяє використовувати носії об'ємом до 38,4 ТБ. Дані накопичувачі унікальні тим, що використовують апаратну компресію даних на самому носії, тим самим підвищуючи продуктивність СЗД і знижуючи навантаження на процесор системи [4]. Також доступна технологія енергонезалежної пам'яті Storage Class Memory (SCM), яка по продуктивності в кілька разів перевершує стандартні SSD накопичувачі і забезпечує більш низькі затримки і високий експлуатаційний ресурс [5]. На сьогодні, програмне забезпечення Spectrum Virtualize налічує такий функціонал:  Шифрування для віртуалізації сховища. Шифрування даних забезпечує захист інформації в разі несанкціонованого доступу.  Графічний користувальницький інтерфейс (GUI). Графічний веб-інтерфейс з можливостями управління зі свого робочого місця, що значно підвищує продуктивність праці ІТ-фахівців.  Easy Tier. Забезпечення автоматичного переносу часто використовуваних фрагментів даних на високопродуктивне сховище на основі флеш-пам'яті.  Real-time Compression. Підвищення ефективності за рахунок п'ятикратного збільшення обсягу зберігання активних, первинних даних без збільшення фізичного обсягу дискової пам'яті. Даний функціонал дає можливість скоротити витрати на зберігання, завдяки більш високій ефективності збереження. Освітні та навчальні аспекти програмування 86  Тонке резервування. Підтримка бізнес-додатків, яким потрібно динамічне розширення. При цьому споживається тільки використовуваний обсяг пам'яті.  Metro Mirror і Global Mirror; Підтримка синхронної і асинхронної реплікації даних між системами, для максимальної гнучкості і ефективності резервного копіювання. Підтримка мережі Fibre Channel, Fibre Channel over Ethernet (FCoE) і IP (Internet Protocol).  FlashCopy. Створення практично миттєвої копії активних даних, яку можна використовувати для резервного копіювання, або для операцій паралельної обробки.  HyperSwap. Підтримка конфігурацій високої готовності для відмовостійких віртуалізованих сховищ, які працюють на віддалених майданчиках [6]. Дослідження впливу накопичувачів на СЗД Для дослідження впливу різноманітного типу накопичувачів на систему збереження, використовувалось спеціалізоване програмне забезпечення Disk Magic (рис. 5). Disk Magic – це інструмент для моделювання роботи дискових систем. Він виконує точне планування продуктивності та аналізу для систем зберігання даних компанії IBM. Disk Magic дозволяє проводити роботи з планування потужностей та аналізу продуктивності, до придбання нового обладнання. Тестування проводилось на системі збереження даних IBM Storwize v5030E. Дана система підтримує накопичувачі двох типів:  Hard Disk Drive (HDD) 7к, 10к, 15к;  Solid State Drive (SSD). Для точного виміру продуктивності системи, необхідно визначитись з кінцевою конфігурацією, вона повинна бути однаковою для обох тестів. Кінцева конфігурація корпусу управління Storwize V5030E:  дві вузлові каністри, кожна з 6 ядерним процесором;  кеш-пам'ять 64 гігабайт (ГБ) на систему;  16 Гб/c (Гігабіти в секунду) Fibre Channel;  19-дюймовий корпус для кріплення в стійку з джерелами живлення змінного струму 100-240 Ват. Рис. 5. Налаштування конфігурації СЗД в Disk Magic Після налаштування конфігурації системи збереження, необхідно вибрати адаптери передачі даних, які використовуються для з’єднання СЗД з сервером. В тесті використано 8 портів FC 16Гб/с зі сторони системи збереження та 4 порти FC 16Гб/с зі сторони сервера (рис. 6, 7). Освітні та навчальні аспекти програмування 87 Рис. 6. Налаштування кількості портів зі сторони сервера Рис. 7. Налаштування кількості портів зі сторони СЗД Після налаштування кількості портів необхідно налаштувати RAID-масив, а саме кількість та тип дисків, які будуть входити до нього. Оскільки об’єми SSD і HDD дисків відрізняються один від одного, необхідно підрахувати кількість накопичувачів, які слід використовувати, щоб забезпечити однаковий об’єм RAID- масивів. Для цього використаємо ще одне ПЗ, а саме Capacity Magic. Дане програмне забезпечення дозволяє підрахувати необхідну кількість накопичувачів для досягнення бажаного об’єму RAID-масиву (рис. 8, 9).. Припустимо, що бажаний об’єм RAID-масиву 30 терабайт (ТБ) при використанні RAID 6. Для цього необхідно створити розділ в Capacity Magic з відповідними параметрами. Рис. 8. Створення RAID-масиву обсягом 30ТБ на SSD накопичувачах Освітні та навчальні аспекти програмування 88 Рис. 9. Створення RAID-масиву обсягом 30ТБ на накопичувачах HDD Отже, для того щоб досягти 30 ТБ в рамках одного RAID-массиву, необхідно використати дев’ятнадцять SSD накопичувачів об’ємом 1.92 ТБ, або шістнадцять HDD дисків об’ємом 2.4 ТБ. Після підрахунку необхідної кількості дисків, необхідно створити відповідні розділи в Disk Magic (рис. 10). Рис. 10. Створення розділу в Disk Magiс Після створення необхідних розділів, можна переходити до самого виміру (рис. 11, 12, 13, 14). Всі налаштування залишаються базовими, а саме:  блок передачі інформації обсягом 4 Кіb (кілобіт);  кількість операцій зчитування з диску – 70 %;  кількість операцій запису на диск – 30 %. Продуктивність системи збереження даних вимірюється в IOPS. IOPS (Input/output operations per second) – кількість операцій введення-виведення, виконуваних системою зберігання даних, за одну секунду. Це один з ключових параметрів, використовуваних для порівняння систем зберігання даних, і оцінки їх продуктивності [7]. Освітні та навчальні аспекти програмування 89 Рис. 11. Вимірювання системи з дисками HDD Рис. 12. Графік залежності кількості IOPS від часу обслуговування для накопичувачів HDD Рис. 13. Вимірювання системи з дисками SSD Освітні та навчальні аспекти програмування 90 Рис. 14. Графік залежності кількості IOPS від часу обслуговування для SSD накопичувачів Аналізуючи результати вимірів можна висловити наступні рекомендації: - продуктивність системи збереження даних, яка використовує накопичувачі SSD показала продуктивність майже в 50 разів краще, ніж таж сама система збереження, яка використовує носії HDD. Саме тому, твердотільні носії варто використовувати для завдань, які потребують швидкої обробки запиту, наприклад бази даних Oracle, MongoDB, PostgreSQL; - незважаючи на те, що носії HDD не такі продуктивні як SSD, існує ряд завдань для яких використовувати твердотільні накопичувачі не раціонально. Завдання такого роду як правило потребують від носія не швидкодії, а здатності вміщувати великі обсяги інформації в рамках одного диску. Саме тому, перед складанням кінцевої конфігурації, бізнес-користувач повинен обов’язково знати, яка кількість IOPS йому необхідна, щоб не переплачувати за носії, які не будуть утилізовані мінімум ніж на 80 % [8]. У зв’язку з тим, що високоємкісні SSD є досить дорогими, використовуються технології компресії та дедублікації даних для збільшення логічної ємкості накопичувача. У сьогоденні, компресія даних має досить серйозний вплив на швидкодію СЗД, оскільки навантаження, які вона створює, напряму впливають на роботу центрального процесора. Задачі, які пов’язанні з компресією даних можуть бути винесені на додаткові апаратні контролери FPGA (Field-Programmable Gate Array), однак не всі моделі підтримують технологію апаратної компресії даних. У такому випадку, існує можливість реалізувати компресію даних програмним шляхом. Промоделюємо вищезгадану конфігурацію СЗД з накопичувачами SSD та ввімкненою програмною компресією даних (рис. 15, 16, 17). Рис. 15. Вимірювання системи з дисками SSD та программною компресією Освітні та навчальні аспекти програмування 91 Рис. 16. Графік залежності кількості IOPS від часу обслуговування для SSD накопичувачів з програмною компресією Рис. 17. Вимірювання системи з дисками SSD та апаратною компресією Дивлячись на результати досліджень, можна зробити висновок, що використання програмної компресії приводить до швидкого завантаження процессора. Це приводить до того, що час обслуговування одного запиту на 10000 тисячах IOPS дорівнює трьом мілісекундам. Нормою для бази даних Oracle в свою чергу, є час до однієї мілісекунди. Для порівняння зробимо аналогічні досліди з системою, яка використовує апаратну компресію даних [9]. Провівши порівняння графіків залежності кількості IOPS від часу обслуговування для накопичувачів SSD з апаратною та програмною компресією, можна висловити наступні рекомендації (рис. 18): - варто використовувати програмну компресію даних лише для задач, які не потребують великої кількості IOPS, адже порівнюючи результати вимірів СЗД IBM v5030E з програмною компресією та без неї, можна спостерігати зниження продуктивності системи збереження приблизно в 4 рази при використанні програмної компресії. Освітні та навчальні аспекти програмування 92 - апаратна компресія є доцільним рішенням навіть при роботі з базами даних. Однак необхідно розраховувати на системи вищого рівня. Наприклад, IBM FlashSystem 7200. Дана система має два 8 ядерних процесори на контролер, це означає, що пікове завантаження процесора при включеній компресії відбудетеся приблизно на позначці в 200 тисяч IOPS. Рис. 18. Графік залежності кількості IOPS від часу обслуговування для накопичувачів SSD з апаратною компресією Висновки Проведено огляд існуючих архітектур збереження даних, наведено їх переваги та недоліки. Проаналізовано системи збереження даних компанії IBM, яка на сьогодні є одним із лідерів в сфері розробки систем збереження. Визначено набір функцій, які впровадила вищезгадана компанія в програмне забезпечення IBM Spectrum Virtualize, а саме віртуалізацію, компресію, розподілення та реплікацію даних. Завдяки спеціалізованому ПЗ: Disk Magic, Capacity Magic було розроблено математичну модель СЗД, на основі якої були проведені експерименти, які дозволили визначити вплив носіїв на продуктивність системи збереження. Для аналізу експериментів використовувалися вже відомі метрики: кількість операцій вводу виводу на секунду та час обслуговування запиту. В результаті було визначено, що накопичувач SSD демонструє майже в 50 разів більшу кількість IOPS ніж носій HDD. Незважаючи на це магнітні диски займають одну із ключових позицій в сфері збереження завдяки свої низькій собівартості і водночас здатності зберігати великі обсяги інформації в рамках одного диски. Також було проведено додаткові експерименти для вивчення впливу програмної та апаратної компресії на продуктивність СЗД та завдяки вищезгаданим метрикам було оцінено продуктивність системи збереження. Сформульовано рекомендації за якими можна визначити, які носії та який стек технологій слід використовувати бізнес-користувачу для виконання поставлених перед ним завдань. Література 1. Exploring Windows Storage Technologies: DAS, NAS and SAN-Based Solutions [Електронний ресурс]. BWW Media Group. 2020. Режим доступу до ресурсу: https://www.petri.com/das-nas-san-storage-technologies. 2. Шрівастава А. От хранения данных к управлению информации. Санкт-Питербург: Питер. 2016. 543 с. 3. Enders F., Kubin S., Tate J. IBM FlashSystem 5000 Family Products. 2020. 38 p. 4. Tate J., Armstrong J., Bastos T., Brodacki P., Enders F., Kubin S., Miyasiro D., Suzuki R. Implementing the IBM System Storage SAN Volume Controller with IBM Spectrum Virtualize GA. 2019. V8.2.1. Р. 37–59. 5. Hughes G. Hard Drive! (As the Disc Turns). 2007. 310 с. (Createspace Publishing). 6. Comparing IOPS for SSDs and HDDs [Електронний ресурс]. 2015. Режим доступу до ресурсу: https://www.tvtechnology.com/opinions/comparing-iops-for-ssds-and-hdds. 7. Профессиональный тест SSD-накопителей Kingston DC500R и DC500M [Електронний ресурс]. 2013. Режим доступу до ресурсу: https://prohoster.info/blog/administrirovanie/po-vashim-zayavkam-professionalnyj-test-ssd-nakopitelej-kingston-dc500r-i-dc500m. https://www.petri.com/das-nas-san-storage-technologies https://www.tvtechnology.com/opinions/comparing-iops-for-ssds-and-hdds Освітні та навчальні аспекти програмування 93 8. What is Storage Class Memory (SCM)? [Електронний ресурс]. 2020. Режим доступу до ресурсу: https://www.intellimagic.com/products/intellimagic-direction-for-san/. 9. Smith M. IBM FlashCore Module Cryptographic Erase. 2020. 8 p. (REDP-5529-00). References 1. Exploring Windows Storage Technologies: DAS, NAS and SAN-Based Solutions [Electronic resource]. BWW Media Group. 2020. Access mode to the resource: https://www.petri.com/das-nas-san-storage-technologies. 2. Shrivastava A. From data storage to information management. St. Petersburg: Peter. 2016. 543 p. 3. Enders F., Kubin S., Tate J. IBM FlashSystem 5000 Family Products. 2020. 38 p. 4. Tate J., Armstrong J., Bastos T., Brodacki P., Enders F., Kubin S., Miyasiro D., Suzuki R. Implementing the IBM System Storage SAN Volume Controller with IBM Spectrum Virtualize GA. 2019. V8.2.1. Р. 37–59. 5. Hughes G. Hard Drive! (As the Disc Turns). 2007. 310 с. (Createspace Publishing). 6. Comparing IOPS for SSDs and HDDs [Electronic resource]. 2015. Access mode to the resource: https://www.tvtechnology.com/opinions/comparing-iops-for-ssds-and-hdds. 7. Professional test SSD-drives Kingston DC500R and DC500M [Electronic resource]. 2013. Access mode to the resource: https://prohoster.info/blog/administrirovanie/po-vashim-zayavkam-professionalnyj-test-ssd-nakopitelej-kingston-dc500r-i-dc500m. 8. What is Storage Class Memory (SCM)? [Electronic resource]. 2020. Access mode to the resource: https://www.intellimagic.com/products/intellimagic-direction-for-san/. 9. Smith M. IBM FlashCore Module Cryptographic Erase. 2020. 8 p. (REDP-5529-00). Одержано 02.03.2020 Про автора: Пунда Сергій Юрійович, магістр факультету інформаційної та обчислювальної техніки. https://orcid.org/0000-0002-1068-494X Місце роботи автора: Національний технічний університет України «КПІ імені Ігоря Сікорського», 03056, Київ, проспект Перемоги, 37. E-mail: serhiipunda@gmail.com https://www.petri.com/das-nas-san-storage-technologies https://www.tvtechnology.com/opinions/comparing-iops-for-ssds-and-hdds https://orcid.org/0000-0002-1068-494X https://uk.wikipedia.org/wiki/%D0%A1%D1%96%D0%BA%D0%BE%D1%80%D1%81%D1%8C%D0%BA%D0%B8%D0%B9_%D0%86%D0%B3%D0%BE%D1%80_%D0%86%D0%B2%D0%B0%D0%BD%D0%BE%D0%B2%D0%B8%D1%87 mailto:serhiipunda@gmail.com