Високопродуктивний синхронізований матричний процесор множення АЛП суперкомп’ютерів

The scope of application and priority directions of improvement of high-performance multibit matrix multipliers (MMM) as components of ALU coprocessors of multicore supercomputers are outlined. The characteristics of performance and hardware complexity of known matrix multi...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2023
Hauptverfasser: Nykolaychuk, Yaroslav, Hryha, Volodymyr, Zastavnyi, Oleh
Format: Artikel
Sprache:Ukrainisch
Veröffentlicht: Інститут прикладних проблем механіки і математики ім. Я. С. Підстригача НАН України 2023
Schlagworte:
Online Zugang:https://www.fmmit.lviv.ua/index.php/fmmit/article/view/302
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Physico-mathematical modeling and informational technologies
Завантажити файл: Pdf

Institution

Physico-mathematical modeling and informational technologies
_version_ 1867479671770185728
author Nykolaychuk, Yaroslav
Hryha, Volodymyr
Zastavnyi, Oleh
author_facet Nykolaychuk, Yaroslav
Hryha, Volodymyr
Zastavnyi, Oleh
author_institution_txt_mv [ { "author": "Yaroslav Nykolaychuk", "institution": "д. т. н., професор, Західноукраїнський національний університет, вул. Львівська, 11, 46009, Тернопіль" }, { "author": "Volodymyr Hryha", "institution": "к. т. н., доцент, Прикарпатський національний університет імені Василя Стефаника, вул. Шевченка, 57, 76018, Івано-Франківськ" }, { "author": "Oleh Zastavnyi", "institution": "к.т.н., старший викладач, Західноукраїнський національний університет, вул. Львівська, 11, 46009, Тернопіль" } ]
author_sort Nykolaychuk, Yaroslav
baseUrl_str http://www.fmmit.lviv.ua/index.php/fmmit/oai
collection OJS
datestamp_date 2025-02-21T17:31:10Z
description The scope of application and priority directions of improvement of high-performance multibit matrix multipliers (MMM) as components of ALU coprocessors of multicore supercomputers are outlined. The characteristics of performance and hardware complexity of known matrix multipliers are systematized. The prospect of improving the structures of multipliers based on synchronized single-bit accumulative binary adders (SABA) is substantiated. The algorithm and structure of the MMM based on multiplex-switched SABAs are proposed. The system characteristics of this class of multipliers are investigated depending on the bit depth of the input binary codes.
first_indexed 2026-06-09T01:09:59Z
format Article
fulltext 42 doi.org/10.15407/fmmit2023.37.042 Високопродуктивний синхронізований матричний процесор множення АЛП суперкомп’ютерів Ярослав Николайчук1, Володимир Грига2, Олег Заставний3 1 д. т. н., професор, Західноукраїнський національний університет, вул. Львівська, 11, 46009, Тернопіль, e-mail: ya.nykolaichuk@wunu.edu.ua 2 к. т. н., доцент, Прикарпатський національний університет імені Василя Стефаника, вул. Шевченка, 57, 76018, Івано-Франківськ, e-mail: v.dr_2000@ukr.net 3 к.т.н., старший викладач, Західноукраїнський національний університет, вул. Львівська, 11, 46009, Тернопіль, e-mail: o.zastavnyi@wunu.edu.ua Викладені сфери застосування та пріоритетні напрямки удосконалення високопродуктивних багаторозрядних матричних перемножувачів (БМП) у якості компонентів співпроцесорів АЛП багатоядерних суперкомп’ютерів. Систематизовані характеристики швидкодії та апаратної складності відомих матричних перемножувачів. Обгрунтована перспектива удосконалення структур перемножувачів на основі синхронізованих однорозрядних накопичуючих двійкових суматорів (СНДС). Запропонований алгоритм та структура БМП на основі мультиплексно-комутованих СНДС. Досліджені системні характеристики такого класу перемножувачів залежно від розрядності вхідних двійкових кодів. Ключові слова: АЛП суперкомп’ютерів, співпроцесори, синхронізовані суматори, перемножувачі, бінарно-двійкова арифметика. Вступ. Основними швидкодіючими компонентами суперкомп’ютерів є процесори оснащені багаторозрядними високопродуктивними модулями АЛП. До класу таких процесорів відносять АЛП векторних та скалярних суперкомп’ютерів фірм: Cray, Fujitsu, Hitachi, IBM, HP [1]. Високопродуктивні співпроцесори у якості компонентів АЛП широко застосовуються при реалізації алгоритмічно-складних обчислень статистичного, кореляційного, спектрального, кластерного та ентропійного аналізу, а також в обладнанні військового призначення. 1. Пріоритетні напрями удосконалення досліджуваного класу співпроцесорів Пріоритетним напрямком удосконалення таких співпроцесорів є досягнення максимально-можливої швидкодії обчислень [2]. Виключно-масове застосування у сучасних комп’ютерних системах та суперпроцесорах класичної двійкової арифметики, яка містить наскрізні переноси між розрядами, є особливо негативним фактором можливостей підвищення швидкодії багаторозрядних обчислювальних засобів. Наприклад, при здійсненні операцій додавання та множення двох n-розрядних монодвійкових УДК 681.32 mailto:ya.nykolaichuk@wunu.edu.ua mailto:v.dr_2000@ukr.net mailto:o.zastavnyi@wunu.edu.ua ISSN 1816-1545 Фізико-математичне моделювання та інформаційні технології 2023, вип. 37, 42-46 43 кодів (МДК) відбувається затримка сигналів в обчислювальному пристрої, відповідно на n та 2n+(2n-1) мікротактів. Тобто, при розрядності регістрів пам’яті АЛП ядер суперкомп’ютерів у діапазоні (128 - 2048) біт, затримка сигналів при виконанні операції додавання у класичних багаторозрядних двійкових суматорах (БДС) [3] з прямими інформаційними входо-виходами, відповідно складає – (256 - 4096) мікротактів, що суттєво знижує швидкодію АЛП суперкомп’ютерів. У відомих структурах однорозрядних суматорів [3], затримка наскрізних переносів (Сout) становить - 2 мікротакти, а формування біта суми (Si) - 6 мікротактів. З метою удосконалення та підвищення швидкодії такого класу БДС нами запропонована структура на основі інверсних входо-виходів однорозрядних суматорів з парафазними (кубітними) інформаційними входами [4], яка представлена на рис. 1. Рис. 1. Запропонована структура n-розрядного БДС на основі інверсних входо-виходів. Дана n-розрядна структура БДС дозволяє здійснити операцію додавання двох n-розрядних двійкових чисел за n мікротактів, тобто із затримкою наскрізних переносів – 1 мікротакт, що підвищує швидкодію суматора у порівнянні з відомим у 2 рази. На рис. 2 а,б,в представлені однорозрядні компоненти перемножувачів Брауна [5], Дадда з однофазними входо/виходами [6] та запропонована нами структура з парафазними входо-виходами [7]. а) б) в) Рис. 2. Однорозрядні компоненти матричних перемножувачів: Брауна (а); Дадда (б); запропонований з парафазними входо-виходами (в). Максимальна швидкодія такого класу перемножувачів на основі запропонованих однорозярдних суматорів з парафазними (кубітними) входо- виходами (рис. 3в) [8], які мають затримки сигналів формування суми та наскрізних переносів 1 мікротакт відповідає критерію мінімально-можливої часової складності такого класу перемножувачів. Ярослав Николайчук, Володимир Грига, Олег Заставний Високопродуктивний синхронізований матричний процесор множення АЛП суперкомп’ютерів 44 Принциповим недоліком таких перемножувачів є наявність наскрізних переносів між компонентами їх структур. 2. Математичні основи бінарно-двійкової арифметики В основу побудови високопродуктивних багаторозрядних синхронізованих матричних перемножувачів покладені математичні положення теорії бінарної арифметики. Згідно положень бінарно-двійкової арифметики, запропонованої професором Я.М. Николайчуком [8], кожне n-розрядне двійкове число, яке представлене двійковим монокодом (МДК), представляється 2n-розрядним бінарним двійковим кодом (БДК), який містить у кожному розряді біт наскрізного переносу ( . iC ) та біт суми ( . iS ). Приклад такого бінарного двійкового коду (БДК) має вигляд: 1 1 0 0 . . . . . . . ,..., ,...,n n n i id C S C S C S  , (1) де . nd – 2n-розрядне бінарно-двійкове число. Запропонований принцип кодування двійкових чисел з реєстрацією бітів наскрізних переносів ( . iC ) та бітів суми ( . iS ) у кожному розряді БДК дозволяє виключити операції наскрізного переносу в алгоритмах обчислень сум та добутків незалежно від розрядності вхідних двійкових кодів. Операція додавання двох двійкових чисел згідно бінарної арифметики здійснюється наступним чином. Нехай, маємо: x+y = . nd , де x,y – n-розрядні двійкові числа, які після додавання утворюють 2n-розрядний БДК, згідно виразу: 0 0 1 1 1 1 1 1 2 1 1 0( ( , ..., , ..., , ) ( , ..., , ..., , ) , ..., , ..., , ..., ) n i n i n n i i x a a a a y b b b b d C S C S C S C S                    , (2) де x, y – двійкові коди цілих чисел: 0,1ia  ; 0,1ib  ; 0,1iC   ; 0,1iS   ; 1 0, 2id    . 3. Структура високопродуктивного синхронізованого матричного процесора множення, який реалізує обчислювальні операції згідно бінарно-двійкової арифметики На рис. 3 представлена мікроелектронна структура (а) та її однорозрядний компонент (б) формування 2n-розрядного БДК шляхом додавання двох n- розрядних МДК. На основі запропонованих однорозрядних синхронізованих суматорів [9] розроблена архітектура синхронізованого матричного перемножувача, 16-розрядна структура якого показана на рис.3 (в). ISSN 1816-1545 Фізико-математичне моделювання та інформаційні технології 2023, вип. 37, 42-46 45 а) б) в) Рис. 3. Структури мікроелектронного компонента НС (а); 2n-розрядного БДК (б); архітектура синхронізованого 16-розрядного матричного перемножувача (в). Розроблений алгоритм перемноження на основі бінарно-двійкової арифметики включає операції: скидання всіх тригерів пристрою у ‘0’-стан’ формування кодів Бута у непарних суматорах та послідовне додавання кодів БДК між (1-2, 2-4,…, log2 (n-1)) суматорами з часовою затримкою 3*5=15 - мікротактів. Наприклад, при розрядності перемножуваних чисел 1024 біт формування вихідного коду результату множення запропонованою структурою здійснюється за 2+2+(15*9)=139 мікротактів, що у 30 разів перевищує швидкодію перемножувачів на основі відомих класичних матричних структурах. Ярослав Николайчук, Володимир Грига, Олег Заставний Високопродуктивний синхронізований матричний процесор множення АЛП суперкомп’ютерів 46 Висновки. Викладений аналіз системних характеристик відомих структур несинхронізованих матричних перемножувачів, які містять у якості компонентів несинхронізовані однорозрядні комбінаційні суматори, принципово обмежує їх швидкодію в залежності від розрядності вхідних двійкових кодів із затримкою сигналів n+(n-1) мікротактів. Запропонована структура високопродуктивного синхронізованого матричного процесора множення, який реалізує алгоритм обчислення згідно бінарної двійкової арифметики, дозволяє збільшити швидкодію такого класу співпроцесорів АЛП суперкомп’ютерів з розрядністю (1024-4096 біт) у 30-90 разів. Література [1] IBM official website. Access mode: https://www.ibm.com [2] Ivan V. Sergienko, Valery K. Zadiraka, Oleg M. Lytvyn. “Elements of the General Theory of Optimal Algorithms”, Springer Optimization and Applications, Springer, 2021,- 377 p. [3] Електронний ресурс: http://phg.su/basis2/X134.HTM [4] Y. Nyckolaychuk, V. Hryha, N. Vozna, A. Voronych, A. Segin, P. Humennyi High-performance coprocessors for arithmetic and logic operations of multi-bit cores for vector and scalar supercomputers // Advanced Computer Information Technologies. 12th International Conference. ACIT 2022. – Spišská Kapitula, Slovakia, September 2022. – P. 410-414. [5] Возна Н.Я., Николайчук Я.М., Давлетова А.Я. Методи удосконалення структур багаторозрядних перемножувальних пристроїв матричного типу. Фізико-математичне моделювання та інформаційні технології, (32), 2021, 80-85 [6] Возна Н.Я., Грига В.М., Николайчук Я.М. Патент на винахід № 123924. Матричний перемножувач, Бюл. №25, 2021. [7] Давлетова А.Я., Грига В.М., Николайчук Я.М. Патент на винахід № 132520. Матричний перемножувач, Бюл. №4, 2019. [8] Николайчук Я.М. Основи теорії, методології та схемотехніки бінарної арифметики багаторозрядних суперкомп’ютерів // Матеріали проблемно-наукової міжгалузевої конференції “Інформаційні проблеми комп’ютерних систем, юриспруденції, енергетики, моделювання та управління”, ISCM-2022 – Надвірна, 2022. – С. 11-27. [9] Пітух І.Р., Грига В.М., Николайчук Л.М., Грига Л.П. Патент на корисну модель № 146833. Повний однорозрядний синхронізований суматор, Бюл. №12, 2021 High-performance synchronized matrix ALU multiplication processor for supercomputers Yaroslav Nykolaychuk, Volodymyr Hryha, Oleh Zastavnyi The scope of application and priority directions of improvement of high-performance multibit matrix multipliers (MMM) as components of ALU coprocessors of multicore supercomputers are outlined. The characteristics of performance and hardware complexity of known matrix multipliers are systematized. The prospect of improving the structures of multipliers based on synchronized single-bit accumulative binary adders (SABA) is substantiated. The algorithm and structure of the MMM based on multiplex-switched SABAs are proposed. The system characteristics of this class of multipliers are investigated depending on the bit depth of the input binary codes. Отримано 30.03.23 https://www.ibm.com/ http://phg.su/basis2/X134.HTM
id oai:ojs2.www.fmmit.lviv.ua:article-302
institution Physico-mathematical modeling and informational technologies
keywords_txt_mv keywords
language Ukrainian
last_indexed 2026-06-09T01:09:59Z
publishDate 2023
publisher Інститут прикладних проблем механіки і математики ім. Я. С. Підстригача НАН України
record_format ojs
resource_txt_mv wwwfmmitlvivua/91/4366efc393d9c096a34bc0ba3a309291.pdf
spelling oai:ojs2.www.fmmit.lviv.ua:article-3022025-02-21T17:31:10Z High-performance synchronized matrix ALU multiplication processor for supercomputers Високопродуктивний синхронізований матричний процесор множення АЛП суперкомп’ютерів Nykolaychuk, Yaroslav Hryha, Volodymyr Zastavnyi, Oleh АЛП суперкомп’ютерів, співпроцесори, синхронізовані суматори, перемножувачі, бінарно-двійкова арифметика The scope of application and priority directions of improvement of high-performance multibit matrix multipliers (MMM) as components of ALU coprocessors of multicore supercomputers are outlined. The characteristics of performance and hardware complexity of known matrix multipliers are systematized. The prospect of improving the structures of multipliers based on synchronized single-bit accumulative binary adders (SABA) is substantiated. The algorithm and structure of the MMM based on multiplex-switched SABAs are proposed. The system characteristics of this class of multipliers are investigated depending on the bit depth of the input binary codes. Викладені сфери застосування та пріоритетні напрямки удосконалення високопродуктивних багаторозрядних матричних перемножувачів (БМП) у якості компонентів співпроцесорів АЛП багатоядерних суперкомп’ютерів. Систематизовані характеристики швидкодії та апаратної складності відомих матричних перемножувачів. Обгрунтована перспектива удосконалення структур перемножувачів на основі синхронізованих однорозрядних накопичуючих двійкових суматорів (СНДС). Запропонований алгоритм та структура БМП на основі мультиплексно-комутованих СНДС. Досліджені системні характеристики такого класу перемножувачів залежно від розрядності вхідних двійкових кодів Інститут прикладних проблем механіки і математики ім. Я. С. Підстригача НАН України 2023-06-27 Article Article application/pdf https://www.fmmit.lviv.ua/index.php/fmmit/article/view/302 PHYSICO-MATHEMATICAL MODELLING AND INFORMATIONAL TECHNOLOGIES; No. 37 (2023): ФІЗИКО-МАТЕМАТИЧНЕ МОДЕЛЮВАННЯ ТА ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ; 42-46 ФІЗИКО-МАТЕМАТИЧНЕ МОДЕЛЮВАННЯ ТА ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ; № 37 (2023): ФІЗИКО-МАТЕМАТИЧНЕ МОДЕЛЮВАННЯ ТА ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ; 42-46 2617-5258 1816-1545 10.15407/fmmit2023.37 uk https://www.fmmit.lviv.ua/index.php/fmmit/article/view/302/270 Авторське право (c) 2023 Ярослав Николайчук, Володимир Грига, Олег Заставний (Автор)
spellingShingle АЛП суперкомп’ютерів
співпроцесори
синхронізовані суматори
перемножувачі
бінарно-двійкова арифметика
Nykolaychuk, Yaroslav
Hryha, Volodymyr
Zastavnyi, Oleh
Високопродуктивний синхронізований матричний процесор множення АЛП суперкомп’ютерів
title Високопродуктивний синхронізований матричний процесор множення АЛП суперкомп’ютерів
title_alt High-performance synchronized matrix ALU multiplication processor for supercomputers
title_full Високопродуктивний синхронізований матричний процесор множення АЛП суперкомп’ютерів
title_fullStr Високопродуктивний синхронізований матричний процесор множення АЛП суперкомп’ютерів
title_full_unstemmed Високопродуктивний синхронізований матричний процесор множення АЛП суперкомп’ютерів
title_short Високопродуктивний синхронізований матричний процесор множення АЛП суперкомп’ютерів
title_sort високопродуктивний синхронізований матричний процесор множення алп суперкомп’ютерів
topic АЛП суперкомп’ютерів
співпроцесори
синхронізовані суматори
перемножувачі
бінарно-двійкова арифметика
topic_facet АЛП суперкомп’ютерів
співпроцесори
синхронізовані суматори
перемножувачі
бінарно-двійкова арифметика
url https://www.fmmit.lviv.ua/index.php/fmmit/article/view/302
work_keys_str_mv AT nykolaychukyaroslav highperformancesynchronizedmatrixalumultiplicationprocessorforsupercomputers
AT hryhavolodymyr highperformancesynchronizedmatrixalumultiplicationprocessorforsupercomputers
AT zastavnyioleh highperformancesynchronizedmatrixalumultiplicationprocessorforsupercomputers
AT nykolaychukyaroslav visokoproduktivnijsinhronízovanijmatričnijprocesormnožennâalpsuperkompûterív
AT hryhavolodymyr visokoproduktivnijsinhronízovanijmatričnijprocesormnožennâalpsuperkompûterív
AT zastavnyioleh visokoproduktivnijsinhronízovanijmatričnijprocesormnožennâalpsuperkompûterív