Регрессионный анализ в условиях неоднородности факторного пространства

Исследуется применение кластерного анализа для выделения однородных подобластей факторного пространства при построении регрессионных моделей. Изложено применение нечеткого кластерного анализа. Проведение вычислительного эксперимента показало, что необходим смысловой анализ результатов и проверки раз...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Математичні машини і системи
Дата:2016
Автори: Лапач, С.Н., Радченко, С.Г.
Формат: Стаття
Мова:Russian
Опубліковано: Інститут проблем математичних машин і систем НАН України 2016
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/113674
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Регрессионный анализ в условиях неоднородности факторного пространства / С.Н. Лапач, С.Г. Радченко // Математичні машини і системи. — 2016. — № 3. — С. 55-63. — Бібліогр.: 7 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-113674
record_format dspace
spelling Лапач, С.Н.
Радченко, С.Г.
2017-02-11T18:01:24Z
2017-02-11T18:01:24Z
2016
Регрессионный анализ в условиях неоднородности факторного пространства / С.Н. Лапач, С.Г. Радченко // Математичні машини і системи. — 2016. — № 3. — С. 55-63. — Бібліогр.: 7 назв. — рос.
1028-9763
https://nasplib.isofts.kiev.ua/handle/123456789/113674
519.237.8:519.233.5
Исследуется применение кластерного анализа для выделения однородных подобластей факторного пространства при построении регрессионных моделей. Изложено применение нечеткого кластерного анализа. Проведение вычислительного эксперимента показало, что необходим смысловой анализ результатов и проверки различных вариантов разбиения на кластеры для получения правильного решения. Проанализировано моделирование болтового соединения композиционных материалов в авиастроении. Приведены диаграммы распределения экспериментов по 4-м кластерам. Даны рекомендации по формализации процесса подбора методов и средств с целью разделения на однородные подобласти факторного пространства при заранее не известных форме и количестве кластеров.
Досліджується застосування нечіткого кластерного аналізу для виділення однорідних підобластей факторного простору при побудові регресійних моделей. Викладено застосування нечіткого кластерного аналізу. Проведений обчислювальний експеримент показав, що необхідно зробити аналіз результатів по суті задачі і перевірку різних варіантів розбиття на кластері для отримання правильного розв’язку. Виконано аналіз моделювання болтового з’єднання композиційних матеріалів в авіабудуванні. Приведено діаграми розподілу експериментів по 4-х кластерах. Дано рекомендації щодо формалізації процесу підбору методів і засобів з метою розбиття на однорідні підобласті факторного простору при апріорі невідомих формі і кількості кластерів.
The application of cluster analysis for selection of homogeneous subfields of the factor space under the building of regression models is investigated. The use of fuzzy cluster analysis was outlined. The computational experiment has shown that it is necessary to make semantic analysis of the results and tests of the different options of partitioning on clusters to obtain the correct solution. Simulation analysis of bolted connection of composite materials in aircraft construction was done. The charts of distribution of experiments in 4 clusters were given. Recommendations for formalization of processes of selection of methods and tools in order to separate into homogeneous subfields of the factor space with an a priori unknown form and number of clusters.
ru
Інститут проблем математичних машин і систем НАН України
Математичні машини і системи
Моделювання і управління
Регрессионный анализ в условиях неоднородности факторного пространства
Регресійний аналіз в умовах неоднорідності факторного простору
Regression analysis under factor space inhomogenuity
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Регрессионный анализ в условиях неоднородности факторного пространства
spellingShingle Регрессионный анализ в условиях неоднородности факторного пространства
Лапач, С.Н.
Радченко, С.Г.
Моделювання і управління
title_short Регрессионный анализ в условиях неоднородности факторного пространства
title_full Регрессионный анализ в условиях неоднородности факторного пространства
title_fullStr Регрессионный анализ в условиях неоднородности факторного пространства
title_full_unstemmed Регрессионный анализ в условиях неоднородности факторного пространства
title_sort регрессионный анализ в условиях неоднородности факторного пространства
author Лапач, С.Н.
Радченко, С.Г.
author_facet Лапач, С.Н.
Радченко, С.Г.
topic Моделювання і управління
topic_facet Моделювання і управління
publishDate 2016
language Russian
container_title Математичні машини і системи
publisher Інститут проблем математичних машин і систем НАН України
format Article
title_alt Регресійний аналіз в умовах неоднорідності факторного простору
Regression analysis under factor space inhomogenuity
description Исследуется применение кластерного анализа для выделения однородных подобластей факторного пространства при построении регрессионных моделей. Изложено применение нечеткого кластерного анализа. Проведение вычислительного эксперимента показало, что необходим смысловой анализ результатов и проверки различных вариантов разбиения на кластеры для получения правильного решения. Проанализировано моделирование болтового соединения композиционных материалов в авиастроении. Приведены диаграммы распределения экспериментов по 4-м кластерам. Даны рекомендации по формализации процесса подбора методов и средств с целью разделения на однородные подобласти факторного пространства при заранее не известных форме и количестве кластеров. Досліджується застосування нечіткого кластерного аналізу для виділення однорідних підобластей факторного простору при побудові регресійних моделей. Викладено застосування нечіткого кластерного аналізу. Проведений обчислювальний експеримент показав, що необхідно зробити аналіз результатів по суті задачі і перевірку різних варіантів розбиття на кластері для отримання правильного розв’язку. Виконано аналіз моделювання болтового з’єднання композиційних матеріалів в авіабудуванні. Приведено діаграми розподілу експериментів по 4-х кластерах. Дано рекомендації щодо формалізації процесу підбору методів і засобів з метою розбиття на однорідні підобласті факторного простору при апріорі невідомих формі і кількості кластерів. The application of cluster analysis for selection of homogeneous subfields of the factor space under the building of regression models is investigated. The use of fuzzy cluster analysis was outlined. The computational experiment has shown that it is necessary to make semantic analysis of the results and tests of the different options of partitioning on clusters to obtain the correct solution. Simulation analysis of bolted connection of composite materials in aircraft construction was done. The charts of distribution of experiments in 4 clusters were given. Recommendations for formalization of processes of selection of methods and tools in order to separate into homogeneous subfields of the factor space with an a priori unknown form and number of clusters.
issn 1028-9763
url https://nasplib.isofts.kiev.ua/handle/123456789/113674
citation_txt Регрессионный анализ в условиях неоднородности факторного пространства / С.Н. Лапач, С.Г. Радченко // Математичні машини і системи. — 2016. — № 3. — С. 55-63. — Бібліогр.: 7 назв. — рос.
work_keys_str_mv AT lapačsn regressionnyianalizvusloviâhneodnorodnostifaktornogoprostranstva
AT radčenkosg regressionnyianalizvusloviâhneodnorodnostifaktornogoprostranstva
AT lapačsn regresíiniianalízvumovahneodnorídnostífaktornogoprostoru
AT radčenkosg regresíiniianalízvumovahneodnorídnostífaktornogoprostoru
AT lapačsn regressionanalysisunderfactorspaceinhomogenuity
AT radčenkosg regressionanalysisunderfactorspaceinhomogenuity
first_indexed 2025-11-26T20:19:02Z
last_indexed 2025-11-26T20:19:02Z
_version_ 1850773092162338816
fulltext © Лапач С.Н., Радченко С.Г., 2016 55 ISSN 1028-9763. Математичні машини і системи, 2016, № 3 УДК 519.237.8:519.233.5 С.Н. ЛАПАЧ * , С.Г. РАДЧЕНКО * РЕГРЕССИОННЫЙ АНАЛИЗ В УСЛОВИЯХ НЕОДНОРОДНОСТИ ФАКТОРНОГО ПРОСТРАНСТВА * Национальный технический университет Украины «Киевский политехнический институт», Киев, Украина Анотація. Досліджується застосування нечіткого кластерного аналізу для виділення однорідних підобластей факторного простору при побудові регресійних моделей. Викладено застосування не- чіткого кластерного аналізу. Проведений обчислювальний експеримент показав, що необхідно зро- бити аналіз результатів по суті задачі і перевірку різних варіантів розбиття на кластері для отримання правильного розв’язку. Виконано аналіз моделювання болтового з’єднання композицій- них матеріалів в авіабудуванні. Приведено діаграми розподілу експериментів по 4-х кластерах. Да- но рекомендації щодо формалізації процесу підбору методів і засобів з метою розбиття на одно- рідні підобласті факторного простору при апріорі невідомих формі і кількості кластерів. Ключові слова: кластерний аналіз, регресійний аналіз, нечіткий кластерний аналіз, розбиття фа- кторного простору на однорідні підобласті. Аннотация. Исследуется применение кластерного анализа для выделения однородных подобла- стей факторного пространства при построении регрессионных моделей. Изложено применение нечеткого кластерного анализа. Проведение вычислительного эксперимента показало, что необ- ходим смысловой анализ результатов и проверки различных вариантов разбиения на кластеры для получения правильного решения. Проанализировано моделирование болтового соединения компози- ционных материалов в авиастроении. Приведены диаграммы распределения экспериментов по 4-м кластерам. Даны рекомендации по формализации процесса подбора методов и средств с целью разделения на однородные подобласти факторного пространства при заранее не известных фор- ме и количестве кластеров. Ключевые слова: кластерный анализ, регрессионный анализ, нечеткий кластерный анализ, разбие- ние факторного пространства на однородные подобласти. Abstract. The application of cluster analysis for selection of homogeneous subfields of the factor space under the building of regression models is investigated. The use of fuzzy cluster analysis was outlined. The computational experiment has shown that it is necessary to make semantic analysis of the results and tests of the different options of partitioning on clusters to obtain the correct solution. Simulation analysis of bolted connection of composite materials in aircraft construction was done. The charts of distribution of experiments in 4 clusters were given. Recommendations for formalization of processes of selection of methods and tools in order to separate into homogeneous subfields of the factor space with an a priori unknown form and number of clusters. Keywords: сluster analysis, regression analysis, fuzzy cluster analysis, partitioning on the factor space into homogeneous subfields. 1. Введение Качественную и надежную регрессионную модель невозможно построить в случае, если факторное пространство неоднородно или разрывно. Необходимо определить неразрыв- ные (однородные) подобласти и построить в каждой модель отдельно. Эта проблема в настоящее время не получила разрешения [1, 2]. Использование традиционного кластерно- го анализа не приносит гарантированного успеха даже в достаточно простых случаях. Успешность его применения зависит от значений параметров, которые нужно подбирать в соответствии с формой кластеров. В общем случае уверенное определение возможно для кластеров простой вытянутой формы, расстояние между которыми больше, чем расстояние между элементами в кластере [3–5]. Для широкого практического применения это мало- пригодно, поскольку, во-первых, форма кластеров и их расположение a priori неизвестно, а 56 ISSN 1028-9763. Математичні машини і системи, 2016, № 3 во-вторых, кластеры часто имеют сложную форму и частично связаны друг с другом, а иногда и частично перекрываются. Цель статьи – исследовать возможность применения нечеткого кластерного анали- за для выделения однородных подобластей факторного пространства при построении ре- грессионных моделей. Постановка вопроса: определение однородных подобластей факторного простран- ства. 2. Нечеткий кластерный анализ При нечеткой кластеризации методом k -средних предполагается [6], что некоторые точки могут принадлежать нескольким кластерам одновременно. Принадлежность элементов выборки к определенному кластеру описывается матрицей , 0,1 , 1, , 1,ij ij i N j kU . Строка i содержит значение, соответствующее степе- ни принадлежности объекта i к кластеру j . При этом 1 1 1, 0 k N ij ij j i N , здесь N – количество объектов (в нашем случае число опытов), k – число кластеров. Кластеризация выполняется следующим образом: 1. Выбираются параметры: k , eg – экспоненциальный вес, – значение критерия остановки. 2. Случайным образом генерируется начальная матрица нечеткого разбиения на кластеры U. 3. Рассчитываются центры кластеров по формуле 1 1 ( ) , 1, ( ) N ge ij i i j N ge ij i X V j k , где jV – вектор длиной M ; iX – матрица размера N M ; M – число факторов (при разбиении на кластеры отклик входит в число факторов). 4. Рассчитываются расстояния между объектами и центрами кластеров 2 iiij VXd . 5. Пересчитываются элементы матрицы нечеткого разбиения: ji,d, ji,d, d, d d ij ij ij )g(k l li ji ij e 00 01 1 1 0 1 1 1 2 2 . 6. Проверяется условие остановки. Если *UU , то процедура заканчивается, иначе – выполняется переход в п.3. ISSN 1028-9763. Математичні машини і системи, 2016, № 3 57 Для оценки качества разбиения используют параметры рассеивания. Общее рассеи- вание N i Xi dS 1 2 , где N i iX N X 1 1 – общий центр веса, межгрупповое рассеивание (между центрами кластеров) )( 1 1 2 ji k i k j X,XdB , внутригрупповое рассеивание k i n j ij i X,XdQ 1 1 2 )( . Здесь in – количество элементов в кластере. Для нечеткого кластерного анализа в этих формулах добавляется множитель ij . Статистика T , которая показывает долю общего рассеивания, поясняемую межгрупповым рассеиванием, определяется как 1 /T Q S . Кластером считается множество точек, для которых выполняется условие / /iQ N S N , а сгущением – множество точек при выпол- нении условия 2max /id S N . Был проведен вычислительный эксперимент со специально сконструированными кластерами разной формы и с разным расстоянием друг от друга. Анализ их результатов показал, что, с одной стороны, нечеткий кластерный анализ может определять кластеры произвольной формы и с различными расстояниями друг от друга. С другой стороны, без смыслового анализа результатов и проверки различных вариантов разбиения на кластеры правильное решение невозможно. Для определения разделения на кластеры с использованием нечеткого кластерного анализа предлагается выполнять следующие действия: 1. Выдвижение гипотезы о количестве кластеров в выборке. 2. Выполнение разбиения на кластеры. 3. Анализ результатов разбиения и выдвижение уточненной гипотезы о количестве кластеров. Здесь выполняется как анализ качества разбиения с точки зрения кластерного анализа в сравнении с другими вариантами, так и смысловой анализ полученного разбие- ния на кластеры с точки зрения знаний предметной области. 4. Проверка уточненной гипотезы. 5. П.п. 2–4 могут повторяться несколько раз до получения удовлетворительных ре- зультатов. 6. Выбор наилучшего разбиения и использование его для регрессионного анализа. 3. Моделирование болтового соединения композиционных материалов В [7] подробно описана задача по моделированию болтового соединения композиционных материалов в авиастроении. Факторы факт10факт1 X...X , с которыми была построена ма- тематическая модель, приведены в табл. 1. В работе была получена регрессионная модель разрушающей удельной нагрузки от описанных выше факторов. Модель имеет отличные информационные свойства, хорошую вычислительную стойкость. К недостаткам относится формальная неадекватность модели по критерию Фишера. Кроме того, описывающие свойства можно назвать только удовле- творительными, что контрастирует с высокой информативностью. Неадекватность и недостаточно хорошие описывающие свойства предположитель- но связаны с неоднородностью факторного пространства. Разработанный алгоритм разде- ления на кластеры с помощью нечеткого кластерного анализа был апробирован в этой за- даче, как раз требующей именно такого решения, поскольку описывающие свойства моде- ли не позволяют использовать еѐ в системах автоматизированного проектирования. 58 ISSN 1028-9763. Математичні машини і системи, 2016, № 3 Таблица 1. Описание факторов Фактор Название Условное обозна- чение Обозначение уровня в матрице плана эксперимента Натуральное значение уровня факт1X Толщина пластины болтового соединения с усилением, мм c 1n = –1; 0; 1 62 11c /ndnd mm факт2X Диаметр болта номинальный, мм md 6; 8; 10; 12 6; 8; 10; 12 факт3X Величина перемычки вдоль действия силы (от центра отверстия до края пластины), мм a 2; 2,5; 3; 4 mad факт4X Величина перемычки поперек действия силы (от центра отверстия до края пластины), мм b 2; 2,5; 3; 3,5 mbd факт5X Относительная вели- чина усиления толщи- ны пластины уk 0,2; 0,4; 0,6; 1 0,2; 0,4; 0,6; 1 факт6X Угол направления волокон в усиливаю- щих слоях относи- тельно направления действия силы, град 0; 30; 60; 90 0; 30; 60; 90 факт7X Кол-во прослоек усиления 2n 0; 1; 2; 3 2)250(2 nd, m факт8X Характер посадки болта в отверстии пластины П 0; 1; 2; 3 6H9/ h ; 106H9/ ,dh m ; H9 ГОСТ131042-79 6H9/ h ВК-9 факт9X Кол-во болтов и их шаг в соединении, мм m 0; 1; 2; 3; 4; 5; 6 1; md,533 ; md43 ; md53 ; md,535 ; md45 ; md55 факт10X Разбиение плана на ортогональные блоки Б 0; 1; 2; 3; 4; 5; 6; 7 0; 1; 2; 3; 4; 5; 6; 7 Первоначально было выдвинуто предположение о разделении пространства на два кла- стера. Явное разделение на два кластера подтверждено кластерным анализом. В каждом кла- стере была получена регрессионная модель. Их характеристики приведены в табл. 2. Как видно из таблицы, полученные модели 1Ŷ и 2Ŷ имеют близкие характеристики к модели Ŷ , полученной по всей выборке, при этом их описывающие свойства значитель- но лучше. Это показывает анализ последних четырех строк табл. 2. Вместе с тем эти ха- рактеристики все еще неудовлетворительны с точки зрения требований предметной обла- сти: погрешности слишком велики для практического использования в САПР. В связи с этим проведен анализ принадлежности объектов (экспериментов) к отдельным кластерам, то есть значения элементов массива U (рис. 1). Из рисунка видно, что прослеживается предположительное разбиение выборки на 4 кластера. ISSN 1028-9763. Математичні машини і системи, 2016, № 3 59 Таблица 2. Статистические характеристики моделей для всей выборки и при разбиении на два кластера Параметры статистического анализа Условные обозначения Ŷ 1Ŷ 2Ŷ П р о в ер к а р ез у л ь та то в о п ы - то в н а о д н о р о д н о ст ь Дисперсия воспроизводимости 2 воспs 0,608812 0,927009 0,29016 Среднеквадратическое отклонение воспs 0,780264 0,962813 0,539088 Число степеней свободы для дисперсии воспроизводимости воспf 64 32 32 Экспериментальное значение G-критерия экспG 0,131403 0,172598 0,225948 Критическое значение G-критерия критG 0,165178 0,289486 0,289486 Уровень значимости α 0,05 0,05 0,05 Однородность дисперсий Однородные Однородные Однородные Число обусловленности cond(X T X) 1,91327 1,11724 2,02779 П р о в ер к а ги п о те зы о б ад ек в ат н о ст и Дисперсия адекватности 2 адs 7,45993 4,45534 1,94985 Экспериментальное значение F-критерия экспF 12,2533 4,80616 6,70929 Критическое значение F-критерия для адекватности критF 1,54931 2,31 2,31 Число степеней свободы для адекватности адf 49 11 11 Уровень значимости α 0,05 0,05 0,05 Адекватность модели Неадекватн. Неадекватн. Неадекватн. А н ал и з п о л у ч ен н о й м о д ел и н а и н ф о р м ат и в н о ст ь Коэффициент множе- ственной корреляции R 0,958281 0,980104 0,989976 Число степеней свободы для коэффициентов модели 'kf 14 11 11 Число степеней свободы для остаточной суммы квадратов Rfост 113 52 52 Экспериментальное значение F-критерия экспF 39,3405 44,3326 89,3332 Критическое значение F-критерия для информативности критF 1,78025 1,97821 1,97821 Уровень значимости α 0,05 0,05 0,05 Значение параметра для критерия Бокса и Веца 4 3 5 Информативность модели Высокая Хорошая Высокая О п и сы в аю щ и е св о й ст в а Среднее абсолютных величин погрешностей аппроксимации ue 3,0754 1,36096 0,942767 Доля рассеивания, объясняемая моделью yQ 0,918302 0,960603 0,980053 Средняя погрешность аппроксимации, % ср 22,5927 9,9847 8,27 Максимальная погреш- ность аппроксимации, % max 77,89 42,06 17,66 60 ISSN 1028-9763. Математичні машини і системи, 2016, № 3 0 0,2 0,4 0,6 0,8 1 1,2 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 Рис. 1. Степень принадлежности (по вертикали) экспериментов (по горизонтали) к разным кластерам Проверка разбиения на четыре кластера показала, что это разбиение предпочтитель- ней с точки зрения кластерного анализа (табл. 3, рис. 2). Таблица 3. Качество разбиения при разном количестве кластеров Характеристика разбиения Количество кластеров 4 2 Параметр экспоненциального веса 2 2 Kритерий остановки 0,00001 0,00001 Внутригрупповое рассеивание 3716,965 17876,97 Межгрупповое рассеивание 36212,92 7684,063 Качество разделения 0,906914 0,300324 Внутригрупповое рассеивание для случая четырех кластеров на порядок меньше межгруппового в отличие от сравнимых характеристик этих величин для разбиения на два кластера. Это позволяет отдавать предпочтение четырем кластерам [5]. 4 1 2 2 3 6 1 1 5 3 7 3 2 4 7 4 6 3 4 1 2 4 5 3 1 1 0 5 3 6 4 4 3 4 2 2 4 2 8 2 1 Кластер 1 Кластер 2 Кластер 3 Кластер 4 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Кластер 1 Кластер 2 Кластер 3 Кластер 4 Рис. 2. Диаграмма распределения экспериментов по 4-м кластерам ISSN 1028-9763. Математичні машини і системи, 2016, № 3 61 Смысловой анализ разбиения показал, что каждому кластеру соответствует свой угол ориентации волокон композита (значение фактора факт6X в табл. 1). То есть в кла- стерах собраны эксперименты, в которых значение угла ориентации волокон составляет 0 для первого кластера, 30 для второго и соответственно 60 и 90 для третьего и четверто- го. Это позволяет сделать физическую интерпретацию причин разбиения именно на такие кластеры. В каждом кластере была построена регрессионная модель. Характеристики моделей 0Ŷ , 30Ŷ , 60Ŷ , 90Ŷ приведены в табл. 4. Анализ табл. 4 показал, что описательные свойства этих моделей значительно лучше, чем модели Ŷ , построенной на всей выборке, и моделей 1Ŷ и 2Ŷ , полученных для двух кластеров (табл. 3), и они могут быть использованы на практике. Таблица 4. Статистические характеристики моделей для всей выборки и при разделении на четыре кластера Параметры статистического анализа Услов- ные обо- значения Ŷ 0Ŷ 30Ŷ 60Ŷ , 90Ŷ 1 2 3 4 5 6 7 8 П р о в ер к а р ез у л ь та то в о п ы то в н а о д - н о р о д н о ст ь Дисперсия воспроизводимости 2 воспs 0,608812 0,233894 0,347337 1,04414 0,809881 Среднеквадратическое отклонение воспs 0,780264 0,483625 0,589353 1,02183 0,899934 Число степеней свобо- ды для дисперсии воспроизводимости воспf 64 16 16 16 16 Экспериментальное значение G-критерия экспG 0,131403 0,561486 0,166408 0,267569 0,395120 Критическое значение G-критерия критG 0,165178 0,451677 0,451677 0,451677 0,451677 Уровень значимости α 0,05 0,05 0,05 0,05 0,05 Однородность дисперсий Одно- родные Неодно- родные Одно- родные Однород- ные Одно- родные Число обусловленности cond(X T X) 1,91327 1,27991 1,4872 2,20828 2,01531 П р о в ер к а ги п о те зы о б ад ек в ат н о ст и Дисперсия адекватности 2 адs 7,45993 0,387069 1,16761 1,25423 6,04992 Экспериментальное значение F-критерия экспF 12,2533 1,6549 3,3615 1,20123 7,47013 Критическое значение F-критерия для адекватности критF 1,54931 2,6572 2,6572 2,34194 2,49351 Число степеней свобо- ды для адекватности адf 49 8 8 9 5 Уровень значимости α 0,05 0,05 0,05 0,05 0,05 62 ISSN 1028-9763. Математичні машини і системи, 2016, № 3 Продолж. табл. 4 Адекватность модели Неадек- ватн. Адекватн. Неадек- ватн. Адекватн. Неадек- ватн. 1 2 3 4 5 6 7 8 А н ал и з п о л у ч ен н о й м о д ел и н а и н ф о р м ат и в н о ст ь Коэффициент множе- ственной корреляции R 0,958281 0,996182 0,995247 0,996684 0,983331 Число степеней свобо- ды для коэффициентов модели 'kf 14 8 8 9 5 Число степеней свобо- ды для остаточной суммы квадратов Rfост 113 23 23 22 26 Экспериментальное значение F-критерия экспF 39,3405 113,929 91,4166 100,021 25,7505 Критическое значение F-критерия для информативности критF 1,78025 2,37481 2,37481 2,34194 2,58679 Уровень значимости α 0,05 0,05 0,05 0,05 0,05 Значение параметра для критерия Бокса и Веца 4 5 4 4 2 Информативность модели Высокая Высокая Высокая Высокая Хорошая Среднее абсолютных величин погрешностей аппроксимации ue 3,0754 0,31089 4 0,63752 9 0,548391 1,55774 Доля рассеивания, объясняемая моделью yQ 0,91830 2 0,99238 7 0,99051 5 0,993379 0,92800 7 Средняя погрешность аппроксимации, % ср 22,5927 4,48608 4,31869 3,61086 13,659 Максимальная погрешность аппроксимации, % max 77,89 14,3384 15,0079 16,1326 49,6679 Степень улучшения по сравнению с моделью для всей выборки Ŷ показана в табл. 5. Как видно, имеют место существенные улучшения характеристик – это улучшения в разы. Таблица 5. Улучшение описывающих характеристик моделей 0Ŷ , 30Ŷ , 60Ŷ , 90Ŷ Характеристика Обозначение Улучшение (разы) Среднее абсолютных величин погрешностей аппроксимации ue 2…10 Средняя погрешность аппроксимации, % ср 1,65…6,26 Максимальная погрешность аппроксимации, % max 1,57…5,43 4. Выводы и рекомендации Проведенные исследования по использованию нечеткого кластерного анализа для выделе- ния однородных (неразрывных) подобластей факторного пространства позволили устано- вить, что его можно использовать для уверенного определения областей типа сгущений. ISSN 1028-9763. Математичні машини і системи, 2016, № 3 63 Алгоритм успешно апробирован на реальных задачах. Вместе с тем общий алгоритм не является полностью формализованным и требует выдвижения предположений о количе- стве кластеров, сравнения результатов разбиения с точки зрения кластерного анализа, ха- рактеристик полученных регрессионных моделей и смыслового анализа полученного раз- биения. Раньше было установлено [4, 5], что для кластеров, имеющих протяженные формы, успешно применяются классические алгоритмы кластерного анализа с подбором парамет- ров. Поскольку для реальных задач форма кластеров a priori неизвестна, то в настоящее время требуется экспериментирование с подбором методов и смысловым анализом. Направлением дальнейшей работы могут быть формализация и программное обеспечение процессов подбора методов или параметров кластерного анализа с целью разделения на однородные подобласти факторного пространства при заранее не известных форме и ко- личестве кластеров. СПИСОК ЛИТЕРАТУРЫ 1. Котюков В.И. Многофакторные кусочно-линейные модели / Котюков В.И. – М.: Финансы и ста- тистика, 1984. – 216 с. 2. Лапач С.Н. Основные проблемы построения регрессионных моделей / С.Н. Лапач, С.Г. Радченко // Математичні машини і системи. – 2012. – № 4. – С. 125 – 133. 3. Лапач С.Н. Статистические методы в фармакологии и маркетинге фармацевтического рынка / Лапач С.Н., Пасечник М.Ф., Чубенко А.В. – К.: ЗАТ «Укрспецмонтаж», 1999. – 312 с. 4. Лапач С.М. Кластерний аналіз при визначенні однорідних областей факторного простору в ре- гресійному аналізі / С.М. Лапач // П’ятнадцята міжнар. конф. ім. акад. Михайла Кравчука, (м. Київ, 15–17 травня 2014 р.). – Т. 3: Теорія ймовірностей та математична статистика. – К.: НТУУ «КПІ», 2014. – С. 82 – 84. 5. Лапач С.М. Визначення оптимальної кількості кластерів / С.М. Лапач // Математичні машини і системи. – 2015. – № 3. – С. 53 – 56. 6. Штовба С.Д. Проектирование нечетких систем средствами MATLAB / Штовба С.Д. – М.: Горя- чая линия – Телеком, 2007. – 288 с. 7. Математическое моделирование прочности болтовых соединений композиционных материалов типа углепластиков / С.Г. Радченко, С.Н. Лапач, А.З. Двейрин [и др.] // Открытые информационные и компьютерные интегрированные технологии: сб. научных трудов. – Харьков: «ХАИ», 2014. – Вып. 63. – С. 61 – 71. Стаття надійшла до редакції 17.03.2016