Застосування методу DRSA – непараметричного кластерного аналізу в класифікації рослинності

Розглядаються переваги застосування методу кластерного аналізу «Distance-Ranked Sorting Assembling» (DRSA)
 для класифікації рослинності. Використання рангів при
 визначенні відстаней між об'єктами забезпечує робастність і ефективність при обробці зашумованих, різнорідних фітоце...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Український ботанічний журнал
Datum:2016
1. Verfasser: Гончаренко, І.В.
Format: Artikel
Sprache:Ukrainisch
Veröffentlicht: Інститут ботаніки ім. М.Г. Холодного НАН України 2016
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/178486
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Застосування методу DRSA – непараметричного кластерного аналізу в класифікації рослинності / І.В. Гончаренко // Український ботанічний журнал. — 2016. — Т. 73, № 6. — С. 568-578. — Бібліогр.: 27 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1862611148651626496
author Гончаренко, І.В.
author_facet Гончаренко, І.В.
citation_txt Застосування методу DRSA – непараметричного кластерного аналізу в класифікації рослинності / І.В. Гончаренко // Український ботанічний журнал. — 2016. — Т. 73, № 6. — С. 568-578. — Бібліогр.: 27 назв. — укр.
collection DSpace DC
container_title Український ботанічний журнал
description Розглядаються переваги застосування методу кластерного аналізу «Distance-Ranked Sorting Assembling» (DRSA)
 для класифікації рослинності. Використання рангів при
 визначенні відстаней між об'єктами забезпечує робастність і ефективність при обробці зашумованих, різнорідних фітоценотичних даних. Алгоритм групування
 об'єктів базується на ранжуванні об'єктів за індексами
 вільності та зв'язаності і виділенні кластерів у структурі
 k-NN графа. Нарощування кластерів припиняється по
 досягненню максимуму зв'язаності кластерів. Детально
 розглядаються підходи до оцінки якості класифікації
 фітоценотичних даних – за показниками щільності та
 відмежованості кластерів (фітоценонів), за кількістю
 диференціюючих видів. Для оцінки кореляції фітоценотичних класифікацій пропонується використовувати коефіцієнти кореляції номінальних ознак та таблиці
 спряженості альтернативних класифікацій. Оцінювати
 щільність та відмежованість фітоценонів пропонується з
 використанням внутрішніх індексів валідації кластерів,
 зокрема статистики силуетів. Запропоновано індекс CDR
 (compactness / distinctness ratio), який враховує співвідношення подібності описів за видовим складом всередині фітоценонів та між фітоценонами. Загальна кількість
 диференціюючих видів та їхня середня кількість на фітоценон використані як флористичний критерій для оцінки якості класифікації. Виділення диференціюючих видів проведено на статистичній основі з використанням
 індексів вірності видів. На модельних фітоценотичних
 наборах даних показано, що бракування перехідних описів покращує і внутрішні, і флористичні критерії якості
 класифікації. Рассматриваются преимущества использования метода кластерного анализа «Distance-Ranked Sorting
 Assembling» (DRSA) в классификации растительности.
 Использование рангов при определении расстояний
 между объектами обеспечивает робастность и эффективность при обработке зашумленых, разнородных фитоценотических данных. Алгоритм группировки объектов базируется на ранжировании объектов по индексам
 свободности-связанности и выделении кластеров в
 структуре k-NN графа. Наращивание кластеров прекращается при достижении максимума связности кластеров. Подробно рассматриваются подходы к оценке
 качества классификации фитоценотических данных – с
 использованием индексов плотности-обособленности
 кластеров (фитоценонов) и по количеству дифференцирующих видов. Для оценки корреляции фитоценотических классификаций предлагается использовать
 коэффициенты корреляции номинальных признаков и
 таблицы сопряженности альтернативных классификаций. Оценить плотность и обособленность фитоценонов
 предлагается с использованием внутренних индексов
 валидации кластеров, в частности статистики силуэтов.
 Предложен индекс CDR (compactness / distinctness ratio),
 учитывающий соотношение сходства описаний по видовому составу внутри фитоценонов и между фитоценонами. Общее количество дифференцирующих видов и
 их среднее количество на фитоценон используются как
 флористический критерий оценки качества классификации. Выделение дифференцирующих видов проведено на статистической основе с использованием индексов верности видов. На модельных фитоценотических
 наборах данных показано, что браковка переходных
 описаний улучшает и внутренние, и флористические
 критерии качества классификации. Advantages of the original clustering method of DRSA, or Distance-Ranked Sorting Assembling, for vegetation
 classification are discussed. Using ranks in determining distances between objects provides robust clustering in case
 of noisy and heterogeneous phytocoenotic data. Algorithm of objects agglomeration is based on ranking objects by
 the indices of freeness and connectedness as well as on assessing clusters within k-NN graph’s framework. Clusters
 are assembled iteratively for some time to be finalized at the maximum of cluster’s connectivity. We also consider in
 detail approaches to assess classification quality of phytocoenotic dataset including degree of cluster’s (phytocoenon)
 compactess-distinctness and amount of differential species. We propose using nominal correlation coefficients to
 evaluate concordance of phytocoenotic classifications and contingency tables to compare frequencies of common
 releves between different classifications. Phytocoenon’s compactness and distinctness are evaluated using well-known
 internal cluster validation indices, e.g. silhouette statistics. We introduced CDR-index (compactness / distinctness ratio)
 which is calculated from the score of average similarity of within-phytocoenon and between-phytocoenons releves. Total
 amount of faithful (differential) species and average amount of them per phytocoenon as floristic index of partitioning
 quality were used. We classified differential species on a statistical basis calculating specied-to-cluster fidelity index and
 selecting species with fidelity above defined fidelity’s threshold. Using the sample phytocoenotic datasets we proved that
 both internal and floristic indices of classification quality improve after the exclusion of transient releves with ecotonic
 species composition. In the DRSA method, noise detection is carried out during cluster agglomeration; this objectifies
 rejecting ecotonic releves according to Braun-Blanquet approach as well as increases amount of differential species and
 thus improves phytocoenons interpretability.
first_indexed 2025-11-29T00:30:48Z
format Article
fulltext
id nasplib_isofts_kiev_ua-123456789-178486
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 0372-4123
language Ukrainian
last_indexed 2025-11-29T00:30:48Z
publishDate 2016
publisher Інститут ботаніки ім. М.Г. Холодного НАН України
record_format dspace
spelling Гончаренко, І.В.
2021-02-19T14:56:57Z
2021-02-19T14:56:57Z
2016
Застосування методу DRSA – непараметричного кластерного аналізу в класифікації рослинності / І.В. Гончаренко // Український ботанічний журнал. — 2016. — Т. 73, № 6. — С. 568-578. — Бібліогр.: 27 назв. — укр.
0372-4123
DOI: http://dx.doi.org/10.15407/ukrbotj73.06.568
https://nasplib.isofts.kiev.ua/handle/123456789/178486
Розглядаються переваги застосування методу кластерного аналізу «Distance-Ranked Sorting Assembling» (DRSA)
 для класифікації рослинності. Використання рангів при
 визначенні відстаней між об'єктами забезпечує робастність і ефективність при обробці зашумованих, різнорідних фітоценотичних даних. Алгоритм групування
 об'єктів базується на ранжуванні об'єктів за індексами
 вільності та зв'язаності і виділенні кластерів у структурі
 k-NN графа. Нарощування кластерів припиняється по
 досягненню максимуму зв'язаності кластерів. Детально
 розглядаються підходи до оцінки якості класифікації
 фітоценотичних даних – за показниками щільності та
 відмежованості кластерів (фітоценонів), за кількістю
 диференціюючих видів. Для оцінки кореляції фітоценотичних класифікацій пропонується використовувати коефіцієнти кореляції номінальних ознак та таблиці
 спряженості альтернативних класифікацій. Оцінювати
 щільність та відмежованість фітоценонів пропонується з
 використанням внутрішніх індексів валідації кластерів,
 зокрема статистики силуетів. Запропоновано індекс CDR
 (compactness / distinctness ratio), який враховує співвідношення подібності описів за видовим складом всередині фітоценонів та між фітоценонами. Загальна кількість
 диференціюючих видів та їхня середня кількість на фітоценон використані як флористичний критерій для оцінки якості класифікації. Виділення диференціюючих видів проведено на статистичній основі з використанням
 індексів вірності видів. На модельних фітоценотичних
 наборах даних показано, що бракування перехідних описів покращує і внутрішні, і флористичні критерії якості
 класифікації.
Рассматриваются преимущества использования метода кластерного анализа «Distance-Ranked Sorting
 Assembling» (DRSA) в классификации растительности.
 Использование рангов при определении расстояний
 между объектами обеспечивает робастность и эффективность при обработке зашумленых, разнородных фитоценотических данных. Алгоритм группировки объектов базируется на ранжировании объектов по индексам
 свободности-связанности и выделении кластеров в
 структуре k-NN графа. Наращивание кластеров прекращается при достижении максимума связности кластеров. Подробно рассматриваются подходы к оценке
 качества классификации фитоценотических данных – с
 использованием индексов плотности-обособленности
 кластеров (фитоценонов) и по количеству дифференцирующих видов. Для оценки корреляции фитоценотических классификаций предлагается использовать
 коэффициенты корреляции номинальных признаков и
 таблицы сопряженности альтернативных классификаций. Оценить плотность и обособленность фитоценонов
 предлагается с использованием внутренних индексов
 валидации кластеров, в частности статистики силуэтов.
 Предложен индекс CDR (compactness / distinctness ratio),
 учитывающий соотношение сходства описаний по видовому составу внутри фитоценонов и между фитоценонами. Общее количество дифференцирующих видов и
 их среднее количество на фитоценон используются как
 флористический критерий оценки качества классификации. Выделение дифференцирующих видов проведено на статистической основе с использованием индексов верности видов. На модельных фитоценотических
 наборах данных показано, что браковка переходных
 описаний улучшает и внутренние, и флористические
 критерии качества классификации.
Advantages of the original clustering method of DRSA, or Distance-Ranked Sorting Assembling, for vegetation
 classification are discussed. Using ranks in determining distances between objects provides robust clustering in case
 of noisy and heterogeneous phytocoenotic data. Algorithm of objects agglomeration is based on ranking objects by
 the indices of freeness and connectedness as well as on assessing clusters within k-NN graph’s framework. Clusters
 are assembled iteratively for some time to be finalized at the maximum of cluster’s connectivity. We also consider in
 detail approaches to assess classification quality of phytocoenotic dataset including degree of cluster’s (phytocoenon)
 compactess-distinctness and amount of differential species. We propose using nominal correlation coefficients to
 evaluate concordance of phytocoenotic classifications and contingency tables to compare frequencies of common
 releves between different classifications. Phytocoenon’s compactness and distinctness are evaluated using well-known
 internal cluster validation indices, e.g. silhouette statistics. We introduced CDR-index (compactness / distinctness ratio)
 which is calculated from the score of average similarity of within-phytocoenon and between-phytocoenons releves. Total
 amount of faithful (differential) species and average amount of them per phytocoenon as floristic index of partitioning
 quality were used. We classified differential species on a statistical basis calculating specied-to-cluster fidelity index and
 selecting species with fidelity above defined fidelity’s threshold. Using the sample phytocoenotic datasets we proved that
 both internal and floristic indices of classification quality improve after the exclusion of transient releves with ecotonic
 species composition. In the DRSA method, noise detection is carried out during cluster agglomeration; this objectifies
 rejecting ecotonic releves according to Braun-Blanquet approach as well as increases amount of differential species and
 thus improves phytocoenons interpretability.
uk
Інститут ботаніки ім. М.Г. Холодного НАН України
Український ботанічний журнал
Геоботаніка, екологія, охорона рослинного світу
Застосування методу DRSA – непараметричного кластерного аналізу в класифікації рослинності
Применение метода DRSA – непараметрического кластерного анализа в классификации растительности
Application of the DRSA technique, a non-parametric cluster analysis, in vegetation classification
Article
published earlier
spellingShingle Застосування методу DRSA – непараметричного кластерного аналізу в класифікації рослинності
Гончаренко, І.В.
Геоботаніка, екологія, охорона рослинного світу
title Застосування методу DRSA – непараметричного кластерного аналізу в класифікації рослинності
title_alt Применение метода DRSA – непараметрического кластерного анализа в классификации растительности
Application of the DRSA technique, a non-parametric cluster analysis, in vegetation classification
title_full Застосування методу DRSA – непараметричного кластерного аналізу в класифікації рослинності
title_fullStr Застосування методу DRSA – непараметричного кластерного аналізу в класифікації рослинності
title_full_unstemmed Застосування методу DRSA – непараметричного кластерного аналізу в класифікації рослинності
title_short Застосування методу DRSA – непараметричного кластерного аналізу в класифікації рослинності
title_sort застосування методу drsa – непараметричного кластерного аналізу в класифікації рослинності
topic Геоботаніка, екологія, охорона рослинного світу
topic_facet Геоботаніка, екологія, охорона рослинного світу
url https://nasplib.isofts.kiev.ua/handle/123456789/178486
work_keys_str_mv AT gončarenkoív zastosuvannâmetodudrsaneparametričnogoklasternogoanalízuvklasifíkacííroslinností
AT gončarenkoív primeneniemetodadrsaneparametričeskogoklasternogoanalizavklassifikaciirastitelʹnosti
AT gončarenkoív applicationofthedrsatechniqueanonparametricclusteranalysisinvegetationclassification