Метод "сортуючої” кластеризації (DRSA) для класифікації рослинності

Розглянуто застосування нового методу класифiкацiї фiтоценозiв “distance-ranked sorting assembling” (DRSA). Проаналiзовано аспекти стiйкостi фiтоценотичної класифiкацiї. Показана можливiсть варiювання масштабу кластеризацiї та кiлькостi фiтоценотичних кластерiв, класифiкацiї даних широкого екологiч...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Доповіді НАН України
Дата:2015
Автор: Гончаренко, І.В.
Формат: Стаття
Мова:Українська
Опубліковано: Видавничий дім "Академперіодика" НАН України 2015
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/97589
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Метод "сортуючої” кластеризації (DRSA) для класифікації рослинності / І.В. Гончаренко // Доповіді Національної академії наук України. — 2015. — № 9. — С. 129-136. — Бібліогр.: 10 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859899162907115520
author Гончаренко, І.В.
author_facet Гончаренко, І.В.
citation_txt Метод "сортуючої” кластеризації (DRSA) для класифікації рослинності / І.В. Гончаренко // Доповіді Національної академії наук України. — 2015. — № 9. — С. 129-136. — Бібліогр.: 10 назв. — укр.
collection DSpace DC
container_title Доповіді НАН України
description Розглянуто застосування нового методу класифiкацiї фiтоценозiв “distance-ranked sorting assembling” (DRSA). Проаналiзовано аспекти стiйкостi фiтоценотичної класифiкацiї. Показана можливiсть варiювання масштабу кластеризацiї та кiлькостi фiтоценотичних кластерiв, класифiкацiї даних широкого екологiчного дiапазону та об’єктивiзацiї визначення екотонних угруповань. Якiсть геоботанiчної класифiкацiї запропоновано оцiнювати кiлькiстю статистично вiрних видiв. Рассмотрено применение нового метода классификации фитоценозов “distance-ranked sorting assembling” (DRSA). Проанализированы аспекты устойчивости фитоценотической классификации. Показана возможность варьировать масштаб кластеризации и количество фитоценотических кластеров, классифицировать данные широкого экологического диапазона и объективизировать определение экотонных сообществ. Качество геоботанической классификации предложено оценивать количеством статистически верных видов. The application of a new clustering technique, named “distance-ranked sorting assembling” (DRSA), for the classification of plant communities is considered. Aspects of the stability of a phytocoenotic classification are analyzed. It is shown that a researcher can vary the scale of clustering and thus change the number of phytocoenons, classify reasonably the data of a wide environmental amplitude, and determine objectively ecotonic releves among the data. We suggest to use the quantity of faithful species per phytocoenon for qualifying clusters in the field of geobotany.
first_indexed 2025-12-07T15:55:29Z
format Article
fulltext УДК 581.524+57.087.1 I. В. Гончаренко Метод “сортуючої” кластеризацiї (DRSA) для класифiкацiї рослинностi (Представлено членом-кореспондентом НАН України Я.П. Дiдухом) Розглянуто застосування нового методу класифiкацiї фiтоценозiв “distance-ranked sorti- ng assembling” (DRSA). Проаналiзовано аспекти стiйкостi фiтоценотичної класифiка- цiї. Показана можливiсть варiювання масштабу кластеризацiї та кiлькостi фiтоцено- тичних кластерiв, класифiкацiї даних широкого екологiчного дiапазону та об’єктивiза- цiї визначення екотонних угруповань. Якiсть геоботанiчної класифiкацiї запропоновано оцiнювати кiлькiстю статистично вiрних видiв. Ключовi слова: кластерний аналiз, DRSA, класифiкацiя рослинностi, фiтоценологiя. Класифiкацiя рослинностi — фундаментальна задача фiтоценологiї — нерозривно пов’яза- на iз сучасними проблемами збереження бiорiзноманiття на ценотичному рiвнi фiтосистем. Для пiзнання (розвiдки) структури (data miming) багатоознакових систем у бiологiї, ме- дицинi, соцiологiї тощо з метою класифiкацiї об’єктiв використовують кластерний аналiз або автоматичну класифiкацiю. Однак застосування класичних методiв кластерного ана- лiзу в фiтоценологiї не набуло популярностi. Геоботанiки або винаходять власнi методи, накшталт методики Браун–Бланке, або використовують автоматичну класифiкацiю лише для первинного сортування таблиць, тобто для отримання “стартової конфiгурацiї”, пiсля чого “доводять” її ручним сортуванням. Одним iз “золотих стандартiв” автоматичних методiв класифiкацiї у фiтоценологiї є ал- горитм Twinspan, який iмплементований у вiдомiй чеськiй програмi Juice [1]. Дiйсно, у бiль- шостi випадкiв вiн дає непоганий результат. Але Twinspan ефективний лише за домiнування одного (провiдного) екологiчного фактора [2]. Коли ж градiєнт комплексний, а простiше ка- жучи — широкий, коли фактори, що визначають варiювання видового складу, змiнюються в рiзних частинах градiєнта (типах рослинностi), ефективнiсть його зменшується. Ситуацiя покращується, якщо градiєнт подiлити на вiдрiзки (звузити), i в кожному з них провести ординацiю окремо (DCA, аналiз вiдповiдностей з видаленим трендом). Але i алгоритм Twi- nspan, i iншi методи ординацiї при багатьох видах з низьким траплянням дають результат, який потребує ручного сортування, а це знову повертає нас до проблеми “мистецтва кла- сифiкацiї” та “некерованого чинника”. Iснують двi основнi проблеми, що перешкоджають впровадженню класичних i перевiре- них часом алгоритмiв кластерного аналiзу щодо фiтоценотичних даних — їх зашумленiсть та неоднорiднiсть. Шум у фiтоценотичних даних зумовлений випадковими або заносними видами. При цьому деякi типовi види в фiтоценозi, навпаки, можуть бути вiдсутнi, що не свiдчить про непридатнiсть для них умов iснування (так звана неповночленнiсть фiтоце- нозiв). Помилки при iдентифiкацiї видiв, пiдбiр описiв та визначення їх меж на розсуд, окомiрнiсть фiтоценометричних показникiв (покриття, зiмкнутостi тощо) також зумовлю- ють шум. © I. В. Гончаренко, 2015 ISSN 1025-6415 Доповiдi Нацiональної академiї наук України, 2015, №9 129 Неоднорiднiсть даних у фiтоценотичнiй таблицi зумовлена тим, що геоботанiчнi описи вiдрiзняються не лише за екологiчними, а й iншими (фенологiчними, сукцесiйними тощо) характеристиками. Наприклад, описи, що здiйсненi в рiзнi мiсяцi вегетацiйного сезону, вико- нанi в одному локалiтетi, але через значний час (понад 10 рокiв); отриманi з пробних площ рiзного розмiру, матимуть вiдмiнностi у видовому складi, що лише частково вiдображають екологiчну диференцiацiю та затушованi iншими факторами. У такому випадку застосування потужних та складних методiв математичної стати- стики не вiдкриє нам новi залежностi чи особливостi структури фiтоценотичних даних, оскiльки вплив на результат якостi вихiдних даних є iстотнiшим за вибiр того або iншого методу. Першочерговою задачею сучасної геоботанiчної науки є розробка “стiйких” методiв автоматичної класифiкацiї фiтоценотичних даних. У цьому повiдомленнi представленi результати апробацiї методу “сортуючої кластери- зацiї, заснованої на рангах вiдстаней” (DRSA, distance-ranked sorting assembling) [3], який розроблявся для класифiкацiї фiтоценозiв з урахуванням зазначених “складних особливо- стей” фiтоценотичних даних (багатовимiрнiсть, зашумленiсть, неоднорiднiсть тощо). Але оскiльки DRSA працює з матрицею вiдстаней, отриманою для будь-яких об’єктiв у вiд- повiдному просторi ознак, то галузь використання методу не обмежується геоботанiкою: вiн може бути застосований у соцiологiї, медицинi, психологiї, i, в першу чергу, там, де дослiджують багатоознаковi стохастичнi системи. Сутнiсть даного методу полягає в тому, що пiсля отримання матрицi вiдстаней (можуть бути застосованi будь-якi метрики або мiри подiбностi) з неї видiляється “активна частина” (i лише остання враховується при групуваннi об’єктiв). При цьому для кожного об’єкта визначається перелiк найближчих сусiдiв (“глибина сканування” задається через параметр mnp (minimum neighboring points)). Можна уявити, що кожен об’єкт “зв’язаний” зi своїми сусiдами, це граф. Важливо, що кiлькiсть сусiдiв однакова у кожного об’єкта, є рiвною обраному mnp i не залежить вiд локальної щiльностi об’єктiв. Далi здiйснюється власне групування. DRSA можна охарактеризувати як iтеративний (неiєрархiчний) метод кластеризацiї з використанням матрицi сумiжностi об’єктiв та почерговим утворенням i нарощуванням кластерiв до досягнення максимуму зв’язностi кореляцiйних плеяд. 1. Цикл утворення нових кластерiв, доки є об’єкти з FI > 0: а) iнiцiювати N+ 1 кластер одним об’єктом з максимальним значенням FI ; б) iнакше — вихiд, некласифiкованi об’єкти помiтити як “шум”. 2. Цикл приєднання об’єктiв до останнього кластеру, доки є об’єкти з CI > 0: а) приєднати m + 1 об’єкт з максимальним значенням CI, далi — п. 3; б) iнакше — перевiрити кластер на досягнення порогового розмiру, далi — п. 1. 3. Перевiрка “якостi” кластеру (пошук оптимальної конфiгурацiї кластеру для зупинки нарощування): а) якщо Q-index кластеру збiльшився пiсля приєднання об’єкта, то запам’ятати нове досягнуте значення Q-index, перерахувати CI усiх об’єктiв, далi — п. 2; б) iнакше — перевiрити кластер на досягнення порогового розмiру, далi — п. 1. ТутN — кiлькiсть кластерiв на даному етапi групування;m— кiлькiсть об’єктiв у складi останнього кластеру; FI (freeness index) — iндекс вiльностi об’єкта, вiн визначається кiль- кiстю серед найближчих сусiдiв вiльних (некласифiкованих) об’єктiв, досягає максимуму у об’єктiв усерединi скупчень, мiнiмуму — поблизу утворених кластерiв; CI (connectedness index) — iндекс зв’язностi об’єкта, визначається кiлькiстю серед найближчих сусiдiв об’єк- 130 ISSN 1025-6415 Доповiдi Нацiональної академiї наук України, 2015, №9 Рис. 1. Кластери DRSA штучних даних (70 точок) при mnp = 5 (суцiльнi лiнiї) i mnp = 12 (пунктирнi лiнiї) тiв “свого” кластеру; максимальний у найближчих до кластеру об’єктiв, зменшується далi вiд нього. Показники FI й CI перераховуються пiсля приєднання об’єктiв i описують їх положення в кластернiй конфiгурацiї, що змiнюється в ходi групування; вони залежать вiд обраного mnp i визначають “сортуючий добiр” об’єктiв: FI — для вибору об’єкта, що стане “центром” нового кластеру (плеяди), CI — для вибору наступного об’єкта для при- єднання до “зростаючого” (останнього) кластеру. Q-index (quality index) — iндекс “якостi” кластеру, визначається кiлькiстю зв’язкiв (ребер) мiж об’єктами кластеру та його розмi- ром у даний момент. Це показник зв’язностi кореляцiйної плеяди (кластеру). Максимiзацiя значень Q-index визначає момент припинення нарощування останнього кластеру та перехiд до утворення нового. З iншого боку, це дозволяє видiляти щiльнi кластери. Як буде пока- зано далi, за цим показником DRSA близький до популярного в бiологiчних дослiдженнях методу Варда. Результат кластеризацiї методом DRSA штучних даних “географiчної моделi” з 70 ви- падкових точок демонструє рис. 1. Для кластеризацiї було використано матрицю евклiдових вiдстаней мiж точками в декартових координатах (X;Y ). Як видно з рисунку, ми отримали непересiчнi кластери. Оскiльки DRSA належить до методiв неiєрархiчної кластеризацiї (flat clustering), то звичної дендрограми тут немає. Осо- бливiстю DRSA є вiдсутнiсть необхiдностi вказувати кiлькiсть кластерiв до початку групу- вання (як у методi К-середнiх). Це важливо, адже геоботанiку апрiорi не вiдома кiлькiсть фiтоценонiв, i тому вгадати їх кiлькiсть заздалегiдь було б важко. Оптимальна кiлькiсть кластерiв визначається у DRSA “автоматично” та пiсля групування. Вона кiлькiсть зале- жить вiд обраного параметра mnp. Бажаний масштаб кластеризацiї можна пiдiбрати ем- пiрично, варiюючи mnp. З рисунку також видно, що збiльшення mnp дає меншу кiлькiсть кластерiв, проте бiльшого розмiру. Можна робити зрiзи при рiзних mnp, отримуючи шари i реалiзуючи вiдсутню в методi DRSA iєрархiю. Для апробацiї на фактичних даних брали масив геоботанiчних описiв (N_obj = 722), виконаних автором у пiвнiчно-схiднiй частинi Лiвобережного Лiсостепу України (Сум- ська область). Данi мають широкий еколого-фiтоценотичний дiапазон (ЕФД) i охоплю- ють 8 класiв Браун–Бланке. Розподiл кiлькостi описiв такий: Alnetea glutinosae (2,2%), Festuco–Brometea (26,7%), Koelerio–Corynephoretea (1,5%), Molinio–Arrhenatheretea (20,3%), Phragmiti–Magnocaricetea (8,6 %), Querco–Fagetea (27,7%), Scheuchzerio–Caricetea (1,0%), Vaccinio–Piceetea (12,1%). Ранiше цi описи були класифiкованi традицiйним методом Браун– Бланке [4]. При апробацiї DRSA масив описiв оброблявся без подiлу за типами рослинностi ISSN 1025-6415 Доповiдi Нацiональної академiї наук України, 2015, №9 131 Рис. 2. Диференцiацiя фiтоценонiв (кластерiв DRSA) у ординацiйнiй площинi багатовимiрного шкалювання з метою дослiдження ефективностi методу при широкому ЕФД, коли iншi методи ордина- цiї (взаємного усереднення (reciprocal averaging) тощо) мають обмеження через так званий arch (horseshoe) effect. Належнiсть фiтоценозiв до ранiше видiлених асоцiацiй використа- ли як критерiй для оцiнки вiдповiдностi автоматичної та експертної класифiкацiї (DRSA i Браун–Бланке). Оцiнити якiсть кластеризацiї можна в ординацiйнiй площинi. Було проведено ординацiю методом багатовимiрного шкалювання [5]. Оскiльки в обох методах використано однакову матрицю вiдстаней, це є перевiркою нового (DRSA) методу верифiкованим (MDS). Класте- ризацiя якiсна, якщо кластери не накладаються (рис. 2). Крiм того, що кластери не перетинаються, вiдзначимо, що DRSA не дає 100% класифi- кацiї всiх об’єктiв, частина фiтоценозiв (позначенi “+”) не увiйшла до кластерiв. Фактично це — перехiднi описи (з екотонним видовим складом). Те що фiтоценози, визначенi як пе- рехiднi, знаходяться мiж кластерами в ординацiйнiй площинi i рiдко опиняються всерединi кластерiв, доводить правильнiсть дiагностики екотонних угруповань. Пiд час класифiкацiї фiтоценозiв геоботанiк теж здiйснює бракування перехiдних описiв, вирiзаючи екотони, але робить це на свiй розсуд. У DRSA цей процес “автоматизовано”, вiн спирається на iнформа- цiю з матрицi вiдстаней, тому бракування об’єктивiзується. Крiм того, в такий спосiб пiд- вищується iзольованiсть кластерiв, що важливо з огляду на континуальнiсть рослинностi. Для кожного з фiтоценозiв, показаних на рис. 2, нам вiдома еталонна класифiкацiя, що отримана методом Браун–Бланке [4]. Отже, можна зiставити склад “автоматичних” i “тра- дицiйних” (класи Браун–Бланке) кластерiв. Загальну мiру кореляцiї двох класифiкацiй оцi- нимо статистикою Крамера (Cramer’s V). Отримано: Cramer’s V = 0,81, тобто кореляцiя значна, проте повної вiдповiдностi кластерiв DRSA класам Браун–Бланке немає. Части- на кластерiв об’єднала фiтоценози з двох, а iнодi з трьох близьких класiв: лучно-степовi Molinio-Arrhenatheretea + Festuco-Brometea, лiсовi Querco-Fagetea+ Vaccinio-Piceetea, боло- тно-лучнi Phragmiti-Magnocaricetea + Molinio-Arrhenatheretea тощо (хоча кластер пiщаних угруповань Koelerio-Corynephoretea залишився цiлком самостiйним). Це пояснюється тим, що в екотоннiй природно-клiматичнiй зонi (Лiсостепу) перехiднi (щодо оптимумiв перерахо- ваних класiв) фiтоценози зустрiчаються не менш часто, нiж типовi. Тому асоцiацiї з таких перехiдних угруповань у Лiсостепу цiлком прийнятнi: їх не можна бракувати, наприклад, щоб узгодити свою класифiкацiйну схему з iснуючими схемами для класiв з оптимумом у iншiй природно-клiматичнiй зонi. 132 ISSN 1025-6415 Доповiдi Нацiональної академiї наук України, 2015, №9 Одночасно було застосовано до згаданого модельного набору даних з 722 описiв метод DRSA та iншi алгоритми групування (метод Варда (Ward’s method), повного та одиничного зв’язку, зваженого середнього (WPGMA), К-середнiх), та розраховано кореляцiю отрима- них класифiкацiй рiзними методами. Результат DRSA виявився найбiльш схожим з методом Варда (Cramer’s V = 0,86), який, як вiдомо, дає щiльнi кластери i тому часто застосо- вується для бiологiчних об’єктiв. Найменша схожiсть була з методом одиничного зв’язку (Cramer’s V = 0,34). Останнiй використовують рiдко через недолiк, вiдомий як “chaining phenomenon”. Iснує математичний апарат оцiнки якостi кластерного рiшення [6]. Вiдомими показника- ми є статистика силуетiв (avg. silh), iндекс Калiнського–Харабаша (Calinski-Harabasz index, ch) та iн. Отриманi значення “внутрiшнiх критерiїв” валiдацiї кластерiв були близькими в методах DRSA, Варда та повного зв’язку, що свiдчить на користь компактностi клас- терiв. У кластерному аналiзi важливо те, якою мiрою кластери пiддаються iнтерпретацiї. Так, для геоботанiка бажаним є результат, де на кожен кластер (фiтоценон) припадає значна кiлькiсть вiрних (диференцiюючих) видiв, i при цьому класифiкацiя має максимально мо- жливий рiвень детальностi. При подальшому подiлi кластерiв межi мiж фiтоценонами ста- ють нечiткими, i загальна кiлькiсть диференцiюючих видiв зменшується. Таким чином, чим бiльшу кiлькiсть вiрних видiв має кожен видiлений фiтоценон (або чим бiльше фiтоценонiв (кластерiв) мають кiлькiсть вiрний видiв бiльшу за встановлений порiг), тим якiснiшою є класифiкацiя фiтоценозiв. Таким чином можна порiвнювати якiсть експертних класифi- кацiй та ефективнiсть застосування рiзних автоматичних методiв класифiкацiї для одного набору даних. Спираючись на концепцiю вiрностi видiв на статистичнiй основi (fidelity index ), чому присвячено чимало робiт європейських фiтоценологiв [7–9], ми порiвняли класифiкацiї на- шого модельного набору даних методами DRSA, Ward’s, К-means, Браун–Бланке. Для кож- ного iз зазначених методiв при порозi fidelity index > 0,5 було отримано такi значення кiль- костi вiрних видiв у середньому на фiтоценон: 4,1, 4,0, 3,8, 3,5 вiдповiдно. Таким чином, метод DRSA показав найкращий (на одному наборi даних порiвняно з iншими методами) результат щодо “змiстовних” з точки зору геоботанiка фiтоценотичних кластерiв. Це дово- дить, що делiмiтацiя кластерiв методом DRSA була екологiчною: фiтоценони мають числен- нi диференцiюючi види, що можливо лише за умови, якщо їх межi було проведено там, де закiнчуються амплiтуди не одного, а групи видiв, та починаються амплiтуди iнших видiв. Кiлька слiв слiд сказати про оцiнку вiдстаней мiж об’єктами у DRSA: враховуються не абсолютнi значення, а ранги, тобто лише порядок розташування об’єктiв один вiдносно iн- шого. Для класифiкацiї зашумованих фiтоценотичних даних це важливо. I хоча це зменшує потужнiсть запропонованого методу, проте забезпечує його робастнiсть. По-перше, внаслiдок цього зменшується вплив випадкових видiв на результат класифi- кацiї i ординацiї. Через їх “домiшку” у складi будь-якого фiтоценозу значення коефiцiєнтiв у матрицi вiдстаней не точно вiдображають екологiчну диференцiацiю i мають “нееколо- гiчну похибку”. В методах, якi спираються на абсолютнi значення з матрицi вiдстаней, вона неодмiнно вплине на результат — склад i кiлькiсть кластерiв. Це небажано. Навпаки, у DRSA, що є непараметричним варiантом кластерного аналiзу, кластери змiняться менше, а шуми вiд випадкових видiв буде згладжено. По-друге, зменшується вплив на результат класифiкацiї фiтоценозiв вибору iншого спосо- бу обчислення вiдстаней (iншого коефiцiєнта подiбностi). В DRSA еквiвалентнi коефiцiєнти ISSN 1025-6415 Доповiдi Нацiональної академiї наук України, 2015, №9 133 подiбностi призводять до iдентичних класифiкацiй. Еквiвалентними у фiтоценологiї нази- вають коефiцiєнти, якi дають однаковi ряди фiтоценозiв, впорядкованих за схожiстю [10]. При цьому абсолютнi значення коефiцiєнтiв та формули їх обчислення вiдрiзняються, але порядок розташування фiтоценозiв (ранги) один вiдносно iншого залишається сталим. Так, замiна коефiцiєнта Жаккара коефiцiєнтом Сьоренсена при класифiкацiї фiтоценозiв, орди- нацiї, побудовi плеяд тощо не додасть нiчого нового, оскiльки цi коефiцiєнти еквiвалентнi: Kj = Ks/(2−Ks). Проте використання матриць цих коефiцiєнтiв (та отриманих з них вiд- станей D = 1−K) у кластерному аналiзi дає близькi, але рiзнi результати. На нашу думку, це — артефакт: хiба можуть бути рiзними класифiкацiї фiтоценозiв одного набору даних, якщо використовуються еквiвалентнi коефiцiєнти?! Ми брали матрицi, розрахованi за коефiцiєнтами Жаккара та Сьоренсена для згада- ного модельного набору даних, i використали їх при класифiкацiї: спочатку за методом DRSA, що спирається на ранжованi вiдстанi, потiм за методом Варда, що базується на абсолютних значеннях вiдстаней. У методi Варда отримано Cramer’s V = 0,84, тобто коре- ляцiя класифiкацiй з використанням еквiвалентних коефiцiєнтiв була високою, але резуль- тат вiдрiзнявся! У DRSA у тiй самiй ситуацiї отримано iдентичнi класифiкацiї (Cramer’s V = 1,0), що природнiше. Далi ми брали iншу пару коефiцiєнтiв подiбностi — Браун–Бланке та Шимкевича–Сiмпсона. Як вiдомо [10], це крайнi по ряду ступеневих середнiх коефiцiєн- ти. Наскiльки змiниться результат класифiкацiї фiтоценозiв, якщо замiнити один коефiцiєнт iншим — адже вихiднi данi тi самi?! DRSA виявився бiльш стiйким: для модельного набо- ру даних з використанням коефiцiєнтiв Браун–Бланке та Шимкевича–Сiмпсона в DRSA Cramer’s V = 0,76, а у методi Варда — Cramer’s V = 0,66. Оперування рангами (порядком об’єктiв) у DRSA має ще одну перевагу для геоботанiка. У рiзних типах рослинностi, наприклад болотнiй та степовiй, середня схожiсть фiтоцено- зiв (бета-рiзноманiтнiсть) iстотно вiдрiзняється. Там, де умови жорсткiшi, видове багат- ство (альфа-рiзноманiтнiсть) менше, бо менше видiв може пристосуватися до таких умов. Але екологiчнi амплiтуди видiв зазвичай ширшi, i бета-рiзноманiтнiсть (швидкiсть змiни видового складу) зменшується. Якщо поєднати болотнi, степовi тощо фiтоценози в однiй таблицi, то подiл в однiй частинi градiєнта буде задовiльним, в iншiй — нi. Замiна абсо- лютних значень вiдстаней на ранги (порядок об’єктiв) дозволяє проводити класифiкацiю фiтоценозiв у DRSA “з нормуванням” щодо середньої щiльностi синтаксонiв у кожному вiд- рiзку градiєнта: кластери DRSA — це нiби проекцiя дендрограми, зрiзана на рiзних рiвнях у рiзних гiлках. Тому DRSA залишається ефективним при широкому ЕФД вибiрки, тодi як iншi методи класифiкацiї та ординацiї потребують роздiлення даних хоча б на рiвнi класiв Браун–Бланке та їх окремої обробки. Важливий аспект кластерного аналiзу — стiйкiсть класифiкацiї. Її можна оцiнити, змi- нюючи метод групування об’єктiв: кластери, що будуть стiйкими i збережуться, природнiшi. На жаль, геоботанiкам добре вiдома ситуацiя, коли дiагностичнi блоки видiв “розсипаю- ться” через додавання нових описiв. Це пов’язане з проблемою неповноти фiтоценотичних даних. Щоб довести, що запропонований метод доволi стiйкий i в цьому аспектi, проведемо обчислювальний експеримент на основi технiки ресамплiнгу. Будемо розглядати ситуацiю, коли геоботанiчнi описи до таблицi не додаються, а вiднiмаються, причому вибираються вони випадково. Генерацiя усiчених вибiрок у такий спосiб схожа з пiдходом, вiдомим як “метод складного ножа” (jackknifing), iдею якого запропонував у 1949 р. М. Кенуй. На- ша гiпотеза полягає в тому, що метод, за яким кореляцiя класифiкацiй “усiчених” вибiрок 134 ISSN 1025-6415 Доповiдi Нацiональної академiї наук України, 2015, №9 фiтоценозiв та “повного” набору буде бiльшою, є стiйкiшим не лише до вилучення описiв з таблицi, а й до їх додавання. З модельного набору даних ми видаляли по 10% випадко- вих фiтоценозiв, отримавши таким чином усiченi вибiрки з N_obj 652, 582, 512, 442 тощо вiдповiдно. Потiм провели класифiкацiї усiчених вибiрок паралельно DRSA та за методом Варда. У випадку з DRSA вiдповiднiсть класифiкацiй цих вибiрок з вихiдним набором (N_obj = 722) коливалася у межах Cramer’s V 0,92–0,97 (для методу Варда в аналогiчнiй ситуацiї Cramer’s V був 0,77–0,84). Отже, вилучення даних меншою мiрою впливало на результат у методi DRSA. Таким чином, вказанi вище особливостi DRSA, як вiдносна стiйкiсть, визначення опти- мальної кiлькостi фiтоценотичних кластерiв при обраному mnp, можливiсть обробляти данi широкого ЕФД, дiагностика перехiдних угруповань, що базується на iнформацiї з матрицi вiдстаней, “щiльнi” фiтоценони зi значною кiлькiстю диференцiюючих видiв тощо свiдчать про перспективнiсть методу для класифiкацiї рослинностi. Цитована лiтература 1. Tichý L. JUICE, software for vegetation classification // J. Veg. Sci. – 2002. – 13. – P. 451–453. 2. Belbin L., McDonald C. Comparing three classification strategies for use in ecology // J. Veg. Sci. – 1993. – 4. – P. 341–348. 3. Гончаренко I. В.Свiдоцтво про реєстрацiю авторського права на твiр “Збiрка наукових творiв “DRSA (distance-ranked sorting assembling) – метод сортуючого кластерного аналiзу” № 58837. – вiд 26.02.2015. – Заяв. № 59398. – I. В. Гончаренко, 31.12.2014. – Бюл. № 36. 4. Гончаренко I. В. Аналiз рослинного покриву пiвнiчно-схiдного Лiсостепу України // Укр. фiтоцен. зб. Сер. А. – 2003. – 1(19). – 203 с. 5. Oksanen J., Blanchet F.G., Kindt R., Legendre P., O’Hara R.G., Simpson G. L., Solymos P., Ste- vens M.H.H., Wagner H. Vegan: Community Ecology Package. – 2010. – URL: http://cran.r-project.org/ web/packages/vegan/. 6. Halkidi M., Batistakis Y., Vazirgiannis M. On Clustering Validation Techniques // J. Intell., Inform. Systems. – 2001. – 17. – P. 107–145. 7. Bruelheide H. A new measure of fidelity and its application to defining species groups // J. Veg. Sci. – 2000. – 11. – P. 167–178. 8. Chytrý M., Tichý L., Holt J., Botta-Dukát Z. Determination of diagnostic species with statistical fidelity measures // J. Veg. Sci. – 2002. – 13. – P. 79–90. 9. De Cáceres M., Font X., Oliva F. Assessing diagnostic species value in large data sets: A comparison between phi-coefficient and Ochiai index // J. Veg. Sci. – 2008. – 19. – P. 779–788. 10. Семкин Б.И. Эквивалентность мер близости и иерархическая классификация многомерных дан- ных // Иерархические классификационные построения в географической экологии и систематике. – Владивосток: ДВНЦ АН СССР, 1979. – С. 97–112. References 1. Tichý L. J. of Veg. Sci., 2002, 13: 451–453. 2. Belbin L., McDonald C. J. of Veg. Sci., 1993, 4: 341–348. 3. Goncharenko I. V. Certificate on the Registration of the Copyright for Scientific Work “Collection of sci- entific works “DRSA (distance-ranked sorting assembling) — a method of sorting clustering” No 58837, 26.02.2015 / № 59398, Goncharenko I.V., 31.12.2014, Bull. No 36 (in Ukrainian). 4. Goncharenko I. V. Analysis of vegetation of the northeastern part of Forest-Steppe of Ukraine, Ukr. Phytosoc. Coll. Ser. А, 2003, 1(19): 203 (in Ukrainian). 5. Oksanen J., Blanchet F.G., Kindt R., Legendre P., O’Hara R.G., Simpson G. L., Solymos P., Ste- vens M.H.H., Wagner H. Vegan: Community Ecology Package, 2010, URL: http://cran.r-project.org/web /packages/vegan/. 6. Halkidi M., Batistakis Y., Vazirgiannis M. J. Intel. Inform. Systems, 2001, 17: 107–145. ISSN 1025-6415 Доповiдi Нацiональної академiї наук України, 2015, №9 135 7. Bruelheide H. J. Veg. Sci., 2000, 11: 167–178. 8. Chytrý M., Tichý L., Holt J., Botta-Dukát Z. J. Veg. Sci., 2002, 13: 79–90. 9. De Cáceres M., Font X., Oliva F. J. Veg. Sci., 2008, 19: 779–788. 10. Semkin B. I. Ierarhicheskie klassifikatsionnyie postroeniya v geograficheskoy ekologii i sistematike, Vladi- vostok, DVNC AN SSSR 1979: P. 97–112 (in Russian). Надiйшло до редакцiї 15.05.2015Iнститут еволюцiйної екологiї НАН України, Київ И.В. Гончаренко Метод “сортирующей” кластеризации (DRSA) для классификации растительности Институт эволюционной экологии НАН Украины, Киев Рассмотрено применение нового метода классификации фитоценозов “distance-ranked sorting assembling” (DRSA). Проанализированы аспекты устойчивости фитоценотической класси- фикации. Показана возможность варьировать масштаб кластеризации и количество фи- тоценотических кластеров, классифицировать данные широкого экологического диапазона и объективизировать определение экотонных сообществ. Качество геоботанической клас- сификации предложено оценивать количеством статистически верных видов. Ключевые слова: кластерный анализ, DRSA, классификация растительности, фитоцено- логия. I. V. Goncharenko A method of “sorting” clustering (DRSA) for the classification of plant communities Institute for Evolutionary Ecology of the NAS of Ukraine, Kiev The application of a new clustering technique, named “distance-ranked sorting assembling” (DRSA), for the classification of plant communities is considered. Aspects of the stability of a phytocoenotic classification are analyzed. It is shown that a researcher can vary the scale of clustering and thus change the number of phytocoenons, classify reasonably the data of a wide environmental amplitude, and determine objectively ecotonic releves among the data. We suggest to use the quantity of faithful species per phytocoenon for qualifying clusters in the field of geobotany. Keywords: cluster analysis, DRSA, vegetation classification, phytocoenology. 136 ISSN 1025-6415 Доповiдi Нацiональної академiї наук України, 2015, №9
id nasplib_isofts_kiev_ua-123456789-97589
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1025-6415
language Ukrainian
last_indexed 2025-12-07T15:55:29Z
publishDate 2015
publisher Видавничий дім "Академперіодика" НАН України
record_format dspace
spelling Гончаренко, І.В.
2016-03-30T16:25:01Z
2016-03-30T16:25:01Z
2015
Метод "сортуючої” кластеризації (DRSA) для класифікації рослинності / І.В. Гончаренко // Доповіді Національної академії наук України. — 2015. — № 9. — С. 129-136. — Бібліогр.: 10 назв. — укр.
1025-6415
https://nasplib.isofts.kiev.ua/handle/123456789/97589
581.524+57.087.1
Розглянуто застосування нового методу класифiкацiї фiтоценозiв “distance-ranked sorting assembling” (DRSA). Проаналiзовано аспекти стiйкостi фiтоценотичної класифiкацiї. Показана можливiсть варiювання масштабу кластеризацiї та кiлькостi фiтоценотичних кластерiв, класифiкацiї даних широкого екологiчного дiапазону та об’єктивiзацiї визначення екотонних угруповань. Якiсть геоботанiчної класифiкацiї запропоновано оцiнювати кiлькiстю статистично вiрних видiв.
Рассмотрено применение нового метода классификации фитоценозов “distance-ranked sorting assembling” (DRSA). Проанализированы аспекты устойчивости фитоценотической классификации. Показана возможность варьировать масштаб кластеризации и количество фитоценотических кластеров, классифицировать данные широкого экологического диапазона и объективизировать определение экотонных сообществ. Качество геоботанической классификации предложено оценивать количеством статистически верных видов.
The application of a new clustering technique, named “distance-ranked sorting assembling” (DRSA), for the classification of plant communities is considered. Aspects of the stability of a phytocoenotic classification are analyzed. It is shown that a researcher can vary the scale of clustering and thus change the number of phytocoenons, classify reasonably the data of a wide environmental amplitude, and determine objectively ecotonic releves among the data. We suggest to use the quantity of faithful species per phytocoenon for qualifying clusters in the field of geobotany.
uk
Видавничий дім "Академперіодика" НАН України
Доповіді НАН України
Екологія
Метод "сортуючої” кластеризації (DRSA) для класифікації рослинності
Метод “сортирующей” кластеризации (DRSA) для классификации растительности
A method of “sorting” clustering (DRSA) for the classification of plant communities
Article
published earlier
spellingShingle Метод "сортуючої” кластеризації (DRSA) для класифікації рослинності
Гончаренко, І.В.
Екологія
title Метод "сортуючої” кластеризації (DRSA) для класифікації рослинності
title_alt Метод “сортирующей” кластеризации (DRSA) для классификации растительности
A method of “sorting” clustering (DRSA) for the classification of plant communities
title_full Метод "сортуючої” кластеризації (DRSA) для класифікації рослинності
title_fullStr Метод "сортуючої” кластеризації (DRSA) для класифікації рослинності
title_full_unstemmed Метод "сортуючої” кластеризації (DRSA) для класифікації рослинності
title_short Метод "сортуючої” кластеризації (DRSA) для класифікації рослинності
title_sort метод "сортуючої” кластеризації (drsa) для класифікації рослинності
topic Екологія
topic_facet Екологія
url https://nasplib.isofts.kiev.ua/handle/123456789/97589
work_keys_str_mv AT gončarenkoív metodsortuûčoíklasterizacíídrsadlâklasifíkacííroslinností
AT gončarenkoív metodsortiruûŝeiklasterizaciidrsadlâklassifikaciirastitelʹnosti
AT gončarenkoív amethodofsortingclusteringdrsafortheclassificationofplantcommunities