Гибридный подход к кластеризации видеорядов различной длины

Рассмотрена задача кластеризации многомерных временных рядов (векторных и матричных) различной длины в условиях неизвестного количества классов и их взаимного пересечения. Предложен метод решения этой задачи на основе гибридизации иерархического агломеративного и нечеткого, основанного на центроидах...

Full description

Saved in:
Bibliographic Details
Published in:Проблемы управления и информатики
Date:2019
Main Authors: Машталир, С.В., Столбовой, М.И., Яковлев, С.В.
Format: Article
Language:Russian
Published: Інститут кібернетики ім. В.М. Глушкова НАН України 2019
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/180784
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Гибридный подход к кластеризации видеорядов различной длины / С.В. Машталир, М.И. Столбовой, С.В. Яковлев // Проблемы управления и информатики. — 2019. — № 2. — С. 80-88. — Бібліогр.: 29 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id nasplib_isofts_kiev_ua-123456789-180784
record_format dspace
spelling Машталир, С.В.
Столбовой, М.И.
Яковлев, С.В.
2021-10-18T19:06:49Z
2021-10-18T19:06:49Z
2019
Гибридный подход к кластеризации видеорядов различной длины / С.В. Машталир, М.И. Столбовой, С.В. Яковлев // Проблемы управления и информатики. — 2019. — № 2. — С. 80-88. — Бібліогр.: 29 назв. — рос.
0572-2691
https://nasplib.isofts.kiev.ua/handle/123456789/180784
004.93
Рассмотрена задача кластеризации многомерных временных рядов (векторных и матричных) различной длины в условиях неизвестного количества классов и их взаимного пересечения. Предложен метод решения этой задачи на основе гибридизации иерархического агломеративного и нечеткого, основанного на центроидах, подходов с использованием метрики Левенштейна. Процесс кластеризации сводится к последовательности элементарных операций над матрицей расстояний между анализируемыми исходными последовательностями. Развиваемый подход крайне прост с вычислительной точки зрения, позволяет решать задачи кластеризации временных рядов произвольной природы как в условиях неопределенности относительно количества классов данных, так и их формы и уровня взаимного пересечения.
Істотне збільшення обсягу даних, що підлягають аналізу і обробці, вимагає запровадження нових ефективних засобів і методів їх збору та зберігання. Особливо актуальною така задача стає при аналізі мультимедійних, зокрема, відеоданих, в силу їх значної надмірності. Один із шляхів зниження обсягу оброблюваної інформації — кластеризація/сегментація відеопослідовностей для виділення однорідних за змістом сегментів. При цьому виникає завдання вибору необхідної кількості кластерів як вихідної інформації. Стаття присвячена розробці гібридного методу кластеризації для аналізу відеопослідовностей різної довжини. Метод зберігає переваги і виключає недоліки агломеративної ієрархічної і нечіткої кластеризації. Для визначення подібності між сегментами відеопослідовностей використовується метрика Левенштейна, що дозволяє розраховувати відстані між багатовимірними послідовностями різної довжини. Критерієм завершення процесу кластеризації в цілому, і, відповідно, якість одержуваного результату визначається індексом Данна. Запропонований гібридний підхід до кластеризації відеопослідовностей відрізняється обчислювальною простотою реалізації і дозволяє вирішувати завдання аналізу багатовимірних часових рядів довільної природи в тому випадку, коли заздалегідь складно визначити необхідну кількість кластерів для розбиття і в умовах невизначеності щодо можливого їх перекриття, тобто в разі, коли результатом кластеризації є побудова покриття, а не розбиття даних.
A significant increase in the amount of data to be analyzed and processed requires the introduction of new efficient tools and methods for their collection and storage. This task is especially important when analyzing multimedia, in particular, video data, due to their great redundancy. One of the ways to reduce the amount of information processed is clustering / segmentation of video sequences to isolate parts that are homogeneous in content. This raises the problem of choosing the required number of clusters as source information. The article is devoted to the development of a hybrid clustering method for analyzing video sequences of various lengths. The method saves the advantages and eliminates the disadvantages of agglomerative hierarchical and fuzzy clusterings. To determine the similarity between segments of video sequences, the Levenshtein metric is used, which allows to calculate the distances between multidimensional sequences of different lengths. The criterion for the clustering process completion as a whole, and, accordingly, the result quality is determined by the Dunn index. The proposed hybrid approach to clustering video sequences is computationally simple to implement and allows solving the multidimensional time series analysis problems of arbitrary nature in the case when it is difficult to determine in advance the necessary number of clusters for splitting and under conditions of uncertainty about their possible overlap, i.e. in the case where the clustering result is the cover construction, and not data partitioning (exact cover construction).
ru
Інститут кібернетики ім. В.М. Глушкова НАН України
Проблемы управления и информатики
Методы обработки информации
Гибридный подход к кластеризации видеорядов различной длины
Гібридний підхід до кластеризації відеорядів різної довжини
Hybrid approach to clustering different length vide
Article
published earlier
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
title Гибридный подход к кластеризации видеорядов различной длины
spellingShingle Гибридный подход к кластеризации видеорядов различной длины
Машталир, С.В.
Столбовой, М.И.
Яковлев, С.В.
Методы обработки информации
title_short Гибридный подход к кластеризации видеорядов различной длины
title_full Гибридный подход к кластеризации видеорядов различной длины
title_fullStr Гибридный подход к кластеризации видеорядов различной длины
title_full_unstemmed Гибридный подход к кластеризации видеорядов различной длины
title_sort гибридный подход к кластеризации видеорядов различной длины
author Машталир, С.В.
Столбовой, М.И.
Яковлев, С.В.
author_facet Машталир, С.В.
Столбовой, М.И.
Яковлев, С.В.
topic Методы обработки информации
topic_facet Методы обработки информации
publishDate 2019
language Russian
container_title Проблемы управления и информатики
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
format Article
title_alt Гібридний підхід до кластеризації відеорядів різної довжини
Hybrid approach to clustering different length vide
description Рассмотрена задача кластеризации многомерных временных рядов (векторных и матричных) различной длины в условиях неизвестного количества классов и их взаимного пересечения. Предложен метод решения этой задачи на основе гибридизации иерархического агломеративного и нечеткого, основанного на центроидах, подходов с использованием метрики Левенштейна. Процесс кластеризации сводится к последовательности элементарных операций над матрицей расстояний между анализируемыми исходными последовательностями. Развиваемый подход крайне прост с вычислительной точки зрения, позволяет решать задачи кластеризации временных рядов произвольной природы как в условиях неопределенности относительно количества классов данных, так и их формы и уровня взаимного пересечения. Істотне збільшення обсягу даних, що підлягають аналізу і обробці, вимагає запровадження нових ефективних засобів і методів їх збору та зберігання. Особливо актуальною така задача стає при аналізі мультимедійних, зокрема, відеоданих, в силу їх значної надмірності. Один із шляхів зниження обсягу оброблюваної інформації — кластеризація/сегментація відеопослідовностей для виділення однорідних за змістом сегментів. При цьому виникає завдання вибору необхідної кількості кластерів як вихідної інформації. Стаття присвячена розробці гібридного методу кластеризації для аналізу відеопослідовностей різної довжини. Метод зберігає переваги і виключає недоліки агломеративної ієрархічної і нечіткої кластеризації. Для визначення подібності між сегментами відеопослідовностей використовується метрика Левенштейна, що дозволяє розраховувати відстані між багатовимірними послідовностями різної довжини. Критерієм завершення процесу кластеризації в цілому, і, відповідно, якість одержуваного результату визначається індексом Данна. Запропонований гібридний підхід до кластеризації відеопослідовностей відрізняється обчислювальною простотою реалізації і дозволяє вирішувати завдання аналізу багатовимірних часових рядів довільної природи в тому випадку, коли заздалегідь складно визначити необхідну кількість кластерів для розбиття і в умовах невизначеності щодо можливого їх перекриття, тобто в разі, коли результатом кластеризації є побудова покриття, а не розбиття даних. A significant increase in the amount of data to be analyzed and processed requires the introduction of new efficient tools and methods for their collection and storage. This task is especially important when analyzing multimedia, in particular, video data, due to their great redundancy. One of the ways to reduce the amount of information processed is clustering / segmentation of video sequences to isolate parts that are homogeneous in content. This raises the problem of choosing the required number of clusters as source information. The article is devoted to the development of a hybrid clustering method for analyzing video sequences of various lengths. The method saves the advantages and eliminates the disadvantages of agglomerative hierarchical and fuzzy clusterings. To determine the similarity between segments of video sequences, the Levenshtein metric is used, which allows to calculate the distances between multidimensional sequences of different lengths. The criterion for the clustering process completion as a whole, and, accordingly, the result quality is determined by the Dunn index. The proposed hybrid approach to clustering video sequences is computationally simple to implement and allows solving the multidimensional time series analysis problems of arbitrary nature in the case when it is difficult to determine in advance the necessary number of clusters for splitting and under conditions of uncertainty about their possible overlap, i.e. in the case where the clustering result is the cover construction, and not data partitioning (exact cover construction).
issn 0572-2691
url https://nasplib.isofts.kiev.ua/handle/123456789/180784
citation_txt Гибридный подход к кластеризации видеорядов различной длины / С.В. Машталир, М.И. Столбовой, С.В. Яковлев // Проблемы управления и информатики. — 2019. — № 2. — С. 80-88. — Бібліогр.: 29 назв. — рос.
work_keys_str_mv AT maštalirsv gibridnyipodhodkklasterizaciivideorâdovrazličnoidliny
AT stolbovoimi gibridnyipodhodkklasterizaciivideorâdovrazličnoidliny
AT âkovlevsv gibridnyipodhodkklasterizaciivideorâdovrazličnoidliny
AT maštalirsv gíbridniipídhíddoklasterizacíívídeorâdívríznoídovžini
AT stolbovoimi gíbridniipídhíddoklasterizacíívídeorâdívríznoídovžini
AT âkovlevsv gíbridniipídhíddoklasterizacíívídeorâdívríznoídovžini
AT maštalirsv hybridapproachtoclusteringdifferentlengthvide
AT stolbovoimi hybridapproachtoclusteringdifferentlengthvide
AT âkovlevsv hybridapproachtoclusteringdifferentlengthvide
first_indexed 2025-12-07T15:31:16Z
last_indexed 2025-12-07T15:31:16Z
_version_ 1850864017668571136