Реконструкция модели вероятностных зависимостей по статистическим данным. Инструментарий и алгоритм

Розроблено інструментарій та алгоритм відтворення ймовірнісних моделей залежностей у класі монопотокових структур (підкласі баєсових мереж). Алгоритм «Proliferator-D» обчислювально ефективний (субкубічної складності) і виконує невелику кількість тестів умовної незалежності тільки першого рангу. Коре...

Full description

Saved in:
Bibliographic Details
Published in:Проблемы управления и информатики
Date:2009
Main Author: Балабанов, А.С.
Format: Article
Language:Russian
Published: Інститут кібернетики ім. В.М. Глушкова НАН України 2009
Subjects:
Online Access:https://nasplib.isofts.kiev.ua/handle/123456789/210628
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Cite this:Реконструкция модели вероятностных зависимостей по статистическим данным. Инструментарий и алгоритм / А.С. Балабанов // Проблемы управления и информатики. — 2009. — № 6. — С. 90-103. — Бібліогр.: 16 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
Description
Summary:Розроблено інструментарій та алгоритм відтворення ймовірнісних моделей залежностей у класі монопотокових структур (підкласі баєсових мереж). Алгоритм «Proliferator-D» обчислювально ефективний (субкубічної складності) і виконує невелику кількість тестів умовної незалежності тільки першого рангу. Коректність алгоритму обґрунтовується простими припущеннями, емпірично робастними до обсягу вибірки даних. Коли генеративна модель виходить за рамки монопотокових структур, алгоритм плавно деградує до відомого алгоритму Крускала і виводить покриття (апроксимацію) моделі деревом. Запропонований алгоритм нескладно модифікувати з метою підвищення якості редукції (апроксимації) баєсових мереж. We have developed technique and algorithm for recovery of probabilistic dependency models in class of mono-streams structures (subclass of Bayesian nets) from data. The «Proliferator-D» algorithm is of sub-cubic complexity and needs to execute a first-order independence tests only. The algorithm is justified by simple assumptions and is robust against data sample size. When generic model goes beyond class of mono-streams structures, the algorithm gracefully degrades to Kruskal algorithm and would infer a spanning tree model. Proposed algorithm may be easily modified to improve approximation of Bayesian nets.
ISSN:0572-2691