До відкриття латентного бінарного фактора в статистичних даних категорного типу

For a discrete model with tree-like structure, we demonstrate that if a separating variable (a root vertex) is binary, then constraints (like “tetrad difference”) hold. Specifically, when there are four or three manifest variables in a model, the “ditetrad-constraint” or “triad-constraint”, respect...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2008
Автори: Андон, П.І., Балабанов, О.С.
Формат: Стаття
Мова:Українська
Опубліковано: Видавничий дім "Академперіодика" НАН України 2008
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/5822
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:До відкриття латентного бінарного фактора в статистичних даних категорного типу / П. I. Андон, О.С. Балабанов // Доп. НАН України. — 2008. — № 9. — С. 37-43. — Бібліогр.: 13 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1860247411158417408
author Андон, П.І.
Балабанов, О.С.
author_facet Андон, П.І.
Балабанов, О.С.
citation_txt До відкриття латентного бінарного фактора в статистичних даних категорного типу / П. I. Андон, О.С. Балабанов // Доп. НАН України. — 2008. — № 9. — С. 37-43. — Бібліогр.: 13 назв. — укр.
collection DSpace DC
description For a discrete model with tree-like structure, we demonstrate that if a separating variable (a root vertex) is binary, then constraints (like “tetrad difference”) hold. Specifically, when there are four or three manifest variables in a model, the “ditetrad-constraint” or “triad-constraint”, respectively, applies. So, these constraints facilitate the discovery of a hidden binary variable (latent class) which is responsible for associations among discrete manifest variables.
first_indexed 2025-12-07T18:38:11Z
format Article
fulltext оповiдi НАЦIОНАЛЬНОЇ АКАДЕМIЇ НАУК УКРАЇНИ 9 • 2008 IНФОРМАТИКА ТА КIБЕРНЕТИКА УДК 007:681.3.00 © 2008 Академiк НАН України П. I. Андон, О. С. Балабанов До вiдкриття латентного бiнарного фактора в статистичних даних категорного типу For a discrete model with tree-like structure, we demonstrate that if a separating variable (a root vertex) is binary, then constraints (like “tetrad difference”) hold. Specifically, when there are four or three manifest variables in a model, the “ditetrad-constraint” or “triad-constraint”, respectively, applies. So, these constraints facilitate the discovery of a hidden binary variable (latent class) which is responsible for associations among discrete manifest variables. 1. Моделi з латентними змiнними (факторами) доволi поширенi в соцiометрицi, економе- трицi, психометрицi, медико-бiологiчних дослiдженнях тощо. Практика аналiзу емпiричних даних потребує методiв швидкого виявлення латентних факторiв. Для введення (включен- ня) в модель прихованої змiнної треба знайти вiдповiднi свiдчення в аналiзованих даних. Структура моделi вважається адекватною, якщо вона сумiсна з даними i не складнiша за альтернативнi структури, сумiснi з даними. Модель M∗ з прихованою змiнною можна на- звати обгрунтованою, якщо вона простiша за всi iншi моделi M в заданому класi (як з при- хованими змiнними, так i без) i не поступається їм за узгодженiстю з даними. Складнiсть моделi в нашому випадку доцiльно визначати кiлькiстю незалежних параметрiв. Для виявлення прихованої змiнної в лiнiйних моделях застосовують iнструмент “тет- рад-рiзниць” (тетрад-стримування), який був винайдений ще на початку 20-го столiття [1]. Бiльш сучасний виклад можна знайти в [2–5]. Лiнiйнi системи залежностей мають цiкаву властивiсть — мультиплiкативнiсть (факторизованiсть) коефiцiєнта кореляцiї на ланцю- гових (деревовидних) структурах залежностей. Тобто для ланцюгiв у структурi лiнiйних моделей коефiцiєнт кореляцiї для транзитивної залежностi дорiвнює добутку коефiцiєн- тiв кореляцiї для складових ланок, якi утворюють ланцюг [3, 4]. Наприклад, у моделi зi структурою рис. 1, а змiннi X, Z, W асоцiйованi лише через “центральну” змiнну Y , отже кондицiонування змiнної Y робить iншi змiннi взаємно незалежними. Зокрема, є чинною умовна незалежнiсть змiнної Z вiд змiнної X за кондицiонування змiнної Y , звiдки маємо rXZ = rXY × rY Z . (1) Завдяки такiй властивостi в моделi вигляду “4-зiрка” з чотирма iндикаторними змiнни- ми, якi асоцiйованi тiльки через єдину центральну змiнну, виконуються “тетрад”-рiвностi. ISSN 1025-6415 Доповiдi Нацiональної академiї наук України, 2008, №9 37 Рис. 1 Наприклад, для лiнiйної моделi, яка зображена на рис. 1, в, маємо: rXY × rZW = rXZ × rY W , rXZ × rY W = rXW × rY Z , (2) а також третє рiвняння, що випливає з цих двох. Крiм того, в лiнiйнiй моделi вигляду “зiрка” є чинними обмеження типу нерiвнiсть, вiдомi як “спiввiдношення трикутника”. Зокрема, для моделi рис. 1, б та 1, в виконується |rXZ | > |rXY × rY Z |, (3) та аналогiчнi спiввiдношення для iнших пар змiнних. Стосовно моделей для дискретних даних, переважна частина результатiв обмежується бiнарними змiнними. Вiдомо [6], що у моделях вигляду “зiрка” з бiнарними змiнними, де є чотири iндикаторнi змiннi (рис. 1, в), теж виконується система рiвнянь тетрад (2). А ко- ли розглядаються лише три iндикаторнi змiннi в моделi “зiрка”, виконується нерiвнiсть “трикутника” (3). I це зрозумiло, оскiльки в моделях з бiнарними змiнними є чинною муль- типлiкативнiсть мiри залежностi на ланцюгах, аналогiчно лiнiйним моделям [7]. Аналогiчний результат показано в [8, 9] в апаратi категорних змiнних. Для цього за- мiсть коефiцiєнта кореляцiї застосовано коефiцiєнт номiнальної стохастичної детермiнацiї dnom(∗) (див. далi). Тобто для ланцюгової структури X–Y –Z з бiнарними змiнними є чин- ним спiввiдношення dnom(Z ← X) = dnom(Y ← X)× dnom(Z ← Y ). Будемо називати цю властивiсть квазiлiнеарнiстю моделi, або квазiлiнеарнiстю залежностi на ланцюгу. Для загального випадку мультиномiальних (категорних) даних вiдомо мало результатiв, якi можна порiвняти з такими для лiнiйних моделей. Лише нещодавно нами показано [10], що властивiсть квазiлiнеарностi залежностi поширюється на випадок, де “крайнi” змiннi ланцюга є мультиномiальними. Таким чином, пропонований нами аналiтичний iнструмен- тарiй заповнює певну “прогалину” i пiдсилює можливостi аналiзу даних. 2. Квазiлiнеарнiсть на ланцюгах залежностей. Запропонований в [11, 12] коефiцi- єнт номiнальної стохастичної детермiнацiї (NSD-коефiцiєнт) вимiрює силу залежностi мiж двома випадковими змiнними мультиномiального (категорного) типу. Цей коефiцiєнт ви- значається як dnom(Z ← X) = CN ∑ x ∑ y ( p(Y |X)− 1 ‖X‖ ∑ x p(Y |X) ) 2 , (4) де CN — нормалiзацiйний коефiцiєнт; ‖X‖ — значнiсть змiнної X. 38 ISSN 1025-6415 Reports of the National Academy of Sciences of Ukraine, 2008, №9 Трохи згодом була пропонована iнша форма (версiя) NSD-коефiцiєнта, яка вiдрiзняється використанням модуля замiсть квадрата [9, 10]. Модуль-форма коефiцiєнта номiнальної детермiнацiї, яку будемо називати iндексом детермiнацiї, визначається як di(Y (X)) = CNa ∑ x ∑ y ∣ ∣ ∣ ∣ ∣ p(Y |X)− 1 ‖X‖ ∑ x p(Y |X) ∣ ∣ ∣ ∣ ∣ . (5) Для бiнарних змiнних iндекс детермiнацiї di(∗) спрощується до вигляду di(Y (X)) = |p(y1|x1)− p(y1|x2)| = |p(y1, x1)− p(x1)p(y1)|/p(x1)p(x2). (6) (Нормалiзацiйний коефiцiєнт CNa в цьому випадку дорiвнює 1/2.) Нехай маємо ланцюгову структуру залежностей у виглядi X–Y –Z, тобто змiнна Z умов- но не залежна вiд змiнної X за кондицiонування змiнної Y ; позначаємо це як Pr(X⊥Y⊥Z). Покажемо, що у випадку, коли медiаторна змiнна Y — бiнарна (Y := {y1, y2}), а змiннi X, Z — дискретнi (категорнi), виконується квазiлiнеарнiсть залежностi. Для зручностi у подальшому будемо застосовувати ненормалiзовану форму iндекса де- термiнацiї (вiдкинемо коефiцiєнт CNa) i позначимо ненормалiзований iндекс d(Y (X)). Тодi визначаємо d(Y (X)) = ∑ x,y ∣ ∣ ∣ ∣ ∣ p(Y |X)− 1 ‖X‖ ∑ x p(Y |X) ∣ ∣ ∣ ∣ ∣ . (7) Тепер формулюємо базовий результат. Твердження. Якщо змiнна Z умовно не залежна вiд X за кондицiонування змiнної Y, змiнна Y — бiнарна, а змiннi X та Z — дискретнi довiльної значностi, то d(Z(X)) = d(Y (X))d(Z(Y )) 2 . (8) Доведення. Спростимо вираз для d(Y (X)), коли медiаторна змiнна Y — бiнарна, а змiн- на X — q-значна. Тривiальнi манiпуляцiї дають d(Y (X)) = ∑ x,y ∣ ∣ ∣ ∣ ∣ p(Y |X)− 1 q ∑ x p(Y |X) ∣ ∣ ∣ ∣ ∣ = 2 ∑ x ∣ ∣ ∣ ∣ ∣ p(y1|X)− 1 q ∑ x p(y1|X) ∣ ∣ ∣ ∣ ∣ . (9) Запишемо вираз для iндексу детермiнацiї d(Z(Y )) з бiнарною Y : d(Z(Y )) = ∑ z,y ∣ ∣ ∣ ∣ ∣ p(Z|Y )− 1 2 ∑ y p(Z|Y ) ∣ ∣ ∣ ∣ ∣ = ∑ z |p(Z|y1)− p(Z|y2)|. (10) Згiдно з визначенням (7), маємо d(Z(X)) = ∑ z ∑ x ∣ ∣ ∣ ∣ ∣ p(Z|X)− 1 q ∑ x p(Z|X) ∣ ∣ ∣ ∣ ∣ . (11) Використовуючи умовну незалежнiсть Z вiд X при фiксованому Y , а також бiнарнiсть змiнної Y , запишемо p(Z|X) = ∑ y [p(Z|Y )p(Y |X)] = p(y1|X)[p(Z|y1)− p(Z|y2)] + p(Z|y2). (12) ISSN 1025-6415 Доповiдi Нацiональної академiї наук України, 2008, №9 39 Пiдставляючи (12) до (11), отримуємо d(Z(X)) = ∑ z,x ∣ ∣ ∣ ∣ ∣ p(y1|X)[p(Z|y1)− p(Z|y2)]− [p(Z|y1)− p(Z|y2)] 1 q ∑ x p(y1|X) ∣ ∣ ∣ ∣ ∣ = = ∑ z |p(Z|y1)− p(Z|y2)| ∑ x ∣ ∣ ∣ ∣ ∣ p(y1|X) − 1 q ∑ x p(y1|X) ∣ ∣ ∣ ∣ ∣ . (13) З огляду на (9) та (10), останнє (13) дає потрiбне (8). Спiввiдношення (8) може також виконуватись в окремих випадках, коли медiаторна змiнна Y не є бiнарною, але залежнiсть має спецiальну форму [9, 10]. 3. Характеристика структури моделi. Подальшi результати стосуються дискретних моделей з бiнарною центральною (вузловою, або сепараторною) змiнною та кiлькома “iн- дикаторними” змiнними навколо неї. Спочатку розглянемо випадок з чотирма “iндикаторними” змiнними (”4-зiрка”). У цiй структурi (рис. 1, в) кондицiонування центральної змiнної робить всi iншi змiннi взаємно незалежними. Отож, чиннi вiдношення умовної незалежностi Pr(X⊥H⊥Y ), Pr(X⊥H⊥Z), Pr(X⊥H⊥W ), Pr(Y⊥H⊥Z) i т. д. В цiй моделi можна нарахувати шiсть ланцюгових фраг- ментiв. Кожний ланцюг задовольняє умови твердження, i можемо записати рiвняння (8) для кожного з вiдповiдною пiдстановкою змiнних (для обох напрямкiв). Для стислостi будемо писати Y (X) замiсть d(Y (X)). Отже, отримуємо систему 12-ти рiвнянь: X(Y ) = X(H)H(Y ) 2 , Y (X) = Y (H)H(X) 2 , Y (Z) = Y (H)H(Z) 2 , Z(Y ) = Z(H)H(Y ) 2 , Z(X) = Z(H)H(X) 2 , X(Z) = X(H)H(Z) 2 , . . . (14) i так далi. Виключаючи з системи (14) члени зi змiнною H, одержуємо такi шiсть рiвнянь для чотирьох змiнних: X(Y )Z(W ) = X(W )Z(Y ), (15) X(Y )W (Z) = X(Z)W (Y ), (16) Y (X)Z(W ) = Y (W )Z(X), (17) Y (X)W (Z) = Y (Z)W (X), (18) Z(X)W (Y ) = Z(Y )W (X), (19) X(Z)Y (W ) = X(W )Y (Z). (20) Серед цих шiстьох рiвнянь незалежними (алгебраїчно) є п’ять. Тобто, будь-яке рiвняння iмплiкується п’ятьма iншими. Як бачимо, ми отримали обмеження, подiбне до “тетрад”, але кiлькiсть рiвнянь тут ма- ємо iншу: шiсть замiсть трьох (або, рахуючи незалежнi, п’ять замiсть двох). Називатимемо обмеження (15)–(20) “дiтетрад-стримуванням”. 40 ISSN 1025-6415 Reports of the National Academy of Sciences of Ukraine, 2008, №9 Тепер розглянемо випадок з трьома “iндикаторними” змiнними. Ця модель iз структурою “3-зiрка” показана на рис. 1, б. Модель мiстить три ланцюгових фрагменти, кожен з яких задовольняє умови твердження (коли H — бiнарна). Вiдтак можемо записати рiвняння (8) з вiдповiдною пiдстановкою змiнних. Знов пишемо Y (X) замiсть d(Y (X)). Отже, отримуємо систему рiвнянь: X(Y ) = X(H)H(Y ) 2 , Y (X) = Y (H)H(X) 2 , Z(X) = Z(H)H(X) 2 , X(Z) = X(H)H(Z) 2 , Z(Y ) = Z(H)H(Y ) 2 , Y (Z) = Y (H)H(Z) 2 . (21) Особливiсть цiєї системи рiвнянь полягає в тому, що члени зi змiнною H входять до системи парами, як вiдношення (пропорцiї). Таких членiв маємо шiсть, як i рiвнянь системи. Тривiальнi алгебраїчнi перетворення дозволяють позбавлятися цих членiв. В кiнцевому результатi члени зi змiнною H взаємознищуються, тож система редукується до єдиного рiвняння, вираженого лише через X, Y , Z: X(Y )Y (Z)Z(X) = Y (X)Z(Y )X(Z). (22) Рiвняння (22) називатимемо “трiад-стримуванням”. Воно характеризує модель вигляду “3-зiрка” з бiнарним вузлом i констатує iнварiантнiсть добутку трьох парних залежностей до їх рiвночасного реверсу. Пiдкреслюємо, що лiнiйнi моделi з аналогiчною структурою не дають можливостей, що ми їх зараз показали, оскiльки коефiцiєнт кореляцiї є симетрична мiра залежностi, а iндекс детермiнацiї — нi. Тому наш результат не має прямого аналогу серед вiдомих. Кiлькiсть вiльних параметрiв у розглядуваних моделях можна пiдрахувати за схемою, за якою параметри визначаються в баєсiвських мережах [4, 13], тобто у формi умовних розподiлiв ймовiрностей p(Y |F (Y )), де F (Y ) — “батьки” (безпосереднi причини) змiнної Y . Нехай кардинальнiсть (значнiсть) iндикаторних змiнних X, Y , Z, W буде вiдповiдно q, r, s, t. Тодi модель “4-зiрка” (рис. 1, в) з бiнарною центральною змiнною має 2(q +r+s+ t)−7 параметрiв. Вiдповiдно, модель “3-зiрка” (рис. 1, б ) з бiнарною центральною змiнною має 2(q + r + s) − 5 вiльних параметрiв. 4. Виявлення прихованої змiнної. Розглянутi структури моделi (вигляду “зiрка”) належать до класу дерев. Але якщо приховати центральну змiнну H, то спостережувана структура моделi постане як модель, насичена зв’язками. Так, модель “4-зiрка” (рис. 1, в), якщо приховати центральну змiнну H, буде виглядати як “клiка” з чотирьох вершин. Свiд- чення про “справжню” структуру моделi захованi у спiввiдношеннях мiж значеннями “ви- димих” парних залежностей iндикаторних змiнних i описанi як дiтетрад-стримування. Для вiдкриття латентної змiнної в лiнiйних моделях iнструмент “тетрад” потребує при- наймнi чотирьох iндикаторних змiнних (ефектiв). Контрастуючи з цим, запропонований нами iнструмент (трiад-стримування) задовольняється трьома ефектами. Але, в разi бiнар- них ефектiв, “трiад” вироджується в тотожнiсть безвiдносно до структури моделi [10]. (Це легко перевiрити з огляду на формулу (6).) Вiдтак, для верифiкацiї iснування латентного фактора трьох бiнарних ефектiв залишається звернутися до нерiвностей “трикутника”. Але в бiльш загальних випадках критерiй трiад-стримування працює. Зокрема (як було показа- но в [10] на числовому прикладi), коли iндикаторнi змiннi — тризначнi, трiад-стримування помiтно вiдрiзняє випадок з тризначним спiльним фактором. ISSN 1025-6415 Доповiдi Нацiональної академiї наук України, 2008, №9 41 Пропонованi обмеження — дiтетрад-стримування та трiад-стримування — є необхiдними умовами адекватностi вказаних моделей (”4-зiрка” та “3-зiрка”). I хоча цi умови можуть бути досить жорсткими, та все ж вони не є достатнiми (втiм, як i iншi вiдомi умови). Дiйсно, кiлькiсть вiльних параметрiв у насиченiй (необмеженiй) моделi з чотирма змiн- ними дорiвнює qrst − 1. Це набагато бiльше, нiж в моделi “4-зiрка” (попри те, що “зiрка” має на одну змiнну бiльше). Наприклад, коли змiннi X, Y , Z, W — тризначнi, необмежена модель має 80 параметрiв, а “4-зiрка” — 17. Ясно, що таку вiддаль у складностi неможливо знiвелювати за допомогою п’яти рiвнянь дiтетрад-стримування. Навiть у випадку бiнар- них iндикаторних змiнних складнiсть зiставлюваних моделей буде 15 проти 9. Аналогiчне є вiрним для випадку трьох iндикаторних змiнних. Необмежена модель з трьох тризнач- них змiнних має 26 вiльних параметрiв, а модель “3-зiрка” з тризначними iндикаторами — 13. Вказану рiзницю у складностi неможливо знiвелювати за допомогою одного рiвняння трiад-стримування. Отже, можна припустити, що iснують альтернативнi моделi, якi теж задовольняють дiтетрад-стримування або трiад-стримування вiдповiдно. Вiдтак, маючи на метi застосувати (22) або (15)–(20) для верифiкацiї моделi, треба розвiдати альтернативнi моделi. Одна з альтернатив — це модель, де виконується умовна незалежнiсть деяких двох змiнних при кондицiонуваннi третьої (бiнарної) змiнної. Наприклад, нехай є чинною умовна незалежнiсть Pr(X⊥Y⊥Z), причому змiнна Y — бiнарна. Тодi з формули (8) випливає: Z(X) = Y (X)Z(Y ) 2 , (23) Y (Z)X(Y ) 2 = X(Z). (24) Добуток (23) та (24) дає трiад (22). До речi, (23) та (24) є бiльш жорстким обмеженням, нiж (22), отже, ланцюг та “зiрку” можна розрiзнити. Вiдомi також альтернативнi моделi, якi накладають спецiальнi обмеження на параметри моделi, кардинальнiсть змiнних та форму залежностей [9, 10]. Перелiк альтернатив є вiд- критий. Проте, якщо альтернативне пояснення емпiричних свiдчень потребує не зумовле- них структурою обмежень на значення параметрiв, то таке пояснення треба розглядати як штучне i непереконливе. Тож виконання спiввiдношень (15)–(20) або (22) можна вважа- ти вагомим свiдченням того, що асоцiацiї помiж спостережуваними дискретними змiнними пояснюються впливом прихованої бiнарної змiнної, яка виступає їх спiльним фактором. Надiйнiсть iдентифiкацiї латентної змiнної пiдвищуватиметься iз зростанням кiлькостi iн- дикаторних змiнних та їх значностi. При виборi моделi з-помiж альтернатив береться до уваги i емпiрична точнiсть, i склад- нiсть. Отже, коли правдоподiбнiсть моделi з прихованим фактором лише незначно гiрша, нiж необмеженої моделi, то перша отримає перевагу завдяки тому, що вона багаторазово простiша. За наявностi досить великої вiдбiрки даних дiтетрад-стримування та трiад-стри- мування можуть бути iнструментом емпiричного виявлення прихованої бiнарної змiнної (спiльного фактору). Таким чином, на ланцюгах (фрагментах деревовидних структур) залежностей, де вуз- лова (сепараторна) змiнна є бiнарною, а iншi змiннi є дискретними з довiльною значнiстю, можна факторизувати (декомпозувати) транзитивну залежнiсть згiдно з вiдтинками лан- цюга. Ми показали, що, завдяки цiй властивостi, для структури моделi у формi “зiрка з бiнарним вузлом” виконуються спецiальнi обмеження типу рiвнiсть на добуток парних 42 ISSN 1025-6415 Reports of the National Academy of Sciences of Ukraine, 2008, №9 залежностей iндикаторних змiнних. (Данi про вузлову змiнну при цьому не використову- ються.) Завдяки цим обмеженням — дiтетрад-стримування та трiад-стримування — мож- на iдентифiкувати приховану бiнарну змiнну, вiдповiдальну за асоцiацiю трьох або бiльше дискретних змiнних. 1. Spearman C. General intelligence, objectively determined and measured // Americ. J. of Psychology. – 1904. – 15. – P. 201–293. 2. Bollen K.A., K. Ting. A tetrad test for causal indicators // Psychological Methods. – 2000. – 5. – P. 3–22. 3. Прикладная статистика: Исследование зависимостей / С.А. Айвазян, И.С. Енюков, Л.Д. Мешал- кин. – Москва: Финансы и статистика, 1985. – 487 с. 4. Scheines R., P. Spirtes, C. Glymour et al. The TETRAD project: constraint based aids to causal model specification // Multivariate Behavioral Research. – 1998. – 33, No 1. – P. 65–118. 5. Scheines R., Spirtes P. Finding latent variable models in large databases // Intern. J. of Intelligent Systems. – 1992. – 7, No 7. – P. 609–621. 6. Pearl J. Fusion, propagation and structuring in belief networks // Artificial Intelligence. – 1986. – 29, No 3. – P. 241–288. 7. Danks D., Glymour C. Linearity properties of bayes nets with binary variables / In: Breese, J., Koller D. eds. Uncertainty in Artificial Intelligence: Proceedings of the 17th Conf. (UAI-2001). Morgan Kaufmann, San Francisco. – P. 98–104. 8. Балабанов А.С. К проблеме вывода знаний о структуре зависимостей между переменными из данных большого объема в условиях помех. – Материалы 2-й Междунар. конф. “УкрПРОГ’2000” // Пробл. программирования. – 2000. – № 1–2. – С. 527–535. 9. Балабанов О.С. Iндуктивне вiдтворення деревовидних структур систем залежностей // Там же. – 2001. – № 1–2. – С. 95–108. 10. Балабанов О.С. Квазiлiнеарнiсть у дискретних моделях залежностей та вiдкриття латентного фа- ктору трьох ефектiв // Пробл. програмування. – 2006. – № 4. – С. 28–36. 11. Балабанов А.С. Мера для обнаружения зависимостей между переменными в данных в условиях случайных возмущений // Пробл. программирования. – 1999. – № 2. – С. 63–69. 12. Балабанов О.С. Kритерiї iдентифiкацiї ймовiрнiсних залежностей в базах даних // Працi 1-ї мiжнар. наук.-практ. конф. з програмування (УкрПрог’98). – Київ, 1998. – 2–4 вересня. – С. 380–382. 13. Neapolitan R. E. Learning bayesian networks. – Englewood Cliffs: Prentice-Hall, 2003. – 686 p. Надiйшло до редакцiї 19.03.2008Iнститут програмних систем НАН України, Київ ISSN 1025-6415 Доповiдi Нацiональної академiї наук України, 2008, №9 43
id nasplib_isofts_kiev_ua-123456789-5822
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1025-6415
language Ukrainian
last_indexed 2025-12-07T18:38:11Z
publishDate 2008
publisher Видавничий дім "Академперіодика" НАН України
record_format dspace
spelling Андон, П.І.
Балабанов, О.С.
2010-02-08T15:04:21Z
2010-02-08T15:04:21Z
2008
До відкриття латентного бінарного фактора в статистичних даних категорного типу / П. I. Андон, О.С. Балабанов // Доп. НАН України. — 2008. — № 9. — С. 37-43. — Бібліогр.: 13 назв. — укр.
1025-6415
https://nasplib.isofts.kiev.ua/handle/123456789/5822
007:681.3.00
For a discrete model with tree-like structure, we demonstrate that if a separating variable (a root vertex) is binary, then constraints (like “tetrad difference”) hold. Specifically, when there are four or three manifest variables in a model, the “ditetrad-constraint” or “triad-constraint”, respectively, applies. So, these constraints facilitate the discovery of a hidden binary variable (latent class) which is responsible for associations among discrete manifest variables.
uk
Видавничий дім "Академперіодика" НАН України
Інформатика та кібернетика
До відкриття латентного бінарного фактора в статистичних даних категорного типу
Article
published earlier
spellingShingle До відкриття латентного бінарного фактора в статистичних даних категорного типу
Андон, П.І.
Балабанов, О.С.
Інформатика та кібернетика
title До відкриття латентного бінарного фактора в статистичних даних категорного типу
title_full До відкриття латентного бінарного фактора в статистичних даних категорного типу
title_fullStr До відкриття латентного бінарного фактора в статистичних даних категорного типу
title_full_unstemmed До відкриття латентного бінарного фактора в статистичних даних категорного типу
title_short До відкриття латентного бінарного фактора в статистичних даних категорного типу
title_sort до відкриття латентного бінарного фактора в статистичних даних категорного типу
topic Інформатика та кібернетика
topic_facet Інформатика та кібернетика
url https://nasplib.isofts.kiev.ua/handle/123456789/5822
work_keys_str_mv AT andonpí dovídkrittâlatentnogobínarnogofaktoravstatističnihdanihkategornogotipu
AT balabanovos dovídkrittâlatentnogobínarnogofaktoravstatističnihdanihkategornogotipu