Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання

Проведено багатофакторний лінійний регресійний аналіз та класифікаційне моделювання (алгоритм Random Forest) протипухлинної активності похідних 4-тіазолідинонів з метою спрямованого синтезу сполук з протираковою дією. Прогностична здатність підтверджена статистичними показниками, отриманими в процес...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Журнал органічної та фармацевтичної хімії
Дата:2012
Автори: Зіменковський, Б.С., Девіняк, О.Т., Лесик, Р.Б.
Формат: Стаття
Мова:Українська
Опубліковано: Інститут органічної хімії НАН України 2012
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/42017
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання / Б.С. Зіменковський, О.Т. Девіняк, Р.Б. Лесик // Журнал органічної та фармацевтичної хімії. — 2012. — Т. 10, вип. 2(38). — С. 43-49. — Бібліогр.: 16 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859825507930996736
author Зіменковський, Б.С.
Девіняк, О.Т.
Лесик, Р.Б.
author_facet Зіменковський, Б.С.
Девіняк, О.Т.
Лесик, Р.Б.
citation_txt Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання / Б.С. Зіменковський, О.Т. Девіняк, Р.Б. Лесик // Журнал органічної та фармацевтичної хімії. — 2012. — Т. 10, вип. 2(38). — С. 43-49. — Бібліогр.: 16 назв. — укр.
collection DSpace DC
container_title Журнал органічної та фармацевтичної хімії
description Проведено багатофакторний лінійний регресійний аналіз та класифікаційне моделювання (алгоритм Random Forest) протипухлинної активності похідних 4-тіазолідинонів з метою спрямованого синтезу сполук з протираковою дією. Прогностична здатність підтверджена статистичними показниками, отриманими в процесі створення моделі, та при прогнозі тестової вибірки. Здійснено аналіз вкладів дескрипторів у прийняття рішення, визначено найбільш важливі з них для проведення класифікації, розкрито їх фізико-хімічний зміст та проілюстровано зв'язок виділених молекулярних дескрипторів зі здатністю до інгібування росту онкоклітин. Проведен многофакторный линейный регрессионный анализ и классификационное моделирование (алгоритм Random Forest) противоопухолевой активности производных 4-тиазолидинонов с целью целенаправленного синтеза соединений с противораковым действием. Прогностическая способность подтверждена статистическими показателями, полученными в процессе создания модели и при прогнозе тестовой выборки. Осуществлен анализ вкладов дескрипторов в принятие решения, определены наиболее важные из них для проведения классификации, раскрыто их физико-химическое значение и проиллюстрирована связь выделенных молекулярных дескрипторов со способностью к ингибированию роста онкоклеток. In order to perform directed synthesis of antineoplastic compounds the multiple linear regression analysis and classifi cation modeling (by Random Forest algorithm) of 4-thiazolidinones as anticancer agents have been carried out. The predictive ability is confi rmed by the statistic data obtained during model developing and test sample predicting. Descriptors contribution in the decision making has been estimated, the most important descriptors for the classifi cation have been identifi ed and interpreted. The relationship between the molecular descriptors selected and cancer cells growth inhibition is given.
first_indexed 2025-12-07T15:28:35Z
format Article
fulltext !"#$%&'"($#)*#'+&,$&-$".$/01,2*#'+&3).)+4&–&56754&–&84&769&12:4&5&;<=> ?< ••• 541.6:547.789:615.076 ! "#$$%& '()*+' ’%',-&«./0-,/-0(&–&10+/!1-23!$$(& (,/! $4./5»&1+246$!2&78/4('+346!$+$4 &*#/+6(*!& 0#90#.4:$+9+&($(34'-&/(&,3(.!;4,(<4:$+9+& *+6#3= ($$% !.".#$%&'()*+,(-/2 3.;.•&*$'<(=2 >.!.?&+-( ?,*$*+,(-/ '@A$)'@B,'-/ %&C-D'-/ E'$*&F+-G&G $%. •@'-B@ H@B-A,()I) 790102 %. ?,*$*2 *EB. J&(@F+,(@2 69. KLmail: dr_r_lesykMorg.lviv.net = •&FN@*'-/ *-O-/ '@*D@B,'-/ P@(B@C «•NI)F)C+,(-/ '@A$)'@B,'-/ E'$*&F+-G&G» !"#$%&'(!$%):'4-*&)+$!&,./$/.;'01$*.023!.//)')5*.%/&(*6;'QSAR;'7/$8.//)'!&/&9/)'1<=1<(&>?' 0$51$5$%)'1<=1<(&>;')!=$1.*7;'Random'Forest !"#$%$&"'()*)+",)-+"!&./'01&1/&./'!$*!$21/&./')&)013'+)'-0)2.,1-)41/&$'5"%$067 #)&&8'9)0*"!.+5'Random'Forest:';!"+.;<=0.&&">')-+.#&"2+1';"=1%&.='?7+1)3"01%.&"7 &1#'3'5$+"6'2;!85"#)&"*"'2.&+$3<'2;"0<-'3';!"+.!)-"#"6'%1@6A' !"*&"2+.B&)'3%)+7 &12+C';1%+#$!%D$&)'2+)+.2+.B&.5.';"-)3&.-)5.E'"+!.5)&.5.'#';!"4$21'2+#"!$&&8' 5"%$01E'+)';!.';!"*&"31'+$2+"#">'#.(1!-.A'G%1/2&$&" ')&)013'#-0)%1#'%$2-!.;+"!1#'<' ;!./&8++8'!1H$&&8E'#.3&)B$&"'&)/(10CH'#)D0.#1'3'&.='%08';!"#$%$&&8'-0)2.,1-)41>E' !"3-!.+"'>=',13.-"7=151B&./'3512+'+)';!"1062+!"#)&" '3#’83"-'#.%10$&.='5"0$-<08!7 &.='%$2-!.;+"!1#'31'3%)+&12+6'%"'1&*1(<#)&&8'!"2+<'"&-"-01+.&A' TIJ'STUKY'OF'TIJ'«STRULTURJ'–'MNTPLMNLJR'MLTPVPTY»'RJQMTPONSIPW'OF'?7TIPMZO7 QPKPNONJS'USPNX'RJXRJSSPON'MNMQYSPS'MNK'LQMSSPFPLMTPON'[OKJQPNX \ASAZimenkovskyE']A^AKevinyakE'RA\AQesyk Pn'order'to'perform'directed'synthesis'of'antineoplastic'compounds'the'multiple'linear'regres7 sion'analysis'and'classi_'cation'modeling'9by'Random'Forest'algorithm:'of'?7thiazolidinones' as'anticancer'agents'have'been'carried'outA'The'predictive'ability'is'con_'rmed'by'the'statistic' data'obtained'during'model'developing'and'test'sample'predictingA'Kescriptors'contribution' in'the'decision'making'has'been'estimatedE'the'most'important'descriptors'for'the'classi_'ca7 tion'have'been'identi_'ed'and'interpretedA'The'relationship'between'the'molecular'descriptors' selected'and'cancer'cells'growth'inhibition'is'givenA `Gjqx{`x'|G}`~]€|•G`'«€^‚jƒ^j‚}'–' ‚]^`|]] j„]…x|}•'}ƒ^`|{]€^†»' ‚]7 `G|]‡{ˆ„'?7^`}G]…`‡`{]{]|'~x^]‡}~`'‚x‰‚x€€`]{{]‰]'}{}…`G}'`'ƒ…}€€`7 Š`ƒ}‹`]{{]‰]'~]‡x…`‚]|}{`• ŒA€AG.5$&-"#2-./E']A^A‡$#.&8-E'‚AŒA…$2•- !"#$%$&'5&"*",)-+"!&•/'0.&$/&•/' !$*!$22."&&•/')&)0 .3' .' -0)22.,.-)4."&&"$' 5"%$0.!"#)&.$'9)0*"!.+5'Random'Forest:';!"+.#"";<="0$#"/')-+.#&"2+.';!".3#"7 %&•='?7+.)3"0.%.&"&"#'2'4$0C6'4$0$&);!)#0$&&"*"'2.&+$3)'2"$%.&$&./'2';!"+.#"7 !)-"#•5'%$/2+#.$5A' !"*&"2+.B$2-)8'2;"2"(&"2+C';"%+#$!D%$&)'2+)+.2+.B$2-.7 5.';"-)3)+$085.E';"0<B$&&•5.'#';!"4$22$'2"3%)&.8'5"%$0.'.';!.';!"*&"3$'+$2+"#"/' #•("!-.A']2<Ž$2+#0$&')&)0.3'#-0)%"#'%$2-!.;+"!"#'#';!.&8+.$'!$H$&.8E'";!$%$0$7 &•'&).("0$$'#)D&•$'.3'&.='%08';!"#$%$&.8'-0)22.,.-)4..E'!)2-!•+"'.=',.3.-"7=.7 5.B$2-"$'3&)B$&.$'.';!".0062+!.!"#)&)'2#83C'#•%$0$&&•='5"0$-<08!&•='%$2-!.;7 +"!"#'2"'2;"2"(&"2+C6'-'.&*.(.!"#)&.6'!"2+)'"&-"-0$+"-A' J)QE( RF)G-RESB-''-S P@+)T$* +&F&C R)S$CL '-S 4LG$@P)B$C-')'$* U )C'-% P R&F+R&(G-*'-S '@RF<%($* '@E()*-S C)+B$CN&', E S$%$V B$(@F+,L (-S P@+)T$* [1L6]. W-()F-+G@''< P A$UX %&G)X P@+)T$* %@G&%@G-D')I) %)C&BX*@''< G@ in'silico' +(F-'$'IE E+R$Q') +&T& P@F&()%&'CE*@B) )GF-L %@'-%- F&PEB,G@G@%- [7L9]. 3T’U(G)% '@Q)I) C)L +B$CN&''< U T$TB$)G&(@ R)S$C'-S 4L@P)B$C)'$* G@ +R)F$C'&'-S I&G&F)A-(B$D'-S +R)BE(2 +-'G&P)L *@'-S '@ (@Y&CF$ Y@F%@A&*G-D')V2 )FI@'$D')V $ T$))FI@'$D')V S$%$V ?Z\• $%. •@'-B@ H@B-A,()I)2 <(@ +&F&C 5000 +R)BE( %$+G-G, 1076 R)S$C'-S ^40` P RF)G-RESB-'')X @(G-*'$+GX F$P')I) F$*L '<b2 RF)G&+G)*@'-S * Z@A$)'@B,')%E $'+G-GEG$ F@L (E "cf ^hjpb [12 `]. J)R&F&C',) '@%- TEB) PC$/L +'&') (B@+-Y$(@A$X 4LG$@P)B$C-')'$* P@ %&S@'$PL %@%- RF)G-RESB-'')V @(G-*')+G$ G@ *-<*B&') q (B@+- ^f2 ! $ Wb @(G-*'-S +R)BE( [10]. ;@()N +Y)F%)*@') GF- %@+-*- F&D)*-' CB< C)+B$CN&'L '< G@ *+G@')*B&')2 O) +R)BE(-2 RF- C$V <(-S +&L F&C'$/ *$C+)G)( F)+GE F@()*-S (B$G-' ^uwb +(B@L C@U x86z2 +B$C *-P'@D-G- <( '&@(G-*'$. • P@RF)R)L !"#$%&'"($#)*#'+&,$&-$".$/01,2*#'+&3).)+4&–&56754&–&84&769&12:4&5&;<=> ?? ••••••• !"•""• #$•%••&'•• %•!(•%&'••) *•’)*+, -•& !"$,+",$•. "• /••(•0•1••. •+"2•••!". ••3 •'%'•24 •25' +(•!•• *• %•#•-•0•. /•0•"•6•+3 "•$••0• (••••••0• $'0$'!••••0• •••(•*, "• +(•!23 6•+•7•8 * •2+•$2!"•••)- -'"•%, Random'Forests9 1. ••••••••!••"#$% &'#'%#$% "(•"()'%#$% •#•&'* :•0•"•6•+"•$•2• (•••••2• $'0$'!•••2• •••3 (•* #•()0•; , !"••$'••• -•"'-•"21••8 -•%'(• *•’)*3 +, -•& *•('&••. *-••••. <•+"2•••!".= "• (••••••. +•-/•••7•;. •'*•('&•24 *-•••24 <%'!+$2#"•$••=9 >'"•. "•+•0• •••(•*, ; •2*••1'••) !",#'•) %'3 "'$-•••••••!"• *•’)*+, "• ••'!+•• •+$'-24 •'3 *•('&•24 *-•••24 , ••$••7•. *•('&••8? • "•+•& #'$'%/•1'••) *••1'••) •+"2•••!"• !#•(,+2 *• %•#•-•0•. 88 -•('+,()$•24 %'!+$2#"•$••9 !- "#$%&'($%)*+,%)(*.%",!/0)12)3(&(4(5(6)&$(5$24% E-Dragon)7>89::)3!"#$%&'($0;<)[8=])&0",?)&(&!$!3/@(A) (&'%4012B0A)5!(4!'$0A)4(,!#+,)+)"%,(;(4+)&(,0)MMFF@A [BC]9 D •%'$&•••-, #'$•2•••-, -•!2•• *%••!•.3 •••!) #•E,+ #•-2(•+ •/12!('••) * ••!",#•2- •2%•('••)- ••%#•••%••0• $)%+• 12 !"••#7)? +'3 $,.12!G #$2•72#•- -•••-•*•7•8 •"$•1'••8 ••6•$3 -•7•89 H$•- "•0•? •2%•('•• +••!"••"•• "• #•#•$3 •• +•$'(G••••• <| r|IJ?@K= %'!+$2#"•$29 L•/,%•3 •• $'0$'!••••8 6,•+7•8 *%••!•.••(•!G *• %•#•-•3 0•. -'"•%, #•+$•+•••8 $'0$'!•8 [BB]9 N•+2- 12••- •%'$&••• 6,•+7•. %() -•!2•, OP GP Q <C9RS±RK9JS=3<RB?CT±C9JC=U’VWW’X X<CC9TA±T9CB=U’YJu’3<B@9RK±C9ZT=U’reactive’ <B= rRQBR9@? WM\^QBA9RJ? FQRR9BC? pQR9RUBJ3BC _2*G+• "•1••!"G -•%'(• •*••1•; !(•/+, (••••3 •, *•('&••!"G •+"2•••!"• •••(•*••••24 !#•(,+ ••% /,%G3)+•8 +•-/•••7•8 •* •/12!('•24 %'!+$2#"•$••9 L$2 #$•'+",••••• '+!#'$2-'•"•(G•24 $'*,(G"•3 "•• •• ••!G $•*$•4••••24 <$2!9 B= •"$2-••• `\VW3 -•%'(G •2%•(); 0$,#,? 5• -•!"2"G S •+"2••24 "• BJ •'•+"2••24 !#•(,+9 N•/"• *•!"•!,••••) 7•;8 -•3 %'(• %•; E••! %'5• -'•E2•? ••& SPBJ <#•42/+• #'$'%/•1'••) #••2••• /,"2 /•(GE•. *• #•42/3 +, $'0$'!•8= *%••!•2"2 !2•"'* •+"2•••8 !#•(,+2 +(•!, O? 5• #$2/(2*•• • BJ $•*•• +$•5' *• *%••3 !•'••) •2#•%+•••0• !2•"'*, <RTPARZ=9 b'0$'!•••• 6,•+7•) %() -•!2•, : -•; ••!",#3 •2• •20()%P GP Q <BJK9CB±B9AK=3<BJ9AB±R9CC=U’nWQ Qdt’3<BB9RZ±R9CZ=U’ndQ Qf3fg’3<J9JRZ±J9JJZ=U’V\VX’ rRQBR9Z? WM\^QBA9KB? FQRJ9AS? pQR9JUBJ3BR h••• 6,•+7•) •2•+$'-(.; 0$,#,? • )+•• C •+3 "2••• "• C •'•+"2••• !#•(,+2 <$2!9 R=9 j••! +•3 $'+"••0• #'$'%/•1'••) ; %'5• -'•E2- *• BPB9 b'0$'!•••• 6,•+7•) %() -•!2•, D ; ••!",#••.P GP Q <BJR9TZ±B9JJ=X<J9JAK± ±J9JJ@=U ‘k<l99\=’3<BC9KZ±C9J@=U ‘nVrdl\W’3 3<J9J@B±J9JBK=U’m^l^oq\VXB’ rRQBA9J? WM\^QT9BB? FQRC9RR? pQZ9JUBJ3BA _••'%'•• 6,•+7•) •2•+$'-(.; 0$,#,? • )+•• R •+"2••• "• S •'•+"2••24 !#•(,+ <$2!9 C=9 j••! +•$'+"••0• #'$'%/•1'••) %'5• -'•E' *• RPS9 s•%•• *• !"••$'•24 `\VW3-•%'('• •' *•%•3 ••(G•); *•0•(G••#$2••)"24 +$2"'$•8• "•1••!"•? 4•1• *••1'••) +$2"'$•. w•E'$• < F= #'$'/,••."G •• *•%•••(G••-, $••••9 x' *,-••('•• ••)•••!". •'•+"2••24 !#•(,+ •* *••1'••)-2 %'!+$2#"•$••? %,&' /(2*G+2-2 %• %'!+$2#"•$•• •+"2••24 -•3 ('+,(9 D••!(•%•+ 7G•0• !#•!"'$•0•;"G!) '6'+" «••3 &'()»? "•/"• *-'•E'••) #•42/+2 -•%'(• %() •+3 "2••24 !#•(,+ •%••1•!•• #•%•25,; #•42/+, ••3 /(2&'•24 %• •24 •'•+"2••249 y •0()%, •• "'? 5• •%'$&••• -•%'(• #$•)•()."G "'•%'•7•. %• #$•3 •••. 1. •••!"#$% !"•&!••'!()*+,(•- •!/0+,)*)$2 3+% '*••20 4 (* 2$•, •56••+!(•- /* 3•&•'•7•8 QSAR9'•3!+$. •••. :. •••!"#$% !"•&!••'!()*+,(•- •!/0+,)*)$2 3+% '*••20 ; (* 2$•, •56••+!(•- /* 3•&•'•7•8 QSAR9'•3!+$. <R= <C= !"#$%&'"($#)*#'+&,$&-$".$/01,2*#'+&3).)+4&–&56754&–&84&769&12:4&5&;<=> ?@ ••••• •••!"#$%%& •'•#() *%+ +)•,-%" •+ %$+)•,-. %"/ •+0"••1 ••2%••• -••+%•-#$%%& -"!•••)"- "%•". 3(-+%%& ••••(4 0•5%+ •••3,•, -,•%•-•)4 6• +!$. )-+•%,7 •',• •-’&•)( 0"5 •••()•(••8 •+ +)•,-. %"••8 0•5#,-,7 - •+0)+9 )#+•,:")+;"7%,9 0•. !$#$7< 2. ••••••!"•#!$%& '()&•*+•%%, -/(0•-13••%%(4 •"0•+%(•0! -(3!)%•3 0!•5(•!)•%(%1 =•,•%+2$%%&0 )#+•,:")+;"7%,9 0•!$#$7 > •••. '"•%+-+%%& •+0••• :+)•( '••&-( 3"•#••"2%•? !"? •'•#()+0,4 ••3•• •••!"#$%%& +)•,-%,9 •+ %$+). •,-%,9 0•#$)(#< @#& ?9 ••-••$%%& 3(#• -,)••,. ••+%• 0$••! Random'Forest4 •+ !•'•0•••8 &)••• •!"7•%8>•1•& '•3(!•-+ +%•+03#8 !$•$-+ •"A$%1 [BC]< D•"!%• • •$9%"2%•8 !•)(0$%•+;">8 0$••!( %$•39"!%•••" ( '••-$!$%%" '$•$9•$•%•? -+#"!+;"? 2, -,!"#$%%& •)•$0•? •$•••-•? -,3"•), !#& -••+. %•-#$%%& '•••%•••,2%•? •!+•%•••" 0•!$#" %$0+>4 ••)"#1), )•5%$ !$•$-• 3(!(>•1•& "• -,)••,••+%. %&0 -,'+!)•-•? -,3"•), "• •$%$•+#1%•? •()('%•. ••"4 •••,0+%•? •+ !•'•0•••8 •$9%"), 3(••••$'"%. •( * bootstraping/< E!$•5+%" '•, ;1•0( -,0"•%,), '•9,3), !#& •'•#()4 6• %$ --"7A#, - %+-2+#1%( -,3"•)( * out-of-bag'compounds/4 > +!$)-+•%,0, " %$('$•$!5$%,0, [BF]< G•!$#1 Random'Forest'0". ••,•1 •%+2%( )"#1)"••1 !$•$- •"A$%14 '•3(!•-+. %,9 %+ •"•%,9 -,3"•)+9 "• -,)••,••+%%&0 -,. '+!)•-,9 !$•)•,'•••%,9 '"!'••••••"- !#& :••. 0(-+%%& )•5%••• -(•#+ !$•$-+4 ••0( 3(!1.&)$ !$. •$-• '••$%;"7%• •'••0•5%$ •9•',•, (•" %+&-%" 0$9+%"•0, +)•,-%•••" •+ '•!"#•0 ( •"•%,9 -(•#+9< H•+9•-(82, %+-$!$%$4 3(#• '•,7%&•• •"A$%%& 6•!• ••-••$%%& >!,%•? 0•!$#" %+ ••%•-" -•"9 -". !•0,9 •+ !•••('%,9 •$•(#1•+•"- •$••(-+%%& '••. •,'(9#,%%•? !"? C.•"+••#"!,%•%"-< I+),0 2,%•04 %+-2+#1%+ -,3"•)+ 0"••,#+ JKC •'•#(),< L$•0$•. •"& ;,9 •'•#() 3(#+ •'•,0"••-+%+ - •,#•-•0( '•. #" MMNNOC [BP]4 + QBJRR !$•)•,'•••"- 3(#• •3. 2,•#$%• •+ !•'•0•••8 S.Tragon [BU]< =•0,#), •32,•#$%%& !$•)•,'•••"- -,!+#&#,•1 •+),0 2,. %•04 6•3 0"%"0"•(-+•, -••+2$%( "%:••0+;"8< V•"0 ••••4 )•%••+%•%" •+ '•'+•%• )••$#1•-+%" *| r|QR4OF/ !$•)•,'•••, •+)•5 3(#, -,!+#$%" • 0+•,-( !+. %,9< I+),0 2,%•04 •+#,A,#••1 KPO !$•)•,'•••"- !#& •!"7•%$%%& 0•!$#8-+%%&< W+ ••%•-" •$•$!%1•. •• -"!•••)+ ••••( •%)•)#"•,% XY Z \J^ &) 0$5" 0"5 )#+•+0, «+)•,-%,9» " «%$+)•,-%,9» •'•#() •+ '+•+0$••"- +#•••,•0( '• •+0•-2(-+%%8 *FRR !$. •$- •"A$%1 •+ 2,•#• !$•)•,'•••"- !#& •!"7•%$%%& ••••+#(5$%%& Z UK4 !$ Ndesc – •••0"•%"••1 '••••••( !$•)•,'•••"-/ •:••0•-+%• 0•!$#1 Random'Forest "• ••+•,••,2%,0, '•)+•. %,)+0,_ 2+••••+ '•0,#•) * Error'Rate/ Z BJ4JU^4 2(•#,-"••1 0•!$#" Z UU4\^4 •'$;,:"2%"••1 Z O\4BF^4 )••$#&;"7%,7 )•$:";">%• MCC'*Matthew’s'correla- tion'coef@icient/ Z R4UKP< `& 0•!$#1 ••+#+ -"!'•+-%,0 '(%)••0 !#& '•. !+#1A•? '•$•+'%•? •'•,0"•+;"? '+•+0$••"- +#••. •,•0(4 ••)•$0+4 • 0$••8 •%,5$%%& 2+••••, '•0,. #•) •+ '"!-,6$%%& 2(•#,-•••" 0•!$#"< b'•2+•)( !••#"!5(-+#,•1 •0"%, $:$)•,-%•••" 0•!$#" '•, '$•$0"6$%%" 0$5" 0"5 )#+•+0, "• )••)•0 C^ '•, :")••-+%•0( 2,•#" !$•)•,'•••"- !#& •!"7•%$%%& ••••+#(5$%%& Z UK •+ •0$%A$%"7 *• 0$••8 '"!. -,6$%%& A-,!)•!"?/ )"#1)•••" !$•$- ( 0•!$#" !• BRR< E!$•5+%" •$•(#1•+•, *•,•< C/ %$ !+8•1 •0•. •, 2"•)• -,•%+2,•, 0$5(4 '•, &)"7 0•!$#1 9+•+). •$•,•(>•1•& %+7)•+6,0, ••+•,••,2%,0, '•)+•. %,)+0,4 •!%+) !••-•#,#, -,•%+2,•, "%•$•-+#, •'•,0+#1%•••"< W+••('%,7 $•+' •'•,0"•+;"? '•. #&•+- ( !••#"!5$%%" '•-$!"%), 0•!$#" '•, •0"%" )"#1)•••" 0•#$)(#&•%,9 !$•)•,'•••"- *)••) BR !$•)•,'•••"-/ !#& •!"7•%$%%& ••••+#(5$%%&4 '•,7. 0+82, &) 0$5( 0"5 )#+•+0, '••#"!•-%• (•" ;"#•. 2,•$#1%" •%+2$%%& "• •%+7!$%••• "%•$•-+#( •'•,. 0+#1%•••"< E••,0+%" •$•(#1•+•, '•)+•+#,4 6• )•+. 6" ••+•,••,2%" '+•+0$••, !••&•+8•1•& - ••0( -,. '+!)(4 )•#, +)•,-%,0, --+5+8•1•& •'•#(), "• XYcUR^< D+#$5%"••1 $:$)•,-%•••" 0•!$#" "• BRR !$•$- •"A$%1 -"! )"#1)•••" !$•)•,'•••"- !#& •!"7•. %$%%& ••••+#(5$%%& '•, :")••-+%"7 0$5" 0"5 )#+. •+0, Z UR^ *•,•< F/< d •%+7!$%•0( "%•$•-+#" •'•,. 0+#1%•••" [BKR4 BOR] '••-•!,#••1 !•!+•)•-$ !•. •#"!5$%%& $:$)•,-%•••" 0•!$#" •" •0"%•8 )"#1. )•••" !$•)•,'•••"- %+ •!,%,;8< I+),0 2,%•04 3(. #• -••+%•-#$%•4 6• 0•!$#1 !••&•+> %+7)•+6,9 '•)+•%,)"- '•, -,)••,••+%%" -,'+!)•-••• B\R.-,. 0"•%••• '"!'••••••( !$•)•,'•••"- !#& '•,7%&•. •& •"A$%%& - )•5%•0( ••••+#(5$%%" !$•$-+< W+ •••+%%1•0( $•+'" •!"7•%8-+#+•1 •'•,0"•+;"& )"#1. )•••" !$•$- ( 0•!$#" Random'Forest< =•, ;1•0( •%+7!$%• !$)"#1)+ •"A$%1 !+%•? •+!+2"4 •!%$ • &),9 !••"-%8> BRR< H •$•(#1•+•" •!$•5+%• )"%;$-( •'. •,0+#1%( 0•!$#1 '•, %+••('%,9 '+•+0$••+9_ 0$. •••. 3. •••!"#$% !"•&!••'!()*+,(•- •!/0+,)*)$1 2+% '*••10 4 (* 1$•, •56••+!(•- /* 2•&•'•7•8 QSAR9'•2!+$. !"#$%&'"($#)*#'+&,$&-$".$/01,2*#'+&3).)+4&–&56754&–&84&769&12:4&5&;<=> ?A •• ••• •••!••" = 20%, •••#••!$# &'!•(")$*(•+ &•- .&•/!1'11- (*.3••4•'11- = 580, •••#••!$# &'('+ (•6'1# = 5007 9$•$"!$":1• )*••.1"•" ;•<> •*&'? •• 1•!$4)1•@ :•!$*$• )*•"•*• A Error'RateB = 2,0CC%, :4$•"+•!$# •*&'•• = DE,00%, !)';"F•:1•!$# = GG,EH%, •*('•-;•/1"/ •*'F•;•<1$ MCC'AMatthew’s'correla- tion'coef@icientB = 0,E8H7 I•($* .•.1•:"$", J* .•+&-? •" )(*+'&'1•/ *)$"••.•;•> 4 8 (•.•+ .•'16'1* :•? !$*$4 )*•"•*•, 4 2,D (•." )•&+"J'1* :4$•"+•!$# $• •*('•-;•/1"/ •*'F•;•<1$ MCC7 K •'$*L .*+1•61#*> +•••&•;•> •*&'•• 1• *!1*? +• +•&•("$*> M•." &•1"N ('.4•#$•$•+ OPQ RTS M4•* !F*(•*+•1* +"M•(•4 •. 52G !)*•4•, J* ••!$-$# !$(4•$4(1"/ F(•3•'1$ H?$••.*••&"1*147 U•!$*$• )*N"M•" •••!"F•••;•> •*&'•• )(" ;#*•4 !••••• 5,DD%7 V•!$4)1"• •(*•*• M4•* )(*+'&'11- •1•••? .4 +•••&•+ &'!•(")$*(•+ 4 )("/1-$$- (•6'11-7 I•••"+•!$# •*•1*3* &'!•(")$*(• *M:"!•L+•••!# -• !'('&1< .1•:'11- (•.1";• ••• +•&!*$•*• )(•? +"•#1"N +•&)*+•&'/ i?3* &'('+• )(" 1'.••11*•4 !$•1• $• )(" +")•&•*+*•4 )'('••64+•11• ;#*3* &'!•(")$*(•7 W'.4•#$•$" 1' +"-+"•" &'!•(")$*? (•+ •. +"!*•"•" (•+1-•" +•••"+*!$•, $*M$* + &•? 1*•4 ••!"+• &'!•(")$*(•+ 1' •!14< 1'+'•"•*> •*•? M•1•;•>, .&•$1*> (*.&••"$" ••$"+1• $• 1'••$"+1• !)*•4•", • +•(1' (*.)•.1•+•11- .&•/!1L<$#!- .• 4:•!$L M•3•$#*N F••$*(•+7 X', +••!1', $••*• < *&? •••. 4. •••!" •#"#••#•$!•% &"'"•(#'•) •*+(,(- Random Forest &'• &('(••/(!!• •(0• ••0 1,"•"••. 2!#(')",• *&#••",3!*•#• )•+•,(!• ••'•• 1*,3*'*•. •••. 5. •",(0!••#3 •#"#••#•$!•% &"'"•(#'•) •*+(,(- Random Forest )•+ 1•,31*•#• +(•1'•&#*'•) +,6 7+•-•!(!!6 '*78",90(!!6. 2!#(')",• *&#••",3!*•#• )•+•,(!• ••'•• 1*,3*'*•. !"#$%&'"($#)*#'+&,$&-$".$/01,2*#'+&3).)+4&–&56754&–&84&769&12:4&5&;<=> ?B •••• • •!"#"• •"•$%&' (&#•&)(• *•••+•", !-.!-/ )•+•", 01•%2•+3 45+657*"6•8• (!" 9-)%!"•(&!" •56-9-•• 1 (5:*"2•3 ;%5•5•• 9-)%!"•(&!" •5*-75($ 9& (&•&*&.•#/ •", • ,5!5%(-!"•1•($ 6•5•<•- !&•<•=-••> 5(&/ <•6 1 <&*-%1*•3 ?-)%!"•(&! D@DrAB &:#")*••($/ )> •5 9&•&<&.&• <5(!"2• #5)(%" 6•9)(5•$@&:,•9 CD@EFG =& • )"<-(!"#•&• <5(!"2-• H ×H C9- H – %•*$%•)($ 5(&<•6 1 <&*-%1*•FG •-9•5.&•5*$•"<" -*-/ <-•(5<" >%&' • 6•9•&8-••> 9&67"• •5+%&!&(8&.& 9& •5+9&68&.& 8*>,1 <•7 :19$/>%&• •5!&• 6-!/ 8"•3 ;&•5 6"••5#5•($)> >% 9- dij(5 I ij – (&•&*&.•#•5 (5 &:,•9•5 6•9)(5•• <•7 6-!8"•5<" J i (5 Jj 6•9•&6•9•&3 D@DrAB >6*>• )&/ :&• )1<1 !>9%•6 <5(!"2• D@EG =& 6•9•&6•95•($ 6-!8"•5< B/#*-••&.& 2"%*1G • 6•9&:!575• *&/ %5*$•- .-&<-(!"#•- &(&#-••> B/#*-••", 2"%*•63 ?-)%!"•(&! KLMvN • 9!1."< •5+6"="< 6*5)•"< ••5#-••>< <5(!"2• O1!9-•5G •657-•&' 5(&<•"<" <5)5<"3 P5(!"2> O1!9-•5 ;G 6 )6&• #-!.1G 6"••5/ #5•($)> •5)(1••"< #"•&<Q 9•5.&•5*$•• -*-<-•(" ; && • 5(&<•"<" •&<-!5<" 6•9•&6•9•", 5(&<•6G •-/ 9•5.&•5*$•• -*-<-•(" ; &jG =& ,5!5%(-!"•1•($ 965 •6’>•5•• 5(&<" i' (5 jG • !•6•"<" 1<&6•&<1 •&!>9/ %1 •6’>•%1G =& )(5•&6"($ AGRG AGNG AGS (5 AGRB 9*> &9"•5!•&.&G •&96•+•&.&G •&(!•+•&.& (5 5!&<5("#/ •&.& •6’>•%1 6•9•&6•9•&T -*-<-•(" <5(!"2•G =& 6•9/ •&6•95•($ %••2-6"< •6’>•%5<G •:•*$81•($)> •5 AGART 1)• ••8• -*-<-•(" <5(!"2•G =& 6•9•&6•95•($ •-•6’>•5•"< 5(&<5<G !•6•• AGAAR3 VLUR &:#")*•/ •($)> >% )1<5 %&-0•2•••(•6 6*5)•&.& 6-%(&!5 <5(/ !"2• )1<•7•&)(•G 5)&2•+&65•&.& • •5+:•*$8 6•9’•</ •"< 6*5)•"< ••5#-••><3 P5(!"2> )1<•7•&)(• >6/ *>• )&:&• %659!5(•1 <5(!"2•G •-9•5.&•5*$•• -*-/ <-•(" >%&' !•6•• &9"•"2•G >%=& <•7 6•9•&6•9•&• •5!&• 5(&<•6 •)•1• •6’>•&%G 6 ••8&<1 7 6"•59%1 -*-<-•(" !•6•• •1*•3 45 6•9<••1 6•9 D@DrAB 2• &:"965 9-)%!"•(&!" &•")1•($ .-&<-(!•• <&*-/ %1*" 6 2•*&<1 • •5)(&)&61•($)> >% <•!" :*"•$%&/ )(• (&•&*&.•#•", )(!1%(1! !•••", <&*-%1* [RW]3 ?*> •*•)(!52•' •6’>•%1 95•", 9-)%!"•(&!•6 •• •595#-• %*5)"0•%52•' &:#")*-•& ', •!&(&("•" •5 •5)(1••"< 5*.&!"(<&<3 45 &)•&6• <5(!"2• •&/ •5!•", :*"•$%&)(-+ <•7 )•&*1%5<" 1 <&9-*• C&:/ #")*-•&' •5 5*.&!"(<&<G •56-9-•"< 1 (-,••#••+ 9&%1<-•(52•' <-(&91 [RB]F 9*> %&7•&.& • %*5)•6 ••5+9-•& (5%1 )•&*1%1G =& <5• •5+:•*$8- #")*& •!-9)(56•"%•6 )6&.& %*5)1 )-!-9 k •5+:*"7#", )1)•9•63 ;!5,&61•#" )"*$•1 5)"<-(!•• 1 !&•<•/ !5, %*5)•6G k 6)(5•&6*•656)> 9*> %&7•&.& • %*5/ )•6 &%!-<& • 9&!•6••656 •&*&6"•••+ %•*$%&)(• )•&*1% 1 %*5)•3 X-!-9 2", k )•&*1% 9*> %&7•&.& 9-)%!"•(&!5 &:#")*•65*5)$ <-9•5•5G 6-!,••+ (5 •"7••+ %65!("*•3 Y5%"< #"•&<G &(!"<5•5 <-9•5/ •5 • •!&(&("•&< %*5)1G 5 %65!("*• 95•($ &2••%1 +&.& )(5:•*$•&)(•3 Z• ,5!5%(-!")("%" :1*" )(5•/ 95!("•&65•• 8*>,&< 6•9••<5••> <•••<1<1 ••5#-•$ 9-)%!"•(&!•6 (5 •5)(1••&.& 9•*-••> •5 !•••"2• <•7 <5%)"<5*$•"<" (5 <•••<5*$•"<" ••5#-••>/ <"3 \&!•6•>*$•"+ 5•5*•• •!&(&("••6 C!")3 WF 95• •<&.1 &,5!5%(-!"•165(" 6%*59 •56-9-•", 9-)%!"•/ (&!•6 1 •!"+•>((> !•8-••> =&9& 6•9•-)-••> )•&/ *1%" 9& (&.& #" ••8&.& %*5)13 ;•9)1(••)($ •-!-("•1 .!5•"2$ ••(-!%65!("*$/ •", •!&<•7%•6 !•••", %*5)•6 )6•9#"($ •!& 9&)(5(/ •• !&•9•*$•1 •95(••)($ 6":!5•", <&*-%1*>!•", 9-)%!"•(&!•63 ^!•< (&.&G 6")&%• ••5#-••> D@DrAB 5%("6•", )•&*1% )6•9#5($ •!& 9->%• &)&:*"6&)(• !"#$%&' !"#$%&'%()"'*+*#,-./!"012!"#32,-)*# Random Forests 4-./!"012! 5%()"'*.16 7%.1/%#'%()"'2.1* D8Dr9:#±*$,-/.#'*,.1%$*82;<2,=#>"/)*'#:?@2#02!A,/= 9B99CE FGBC:H IJKvG#±#,!=@-#$%&'"L-#')%.$-#M$%N-$$A#3%1!">*#O=!,-$%B# M'%(-$2P#%123$"3"#3%.%3" 9B99:G EBC:H VJQF#±#.=3%#/2-R*>*S$1*'#')%.$2@2#'-/12!%#3%1!">*#.=3*($2.1*B# %.2>*&2'%$2@2#M#$%&3-$+"3#')%.$"3#M$%N-$$A3 9B99T9 UBW9H •••. 6. •••!•!•"• #$%•&' %#!•'(•) !% (*%#!•'(•) •"•$+#. ,(!*•'%$• -&/ '&0"•'&0(•-• #'%•!•$1-• "•2(%3*(• •&••- #•$4•••-. C_F !"#$%&'"($#)*#'+&,$&-$".$/01,2*#'+&3).)+4&–&56754&–&84&769&12:4&5&;<=> ?= ••••••• !"#$•%&',"(•"•)*•+"$•-.•./0.1"/$%./" 0• 2&/)003"••#•&"•)'•/.4"'% •.05"6•'•••),"0)7 3/0 #•+"8•' %+'•4"$’3•.9%•00.4":.'% /"•)"-2 %+7 ;•003"/ 8#•)0 "• <":.'%)•."&"••%•'&% "$ 8/.7 (&*•+" ••/ •0 #•+"•0'•:.••••'#.90•!"8 !," "0)7 /$)'."–"0)3/0 #•+"•80•••"$’3•.9%•00•••":.'%&," ••-•);•/)0•••"/"2•-$•#•••80 1"2%.-+'•#• "/ 8" 0;.4":.'% /,"-0.<&=";)0#."(•8•")'•./0•#• 5" >)"•.#5"?"•••.•)0.1"/.#0•/•'"$•• %*#•••/)0•" 0)"$••8#•)/0.')4"• -0.4"'%)# /5 @.( "-0)9•003"BEHvA"8%3")'•./0.4"#$•%&'" #/ 89)•+,"(•"-2 %+;•003"' %+'•#• "••••••)••• /," $•8/ 10.4"•)")•••)•.90.4"-/’3-' /"$ 8/.(&*•+" ••/ •0 #•+"$••3/&"$•••.$&4%.00•!")'•./0•#• 5" C"••1"<•"9)#"D)'•,"(•"8%3"'%)#.D '): !"•2•)0•" #)••" >?@AB"0)1/.(•"/%)#0•"-0)9•003"•)••.: " F&•8•0),"-/)<•0•!")•••0.•."•)#)•.,"#/ 89.•+" $••"2)<)0&"$•.#&•0 #•+"«/)<'•••»"••••••)••7 •)"G0)19)#• ;•"•)%•••0&I5">••24 80•"/ 8-0)9.7 •.,"(•"$•.••8)"«/)<'•••»"••••••)•••)"G)•••0)" •••. 7 . ••••!"#• c$%!&• ' (••%••) *" +•',••) -+#/••")• (-#•*"+-0%12%#& 3••!-( 546% $%•8#•&. •••. 9. ••••!"#• c$%!&• ' (••%••) *" +•',••) #•&6•) +":(•;•) (!"•+•) '+"</++8) )"*••3- =&•#/+"> '("?/+%@ "*%)+•)• )"•")•. •••. A. ••••!"#• c$%!&• ' (••%•%B *" +•',•%B •&)%B •%/C-3-D+*-( (!"•+%6% (/•*%•" )"*••3- •&)-?+%•*-> "•%3-:%("+%6% ' +":)/+E•) (!"•+•) '+"</++8). !"#$%&'"($#)*#'+&,$&-$".$/01,2*#'+&3).)+4&–&56754&–&84&769&12:4&5&;<=> ?C ••••) • ••!•"#$!%&, %•'(#*'$ +%#* -••'+$./%0 +• BEHv1 2.•+3• ••4!$5• !#•••• 6••7•••8), •• 8'$4 9•4 :•/•+%•/%• 7$•$/* !.#$!, .+$ '#••$0 ;('•9(< ••6••7••= >/+$•••$4 !$••%!%' .+%(#&0 •/+%!••% .+$'#•-••$ •• +$•= ?= @••'+$./%+ VEA1 .•!•$• 7$•%• 6•#•"$/* !(- ••8!•%•/( /• :•%••/+$7•%:% %/%7•••8 C •%0 #•'C#( /•+•(••#*•$D :+C.= F•', 6G(#*3•••8 '(#*0 '%•/( •/%••$D :+C., 5% 6!’86••( #$3• 6 %-•$• •/%•%•0•C•(-%•, 6G(#*3•••8 !(-•/••( 9$D :+C. -% 9••/+C •%#•'C#$ /• -% !•+3$• !$•%'%:% •/C0 .••8 26!’86%' 6 /+*%••07%/$+•• •C•(-••$) .+$0 6!%-8/* -% 6•••3•••8 9*%:% -••'+$./%+•, 5%, ! •!%& 7•+:C, ••:•/$!•% !.#$!•• •• 3••• .+%8!C •'/$!•%•/( 2+$•= I)= •••••• • 1= J+%!•-••% G•:•/%;•'/%+•$4 #(•(4•$4 +•0 :+••(4•$4 •••#(6, 8'$4 .%'•6•! •••%"#$!(•/* /%70 •%:% %.$•C .+%/$.CD#$••%< •'/$!•%•/( #(•(4•%& ;C•'9(•& !(- %G7$•#••$D -••'+$./%+(!, %-••' .•0 +•-G•7$! •;•'/$!•(•/* '#••$;('•9(4•%:% •%-•0 #&!•••8= K= L• -%.%•%:%& •#:%+$/•C Random'Forest .%0 GC-%!••% '#••$;('•9(4•C •%-•#*, 6-•/•C .•+•-0 G•7•/$ ••8!•(•/* 7$ !(-•C/•(•/* .+%/$.CD#$••%< •'/$!•%•/( -#8 •%!$D •.%#C' 6 ••/%& •••/C.•%:% •.+8•%!••%:% •$•/•6C +•7%!$•, 5% !%#%-(&/* !$0 +•6•%& .+%/$+•'%!%& -(•&= J+%:•%•/$7•• 6-•/0 •(•/* •%-•#( .(-/!•+-"••• •/•/$•/$7•$•$ '+$0 /•+(8•$, %/+$•••$•$ ! .+%9••( << •/!%+•••8 /• .+$ .+%:•%6( /••/%!%< !$G(+'$= M= L-(4••••% •••#(6 !'#•-(! -••'+$./%+(! C .+$4•8//8 +(3•••8, !$6••7••% ••4G(#*3 !•"#$!( 6 •$D -#8 6-(4•••••8 '#••$;('•9(<, +%6'+$/% <D ;(0 6$'%0D(•(7•$4 6•(•/ /• .+%(#&•/+%!••% 6!’86%' !$G+••$D -••'+$./%+(! 6( 6-•/•(•/& -% (•:(GC0 !•••8 +%•/C %•'%'#(/$•= !"#$%&#'%& BD' H&7</5$%(65.9'IDJD?'K<(.5'LDID'4-O&)+$!&,$/.D'T&7&>?'U&+&$!$=&#/)',&>?'0<1(0<5*.%.D'–'V&//.W>:'X$%)' 5/.=)?'YZZ4D'–'BZ['(D YD' \esyk'RD]D?'^imenkovsky']DSD?'_aminsky'`DqD'et'alD'xx']iopolymers'and'CellD'–'YZBBD'–'qolD'Yz?'{YD'–'LD'BZz-BBzD |D' })%1.!"5'~D€D?'K<(.5'LDID?'•)*&9#25'VDJD?'‚ƒ2„)5'•D~D'xx'…‚†TD'–'YZZ[D'–'OD'4?'%.0D'B'‡B|ˆD'–'JD'4Y-4zD 4D' ‰avrylyuk'`D?'Mosula'\D?'^imenkovsky']D'et'alD'xx'EurD'ŠD'MedD'ChemD'–'YZBZD'–'qolD'4‹D'–'PD'‹ZBY-YBD' ‹D' ‰avrylyuk'̀ D?'̂ imenkovsky']D?'qasylenko'ŒD'et'alD'xx'EurD'ŠD'MedD'ChemD'–'YZZ•D'–'qolD'44?'{4D'–'LD'B|•[-B4Z4D [D' _aminsky'`D?'^imenkovsky']D?'\esyk'RD'xx'EurD'ŠD'MedD'ChemD'–'YZZ•D'–'qolD'44D'–'PD'|[Yz-|[|[D zD' )7&/(65.9'~DVD?'L$7)/'‚D•D?'Ž*)7)/"5'~DVD?'K<(.5'LDID'xx'…‚†TD'–'YZZ[D'–'OD'4?'%.0D'B'‡B|ˆD'–'JD'4B-4•D •D' })%1.!"5'~D€D?'H&7</5$%(65.9'IDJD?'~1)0)5'•DVD'*)'&/D'xx'†)17)WD'821/D'–'YZZ•D'–'{[D'–'JD'[•-z‹D' •D' •$(2!)'KD•D?'H&7</5$%(65.9'IDJD?'‚=21W$%'VDVD'*)'&/D'xx'†)17)WD'821/D'–'YZBZD'–'{YD'–'JD'zz-•|D' BZD' H&7</5$%(65.9'IDJD?'~<%&/>5'‚DOD?'})%1.!"5'~D€D?'K<(.5'LDID'xx'…‚†TD'–'YZBBD'–'OD'•?'%.0D'|'‡|‹ˆD'–'JD'[4-zBD BBD' `raper'NDRD?'Smith'‰D'Applied Regression AnalysisD'–'‰oboken?'NŠ:'‘iley-“ntersciD?'B•••D'–'PD'|Zz-|BYD BYD' ”etko'“DqD?'Gasteiger'ŠD?'”odeschini'RD'et'alD'xx'ŠD'ComputD'AidD'MolD'`esD'–'YZZ‹D'–'qolD'B•D'–'LD'4‹|-4[|D B|D' ‰algren'”DAD'xx'ŠD'CompD'ChemD'–'B••[D'–'qolD'Bz'‡‹-[ˆD'–'PD'4•Z-‹B•D B4D' ]reiman'\D'xx'Machine'\earningD'–'YZZBD'–'qolD'4‹'‡BˆD'–'PD'‹-|YD B‹D' ‚U&W&9/)'(*$1&/5)')%*$1)')!=$1.*72' «Random Forests». http:xxwwwDstatDberkeleyDedux•breimanx RandomForestsxcc—homeDhtm B[D' ”odeschini'RD?'Consonni'qD'Molecular'`escriptors'for'ChemoinformaticsD'Second?'Revised'and'Enlarged'EdD' qolD'BD'–'‘einheim'‡Germanyˆ:'‘iley-qC‰?'YZZ•D'–'BY[‹'pD' N•-(43#• -% +•-•'9(< 11=11=KO11 +=
id nasplib_isofts_kiev_ua-123456789-42017
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 0533-1153
language Ukrainian
last_indexed 2025-12-07T15:28:35Z
publishDate 2012
publisher Інститут органічної хімії НАН України
record_format dspace
spelling Зіменковський, Б.С.
Девіняк, О.Т.
Лесик, Р.Б.
2013-03-06T15:52:24Z
2013-03-06T15:52:24Z
2012
Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання / Б.С. Зіменковський, О.Т. Девіняк, Р.Б. Лесик // Журнал органічної та фармацевтичної хімії. — 2012. — Т. 10, вип. 2(38). — С. 43-49. — Бібліогр.: 16 назв. — укр.
0533-1153
https://nasplib.isofts.kiev.ua/handle/123456789/42017
541.6:547.789:615.076
Проведено багатофакторний лінійний регресійний аналіз та класифікаційне моделювання (алгоритм Random Forest) протипухлинної активності похідних 4-тіазолідинонів з метою спрямованого синтезу сполук з протираковою дією. Прогностична здатність підтверджена статистичними показниками, отриманими в процесі створення моделі, та при прогнозі тестової вибірки. Здійснено аналіз вкладів дескрипторів у прийняття рішення, визначено найбільш важливі з них для проведення класифікації, розкрито їх фізико-хімічний зміст та проілюстровано зв'язок виділених молекулярних дескрипторів зі здатністю до інгібування росту онкоклітин.
Проведен многофакторный линейный регрессионный анализ и классификационное моделирование (алгоритм Random Forest) противоопухолевой активности производных 4-тиазолидинонов с целью целенаправленного синтеза соединений с противораковым действием. Прогностическая способность подтверждена статистическими показателями, полученными в процессе создания модели и при прогнозе тестовой выборки. Осуществлен анализ вкладов дескрипторов в принятие решения, определены наиболее важные из них для проведения классификации, раскрыто их физико-химическое значение и проиллюстрирована связь выделенных молекулярных дескрипторов со способностью к ингибированию роста онкоклеток.
In order to perform directed synthesis of antineoplastic compounds the multiple linear regression analysis and classifi cation modeling (by Random Forest algorithm) of 4-thiazolidinones as anticancer agents have been carried out. The predictive ability is confi rmed by the statistic data obtained during model developing and test sample predicting. Descriptors contribution in the decision making has been estimated, the most important descriptors for the classifi cation have been identifi ed and interpreted. The relationship between the molecular descriptors selected and cancer cells growth inhibition is given.
uk
Інститут органічної хімії НАН України
Журнал органічної та фармацевтичної хімії
Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання
Изучение взаимосвязи «структура – противоопухолевая активность» производных 4-тиазолидинонов методами регрессионного анализа и классификационного моделирования
The study of the «structure – anticancer activity» relationship of 4-thiazolidinones using regression analysis and classification modeling
Article
published earlier
spellingShingle Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання
Зіменковський, Б.С.
Девіняк, О.Т.
Лесик, Р.Б.
title Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання
title_alt Изучение взаимосвязи «структура – противоопухолевая активность» производных 4-тиазолидинонов методами регрессионного анализа и классификационного моделирования
The study of the «structure – anticancer activity» relationship of 4-thiazolidinones using regression analysis and classification modeling
title_full Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання
title_fullStr Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання
title_full_unstemmed Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання
title_short Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання
title_sort вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання
url https://nasplib.isofts.kiev.ua/handle/123456789/42017
work_keys_str_mv AT zímenkovsʹkiibs vivčennâvzaêmozvâzkustrukturaprotipuhlinnaaktivnístʹpohídnih4tíazolídinonívmetodamiregresíinogoanalízutaklasifíkacíinogomodelûvannâ
AT devínâkot vivčennâvzaêmozvâzkustrukturaprotipuhlinnaaktivnístʹpohídnih4tíazolídinonívmetodamiregresíinogoanalízutaklasifíkacíinogomodelûvannâ
AT lesikrb vivčennâvzaêmozvâzkustrukturaprotipuhlinnaaktivnístʹpohídnih4tíazolídinonívmetodamiregresíinogoanalízutaklasifíkacíinogomodelûvannâ
AT zímenkovsʹkiibs izučenievzaimosvâzistrukturaprotivoopuholevaâaktivnostʹproizvodnyh4tiazolidinonovmetodamiregressionnogoanalizaiklassifikacionnogomodelirovaniâ
AT devínâkot izučenievzaimosvâzistrukturaprotivoopuholevaâaktivnostʹproizvodnyh4tiazolidinonovmetodamiregressionnogoanalizaiklassifikacionnogomodelirovaniâ
AT lesikrb izučenievzaimosvâzistrukturaprotivoopuholevaâaktivnostʹproizvodnyh4tiazolidinonovmetodamiregressionnogoanalizaiklassifikacionnogomodelirovaniâ
AT zímenkovsʹkiibs thestudyofthestructureanticanceractivityrelationshipof4thiazolidinonesusingregressionanalysisandclassificationmodeling
AT devínâkot thestudyofthestructureanticanceractivityrelationshipof4thiazolidinonesusingregressionanalysisandclassificationmodeling
AT lesikrb thestudyofthestructureanticanceractivityrelationshipof4thiazolidinonesusingregressionanalysisandclassificationmodeling