Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання
Проведено багатофакторний лінійний регресійний аналіз та класифікаційне моделювання (алгоритм Random Forest) протипухлинної активності похідних 4-тіазолідинонів з метою спрямованого синтезу сполук з протираковою дією. Прогностична здатність підтверджена статистичними показниками, отриманими в процес...
Збережено в:
| Опубліковано в: : | Журнал органічної та фармацевтичної хімії |
|---|---|
| Дата: | 2012 |
| Автори: | , , |
| Формат: | Стаття |
| Мова: | Українська |
| Опубліковано: |
Інститут органічної хімії НАН України
2012
|
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/42017 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання / Б.С. Зіменковський, О.Т. Девіняк, Р.Б. Лесик // Журнал органічної та фармацевтичної хімії. — 2012. — Т. 10, вип. 2(38). — С. 43-49. — Бібліогр.: 16 назв. — укр. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859825507930996736 |
|---|---|
| author | Зіменковський, Б.С. Девіняк, О.Т. Лесик, Р.Б. |
| author_facet | Зіменковський, Б.С. Девіняк, О.Т. Лесик, Р.Б. |
| citation_txt | Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання / Б.С. Зіменковський, О.Т. Девіняк, Р.Б. Лесик // Журнал органічної та фармацевтичної хімії. — 2012. — Т. 10, вип. 2(38). — С. 43-49. — Бібліогр.: 16 назв. — укр. |
| collection | DSpace DC |
| container_title | Журнал органічної та фармацевтичної хімії |
| description | Проведено багатофакторний лінійний регресійний аналіз та класифікаційне моделювання (алгоритм Random Forest) протипухлинної активності похідних 4-тіазолідинонів з метою спрямованого синтезу сполук з протираковою дією. Прогностична здатність підтверджена статистичними показниками, отриманими в процесі створення моделі, та при прогнозі тестової вибірки. Здійснено аналіз вкладів дескрипторів у прийняття рішення, визначено найбільш важливі з них для проведення класифікації, розкрито їх фізико-хімічний зміст та проілюстровано зв'язок виділених молекулярних дескрипторів зі здатністю до інгібування росту онкоклітин.
Проведен многофакторный линейный регрессионный анализ и классификационное моделирование (алгоритм Random Forest) противоопухолевой активности производных 4-тиазолидинонов с целью целенаправленного синтеза соединений с противораковым действием. Прогностическая способность подтверждена статистическими показателями, полученными в процессе создания модели и при прогнозе тестовой выборки. Осуществлен анализ вкладов дескрипторов в принятие решения, определены наиболее важные из них для проведения классификации, раскрыто их физико-химическое значение и проиллюстрирована связь выделенных молекулярных дескрипторов со способностью к ингибированию роста онкоклеток.
In order to perform directed synthesis of antineoplastic compounds the multiple linear regression analysis and classifi cation modeling (by Random Forest algorithm) of 4-thiazolidinones as anticancer agents have been carried out. The predictive ability is confi rmed by the statistic data obtained during model developing and test sample predicting. Descriptors contribution in the decision making has been estimated, the most important descriptors for the classifi cation have been identifi ed and interpreted. The relationship between the molecular descriptors selected and cancer cells growth inhibition is given.
|
| first_indexed | 2025-12-07T15:28:35Z |
| format | Article |
| fulltext |
!"#$%&'"($#)*#'+&,$&-$".$/01,2*#'+&3).)+4&–&56754&–&84&769&12:4&5&;<=>
?<
••• 541.6:547.789:615.076
! "#$$%& '()*+' ’%',-&«./0-,/-0(&–&10+/!1-23!$$(&
(,/! $4./5»&1+246$!2&78/4('+346!$+$4 &*#/+6(*!&
0#90#.4:$+9+&($(34'-&/(&,3(.!;4,(<4:$+9+&
*+6#3= ($$%
!.".#$%&'()*+,(-/2 3.;.•&*$'<(=2 >.!.?&+-(
?,*$*+,(-/ '@A$)'@B,'-/ %&C-D'-/ E'$*&F+-G&G $%. •@'-B@ H@B-A,()I)
790102 %. ?,*$*2 *EB. J&(@F+,(@2 69. KLmail: dr_r_lesykMorg.lviv.net
= •&FN@*'-/ *-O-/ '@*D@B,'-/ P@(B@C «•NI)F)C+,(-/ '@A$)'@B,'-/ E'$*&F+-G&G»
!"#$%&'(!$%):'4-*&)+$!&,./$/.;'01$*.023!.//)')5*.%/&(*6;'QSAR;'7/$8.//)'!&/&9/)'1<=1<(&>?'
0$51$5$%)'1<=1<(&>;')!=$1.*7;'Random'Forest
!"#$%$&"'()*)+",)-+"!&./'01&1/&./'!$*!$21/&./')&)013'+)'-0)2.,1-)41/&$'5"%$067
#)&&8'9)0*"!.+5'Random'Forest:';!"+.;<=0.&&">')-+.#&"2+1';"=1%&.='?7+1)3"01%.&"7
&1#'3'5$+"6'2;!85"#)&"*"'2.&+$3<'2;"0<-'3';!"+.!)-"#"6'%1@6A' !"*&"2+.B&)'3%)+7
&12+C';1%+#$!%D$&)'2+)+.2+.B&.5.';"-)3&.-)5.E'"+!.5)&.5.'#';!"4$21'2+#"!$&&8'
5"%$01E'+)';!.';!"*&"31'+$2+"#">'#.(1!-.A'G%1/2&$&" ')&)013'#-0)%1#'%$2-!.;+"!1#'<'
;!./&8++8'!1H$&&8E'#.3&)B$&"'&)/(10CH'#)D0.#1'3'&.='%08';!"#$%$&&8'-0)2.,1-)41>E'
!"3-!.+"'>=',13.-"7=151B&./'3512+'+)';!"1062+!"#)&" '3#’83"-'#.%10$&.='5"0$-<08!7
&.='%$2-!.;+"!1#'31'3%)+&12+6'%"'1&*1(<#)&&8'!"2+<'"&-"-01+.&A'
TIJ'STUKY'OF'TIJ'«STRULTURJ'–'MNTPLMNLJR'MLTPVPTY»'RJQMTPONSIPW'OF'?7TIPMZO7
QPKPNONJS'USPNX'RJXRJSSPON'MNMQYSPS'MNK'LQMSSPFPLMTPON'[OKJQPNX
\ASAZimenkovskyE']A^AKevinyakE'RA\AQesyk
Pn'order'to'perform'directed'synthesis'of'antineoplastic'compounds'the'multiple'linear'regres7
sion'analysis'and'classi_'cation'modeling'9by'Random'Forest'algorithm:'of'?7thiazolidinones'
as'anticancer'agents'have'been'carried'outA'The'predictive'ability'is'con_'rmed'by'the'statistic'
data'obtained'during'model'developing'and'test'sample'predictingA'Kescriptors'contribution'
in'the'decision'making'has'been'estimatedE'the'most'important'descriptors'for'the'classi_'ca7
tion'have'been'identi_'ed'and'interpretedA'The'relationship'between'the'molecular'descriptors'
selected'and'cancer'cells'growth'inhibition'is'givenA
`Gjqx{`x'|G}`~]€|•G`'«€^‚jƒ^j‚}'–' ‚]^`|]] j„]…x|}•'}ƒ^`|{]€^†»' ‚]7
`G|]‡{ˆ„'?7^`}G]…`‡`{]{]|'~x^]‡}~`'‚x‰‚x€€`]{{]‰]'}{}…`G}'`'ƒ…}€€`7
Š`ƒ}‹`]{{]‰]'~]‡x…`‚]|}{`•
ŒA€AG.5$&-"#2-./E']A^A‡$#.&8-E'‚AŒA…$2•-
!"#$%$&'5&"*",)-+"!&•/'0.&$/&•/' !$*!$22."&&•/')&)0 .3' .' -0)22.,.-)4."&&"$'
5"%$0.!"#)&.$'9)0*"!.+5'Random'Forest:';!"+.#"";<="0$#"/')-+.#&"2+.';!".3#"7
%&•='?7+.)3"0.%.&"&"#'2'4$0C6'4$0$&);!)#0$&&"*"'2.&+$3)'2"$%.&$&./'2';!"+.#"7
!)-"#•5'%$/2+#.$5A' !"*&"2+.B$2-)8'2;"2"(&"2+C';"%+#$!D%$&)'2+)+.2+.B$2-.7
5.';"-)3)+$085.E';"0<B$&&•5.'#';!"4$22$'2"3%)&.8'5"%$0.'.';!.';!"*&"3$'+$2+"#"/'
#•("!-.A']2<Ž$2+#0$&')&)0.3'#-0)%"#'%$2-!.;+"!"#'#';!.&8+.$'!$H$&.8E'";!$%$0$7
&•'&).("0$$'#)D&•$'.3'&.='%08';!"#$%$&.8'-0)22.,.-)4..E'!)2-!•+"'.=',.3.-"7=.7
5.B$2-"$'3&)B$&.$'.';!".0062+!.!"#)&)'2#83C'#•%$0$&&•='5"0$-<08!&•='%$2-!.;7
+"!"#'2"'2;"2"(&"2+C6'-'.&*.(.!"#)&.6'!"2+)'"&-"-0$+"-A'
J)QE( RF)G-RESB-''-S P@+)T$* +&F&C R)S$CL
'-S 4LG$@P)B$C-')'$* U )C'-% P R&F+R&(G-*'-S
'@RF<%($* '@E()*-S C)+B$CN&', E S$%$V B$(@F+,L
(-S P@+)T$* [1L6]. W-()F-+G@''< P A$UX %&G)X
P@+)T$* %@G&%@G-D')I) %)C&BX*@''< G@ in'silico'
+(F-'$'IE E+R$Q') +&T& P@F&()%&'CE*@B) )GF-L
%@'-%- F&PEB,G@G@%- [7L9]. 3T’U(G)% '@Q)I) C)L
+B$CN&''< U T$TB$)G&(@ R)S$C'-S 4L@P)B$C)'$* G@
+R)F$C'&'-S I&G&F)A-(B$D'-S +R)BE(2 +-'G&P)L
*@'-S '@ (@Y&CF$ Y@F%@A&*G-D')V2 )FI@'$D')V $
T$))FI@'$D')V S$%$V ?Z\• $%. •@'-B@ H@B-A,()I)2
<(@ +&F&C 5000 +R)BE( %$+G-G, 1076 R)S$C'-S
^40` P RF)G-RESB-'')X @(G-*'$+GX F$P')I) F$*L
'<b2 RF)G&+G)*@'-S * Z@A$)'@B,')%E $'+G-GEG$ F@L
(E "cf ^hjpb [12 `]. J)R&F&C',) '@%- TEB) PC$/L
+'&') (B@+-Y$(@A$X 4LG$@P)B$C-')'$* P@ %&S@'$PL
%@%- RF)G-RESB-'')V @(G-*')+G$ G@ *-<*B&')
q (B@+- ^f2 ! $ Wb @(G-*'-S +R)BE( [10]. ;@()N
+Y)F%)*@') GF- %@+-*- F&D)*-' CB< C)+B$CN&'L
'< G@ *+G@')*B&')2 O) +R)BE(-2 RF- C$V <(-S +&L
F&C'$/ *$C+)G)( F)+GE F@()*-S (B$G-' ^uwb +(B@L
C@U x86z2 +B$C *-P'@D-G- <( '&@(G-*'$. • P@RF)R)L
!"#$%&'"($#)*#'+&,$&-$".$/01,2*#'+&3).)+4&–&56754&–&84&769&12:4&5&;<=>
??
••••••• !"•""• #$•%••&'•• %•!(•%&'••) *•’)*+,
-•& !"$,+",$•. "• /••(•0•1••. •+"2•••!". ••3
•'%'•24 •25' +(•!•• *• %•#•-•0•. /•0•"•6•+3
"•$••0• (••••••0• $'0$'!••••0• •••(•*, "• +(•!23
6•+•7•8 * •2+•$2!"•••)- -'"•%, Random'Forests9
1. ••••••••!••"#$% &'#'%#$%
"(•"()'%#$% •#•&'*
:•0•"•6•+"•$•2• (•••••2• $'0$'!•••2• •••3
(•* #•()0•; , !"••$'••• -•"'-•"21••8 -•%'(• *•’)*3
+, -•& *•('&••. *-••••. <•+"2•••!".= "• (••••••.
+•-/•••7•;. •'*•('&•24 *-•••24 <%'!+$2#"•$••=9
>'"•. "•+•0• •••(•*, ; •2*••1'••) !",#'•) %'3
"'$-•••••••!"• *•’)*+, "• ••'!+•• •+$'-24 •'3
*•('&•24 *-•••24 , ••$••7•. *•('&••8? • "•+•&
#'$'%/•1'••) *••1'••) •+"2•••!"• !#•(,+2 *•
%•#•-•0•. 88 -•('+,()$•24 %'!+$2#"•$••9 !-
"#$%&'($%)*+,%)(*.%",!/0)12)3(&(4(5(6)&$(5$24%
E-Dragon)7>89::)3!"#$%&'($0;<)[8=])&0",?)&(&!$!3/@(A)
(&'%4012B0A)5!(4!'$0A)4(,!#+,)+)"%,(;(4+)&(,0)MMFF@A
[BC]9 D •%'$&•••-, #'$•2•••-, -•!2•• *%••!•.3
•••!) #•E,+ #•-2(•+ •/12!('••) * ••!",#•2-
•2%•('••)- ••%#•••%••0• $)%+• 12 !"••#7)? +'3
$,.12!G #$2•72#•- -•••-•*•7•8 •"$•1'••8 ••6•$3
-•7•89 H$•- "•0•? •2%•('•• +••!"••"•• "• #•#•$3
•• +•$'(G••••• <| r|IJ?@K= %'!+$2#"•$29 L•/,%•3
•• $'0$'!••••8 6,•+7•8 *%••!•.••(•!G *• %•#•-•3
0•. -'"•%, #•+$•+•••8 $'0$'!•8 [BB]9
N•+2- 12••- •%'$&••• 6,•+7•. %() -•!2•, OP
GP Q <C9RS±RK9JS=3<RB?CT±C9JC=U’VWW’X
X<CC9TA±T9CB=U’YJu’3<B@9RK±C9ZT=U’reactive’ <B=
rRQBR9@? WM\^QBA9RJ? FQRR9BC? pQR9RUBJ3BC
_2*G+• "•1••!"G -•%'(• •*••1•; !(•/+, (••••3
•, *•('&••!"G •+"2•••!"• •••(•*••••24 !#•(,+ ••%
/,%G3)+•8 +•-/•••7•8 •* •/12!('•24 %'!+$2#"•$••9
L$2 #$•'+",••••• '+!#'$2-'•"•(G•24 $'*,(G"•3
"•• •• ••!G $•*$•4••••24 <$2!9 B= •"$2-••• `\VW3
-•%'(G •2%•(); 0$,#,? 5• -•!"2"G S •+"2••24 "•
BJ •'•+"2••24 !#•(,+9 N•/"• *•!"•!,••••) 7•;8 -•3
%'(• %•; E••! %'5• -'•E2•? ••& SPBJ <#•42/+•
#'$'%/•1'••) #••2••• /,"2 /•(GE•. *• #•42/3
+, $'0$'!•8= *%••!•2"2 !2•"'* •+"2•••8 !#•(,+2
+(•!, O? 5• #$2/(2*•• • BJ $•*•• +$•5' *• *%••3
!•'••) •2#•%+•••0• !2•"'*, <RTPARZ=9
b'0$'!•••• 6,•+7•) %() -•!2•, : -•; ••!",#3
•2• •20()%P
GP Q <BJK9CB±B9AK=3<BJ9AB±R9CC=U’nWQ
Qdt’3<BB9RZ±R9CZ=U’ndQ
Qf3fg’3<J9JRZ±J9JJZ=U’V\VX’
rRQBR9Z? WM\^QBA9KB? FQRJ9AS? pQR9JUBJ3BR
h••• 6,•+7•) •2•+$'-(.; 0$,#,? • )+•• C •+3
"2••• "• C •'•+"2••• !#•(,+2 <$2!9 R=9 j••! +•3
$'+"••0• #'$'%/•1'••) ; %'5• -'•E2- *• BPB9
b'0$'!•••• 6,•+7•) %() -•!2•, D ; ••!",#••.P
GP Q <BJR9TZ±B9JJ=X<J9JAK±
±J9JJ@=U ‘k<l99\=’3<BC9KZ±C9J@=U ‘nVrdl\W’3
3<J9J@B±J9JBK=U’m^l^oq\VXB’
rRQBA9J? WM\^QT9BB? FQRC9RR? pQZ9JUBJ3BA
_••'%'•• 6,•+7•) •2•+$'-(.; 0$,#,? • )+••
R •+"2••• "• S •'•+"2••24 !#•(,+ <$2!9 C=9 j••!
+•$'+"••0• #'$'%/•1'••) %'5• -'•E' *• RPS9
s•%•• *• !"••$'•24 `\VW3-•%'('• •' *•%•3
••(G•); *•0•(G••#$2••)"24 +$2"'$•8• "•1••!"•?
4•1• *••1'••) +$2"'$•. w•E'$• < F= #'$'/,••."G
•• *•%•••(G••-, $••••9 x' *,-••('•• ••)•••!".
•'•+"2••24 !#•(,+ •* *••1'••)-2 %'!+$2#"•$••?
%,&' /(2*G+2-2 %• %'!+$2#"•$•• •+"2••24 -•3
('+,(9 D••!(•%•+ 7G•0• !#•!"'$•0•;"G!) '6'+" «••3
&'()»? "•/"• *-'•E'••) #•42/+2 -•%'(• %() •+3
"2••24 !#•(,+ •%••1•!•• #•%•25,; #•42/+, ••3
/(2&'•24 %• •24 •'•+"2••249 y •0()%, •• "'? 5•
•%'$&••• -•%'(• #$•)•()."G "'•%'•7•. %• #$•3
•••. 1. •••!"#$% !"•&!••'!()*+,(•- •!/0+,)*)$2
3+% '*••20 4 (* 2$•, •56••+!(•- /* 3•&•'•7•8 QSAR9'•3!+$.
•••. :. •••!"#$% !"•&!••'!()*+,(•- •!/0+,)*)$2
3+% '*••20 ; (* 2$•, •56••+!(•- /* 3•&•'•7•8 QSAR9'•3!+$.
<R=
<C=
!"#$%&'"($#)*#'+&,$&-$".$/01,2*#'+&3).)+4&–&56754&–&84&769&12:4&5&;<=>
?@
••••• •••!"#$%%& •'•#() *%+ +)•,-%" •+ %$+)•,-.
%"/ •+0"••1 ••2%••• -••+%•-#$%%& -"!•••)"- "%•".
3(-+%%& ••••(4 0•5%+ •••3,•, -,•%•-•)4 6• +!$.
)-+•%,7 •',• •-’&•)( 0"5 •••()•(••8 •+ +)•,-.
%"••8 0•5#,-,7 - •+0)+9 )#+•,:")+;"7%,9 0•.
!$#$7<
2. ••••••!"•#!$%& '()&•*+•%%,
-/(0•-13••%%(4 •"0•+%(•0! -(3!)%•3
0!•5(•!)•%(%1
=•,•%+2$%%&0 )#+•,:")+;"7%,9 0•!$#$7 > •••.
'"•%+-+%%& •+0••• :+)•( '••&-( 3"•#••"2%•? !"?
•'•#()+0,4 ••3•• •••!"#$%%& +)•,-%,9 •+ %$+).
•,-%,9 0•#$)(#< @#& ?9 ••-••$%%& 3(#• -,)••,.
••+%• 0$••! Random'Forest4 •+ !•'•0•••8 &)•••
•!"7•%8>•1•& '•3(!•-+ +%•+03#8 !$•$-+ •"A$%1
[BC]< D•"!%• • •$9%"2%•8 !•)(0$%•+;">8 0$••!(
%$•39"!%•••" ( '••-$!$%%" '$•$9•$•%•? -+#"!+;"?
2, -,!"#$%%& •)•$0•? •$•••-•? -,3"•), !#& -••+.
%•-#$%%& '•••%•••,2%•? •!+•%•••" 0•!$#" %$0+>4
••)"#1), )•5%$ !$•$-• 3(!(>•1•& "• -,)••,••+%.
%&0 -,'+!)•-•? -,3"•), "• •$%$•+#1%•? •()('%•.
••"4 •••,0+%•? •+ !•'•0•••8 •$9%"), 3(••••$'"%.
•( * bootstraping/< E!$•5+%" '•, ;1•0( -,0"•%,),
'•9,3), !#& •'•#()4 6• %$ --"7A#, - %+-2+#1%(
-,3"•)( * out-of-bag'compounds/4 > +!$)-+•%,0, "
%$('$•$!5$%,0, [BF]< G•!$#1 Random'Forest'0".
••,•1 •%+2%( )"#1)"••1 !$•$- •"A$%14 '•3(!•-+.
%,9 %+ •"•%,9 -,3"•)+9 "• -,)••,••+%%&0 -,.
'+!)•-,9 !$•)•,'•••%,9 '"!'••••••"- !#& :••.
0(-+%%& )•5%••• -(•#+ !$•$-+4 ••0( 3(!1.&)$ !$.
•$-• '••$%;"7%• •'••0•5%$ •9•',•, (•" %+&-%"
0$9+%"•0, +)•,-%•••" •+ '•!"#•0 ( •"•%,9 -(•#+9<
H•+9•-(82, %+-$!$%$4 3(#• '•,7%&•• •"A$%%&
6•!• ••-••$%%& >!,%•? 0•!$#" %+ ••%•-" -•"9 -".
!•0,9 •+ !•••('%,9 •$•(#1•+•"- •$••(-+%%& '••.
•,'(9#,%%•? !"? C.•"+••#"!,%•%"-< I+),0 2,%•04
%+-2+#1%+ -,3"•)+ 0"••,#+ JKC •'•#(),< L$•0$•.
•"& ;,9 •'•#() 3(#+ •'•,0"••-+%+ - •,#•-•0( '•.
#" MMNNOC [BP]4 + QBJRR !$•)•,'•••"- 3(#• •3.
2,•#$%• •+ !•'•0•••8 S.Tragon [BU]< =•0,#),
•32,•#$%%& !$•)•,'•••"- -,!+#&#,•1 •+),0 2,.
%•04 6•3 0"%"0"•(-+•, -••+2$%( "%:••0+;"8< V•"0
••••4 )•%••+%•%" •+ '•'+•%• )••$#1•-+%" *| r|QR4OF/
!$•)•,'•••, •+)•5 3(#, -,!+#$%" • 0+•,-( !+.
%,9< I+),0 2,%•04 •+#,A,#••1 KPO !$•)•,'•••"-
!#& •!"7•%$%%& 0•!$#8-+%%&< W+ ••%•-" •$•$!%1•.
•• -"!•••)+ ••••( •%)•)#"•,% XY Z \J^ &) 0$5"
0"5 )#+•+0, «+)•,-%,9» " «%$+)•,-%,9» •'•#()
•+ '+•+0$••"- +#•••,•0( '• •+0•-2(-+%%8 *FRR !$.
•$- •"A$%1 •+ 2,•#• !$•)•,'•••"- !#& •!"7•%$%%&
••••+#(5$%%& Z UK4 !$ Ndesc –
•••0"•%"••1 '••••••( !$•)•,'•••"-/ •:••0•-+%•
0•!$#1 Random'Forest "• ••+•,••,2%,0, '•)+•.
%,)+0,_ 2+••••+ '•0,#•) * Error'Rate/ Z BJ4JU^4
2(•#,-"••1 0•!$#" Z UU4\^4 •'$;,:"2%"••1 Z O\4BF^4
)••$#&;"7%,7 )•$:";">%• MCC'*Matthew’s'correla-
tion'coef@icient/ Z R4UKP<
`& 0•!$#1 ••+#+ -"!'•+-%,0 '(%)••0 !#& '•.
!+#1A•? '•$•+'%•? •'•,0"•+;"? '+•+0$••"- +#••.
•,•0(4 ••)•$0+4 • 0$••8 •%,5$%%& 2+••••, '•0,.
#•) •+ '"!-,6$%%& 2(•#,-•••" 0•!$#"< b'•2+•)(
!••#"!5(-+#,•1 •0"%, $:$)•,-%•••" 0•!$#" '•,
'$•$0"6$%%" 0$5" 0"5 )#+•+0, "• )••)•0 C^ '•,
:")••-+%•0( 2,•#" !$•)•,'•••"- !#& •!"7•%$%%&
••••+#(5$%%& Z UK •+ •0$%A$%"7 *• 0$••8 '"!.
-,6$%%& A-,!)•!"?/ )"#1)•••" !$•$- ( 0•!$#" !•
BRR< E!$•5+%" •$•(#1•+•, *•,•< C/ %$ !+8•1 •0•.
•, 2"•)• -,•%+2,•, 0$5(4 '•, &)"7 0•!$#1 9+•+).
•$•,•(>•1•& %+7)•+6,0, ••+•,••,2%,0, '•)+•.
%,)+0,4 •!%+) !••-•#,#, -,•%+2,•, "%•$•-+#,
•'•,0+#1%•••"< W+••('%,7 $•+' •'•,0"•+;"? '•.
#&•+- ( !••#"!5$%%" '•-$!"%), 0•!$#" '•, •0"%"
)"#1)•••" 0•#$)(#&•%,9 !$•)•,'•••"- *)••) BR
!$•)•,'•••"-/ !#& •!"7•%$%%& ••••+#(5$%%&4 '•,7.
0+82, &) 0$5( 0"5 )#+•+0, '••#"!•-%• (•" ;"#•.
2,•$#1%" •%+2$%%& "• •%+7!$%••• "%•$•-+#( •'•,.
0+#1%•••"< E••,0+%" •$•(#1•+•, '•)+•+#,4 6• )•+.
6" ••+•,••,2%" '+•+0$••, !••&•+8•1•& - ••0( -,.
'+!)(4 )•#, +)•,-%,0, --+5+8•1•& •'•#(), "•
XYcUR^< D+#$5%"••1 $:$)•,-%•••" 0•!$#" "• BRR
!$•$- •"A$%1 -"! )"#1)•••" !$•)•,'•••"- !#& •!"7•.
%$%%& ••••+#(5$%%& '•, :")••-+%"7 0$5" 0"5 )#+.
•+0, Z UR^ *•,•< F/< d •%+7!$%•0( "%•$•-+#" •'•,.
0+#1%•••" [BKR4 BOR] '••-•!,#••1 !•!+•)•-$ !•.
•#"!5$%%& $:$)•,-%•••" 0•!$#" •" •0"%•8 )"#1.
)•••" !$•)•,'•••"- %+ •!,%,;8< I+),0 2,%•04 3(.
#• -••+%•-#$%•4 6• 0•!$#1 !••&•+> %+7)•+6,9
'•)+•%,)"- '•, -,)••,••+%%" -,'+!)•-••• B\R.-,.
0"•%••• '"!'••••••( !$•)•,'•••"- !#& '•,7%&•.
•& •"A$%%& - )•5%•0( ••••+#(5$%%" !$•$-+< W+
•••+%%1•0( $•+'" •!"7•%8-+#+•1 •'•,0"•+;"& )"#1.
)•••" !$•$- ( 0•!$#" Random'Forest< =•, ;1•0(
•%+7!$%• !$)"#1)+ •"A$%1 !+%•? •+!+2"4 •!%$ • &),9
!••"-%8> BRR< H •$•(#1•+•" •!$•5+%• )"%;$-( •'.
•,0+#1%( 0•!$#1 '•, %+••('%,9 '+•+0$••+9_ 0$.
•••. 3. •••!"#$% !"•&!••'!()*+,(•- •!/0+,)*)$1
2+% '*••10 4 (* 1$•, •56••+!(•- /* 2•&•'•7•8 QSAR9'•2!+$.
!"#$%&'"($#)*#'+&,$&-$".$/01,2*#'+&3).)+4&–&56754&–&84&769&12:4&5&;<=>
?A
•• ••• •••!••" = 20%, •••#••!$# &'!•(")$*(•+ &•-
.&•/!1'11- (*.3••4•'11- = 580, •••#••!$# &'('+
(•6'1# = 5007 9$•$"!$":1• )*••.1"•" ;•<> •*&'?
•• 1•!$4)1•@ :•!$*$• )*•"•*• A Error'RateB = 2,0CC%,
:4$•"+•!$# •*&'•• = DE,00%, !)';"F•:1•!$# = GG,EH%,
•*('•-;•/1"/ •*'F•;•<1$ MCC'AMatthew’s'correla-
tion'coef@icientB = 0,E8H7 I•($* .•.1•:"$", J* .•+&-?
•" )(*+'&'1•/ *)$"••.•;•> 4 8 (•.•+ .•'16'1* :•?
!$*$4 )*•"•*•, 4 2,D (•." )•&+"J'1* :4$•"+•!$#
$• •*('•-;•/1"/ •*'F•;•<1$ MCC7
K •'$*L .*+1•61#*> +•••&•;•> •*&'•• 1• *!1*?
+• +•&•("$*> M•." &•1"N ('.4•#$•$•+ OPQ RTS M4•*
!F*(•*+•1* +"M•(•4 •. 52G !)*•4•, J* ••!$-$#
!$(4•$4(1"/ F(•3•'1$ H?$••.*••&"1*147 U•!$*$•
)*N"M•" •••!"F•••;•> •*&'•• )(" ;#*•4 !•••••
5,DD%7
V•!$4)1"• •(*•*• M4•* )(*+'&'11- •1•••?
.4 +•••&•+ &'!•(")$*(•+ 4 )("/1-$$- (•6'11-7
I•••"+•!$# •*•1*3* &'!•(")$*(• *M:"!•L+•••!#
-• !'('&1< .1•:'11- (•.1";• ••• +•&!*$•*• )(•?
+"•#1"N +•&)*+•&'/ i?3* &'('+• )(" 1'.••11*•4
!$•1• $• )(" +")•&•*+*•4 )'('••64+•11• ;#*3*
&'!•(")$*(•7 W'.4•#$•$" 1' +"-+"•" &'!•(")$*?
(•+ •. +"!*•"•" (•+1-•" +•••"+*!$•, $*M$* + &•?
1*•4 ••!"+• &'!•(")$*(•+ 1' •!14< 1'+'•"•*> •*•?
M•1•;•>, .&•$1*> (*.&••"$" ••$"+1• $• 1'••$"+1•
!)*•4•", • +•(1' (*.)•.1•+•11- .&•/!1L<$#!- .•
4:•!$L M•3•$#*N F••$*(•+7 X', +••!1', $••*• < *&?
•••. 4. •••!" •#"#••#•$!•% &"'"•(#'•) •*+(,(- Random Forest
&'• &('(••/(!!• •(0• ••0 1,"•"••. 2!#(')",• *&#••",3!*•#•
)•+•,(!• ••'•• 1*,3*'*•.
•••. 5. •",(0!••#3 •#"#••#•$!•% &"'"•(#'•) •*+(,(- Random Forest )•+ 1•,31*•#• +(•1'•&#*'•) +,6 7+•-•!(!!6 '*78",90(!!6.
2!#(')",• *&#••",3!*•#• )•+•,(!• ••'•• 1*,3*'*•.
!"#$%&'"($#)*#'+&,$&-$".$/01,2*#'+&3).)+4&–&56754&–&84&769&12:4&5&;<=>
?B
•••• • •!"#"• •"•$%&' (&#•&)(• *•••+•", !-.!-/
)•+•", 01•%2•+3 45+657*"6•8• (!" 9-)%!"•(&!"
•56-9-•• 1 (5:*"2•3
;%5•5•• 9-)%!"•(&!" •5*-75($ 9& (&•&*&.•#/
•", • ,5!5%(-!"•1•($ 6•5•<•- !&•<•=-••> 5(&/
<•6 1 <&*-%1*•3 ?-)%!"•(&! D@DrAB &:#")*••($/
)> •5 9&•&<&.&• <5(!"2• #5)(%" 6•9)(5•$@&:,•9
CD@EFG =& • )"<-(!"#•&• <5(!"2-• H ×H C9- H –
%•*$%•)($ 5(&<•6 1 <&*-%1*•FG •-9•5.&•5*$•"<" -*-/
<-•(5<" >%&' • 6•9•&8-••> 9&67"• •5+%&!&(8&.&
9& •5+9&68&.& 8*>,1 <•7 :19$/>%&• •5!&• 6-!/
8"•3 ;&•5 6"••5#5•($)> >%
9- dij(5 I ij – (&•&*&.•#•5 (5 &:,•9•5 6•9)(5•• <•7
6-!8"•5<" J i (5 Jj 6•9•&6•9•&3 D@DrAB >6*>• )&/
:&• )1<1 !>9%•6 <5(!"2• D@EG =& 6•9•&6•95•($
6-!8"•5< B/#*-••&.& 2"%*1G • 6•9&:!575• *&/
%5*$•- .-&<-(!"#•- &(&#-••> B/#*-••", 2"%*•63
?-)%!"•(&! KLMvN • 9!1."< •5+6"="< 6*5)•"<
••5#-••>< <5(!"2• O1!9-•5G •657-•&' 5(&<•"<"
<5)5<"3 P5(!"2> O1!9-•5 ;G 6 )6&• #-!.1G 6"••5/
#5•($)> •5)(1••"< #"•&<Q 9•5.&•5*$•• -*-<-•("
; && • 5(&<•"<" •&<-!5<" 6•9•&6•9•", 5(&<•6G •-/
9•5.&•5*$•• -*-<-•(" ; &jG =& ,5!5%(-!"•1•($ 965
•6’>•5•• 5(&<" i' (5 jG • !•6•"<" 1<&6•&<1 •&!>9/
%1 •6’>•%1G =& )(5•&6"($ AGRG AGNG AGS (5 AGRB 9*>
&9"•5!•&.&G •&96•+•&.&G •&(!•+•&.& (5 5!&<5("#/
•&.& •6’>•%1 6•9•&6•9•&T -*-<-•(" <5(!"2•G =& 6•9/
•&6•95•($ %••2-6"< •6’>•%5<G •:•*$81•($)> •5
AGART 1)• ••8• -*-<-•(" <5(!"2•G =& 6•9•&6•95•($
•-•6’>•5•"< 5(&<5<G !•6•• AGAAR3 VLUR &:#")*•/
•($)> >% )1<5 %&-0•2•••(•6 6*5)•&.& 6-%(&!5 <5(/
!"2• )1<•7•&)(•G 5)&2•+&65•&.& • •5+:•*$8 6•9’•</
•"< 6*5)•"< ••5#-••><3 P5(!"2> )1<•7•&)(• >6/
*>• )&:&• %659!5(•1 <5(!"2•G •-9•5.&•5*$•• -*-/
<-•(" >%&' !•6•• &9"•"2•G >%=& <•7 6•9•&6•9•&•
•5!&• 5(&<•6 •)•1• •6’>•&%G 6 ••8&<1 7 6"•59%1
-*-<-•(" !•6•• •1*•3 45 6•9<••1 6•9 D@DrAB 2•
&:"965 9-)%!"•(&!" &•")1•($ .-&<-(!•• <&*-/
%1*" 6 2•*&<1 • •5)(&)&61•($)> >% <•!" :*"•$%&/
)(• (&•&*&.•#•", )(!1%(1! !•••", <&*-%1* [RW]3
?*> •*•)(!52•' •6’>•%1 95•", 9-)%!"•(&!•6 ••
•595#-• %*5)"0•%52•' &:#")*-•& ', •!&(&("•" •5
•5)(1••"< 5*.&!"(<&<3 45 &)•&6• <5(!"2• •&/
•5!•", :*"•$%&)(-+ <•7 )•&*1%5<" 1 <&9-*• C&:/
#")*-•&' •5 5*.&!"(<&<G •56-9-•"< 1 (-,••#••+
9&%1<-•(52•' <-(&91 [RB]F 9*> %&7•&.& • %*5)•6
••5+9-•& (5%1 )•&*1%1G =& <5• •5+:•*$8- #")*&
•!-9)(56•"%•6 )6&.& %*5)1 )-!-9 k •5+:*"7#",
)1)•9•63 ;!5,&61•#" )"*$•1 5)"<-(!•• 1 !&•<•/
!5, %*5)•6G k 6)(5•&6*•656)> 9*> %&7•&.& • %*5/
)•6 &%!-<& • 9&!•6••656 •&*&6"•••+ %•*$%&)(•
)•&*1% 1 %*5)•3 X-!-9 2", k )•&*1% 9*> %&7•&.&
9-)%!"•(&!5 &:#")*•65*5)$ <-9•5•5G 6-!,••+ (5
•"7••+ %65!("*•3 Y5%"< #"•&<G &(!"<5•5 <-9•5/
•5 • •!&(&("•&< %*5)1G 5 %65!("*• 95•($ &2••%1
+&.& )(5:•*$•&)(•3 Z• ,5!5%(-!")("%" :1*" )(5•/
95!("•&65•• 8*>,&< 6•9••<5••> <•••<1<1 ••5#-•$
9-)%!"•(&!•6 (5 •5)(1••&.& 9•*-••> •5 !•••"2•
<•7 <5%)"<5*$•"<" (5 <•••<5*$•"<" ••5#-••>/
<"3 \&!•6•>*$•"+ 5•5*•• •!&(&("••6 C!")3 WF 95•
•<&.1 &,5!5%(-!"•165(" 6%*59 •56-9-•", 9-)%!"•/
(&!•6 1 •!"+•>((> !•8-••> =&9& 6•9•-)-••> )•&/
*1%" 9& (&.& #" ••8&.& %*5)13
;•9)1(••)($ •-!-("•1 .!5•"2$ ••(-!%65!("*$/
•", •!&<•7%•6 !•••", %*5)•6 )6•9#"($ •!& 9&)(5(/
•• !&•9•*$•1 •95(••)($ 6":!5•", <&*-%1*>!•",
9-)%!"•(&!•63 ^!•< (&.&G 6")&%• ••5#-••> D@DrAB
5%("6•", )•&*1% )6•9#5($ •!& 9->%• &)&:*"6&)(•
!"#$%&'
!"#$%&'%()"'*+*#,-./!"012!"#32,-)*# Random Forests
4-./!"012! 5%()"'*.16 7%.1/%#'%()"'2.1*
D8Dr9:#±*$,-/.#'*,.1%$*82;<2,=#>"/)*'#:?@2#02!A,/= 9B99CE FGBC:H
IJKvG#±#,!=@-#$%&'"L-#')%.$-#M$%N-$$A#3%1!">*#O=!,-$%B#
M'%(-$2P#%123$"3"#3%.%3" 9B99:G EBC:H
VJQF#±#.=3%#/2-R*>*S$1*'#')%.$2@2#'-/12!%#3%1!">*#.=3*($2.1*B#
%.2>*&2'%$2@2#M#$%&3-$+"3#')%.$"3#M$%N-$$A3 9B99T9 UBW9H
•••. 6. •••!•!•"• #$%•&' %#!•'(•) !% (*%#!•'(•) •"•$+#.
,(!*•'%$• -&/ '&0"•'&0(•-• #'%•!•$1-• "•2(%3*(• •&••-
#•$4•••-.
C_F
!"#$%&'"($#)*#'+&,$&-$".$/01,2*#'+&3).)+4&–&56754&–&84&769&12:4&5&;<=>
?=
••••••• !"#$•%&',"(•"•)*•+"$•-.•./0.1"/$%./"
0• 2&/)003"••#•&"•)'•/.4"'% •.05"6•'•••),"0)7
3/0 #•+"8•' %+'•4"$’3•.9%•00.4":.'% /"•)"-2 %+7
;•003"/ 8#•)0 "• <":.'%)•."&"••%•'&% "$ 8/.7
(&*•+" ••/ •0 #•+"•0'•:.••••'#.90•!"8 !," "0)7
/$)'."–"0)3/0 #•+"•80•••"$’3•.9%•00•••":.'%&,"
••-•);•/)0•••"/"2•-$•#•••80 1"2%.-+'•#• "/ 8"
0;.4":.'% /,"-0.<&=";)0#."(•8•")'•./0•#• 5"
>)"•.#5"?"•••.•)0.1"/.#0•/•'"$•• %*#•••/)0•"
0)"$••8#•)/0.')4"• -0.4"'%)# /5
@.( "-0)9•003"BEHvA"8%3")'•./0.4"#$•%&'"
#/ 89)•+,"(•"-2 %+;•003"' %+'•#• "••••••)••• /,"
$•8/ 10.4"•)")•••)•.90.4"-/’3-' /"$ 8/.(&*•+"
••/ •0 #•+"$••3/&"$•••.$&4%.00•!")'•./0•#• 5"
C"••1"<•"9)#"D)'•,"(•"8%3"'%)#.D '): !"•2•)0•"
#)••" >?@AB"0)1/.(•"/%)#0•"-0)9•003"•)••.: "
F&•8•0),"-/)<•0•!")•••0.•."•)#)•.,"#/ 89.•+"
$••"2)<)0&"$•.#&•0 #•+"«/)<'•••»"••••••)••7
•)"G0)19)#• ;•"•)%•••0&I5">••24 80•"/ 8-0)9.7
•.,"(•"$•.••8)"«/)<'•••»"••••••)•••)"G)•••0)"
•••. 7 . ••••!"#• c$%!&• ' (••%••) *" +•',••) -+#/••")• (-#•*"+-0%12%#& 3••!-( 546% $%•8#•&.
•••. 9. ••••!"#• c$%!&• ' (••%••) *" +•',••) #•&6•) +":(•;•) (!"•+•) '+"</++8) )"*••3- =&•#/+"> '("?/+%@ "*%)+•)• )"•")•.
•••. A. ••••!"#• c$%!&• ' (••%•%B *" +•',•%B •&)%B •%/C-3-D+*-( (!"•+%6% (/•*%•" )"*••3- •&)-?+%•*-> "•%3-:%("+%6% ' +":)/+E•)
(!"•+•) '+"</++8).
!"#$%&'"($#)*#'+&,$&-$".$/01,2*#'+&3).)+4&–&56754&–&84&769&12:4&5&;<=>
?C
••••) • ••!•"#$!%&, %•'(#*'$ +%#* -••'+$./%0
+• BEHv1 2.•+3• ••4!$5• !#•••• 6••7•••8), ••
8'$4 9•4 :•/•+%•/%• 7$•$/* !.#$!, .+$ '#••$0
;('•9(< ••6••7••= >/+$•••$4 !$••%!%' .+%(#&0
•/+%!••% .+$'#•-••$ •• +$•= ?=
@••'+$./%+ VEA1 .•!•$• 7$•%• 6•#•"$/*
!(- ••8!•%•/( /• :•%••/+$7•%:% %/%7•••8 C •%0
#•'C#( /•+•(••#*•$D :+C.= F•', 6G(#*3•••8 '(#*0
'%•/( •/%••$D :+C., 5% 6!’86••( #$3• 6 %-•$•
•/%•%•0•C•(-%•, 6G(#*3•••8 !(-•/••( 9$D :+C.
-% 9••/+C •%#•'C#$ /• -% !•+3$• !$•%'%:% •/C0
.••8 26!’86%' 6 /+*%••07%/$+•• •C•(-••$) .+$0
6!%-8/* -% 6•••3•••8 9*%:% -••'+$./%+•, 5%, !
•!%& 7•+:C, ••:•/$!•% !.#$!•• •• 3••• .+%8!C
•'/$!•%•/( 2+$•= I)=
•••••• •
1= J+%!•-••% G•:•/%;•'/%+•$4 #(•(4•$4 +•0
:+••(4•$4 •••#(6, 8'$4 .%'•6•! •••%"#$!(•/* /%70
•%:% %.$•C .+%/$.CD#$••%< •'/$!•%•/( #(•(4•%&
;C•'9(•& !(- %G7$•#••$D -••'+$./%+(!, %-••' .•0
+•-G•7$! •;•'/$!•(•/* '#••$;('•9(4•%:% •%-•0
#&!•••8=
K= L• -%.%•%:%& •#:%+$/•C Random'Forest .%0
GC-%!••% '#••$;('•9(4•C •%-•#*, 6-•/•C .•+•-0
G•7•/$ ••8!•(•/* 7$ !(-•C/•(•/* .+%/$.CD#$••%<
•'/$!•%•/( -#8 •%!$D •.%#C' 6 ••/%& •••/C.•%:%
•.+8•%!••%:% •$•/•6C +•7%!$•, 5% !%#%-(&/* !$0
+•6•%& .+%/$+•'%!%& -(•&= J+%:•%•/$7•• 6-•/0
•(•/* •%-•#( .(-/!•+-"••• •/•/$•/$7•$•$ '+$0
/•+(8•$, %/+$•••$•$ ! .+%9••( << •/!%+•••8 /•
.+$ .+%:•%6( /••/%!%< !$G(+'$=
M= L-(4••••% •••#(6 !'#•-(! -••'+$./%+(! C
.+$4•8//8 +(3•••8, !$6••7••% ••4G(#*3 !•"#$!( 6
•$D -#8 6-(4•••••8 '#••$;('•9(<, +%6'+$/% <D ;(0
6$'%0D(•(7•$4 6•(•/ /• .+%(#&•/+%!••% 6!’86%'
!$G+••$D -••'+$./%+(! 6( 6-•/•(•/& -% (•:(GC0
!•••8 +%•/C %•'%'#(/$•=
!"#$%&#'%&
BD' H&7</5$%(65.9'IDJD?'K<(.5'LDID'4-O&)+$!&,$/.D'T&7&>?'U&+&$!$=&#/)',&>?'0<1(0<5*.%.D'–'V&//.W>:'X$%)'
5/.=)?'YZZ4D'–'BZ['(D
YD' \esyk'RD]D?'^imenkovsky']DSD?'_aminsky'`DqD'et'alD'xx']iopolymers'and'CellD'–'YZBBD'–'qolD'Yz?'{YD'–'LD'BZz-BBzD
|D' })%1.!"5'~D€D?'K<(.5'LDID?'•)*&9#25'VDJD?'‚ƒ2„)5'•D~D'xx'…‚†TD'–'YZZ[D'–'OD'4?'%.0D'B'‡B|ˆD'–'JD'4Y-4zD
4D' ‰avrylyuk'`D?'Mosula'\D?'^imenkovsky']D'et'alD'xx'EurD'ŠD'MedD'ChemD'–'YZBZD'–'qolD'4‹D'–'PD'‹ZBY-YBD'
‹D' ‰avrylyuk'̀ D?'̂ imenkovsky']D?'qasylenko'ŒD'et'alD'xx'EurD'ŠD'MedD'ChemD'–'YZZ•D'–'qolD'44?'{4D'–'LD'B|•[-B4Z4D
[D' _aminsky'`D?'^imenkovsky']D?'\esyk'RD'xx'EurD'ŠD'MedD'ChemD'–'YZZ•D'–'qolD'44D'–'PD'|[Yz-|[|[D
zD' )7&/(65.9'~DVD?'L$7)/'‚D•D?'Ž*)7)/"5'~DVD?'K<(.5'LDID'xx'…‚†TD'–'YZZ[D'–'OD'4?'%.0D'B'‡B|ˆD'–'JD'4B-4•D
•D' })%1.!"5'~D€D?'H&7</5$%(65.9'IDJD?'~1)0)5'•DVD'*)'&/D'xx'†)17)WD'821/D'–'YZZ•D'–'{[D'–'JD'[•-z‹D'
•D' •$(2!)'KD•D?'H&7</5$%(65.9'IDJD?'‚=21W$%'VDVD'*)'&/D'xx'†)17)WD'821/D'–'YZBZD'–'{YD'–'JD'zz-•|D'
BZD' H&7</5$%(65.9'IDJD?'~<%&/>5'‚DOD?'})%1.!"5'~D€D?'K<(.5'LDID'xx'…‚†TD'–'YZBBD'–'OD'•?'%.0D'|'‡|‹ˆD'–'JD'[4-zBD
BBD' `raper'NDRD?'Smith'‰D'Applied Regression AnalysisD'–'‰oboken?'NŠ:'‘iley-“ntersciD?'B•••D'–'PD'|Zz-|BYD
BYD' ”etko'“DqD?'Gasteiger'ŠD?'”odeschini'RD'et'alD'xx'ŠD'ComputD'AidD'MolD'`esD'–'YZZ‹D'–'qolD'B•D'–'LD'4‹|-4[|D
B|D' ‰algren'”DAD'xx'ŠD'CompD'ChemD'–'B••[D'–'qolD'Bz'‡‹-[ˆD'–'PD'4•Z-‹B•D
B4D' ]reiman'\D'xx'Machine'\earningD'–'YZZBD'–'qolD'4‹'‡BˆD'–'PD'‹-|YD
B‹D' ‚U&W&9/)'(*$1&/5)')%*$1)')!=$1.*72' «Random Forests». http:xxwwwDstatDberkeleyDedux•breimanx
RandomForestsxcc—homeDhtm
B[D' ”odeschini'RD?'Consonni'qD'Molecular'`escriptors'for'ChemoinformaticsD'Second?'Revised'and'Enlarged'EdD'
qolD'BD'–'‘einheim'‡Germanyˆ:'‘iley-qC‰?'YZZ•D'–'BY[‹'pD'
N•-(43#• -% +•-•'9(< 11=11=KO11 +=
|
| id | nasplib_isofts_kiev_ua-123456789-42017 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 0533-1153 |
| language | Ukrainian |
| last_indexed | 2025-12-07T15:28:35Z |
| publishDate | 2012 |
| publisher | Інститут органічної хімії НАН України |
| record_format | dspace |
| spelling | Зіменковський, Б.С. Девіняк, О.Т. Лесик, Р.Б. 2013-03-06T15:52:24Z 2013-03-06T15:52:24Z 2012 Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання / Б.С. Зіменковський, О.Т. Девіняк, Р.Б. Лесик // Журнал органічної та фармацевтичної хімії. — 2012. — Т. 10, вип. 2(38). — С. 43-49. — Бібліогр.: 16 назв. — укр. 0533-1153 https://nasplib.isofts.kiev.ua/handle/123456789/42017 541.6:547.789:615.076 Проведено багатофакторний лінійний регресійний аналіз та класифікаційне моделювання (алгоритм Random Forest) протипухлинної активності похідних 4-тіазолідинонів з метою спрямованого синтезу сполук з протираковою дією. Прогностична здатність підтверджена статистичними показниками, отриманими в процесі створення моделі, та при прогнозі тестової вибірки. Здійснено аналіз вкладів дескрипторів у прийняття рішення, визначено найбільш важливі з них для проведення класифікації, розкрито їх фізико-хімічний зміст та проілюстровано зв'язок виділених молекулярних дескрипторів зі здатністю до інгібування росту онкоклітин. Проведен многофакторный линейный регрессионный анализ и классификационное моделирование (алгоритм Random Forest) противоопухолевой активности производных 4-тиазолидинонов с целью целенаправленного синтеза соединений с противораковым действием. Прогностическая способность подтверждена статистическими показателями, полученными в процессе создания модели и при прогнозе тестовой выборки. Осуществлен анализ вкладов дескрипторов в принятие решения, определены наиболее важные из них для проведения классификации, раскрыто их физико-химическое значение и проиллюстрирована связь выделенных молекулярных дескрипторов со способностью к ингибированию роста онкоклеток. In order to perform directed synthesis of antineoplastic compounds the multiple linear regression analysis and classifi cation modeling (by Random Forest algorithm) of 4-thiazolidinones as anticancer agents have been carried out. The predictive ability is confi rmed by the statistic data obtained during model developing and test sample predicting. Descriptors contribution in the decision making has been estimated, the most important descriptors for the classifi cation have been identifi ed and interpreted. The relationship between the molecular descriptors selected and cancer cells growth inhibition is given. uk Інститут органічної хімії НАН України Журнал органічної та фармацевтичної хімії Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання Изучение взаимосвязи «структура – противоопухолевая активность» производных 4-тиазолидинонов методами регрессионного анализа и классификационного моделирования The study of the «structure – anticancer activity» relationship of 4-thiazolidinones using regression analysis and classification modeling Article published earlier |
| spellingShingle | Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання Зіменковський, Б.С. Девіняк, О.Т. Лесик, Р.Б. |
| title | Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання |
| title_alt | Изучение взаимосвязи «структура – противоопухолевая активность» производных 4-тиазолидинонов методами регрессионного анализа и классификационного моделирования The study of the «structure – anticancer activity» relationship of 4-thiazolidinones using regression analysis and classification modeling |
| title_full | Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання |
| title_fullStr | Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання |
| title_full_unstemmed | Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання |
| title_short | Вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання |
| title_sort | вивчення взаємозв’язку «структура – протипухлинна активність» похідних 4-тіазолідинонів методами регресійного аналізу та класифікаційного моделювання |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/42017 |
| work_keys_str_mv | AT zímenkovsʹkiibs vivčennâvzaêmozvâzkustrukturaprotipuhlinnaaktivnístʹpohídnih4tíazolídinonívmetodamiregresíinogoanalízutaklasifíkacíinogomodelûvannâ AT devínâkot vivčennâvzaêmozvâzkustrukturaprotipuhlinnaaktivnístʹpohídnih4tíazolídinonívmetodamiregresíinogoanalízutaklasifíkacíinogomodelûvannâ AT lesikrb vivčennâvzaêmozvâzkustrukturaprotipuhlinnaaktivnístʹpohídnih4tíazolídinonívmetodamiregresíinogoanalízutaklasifíkacíinogomodelûvannâ AT zímenkovsʹkiibs izučenievzaimosvâzistrukturaprotivoopuholevaâaktivnostʹproizvodnyh4tiazolidinonovmetodamiregressionnogoanalizaiklassifikacionnogomodelirovaniâ AT devínâkot izučenievzaimosvâzistrukturaprotivoopuholevaâaktivnostʹproizvodnyh4tiazolidinonovmetodamiregressionnogoanalizaiklassifikacionnogomodelirovaniâ AT lesikrb izučenievzaimosvâzistrukturaprotivoopuholevaâaktivnostʹproizvodnyh4tiazolidinonovmetodamiregressionnogoanalizaiklassifikacionnogomodelirovaniâ AT zímenkovsʹkiibs thestudyofthestructureanticanceractivityrelationshipof4thiazolidinonesusingregressionanalysisandclassificationmodeling AT devínâkot thestudyofthestructureanticanceractivityrelationshipof4thiazolidinonesusingregressionanalysisandclassificationmodeling AT lesikrb thestudyofthestructureanticanceractivityrelationshipof4thiazolidinonesusingregressionanalysisandclassificationmodeling |