
2. 南京大学环境学院, 污染控制与资源化研究国家重点实验室, 南京 210046
2. State Key Laboratory of Pollution Control and Resources Reuse, School of Environment, Nanjing University, Nanjing 210046
三维定量构效关系(3D-QSAR)方法被广泛应用于各个领域的活性与结构、性质与结构关系的研究,而其中比较分子场(CoMFA)方法与比较分子相似性指数(CoMSIA)方法是常用的技术(Cramer et al., 1988a;1998b). CoMFA与CoMSIA方法通过分析分子周围三维空间力场的变化揭示影响化合物活性的结构因素,在环境科学和毒理学领域有广泛的应用(Shi et al., 2012;Waller,2004;王甫洋等,2012;石佳奇等,2010; Wang et al., 2012). 有机化合物在水中的溶解度(-lgSw)和正辛醇/水分配系数(lgKow)是描述其环境行为,特别是生物降解及富集行为的重要理化参数(Zhai et al., 2009).由于有机化合物数量多、不易降解,因此,人们致力于采用不同方法测定、估算和预测化合物的水溶解度、正辛醇/水分配系数(Xie et al., 2007).卤代苯化合物是常见的化工原料,也是环境中的有毒有害物质,对它们的水溶解度、正辛醇/水分配系数的研究始终是一个热点(Li et al., 2009; Wei et al., 2007).目前,人们运用各种方法测定及预测了卤代苯化合物的水溶解度和正辛醇/水分配系数,如反向高效液相色谱法(Finizio et al., 2001)、半经验PM3法(陈景文等,1997)、价连接性指数法(唐自强等,2003)等. 而三维定量构效关系作为目前比较流行的方法并没有用于卤代苯的水溶解度和正辛醇/水分配系数的研究.
因此,本文将三维定量构效关系引入卤代苯化合物的理化性质研究中,选择36种卤代苯化合物作为研究对象,运用CoMFA和CoMSIA方法分别建立-lgSw和lgKow与三维空间结构之间的3D-QSPR模型,分析影响该类化合物水溶解性的结构因素,并与密度泛函理论(DFT)方法得到的2D-QSPR模型进行比较,以期为进一步研究该类化合物的环境行为提供依据.
2 材料与方法(Materials and methods) 2.1 数据来源36个卤代苯(包括12个氟代苯、12个氯代苯和12个溴代苯)化合物中,已有的23个水溶解度(-lgSw)、24个正辛醇/水分配系数(lgKow)的实验数据取自文献(Qiu et al., 2007).化合物的名称及实验数据列于表 1.
表 1 卤代苯的-lgSw和lgKow的实验值、预测值及差值 Table 1 Experiment,prediction and difference data of -lgSw and lgKow for halogenated denzenes |
![]() |
所有36个化合物的分子结构均经过Tripos标准分子力场进行能量优化,能量收敛标准为4.29×10-6 J · mol-1 · nm-1,分子中原子净电荷采用Gasteriger-Hückel方法计算,从而得到分子的最低能构象.分子的叠合是影响CoMFA和CoMSIA模型结果的重要因素(Tervo et al., 2004; Hu et al., 2009),由于所有化合物中都含有苯环,因此,本文以苯环作为叠合骨架,以活性最高的24号化合物作为叠合模板进行叠合.
2.3 3D-QSPR分析CoMFA和CoMSIA分析由SYBYL 7.3工作站完成,采用Tripos标准场,静电场能和立体场能的阈值设定为1.25×103 J · mol-1,以sp3杂化的C+为探针原子对叠合分子外围网格上的静电场能和立体场能的大小和分布进行计算,每隔2.0 Å设置一个检测点;其它值均为缺省值.
与CoMFA相比,CoMSIA采用距离相关的高斯函数计算分子相似性指数,在CoMFA静电场和立体场基础上增加了疏水场、氢键供受体体场等结构参数,其结果受化合物匹配规则的影响相对较小,并且能更加直观地揭示化合物的构效关系(Klebe et al., 1994).理论上,CoMSIA可以克服CoMFA的一些内在缺陷(Gallo et al., 1983),但并不一定能得到比CoMFA更好的结果(Faust et al., 2000).因此,本文结合CoMFA和CoMSIA两种方法进行3D-QSPR研究以相互验证和补充,有助于得到可靠的预测模型.在CoMSIA分析中,由于卤代苯类化合物没有氢键供受体特征,因此,本文共计算了3种三维结构特征场对构效关系模型的影响,分别为立体场(S)、静电场(E)和疏水场(H).
采用偏最小二乘回归方法(PLS)对已有实验数据的部分化合物(另一部分作为测试集)与三维分子结构信息进行统计分析.首先通过“逐一剔除”交叉验证的方法确定最佳主成分数n和交叉验证相关系数(Q2),然后在上述最佳主成分数下进行非交叉验证,得到决定系数(R2),从而构建得到CoMFA和CoMSIA模型.模型的质量由Q2、R2、标准误差(SE)和F检测值来度量.
3 结果与分析(Results and discussion) 3.1 -lgSw与lgKow数值及分子叠合结果表 1列出了部分卤代苯化合物的-lgSw和lgKow的实验数据和预测数据.目标化合物分子的叠合效果是影响CoMFA和CoMSIA模型结果的重要因素,分子叠合效果如图 1所示,表明所有的分子均能很好地叠合.
![]() |
图 1 卤代苯分子叠合图 Fig. 1 Superposition of halogenated denzenes |
利用已有的23个-lgSw和24个lgKow数据进行分析,随机选择1号、13号、21号和27号化合物(氟、氯、溴取代苯至少各取1个)作为测试集化合物,其余作为训练集进行PLS分析,建立得到CoMFA和CoMSIA模型,并使用模型预测了没有实验数据的13个-lgSw和12个lgKow数据,预测数据列于表 1,模型统计参数列于表 2.
表 2 CoMFA和CoMSIA模型统计参数 Table 2 Statistical parameters of the CoMFA and CoMSIA models |
![]() |
由表 2可知,对于-lgSw,CoMFA和CoMSIA模型最佳主成分数n为4,交叉验证相关系数Q2前者 为0.902,后者为0.940,后者稍大于前者;决定系数R2分别为0.982和0.986,标准误差SE分别为0.246和0.215,F检验值分别为193.674和254.849.模型的系列统计参数表明,-lgSw的CoMFA、CoMSIA模型具有较强的稳定性和良好的估算能力.由估算值及差值(估算值与实验值之差)可见,CoMFA模型估算值中,误差最大的是3号化合物,相对误差为18.78%;CoMSIA模型估算值中,误差最大的是1号化合物,相对误差为17.32%,其余估算值与实验值都很接近.在有实验数据的23个化合物中,CoMFA模型相对误差小于10%的数量达到了17个,而CoMSIA模型达到了20个.估算结果表明,CoMFA、CoMSIA模型可以用于该类化合物-lgSw的预测.CoMFA模型还表明,立体场效应对-lgSw的影响要大于静电场效应,表现在立体场(S)的贡献值为0.810,而静电场(E)的贡献值仅为0.190.而在引入疏水场(H)的CoMSIA模型中,疏水场的贡献值达到了0.657,而立体场和静电场的贡献值分别为0.229、0.114.CoMSIA模型进一步说明取代基的疏水特性对于该类化合物的水溶解性能有重要影响,而立体场次之,静电场影响较小.
对于lgKow而言,模型系列统计数据与-lgSw基本相似,并且表现出比-lgSw模型更好的相关性和预测能力,具体数值参见表 1和表 2.
3.3 -lgSw三维等势图图 2为-lgSw的CoMFA和CoMSIA模型的三维等势图(图中分子为六氯苯).图 2a为CoMSIA模型疏水场分布图,图中白色区域表示在该区域引入的卤原子疏水性越强-lgSw越大,即越难溶于水.由图 2a可以看出,分子周围被白色区域所包围,说明在苯环任意取代位引入疏水性强的卤原子,-lgSw值越大.常见卤原子疏水性强弱次序为Br>Cl>F,在其他位置取代基相同的情况下,白色区域引入Br原子的化合物的-lgSw要大于引入Cl原子和F原子的化合物,而引入Cl原子的化合物的-lgSw要大于引入F原子的化合物.这与-lgSw的实验数据一致,比如:1,2-二溴苯>1,2-二氯苯>1,2-二氟苯、1,4-二溴苯>1,4-二氯苯>1,4-二氟苯、1,2,4-二溴苯>1,2,4-二氯苯,模型表征与实验结果相一致,很好地验证了模型的准确性.同时,疏水场的贡献值最大,为0.657,表明卤代苯化合物的水溶解度主要受卤原子的疏水性特征影响.
![]() |
图 2 -lgSw的疏水场CoMSIA(a)、立体场CoMSIA(b)和CoMFA(c)三维等势图 Fig. 2 Contour map of CoMSIA hydrophobic(a),CoMSIA steric(b) and CoMFA steric(c)fields of -lgSw |
图 2b和2c分别为CoMSIA模型和CoMFA模型立体场分布图,图中绿色区域表示此区域引入的卤原子体积越大-lgSw值越大,即水溶解度愈小.常见卤原子体积大小次序为Br>Cl>F,在其他位置取代基相同的情况下,绿色区域引入Br原子的苯衍生物的水溶解度要小于引入Cl原子和F原子的苯衍生物,而引入Cl原子的苯衍生物的水溶解度要小于引入F原子的苯衍生物.这与实验数据一致,-lgSw实验数据排序为:1,2-二溴苯>1,2-二氯苯>1,2-二氟苯、1,4-二溴苯>1,4-二氯苯>1,4-二氟苯、1,2,4-二溴苯>1,2,4-二氯苯,都很好地验证了模型的准确性.
3.4 lgKow三维等势图图 3为lgKow的CoMFA和CoMSIA模型的三维等势图,不同颜色的指示作用参见-lgSw等势图.其中,图 3a为CoMSIA模型疏水场分布图,苯环周围被白色区域所包围,说明在该位置引入Br原子的化合物的lgKow要大于引入Cl原子和F原子的化合物,这与实验结果一致,如1,2-二溴苯>1,2-二氯苯>1,2-二氟苯、1,4-二溴苯>1,4-二氯苯>1,4-二氟苯.同时,疏水场的贡献值最大,为0.691,表明辛醇/水分配系数主要受卤原子的疏水性特征影响.图 3b、3c不再分析,参见-lgSw等势图.
![]() |
图 3 lgKow的疏水场CoMSIA(a)、立体场CoMSIA(b)和CoMFA(c)三维等势图 Fig. 3 Contour map of CoMSIA hydrophobic(a),CoMSIA steric(b) and CoMFA steric(c)fields of lgKow |
-lgSw和lgKow的CoMFA、CoMSIA模型的估算值列于表 1,各模型的估算值与实验值的相关性如图 4所示.由图 4可见,所建模型的估算值与实验值相关性较高,没有明显偏离的点,可以用于估算同类化合物的活性值.由测试集化合物(1号、13号、21号和27号)的估算值可见,-lgSw的CoMFA和CoMSIA模型估算差值最大的都是21号,差值分别为-0.62、-0.38,相对误差分别为11.15%、6.83%.lgKow的CoMFA和CoMSIA模型估算差值最大的分别是27号和13号,差值分别为-0.18、-0.08,相对误差分别为4.42%、2.85%,一系列估算数据表明模型的估算值与实验值非常接近.使用模型对没有实验数据的化合物进行了预测,预测值很好地印证了三维等势图指示结果,相同位置引入Br原子的化合物的-lgSw和lgKow均大于引入Cl原子和F原子的化合物,如1,2,3,4-四溴苯>1,2,3,4-四氯苯>1,2,3,4-四氟苯.引入卤原子的个数越多,化合物的疏水性越强,-lgSw和lgKow值越大.
![]() |
图 4 -lgSw和lgKow实验值与估算值的相关性 Fig. 4 Plots of experiment and prediction data of -lgSw and lgKow |
文献(Qiu et al., 2007)中采用密度泛函理论(DFT)方法,在B3LYP/6-31G*水平上全优化计算得到分子的结构参数:分子平均极化率(α)、偶极距(μ)、分子最高占有轨道能(EHOMO)、分子最低未占轨道能(ELUMO)、分子中原子的最正电荷(q+)、分子中氢原子的最正电荷(qH+)、分子中原子的最负电荷(q-)、分子的平均体积(Vm)等,并将结构参数作为理论描述符,通过线性回归得到了预测卤代苯-lgSw和lgKow的相关模型.经过比较DFT方法和3D-QSPR方法的结果可以发现:
1)DFT方法得到的-lgSw和lgKow模型的可决系数R2分别为0.962和0.990,与本研究相比,-lgSw模型的R2小于本研究结果(CoMFA为0.982,CoMSIA为0.986),而lgKow模型的R2小于CoMSIA模型的0.997,但比CoMFA模型的0.983稍大.
2)在估算能力上,DFT方法得到的-lgSw模型估算差值最大相对误差达到了28.9%,分别高于本研究的CoMFA模型(17.88%)和CoMSIA模型(17.32%);同样,DFT方法得到的lgKow模型预测差值最大相对误差达到了12.2%,分别高于本研究的CoMFA模型(10.47%)和CoMSIA模型(3.73%).因此,本研究建立的3D-QSPR模型具有更好的估算能力.
3)DFT模型表明,卤代苯的-lgSw随着qH+的增大而减小,lgKow随着q+的增大而减小,qH+和q+是与疏水性有关的结构参数,qH+和q+越大表明分子接受电子能力越强,越容易与水形成氢键,越易溶于水相.这与本研究得到的取代基疏水场越强,-lgSw和lgKow越小的结论相似.
4)DFT模型还表明,-lgSw和lgKow与体积Vm成正比,Vm越大的分子越不易进入水相而更容易分配到正辛醇相中,这与本研究立体场的贡献相似;但与DFT模型相比,本研究能够给出更直观的三维等势图,三维等势图能够清楚地显示在不同的取代位引入不同的基团相关活性将如何变化,如从疏水场、立体场图可以看出在相应取代位引入不同的基团活性将如何变化等,而DFT模型的预测则需要定量地知道有关结构参数的值,否则很难利用其进行预测.
4 结论(Conclusions)用比较分子场分析(CoMFA)和比较分子相似性指数分析(CoMSIA)方法,对卤代苯化合物的水溶解度(-lgSw)和正辛醇/水分配系数(lgKow)进行了三维定量结构-活性相关研究,分别建立了3D-QSPR模型并与已有文献报道的密度泛函理论(DFT)方法进行了对比.结果表明:
1)-lgSw的CoMFA和CoMSIA模型的Q2分别为0.902和0.940,R2分别为0.982和0.986.两种模型均具有较高的稳定性和良好的预测能力,预测值与实验值较接近,模型相关系数和预测能力均优于DFT方法得到的模型.三维等势图表明,取代基的疏水特性对水溶解性能有更为显著的影响,立体效应次之,静电场效应影响较小.
2)lgKow的CoMFA和CoMSIA模型的Q2分别为0.926和0.988,R2分别为0.983和0.997.两种模型同样具有较高的稳定性和良好的预测能力,模型预测能力优于DFT方法得到的模型.三维等势图表明,取代基的疏水特性对正辛醇/水分配系数有更为显著的影响,立体效应次之,静电场效应影响较小.
3)两种基于不同维数的结构参数所建立的模型在解释机理上能相互印证,但3D-QSPR方法能够提供更为直观的三维等势图,可以清楚地看到在不同取代位引入不同的基团相关活性的发展趋势.
[1] | 陈景文,杨丽红,王连生.1997.应用理论线性溶解能关系预测部分卤代芳烃的正辛醇/空气分配系数[J].环境化学,16(3): 215-219 |
[2] | Cramer R D,Patterson D E,Bunce J D.1988a.Comparative molecular field analysis (CoMFA).1.Effect of shape on binding of steroids to carrier proteins[J].Journal of the American Chemical Society,110(18): 5959-5967 |
[3] | Cramer R D,Bunce J D,Patterson D E,et al.1988b.Crossvalidation,bootstrapping,and partial least squares compared with multiple regression in conventional QSAR studies[J].Quantitative Structure-Activity Relationships,7(1): 18-25 |
[4] | Faust R,Garratt P G,Jones R,et al.2000.Mapping the melatonin receptor.6.melatonin agonists and antagonists derived from 6H-Isoindolo indoles,5,6-dihydroindolo isoquinolines,and 6,7-dihydro-5H-benzo azepino indoles[J].Journal of Medicinal Chemistry,43(6): 1050-1061 |
[5] | Finizio A,Di Guardo A.2001.Estimating temperature dependence of solubility and octanol-water partition coefficient for organic compounds using RP-HPLC[J].Chemosphere,45(6/7): 1063-1070 |
[6] | Gallo R C,Sarin P S,Gelmann E P,et al.1983.Isolation of human T-cell leukemia virus in acquired immune deficiency syndrome (AIDS)[J].Science,220(4599): 865-867 |
[7] | Hu R J,Barbault F,Delamar M,et al.2009.Receptor- and ligand-based 3D-QSAR study for a series of non-nucleoside HIV-1 reverse transcriptase inhibitors[J].Bioorganic & Medicinal Chemistry,17(6): 2400-2409 |
[8] | Klebe G,Abraham U,Mietzner T.1994.Molecular similarity indices in a comparative analysis (CoMSIA) of drug molecules to correlate and predict their biological activity[J].Journal of Medicinal Chemistry,37(24): 4130-4146 |
[9] | Li X J,Shan G,Liu H,et al.2009.Determination of lgKow and QSPR study on some fluorobenzene derivatives[J].Chinese Journal of Structural Chemistry,28(10): 1236-1241 |
[10] | Qiu J,Zheng Q,Wang Z Y,et al.2007.DFT study on dissolvability-structure relationship of halogeno-benzene[J].Chinese Journal of Structural Chemistry,26(5): 555-561 |
[11] | 石佳奇,王甫洋,孙莉,等.2010.部分苯酚衍生物生物降解性的2D和3D-QSBR研究[J].科学通报,55(16): 1600-1607 |
[12] | Shi J Q,Cheng J,Wang F Y,et al.2012.Acute toxicity and n-octanol/water partition coefficients of substituted thiophenols: Determination and QSAR analysis[J].Ecotoxicology and Environmental Safety,78: 134-141 |
[13] | 唐自强,堵锡华,冯长君,等.2003.价连接性指数与卤代苯、酯的溶解度及辛醇/水分配系数定量关系的研究[J].上海大学学报(自然科学版),9(3): 266-270 |
[14] | Tervo A J,Nyrönen T H,Rönkkö T,et al.2004.Comparing the quality and predictiveness between 3D QSAR models obtained from manual and automated alignment[J].Journal of Chemical Information and Computer Science,44(3): 807-816 |
[15] | Waller C L.2004.A comparative QSAR study using CoMFA,HQSAR,and FRED/SKEYS paradigms for estrogen receptor binding affinities of structurally diverse compounds[J].Journal of Chemical Information and Computer Science,44(2): 758-765 |
[16] | Wang F Y,Shi J Q.2012.2D and 3D-QSBR study on biodegradation of phenol derivatives[J].Bulletin of Environmental Contamination and Toxicology,89(2): 316-321 |
[17] | 王甫洋,张学胜,刘辉.2012.几种酚衍生物对青海弧菌Q67毒性的3D-QSAR研究[J].环境科学学报,32(11): 2884-2890 |
[18] | Wei X Y,Ge Z G,Wang Z Y,et al.2007.Estimation of aqueous solubility (-lgSw) of All polychlorinated biphenyl(PCB) congeners by density functional theory and position of Cl substitution(NPCS) method[J].Chinese Journal of Structural Chemistry,26(5): 519-528 |
[19] | Xie Y J,Zhao H M,Wang Z Y,et al.2007.DFT and position of Cl substitution(PCS) methods studies on n-Octanol/water partition coefficients(lgKow) and aqueous solubility(-lgSw) of All PCDD congeners[J].Chinese Journal of Structural Chemistry,26(12): 1409-1418 |
[20] | Zhai Z C,Liu H X,Wang Z Y,et al.2009.QSPR of n-Octanol/water partition coefficient(lgKow) for Alkyl (1-phenylsulfonyl) Cycloalkane-carboxylates[J].Chinese Journal of Structural Chemistry,28(2): 143-150 |