药学学报  2018, Vol. 53 Issue (9): 1422-1428   PDF    
含党参方剂的数据挖掘及防治胃肠道疾病的分子机制
周荣荣1,4, 张萌2, 朱彦3, 周文静1, 李彦文3, 李志勇1,4,5     
1. 山西中医药大学 基础医学院, 山西 晋中 030600;
2. 山西中医药大学 中药学院, 山西 晋中 030600;
3. 中国中医科学院中医药信息研究所, 北京 100700;
4. 中央民族大学药学院, 北京 100081;
5. 云南省中药新资源开发研究协同创新中心, 云南 昆明 650051
摘要: 基于数据挖掘工具分析含党参高频对药的用药规律,利用网络药理学方法预测防治胃肠疾病的分子作用机制。筛选含党参方剂,使用R语言关联规则对筛选方进行数据挖掘,筛选同时满足support≥0.3、confidence≥0.9的高频组合,利用中药整合药理学平台(TCMIP)预测高频对药的“中药-疾病”关键核心靶点,构建“中药-化合物-靶点-通路”网络,探究含党参高频对药在防治胃肠疾病中的分子作用机制。通过SystemsDock Web Site对成分与靶点进行分子对接验证。从543首含党参方剂数据中筛选得到185首标准方剂,关联分析获得含党参高频对药共6个,党参与当归、甘草、白术、茯苓、陈皮、黄芪密切相关;高频对药与补中益气汤(党参、当归、甘草、白术、陈皮、黄芪、柴胡、升麻)相似;整合药理学平台发现6组党参高频对药均与靶点POMC、OPRM1、CCR9、HTR2C有关;预测含党参高频对药防治胃肠疾病已知靶点(HTR2C、POMC、OPRM1、CCR9、OPRD1)和潜在药物作用靶点(GNB1、GCK、SDHD、SLC25A2、DHRS4)。Gene Ontology(GO)富集分析显示,其生物功能主要定位在线粒体、髓鞘,参与三羧酸循环、血小板活化、天门冬氨酸代谢等生物过程;KEGG通路富集分析显示,其疾病代谢通路主要与氨基酸代谢、能量代谢、内分泌代谢等有关。含党参高频对药在防治胃肠疾病中存在多个靶点与神经细胞密切相关,推测其可能通过脑-肠轴、神经内分泌系统来发挥治疗作用。
关键词: 党参     胃肠疾病     关联规则     整合药理学     分子机制    
Data mining of the prescription containing Codonopsis and study on the molecular mechanism of prevention and treatment of gastrointestinal disease
ZHOU Rong-rong1,4, ZHANG Meng2, ZHU Yan3, ZHOU Wen-jing1, LI Yan-wen3, LI Zhi-yong1,4,5     
1. School of Basic Medicine, Shanxi University of Chinese Medicine, Jinzhong 030600, China;
2. College of Traditional Chinese Medicine, Shanxi University of Chinese Medicine, Jinzhong 030600, China;
3. Institute of Information on Traditional Chinese Medicine of China Academy of Chinese Medical Sciences, Beijing 100700, China;
4. School of Pharmacy, Minzu University of China, Beijing 100081, China;
5. Collaborative Innovation Center for the Development of New Chinese Medicine Resources in Yunnan, Kunming 650051, China
Abstract: The medication rules of high frequency herb-pairs containing Codonopsis pilosula (Dangshen) were analyzed with data mining tools, and the molecular mechanisms of these herb-pairs on the gastrointestinal diseases were predicted with the network pharmacology. The R language association rules were used to mine the high frequency herb-pairs from TCM formulae containing Dangshen, and these herb-pairs would be screened out, which satisfied the following requirements with support ≥ 0.3 and confidence ≥ 0.9 at the same time. Using the Integrated Pharmacology Platform of Traditional Chinese Medicine (TCMIP) to predict the key core targets of the high frequency herb-pairs, the network of Chinese medicine-compound-target-pathway related to Dangshen were built to explore the preventing and treating molecular mechanism on gastrointestinal diseases. At last, the relation of the main active components from Dangshen and its herbal pairs with target proteins were validated by Systems Dock Web Site. The 185 formulae were selected from 543 formulae containing Dangshen, and 6 herbal pairs with Dangshen, which includes Angelica (Danggui), Licorice (Gancao), Atractylodes macrocephala (Baizhu), Poria cocos (Fuling), dried tangerine peel (Chenpi) and Astragalus membranaceus (Huangqi), were discovered with Apriori algorithm. The combination of 6 herbal pairs is similar to Bu Zhong Yi Qi Decoction; 6 herbal pairs with Dangshen were related to the target of POMC, OPRM1, CCR9 and HTR2C in TCMIP. The known targets (HTR2C, POMC, OPRM1, CCR9, OPRD1) and potential drug-targets (GNB1, GCK, SDHD, SLC25A2, DHRS4) for gastrointestinal diseases were predicted about the high frequency pairs with Dangshen. The results of GO enrichment analysis showed that the biological function was mainly located in the mitochondria and myelin sheath, and involved in the biological processes of three carboxylic acid cycle, platelet activation, and aspartic acid metabolism. KEGG pathway enrichment analysis showed that the main metabolic pathways related with Dangshen pairs involved amino acid metabolism, energy metabolism and endocrine metabolism. The prediction results showed many targets of the frequency herbal pairs with Dangshen preventing and treating gastrointestinal diseases were related with nerve cells. These herbal pairs could prevent and treat the gastrointestinal diseases through the neuroendocrine system and the brain gut axis.
Key words: Codonopsis pilosula (Dangshen)     gastrointestinal disease     association rule     integrated pharmacology     molecular mechanism    

胃肠疾病是一类兼具动力学改变和器质性病变的系列疾病, 主要包括肠易激综合征、功能性便秘、胃炎、胃溃疡等, 涉及口臭、烦躁易怒、失眠多梦、胃脘痞满、胃脘疼痛、胸胁疼痛、呃逆、反酸、便秘、腹泻、腹痛等34种不适症状[1], 其病因病机复杂, 中医理论认为“脾胃者, 仓廪之官; 大肠者, 传道之官; 小肠者, 受盛之官”, 饮食不节与不洁则生胃病, 形劳多思则生脾病, 脾失健运, 大小肠失司, 津液不行或过行。胃肠病具有发病易、收效速、根除难的特点, 病程久则严重影响人的饮食、精神情绪、睡眠等正常生活。

党参(Dangshen, Codonopsis radix)广布于甘肃、山西和陕西、四川等地, 以山西分布最广; 潞党参、白条党参是“晋药”道地药材的代表[2]。党参性味甘平, 归脾、肺经, 具有健脾益肺、养血生津之功效, 研究表明党参可调节胃肠运动、抗溃疡、增强免疫功能等, 其治疗肠胃疾病, 尤其是便秘、胃痛、痢疾、腹泻、脱肛等疾病有很好的疗效, 且不良反应较少, 成为中医药研究胃肠疾病的常用药之一。

数据挖掘分析工具能快速发现药物之间相互规律, 挖掘药物间的内在联系。为中医药研究科学问题, 阐明中药与疾病之间的内在联系提供便利。本文采用R语言关联规则挖掘方剂数据库中含党参方剂高频对药; 通过整合药理学平台(V1.0)[3]探究高频对药与胃肠疾病的关系, 发现高频对药之间的内在联系, 本研究从“中药-化学成分-疾病-靶点-通路”角度进行分析, 探究含党参高频对药在防治胃肠疾病的分子作用机制。

材料与方法

处方来源   含党参方剂来源于中国中医科学院中医药信息所方剂数据库, 该数据库共收录84 464首来自710余种古籍及现代文献的中医方剂。

处方筛选与数据标准化   检索含有“党参”的方剂543首, 并进行筛选。筛选标准如下: ①筛选1911年以前的古代方剂; ②剔除外用方剂, 只保留内服方剂; ③剔除只有单味药的方剂; ④剔除方剂组成中含其他方剂名称的方剂, 如四物加参术汤的药物组成示:四物汤、参术汤。数据标准化处理: ①依据《中华人民共和国药典》2015年版、《中药大辞典》 (上海科学技术出版社、第二版)的药物名称, 对方中药物名称进行规范化处理; ②剔除方剂组成药物的剂量、炮制信息、产地信息、制作方法等描述性缀词; ③参照《中国药典》2015年版中药信息目录, 保留部分中药炮制的药物, 如半夏曲、胆星曲等。

数据分析

含党参高频对药筛选  运用统计分析软件R (V 3.4.0)语言的arules包(https://cran.r-project.org/web/packages/arules/), 对含党参方剂的高频中药进行关联规则(association rules)分析, 结果按支持度(support)、置信度(confidence)降序排列, 设置筛选条件: lift (提升度)大于≥1、support≥0.3、confidence≥0.9。设置同时满足support≥0.5和confidence≥0.5的高频对药具有强关联规则性。

含党参高频对药组合疾病筛选  通过中国知网(CNKI, http://www.cnki.net/)检索关键词“党参”并含“疾病”, 党参防治疾病主要涉及便秘(constipation)、腹泻(diarrhea)、胃炎(gastritis)、结肠炎(colitis)等胃肠道病, 因此将“胃肠道病”作为疾病研究对象。

党参高频对药防治疾病关键作用靶点预测  利用中药整合药理学计算平台(TCMIP, http://www.tcmip.cn/home.jsp), 建立“党参高频对药-胃肠道病”(如党参白术-胃肠道病)任务、“党参高频对药组合-胃肠道病” (如“党参、白术、甘草、茯苓、陈皮”组合-胃肠道病)多项任务, 疾病检索词限定为: “constipation”、“diarrhea”、“gastritis”、“colitis”, 设置相似性分数为0.9, 筛选同时满足网络拓扑特征值“度(degree)、紧密度(closeness)、介度(betweenness)”中位数排名前10位的关键核心靶点。

基因功能和通路富集分析  中药整合药理学计算平台整合基因本体数据库Gene Ontology (GO)和KEGG通路数据库资源, 对关键核心靶点进行细胞、功能定位及疾病代谢通路富集。党参高频对药组合GO和KEGG通路富集结果分别按统计学P≤0.05由小到大筛选排序, 认为排名越靠前的富集结果越有意义。

主要化合物-靶点分子对接验证  利用分子对接Systems Dock Web Site网站(http://systemsdock.unit.oist.jp, Version 2.0)对整合药理学预测的degree值排名靠前5个潜在药物靶点与对应的中药成分进行分子对接验证; 并以与靶点对应的Drugbank已上市药作为阳性对照药, 根据分子对接结果验证本研究中党参及其对药化学成分与靶点的潜在作用关系。

结果 1 关联分析

从543首含党参方剂中筛选出185首符合要求的标准方剂, 同时符合lift、support、confidence关联规则筛选条件的对药共6对(表 1), 与党参密切相关的中药依次是当归、甘草、白术、茯苓、陈皮、黄芪; 其中{当归} = > {党参} ({Angelica} = > {Dangshen})、{甘草} = > {党参} ({Licorice} = > {Dangshen})、{白术} = > {党参} ({Atractylodes} = > {Dangshen})具有强关联规则性。

Table 1 Frequency herbal pairs of Dangshen with Apriori algorithm
2 关键靶点预测结果 2.1 含党参高频对药防治胃肠道病关键靶点预测

通过对TCMIP分析结果统计(表 2), 发现6组含党参的高频对药均对靶点POMC、OPRM1、CCR9、HTR2C具有很高的拓扑特征值, 其中POMC是腹泻的已知靶点, OPRM1、HTR2C是便秘的已知靶点, CCR9是结肠炎的已知靶点; 筛选出的潜在药物靶点共10个, SDHD、SDHC是当归成分预测靶点, GNB1是陈皮成分预测靶点, PLD1、PLA2G2D、PLD2是党参、黄芪、当归、茯苓对应成分预测靶点, 其余为党参成分预测靶点。其中UQCRC2既是当归-党参作用的潜在药物靶点, 又是茯苓-党参作用的已知疾病靶点。

Table 2 The known targets and potential drug-targets of herbal pairs of Dangshen for preventing and treating gastrointestinal diseases
2.2 党参高频药物组合防治胃肠道病关键靶点预测

党参分别与当归、甘草、白术、茯苓、陈皮、黄芪具有紧密关联, 且预测得到了高拓扑值的共有关键靶点, 如POMC、SDHD、SDHC等。总体来看, “党参、当归、甘草、白术、茯苓、陈皮、黄芪”与“补中益气汤”加减方相似, 推测党参与其他药物之间的关系密切, 通过TCMIP对含党参的药物组合进行防治胃肠道病的分子机制预测, 并以补中益气汤作为对照。平台收录党参成分68个、当归成分65个、陈皮成分46个、茯苓成分33个、黄芪成分29个、白术成分32个、甘草成分133个, 将化学成分相似性系数设置为0.9, 可预测到1 163个靶点, 发现党参跟其他中药均存在共性靶点; 白术只与党参存在相对较少的靶点; 陈皮、甘草与其他中药共性靶点最少(表 3)。这些靶点主要定位在线粒体、乙酰胆碱受体, 参与氨基酰化反应、氧化还原过程、胆碱能突触传递等, 与多种氨基酸代谢、柠檬酸循环(TCA循环)功能有关。

Table 3 Analysis of common targets of the high frequency herbs

根据网络拓扑特征值筛选得到133个关键靶点, degree排名前10位可认为是关键核心靶点(图 1), 显示已知疾病靶点有5个: HTR2C、POMC、OPRM1、CCR9、OPRD1;潜在药物靶点有5个: GNB1、GCK、SDHD、SLC25A2、DHRS4。

Figure 1 The key target network (red dots represent putative drug target, yellow dots represent known disease target, green dots represent common target, and gray dots represent others; the dot increases with the increase of degree)
2.3 分子对接验证

将degree值排名前5的潜在药物靶点与对应的成分及阳性对照药进行分子对接验证, 对接结果见表 4。分子对接结果表明, 预测靶点与中药成分的结合活性很好, 且分别与阳性对照药docking score值相接近。

Table 4 Molecular docking results of herbal compounds and potential targets
2.4 关键靶点GO、KEGG通路富集分析

对关键靶点进行GO和KEGG通路富集分析, 主要定位在线粒体、髓鞘, 参与三羧酸循环、血小板活化、天门冬氨酸代谢、IMP代谢等生物过程; 主要参与氨基酸代谢、碳代谢、精氨酸与脯氨酸代谢、神经系统、血管内皮生长因子信号通路、丙氨酸、天门冬氨酸和谷氨酸代谢、柠檬酸循环、内分泌代谢疾病、肾细胞癌等代谢过程。按KEGG通路富集分析结果前30位排名绘制“中药-成分-关键药靶-通路”网络图(图 2)。

Figure 2 The "traditional Chinese medicine-ingredient-key ingredient target-pathway" network of Dangshen. Green dots: Chinese medicine; Purple dots: Composition; Blue dots: Key target; Red dots: Pathway
讨论

本实验发现党参与当归、甘草、白术、茯苓、陈皮、黄芪6个中药密切相关, 七味药与补中益气汤相比, 缺少升麻、柴胡而增加了茯苓, 两者均属偏温、甘、平补之性。通过文献调查, 发现补中益气汤加减方最常与茯苓配伍, 党参与白术、茯苓、大枣等多种中药配伍治疗胃肠疾病[4]。此次研究中当归、甘草、白术关联度最高, 《本草汇言》记载: “温疟寒热, 不在皮肤外肌肉内, 而洗在皮肤中, 观夫皮肤之中, 营气之所会也, 温疟延久, 营气中虚, 寒热交争, 汗出洗洗, 用血药养营, 则营和而与卫调矣, 营卫和调, 何温疟之不可止乎”。党参、白术、茯苓、甘草合用补气健脾, 党参、黄芪配伍-表-里补气固表, 生津安神, 诸药合用大补中气, 气血同调, 健脾和胃, 固护胃肠。通过对党参与柴胡、升麻以及补中益气汤防治胃肠疾病的网络药理学研究, 发现主要已知疾病靶点均是OPRM1、POMC、CCR9和HTR2C, 党参-升麻潜在药物靶点主要是PLD2、GCK和PLD1, 党参-柴胡潜在药物靶点主要是PLD2、UQCRC2和UQCRC1;补中益气汤与党参高频药物组合预测靶点结果比较, 两者主要作用靶点十分相似, 只是网络拓扑特征值排名稍有不同, 可以看出柴胡、升麻在补中益气汤中也处于十分重要的作用, 而茯苓可能在补中益气汤加减应用中处于重要位置。

中药成分主要在胃肠道完成体内代谢与生物转化, 胃提供酸性环境, 大肠提供碱性环境, 在胃蛋白酶、酯酶、细胞色素P450等作用下, 糖类、蛋白质和脂肪等成分容易产生水解反应, 与肠道菌群的作用, 完成杀菌、排毒、吸收代谢产物、免疫等过程。通过对药组合关键核心靶点对应的相似化学成分分析, 发现党参、当归、黄芪同时存在十六酸(hexadecanoic acid)和胆碱(choline); 当归、党参同时存在肉豆蔻酸(myristic acid); 党参、茯苓同时存在月桂酸(lauric acid)和辛酸(caprylic acid); 其他如陈皮有α-法尼烯(α-farnesene); 当归有琥珀酸(succinic acid)、木犀草酸(lignoceric acid); 党参有二十二烷酸(heneicosanoic acid)、甘露糖(mannose)、庚酸(enanthic acid)、己酸(caproic acid)、尿酸(daturic acid)、壬酸(nonanoic acid)、十五酸(pentadecanoic acid)、N-己基-β-D-葡萄糖苷(N-hexyl-β-D-glucopyranoside), 茯苓有十一酸(undecanoic acid)等, 诸药之间存在共同成分、共性靶标, 推测诸药合用可起到协同增效的作用。分别对已知靶点(HTR2C、POMC、OPRM1、CCR9、OPRD1)和潜在药物靶点(GNB1、GCK、SDHD、SLC25A2、DHRS4)分析, 发现POMC[5]存在于脑和垂体的神经肽, 与调节肥胖症、摄食量、糖耐量、缓解疼痛等密切相关。OPRM1[6]可能与阿片类药物引起的便秘密切相关。CCR9[7]是一种淋巴细胞归巢受体, 研究表明它是调控溃疡性结肠炎重要活动因子。HTR2C[8]存在于大脑中枢黑素皮质素系统中, 参与调节食欲过程, 并与肠易激综合征、抑郁患者血清素相关基因变异有关。OPRD1[9]是G蛋白偶联受体阿片家族的成员, 与OPRM1等受体关系密切, 参与阿尔茨海默病、阿片样物质成瘾等疾病, 具有镇痛、调节厌食症、调控神经等作用。GNB1[10]参与多种受体及信号转导过程, GNB1受损可引起严重的神经性疾病。GCK[11]主要存在于胰脏和肝脏, 有助于葡萄糖吸收和转化, 参与调控神经代谢与胰岛素功能等过程。SDHD[12]是副神经节瘤、嗜铬细胞瘤等疾病的致病基因之一。SLC25A2[13]为线粒体内膜转运体, 与鸟氨酸转运体2密切相关, 主要参与CDK介导的磷酸化和病毒mRNA翻译等过程, 可提高激素水平。DHRS4[14] (dehydrogenase/reductase 4, 脱氢酶/还原酶4)主要参与受体结合和氧化还原酶活性, 可在大肠杆菌中产生。结果发现预测的靶点均与脑、神经系统有关, 可能参与氨基酸代谢、神经系统代谢过程。胃肠道是唯一由中枢神经系统、肠神经系统和自主神经系统共同支配的系统[15]。研究发现, 脑-肠轴是联系认知感情中枢与神经内分泌、肠神经系统和免疫系统的双向环路, 推测可能通过脑-肠轴系统达到治疗胃肠疾病的目的。

通过R语言关联规则的知识发现并基于整合药理学平台探究疾病分子作用机制, 为方剂数据库挖掘关键药物以及中医药方剂研究提供思路与方法。本研究得到党参关联性强的对药组合, 组成上似补中益气汤加减方(去柴胡、升麻, 加茯苓), 整合药理学平台预测出防治胃肠疾病的10个关键靶点, 但其有效性还有待进一步实验验证。

参考文献
[1] Yang CB, Lao SX, Wei BH, et al. The scale of TCM symptoms of gastrointestinal diseases (China Integrated Chinese and Western Medicine Association Digestive System Disease Specialized Committee, 2010, Suzhou)[J]. Chin J Integr Tradit West Med Dig (中国中西医结合消化杂志), 2011, 19: 66–68.
[2] Wu XJ, Zhang XB, Guo LP, et al. Distribution regionalization of Codonopsis pilosula[J]. China J Chin Mater Med (中国中药杂志), 2017, 42: 4368–4372.
[3] Xu HY, Liu ZM, Fu Y, et al. Development and application of integrated pharmacology computing platform of Chinese medicine[J]. China J Chin Mater Med (中国中药杂志), 2017, 42: 3633–3638.
[4] Feng BB, Zhang JH. Advances in studies on compatibility of Dangshen[J]. Chin J Exp Med (中国实验方剂学杂志), 2016, 22: 194–198.
[5] Rubinstein M, Low MJ. Molecular and functional genetics of the proopiomelanocortin gene, food intake regulation and obesity[J]. FEBS Lett, 2017, 591: 2593–2606. DOI:10.1002/feb2.2017.591.issue-17
[6] Solismaa A, Kampman O, Lyytikäinen LP, et al. Genetic polymorphisms associated with constipation and anticholinergic symptoms in patients receiving clozapine[J]. J Clin Psychopharmacol, 2018, 38: 193–199. DOI:10.1097/JCP.0000000000000885
[7] Liu X, Ding YW, Lin H. Correlation between homing receptor and TLR4 in the intestinal tract of ulcerative colitis mice[J]. Chin J Mod Med (中国现代医学杂志), 2012, 22: 9–12.
[8] Grzesiak M, Beszłej JA, Waszczuk E, et al. Serotonin-related gene variants in patients with irritable bowel syndrome and depressive or anxiety disorders[J]. Gastroenterol Res Pract, 2017, 2017: 4290430.
[9] Ji H, Wang Y, Liu G, et al. Elevated OPRD1 promoter methylation in Alzheimer's disease patients[J]. PLoS One, 2017, 12: e0172335. DOI:10.1371/journal.pone.0172335
[10] Petrovski S, Küry S, Myers CT, et al. Germline de novo mutations in GNB1 cause severe neurodevelopmental disability, hypotonia, and seizures[J]. Am J Human Genet, 2016, 98: 1001–1010. DOI:10.1016/j.ajhg.2016.03.011
[11] Ogunnowobada EO, Heeley N, Brochard L, et al. Brain glucose sensing, glucokinase and neural control of metabolism and islet function[J]. Diabetes Obes Metab, 2014, 16: 26–32. DOI:10.1111/dom.12334
[12] Zuo Y, Li X, Wu X, et al. Multifocal paraganglioma and pheochromocytoma due to truncated SDHD mutation[J]. Urology, 2018, 116: 63–67. DOI:10.1016/j.urology.2018.01.012
[13] Fiermonte G, Dolce V, David L, et al. The mitochondrial ornithine transporter[J]. J Biol Chem, 2003, 278: 32778–32783. DOI:10.1074/jbc.M302317200
[14] Cosnes J, Gowerrousseau C, Seksik P, et al. Epidemiology and natural history of inflammatory bowel diseases[J]. Gastroenterology, 2011, 140: 1785–1794. DOI:10.1053/j.gastro.2011.01.055
[15] Zhang LH, Fang BW. Brain gut axis and its role in the pathogenesis of gastrointestinal diseases[J]. Chin J Surg Integrated Tradit West Med (中国中西医结合外科杂志), 2007, 13: 199–201.