皮肤病是一种常见病和多发病[1],不但使患者承受生理的病痛,而且给患者的社会生活造成许多负面影响。针对皮肤病的诊断方法的相关研究具有重要的意义。现有的很多疾病诊断方法[2-4]一般先抽取病例中的医学特征,将一个病例表示为其所具有医学特征的集合,然后将该病例转化为向量数据,如
神经网络模型在皮肤病和其他疾病的诊断应用中均取得了一定的研究成果。
1)皮肤病辅助诊断的相关工作:文献[6]提出了一种基于卷积神经网络的皮肤镜图像分类方法,其梯度下降损失函数由分割损失和分类损失2部分组成,使单个网络结合分割样本和分类样本2方面的信息,同时提高了模型在分割和分类任务上的表现,该方法在国际烧伤学会皮肤镜图像数据集上表现出比传统方法更高的鲁棒性和准确度;斯坦福大学人工智能实验室与斯坦福医学院合作采用神经网络方法对皮肤镜图像和临床皮损图像进行自动分类[7],该方法使用GoogLeNetInception-v3作为其分类网络,实验表明该方法在多个分类任务上达到了与专业皮肤科医生相当甚至更好的水平。
2)其他疾病辅助诊断的相关工作:文献[8]提出一种基于卷积神经网络的阿尔茨海默病识别方法,该方法对大脑海马体图像使用卷积神经网络进行训练和识别,将同一个对象的图像识别结果用于对该对象的联合诊断,其平均识别准确率达到88.02%;文献[9]研究使用样本过滤方法解决医学数据集中的样本不平衡问题,从而提高了卷积神经网络的性能;文献[10]提出了一种基于卷积神经网络的乳糜泻诊断方法,该方法在十二指肠的内窥镜图像上训练卷积神经网络,然后使用softmax分类器和线性支持向量机进行分类,取得了良好的分类效果;文献[11]构建了多个三维卷积神经网络,从大脑的局部图像中学习各种特征,从而对阿尔茨海默病进行分类诊断;CHE Zhengping 等[12]在KDD2015上提出一种基于医学先验知识的深度人工神经网络特征提取框架,该框架利用医学本体来训练神经网络,从而发现人体生理系统与临床检测指标中的关系;文献[13]提出一种基于神经网络技术的建模方法,该方法能够预测人的心理疾病;文献[14]使用神经网络对人的头痛进行建模分析;文献[15]首次使用神经网络在临床数据的时间序列中自动学习特征,这些特征对病例的聚类和分类都有较强的可解释性。
综上所述,许多专家学者使用神经网络模型进行医学图像的分类研究,从而辅助疾病诊断,而对医学文本分类的相关研究较少。
2 相关文本分类模型介绍 2.1 TextCNNYoon Kim等[16]提出了基于卷积神经网络的文本分类模型(convolutional neural network for text, TextCNN),该模型在文本分类任务中取得了不错的成绩。TextCNN结构如图1所示,输入层将文本数据传入到模型,Embedding层将文本数据转化为词向量,卷积层(使用3个卷积核)提取数据特征,K-MaxPooling层(3个卷积核对应3个池化层)提取特征矩阵局部最大的K个值,拼接层将3个特征向量进行拼接,全连接层对特征进行降维,分类器层使用softmax分类器进行分类预测。
Download:
|
|
长短期记忆网络[16](long short term memory neural network,LSTM)是循环神经网络[17](recurrent neural network,RNN)的一种变体,能够保存长时间间隔的输入信息。基于长短期记忆网络的文本分类模型(long short term memory neural network for text, TextLSTM)通常采用双向长短期记忆网络(Bi directional long short term memory neural network, Bi-LSTM)进行构建。TextLSTM结构如图2所示,双向LSTM层主要负责提取文本向量及其上下文的特征,其他层的作用与TextCNN对应层作用相同。
Download:
|
|
Lai S等[18]在2015年提出了基于循环神经网络和卷积神经网络的文本分类模型(recurrent convolutional neural networks for text classification,RCNN)。双向循环神经网络(Bi directional recurrent neural network, Bi-RNN)比基于窗口的神经网络噪声小,能够最大化地提取文本上下文信息。RCNN结构如图3所示,双向RNN层主要负责提取文本向量及其上下文特征,拼接层将双向RNN层提取的向量进行拼接。
Download:
|
|
迁移学习是一种举一反三的能力,让机器在处理新领域(目标域)的问题时能够根据已有领域(源域)的模型和少量的数据快速训练出适合新场景的模型。根据源域和目标域中是否含有带标签样本、源域和目标域是否相同以及源域和目标域的任务是否相同可分为归纳式迁移学习、直推式迁移学习和无监督迁移学习[19]。近年来,迁移学习已经引起了广泛的关注[20-21]。
本文方法在训练诊断模型过程中分为2个步骤。1) 构建基于深度学习的分类诊断模型,在源域数据集上训练源域诊断模型,并保存源域诊断模型;2) 加载已保存的源域模型,然后将其在目标域数据集中进行训练,继而获得目标域模型(皮肤病诊断模型)。源域数据集为基于皮肤病专业书籍《皮肤性病学(第6版)》构建的虚拟数据集。目标域数据集为真实的皮肤病数据集。
《皮肤性病学(第6版)》具有专业的皮肤病理论知识与准确的皮肤病描述语言。因此,基于该书构建的皮肤病虚拟数据集具有如下特点:1)具有专业的皮肤病理论知识;2)与目标域属于相同的专业理论体系;3)与皮肤病真实数据集具有相同的特征空间。但是,虚拟数据集与真实数据集不满足独立同分布条件,在迁移学习理论中属于直推式迁移。
基于皮肤病专业书籍的虚拟数据集构建方法分为5个步骤。1) 对《皮肤性病学(第6版)》中的各种皮肤病理论知识进行抽取和整理。皮肤病理论知识由“概念”、“病因”、“发病原理”、“临床表现”、“实验室检查”、“诊断与鉴别诊断”以及“预防和治疗”等部分组成;2) 按照“主述”、“现病史”、“体格检查”等要素,将整理好的皮肤病理论知识进行对应填写,构建每种皮肤病的“标准病例模板”;3)对每种皮肤病的标准病例模板中各项内容进行合理划分,可根据“,”、“。”以及知识连接紧密性进行划分,将每个模块划分为多个短句;4)在一种皮肤病标准病例模板的每一项内容中,以随机的方式无放回地抽取数量为该项内容短句总数50%的短句,将所得短句组合成一个虚拟病例,重复执行本步可获得大量该病种的虚拟病例;5) 对每种皮肤病均重复步骤4),可获得大量虚拟病例。通过该方法获得的虚拟数据集即为源域数据集,用于训练源域模型。
3.2 皮肤病辅助诊断方法为避免其他机器学习方法无法有效表达病情发展的时间顺序、难以构建复杂函数模型以及繁重的特征工程等缺点,同时针对皮肤病数据小样本问题,本文提出了融合迁移学习和神经网络的皮肤病辅助诊断方法(method based on transfer learning and neural networks for classification,TLNN)。
1)模型构建
皮肤病诊断模型构建流程如图4所示。首先,对皮肤病专业书籍进行知识抽取和整理,获得皮肤病的相关知识;然后,使用虚拟数据集构建方法,建立皮肤病虚拟数据集,即为源域数据集;接下来,在虚拟数据集上预训练TextLSTM、TextCNN以及RCNN 3个神经网络文本分类模型,即为源模型;最后,使用迁移学习技术,将源模型在皮肤病真实数据集上继续训练,获得最终的皮肤病诊断模型。
Download:
|
|
算法1详细叙述了融合迁移学习和神经网络的皮肤病诊断模型构建方法,如步骤①~②所示。预训练数据集Dpre为虚拟数据集,数据集中的任意一个数据xi为生成的虚拟病例样本;皮肤病数据集D为真实数据集,数据集中的任意一个数据xi为真实病例样本。算法分为3个步骤:1)进行源模型训练;2)进行真实数据训练;3)进行模型融合,获得最终的皮肤病诊断模型。
算法1 融合迁移学习和神经网络的皮肤病诊断模型构建方法
输入 预训练数据集
输出 皮肤病诊断模型F。
源模型训练:使用基于神经网络的文本分类模型在预训练数据集Dpre上训练皮肤病诊断模型
$ {{\rm{Model}}_{{\rm{pre}}}^{\left( i \right)}\left( x \right) = {\rm{PreTrain}}\left( {{D_{{\rm{pre}}}}} \right)} $ | (1) |
真实数据训练:使用预训练获得的模型
$ {{\rm{Mode}}{{\rm{l}}^{\left( i \right)}}\left( x \right) = {\rm{Train}}\left( {{\rm{Model}}_{{\rm{pre}}}^{\left( i \right)}\left( x \right),D} \right)} {\rm{}}$ | (2) |
模型融合:
① 使用TextCNN、TextLSTM以及RCNN模型依次执行步骤①、②,获得3个皮肤病诊断模型
② 通过概论等权重融合方式将多个皮肤病诊断模型组合为一个皮肤病诊断模型为
$ {{F_j}\left( x \right) = \{ {F_{ {{\rm{TextCNN}}} }}\left( x \right),{F_{ {{\rm{TextLSTM}}} }}\left( x \right),} {F_{ {{\rm{RCNN}}} }}\left( x \right)\} $ | (3) |
2)诊断
给定一个未知皮肤病标签集合的病例样本,诊断其可能的皮肤病标签集合,实现方法如下:
① 给定待预测样本x;
②根据诊断器
$ {{{P}_{{\rm{TextLSTM}}}} = {F_{ {{\rm{TextLSTM}}} }}\left( x \right)} $ | (4) |
$ {{{P}_{{\rm{TextCNN}}}} = {F_{ {{\rm{TextCNN}}} }}\left( x \right)} $ | (5) |
$ {{{ P}_{{\rm{RCNN}}}} = {F_{ {{\rm{RCNN}}} }}\left( x \right)} $ | (6) |
③ 对于待预测样本x,3个基础诊断器给出了3个向量,采用等概率加权融合的方式可以确定出最终诊断器F给出的概率Px,如式(7)所示。向量中值最大一维j所对应的疾病标签cj即为样本x的诊断结果。
$ {{{P}_{x \in {c_j}}} = {F_j}\left( x \right) = \frac{1}{3}{P_{{\rm{RCNN}}}}} + \frac{1}{3}{P_{{\rm{TextRNN}}}} + \frac{1}{3}{P_{{\rm{TextCNN}}}}$ | (7) |
本文将融合迁移学习和神经网络的皮肤病诊断方法与其他文本分类方法在皮肤病二分类与多分类数据集上进行了对比实验,对比方法有TextCNN、TextLSTM以及RCNN等。
文本形式病例数据全部来自“爱爱医医学网-病例中心”(
本文采用准确率(Precision)和召回率(Recall)2个指标对模型在二分类数据集上的表现进行评价。本文根据样本的预测标签值和原始标签值将样本进行划分:TP表示预测模型结果为正样本,真实标签为正样本的样本个数;FP表示预测模型结果为正样本,真实标签为负样本的样本个数;TN表示预测模型结果为负样本,真实标签为负样本的样本个数;FN表示预测模型结果为负样本,真实标签为正样本的样本个数。本文采用的精确率、召回率分别如式(8)、(9)计算。本文采用正确率(Accuracy)对模型在多分类数据集上的表现进行评价,T表示被正确分类的样本数量、N表示样本总数,正确率使用式(10)进行计算。
$ {{\rm{Precision}} = \frac{{{\rm{TP}}}}{{{\rm{TP}} + {\rm{FP}}}}} $ | (8) |
$ {{\rm{Recall}} = \frac{{{\rm{TP}}}}{{{\rm{TP}} + {\rm{FN}}}}} $ | (9) |
$ {{\rm{Accuracy}} = \frac{{\rm{T}}}{{\rm{N}}}}$ | (10) |
多种分类方法在皮肤病二分类数据集上的准确率如表3所示,召回率如表4所示,使用迁移学习后的准曲率和召回率如表5、6所示。未使用迁移学习技术时,TextLSTM在1种皮肤病上准确率最高,在0种皮肤病上召回率最高;TextCNN在5种皮肤病上准确率最高,在4种皮肤病上召回率最高;RCNN在1种皮肤病上准确率最高,在3种皮肤病上召回率最高。使用迁移学习技术后,TextCNN在4种皮肤病上准确率最高,RCNN在2中皮肤病上准确率最高。
在不使用迁移学习的情况下,神经网络模型等权重融合方法(fusion method of neural network, FMNN)在7种皮肤病中的3种皮肤病上准确率最高,仅次于TextCNN;在2种皮肤病上召回率最高,仅次于TextCNN。在使用迁移学习的情况下,TLNN方法在2种皮肤病上准确率最高,仅次于TextCNN;在3种皮肤病上召回率最高,为最优模型。迁移学习的使用对7个皮肤病二分类数据集和4种实验方法共28个准确率中的22个产生了积极影响,积极影响率为78.57%;对21个召回率产生了积极影响,积极影响率为75.00%。
本文方法在皮肤病多分类数据集上的正确率如表7所示。在皮肤病多分类实验中,迁移学习对4种方法的正确率均产生了积极影响,最高可提升20.14%。本文提出的TLNN方法正确率最高,为84.17%,比第2名方法RCNN高0.84%。
为证明本文方法相对于非神经网络文本分类方法的优越性,本文使用空间模型对皮肤病文本病例数据进行形式化,然后通过朴素贝叶斯(NB)、决策树(DT)、K最邻近(KNN)、TF-IDF与余弦相似度结合的方法(TICS)以及随机森林(RF)进行实验。4种对比方法在二分类任务上的准确率和召回率分别如表8、9所示,在多分类任务上的正确率如表10所示。对比表5和表8可知,在二分类实验中,本文方法的准确率在6种皮肤病上高于4种对比方法;对比表6和表9可知,在二分类实验中,本文方法的召回率在7种皮肤病上高于4种对比方法;对比表7和表10可知,在多分类实验中,本文方法的正确率高于4种非神经网络文本分类方法。
在皮肤病二分类数据集上,本文提出融合迁移学习和神经网络的皮肤病辅助诊断方法的召回率优于TextLSTM、TextCNN、RCNN 3种神经网络文本分类方法,以及NB、DT、KNN、TICS 4种方法;准确率仅次于TextCNN。在皮肤病多分类数据集上,本文方法的正确率优于对比方法。迁移学习的使用将皮肤病专业书籍中的理论知识有效地迁移到了诊断模型中,对实验结果产生了积极影响。在二分类实验中,迁移学习的积极影响率高于75%,在多分类实验中,迁移学习的积极影响率为100%。
5 结束语本文提出了融合迁移学习和神经网络的皮肤病辅助诊断方法,针对传统机器学习算法对复杂函数的表达能力有限,特征构建工作耗费大量人工成本,以及基于医学特征的机器学习诊断方法难以表达皮肤病临床表现的时间顺序性等问题进行了改进,根据皮肤病书籍知识构建的虚拟数据集预训练神经网络模型,使用迁移学习技术将书籍中的皮肤病知识迁移到皮肤病诊断模型中,在皮肤病数据集上继续训练皮肤病诊断模型。本文使用皮肤病数据集进行实验,通过与基于神经网络的文本分类方法TextLSTM、TextCNN、RCNN以及非神经网络文本分类方法NB、DT、RF、KNN、TICS进行对比,本文方法取得了较好的实验效果。
[1] |
尤艳明, 李邻峰. 北京市海淀区社区人群常见皮肤病流行病学调查及风险因素分析[J]. 中国皮肤性病学杂志, 2011, 25(6): 459-461. YOU Y M, LI L F. The prevalence of skin diseases in a community of beijing and analysis of risk factors[J]. The Chinese journal of dermatovenereology, 2011, 25(6): 459-461. (0) |
[2] | JIANG Weiqin, SHEN Yifei, DING Yongfeng, et al. A naive Bayes algorithm for tissue origin diagnosis (TOD-Bayes) of synchronous multifocal tumors in the hepatobiliary and pancreatic system[J]. International journal of cancer, 2018, 142(2): 357-368. DOI:10.1002/ijc.31054 (0) |
[3] | SAYIN R, KESKIN S, HAMAMCI M. Evaluation of several classification methods in carpal tunnel syndrome[J]. The journal of the Pakistan medical association, 2017, 67(11): 1654-1657. (0) |
[4] | EL BAKRAWY L M. Grey wolf optimization and naive Bayes classifier incorporation for heart disease diagnosis[J]. Australian journal of basic and applied sciences, 2017, 11(7): 64-70. (0) |
[5] | LIU Jingzhou, CHANG Weicheng, WU Yuexin, et al. Deep learning for extreme multi-label text classification [C]//Proceedings of the 40th International ACM SIGIR Conference on Research and Development in Information Retrieval. Shinjuku, Japan, 2017: 115–124. (0) |
[6] |
王诗琪, 刘洁, 朱晨雨. 皮肤科医师与深度卷积神经网络诊断色素痣和脂溢性角化病皮肤镜图像比较[J]. 中华皮肤科杂志, 2018, 51(7): 486-489. WAMG S Q, LIU J, ZHU C Y. Comparison of diagnostic performance of dermatologists versus deep convolutional neural network for dermoscopic images of pigmented nevus and seborrheic keratosis[J]. Chinese journal of dermatology, 2018, 51(7): 486-489. DOI:10.3760/cma.j.issn.0412-4030.2018.07.002 (0) |
[7] | ESTEVA A, KUPREL B, NOVOA R A, et al. Dermatologist-level classification of skin cancer with deep neural networks[J]. Nature, 2017, 542(7639): 115-118. DOI:10.1038/nature21056 (0) |
[8] |
林伟铭, 高钦泉, 杜民. 卷积神经网络诊断阿尔兹海默症的方法[J]. 计算机应用, 2017, 37(12): 3504-3508. LIN Weiming, GAO Qinquan, DU Min. Convolutional neural network based method for diagnosis of Alzheimer's disease[J]. Journal of computer applications, 2017, 37(12): 3504-3508. DOI:10.11772/j.issn.1001-9081.2017.12.3504 (0) |
[9] | DOU Qi, CHEN Hao, JIN Yueming, et al. Automated pulmonary nodule detection via 3D ConvNets with online sample filtering and hybrid-loss residual learning[C]//Proceedings of the 20th International Conference on Medical Image Computing and Computer-Assisted Intervention. Quebec City, Canada, 2017: 630–638. (0) |
[10] | WIMMER G, VÉCSEI A, UHL A. CNN transfer learning for the automated diagnosis of celiac disease[C]//Proceedings of the 2016 Sixth International Conference on Image Processing Theory, Tools and Applications. Oulu, Finland, 2016: 1–6. (0) |
[11] | CHENG Danni, LIU Manhua, FU Jianliang, et al. Classification of MR brain images by combination of multi-CNNs for AD diagnosis[C]//Proceedings of the SPIE 10420, Ninth International Conference on Digital Image Processing. Hong Kong, China, 2017: 1042042. (0) |
[12] | CHE Zhengping, KALE D, LI Wenzhe, et al. Deep computational Phenotyping[C]//Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Australia, 2015: 507–516. (0) |
[13] | DABEK F D, CABAN J J. A neural network based model for predicting psychological conditions[C]//Proceedings of 8th International Conference on Brain Informatics and Health. London, UK, 2015: 252–261. (0) |
[14] | RUGHANI A I, DUMONT T M, LU Zhenyu, et al. Use of an artificial neural network to predict head injury outcome: clinical article[J]. Journal of neurosurgery, 2010, 113(3): 585-590. DOI:10.3171/2009.11.JNS09857 (0) |
[15] | LASKO T A, DENNY J C, LEVY M A. Computational phenotype discovery using unsupervised feature learning over noisy, sparse, and irregular clinical data[J]. PLoS one, 2013, 8(6): e66341. DOI:10.1371/journal.pone.0066341 (0) |
[16] | KIM Y. Convolutional neural networks for sentence classification[C]//In Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2014: 1746–1751. (0) |
[17] | HOPFIELD J J. Neural networks and physical systems with emergent collective computational abilities[J]. Proceedings of the national academy of sciences of the United States of America, 1982, 79(8): 2554-2558. DOI:10.1073/pnas.79.8.2554 (0) |
[18] | LAI Siwei, XU Liheng, LIU Kang, et al. Recurrent convolutional neural networks for text classification[C]//Proceedings of the Twenty-Ninth AAAI Conference on Artificial Intelligence. Austin, USA, 2015: 2267–2273. (0) |
[19] |
庄福振, 罗平, 何清, 等. 迁移学习研究进展[J]. 软件学报, 2015, 26(1): 26-39. ZHUANG Fuzhen, LUO Ping, HE Qing, et al. Survey on transfer learning research[J]. Journal of software, 2015, 26(1): 26-39. (0) |
[20] | PAN S J, YANG Q. A survey on transfer learning[J]. IEEE transactions on knowledge and data engineering, 2010, 22(10): 1345-1359. DOI:10.1109/TKDE.2009.191 (0) |
[21] | WEI Fengmei, ZHANG Jianpei, CHU Yan, et al. FSFP: transfer learning from long texts to the short[J]. Applied mathematics & information sciences, 2014, 8(4): 2033-2040. (0) |