自闭症又叫孤独症,是一种广泛性神经失调的发展障碍疾病,其临床表现主要为社会交往障碍、言语交流障碍和动作刻板重复等[1-3]。自1943 年利奥·坎纳医生首次对自闭症做出经典性描述以来,该疾病因其病因不明确,又集多种障碍于一身,已经得到了广泛的关注。目前,在美国平均每68名儿童中就有1名自闭症儿童;在世界范围内,自闭症患者超过1%。据统计,约2/3孤独症患儿成年后无法独立生活,需要终生照顾和看护。为此,人们迫切希望寻找科学而高效的手段对自闭症进行准确诊断以达到早发现早治疗的目的。
已有研究表明,自闭症患者行为和认知缺陷与潜在的脑功能异常有关。静息态fMRI技术[4-9]通过使用血氧水平依赖(blood oxygenation level dependent, BOLD)信号可以有效地反映患者在静息状态下脑部血流和代谢活动等功能性变化,因此在自闭症的辅助诊断中起着重要的作用。基于静息态的医学影像诊断大致可分为特征提取和分类器设计这两个阶段。在特征提取阶段,通过使用相关性特征选择等方法从高维医学影像特征中得到有鉴别意义的特征;在分类器设计阶段,通过使用线性或非线性分类器进行分类。但是目前多采用线性特征学习方法,虽然具有简单高效等优点,但是尚不能有效挖掘出医学影像数据中的复杂信息。
本文基于静息态fMRI提出了一种新型的无监督模糊特征学习方法,并在此基础上构造多视角分类器从而实现自闭症的辅助诊断。其技术路线可概括为:首先,将静息态fMRI经过预处理后,基于Pearson相关系数构造低阶功能连接矩阵,并使用文献[7]的方法构造高阶功能连接矩阵;然后,提出新型的无监督模糊特征学习方法,将2种功能连接矩阵分别映射到不同的低维嵌入空间中;最后,以低阶和高阶功能连接在脑疾病诊断中的互补性为出发点,设计多视角SVM[10]分类器进行分类。
1 实验数据集及处理本文使用的数据集来自ABIDE(autism brain imaging datae xchange)数据库(http://preprocessed-connectomes-project.org/abide/download.html)的NYU子集和USM子集,采集对象的FIQ(full-scale intelligence quotient)范围为65~150。实验所处理对象的相关信息如表1和表2所示。
每个对象的fMRI数据使用DPARSF(data processing assistant for resting-state fMRI)[11]工具进行处理。处理步骤主要包括:1)去除功能磁共振图像序列前10个时间点的数据;2)时间层校正和头部运动校正;3)数据通过统一使用T1加权图像分割并将其归一化到MNI152(montreal neurological institute 152)标准空间中;4)使用AAL (anatomical automatic labeling)模板将大脑划分成116个脑区,每个区域重新采样3×3×3 mm3的体素;5)使用半高全宽高斯核进行空间平滑处理;6)应用带通滤波(0.01~0.1 Hz)去除噪声;7)去线性漂移并进行全局信号校正去干扰变量;8)计算每个脑区的平均时间序列。
2 基于fMRI数据的无监督模糊特征学习方法 2.1 方法流程基于静息态fMRI进行自闭症辅助诊断包括训练和测试两个阶段。本文所采用的训练过程如图1所示,各步骤包括:
1)根据预处理后的静息态功能磁共振成像数据,提取出各脑区的平均时间序列信号,计算脑区之间的Pearson系数,得到低阶功能连接矩阵
2)将低阶功能连接矩阵的每一行作为各脑区的特征描述,再次计算脑区之间的Pearson系数,得到高阶功能连接矩阵
3)分别取低阶和高阶功能连接矩阵
4)使用无监督模糊特征映射方法对低阶和高阶功能连接的特征矩阵进行特征学习,得到相应的变换矩阵
5)基于4)得到的嵌入矩阵
6)将2种不同的核矩阵进行线性组合得到复合核矩阵。
7)构造相应的SVM分类器。
Download:
|
|
虽然大脑各脑区在空间上相互隔离,但它们之间的神经活动相互影响,通常使用功能连接矩阵来表示脑区之间的时间相关性[12]。本文使用文献[8]中的方法,基于每个脑区fMRI时间序列来计算每个对象各脑区之间的Pearson相关系数,得到低阶功能连接矩阵
为了在无监督环境中将高维空间中的样本点映射到S维的低维空间,本文引入多输出TSK模糊建模方法。TSK模糊系统是由形式为“IF-THEN”的模糊规则组成的,对于多输出TSK模糊系统,给定任意一个D维输入向量
$ \begin{split} & {\rm{if}}\;\;\;\;{x_1}\;{\rm{is}}\;A_1^k \wedge {x_2}\;{\rm{is}}\;A_2^k \wedge \cdots\;\wedge {x_D} \wedge\;A_D^k, {\rm{then}} \\ & \left\{ \begin{array}{l} f_1^k\left( {{x}} \right) = \beta _0^{k,1} + \beta _1^{k,1}{x_1} + \cdots + \beta _D^{k,1}{x_D}\\ f_2^k\left( {{x}} \right) = \beta _0^{k,2} + \beta _1^{k,2}{x_1} + \cdots + \beta _D^{k,2}{x_D}\\ \qquad\qquad\qquad \vdots \\ f_S^k\left( {{x}} \right) = \beta _0^{k,S} + \beta _1^{k,S}{x_1} + \cdots + \beta _D^{k,S}{x_D} \end{array} \right. \end{split} $ |
式中:
本文采用高斯函数表示模糊规则的模糊集,即
${\mu _{A_d^k}}\left( {{x_d}} \right) = {\rm{exp}}\left( {\frac{{ - {{\left( {{x_d} - c_d^k} \right)}^2}}}{{2\delta _d^k}}} \right)$ | (1) |
并使用式(2)、式(3)来计算每个样本相对于每条模糊规则的点火强度:
${\mu ^k}\left( x \right) = \prod\limits_{d = 1}^D {{\mu _{A_d^k}}\left( {{x_d}} \right)} $ | (2) |
${\tilde \mu ^k}\left( x \right) = \frac{{{\mu ^k}\left( x \right)}}{{\displaystyle\sum\limits_{k = 1}^K {{\mu ^k}\left( x \right)} }}$ | (3) |
参数
$c_d^k = \sum\limits_{i = 1}^N {{u_{ik}}{x_{id}}} /\sum\limits_{i = 1}^N {{u_{ik}}} $ | (4) |
$\delta _d^k = h \cdot \sum\limits_{i = 1}^N {{u_{ik}}{{\left( {{x_{id}} - c_d^k} \right)}^2}} /\sum\limits_{i = 1}^N {{u_{ik}}} $ | (5) |
式中:
${y_s} = \sum\limits_{k = 1}^K {{{\tilde \mu }^k}\left( {{x}} \right) \cdot f_s^k\left( {{x}} \right)} $ | (6) |
式中
令
${{{X}}_e} = \left( {{\bf{1}},{{X}}} \right)$ | (7) |
${\tilde {{X}}^k} = {\rm{diag}}\left( {{{\tilde \mu }^k}\left( {{{{x}}_1}} \right),{{\tilde \mu }^k}\left( {{{{x}}_2}} \right), \cdots ,{{\tilde \mu }^k}\left( {{{{x}}_N}} \right)} \right){{{X}}_e}$ | (8) |
${{{X}}_g} = {\left( {{{\left( {{{\tilde {{X}}}^1}} \right)}^{\rm{T}}}{{\left( {{{\tilde {{X}}}^2}} \right)}^{\rm{T}}} \cdots {{\left( {{{\tilde {{X}}}^K}} \right)}^{\rm{T}}}} \right)^{\rm{T}}}$ | (9) |
${{{\beta}} ^{s,k}} = {\left( {\beta _0^{s,k},\beta _1^{s,k}, \cdots ,\beta _D^{s,k}} \right)^{\rm{T}}}$ | (10) |
${{{\beta}} ^s} = {\left( {{{\left( {{{{\beta}} ^{s,1}}} \right)}^{\rm{T}}},{{\left( {{{{\beta}} ^{s,2}}} \right)}^{\rm{T}}}, \cdots ,{{\left( {{{{\beta}} ^{s,K}}} \right)}^{\rm{T}}}} \right)^{\rm{T}}}$ | (11) |
${{{\beta}} _g} = \left[ {{{{\beta}} ^1}\quad{{{\beta}} ^2}\quad \cdots\quad {{{\beta}} ^S}} \right]$ | (12) |
$f\left( {{X}} \right) = {{{X}}_g}{{{\beta}} _g}$ | (13) |
式(7)~(13)表述的多输出TSK模糊系统建模过程可以看作将
$ \begin{array}{c} \mathop {\min }\limits_{{{{\beta}} _g} \in {R^{\left( {D + 1} \right)K \times S}}} \parallel {{{\beta}} _g}{\parallel _F} + {\textit{λ}} {\rm{tr}}\left( {{{\beta}} _g^{\rm{T}}{{X}}_g^{\rm{T}}{{L}}{{{X}}_g}{{{\beta}} _g}} \right) \\ {\rm{s.t.}} {\left( {{{{X}}_g}{{{\beta}} _g}} \right)^{\rm{T}}}{{{X}}_g}{{{\beta}} _g} = {{{I}}_S} \end{array} $ | (14) |
式中:
本文中所涉及的场景是典型的高维小样本问题,故满足
$\left( {{{{I}}_N} + {\textit{λ}} {{L}}{{{X}}_g}{{X}}_g^{\rm{T}}} \right){{u}} = \gamma {{{X}}_g}{{X}}_g^{\rm{T}}{{u}}$ | (15) |
在得到最小 S 个特征值
${{{\beta}} _g} = {{X}}_g^{\rm{T}}\left( {{{\tilde {{u}}}_2},{{\tilde {{u}}}_3},\cdots,{{\tilde {{u}}}_{S + 1}}} \right)$ | (16) |
式中:
无监督模型模糊特征学习的过程如图2所示。
Download:
|
|
在模型训练过程中,本文分别对低阶功能连接数据
${{E}}_{{\rm{tr}}}^{\rm{l}}{\rm{ = }}{\left( {{{X}}_{\rm{tr}}^{\rm{l}}} \right)_g}{{\beta}} _g^{\rm{l}}$ | (17) |
${{E}}_{{\rm{tr}}}^{\rm{h}}{\rm{ = }}{\left( {{{X}}_{\rm{tr}}^{\rm{h}}} \right)_g}{{\beta}} _g^{\rm{h}}$ | (18) |
基于上述模糊特征学习过程得到低阶和高阶嵌入矩阵
${{K}}_{{\rm{tr}}}^{\rm{l}} = {{E}}_{{\rm{tr}}}^{\rm{l}}{\left( {{{E}}_{{\rm{tr}}}^{\rm{l}}} \right)^{\rm{T}}}$ | (19) |
${{K}}_{{\rm{tr}}}^{\rm{h}} = {{E}}_{{\rm{tr}}}^{\rm{h}}{\left( {{{E}}_{{\rm{tr}}}^{\rm{h}}} \right)^{\rm{T}}}$ | (20) |
使用式(21)对核矩阵进行线性组合,得到最终的复合核矩阵
${{{K}}_{{\rm{tr}}}} = {\theta _1}{{K}}_{{\rm{tr}}}^{\rm{l}} + {\theta _2}{{K}}_{{\rm{tr}}}^{\rm{h}}$ | (21) |
式中:
本节通过实验验证本文方法的有效性并与已有方法进行比较。本文选取精确度(ACC)、AUC值、敏感度(SEN)、特异性(SPE)作为实验的评价指标,实验的参数设置使用嵌套五折交叉验证来进行寻优。相关方法的表述及各参数的详细设置等信息如表3所示。
本文采用式(22)~(24)计算性能指标,以此进行算法性能评估:
${\rm{ACC}} = \frac{{{\rm{TP}} + {\rm{TN}}}}{{{\rm{TP}} + {\rm{FN}} + {\rm{TN}} + {\rm{FP}}}}$ | (22) |
${\rm{SEN}} = \frac{{{\rm{TP}}}}{{{\rm{TP}} + {\rm{FN}}}}$ | (23) |
${\rm{SPE}} = \frac{{{\rm{TN}}}}{{{\rm{TN}} + {\rm{FP}}}}$ | (24) |
式中:TP和TN分别代表正确分类为自闭症患者的人数和正确分类为正常对照组的人数;FP和FN分别代表正常个体被分类为自闭症患者的人数以及自闭症患者被分类为正常对照组的人数[17];灵敏度SEN作为衡量该方法准确预测出自闭症患者的能力的指标;特异性SPE是衡量该方法准确预测出健康个体的能力指标。本文实验使用LIBSVM[18]工具包中的高斯核SVM。
3.2 分类结果及分析从表4和表5中可以看到,UFFM-M2SVC使用无监督模糊特征映射算法UFFM进行特征学习,在此基础上构造分类器M2SVC,可以取得比LOFCC、HOFCC及M2SVC等传统分类器更好的性能。
M2SVC算法联合使用两个视角的数据进行分类,其分类结果要明显优于基于单视角的分类器LOFCC和HOFCC;而本文方法采用新型的模糊特征学习技术进行特征学习,在此基础上使用M2SVC进行分类,从而取得了比仅使用M2SVC更好的效果,这表明本文所使用的模糊特征学习技术能够得到更有鉴别能力的特征,这对自闭症的诊断具有更优的判别能力。
3.3 特征数目对实验结果的影响本节研究UFFM所提取的特征数目S对M2SVC性能的影响,图3和图4中给出了算法在数据集NYU和USM上S取不同值时M2SVC的分类结果。从图3和图4可以看出,UFFM-M2SVC算法的分类准确率随着S取值的不同而发生变化,图3中最高达到78.38%,图4中最高达到78.95%,均比M2SVC算法提高了约5%。可知,在特征提取数S合理取值的情况下,本文使用UFFM进行无监督模糊特征学习,不仅可以有效保留原始有效的特征信息,而且去除了其中包含的冗余信息,使得自闭症患者和正常对照组之间的特征差异更有区分性。
Download:
|
|
Download:
|
|
自闭症患者的脑区神经活动异于常人。以此为出发点,本文基于静息态fMRI提出了一种面向自闭症辅助诊断的无监督模糊特征学习方法UFFM,并与M2SVC相结合,从而实现了自闭症的辅助诊断。相对于目前传统的分类算法,UFFM-M2SVC算法训练出的分类模型具有优越且稳定的分类性能。实验结果表明,本文所使用的无监督模糊特征学习方法能够有效地提取出fMRI数据中的重要特征,从而有助于自闭症的临床辅助诊断。但是,本文仅基于静息态fMRI数据进行实验,针对任务态fMRI数据的分类效果还未可知,有待进一步的研究。
[1] | DUAN Xujun, CHEN Heng, HE Changchun, et al. Resting-state functional under-connectivity within and between large-scale cortical networks across three low-frequency bands in adolescents with autism[J]. Progress in neuro-psychopharmacology and biological psychiatry, 2017, 79: 434-441. DOI:10.1016/j.pnpbp.2017.07.027 (0) |
[2] | DICKIE E W, AMEIS S H, SHAHAB S, et al. Personalized intrinsic network topography mapping and functional connectivity deficits in autism spectrum disorder[J]. Biological psychiatry, 2018, 84(4): 278-286. DOI:10.1016/j.biopsych.2018.02.1174 (0) |
[3] |
徐云, 杨健. 自闭症早期发现研究进展[J]. 中国临床心理学杂志, 2014, 22(6): 1023-1027. XU Yun, YANG Jian. The research progress of the early recognization of autism[J]. Chinese journal of clinical psychology, 2014, 22(6): 1023-1027. (0) |
[4] | BULLMORE E, SPORNS O. Complex brain networks: graph theoretical analysis of structural and functional systems[J]. Nature reviews neuroscience, 2009, 10(3): 186-198. DOI:10.1038/nrn2575 (0) |
[5] | BULLMORE E, SPORNS O. The economy of brain network organization[J]. Nature reviews neuroscience, 2012, 13(5): 336-349. DOI:10.1038/nrn3214 (0) |
[6] | PLIS S M, SUI Jing, LANE T, et al. High-order interactions observed in multi-task intrinsic networks are dominant indicators of aberrant brain function in schizophrenia[J]. NeuroImage, 2014, 102: 35-48. DOI:10.1016/j.neuroimage.2013.07.041 (0) |
[7] | CHEN Xiaobo, ZHANG Han, GAO Yue, et al. High-order resting-state functional connectivity network for MCI classification[J]. Human brain mapping, 2016, 37(9): 3282-3296. DOI:10.1002/hbm.v37.9 (0) |
[8] | MEUNIER D, ACHARD S, MORCOM A, et al. Age-related changes in modular organization of human brain functional networks[J]. NeuroImage, 2009, 44(3): 715-723. DOI:10.1016/j.neuroimage.2008.09.062 (0) |
[9] | DSOUZA A M, ABIDIN A Z, CHOCKANATHAN U, et al. Mutual connectivity analysis of resting-state functional MRI data with local models[J]. NeuroImage, 2018, 178: 210-223. DOI:10.1016/j.neuroimage.2018.05.038 (0) |
[10] | CORTES C, VAPNIK V. Support-vector networks[J]. Machine learning, 1995, 20(3): 273-297. (0) |
[11] | YAN Chaogan, ZANG Yufeng. DPARSF: a MATLAB toolbox for " pipeline” data analysis of resting-state fMRI[J]. Frontiers in systems neuroscience, 2010, 4(13): 13. (0) |
[12] | LAUFS H, DUNCAN J S. Electroencephalography/functional MRI in human epilepsy: what it currently can and cannot do[J]. Current opinion in neurology, 2007, 20(4): 417-423. DOI:10.1097/WCO.0b013e3282202b92 (0) |
[13] | KESHAVARZI A, SARMADIAN F, SHIRI J, et al. Application of ANFIS-based subtractive clustering algorithm in soil Cation Exchange Capacity estimation using soil and remotely sensed data[J]. Measurement, 2017, 95: 173-180. DOI:10.1016/j.measurement.2016.10.010 (0) |
[14] | DAMAYANTI A. Fuzzy learning vector quantization, neural network and fuzzy systems for classification fundus eye images with wavelet transformation[C]//Proceedings of the 2nd International Conferences on Information Technology, Information Systems and Electrical Engineering (ICITISEE). Wuhan, China, 2017: 331−336. (0) |
[15] | DENG Zhaohong, JIANG Yizhang, CHOI K S, et al. Knowledge-leverage-based TSK Fuzzy System modeling[J]. IEEE transactions on neural networks and learning systems, 2013, 24(8): 1200-1212. DOI:10.1109/TNNLS.2013.2253617 (0) |
[16] | ZHANG Daoqiang, WANG Yaping, ZHOU Luping, et al. Multimodal classification of Alzheimer's disease and mild cognitive impairment[J]. NeuroImage, 2011, 55(3): 856-867. DOI:10.1016/j.neuroimage.2011.01.008 (0) |
[17] | POWERS D M W. Evaluation: from precision, recall and F-factor to ROC, informedness, markedness and correlation[J]. Journal of machine learning technologies, 2011, 2(1): 37-83. (0) |
[18] | CHANG C C, LIN C J. LIBSVM: a library for support vector machines[J]. ACM transactions on intelligent systems and technology, 2011, 2(3): 27. (0) |