代谢组研究的生物信息学方法

文章信息

李连伟, 张阿梅, 马占山.

LI Lian-wei, ZHANG A-mei, MA Zhan-shan.

代谢组研究的生物信息学方法

Bioinformatics Methods for Metabolome Research

中国生物工程杂志, 2017, 37(1): 89-96

China Biotechnology, 2017, 37(1): 89-96

http://dx.doi.org/DOI:10.13523/j.cb.20170113

文章历史

收稿日期: 2016-09-29

修回日期: 2016-11-26

Abstract

PDF

Figures

Tables

引用本文

李连伟,张阿梅,马占山. 代谢组研究的生物信息学方法[J]. 中国生物工程杂志, 2017, 37(1): 89-96. 复制到剪切板

LI Lian-wei,ZHANG A-mei,MA Zhan-shan. Bioinformatics Methods for Metabolome Research[J]. China Biotechnology, 2017, 37(1): 89-96. 复制到剪切板

代谢组研究的生物信息学方法

李连伟^1,2 , 张阿梅¹ , 马占山²

1. 昆明理工大学生命科学与技术学院昆明 650500；
2. 中国科学院昆明动物研究所计算生物与医学生态学实验室昆明 650223

收稿日期: 2016-09-29; 修回日期: 2016-11-26

通讯作者: 电子信箱：zam1980@yeah.net ; 电子信箱：ma@alumni.uidaho.edu

摘要: 代谢组是细胞新陈代谢过程中小分子代谢物的集合。新陈代谢为细胞提供生理活动必需的物质和能量。代谢组直接反映细胞的新陈代谢过程，对代谢组的研究体现细胞的功能。细胞功能的异常会导致代谢组的异常，因此通过代谢组数据即可分析出细胞的健康状况。对代谢组物质的提取鉴定过程和代谢组数据的分析方法，主要是对代谢组数据整理和代谢网络推断过程进行综述。

关键词: 代谢组 KEGG 网络

Bioinformatics Methods for Metabolome Research

LI Lian-wei^1,2 , ZHANG A-mei¹ , MA Zhan-shan²

1. Faculty of Life Science and Technology, Kunming University of Science and Technology, Yunnan 650500, China;
2. Computational Biology and Medical Ecology Lab, State Key of Genetic Resource and Evolution, Kunming Institute of Zoology, Chinese Academy of Science, Yunnan 650223, China

Abstract: The metabolome refers to a set of small molecular metabolites. The main purposes of metabolism are the conversion of fuel to energy to run cellular processes. The metabolome can reflect the process of metabolism, As a result, a cell's metabolome can serve as an excellent probe of its function. Cell function abnormality leads to the abnormal changes of metabolom, so metabolome can be assessment standards of the function of cell. The process of extraction and identification of metabolites and the analysis of metabolic data were briefly reviewed, including the pre-processing and network constructed of metabolome datasets.

Key words: Metabolome KEGG Network

1 代谢组简介

生命共有的一个重要特征是能够进行新陈代谢(metabolism)，新陈代谢是细胞中所有生物化学反应的集合，它保证生物个体与环境时刻进行物质和能量的交换，为生物体各种生命活动提供物质和能量。

生物体新陈代谢过程中产生的化学小分子称为代谢物(metabolite)，细胞中小分子代谢物的集合即为细胞的代谢组(metabolome)。“代谢组”一词最早由Stephen G. Oliver于1998年在研究酵母菌系统功能时提出^[1]。因为细胞中生物化学反应时刻在进行，所以细胞的代谢组是一个动态的集合，代谢组反映的是细胞的实时功能，尤其是当细胞所处环境发生变化时，细胞对环境变化的应答会通过代谢组表现出来。

传统的代谢组研究是通过物理或化学的方法对特定时期细胞中的小分子物质进行提取并鉴定，然后根据已有的生物学知识，推断所测组织细胞中的代谢路径。但是由于传统实验技术的限制，无法提取和鉴定出细胞全部的代谢物，对代谢物的提取和鉴定结果并不能完全代表细胞的功能活性。进入21世纪以来，生物测序技术的飞速发展使得对基因组、转录组和蛋白质组的研究也得到了相应的发展，对代谢组的研究也能够依靠以上组学数据应用生物信息学的方法来进行。不仅细胞内的代谢物之间存在相互作用，细胞组织之间也存在化学物质的相互影响、相互调控，所以对代谢组的研究需要从生命系统整体出发，用系统生物学方法进行研究。因此，对代谢组进行生物信息学分析时，可以引进网络的概念，构建代谢网络，通过网络的性质研究代谢物之间的关系^[2]。2007年，加拿大艾伯塔大学和卡尔加里大学的科学家构建了第一个人类代谢组数据库，其中包括人体中大约2 500种代谢物、1 200种药物和3 500种食物成分。2013年，建立了比较完整的人类代谢组数据库(http://www.hmdb.ca/)，其中人体代谢物的种类已经达到40 000多种，包含人体中小分子代谢物及其相互作用的详细信息^[3]。

KEGG(Kyoto Encyclopeida of Genes and Genomes)是日本京都大学和东京大学于1995年建立的综合性数据库，包括系统生物学、基因组学和化学分子信息三大类近20个数据库(http://www.kegg.jp/kegg/)。KEGG集基因组序列分析、功能注释和通路分析于一体，在分子、细胞、组织、生态系统等不同水平探寻基因的功能。KEGG中储存有大量基因转录、翻译表达产物的分子信息，通过KEGG中的通路数据库(Pathway Database)(http://www.kegg.jp/kegg/pathway.html)对基因表达产物之间的相互作用进行研究，构建细胞或组织的代谢网络通路，进而可以推断出细胞或组织的生物学行为和功能。KEGG代谢通路数据库通过分析上传的代谢物数据，可以构建特定的能量代谢、糖代谢、脂代谢、核苷酸代谢、氨基酸代谢等不同的代谢网络。用于代谢组研究的数据库见表 1。

表 1 代谢组数据库 Table 1 The databases of metabolome

类型	数据库	网址代谢通路
数据库	KEGG	http://www.genome.jp/kegg/
	MetaCycle	http://metacyc.org/
	HumanCyc	http://humancyc.org/
	BioCyc	http://biocyc.org/
	Reactome	http://www.reactome.org/ReactomeGWT/entrypoint.html
全代谢组学数据库	HMDB	http://www.hmdb.ca/
	BIGG	http://bigg.ucsd.edu/
	SetupX	http://fiehnlab.ucdavis.edu/projects/binbase_setupx
	BinBase	http://fiehnlab.ucdavis.edu/projects/binbase_setupx#binbase
	SYSTOMONAS	http://systomonas.tu-bs.de/
化合物结构数据库	PubChem	http://pubchem.ncbi.nlm.nih.gov/
	ChEBI	http://www.ebi.ac.uk/chebi/
	ChemSpider	http://www.chemspider.com/
	KEGG Glycan	http://www.genome.jp/kegg/glycan/
	CSFMetabolome	http://www.csfmetabolome.ca/
	LMSD	http://www.lipidmaps.org/data/structure/
药物数据库	DrugBank	http://www.drugbank.ca/
	Theapeutic Target Database	http://xin.cz3.nus.edu.sg/group/ttd/ttd.asp
	PharmGKB	http://www.pharmgkb.org/
	STITCH	http://stitch.embl.de/
	SuperTarget	http://bioinf-apache.charite.de/supertarget_v2/
波谱分析数据库	HMDB	http://www.hmdb.ca/
	NIST	http://www.sisweb.com/software/ms/nist.htm
	GMD	http://gmd.mpimp-golm.mpg.de/
	BMRB	http://www.metabolomicssociety.org/databases
	MMCD	http://mmcd.nmrfam.wisc.edu/
	MassBank	http://www.massbank.jp/
	MetLin	http://metlin.scripps.edu/index.php
	Fiehn-Lib	http://fiehnlab.ucdavis.edu/Metabolite-Library-2007/
	BML-NMR	http://www.bml-nmr.org/
疾病数据库	OMIM	http://www.ncbi.nlm.nih.gov/omim/
疾病数据库	OMMBID	http://www.ommbid.com/

表选项

基因组和转录组反映的是遗传物质水平上细胞的功能，功能基因通过转录形成mRNA，mRNA翻译出蛋白质，这些蛋白质的功能和活性决定了细胞的功能。由于基因组和转录组所反映的细胞功能在表达的过程中可能会发生变化，所以不能完全真实的反映细胞的功能。而代谢组直接反映的是细胞内生物化学反应合成或分解的物质的功能和活性，因此与基因组和转录组相比，代谢组与表型的关系更加密切，通过代谢组数据能更加直观地反映细胞的生物功能^[4]。

相对于基因组、转录组和蛋白质组序列的测序及数据分析，代谢组数据分析的优势不仅仅在于其与表型联系更密切，而且代谢组的数据量更小，数据中干扰数据更少，其有效数据所占比例更高，目前已经建立了人体的代谢组数据库^[5]。

本文主要介绍小分子代谢物的提取和鉴定方法以及代谢路径的推断。重点介绍代谢组数据的分析以及利用生物信息学方法来推断构建代谢网络的过程。代谢组数据分析的一般流程是：细胞或组织样品、代谢物提取和鉴定、数据整理、数据分析、代谢网络构建、推断代谢通路。

2 代谢物的提取和鉴定

代谢组研究首先需要将代谢物从组织细胞中提取出来并进行鉴定，这是代谢组分析过程中最基础也是最重要的步骤，代谢组提取的质量直接关系到代谢组数据分析的准确性，因此代谢物的提取过程要求严格的实验操作。由于代谢组的实时变化，所以在实验设计时要综合考虑代谢物提取所用样本的数量、部位、细胞生长时期等因素。特别是生物反应酶对代谢物提取的影响，必须避免生物酶催化初级代谢产物反应产生新的次级代谢产物。

设计代谢组学实验，首先要确定所要检测的代谢物的数量。代谢物实验的设计策略有两种：定向检测和非定向检测^[6]。定向检测是只针对一个或多个特定的代谢路径的代谢物进行提取、鉴定，如对药物代谢路径及代谢动力学的研究。定向检测可以检测出药物对代谢路径特定酶的作用原理。非定向检测是对生物细胞或组织内所有代谢物进行提取、鉴定，以求推断出所有可能的代谢路径，它对实验技术要求更高。

代谢物提取后，需要对其进行鉴定。目前代谢物提取和鉴定方法主要有核磁共振、色谱法、质谱法、电化学检测法、毛细管电泳等^[7-12]。不同的鉴定方法有各自的优缺点以及适用的代谢物，尤其是要进行非定向检测时，单独使用一种方法很难将所有的代谢物全部提取、鉴定出来，所以一般采取多种方法联用的策略，尽可能精确地鉴定出细胞完整的代谢物。下面介绍的是目前主要使用的几种方法。

2.1 核磁共振波谱技术

使用核磁共振波谱技术(nuclear magnetic resonance,NMR)对代谢物鉴定不会破坏代谢物的结构，能够解析出化学分子精确的结构信息。核磁共振的原理是：具有奇数个核子的原子核具有自旋性质，在外加磁场的作用下，吸收频谱辐射能量，电子产生能级跃迁且在跃迁的过程中放出波谱，通过波谱确定原子的种类，然后对共振波谱进行解析，得到化学分子的结构信息。

生物体内的代谢产物主要由碳、氢、氧、氮、磷、硫等元素组成，这些元素的同位素都能应用于核磁共振技术。用于代谢组鉴定的核磁共振方法主要是氢谱(H-NMR)、碳谱(C-NMR)、氮谱(N-NMR)。

氢谱用氢的同位素氕，氕在自然界中的含量为99.8%，含量丰富。氢谱的灵敏度极高，因此用它来确定化学分子中的氢原子的位置。氢谱不仅能够用于解析氢原子的位置，而且它还能辅助解析与其相邻的碳原子和氮原子，提高了碳原子和氮原子测量的精确性。碳谱是用碳的同位素¹³C对碳原子进行测量，其灵敏度低于氢谱。氮谱对氮原子的测量用的是¹⁴N和¹⁵N两种氮的同位素。¹⁴N同位素在自然界中的含量为99.63%，其测量灵敏度也很高。

核磁共振技术在鉴定代谢物结构方面具有的优势主要有以下两点：①核磁共振技术在结构解析过程中不损伤样品，因此，可以与其他技术联用，在应用核磁共振技术之后，样品可以直接用其他技术进行再次鉴定，提高结构测定的精确性；②核磁共振检测可以在一定的缓冲液及温度范围下进行，因此可以保证待检测的代谢物的生理活性，这样解析出的结构更接近于生物体内活性状态下的结构^[7-8]。

2.2 色谱技术

色谱技术(chromatography)是一种物理化学分析分离方法，它能从复杂的混合物中分离出所需要的组分。不同物质在溶剂中具有不同的分配系数，色谱法利用这一性质，以流动相对固定相中的混合物进行逐次洗脱，混合物中不同的物质因其分配系数的差异会以不同的速度沿固定相移动，最终达到分离的效果。应用于代谢物分离研究的主要是气相色谱法(gas chromatography,GC)和高效液相色谱法(high performance liquid chromatography,HPLC) ^[13-15]。

气相色谱法是用气体作为流动相的色谱法，它适用于分析分子质量小、热稳定性高、易挥发、能气化的代谢物。高效液相色谱法是以液体作为流动相的色谱技术，流经色谱柱时，受到的阻力较大，为了能迅速通过色谱柱，必须对液体加高压，其分析速率快，高压使得液相流动速率变快，分离效率高。高效液相色谱法适用于高沸点、大分子、强极性、热稳定性差的化合物的分离分析。

2.3 质谱法

质谱分析是一种测量离子荷质比(电荷-质量比)的分析方法，可用来分析同位素成分、有机物组成及元素成分等。质谱分析的原理是：待测样品中的成分在离子化器中发生电离，生成不同荷质比的带正电荷的离子，经过电场的作用，形成离子束，进入质量分析器。在质量分析器中，再利用电场或磁场使不同质荷比的离子在空间上或时间上分离，或是通过过滤的方式，将它们分别聚焦到侦测器而得到质量与浓度相关的质谱图，从而确定其质量。

在代谢组中应用的主要是气相色谱-质谱联用仪(GC-MS)和液相色谱-质谱联用仪(LC-MS)。这两种质谱仪都可与前文所述的色谱分析技术联合使用。

3 代谢组数据分析 3.1 代谢组数据整理和分析

通过对代谢物的提取和鉴定，得到一系列质谱或核磁共振波谱图，接下来要对这些波谱图数据进行处理。对代谢组数据的处理可分为数据整理和数据分析两个步骤^[16-17]。数据整理的目的是将原始波谱数据转化整理成易于进行分析的数据格式，包括数据过滤、特征检测、比对和数据标准化等几个过程。通过数据整理，将液相-质谱或气相-质谱得出的质谱图的原始数据(raw data)转化为标准数据格式。

数据过滤(data filtering)。该方法主要的困难是对质谱图峰值(peak)区域的识别。

特征检测是代谢物数据分析的重要环节，其目的是确定波谱图峰值所表达的信息，将其转化为具体的结构信息。

数据比对是用于校正不同样本之间的保留时间(retention time)，以此确定代谢物的具体种类。

数据标准化是去除干扰数据，只保留研究所需要的代谢组数据。

经过数据整理后，原始数据整理成矩阵形式^[18]。接下来要对数据进行统计分析，通过多元分析和单因素分析找到代谢组数据代表的生物学意义。代谢组数据分析方法主要有以下几类。

(1) 主成分分析(PCA)是应用最广泛的代谢组数据统计方法，代谢组数据异常复杂且维数较高，主成分分析能够减少变量的维数，起到降维的作用，从而只分析对结果影响最大的变量。通过主成分分析，找到细胞特定时刻最重要的代谢物和代谢路径，筛选出主要变量后为后续分析做准备。

(2) 聚类分析(CA)。聚类分析将代谢组数据根据其生物学性质的相似度分为几个子集，进一步对数据归类，简化分析过程。各个子集内的数据代表的生物学意义具有极大的相似性，而各个子集之间，其生物学意义相差较大。

(3) 传统的统计分析。传统的单一变量的分析方法适用于对单个代谢物进行分析。

(4) 随机森林(random forest)。随机森林是一种机器学习的方法，它可以在降维之前即多变量的情况下对两个群体进行区分，不受高维度数据的影响。随机森林法采用分类树的算法，通过这种算法将代谢组数据分为多个群体，同时评估变量的重要性。

目前用于数据整理和分析的软件很多(XCMS^[19]、XCMS2^[20]、MetaScape^[21]、MetAlign^[22]、R^[23]等)，且各有优势，分别对数据进行整理和分析(表 1) 。

3.2 代谢网络的构建及分析

通过对代谢组数据进行上述分析，找到数据中的主要变量，即细胞新陈代谢中的主要路径和主要代谢物；并对代谢物进行分类，通过代谢物的类别和数量进一步推断代谢路径。

为了理解细胞中代谢物分子之间的相互作用，及其对细胞功能的影响。在代谢组学数据分析的过程中引入了网络(network)的概念，通过网络的性质描述细胞中复杂的分子反应。下面介绍一些网络的基本知识^[2]。

网络图是由点和边组成的，图中每个点连接的边数称为点的度数(degree),度数反映了点的某些性质。根据图中两个点之间的边是否有方向，可将网络图分为无向图(undirected network)和有向图(directed network)。度数的计算在无向图和有向图中有所差别。无向图中点连接的边数即为点的度数(如图 1) 。有向图中两点之间的边有方向(图 1) ，点的度数可分为进度(incoming degree)和出度(outgoing degree)。点的进度是以这个点为终点的边的数量，点的出度是以这个点为起点的边的数量。网络图的一个重要性质是点的度数分布，用N表示网络图中点的个数，K表示每个点的度数。N(K)表示度数为K的点的个数。N(K)分布函数即为网络图点度数的分布。点度数的分布是网络图的特征性质，根据点度数分布把网络图分为不同的类型。大多数生物网络点的度数都服从幂律分布：P(k)→k^－a。a的大小决定了网络图的性质，a越小，网络图中心的越重要，当时，网络图中心具有明显的层次性。

表 2 代谢组数据整理和分析软件 Table 2 The software list ofr metabolomic pre-processing and analysis

软件名称	功能及特点
OpenMS	MS数据整理、特征检测、结构鉴定
Metabonomic Package	用R语言编写，是R的一个软件包，用于NMR 数据统计：多元分析、PCA、PLS、神经网络
XCMS	用R 语言编写，用于整理LC-MS数据和GC-MS数据，包括特征检测和峰值比对
XCMS 2	用于整理串联质谱法(MS-MS)数据的代谢物鉴定和结构特征描述
MeDDL	是数学软件Matlab的一个脚本，用于处理LC-MS数据和GC-MS数据
MetaboliteDetector	是图形用户界面，用于综合分析、平滑去噪、特征检测、色谱数据分析、化合物鉴定
MetAlign	用于处理GC-MS 数据和LC-MS数据、基线校准、特征检测、数据平滑去噪和比对
MetaboAnalyst	用于数据统计分析、功能解释、数据可视化、数据质量检测
MeltDB	数据可视化、代谢通路分析
MetDAT	在线的MS数据整理分析平台，用于统计分析、代谢通路可视化
AMDIS	峰值检测、去卷积、数据识别、数据可视化
TagFinder	数据比对、数据识别
MetIDEA	LC-MS、GC-MS和CE-MS数据的峰值区域计算、相关性分析
MetaScape	是网络分析平台Cytoscape的一个插件，用于网络通路可视化、数据统计分析等
MetaboMiner	Java语言编写，识别代谢物分析的NMR数据
MolFind	Java语言编写，用于分析HPLC/MS数据
MAVEN	是图形用户界面，对LC-MS数据进行数据整理、数据分析、通路可视化分析等
LIMSA	用于质谱数据峰值数据比对整理
Xalign	LC-MS数据的峰值检测
BlueFuse	MS和NMR数据的数据过滤、峰值检测、一元和多元数据分析

表选项

图 1 无向网络图和有向网络图 Figure 1 The undirection and direction network graph

图选项

网络图的另一个性质是路径的长度。网络图点与点的距离用路径长度表示(path length)。路径的长度用两个点之间的边数表示，两点之间所需经过的最少边数即为最短路径。需要注意的是在有向图中从点A到点B的距离l_ab与从点B到点A的距离l_ba不一定相等。

如前文所述，通过对数据的主成分分析、聚类分析等，分析得到的生物学性质可以通过网络图直观的表现出来。代谢网络图的构建原则是：以代谢物为点，如果代谢物之间存在化学反应关系，如一种代谢物通过生物化学反应生成另外一种代谢物，则这个点直接存在一条边，如果构建的是有向网络图，则边的方向是从反应底物指向反应产物。

网络图构建完成后，计算点的度数、度数分布、路径长度和聚类系数，确定网络图的类型。根据网络图的类型得出其性质，分析网络性质所代表的生物学意义，进而推断出细胞的代谢路径及代谢通量。从代谢网络中推断代谢路径需要从图中“提取”子图^[24]。根据度数的分布以及聚类分析，网络图被分成了许多个子图，每个子图表示的即为一个或几个主要的代谢路径。

目前，比较适用于系统生物学研究的是Petri Nets 网络，Petri Nets网络的基本概念最早是Carl Adam Petri于1962年在一篇论文中提出的，随后，Petri Nets的概念和算法经过不断的补充和改进，已经能够描述定量的、随机的或连续的系统行为。Petri Nets网络在生物方面主要用于分析代谢网络、信号传导网络和基因调控网络。Petri Nets 网络适用于生物学研究中的各个水平，并能将各个水平的性质整合研究，其优势之一是通过将定量描述与定性描述相结合体现生物系统的结构和行为特性。

Petri Nets 网络是四元素集合：库所、变迁、有向边、令牌。Petri Nets有两种类型的点：库所(place)和变迁(transition)。Petri Nets网络的有向边只建立在库所和变迁之间，在库所与库所之间以及变迁与变迁之间不存在有向边。Petri Nets网络的令牌(token)表示变迁发生的可能性，反映的是生物化学反应的限度，令牌通常根据库所代表的反应物的浓度或基因表达量等数值确定。Petri Nets 网络中所有令牌值的分布反映网络的状态和性质。

由以上Petri Nets网络的基本规则可以看出，它非常适合描述生物化学反应。生物化学反应包括反应物、产物、酶、反应方向、反应速率等要素，Petri Nets网络可以描述出生物化学反应的几乎所有要素。

酶催化的中间产物学说，酶在催化生物化学反应时，会与反应物形成中间产物(如下式)：

$A+B+E\underset{3}{\overset{1}{\mathop{\rightleftharpoons }}}\,AEB\underset{4}{\overset{2}{\mathop{\rightleftharpoons }}}\,C+D+E$

式中，A、B为反应底物，E为催化反应的酶，C、D为反应产物，AEB为反应中间产物，由此可见，生物化学反应的方向和速率由中间产物AEB的浓度决定。在Petri Nets 网络中用库所表示反应底物，用变迁表示催化酶，有向边表示反应的方向，令牌表示底物浓度以及反应限度。因此所有生物化学反应的信息都可以通过Petri Nets 网络反映出来，从而构建代谢通路。

4 代谢组分析的应用 4.1 代谢组在细胞功能研究方面的应用

代谢组能够反映细胞新陈代谢的状态和代谢路径的信息。因为代谢网络的高度联通性，所以难以解释其生物学意义。系统生物学研究的主要目标之一是能够定量的描述细胞中遗传信息的表达，以及物质、能量的代谢过程，但是细胞中的生物化学反应时时刻刻在进行着，参与反应的物质也在不断变化。要想定量描述细胞中复杂的新陈代谢反应，需要通过对基因组、转录组、蛋白质组和代谢组等组学数据的综合分析，找到代谢路径中的关键代谢物。细胞中众多的代谢路径通过参与代谢反应的代谢物相互联系成一个整体。把转录组数据和代谢组数据相结合可用于研究代谢调控的机制。Ter Kuile和Westerhoff把代谢通量的调控方式分为两种：代谢物调控(metabolic regulation)和分级调控(hierarchical regulation)^[25]。代谢物调控以酶的动力学活性为基础，参与生物化学反应的酶活性决定了代谢物的浓度水平，通过对代谢物浓度的调节可以控制代谢通量。分级调控是在酶基因的转录、翻译、翻译后修饰和酶活性的激活各个水平上分别进行。通过代谢组数据的研究，为以后定向调控细胞的代谢通路提供理论基础。

对细胞代谢组数据的研究能实时监测细胞中代谢通路的变化。Daran-Lapujade等把葡萄糖加入到酵母菌培养基中，5min内，酵母菌的代谢组和转录组迅速发生变化，它们之间有非常紧密的联系。而在缺乏葡萄糖的环境下，酵母菌的能量全部用于呼吸作用。酵母菌的生存环境发生变化后，其体内的新陈代谢会随之迅速变化，以适应新的环境(基因表达的变化发生在环境变化后的120~210s内^[26])。

细胞代谢物的数量和种类能够反映细胞的功能。Panopoulos等通过对诱导性多能干细胞和胚胎干细胞代谢组的非定向检测，研究细胞代谢路径对细胞分化的影响。组成生物的细胞都是从胚胎干细胞分化而来的。而成熟的体细胞也能去分化为多能干细胞，细胞的分化过程是基因选择性表达的过程，基因表达的变化同样反映在代谢物数量和种类的变化上。细胞分化导致的代谢路径的变化可以通过代谢物的数量和种类的变化检测出。抑制氧化路径对于维持细胞功能多样性具有重要作用，对诱导性多能干细胞和胚胎干细胞的代谢物研究发现：诱导性多能干细胞中不饱和脂肪酸的含量远低于胚胎干细胞^[27]。

4.2 代谢组研究在免疫和疾病方面的应用

代谢组能够分析免疫细胞的代谢产物并用于疾病临床检测^[28]。通过对病变细胞和正常细胞的比较，可以直观的显示出导致细胞病变的代谢物或代谢路径，尤其是对癌细胞的研究。正常细胞向癌细胞的转变正是由于糖代谢、脂代谢、蛋白质代谢等代谢路径的病变所引发的^[29-30]。新陈代谢的代谢产物分为初级代谢产物和次级代谢产物，初级代谢产物是生物代谢活动中所产生的、生物生长繁殖所必需的物质，如糖类、脂类、氨基酸、维生素等。初级代谢产物是生物体的必需物质，如果其代谢过程发生变异，极易导致细胞病变。次级代谢产物由初级代谢产物经过化学变化产生，它并非是生物生长必需物质，如抗生素、激素、色素等。次级代谢产物在细胞中的积累也会影响细胞的功能^[31]。

Psychogios 等综合运用核磁共振技术、GC-MS和LC-MS等技术，对人体血清代谢物进行非定向检测^[32]。人体血清中代谢物种类、代谢物相互作用及其与人类疾病的关系都可在血清代谢组数据库(serum metabolome database，SMDB)中查询(http://www.serummetabolome.ca.)。

5 小结

随着组学研究的深入，代谢组在细胞功能研究方面的优势会逐渐显现，相比于基因组、转录组、蛋白质组数据来说，代谢组数据的数据量相对较少，而且代谢组与细胞结构和功能之间的关系更密切。通过代谢组数据的分析可以直接预测人体某个时刻的代谢通路^[33]。生物体的代谢通路随着细胞生活环境的变化而不断变化，因此代谢组数据直接反映了细胞对周围环境变化的应答^[34]。代谢组的研究可以与基因组、转录组和蛋白质组的研究联合进行，以此对基因转录、翻译，直至发挥功能进行全程监测，深入理解基因与其功能的关系，Somel等在研究大脑的进化过程时，就使用了组学的联合技术^[35]。随着小分子物质检测鉴定、技术的提高以及对代谢路径认识的深入，通过代谢网络对代谢通路的预测将会变得更加精确。

参考文献

[1]	Oliver S G, Winson M K, Kell D B, et al. Systematic functional analysis of the yeast genome. Trends Biotechnol, 1998, 16(9) : 373–378. DOI:10.1016/S0167-7799(98)01214-1

[2]	Barabasi A L, Oltvai Z N. Network biology:understanding the cell's functional organization. Nat Rev Genet, 2004, 5(2) : 101–113. DOI:10.1038/nrg1272

[3]	Lazar A G, Romanciuc F, Socaciu M A, et al. Bioinformatics Tools for Metabolomic Data Processing and Analysis Using Untargeted Liquid Chromatography Coupled With Mass Spectrometry. Bulletin of University of Agricultural Sciences, 2015, 72(2) : 103–115.

[4]	Swerdlow R H. Bioenergetics and metabolism:a bench to bedside perspective. Journal of Neurochemistry, 2016, 139(52) : 126–135.

[5]	Pornputtapong N, Nookaew I, Nielsen J. Human metabolic atlas:an online resource for human metabolism. Database, 2015 : 1–9.

[6]	Patti G J, Yanes O, Siuzdak G. Innovation:Metabolomics:the apogee of the omics trilogy. Nature reviews. Molecular cell biology, 2012, 13(4):263-269.

[7]	Ratcliffe R G. Probing plant metabolism with NMR. Annu.Rev.Plant Physiol.Plant Mol.Biol, 2001, 52(52):499-526.

[8]	Gadian D G, Radda G K. NMR studies of tissue metabolism. Biochemistry, 1981, 50 : 69–83. DOI:10.1146/annurev.bi.50.070181.000441

[9]	Pan Z, Raftery D. Comparing and combining NMR spectroscopy and mass spectrometry in metabolomics. Analytical and bioanalytical chemistry, 2007, 387(2) : 525–527. DOI:10.1007/s00216-006-0687-8

[10]	Krone N, Hughes B A, Lavery G G, et al. Gas chromatography/mass spectrometry (GC/MS) remains a pre-eminent discovery tool in clinical steroid investigations even in the era of fast liquid chromatography tandem mass spectrometry (LC/MS/MS). The Journal of steroid biochemistry and molecular biology, 2010, 121(3-5) : 496–504. DOI:10.1016/j.jsbmb.2010.04.010

[11]	Drexler D M, Reily M D, Shipkova P A. Advances in mass spectrometry applied to pharmaceutical metabolomics. Analytical and bioanalytical chemistry, 2011, 399(8) : 2645–2653. DOI:10.1007/s00216-010-4370-8

[12]	Stycznski M P, Moxley J F, Tong L V, et al. Systematic identification of conserved metabolites in GC/MS data for metabolomics and biomarker discovery. Analytical Chemistry, 2007, 79(3) : 966–973. DOI:10.1021/ac0614846

[13]	Schauer N, Steinhauser D, Strelkov S, et al. GC-MS libraries for the rapid identification of metabolites in complex biological samples. FEBS Letters, 2005, 579(6) : 1332–1337. DOI:10.1016/j.febslet.2005.01.029

[14]	Gika H G, Theodoridis G A, Wingate J E, et al. Within-Day reproducibility of an HPLC-MS-Based method for metabonomic analysis:application to human urine. Journal of Proteome Research, 2007, 6(8) : 3291–3303. DOI:10.1021/pr070183p

[15]	Coble J B, Fraga C G. Comparative evaluation of preprocessing freeware on chromatography/mass spectrometry data for signature discovery. Journal of Chromatography A, 2014, 1358 : 155–164. DOI:10.1016/j.chroma.2014.06.100

[16]	Katajamaa M, Oresic M. Data processing for mass spectrometry-based metabolomics. Journal of chromatography, 2007, 1158(1-2) : 318–328. DOI:10.1016/j.chroma.2007.04.021

[17]	Yao Y, Sun T, Wang T, et al. Analysis of Metabolomics Datasets with High-Performance Computing and Metabolite Atlases. Metabolites, 2015, 5(3) : 431–442. DOI:10.3390/metabo5030431

[18]	Sugimoto M, Kawakami M, Robert M, et al. Bioinformatics tools for mass spectroscopy-based metabolomic data processing and analysis. Current Bioinformatics, 2012, 7(1) : 96–108. DOI:10.2174/157489312799304431

[19]	Smith C A, Want E J, O'Maille G, et al. XCMS:Processing mass spectrometry data for metabolite Profiling using nonlinear peak alignment, matching, and identification. Anal Chem, 2006, 78(3) : 779–787. DOI:10.1021/ac051437y

[20]	Benton H P, Wong D M, Trauger S A, et al. XCMS2:Processing tandem mass spectrometry data for metabolite identification and structural characterization. Anal Chem, 2008, 80(16) : 6382–6389. DOI:10.1021/ac800795f

[21]	Brakhage A A. Regulation of fungal secondary metabolism. Nat Rev Microbiol, 2013, 11(1) : 21–32.

[22]	Barabasi A L, Gulbahce N, Loscalzo J. Network medicine:a network-based approach to human disease. Nat Rev Genet, 2011, 12(1) : 56–68. DOI:10.1038/nrg2918

[23]	Fernanndez A F, Llorach R, Andres L C, et al. An R package to analyse LC/MS metabolomic data:MAIT (Metabolite Automatic Identification Toolkit). Bioinformatics, 2014, 30(13) : 1937–1939. DOI:10.1093/bioinformatics/btu136

[24]	Faust K, Dupont P, Callut J, et al. Pathway discovery in metabolic networks by subgraph extraction. Bioinformatics, 2010, 26(9) : 1211–1218. DOI:10.1093/bioinformatics/btq105

[25]	Cakir T, Patil K R, Onsan Z, et al. Integration of metabolome data with metabolic networks reveals reporter reactions. Mol Syst Biol, 2006, 2(1) : 50.

[26]	Daran L P, Pronk J T, Heijnen J J, et al. When transcriptome meets metabolome:fast cellular responses of yeast to sudden relief of glucose limitation. Mol Syst Biol, 2006, 2(1) : 49.

[27]	Plongthongkum N, Lutz M, Berggren W T, et al. The metabolome of induced pluripotent stem cells reveals metabolic changes occurring in somatic cell reprogramming. Cell Res, 2012, 22(1) : 168–177. DOI:10.1038/cr.2011.177

[28]	Ghesquière B, Wong B W, Kuchnio A. Metabolism of stromal and immune cells in health and disease. Nature, 2014, 511(7508) : 167–176. DOI:10.1038/nature13312

[29]	Yizhak K, Chaneton B, Gottlieb B, et al. Modeling cancer metabolism on a genome scale. Molecular Systems Biology, 2015, 11(6) : 817. DOI:10.15252/msb.20145307

[30]	Uzunlulu M, Caklili OT, Oguz A. Association between metabolic syndrome and cancer. Annals of Nutrition & Metabolism, 2016, 68(3) : 173–179.

[31]	Ma Z, Shi X, Zhang G, et al. Metabolism and metabolic inhibition of xanthotoxol in human liver microsomes. Evidence-Based Complementary and Alternative Medicine, 2016, 2 : 1–8.

[32]	Psychogios N, Hau D D, Peng J, et al. The human Serum metabolome. PloS ONE, 2011, 6(2) : e16957. DOI:10.1371/journal.pone.0016957

[33]	Shlomi T, Cabili M N, Herrgard M J, et al. Network-based prediction of human tissue-specific metabolism. Nat Biotechnol, 2008, 26(9) : 1003–1010. DOI:10.1038/nbt.1487

[34]	Nicholson G, Rantalainen M, Maher A D, et al. Human metabolic profiles are stably controlled by genetic and environmental variation. Mol Syst Biol, 2011, 7(1) : 525.

[35]	Somel M, Liu X, Khaitovich P. Human brain evolution:transcripts, metabolites and their regulators. Nat Rev Neurosci, 2013, 14(2) : 112–127. DOI:10.1038/nrn3372