中国医科大学学报  2021, Vol. 50 Issue (7): 597-601, 607

文章信息

刘建云, 江和, 张杰, 马百成, 吴萍, 熊建军
LIU Jianyun, JIANG He, ZHANG Jie, MA Baicheng, WU Ping, XIONG Jianjun
ATAC-seq技术在间充质干细胞成脂分化早期研究中的应用
ATAC-Seq-based studies of dynamic changes in chromatin accessibility during early stage adipogenic differentiation of mesenchymal stem cells
中国医科大学学报, 2021, 50(7): 597-601, 607
Journal of China Medical University, 2021, 50(7): 597-601, 607

文章历史

收稿日期:2020-07-01
网络出版时间:2021-06-22 17:30
ATAC-seq技术在间充质干细胞成脂分化早期研究中的应用
刘建云1 , 江和2 , 张杰2 , 马百成2 , 吴萍1 , 熊建军1,2     
1. 江西省系统生物医学重点实验室, 江西 九江 332000;
2. 九江学院医学院组织胚胎学与医学遗传学教研室, 江西 九江 332000
摘要目的 利用ATAC-seq技术研究人骨髓间充质干细胞(hMSCs)成脂分化过程中染色质开放性的动态变化。方法 第6代人源hMSCs经成脂诱导剂分别刺激0 d、3 d、5 d和7 d。收集各组细胞,转座酶Tn5捕获DNA序列并测序,生物信息学分析各组间染色质开放区域数量分布、转录因子结合序列(motif)、邻近基因功能(GO)及相关信号通路(Pathway)。结果 在hMSCs成脂分化早期的不同时间点,细胞染色质开放区域数量发生显著动态变化;各组功能性区域Peak分布主要富集在转录起始点(TSS)附近;Motif分析显示各组细胞间参与转录调控的活化DNA序列发生改变;Peak邻近基因功能的GO分析结果显示,新增的染色质开放区域的生物过程主要集中在各种细胞黏附、血管生成以及细胞外基质生成等;而差异基因显著性富集通路主要集中在Rap1信号通路,PPAR信号通路等。结论 hMSCs成脂分化早期染色质开放区域出现显著动态变化,为进一步了解成脂分化的调控机制及寻找有效靶基因提供了新的思路。
ATAC-Seq-based studies of dynamic changes in chromatin accessibility during early stage adipogenic differentiation of mesenchymal stem cells
1. Key Laboratory of Jiangxi Province for the Systems Bio-medicine, Jiujiang 332000, China;
2. Department of Histoembryology and Medical Genetics, College of Medical Science, Jiujiang University, Jiujiang 332000, China
Abstract: Objective To study dynamic changes in chromatin accessibility during early stage adipogenic differentiation of mesenchymal stem cells (MSCs) using ATAC-Seq. Methods Sixth generation primary cultured MSCs were stimulated with an adipogenic cocktail for 0, 3, 5, or 7 days. Each group of cells was collected and lysed to extract DNA. Regions of open euchromatin were captured using Tn5 transposase and sequenced. Bioinformatics was used to analyze the numbers/distributions of open euchromatin regions, transcription factor binding motifs, functions of genes adjacent to open regions, and related signaling pathways. Results At different time points in early stage adipogenic differentiation, the number of open euchromatin areas changed significantly, and the peak distribution of each group was mainly concentrated near transcription start sites (TSS). Motif analysis showed that the activated DNA sequences involved in transcription regulation changed with time; GO analysis identified significant differences among groups. Biological processes associated with increasing open euchromatin included cell adhesion, angiogenesis, extracellular matrix organization, etc. In addition, involved pathways include the Rap1 and PPAR signaling pathways. Conclusion In early stage adipogenic differentiation, hMSCs undergo obvious dynamic changes in chromatin organization, providing new insights into the regulatory mechanisms of adipogenic differentiation, and identifying candidate target genes for manipulation of MSC adipogenic differentiation.

脂肪细胞由间充质干细胞(mesenchymal stem cells,MSCs)定向分化而来。脂肪生成的改变可能导致复杂疾病的发生,如骨质疏松症、肥胖、糖尿病和其他脂肪代谢紊乱等[1]。应用成脂诱导剂(地塞米松联合胰岛素、吲哚美辛、3-异丁基-1-甲基黄嘌呤)是体外诱导hMSCs向成脂细胞分化的经典方法[2]。这一过程中涉及众多基因的转录激活或抑制[3-4],但是其中的机制尚未完全明确。基于转座酶和高通量测序的染色质分析(assay for transposaseaccessible chromatin using sequencing,ATAC-seq)是近年来兴起的用于研究染色质开放性的表观遗传学技术,通过获得染色质上开放区域的位置和活跃的调控序列,在全基因组范围内推测特定生理过程中可能参与的转录因子及其动态规律[5-6]。本研究以人源hMSCs成脂分化的早期过程(0~7 d)为研究目标,采用ATAC-seq技术分析其中的染色质开放性变化,为进一步了解成脂分化的调控机制及寻找有效靶基因提供新的思路。

1 材料与方法 1.1 细胞培养和处理

人源性MSCs (hMSCs)由本实验室保存。在37 ℃,5% CO2环境下培养,间隔48 h传代。取第6代MSCs进行成脂诱导,诱导剂成分为DMEM培养液,内含10%胎牛血清,1 μmol地塞米松,10 μg/mL胰岛素,200 μmol吲哚美辛和0.5 mmol 3-异丁基-1-甲基黄嘌呤[2]。成脂诱导剂分别刺激细胞0 d (MSC-0d)、3 d (AD-3d)、5 d (AD-5d)和7 d (AD-7d)。刺激完毕去上清,收集细胞,在4 ℃环境下以500 g离心力离心5 min,留取沉淀细胞,随后以50 µL冰冷PBS洗涤细胞1次,去上清液,再以50 µL冰冷裂解缓冲液悬浮细胞,离心10 min;去上清液,迅速进入转座反应。

1.2 转座反应与纯化

混合转座反应体系50 μL (2.5 μL Nextera Tn5 Transposase、25 μL 2 ×反应缓冲液、22.5 μL无核酶水)在冰冷温度悬浮细胞核,再置于37 ℃孵育30 min;随后用Qiagen MinElute PCR纯化试剂盒纯化DNA用于PCR反应[7],反应体系为10 µL DNA、2.5 µL PCR引物1、2.5 µL Barcoded PCR引物2、25 µL NEBNext High-Fidelity 2× PCR Master Mix、10 µL无核酶水。反应条件为72 ℃延伸5 min;98 ℃变性30 s (1个循环);98 ℃变性10 s;63 ℃退火30 s;72 ℃延伸1 min (共5个循环);72 ℃延伸5 min;4 ℃冷却。PCR产物再经Qiagen MinElute PCR纯化试剂盒纯化后进行Illumina HiSeq测序。

1.3 生物信息学分析

测序数据的质量控制使用Fast QC软件。下机的原始数据经去接头处理。BWA软件将clean data比对到参考基因组hg38_genecode[8]。比对分析后得到的bam文件作为输入文件,使用MACS2软件进行Call Peak,筛选阈值为q < 0.05[9]。每个Peak区域从5’端和3’端2个方向分别延伸200 bp提取DNA序列,采用HOMER软件预测Motif,随后将预测的motif与数据库(HOMER、JASPAR)中已有的motif数据进行匹配,鉴定相应的已知motif和相应的转录因子[10]。基因附近信号分布图的分析使用deeptools软件[11]

利用DAVID (the Database for Annotation,Visuali- zationand Integrated Discovery)数据库对染色质开放区域相关联的基因进行基因本体论(gene ontology,GO)富集分析[12];基于京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)数据库对Peak邻近基因Pathway富集分析[13]

2 结果 2.1 细胞染色质开放区域的鉴定

在成脂诱导剂刺激下,原代培养的hMSCs逐渐出现分化至14 d,成功分化为包含脂滴的脂肪细胞,见图 1

A, hMSCs induced toward adipogenesis for 0 d; B, hMSCs induced toward adipogenesis for 7 d; C, hMSCs induced toward adipogenesis for 14 d. 图 1 油红O对hMSC分化不同时间点细胞的染色×200 Fig.1 Oil red O staining of hMSCs at different time points of differentiation ×200

测序原始数据经筛选后,采用BWA软件比对,各组细胞(MSC-0d、AD-3d、AD-5d、AD-7d)的Reads比对率均高于95%;Reads信号在基因区域的分布主要在转录起始点(TSS)附近(图 2A)。使用MACS软件对各组细胞Reads进行Call Peak,在MSC-0d组筛选出110 369个Reads显著富集的区域(Peak),在AD-3d组筛选出68 327个Peak,在AD-5d组筛选出99 362个Peak,在AD-7d组筛选出77 712个Peak,表明hMSCs向成脂细胞分化的前3 d,转录活性区域明显减少,随后逐渐恢复(图 2B)。各组细胞的Peak分布在启动子与转录起始点之间的比例大约为10%~20%,各组之间存在细微差异。在成脂诱导的第3天,位于启动子与转录起始点染色质开放区域的比例最高(17.63%),而此时全基因组Reads信号反而最少(图 2C)。

A, read distributions (from bigwig) across each gene are presented as heatmaps; B, peak numbers at different time points during adipogenic differentiation; C, peak distribution in functional areas. 图 2 细胞染色质开放区域的鉴定 Fig.2 Identification of opening chromatin regions in each group of cells

2.2 染色质开放区域的motif分析

采用Homer软件对4组细胞染色质开放区域的DNA序列进行motif分析,结果显示,各组细胞中结合最多的motif均是亮氨酸拉链(basic leucine zipper,bZIP)转录因子家族的成员,如Fra1、Atf3、Fra2、JunB、BATF、AP-1等(结果未显示)。随后对AD-3d/MSC-0d、AD-5d/MSC-0d、AD-7d/MSC-0d组间差异motif分别进行分析,在AD-3d/MSC-0d组间,数量上调最为显著的motif为CEBP、EBF2、NF1等;在AD-5d/MSC-0d组间,数量上调最为显著的motif为CEBP、EBF2、RUNX1等;在AD-7d/MSC-0d组间,转录因子数量上调最为明显的motif则为TEAD3、CEBP、RUNX1等(图 3A)。过氧化物酶体增殖物激活受体(peroxisome proliferators-activated receptors,PPARs)为调控成脂早期分化的关键转录因子,本研究重点追踪了PPARγ结合motif排序的动态变化,结果显示,PPARγ结合的motif在MSC-0d的富集排序为360位;在AD-3d和AD-5d,富集排序分别升至第161位和第170位;而在AD-7d,PPARγ的motif富集排序又降至350位(图 3B),表明成脂分化的第3~5天,PPARγ转录因子被显著激活。

A, the main conserved motifs in each group; B, dynamic rankings of PPARγ motif during osteogenic differentiation. 图 3 各组细胞间差异motif分析 Fig.3 Motif analysis in each group

2.3 GO富集分析结果

MSC-0d、AD-3d、AD-5d和AD-7d 4组细胞染色质开放区域所关联的基因的主要生物学过程(biological process,BP)并无统计学差异,大多涉及蛋白磷酸化、代谢等过程(结果未显示)。通过对各组间差异染色质开放区域所关联的基因进行GO分析,发现在AD-3d/MSC-0d组间,上调最为显著的BP有细胞黏附,细胞外基质组织,Rho-GTPase活性的正性调控等;在AD-5d/MSC-0d组间,上调最为显著的BP有细胞黏附,细胞外基质组织,细胞形态调控等;在AD-7d/MSC-0d组间,上调最为显著的BP则是GTPase活性的正性调节,内皮细胞迁移的正性调节和血管生成等(图 4)。以上结果表明,成脂分化第7天,基因功能的变化与前5 d有明显不同。

A, GO enrichment analyses of peak adjacent gene differences between AD-3d and MSC-0d groups; B, GO enrichment analyses of peak adjacent gene differences between AD-5d and MSC-0d groups; C, GO enrichment analyses of peak adjacent gene differences between AD-7d and MSC-0d groups. 图 4 各组细胞间差异Peak邻近基因GO富集分析 Fig.4 GO enrichment analyses of peak adjacent gene differences in each group

2.4 Peak邻近基因功能Pathway富集分析结果

Pathway富集分析结果显示,MSC-0d、AD-3d、AD-5d和AD-7d 4组细胞染色质开放区域所关联的Pathway并无明显差别(结果未显示)。而组间差异染色质开放区域所关联Pathway有显著变化。在AD-3d/MSC-0d组间,上调最为显著的Pathway有Rap1信号通路,蛋白消化与吸收通路,PPARs信号通路,PI3K-Akt信号通路等,而与脂肪酸代谢密切相关的脂肪酸代谢通路也显著上调;在AD-5d/MSC-0d组间,上调较为显著的Pathway有Rap1信号通路,黏附连接,PPARs信号通路等;在AD-7d/MSC-0d组间,上调较为显著的Pathway有Rap1信号通路,黏附连接,黏着斑激酶通路等,而PPARs信号通路和脂肪酸代谢通路活性显著下降,见图 5

A, pathway enrichment analyses of peak adjacent gene differences between AD-3d and MSC-0d groups; B, pathway enrichment analyses of peak adjacent gene differences between AD-5d and MSC-0d groups; C, pathway enrichment analyses of peak adjacent gene differences between AD-7d and MSC-0d groups. 图 5 各组细胞间差异Peak邻近基因Pathway富集分析 Fig.5 Pathway enrichment analysis of peak adjacent gene differences in each group

3 讨论

脂肪细胞来源于hMSCs的分化,这一过程通常被划分为2个阶段:(1) MSCs定向分化为前脂肪细胞阶段(决定期);(2)前脂肪细胞最终分化为成熟和功能性脂肪细胞(终末分化期) [14-15]。本项研究着重关注hMSCs成脂分化的早期阶段,所以将观察的染色质开放区的时间点定为诱导后的7 d之内。

“开放”和“封闭”染色质分别代表基因的转录激活和抑制状态[16]。ATAC-seq测序结果显示,hMSCs有超过十万个染色质开放区域,且信号密度在转录起始点附近最高,表明MSCs在体外培养条件下就具有较高的基因表达活性。成脂诱导剂作用第3天,染色质开放区域的数量发生显著下降,但是信号趋向转录起始点集中,推测此阶段的细胞功能可能被专一地锚定在谱系定向,而其余功能被弱化。成脂诱导的第5天和第7天,染色质开放区域的数量缓慢回升,提示转录因子活性增多,目前,这一动态变化尚未见报导。

motif分析反映活化转录因子活性的动态变化。在成脂分化的前5 d,motif的变动较为相似,最为明显的有CEBP、EBF2、NF1等。CEBP家族是脂肪分化重要的调节因子[17],CEBPα,CEBPβ和CEBPδ促进脂肪生成,而CEBPγ则起抑制作用[18]。在此次测序分析中,没有对各亚型进行细分,需要在下一步细胞实验中予以验证。值得关注的是,成脂分化第7天,发生显著变化的motif是TEAD3而非CEBP。TEAD3是转录增强因子家族成员,有研究[19]显示其也参与调控成脂分化,但作用机制尚不明确。以上结果表明,成脂分化不同时间点,调控细胞功能的转录因子有不同的侧重点。本研究重点观察PPARγ,因其是调控脂肪分化的重要的转录因子之一[20]。PPARγ的结合活性在经历明显升高后于第7天下降至正常水平,一方面表明前5 d可能为成脂定向分化的关键时期,另一方面也证实PPARγ是参与成脂分化的关键因子。

Peak邻近基因GO富集分析显示,成脂诱导剂作用的第3天和第5天,上调的基因功能与细胞黏附、血管生成、细胞外基质形成有关;第7天,新增的基因功能转变为小分子GTPase活性、内皮细胞迁移等活动,提示细胞功能出现转变。差异Pathway富集分析显示,Rap1信号通路在成脂分化的前期都呈现显著激活状态,提示Rap1信号通路对于脂肪细胞分化可能具有重要的意义,值得进一步研究。此外,PPARγ信号通路在第3天和第5天中都呈现明显激活状态,与第7天不同,均提示分化第5~7天前后,细胞可能发挥不同的生理功能。

本研究分析了hMSCs成脂分化早期染色质开放区域的动态变化,下一步工作计划联合RNA-seq数据和ChIP-seq数据进行深入分析,为研究hMSCs定向分化的调控机制及骨质疏松症的发病机制提供新的切入点。

参考文献
[1]
HASLAM DW, JAMES WPT. Obesity[J]. Lancet, 2005, 366(9492): 1197-1209. DOI:10.1016/S0140-6736(05)67483-1
[2]
XU X, LI X, YAN R, et al. Gene expression profiling of human bone marrow-derived mesenchymal stem cells during adipogenesis[J]. Folia Histochem Cytobiol, 2016, 54(1): 14-24. DOI:10.5603/fhc.a2016.0003
[3]
NAKAMURA T, SHIOJIMA S, HIRAI Y, et al. Temporal gene expression changes during adipogenesis in human mesenchymal stem cells[J]. Biochem Biophys Res Commun, 2003, 303(1): 306-312. DOI:10.1016/s0006-291x(03)00325-5
[4]
MENSSEN A, HÄUPL T, SITTINGER M, et al. Differential gene expression profiling of human bone marrow-derived mesenchymal stem cells during adipogenic development[J]. BMC Genomics, 2011, 12: 461. DOI:10.1186/1471-2164-12-461
[5]
LI ZP, JIAO XM, SANTE GD, et al. Cyclin D1 integrates G9a-mediated histone methylation[J]. Oncogene, 2019, 38(22): 4232-4249. DOI:10.1038/s41388-019-0723-8
[6]
HENDRICKSON DG, SOIFER I, WRANIK BJ, et al. Simultaneous profiling of DNA accessibility and gene expression dynamics with ATAC-seq and RNA-seq[J]. Methods Mol Biol, 2018, 1819: 317-333. DOI:10.1007/978-1-4939-8618-7_15
[7]
BUENROSTRO JD, WU B, CHANG HY, et al. ATAC-seq:a method for assaying chromatin accessibility genome-wide[J]. Curr Protoc Mol Biol, 2015, 109: 21.29.1-21.29.9. DOI:10.1002/0471142727.mb2129s109
[8]
LANGMEAD B, SALZBERG SL. Fast gapped-read alignment with Bowtie 2[J]. Nat Methods, 2012, 9(4): 357-359. DOI:10.1038/nmeth.1923
[9]
ZHANG Y, LIU T, MEYER CA, et al. Model-based analysis of ChIP-Seq (MACS)[J]. Genome Biol, 2008, 9(9): R137. DOI:10.1186/gb-2008-9-9-r137
[10]
HEINZ S, BENNER C, SPANN N, et al. Simple combinations of lineage-determining transcription factors prime Cis-regulatory elements required for macrophage and B cell identities[J]. Mol Cell, 2010, 38(4): 576-589. DOI:10.1016/j.molcel.2010.05.004
[11]
RAMÍREZ F, DÜNDAR F, DIEHL S, et al. deepTools:a flexible platform for exploring deep-sequencing data[J]. Nucleic Acids Res, 2014, 42(web server issue): W187-W191. DOI:10.1093/nar/gku365
[12]
HUANG DW, SHERMAN BT, LEMPICKI RA. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources[J]. Nat Protoc, 2009, 4(1): 44-57. DOI:10.1038/nprot.2008.211
[13]
KANEHISA M, GOTO S, SATO Y, et al. KEGG for integration and interpretation of large-scale molecular data sets[J]. Nucleic Acids Res, 2012, 40(D1): D109-D114. DOI:10.1093/nar/gkr988
[14]
BOWERS RR, LANE MD. A role for bone morphogenetic protein-4 in adipocyte development[J]. Cell Cycle, 2007, 6(4): 385-389. DOI:10.4161/cc.6.4.3804
[15]
CHIELLINI C, COCHET O, NEGRONI L, et al. Characterization of human mesenchymal stem cell secretome at early steps of adipocyte and osteoblast differentiation[J]. BMC Mol Biol, 2008, 9: 26. DOI:10.1186/1471-2199-9-26
[16]
ENCODE PROJECT CONSORTIUM. An integrated encyclopedia of DNA elements in the human genome[J]. Nature, 2012, 489(7414): 57-74. DOI:10.1038/nature11247
[17]
RAMJI DP, FOKA P. CCAAT/enhancer-binding proteins:structure, function and regulation[J]. Biochem J, 2002, 365(Pt 3): 561-575. DOI:10.1042/BJ20020508
[18]
YEH WC, CAO Z, CLASSON M, et al. Cascade regulation of terminal adipocyte differentiation by three members of the C/EBP family of leucine zipper proteins[J]. Genes Dev, 1995, 9(2): 168-181. DOI:10.1101/gad.9.2.168
[19]
WANG J, ZHANG F, YANG H, et al. Effect of TEAD4 on multilineage differentiation of muscle-derived stem cells[J]. Am J Transl Res, 2018, 10(3): 998-1011.
[20]
ZHANG J, FU M, CUI T, et al. Selective disruption of PPARgamma 2 impairs the development of adipose tissue and insulin sensitivity[J]. PNAS, 2004, 101(29): 10703-10708. DOI:10.1073/pnas.0403652101