大多数常见的由于营养缺乏带来的疾病,如缺铁性贫血、眼干燥症、牙龈出血等均由环境和基因的共同作用导致,不同个体之间有99.9 %的DNA序列一致,0.1 %的DNA序列差异使得人们罹患疾病的风险程度可能不同。发现这些与常见疾病关联的DNA序列上的多态性位点,是从遗传角度了解营养缺乏风险程度的重要途径。铁缺乏是全球尤其是发展中国家最主要的营养问题之一,也是危害我国青少年的主要营养缺乏病,铁缺乏不仅导致贫血,还可引起机体免疫功能和工作能力下降,青少年心理行为改变和智力发育损害[1 – 2]。2002年中国居民营养与健康状况调查报告显示,我国10~18岁人群的贫血率为9.5 %~21.4 %,贫血成为影响该类人群健康的主要疾病之一[3]。随着人们对营养基因组学研究日益深入,与铁营养状况关联基因多态性位点相继发现,但针对我国少数民族6~16岁在校学生人群的营养素缺乏风险的关联SNP (single nucleotide polymorphism)位点研究鲜有报道。本研究搜集以往研究中报道的21个SNP位点,采用2016年广西、内蒙和新疆地区384名贫困农村学生的凝固血细胞检测基因分型结果分析地域分布特征。
1 对象与方法 1.1 对象在2016年“农村义务教育学生营养改善计划”营养监测项目中选择广西上林县、内蒙扎旗县和新疆喀什地区泽普县,每个县抽取1~2个学校,每个学校选择1~9年级学生,每个年级抽取40人左右,男女基本各半。收集去掉血清后的凝固血细胞。其中广西213名壮族在校学生,内蒙78名蒙古族在校学生,新疆93名维吾尔族在校学生,共收集6~16岁少数民族在校学生384人。所有学生及家长均已详细阅读和签署了课题知情同意书。
1.2 方法 1.2.1 试剂与仪器PCR引物(上海生工生物工程股份有限公司);磁珠法中量全血基因组DNA提取试剂盒(北京百泰克生物技术有限公司);10 × PCR反应缓冲液;MgCl2 2.5 μmol/L;dNTP(包含dATP,dTTP,dCTP,dGTP);Taq DNA聚合酶;SAP反应缓冲液;SAP反应酶;iPLEX缓冲液;iPLEX终止子溶液;iPLEX反应引物混合液;iPLEX反应酶(Agena公司)。全自动核酸提取仪(北京百泰克生物技术有限公司);离心机(Beckman Avanti J-25I,美国);低速自动平衡离心机(北京时代北利离心机有限公司);紫外光密度检测仪 (Thermo Scientific);PCR仪(AB Veriti 384 Wellcycler Thermal);Sequenom MassArray飞行质谱检测系统(Sequenom,美国)。
1.2.2 实验方法将样本凝固血细胞用磁珠法中量全血基因组DNA提取试剂盒进行DNA提取,提取的DNA产物使用紫外光密度检测仪检测A值,DNA提取物A260/A280比值在1.6~2.0之间为合格。合格样本分别经过目标片段扩增实验和单碱基延伸实验处理后使用sequenom mass array飞行质谱检测系统进行分型检测,响应率 > 85 %为分型合格样本。
1.3 统计分析应用SPSS 18.0软件对数据结果进行χ2检验,检测水准(α)为0.05。应用HaploView 4.2软件进行Hardy-Weinberg平衡检验、连锁不平衡和单倍型分析。连锁不平衡(linkage disequilibrium,LD)是指在某一个群体中,不同座位上两个基因同时遗传的频率明显高于预期的随机频率现象[4]。一般用D,D′和r2来表示LD的程度。D是LD的基本单位,度量观察到的单倍型频率与平衡状态下期望频率的偏差,算法如下:D = P(AB)– P(A)*P(B);P(AB)表示实际观察到的AB频率,P(A)*P(B)表示AB频率的期望值(如果发生连锁不平衡,实际观测到的AB频率肯定不等于AB频率的期望值)。如果D值显著偏离0,则说明存在LD。因为D的取值强烈地依赖于人为制定的等位基因频率,所以它不利于LD程度的比较。标准化的不平衡系数D′能够避免这种对等位基因频率的依赖。D′的计算方法如下:D′ = D/Dmax,当D < 0,Dmax = min{P(A)P(B),P(a)P(b)};当D > 0,Dmax = min{P(A)P(b),P(a)P(B)};当D′ = 1,表示连锁完全不平衡,没有重组;当D′ = 0,表示连锁完全平衡,随机组合。与D′相比,r 2在连锁不平衡中更加有用,因为其具有较强的群体遗传学理论基础和一些统计学上的优势:r2的期望值和有效种群大小和重组系数相关,r2 = 1/(1 + 4NeC),其中Ne是有效种群大小,C是重组系数。r2有很好的取样特性,样本量和r2的乘积就是所观察到的关联水平概率对应的 χ2值。与D′相比,在同样长度的染色体范围内,r2往往更低,这个特性能够帮助我们找到更精度的基因定位。另外,r2和D′相比,受样本量和等位基因频率的影响较小(但影响仍然存在)。当D′和r2值为0时,连锁完全平衡;D′和r2值为1时,连锁完全不平衡[5]。针对以上情况,本研究在分析连锁不平衡信息时综合纳入了D′和r2值对结果进行解析。
2 结 果 2.1 基本情况随机选取来自广西、内蒙和新疆地区6~16岁384名少数民族在校学生的血细胞,并成功获取了质量合格的DNA。其中广西213名壮族在校学生10份样本基础信息缺失,有效样本为203份,男生95人,女生80人,有效率为95.3 %,平均年龄(11 ± 5.66)岁;内蒙78名蒙古族在校学生所有样本信息齐全,有效样本为78份,男生38人,女生40人,有效率为100 %,平均年龄(10 ± 3.09)岁;新疆93名维吾尔族在校学生,男生53人,女生40人,所有样本信息齐全,有效率为100 %,平均年龄(13 ± 1.22)。最终纳入分析的样本总数为374份。
2.2 Hardy-Weinberg平衡检验来自广西,内蒙和新疆地区少数民族在校学生的血样样本21个SNP位点基因分型检验结果(P > 0. 05)均符合Hardy-Weinberg遗传平衡,说明3个地区中人群样本均代表不同的群体。
2.3 铁营养状况关联SNP位点基因型频率分析(表1)| 表 1 少数民族在校学生铁营养状况关联SNP位点基因型频率分析 |
对广西、内蒙和新疆地区少数民族在校学生铁营养状况关联的21个SNP位点不同基因型频率进行比较的结果显示,rs11704654、rs1421312、rs173107、rs-1799852、rs1830084、rs1880669、rs2111833、rs3811658、rs7385804、rs9948708共10个SNP位点的基因型频率分布均P < 0.05,具有统计学意义。其中rs1830084、rs1880669和rs3811658位于3号染色体上,rs11704654、rs1421312和rs2111833位于22号染色体上。
2.4 连锁情况和单倍型分析 2.4.1 3号染色体上连锁不平衡信息(表2、图1)| 表 2 3号染色体上连锁不平衡信息 |
|
图 1 3号染色体上SNP位点R-squared图 |
对3号染色体上rs1830084、rs1880669和rs3811658进行连锁不平衡和单倍型分析,结果如表2所示。R-squared图显示,壮族,蒙古族和维吾尔族在校学生3个位点的连锁不平衡关联强度各有特点,其中数值越大颜色越深,颜色越深连锁程度越强(图1)。进一步通过数据分析显示了3个少数民族中每2个位点之间的连锁程度和单倍型分布具有不同的地域特征(表2)。作为2个位点间的统计关联指标,r2 ≥ 0.8,则认为可以用一个点代表另外一个点,新疆地区rs3811658和rs1830084之间的r2为0.81,可以用其中一个位点代替。
2.4.2 22号染色体上连锁不平衡信息(表3、图2)| 表 3 22号染色体上连锁不平衡信息 |
|
图 2 22号染色体上SNP位点R-squared图 |
通过数据对22号染色体上rs11704654,rs1421312和rs2111833进行连锁不平衡和单倍型分析,结果显示了3个少数民族中每2个位点之间的连锁程度和单倍型分布具有明显的地域特征。R-squared图显示,壮族、蒙古族和维吾尔族在校学生3个位点的连锁不平衡关联强度不同,其中数值越大颜色越深,颜色越深连锁程度越强,r2 ≥ 0.3表示2位点之间连锁不平衡关联程度强,可以看出rs2111833 和rs1421312之间r2分别为壮族0.30,蒙古族0.24,维吾尔族0.44,结果显示壮族和维吾尔族在校学生中2位点间显示连锁不平衡强关联性,蒙古族在校学生位点连锁不平衡程度弱于壮族和维吾尔族。
3 讨 论本研究基于以往文献报道的21个与铁营养素关联的阳性SNP位点,在我国广西、内蒙和新疆地区对6~16岁壮族、蒙古族和维吾尔族在校学生人群分析地域分布特征,发现10个SNP位点在地域分布差异上存在统计学意义。随后对位于3号和22号染色体上的各3个位点进行了连锁不平衡和单倍型分析,量化了3个少数民族在校学生在不同基因型位点之间的连锁不平衡程度和单倍型分布特点。Benyamin等[8]提到TF基因上2个独立的位点rs3811647和rs1830084在欧洲人群中的连锁不平衡系数为0.86。本研究中位于3号染色体上的rs1830084和rs3811658位点连锁不平衡关联系数为0.81,但rs3811647在3个少数民族中的基因型分布频率差异无统计学意义(P = 0.613),表明SNP位点在不同地域和不同人群中存在差异。
Mclaren等[17]针对位于22号染色体TMPRSS6基因rs2111833和rs1421312与铁生化指标关联性的研究结果显示,在白种人群rs2111833与血清铁(P = 4.7 × 10–7)和log转铁蛋白饱和度(P = 0.001 4)之间存在关联,在亚洲裔人群中显示出总铁结合力(P = 0.007)、不饱和铁结合力(P = 0.006 7)和血清铁(P = 0.044)有关联。在白种人群中rs1421312位点与血清铁(P = 3.7 × 10–6)和log转铁蛋白饱和度(P = 0.001 8)有关联,在非洲裔美洲人群中与血清铁(P = 0.001 2)和log转铁蛋白饱和度(P = 0.001 1)有关联。该研究认为rs2111833和rs1421312在不同种族中均对铁营养状况产生影响。本研究中对于rs2111833和rs1421312位点的连锁不平衡分析显示,壮族和维吾尔族在校学生基因多态性位点连锁关联程度强于蒙古族,3个少数民族在校学生间的基因型频率比较存在统计学意义,表明与铁营养状况相关的阳性SNP位点在我国少数民族在校学生人群中存在地域上的差异。
继第一代的RFLP (restriction fragment length polymorphism)及第二代的STR (short tandem repeat)以长度的差异作为遗传标记之后,SNP作为第三代遗传标记,人类基因组中平均每1 000个核苷酸有1个SNP,30亿碱基中共有300万以上的SNP,基因上位点间存在连锁不平衡关联性,依据关联程度强弱,可以用1个标签SNPs位点(或多个位点的组合)代表另外的位点或单倍型,描述人类常见的遗传多态性模式,本研究中维吾尔族在校学生中rs3811658和rs1830084之间的r2为0.81,显示出2个位点间的强连锁不平衡程度,并明显区别于壮族和蒙古族在校学生,3个少数民族在校学生在单倍型分布方面也各具有特点。
本研究基于我国少数在校学生人群分析了壮族、蒙古族和维吾尔族在校学生铁营养状况关联SNP位点,并通过基因型频率分布特点,连锁不平衡程度及单倍型构成量化了区域分布特征的不同,而目前从SNP位点角度对我国不同人群的地域分布差异研究鲜有报道,本研究为从SNP方面对在校学生人群的铁营养素缺乏风险差异化干预提供了一定的科学依据。因本研究纳入的样本数量有限,纳入的以往报道与铁营养状况相关的21个阳性SNP位点中得出了10个有地域分布差异的SNP位点,在连锁不平衡分析中D′的一个重要特点是严格依赖于样品量的大小。如果样品量太小,D′值的实际含义很容易被“夸大”,尤其某个位点的其中一个等位基因的频率很低时,尽管本研究同时纳入了r2值,r2和D′相比,受样本量和等位基因频率的影响较小,但影响仍然存在。本研究的样本量较少,结果带有一定的局限性,但从一定程度上可以看出3个少数民族在校学生SNP地域分布具有差异性。此后可扩大样本量,从人群的铁摄入状况、生化指标及关联SNP位点等环境 – 基因、基因 – 基因相互作用的角度开展大样本量的研究,探讨从SNP方面评估在校学生个体铁营养素缺乏风险的可能性。
| [1] | 张丁, 李永利, 刘翠娥, 等. NaFeEDTA对青少年缺铁性贫血状况改善作用的研究[J]. 中国公共卫生, 2002, 18(11): 1402–1403. |
| [2] | 郜蕊, 陈静, 周筱燕. 单纯性肥胖高中生血清钙铁锌铜对脂代谢影响[J]. 中国公共卫生, 2011, 27(4): 494–495. |
| [3] | 王陇德. 中国居民营养与健康状况调查报告之一 —— 综合报告[M]. 北京: 人民卫生出版社, 2005. |
| [4] | Pritchard JK, Przeworski M. Linkage disequilibrium in humans: models and data[J]. American Journal of Human Genetics, 2001, 69(1): 1–14. |
| [5] | Tenesa A, Navarro P, Hayes BJ, et al. Recent human effective population size estimated from linkage disequilibrium[J]. Genome Research, 2007, 17(4): 520–526. DOI:10.1101/gr.6023607 |
| [6] | Gichohi-Wainaina WN, Tanaka T, Towers GW, et al. Associations between common variants in iron-related genes with haematological traits in populations of African ancestry[J]. PLoS One, 2016, 11(6): e0157996. DOI:10.1371/journal.pone.0157996 |
| [7] | Delbini P, Vaja V, Graziadei G, et al. Genetic variability of TMPRSS6 and its association with iron deficiency anaemia[J]. British Journal of Haematology, 2010, 151(3): 281–284. DOI:10.1111/j.1365-2141.2010.08349.x |
| [8] | Benyamin B, Mcrae AG, Gordon S, et al. Variants in TF and HFE explain approximately 40% of genetic variation in serum-transferrin levels[J]. American Journal of Human Genetics, 2009, 84(1): 60–65. DOI:10.1016/j.ajhg.2008.11.011 |
| [9] | 朴玮, 孙静, 黄建, 等. rs855791和rs3811647多态性对8~14岁人群血清铁蛋白与可溶性转铁蛋白受体水平的影响[J]. 卫生研究, 2014, 43(6): 900–905. |
| [10] | Milet J, Déhais V, Bourgain C, et al. Common variants in the BMP2, BMP4, and HJV genes of the hepcidin regulation pathway modulate HFE hemochromatosis penetrance[J]. American Journal of Human Genetics, 2007, 81(4): 799–807. DOI:10.1086/520001 |
| [11] | Benyamin B, Ferreira MA, Willemsen G, et al. Common variants in TMPRSS6 are associated with iron status and erythrocyte volume[J]. Nature Genetics, 2009, 41(11): 1173. DOI:10.1038/ng.456 |
| [12] | Whitfield JB, Cullen LM, Jazwinska EC, et al. Effects of HFE C282Y and H63D polymorphisms and polygenic background on iron stores in a large community sample of twins[J]. American Journal of Human Genetics, 2000, 66(4): 1246–1258. DOI:10.1086/302862 |
| [13] | Mclaren CE, Mclachlan S, Garner CP, et al. Associations between single nucleotide polymorphisms in iron-related genes and iron status in multiethnic populations[J]. PLoS One, 2012, 7(6): e38339. DOI:10.1371/journal.pone.0038339 |
| [14] | An P, Wu Q, Wang H, et al. TMPRSS6, but not TF, TFR2 or BMP2 variants are associated with increased risk of iron-deficiency anemia[J]. Human Molecular Genetics, 2012, 21(9): 2124. DOI:10.1093/hmg/dds028 |
| [15] | He M, Workalemahu T, Manson JE, et al. Genetic determinants for body iron store and type 2 diabetes risk in US men and women[J]. PLoS One, 2012, 7(7): e40919. DOI:10.1371/journal.pone.0040919 |
| [16] | Pichler I, Minelli C, Sanna S, et al. Identification of a common variant in the TFR2 gene implicated in the physiological regulation of serum iron levels[J]. Human Molecular Genetics, 2011, 20(6): 1232–1240. DOI:10.1093/hmg/ddq552 |
| [17] | Mclaren CE, Garner CP, Constantine CC, et al. Genome-wide association study identifies genetic loci associated with iron deficiency[J]. PLoS One, 2011, 6(3): e17390. DOI:10.1371/journal.pone.0017390 |
2019, Vol. 35


