2. 国家级玉江猪(玉山黑猪)保种场, 玉山 334700
2. National Conservation Farm of Yushan Black Pigs, Yushan 334700, China
猪是继狗和羊之后第三个被人类驯养的家畜[1]。经过长时间的人工选择和自然选择,家猪形成了丰富的品种和多样化的体型外貌特征。玉山黑猪是江西省第一个被列入国家级畜禽遗传资源保护名录的地方猪种,具有早熟易肥,肉质细嫩、鲜美等特点,其全身被毛黑色。玉山黑猪的头型有两类:“狮子头”型和“马脸”型。“狮子头”型头大,额宽,且有较深的皱纹;嘴筒短略上翘,躯干背腰不平;腹下垂,体短,体型较小,体质较疏松。“马脸”型头中等大,躯干背腰平直,体长[2]。迄今为止,导致这两种头型的遗传机制尚未被解析。深入揭示玉山黑猪不同头型的形成机制对玉山黑猪种质特性形成机理研究、品种多样性的保护及利用具有重要的指导意义。
在人工选择的过程中,对目标基因的定向选择会导致种群的某一性状发生改变。目的基因优势等位基因频率在选择的作用下会不断提高,其附近与之紧密连锁的等位基因频率将伴随其一同升高,此现象称为选择性清除(selective sweep)。因此,受到选择的基因组区域会表现出选择性清除信号,如连锁不平衡值(linkage disequilibrium, LD)升高、核苷酸多态性(DNA polymorphism)下降等[3]。选择和遗传漂变都能导致遗传分化和选择信号的产生,表现为不同种群间等位基因频率差异显著。遗传分化系数(Fst)是检测群体遗传分化程度的重要指标,由Wright[4]提出,用于计算物种亚群之间的分化程度。
全基因组关联分析(GWAS)自2005年首次报道应用于人视网膜黄斑变性遗传机理研究以来,其在人类复杂疾病研究领域取得了迅速发展。研究人员通过GWAS发现了大量与疾病相关联的遗传变异。在家猪中,自2011年第一篇应用GWAS研究猪毛色的文章报道以来[5],GWAS在家猪重要经济性状关联基因的鉴别中同样得到了广泛应用[6-7]。
本研究尝试利用猪全基因组60K SNP芯片数据,检测玉山黑猪“狮子头”和“马脸”两种头型种群间的遗传分化信号,并进行病例-对照的全基因组关联分析,初步筛选与头型相关的染色体关联区域,并在这些区域内发现令人感兴趣的候选基因,以期初步解析玉山黑猪形成不同头型的分子机制,为深入研究玉山黑猪及中国地方猪种群体内不同头型的形成机制奠定基础。
1 材料与方法 1.1 试验动物及表型测定本研究选取国家级玉山黑猪保种场的36头原种猪,其中“狮子头”型猪12头,“马脸”型猪24头(图 1)。在出生时测定初生重,断奶时测定断奶重,猪只180日龄时,测定其体重、体长、体高、背高、胸围、胸深、腹围、管围、腿臀围,并做好记录。
![]() |
a.马脸型;b.狮子头型 a. Long-pointed head; b. Short head 图 1 玉山黑猪不同头型个体 Figure 1 Different head types in Yushan Black pigs |
采集耳组织样品,按常规的酚/氯仿法提取耳组织DNA,将其溶于TE缓冲液中,并统一稀释至50 ng·μL-1,用ILLumina猪60K SNP芯片进行扫描分型。芯片分型工作委托北京怡美通德公司按照标准操作流程完成。用Plink软件(Plink v1.07)对SNP进行质控,剔除个体检出率<90%、最小等位基因频率<0.05、极显著偏离哈代温伯格平衡(P<0.000 001)、染色体位置不确定的SNP位点和剔除SNP检出率<90%的个体,最后剩余26 480个SNPs用于后续的统计分析[8]。
1.3 统计分析 1.3.1 玉山黑猪两种头型间表型差异性分析用R语言(R v3.3.1)中的aov()函数对所记录的11个性状进行组间方差分析[9]。将性别、批次(年、季)和180日龄体重作为协变量,比较这些表型性状在“狮子头”型和“马脸”型两组间是否存在显著差异。
1.3.2 玉山黑猪两种头型间遗传分化系数(Fst)的计算用R语言(R v3.3.1)中的Genepop软件包计算“狮子头”型和“马脸”型两类群体之间每个SNP位点的遗传分化系数(Fst)值:
$ Fst = \frac{{MSP - MSG}}{{MSP + \left( {{n_{{c}}} - 1} \right)MSG}} $ |
其中,MSG为群体内的观测均方差:
$ MSG = \frac{1}{{\sum\nolimits_{i = 1}^S {{n_i} - 1} }}\sum\limits_I^S {{n_i}{P_{Ai}}\left( {1 - {P_{Ai}}} \right);} $ |
MSP为群体间的观测均方差:
$ MSP = \frac{1}{{S - 1}}\sum\limits_i^S {{n_i}{{\left( {{P_{Ai}} - \overline {{P_A}} } \right)}^2};} $ |
nc是指校正后群体间的平均样本大小:
$ {n_c} = \frac{1}{{S - 1}}\sum\limits_{i - 1}^S {{n_i} - \frac{{\sum\nolimits_i {n_i^2} }}{{\sum\nolimits_i {{n_i}} }}} 。$ |
以上各公式中,i是总亚群数S的一个群体;PAi是第i个群体中等位基因A的频率;ni是亚群i的样本大小;
采用病例-对照的全基因组关联分析,应用GEMMA(genome-wide efficient mixed-model association)软件[11]中的单变量线性混合模型(univariate linear mixed model)来比较全基因组上“狮子头”型个体和“马脸”型个体间等位基因及基因型频率的差异,搜寻与目标性状基因座处于连锁不平衡的位点。为了消除群体分层对GWAS结果的影响,GEMMA将提前生成的一个分子亲缘关系矩阵作为随机效应带入到模型中:
$ y = W\alpha + x\beta + u + \varepsilon $ |
式中,y为所有个体的表型值向量;W为协变量矩阵;α为包含截距的相应的系数向量;x为SNP的基因型向量;β为SNP的影响效应;u为随机效应向量;ε为误差向量。将表型对性别和批次(年、季)进行回归分析,并用残差作为新的表型用于上述分析[12]。
采用Bonferroni方法确定关联显著性阈值,基因组显著水平阈值为0.05/N,N为有效SNP个数,即0.05/26 480=1.89E-06。通过与最高点SNP连锁不平衡(LD)r2≥0.8的SNP位点确定置信区间。使用Haploview程序[13]生成单倍型及单倍型框。采用QQ-plot通过比较无效假设的分布与实际关联性分布的差异来检测是否具有群体层化效应。
1.3.4 玉山黑猪两种头型候选基因的鉴别参照Sus scrofa Build 10.2基因组注释版本(http://www.ensembl.org/Sus_scrofa/Info/Index),查找遗传分化显著区域和GWAS置信区间内的基因。利用GeneCards (http://www.genecards.org/)数据库查找这些基因的生物学功能。为避免遗漏基因,针对家猪基因组中尚未注释的RefSeq基因,利用UCSC Genome Browser数据库(http://genome.ucsc.edu/)选出在人和小鼠中注释的同源基因。
2 结果 2.1 玉山黑猪两种头型群体间表型差异分析本研究统计分析了玉山黑猪“狮子头”型和“马脸”型两个类群的11个表型性状(表 1),发现“马脸”型猪比“狮子头”型猪的体长要长,体型要大,但差异未达到显著水平(P>0.05)。“马脸”型猪的管围显著大于“狮子头”型猪(P<0.05)。
![]() |
表 1 玉山黑猪“狮子头”型和“马脸”型猪11个表型性状的差异分析 Table 1 Differences of 11 phenotypic traits between long-pointed and short head individuals in Yushan Black pigs |
玉山黑猪两种头型的群体间总体上不存在明显的遗传分化,所得Fst值平均值为0.031(图 2)。Fst值最高的10个SNP涉及11个基因(表 2)。遗传分化最显著的选择信号位于10号染色体上,Fst值最大的SNP位点CASI0009931位于SSC10的11.36 Mb处(图 3a)。
![]() |
蓝线代表Fst的平均值 The blue line indicates the average Fst value 图 2 所有SNP位点遗传分化系数(Fst)值的密度分布 Figure 2 Distribution of genetic differentiation coefficient (Fst) values of all the SNPs |
![]() |
表 2 Fst值最高的10个SNPs及其附近基因 Table 2 10 SNPs with the top Fst values and their nearby genes |
![]() |
a.全基因组SNP的Fst值分布图;b. GWAS曼哈顿图:图中虚线代表 5%基因组显著水平阈值 a. Distribution of Fst values of all qualified SNPs across the genome; b. Manhattan plot of GWAS: The dashed lines indicate the 5% genome-wide significant threshold values 图 3 全基因组Fst值分布图和GWAS曼哈顿图 Figure 3 The distribution of Fst values of SNPs across the genome and Manhattan plot of GWAS |
通过GEMMA软件对所有个体进行病例-对照的全基因组关联分析,并经Q-Q plot检验,结果显示,膨胀系数(λ)为1.037, 表示没有明显的群体层化效应(图 4)。我们在SSC10上检测到了2个基因组显著水平的SNPs,最高点SNP(ALGA0056978,P=5.38E-07)位于11.76 Mb处(图 3b),与Fst最高值的SNP(CASI0009931, SSC10:11.36 Mb)相距仅400 kb。通过与最高点连锁不平衡(LD)r2≥0.8及单倍型分析, 确定该位点的置信区间为11.76~12.05 Mb(图 5)。
![]() |
横坐标为预期P值对数的相反数(将负数转换为正数),纵坐标为计算P值对数的相反数 X axis means the expected values of the opposite of exponential P values, the Y axis means the observed values of the opposite of exponential P values 图 4 Quantile-quantile (QQ)图 Figure 4 Quantile-quantile (QQ) plot |
![]() |
a.最显著位点附近4 Mb的区域GWAS,四边形块代表不同显著程度的SNP位点,不同颜色代表与最高点不同的连锁不平衡程度;b. 290 kb置信区间内的基因;c.包含最高点的LD热图,最高点SNP用红线表示,一段包含最高点的392 kb单倍型框用黑色线框圈出 a. Regional plot of a 4 Mb region around the most significant SNP, diamonds represent the SNPs with differet significance, the colored diamonds indicate different linkage disequilibrium (LD) extents between the top SNP and other SNPs; b. Genes within the 290 kb confidence interval; c. LD heatmap for the SSC10 locus, the top SNP is indicated in red line, a haplotype block with 392 kb harbors containing the top SNP are highlighted by black triangles 图 5 10号染色体上的显著关联位点 Figure 5 The significant associated region on SSC10 |
近年来,中国地方猪因其优异的种质特性受到研究者的广泛关注,为科研工作在繁殖性状、肉质性状和遗传进化等领域提供了重要的研究材料[14]。在《中国畜禽遗传资源志·猪志》收录的猪种中,有18个猪种(东串猪、山猪、岔路黑猪、金华猪、仙居花猪、皖南黑猪、滨湖黑猪、杭猪、乐平猪、玉江猪、大蒲莲猪、确山黑猪、阳新猪、大围子猪、通城猪、德保猪、文昌猪、汉江黑猪)存在头型的分离。从其中心产区的分布地域来看,这些具有头型变异的猪种主要集中在长江中下游流域。不同头型的产生可能与长江中下游流域祭祀习俗有关。清吴谷人《新年杂咏》中写到“杭俗,岁终礼神尚猪首,至年外犹足充馔。定买猪头在冬至前,选皱纹如‘寿’字者,谓之‘寿头猪头’。”“狮子头”型猪符合了当时社会活动和人们祭祀的文化需求而受到了选择。
我们对玉山黑猪两种头型的群体进行了遗传分化信号检测,Wright[4]建议,Fst为0~0.05表明群体间遗传分化程度较小,可以忽略,Fst为0.05~0.15表明群体间分化程度为中等,Fst为0.15~0.25表明群体间分化程度较大,Fst大于0.25则表明群体间分化程度很大。本研究所得到的Fst平均值为0.031(图 2),说明玉山黑猪两种头型的群体间总体上不存在明显的遗传分化。我们对玉山黑猪“狮子头”型和“马脸”型两个类群的11个表型性状进行了差异性分析,结果表明大部分性状(除管围外)均差异不显著。这些结果符合了玉山黑猪品种选育的实践-即无论是“狮子头”型还是“马脸”型都是按照相同的方向进行选育的,玉山黑猪并没有形成两种特定的、存在明显遗传分化和表型巨大差异的亚群。这为后续基于“病例-对照”的两种头型群体的全基因组关联分析奠定了基础。将仅存在头型差异的两组玉山黑猪群体进行了基于“病例-对照”的全基因组关联分析,结果显示,在10号染色体上检测到了与遗传分化信号相互重合的显著关联位点。通过连锁不平衡(LD)和单倍型分析,将置信区间定位在11.76~12.05 Mb(图 5)。此区间内包含两个可能的候选基因:RAB3GAP2和IARS2。
RAB3GAP2(RAB3-GTP酶激活蛋白催化亚单位2)编码的蛋白质属于RAB3蛋白质家族,参与调节胞外分泌的神经递质和激素,可能参与神经发育过程如增殖、迁移和分化前突触的形成[15]。在人中,与RAB3GAP2相关的疾病有Martsolf综合征和Warburg Micro综合征,其症状表现为颅面部骨骼发育异常(颧骨扁平、高颚)和智力障碍[16]。Aligianis等[17]报道,RAB3GAP2基因的一个低倍纯合剪切突变在一个家族中造成Martsolf综合征。Borck等[18]报道,一个纯合移框突变造成一个土耳其女孩的Warburg Micro综合征。IARS2(异亮氨酰-tRNA合成酶2)编码蛋白可氨酰化与其tRNA同源的氨基酸,氨酰合成酶被认为是在进化过程中最早出现的蛋白质。在人中,与IARS2相关的疾病包括骨骼发育异常、生长激素缺乏症、白内障和感音神经性听力损失等[19-20]。GO注释表明,与该基因相关的生物学活动包括核苷酸装配和氨酰-tRNA编辑[21]。近年来多项研究表明,IARS2基因在人类中与多种疾病相关,如肥厚型心肌病[22]、非小细胞肺癌[23]、胃癌[24]等。Hägg等[25]利用全基因组基因荟萃分析认为,IARS2等基因与欧洲人肥胖相关。Gomes等[26]发现,IARS2等蛋白质合成和降解基因与内洛尔牛的重要经济性状相关。根据与这两个基因相关的人疾病综合征表现特征(骨骼发育,尤其是颅面部骨骼发育),笔者推测,RAB3GAP2和IARS2基因可能参与调控玉山黑猪两种头型的形成过程。验证这一推测需要更多深入的后续研究,如精细定位和多组学联合分析。
4 结论本研究基于全基因组60K芯片数据,结合群体遗传分化分析和全基因组关联分析,在SSC10上鉴别到了与玉山黑猪两种头型形成显著关联的遗传位点。结合统计分析结果和目标区域内的基因功能,笔者推测,RAB3GAP2和IARS2是影响玉山黑猪头型的重要候选基因。该结果为玉山黑猪及中国地方猪种群体内不同头型形成机制的深入研究奠定了基础。
致谢: 感谢江西农业大学任军教授在试验设计和文章修改上提供的指导和帮助。[1] | WANG C, WANG H Y, ZHANG Y, et al. Genome-wide analysis reveals artificial selection on coat colour and reproductive traits in Chinese domestic pigs[J]. Mol Ecol Resour, 2015, 15(2): 414–424. DOI: 10.1111/1755-0998.12311 |
[2] |
国家畜禽遗传资源委员会.
中国畜禽遗传资源志:猪志[M]. 北京: 中国农业出版社, 2011: 157-160.
National Livestock and Poultry Genetic Resources Committee. Animal genetic resources in China:Pigs[M]. Beijing: China Agriculture Press, 2011: 157-160. (in Chinese) |
[3] |
李秀领, 杨松柏, 唐中林, 等. 大白猪和通城猪全基因组选择性清扫分析[J]. 遗传, 2012, 34(10): 1271–1281.
LI X L, YANG S B, TANG Z L, et al. Genome-wide selective sweep analysis on Large White and Tongcheng pigs[J]. Hereditas, 2012, 34(10): 1271–1281. (in Chinese) |
[4] | WRIGHT S. Isolation by distance[J]. Genetics, 1943, 28(2): 114–138. |
[5] | REN J, MAO H, ZHANG Z, et al. A 6-bp deletion in the TYRP1 gene causes the brown colouration phenotype in Chinese indigenous pigs[J]. Heredity (Edinb), 2011, 106(5): 862–868. DOI: 10.1038/hdy.2010.129 |
[6] | REN J, DUAN Y Y, QIAO R M, et al. A missense mutation in PPARD causes a major QTL effect on ear size in pigs[J]. PLoS Genet, 2011, 7(5): e1002043. DOI: 10.1371/journal.pgen.1002043 |
[7] | YANG B, ZHANG W C, ZHANG Z Y, et al. Genome-wide association analyses for fatty acid composition in porcine muscle and abdominal fat tissues[J]. PLoS One, 2013, 8(6): e65554. DOI: 10.1371/journal.pone.0065554 |
[8] |
阮国荣, 龙毅, 宿英, 等. 全基因组关联分析(GWAS)鉴别猪腹股沟/阴囊疝易感基因[J]. 畜牧兽医学报, 2014, 45(11): 1775–1783.
RUAN G R, LONG Y, SU Y, et al. Genome-wide association study on identifying susceptibility loci for pig inguinal/scrotal hernia[J]. Acta Veterinaria et Zootechnica Sinica, 2014, 45(11): 1775–1783. (in Chinese) |
[9] |
杨杰, 周李生, 刘先先, 等. 莱芜猪与杜长大三元杂交猪肉质性状种质资源比较研究[J]. 畜牧兽医学报, 2014, 45(11): 1752–1759.
YANG J, ZHOU L S, LIU X X, et al. A comparative study of meat quality traits between Laiwu and DLY Pigs[J]. Acta Veterinaria et Zootechnica Sinica, 2014, 45(11): 1752–1759. (in Chinese) |
[10] | WEIR B S, COCKERHAM C C. Estimating f-statistics for the analysis of population structure[J]. Evolution, 1984, 38(6): 1358–1370. |
[11] | ZHOU X, STEPHENS M. Genome-wide efficient mixed-model analysis for association studies[J]. Nat Genet, 2012, 44(7): 821–824. DOI: 10.1038/ng.2310 |
[12] | WANG C B, WANG X P, TANG J H, et al. Genome-wide association studies for two exterior traits in Chinese Dongxiang spotted pigs[J]. Anim Sci J, 2018. DOI: 10.1111/asj.13003 |
[13] | BARRETT J C, FRY B, MALLER J, et al. Haploview:Analysis and visualization of LD and haplotype maps[J]. Bioinformatics, 2005, 21(2): 263–265. |
[14] | AI H S, FANG X D, YANG B, et al. Adaptation and possible ancient interspecies introgression in pigs identified by whole-genome sequencing[J]. Nat Genet, 2015, 47(3): 217–225. DOI: 10.1038/ng.3199 |
[15] | NAGANO F, SASAKI T, FUKUI K, et al. Molecular cloning and characterization of the noncatalytic subunit of the Rab3 subfamily-specific GTPase-activating protein[J]. J Biol Chem, 1998, 273(38): 24781–24785. DOI: 10.1074/jbc.273.38.24781 |
[16] | HANDLEY M T, MORRIS-ROSENDAHL D J, BROWN S, et al. Mutation spectrum in RAB3GAP1, RAB3GAP2, and RAB18 and genotype-phenotype correlations in warburg micro syndrome and Martsolf syndrome[J]. Hum Mutat, 2013, 34(5): 686–696. DOI: 10.1002/humu.22296 |
[17] | ALIGIANIS I A, MORGAN N V, MIONE M, et al. Mutation in Rab3 GTPase-activating protein (RAB3GAP) noncatalytic subunit in a kindred with martsolf syndrome[J]. Am J Hum Genet, 2006, 78(4): 702–707. DOI: 10.1086/502681 |
[18] | BORCK G, WUNRAM H, STEIERT A, et al. A homozygous RAB3GAP2 mutation causes Warburg Micro syndrome[J]. Hum Genet, 2011, 129(1): 45–50. DOI: 10.1007/s00439-010-0896-2 |
[19] | SCHWARTZENTRUBER J, BUHAS D, MAJEWSKI J, et al. Mutation in the nuclear-encoded mitochondrial isoleucyl-tRNA Synthetase IARS2 in patients with cataracts, growth hormone deficiency with short stature, partial sensorineural deafness, and peripheral neuropathy or with Leigh syndrome[J]. Hum Mutat, 2014, 35(11): 1285–1289. |
[20] | MOOSA S, HAAGERUP A, GREGERSEN P A, et al. Confirmation of CAGSSS syndrome as a distinct entity in a Danish patient with a novel homozygous mutation in IARS2[J]. Am J Med Genet, 2017, 173(4): 1102–1108. DOI: 10.1002/ajmg.a.v173.4 |
[21] | SOKABE M, OKADA A, YAO M, et al. Molecular basis of alanine discrimination in editing site[J]. Proc Natl Acad Sci U S A, 2005, 102(33): 11669–11674. DOI: 10.1073/pnas.0502119102 |
[22] | PERLI E, GIORDANO C, TUPPEN H A L, et al. Isoleucyl-tRNA synthetase levels modulate the penetrance of a homoplasmic m.4277T>C mitochondrial tRNAIle mutation causing hypertrophic cardiomyopathy[J]. Hum Mol Genet, 2012, 21(1): 85–100. DOI: 10.1093/hmg/ddr440 |
[23] | YIN J, LIU W, LI R, et al. IARS2 silencing induces non-small cell lung cancer cells proliferation inhibition, cell cycle arrest and promotes cell apoptosis[J]. Neoplasma, 2016, 63(1): 64–71. DOI: 10.4149/neo_2016_008 |
[24] | FANG Z, WANG X Y, YAN Q, et al. Knockdown of IARS2 suppressed growth of gastric cancer cells by regulating the phosphorylation of cell cycle-related proteins[J]. Mol Cell Biochem, 2018, 443(1-2): 93–100. DOI: 10.1007/s11010-017-3213-8 |
[25] | HÄGG S, GANNA A, VAN DER LAAN S W, et al. Gene-based meta-analysis of genome-wide association studies implicates new loci involved in obesity[J]. Hum Mol Genet, 2015, 24(23): 6849–6860. DOI: 10.1093/hmg/ddv379 |
[26] | GOMES R C, SILVA S L, CARVALHO M E, et al. Protein synthesis and degradation gene SNPs related to feed intake, feed efficiency, growth, and ultrasound carcass traits in Nellore cattle[J]. Genet Mol Res, 2013, 12(3): 2923–2936. DOI: 10.4238/2013.August.12.8 |