畜牧兽医学报  2020, Vol. 51 Issue (7): 1515-1524. DOI: 10.11843/j.issn.0366-6964.2020.07.005    PDF    
拷贝数变异全基因组关联分析及数量性状基因座定位联合鉴定猪体高性状候选基因
欧阳峰正, 王立刚, 岳静伟, 颜华, 张龙超, 侯欣华, 刘欣, 王立贤     
中国农业科学院北京畜牧兽医研究所, 农业部动物遗传育种与繁殖(家禽)重点实验室, 北京 100193
摘要:旨在利用全基因组拷贝数变异区域(copy number variation regions,CNVRs)关联分析以及全基因组数量性状基因座(quantitative trait locus,QTLs)定位联合筛选出影响猪体高性状的候选基因。本研究利用快速检测基因组拷贝数变异软件CNVcaller对本实验室构建的大白×民猪F2代资源群体的重测序数据进行拷贝数变异检测。利用混合线性模型(mixed-linear model,MLM)将性别和胎次作为固定效应对体高性状进行拷贝数变异全基因组关联分析(CNVR-GWAS)。采用软件R/qtl进行QTL分析,并使用置换检验(permutation test,PT)进行检验。将CNVR-GWAS与QTL结果进行联合注释,结合GO富集和KEGG通路分析,对影响猪体高的位点和基因进行挖掘。利用实时荧光定量PCR(qPCR)方法验证候选基因。结果表明,本群体在全基因组范围内共有3 099个CNVRs,其中有两个CNVRs与体高性状在全基因组范围内显著相关,分别位于7号染色体的25 358 001~26 696 400 bp处(CNVR1)和54 087 201~54 090 000 bp处(CNVR2)。在混合线性模型分析的结果中发现,CNVR1拷贝数增加(P < 0.01)和CNVR2拷贝数缺失(P < 0.01)对猪的体高性状具有显著影响。基因组显著水平可找到2个显著影响猪体高的QTLs,分别为BH-1和BH-2,其中BH-2对体高性状的影响较大。CNVR1和BH-2重叠区存在1个嗅觉受体基因OR12D3和18个未被注释的基因。qPCR验证OR12D3的拷贝数变异与利用混合线性模型统计推断出的结果一致。初步推测,OR12D3基因的拷贝数变异可能与猪体高性状相关。
关键词大白×民猪F2代猪群体    拷贝数变异    数量性状基因座    体高    全基因组关联分析    
Genome-wide Association Study of Copy Number Variations and Quantitative Trait Loci Mapping to Identify Candidate Genes for Body Height Trait in Pigs
OUYANG Fengzheng, WANG Ligang, YUE Jingwei, YAN Hua, ZHANG Longchao, HOU Xinhua, LIU Xin, WANG Lixian     
Key Laborary of Animal Genetics, Breeding and Reproduction(Poultry) of Ministry of Agriculture, Institute of Animal Science, Chinese Academy of Agricultural Sciences, Beijing 100193, China
Abstract: The purpose of this study was to screen candidate genes affecting pig body height traits by using genome-wide copy number variation regions (CNVRs) association analysis and genome-wide quantitative trait loci (QTLs) mapping. CNVcaller software was used for rapid detection of genome copy number variations based on resequencing data of the Large White×Min pig F2 population constructed. Mixed-linear model (MLM) with gender and parity as fixed effects was used to perform copy number variation genome-wide association study (CNVR-GWAS) of body height traits. The software R/qtl was used for QTL analysis and the permutation test (PT) was used for inspection. The results of CNVR-GWAS and QTL were jointly annotated, combined with GO enrichment and KEGG pathway analysis, the loci and genes affecting pig body height were excavated. Candidate genes were verified by real-time quantitative polymerase chain reaction (qPCR) method. The results showed that there were 3 099 CNVRs in the whole genome of the population. Among them, two CNVRs were significantly associated with body height trait in the whole genome level, and they located at 25 358 001-26 696 400 bp (CNVR1) and 54 087 201-54 090 000 bp(CNVR2) on chromosome 7, respectively. The results of mixed linear model analysis showed that the increase of copy number of CNVR1 (P < 0.01) and the loss of copy number of CNVR2 (P < 0.01) had significant effects on pig body height. Two significant QTLs (BH-1 and BH-2, respectively)affecting pig body height were also found at genomic level, of which BH-2 had a greater impact on body height trait. There were one olfactory receptor gene OR12D3 and 18 unannotated genes in the overlap region of CNVR1 and BH-2. And the verification results of qPCR indicated that the copy number variation of OR12D3 was consistent with the results inferred by mixed linear model statistics. The copy number variation of the OR12D3 gene was inferred to be associated with pig body height trait.
Key words: Large White×Min pig F2 population    copy number variation    quantitative trait loci    body height    genome-wide association study    

与猪生长相关的性状普遍被认为是重要的经济性状。然而,与生长相关的性状大部分为数量性状,受微效多基因控制,每个基因对性状的贡献率非常低,在全基因组关联分析(gnome-wide association study, GWAS)中往往达不到显著水平而不能被准确挖掘出来。猪的体高一般为中高等遗传力,与低遗传力性状相比,应用遗传力高的性状去做选择育种能取得较快的进展。因此,找出影响猪体高的候选基因而后运用于分子育种具有重要的实践意义。

拷贝数变异(copy number variation, CNV)被定义为与参考基因组相比具有可变拷贝数的大小为1 kb或更长的DNA片段,是基因组结构变异的重要组成部分[1]。在人类遗传病中,CNV相较于单核苷酸多态性(single nucleotide polymorphism, SNP)对基因组结构和序列区域的影响更大,能够解释更多的遗传变异[2]。近年来,大部分针对于CNV检测的报道集中于比较基因组杂交(comparative genomic hybridization, CGH)芯片和SNP芯片[3-4],然而,随着二代测序技术的日益成熟和成本的不断下降,用测序数据来检测CNVR变得越来越广泛[5-6]。一些影响家畜重要经济性状的CNVR已被成功鉴定,例如Hou等[7]鉴定出许多与牛基因(1 263个)重叠的CNVs区域(大约56%),这些基因显著富集在免疫力、泌乳、繁殖等生理过程。Xu等[8]对荷斯坦牛的CNVs与产奶性状之间进行了全基因组关联分析,发现34个CNVRs与至少一种产奶性状显著相关,其中一些CNVs位于已知的奶牛生产性状QTL内或附近。Di Gerlando等[9]将羊的产奶性状与CNVs之间进行了GWAS,鉴定到与每日产奶量、乳脂率、乳脂量、乳蛋白率性状显著相关的CNVRs分别有13、11、10、2个。同样,Wang等[10]对猪的CNVs与肉质性状之间进行了全基因组关联分析,确定了8个CNVRs与至少一种肉质性状显著相关。Revilla等[11]基于二代测序数据对猪CNVR进行了全基因组关联分析,发现拷贝数变异区域CNVR112与脂肪酸组成和生长性状的遗传变异有关。Wright等[12]研究表明,位于SOX5转录因子编码基因内含子1附近的保守非编码序列拷贝数变异增加会导致鸡出现豌豆冠。

大多数性状和疾病还受环境因素以及数量性状基因座(quantitative Trait Loci, QTLs)的控制,由于每个基因座仅解释了表型变异的一部分,因此鉴定QTL的潜在突变也是一个挑战[13]。位置相关策略整合了基因组扫描和候选基因分析,其中候选基因的鉴定主要基于所鉴定QTL染色体片段中的物理连锁信息[14]。目前,应用位置相关策略去鉴定候选基因的方法已成功运用在猪[15-16]、牛[17]、羊[18]等动物上。Hérault等[19]利用GWAS与连锁不平衡分析(linkage disequilibrium-linkage analysis, LDLA)方法联合鉴定猪胴体和肉质性状相关的QTL,共检测到18个影响胴体组成性状的QTLs和16个影响肉质性状的QTLs。Fang和Pausch[20]利用单性状GWAS的结果进行meta分析, 鉴定到25个与牛的重要经济性状相关的QTLs,其中有2个QTLs同时与多个性状相关,包括牛的身体构造、产犊数、寿命和挤奶速度。Mebratie等[21]利用MLM方法鉴定了肉鸡群体中的11个与体重性状相关的QTLs以及5个与饲料利用效率相关的QTLs。Martin等[22]利用QTLmap软件的区间作图法进行连锁不平衡分析,并用线性回归进行似然比检验,鉴定出2个与阿尔卑斯山羊的胸深性状相关的QTLs区域。

为鉴定大白×民猪F2群体体高性状的因果突变位点和候选基因,本研究利用F2群体全基因组重测序数据,将全基因组范围内的CNVRs标记对体高性状相关变异进行关联分析以及相关QTL的定位,并综合两种关联分析的结果挖掘影响体高性状的相关基因,为猪的分子育种和体高性状候选基因鉴定提供参考。

1 材料与方法 1.1 研究材料及表型测定

本研究所用动物材料均来自中国农业科学院北京畜牧兽医研究所昌平试验养殖基地的大白猪×民猪F2代资源群体。该群体以4头雄性大白猪以及16头雌性民猪作为祖代进行杂交,产生的9头雄性以及46头雌性F1代猪再进行杂交,最终得到502头F2代猪。试验材料所用的F2代猪均在北京畜牧兽医研究所昌平试验养殖基地饲养,饲养环境、方式、日龄等均一致。本试验选取体高作为研究性状,体高性状在(240±7)日龄时由固定的工作人员使用固定的测量工具进行测量。猪的体高测定时用长度适当的钢丝对猪嘴部进行固定,保持猪背腰平直,猪只处于放松状态。应在猪相对安静的状态下,平地站立时,用硬尺量取髻甲至地面的垂直距离。

1.2 DNA提取及测序

用酒精消毒后的猪耳钳分别采集了502头F2代猪的耳组织样品用于DNA提取。DNA提取的方法采用常规的酚仿法。利用NanoDrop 1000(thermo fisher scientific, USA)仪器对DNA进行定量和质量鉴定,鉴定标准为:DNA浓度>50 ng·μL-1;A260 nm/A280 nm的比例为1.8~2.1;A260 nm/A230 nm比例>1.8。将检验合格的DNA利用Illumina Hi-seq2500进行双末端测序,测序深度为6×左右。

1.3 CNVR全基因组关联分析

为了快速准确检测F2代猪群体基因组拷贝数变异,Wang等[23]开发的CNVcaller软件被用来进行CNVR检测。该软件的主要步骤:1)将参考基因组分割成指定大小的窗口;2)统计窗口中匹配上的读数段;3)根据窗口之间的相似度进行绝对拷贝数校正;4)对校正后的窗口读段数进行GC含量校正和标准化;5)利用标准化的读段信号在群体中检测CNVR并进行基因型判定。本研究采用ENSEMBL网站上的Sscrofa10.2版本基因组数据(ftp://ftp.ensembl.org/pub/release77/fasta/sus_scrofa/dna/Sus_scrofa.Sscrofa10.2.dna.toplevel.fa.gz)作为参考基因组,按照800 bp的滑动窗口,400 bp的步长生成参考基因组数据库。计算每个个体基因组所有窗口的绝对拷贝数,确定拷贝数变异区域,最终导出VCF文件,用于关联分析。利用SAS 9.4软件对性别、批次、胎次等效应进行统计分析。采用TASSEL软件[24]中PCA+K(控制主成分加亲缘关系)的混合线性模型(mixed-linear model, MLM),将性别和胎次作为固定效应对CNVR标记进行关联位点的检测,设定的阈值为P < 1.61×10-5(0.05/所有CNVRs标记数目)。

1.4 QTL全基因组关联分析

采用R/qtl软件[25]的复合区间作图法进行猪体高的QTL定位和效应检测。该软件QTL定位的计算方法是采用隐马尔可夫模型(hidden Markov model, HMM)技术[26]来处理基因型数据。利用置换检验(permutation test, PT)检验1 000次以及0.99置信度来估计对应的LOD阈值。

1.5 猪体高显著相关CNVR与QTL定位联合分析

利用Kobas3.0(http://kobas.cbi.pku.edu.cn/anno_iden.php)对显著性CNVR和QTL区间作GO富集和KEGG通路分析。利用Ensembl的VEP (http://asia.ensembl.org/Tools/VEP)工具注释与体高显著相关的CNVR以及QTL区间的基因,找出CNVR与QTL重叠区的基因。在GenBank (https://www.ncbi.nlm.nih.gov/)中对重叠的基因进行功能注释。

1.6 利用qPCR方法对OR12D3基因拷贝数进行验证

根据猪参考基因组序列,使用Primer Premier 5.0设计检测OR12D3基因的特异性引物,将单拷贝的GCG(glucagon)基因作为内参。qPCR引物由赛默飞世尔科技(中国)有限公司合成,OR12D3基因的上游引物为5′-TTGCCACTCGCACAAACTC-3′,下游引物为5′-GTGAAGCCTACGGGTCCAT-3′;GCG基因的上游引物为5′-GCCCAGGATAACCGTAACTC -3′,下游引物为5′-CACCATTTCCCACCCTTTT-3′。利用Y063荧光定量PCR (ABI Q7 Flex 96孔)进行qPCR扩增,PCR反应体系为20 μL:基因组DNA 2 μL,上、下游引物(10 μmol·L-1)各0.4 μL,2×TB Green Premix Ex Taq 10 μL,50×ROX Reference Dye II 0.4 μL,ddH2O 6.8 μL。PCR反应条件:95 ℃预变性30 s;95 ℃变性5 s,60 ℃退火34 s,共计40个循环;熔解曲线为95 ℃ 15 s,60℃ 1 min及95 ℃ 15 s。采用相对定量的方法验证9个样本基因组(猪BH高、低、中各3个)中OR12D3基因的拷贝数,每个反应设3次重复,采用2-ΔΔCT[27]的方法计算,其中-ΔΔCT代表具有CNVR的样品的ΔCT值与单拷贝样品的ΔCT值的比较。

2 结 果 2.1 猪体高性状表型分布分析

本试验中,502头大白×民猪F2代资源群体的体高性状分布如图 1所示。F2代猪群体的体高性状的平均值为69.76 cm;最小值为55.6 cm,最大值为81.50 cm,标准差为4.29 cm,变异系数为6.15%。如图 1所示,表型的性状分布基本符合正态分布,可用于CNVR的全基因组关联分析。

图 1 猪体高性状表型分布 Fig. 1 Phenotypic distribution of body height trait in pigs
2.2 猪全基因组CNVR检测及体高性状显著CNVRs鉴定

利用CNVRcaller软件,在502头F2代猪群体中总共检测到3 099个CNVRs,CNVRs分布见表 1,将AA基因型的CNVR定义为缺失型,AG基因型的CNVR定义为正常型,GG基因型的CNVR定义为多拷贝型。同一个CNVR位点的群体只包含AA型则该CNVR位点为缺失;只包含GG型则该CNVR位点为多拷贝;同时包含AA和GG型则该CNVR位点为缺失和多拷贝并存。经过统计发现,有2 275个CNVRs为缺失,6个为多拷贝,818个为缺失和多拷贝并存。

表 1 CNVRs在染色体上的分布 Table 1 The distribution of copy number variations on chromosomes

F2代猪群体体高性状CNVRs全基因组关联分析结果如图 2所示,总共有2个与体高相关联的显著性CNVRs,且均位于7号染色体,CNVR1(P= 3.26×10-7)和CNVR2(P=3.01×10-6)。CNVR1的起始位置为7号染色体的25 358 001 bp处,长度为1 338 399 bp;CNVR2的起始位置为7号染色体的54 087 201 bp处,长度为2 799 bp。使用VEP注释2个CNVRs中的基因,发现CNVR1内包含59个基因(表 2),其中有58个为编码蛋白基因,1个为snRNA基因,SLA-11基因的5′端不在CNVR1内;CNVR2位于基因间隔区域,未包含基因。在混合线性模型分析的结果中发现,CNVR1拷贝数增加(P < 0.01)和CNVR2拷贝数缺失(P < 0.01)对猪的体高性状具有显著影响。

图 2 体高性状相关拷贝数变异全基因组关联分析曼哈顿图 Fig. 2 Manhattan plot of genome-wide association study of body height related copy number variations
表 2 CNVR1区间内基因注释 Table 2 Gene annotations in the CNVR1 interval
2.3 影响猪体高性状QTL的定位

通过复合区间作图法对影响猪体高性状进行QTL精确定位的结果如图 3所示,在X染色体和7号染色体上分别定位到1个显著性位点,分别为BH-1(X: 76.423~77.227 cM)和BH-2(7: 6.646~ 7.461 cM)。LOD阈值线为5.329,BH-1和BH-2的LOD值分别为6.327和10.780,都已超过阈值线。BH-1的加性效应为-1.214,显性效应为-1.866,解释的表型变异(即PVE)为5.904%;BH-2的加性效应为1.841,显性效应为0.390,解释的表型变异为11.950%。说明7号染色体上的BH-2对表型的影响较大,且BH-2与CNVR1区间重叠,该重叠区间为BH-2的物理区间,为7号染色体的25 625 844~26 033 153 bp区域。

0代表X染色体 0 represents the X chromosome 图 3 猪体高相关QTL的定位 Fig. 3 Location of pig body height related QTL
2.4 猪体高显著相关的CNVR与QTL重叠区间的基因功能注释

对重叠区间7号染色体25 625 844~26 033 153 bp中的基因进行注释,发现该区间内有19个基因,分别是OR12D3以及18个Novel基因(ENSSSCG00000030245、ENSSSCG00000023402、ENSSSCG00000025278、ENSSSCG00000020762、ENSSSCG00000025358、ENSSSCG00000021894、ENSSSCG00000001279、ENSSSCG00000001286、ENSSSCG00000023411、ENSSSCG00000026436、ENSSSCG00000023813、ENSSSCG00000021889、ENSSSCG00000027588 ENSSSCG00000001294、ENSSSCG00000029853、ENSSSCG00000001268、ENSSSCG00000001297、ENSSSCG00000024940),全部为蛋白编码基因。OR12D3(嗅觉受体家族12亚家族D成员3)的相关通路包括嗅觉转导和肽配体结合受体。与该基因有关的基因本体论(GO)注释包括G蛋白偶联受体活性和跨膜信号受体活性。该基因的重要旁系同源物是OR12D2。18个Novel基因经过ID转化,转化为8个类嗅觉受体基因,分别为OR2G6-likeOR2G3-likeOR12D2-likeOR2W1-likeOR5V1-likeOR2H2-likeOR10C1-likeOR14J1-like。推测其功能皆与OR12D3的基因本体论和通路类似。

2.5 qPCR对OR12D3基因拷贝数的验证

从体高(BH)高、低、正常组中随机挑选3头个体进行qPCR验证(图 4),通过计算得出,BH高组中OR12D3基因的相对表达量极显著高于正常组(P < 0.01),且在高组中OR12D3基因拷贝数变异为多拷贝数变异。由于本研究的OR12D3基因位于CNVR1区间(25 358 001~26 696 400 bp)内,OR12D3基因拷贝数变异增加必然会引起CNVR1区间拷贝数变异增加,而且拷贝数变异增加都对猪体高具有显著影响。因此,此试验结果与在混合线性模型分析中发现CNVR1拷贝数增加(P < 0.01)对猪的体高性状具有显著影响的结果是一致的,进一步验证了OR12D3的拷贝数变异可能与猪体高性状相关。

*. P < 0.05; **. P < 0.01 图 4 OR12D3相对表达量检测 Fig. 4 Detection of OR12D3 relative expression
3 讨 论

本研究中,大白猪×民猪F2代资源群体的体高性状变异系数为6.15%,处在较低水平,说明数据集中度较好且群体整齐度较高,结果具有一定代表性[28]。CNVR全基因组关联分析准确性与QTL检测功效都与群体大小有关,本试验选取了502头F2代群体,群体足够大而且体高性状符合正态分布,一定程度上降低了假阳性的概率。在对性别、批次、胎次进行分析时发现,性别和胎次显著影响体高,公、母猪体高均值分别为70.99和69.22 cm,4个胎次的均值分别为70.55、69.95、70.44、69.47 cm,而批次不显著。因此,为更有效剖分可遗传效应,本研究将性别和胎次作为固定效应来做CNVR全基因组关联分析[29]

拷贝数变异是个体间遗传和表型多样性的重要标志,其通过调节基因剂量和破坏基因组中的编码区来解释复杂数量性状表型和疾病[30]。Goshu等[30]通过方差分析发现,KLF6基因的CNVR缺失型与牛体重(P=0.0001)、胸围(P=0.002)和体重(P=0.003)高度相关。Liu和Yang等[31-32]发现,CYP4A11和MAPK10基因的拷贝数增加与中国牛的体重、胸围、身长和身高相关。GBP2基因中的两个CNV区域(CNV1和CNV2)与安格斯牛的生长性状显著相关[33]MTHFSD基因的CNV能显著影响香猪的产仔数性状,具有MTHFSD基因CNV增加的猪比CNV减少的猪产仔数多[34]。本研究中,利用SAS9.4软件统计分析发现,F2代资源群体中CNVR1缺失型占45.72%,多拷贝型占30.48%,正常型占23.80%;CNVR2缺失型占8.39%,多拷贝型占52.05%,正常型占39.56%。对混合线性模型分析结果进一步研究发现,CNVR1多拷贝型的个体身高均值为71.47 cm,与正常型(69.29 cm)和缺失型(68.67 cm)个体差异极显著(P < 0.01);CNVR2缺失型的个体身高均值为71.84 cm, 与正常型(70.70 cm)和多拷贝型(68.72 cm)个体差异极显著(P < 0.01)。以上结果说明,CNVR1拷贝数增加和CNVR2拷贝数缺失与F2代猪资源群体的体高性状存在显著关联。

Ji等[35]运用R软件中的GenABEL包对杜洛克×二花脸猪F2代群体的体高性状进行全基因组关联分析,发现了一个显著性SNP位于7号染色体31 914 593 bp处,并将HMGA1作为猪体高性状候选基因。同样的,Gong等[36]利用高密度芯片对300日龄巴马香猪的体高性状进行全基因组关联分析,将显著影响猪体高性状的SNP定位在7号染色体35 650 280 bp处,并表明7号染色体上的QTL可能对生长性状特别是与骨骼发育有关的性状具有生长阶段依赖性作用。与上述两者研究方法不同,本研究通过CNVR全基因组关联分析找到7号染色体上显著影响猪体高的CNVR1和CNVR2,再联合全基因组QTL精确定位,找到与猪体高显著相关的2个QTLs分别为BH-1(X: 76.423~77.227 cM)和BH-2(7: 6.646~7.461 cM),其中CNVR1与BH-2重叠,重叠区间即为BH-2的物理区间(7: 25 625 844~26 033 153 bp)。Mao等[37]对猪肢骨长性状QTL定位结果表明,SSC7上的12.19~121.08 Mb区域具有多效性,肢骨长、生长和肥胖性状相关的QTL重叠在该区域。有趣的是,本研究找到的BH-2(7: 25 625 844~26 033 153 bp)正处于该区域,进一步说明本研究QTL定位的准确性。

BH-2区域内基因为嗅觉受体基因OR12D3以及一些类嗅觉受体基因,已有研究显示,嗅觉受体可能影响摄食行为、食物选择和能量平衡,从而影响采食和生长性状。Magalhaes等[38]通过对内洛尔牛的全基因组关联分析发现,与候选基因相关的SNP与两种肉质性状(大理石纹、嫩度)相关,并发现内洛尔牛5号染色体31 349 253~32 177 734 bp区域内有10个OR基因,表明OR基因在影响内洛尔牛的肉质性状上有一定功能。同样,Olivieri等[39]也通过GWAS的方法确定了内洛尔牛干物质摄入量(DMI)、平均日增重(ADG)、饲料效率(G:F)和残留采食量(RFI)这些性状的候选基因,在位于15号染色体46 004 031~46 020 475 bp区域发现与DMI相关的嗅觉受体基因OR2D2、OR2D3和OR6A2,在15号染色体50 448 739~50 491 730 bp区域发现与ADG相关联的OR52J3和OR51A7基因以及在14号染色体105 904 240~105 916 649 bp区域发现与RFI相关联的OR9A4基因。另外,有关嗅觉受体的拷贝数变异也有报道,Wang等[40]研究结果表明,ORMDL1基因与湖羊和小尾寒羊的许多生长性状显著相关,特别是与体重、身高和心围有关。其原因可能是由于ORMDL1的拷贝数剂量效应,进而影响肌肉的发育和沉积,从而导致体重和心围显著不同。本研究在BH-2区间内定位到嗅觉受体基因OR12D3,OR12D3可能与人的哮喘病有关[41],但在猪上未曾报道过。通过CNVR全基因关联分析和QTL定位联合分析以及qPCR的结果,能够推断出OR12D3基因的拷贝数变异可能与猪体高性状相关,但具体影响机制还需要进一步研究。

4 结 论

本研究通过拷贝数变异全基因组关联分析鉴定出CNVR1和CNVR2能显著影响猪体高性状,CNVR1拷贝数增加和CNVR2拷贝数缺失对猪的体高性状具有显著影响。通过全基因组QTL定位,找到2个显著影响猪体高的QTLs,分别为BH-1和BH-2,其中BH-2对体高性状的影响较大。而BH-2又与CNVR1的区间重叠,在重叠区间中找到了1个嗅觉受体基因OR12D3和18个未被注释的基因,初步推测,OR12D3基因的拷贝数变异可能与猪体高性状相关。

参考文献
[1] FEUK L, MARSHALL C R, WINTLE R F, et al. Structural variants:changing the landscape of chromosomes and design of disease studies[J]. Hum Mol Genet, 2006, 15(Suppl1): R57–R66. DOI: 10.1093/hmg/ddl057
[2] ZHANG F, GU W L, HURLES M E, et al. Copy number variation in human health, disease, and evolution[J]. Annu Rev Genom Hum Genet, 2009, 10(1): 451–481. DOI: 10.1146/annurev.genom.9.081307.164217
[3] ZHANG L Z, JIA S G, YANG M J, et al. Detection of copy number variations and their effects in Chinese bulls[J]. BMC Genomics, 2014, 15(1): 480. DOI: 10.1186/1471-2164-15-480
[4] XU L Y, HOU Y L, BICKHART D M, et al. Population-genetic properties of differentiated copy number variations in cattle[J]. Sci Rep, 2016, 6(1): 23161. DOI: 10.1038/srep23161
[5] PINTO D, DARVISHI K, SHI X H, et al. Comprehensive assessment of array-based platforms and calling algorithms for detection of copy number variants[J]. Nat Biotechnol, 2011, 29(6): 512–520. DOI: 10.1038/nbt.1852
[6] CURTIS C, LYNCH A G, DUNNING M J, et al. The pitfalls of platform comparison:DNA copy number array technologies assessed[J]. BMC Genomics, 2009, 10(1): 588. DOI: 10.1186/1471-2164-10-588
[7] HOU Y L, LIU G E, BICKHART D M, et al. Genomic characteristics of cattle copy number variations[J]. BMC Genomics, 2011, 12(1): 127. DOI: 10.1186/1471-2164-12-127
[8] XU L Y, COLE J B, BICKHART D M, et al. Genome wide CNV analysis reveals additional variants associated with milk production traits in Holsteins[J]. BMC Genomics, 2014, 15(1): 683. DOI: 10.1186/1471-2164-15-683
[9] DI GERLANDO R, SUTERA A M, MASTRANGELO S, et al. Genome-wide association study between CNVs and milk production traits in Valle del Belice sheep[J]. PLoS One, 2019, 14(4): e0215204. DOI: 10.1371/journal.pone.0215204
[10] WANG L G, XU L Y, LIU X, et al. Copy number varia tion-based genome wide association study reveals additional variants contributing to meat quality in Swine[J]. Sci Rep, 2015, 5: 12535. DOI: 10.1038/srep12535
[11] REVILLA M, PUIG-OLIVERAS A, CASTELLÓ A, et al. A global analysis of CNVs in swine using whole genome sequence data and association analysis with fatty acid composition and growth traits[J]. PLoS One, 2017, 12(5): e0177014. DOI: 10.1371/journal.pone.0177014
[12] WRIGHT D, BOIJE H, MEADOWS J R S, et al. Copy number variation in intron 1 of SOX5 causes the Pea-comb phenotype in chickens[J]. PLoS Genet, 2009, 5(6): e1000512. DOI: 10.1371/journal.pgen.1000512
[13] VAN LAERE A S, NGUYEN M, BRAUNSCHWEIG M, et al. A regulatory mutation in IGF2 causes a major QTL effect on muscle growth in the pig[J]. Nature, 2003, 425(6960): 832–836. DOI: 10.1038/nature02064
[14] ZHU M J, ZHAO S H. Candidate gene identification approach:progress and challenges[J]. Int J Biol Sci, 2007, 3(7): 420–427.
[15] FUJII J, OTSU K, ZORZATO F, et al. Identification of a mutation in porcine ryanodine receptor associated with malignant hyperthermia[J]. Science, 1991, 253(5018): 448–451. DOI: 10.1126/science.1862346
[16] STRATIL A, GELDERMANN H. Analysis of porcine candidate genes from selected QTL regions affecting production traits[J]. Anim Sci Pap Rep, 2004, 22(1): 123–125.
[17] GRISART B, COPPIETERS W, FARNIR F, et al. Positional candidate cloning of a QTL in dairy cattle:identification of a missense mutation in the bovine DGAT1 gene with major effect on milk yield and composition[J]. Genome Res, 2002, 12(2): 222–231. DOI: 10.1101/gr.224202
[18] CLOP A, MARCQ F, TAKEDA H, et al. A mutation creating a potential illegitimate microRNA target site in the myostatin gene affects muscularity in sheep[J]. Nat Genet, 2006, 38(7): 813–818. DOI: 10.1038/ng1810
[19] HÉRAULT F, DAMON M, CHEREL P, et al. Combined GWAS and LDLA approaches to improve genome-wide quantitative trait loci detection affecting carcass and meat quality traits in pig[J]. Meat Sci, 2018, 135: 148–158. DOI: 10.1016/j.meatsci.2017.09.015
[20] FANG Z H, PAUSCH H. Multi-trait meta-analyses reveal 25 quantitative trait loci for economically important traits in Brown Swiss cattle[J]. BMC Genomics, 2019, 20(1): 695. DOI: 10.1186/s12864-019-6066-6
[21] MEBRATIE W, REYER H, WIMMERS K, et al. Genome wide association study of body weight and feed efficiency traits in a commercial broiler chicken population, a re-visitation[J]. Sci Rep, 2019, 9(1): 922. DOI: 10.1038/s41598-018-37216-z
[22] MARTIN P, PALHIÈRE I, MAROTEAU C, et al. Genome-wide association mapping for type and mammary health traits in French dairy goats identifies a pleiotropic region on chromosome 19 in the Saanen breed[J]. J Dairy Sci, 2018, 101(6): 5214–5226. DOI: 10.3168/jds.2017-13625
[23] WANG X, ZHENG Z, CAI Y, et al. CNVcaller:highly efficient and widely applicable software for detecting copy number variations in large populations[J]. Gigascience, 2017, 6(12): 1–12. DOI: 10.1093/gigascience/gix115
[24] BRADBURY P J, ZHANG Z, KROON D E, et al. TASSEL:software for association mapping of complex traits in diverse samples[J]. Bioinformatics, 2007, 23(19): 2633–2635. DOI: 10.1093/bioinformatics/btm308
[25] BROMAN K W, WU H, SEN Ś, et al. R/qtl:QTL mapping in experimental crosses[J]. Bioinformatics, 2003, 19(7): 889–890. DOI: 10.1093/bioinformatics/btg112
[26] BAUM L E, PETRIE T, SOULES G, et al. A maximization technique occurring in the statistical analysis of probabilistic functions of Markov chains[J]. Ann Math Statist, 1970, 41(1): 164–171. DOI: 10.1214/aoms/1177697196
[27] LIVAK K J, SCHMITTGEN T D. Analysis of relative gene expression data using real-time quantitative PCR and the 2-ΔΔCT method[J]. Methods, 2001, 25(4): 402–408. DOI: 10.1006/meth.2001.1262
[28] 叶健, 胡晓湘, 屈胜丽, 等. 大白猪体型性状的遗传参数及其与生产性能的关系[J]. 中国畜牧杂志, 2016, 52(19): 6–8.
YE J, HU X X, QU S L, et al. Estimation of genetic parameters of type traits and it's correlation with production traits in large white pigs[J]. Chinese Journal of Animal Science, 2016, 52(19): 6–8. (in Chinese)
[29] 王立刚, 张跃博, 颜华, 等. 拷贝数变异全基因组关联鉴定猪骨率性状候选基因[J]. 畜牧兽医学报, 2019, 50(11): 2208–2214.
WANG L G, ZHANG Y B, YAN H, et al. Identification of candidate genes for porcine bone rate traits by genome-wide association of copy number variation[J]. Acta Veterinaria et Zootechnica Sinica, 2019, 50(11): 2208–2214. (in Chinese)
[30] GOSHU H A, WU X Y, CHU M, et al. Copy number variations of KLF6 modulate gene transcription and growth traits in Chinese Datong Yak (Bos Grunniens)[J]. Animals, 2018, 8(9): 145. DOI: 10.3390/ani8090145
[31] LIU M, LI B, HUANG Y Z, et al. Copy number variation of bovine MAPK10 modulates the transcriptional activity and affects growth traits[J]. Live Sci, 2016, 194: 44–50. DOI: 10.1016/j.livsci.2016.09.014
[32] YANG M J, LV J Q, ZHANG L Z, et al. Association study and expression analysis of CYP4A11 gene copy number variation in Chinese cattle[J]. Sci Rep, 2017, 7: 46599. DOI: 10.1038/srep46599
[33] ZHANG G M, ZHENG L, HE H, et al. Associations of GBP2 gene copy number variations with growth traits and transcriptional expression in Chinese cattle[J]. Gene, 2018, 647: 101–106. DOI: 10.1016/j.gene.2018.01.004
[34] RAN X Q, PAN H, HUANG S H, et al. Copy number variations of MTHFSD gene across pig breeds and its association with litter size traits in Chinese indigenous Xiang pig[J]. J Anim Physiol Anim Nutr (Berl), 2018, 102(5): 1320–1327. DOI: 10.1111/jpn.12922
[35] JI J X, ZHOU L S, GUO Y M, et al. Genome-wide association study identifies 22 new loci for body dimension and body weight traits in a white Duroc×Erhualian F2 intercross population[J]. Asian-Austral J Anim Sci, 2017, 30(8): 1066–1073. DOI: 10.5713/ajas.16.0679
[36] GONG H F, XIAO S J, LI W B, et al. Unravelling the genetic loci for growth and carcass traits in Chinese Bamaxiang pigs based on a 1.4 million SNP array[J]. J Anim Breed Genet, 2019, 136(1): 3–14. DOI: 10.1111/jbg.12365
[37] MAO H R, GUO Y M, YANG G C, et al. A genome-wide scan for quantitative trait loci affecting limb bone lengths and areal bone mineral density of the distal femur in a White Duroc×Erhualian F 2 population[J]. BMC Genetics, 2008, 9(1): 63. DOI: 10.1186/1471-2156-9-63
[38] MAGALHAES A F B, DE CAMARGO G M F, FERNANDES G A, et al. Genome-wide association study of meat quality traits in Nellore cattle[J]. PLoS One, 2016, 11(6): e0157845. DOI: 10.1371/journal.pone.0157845
[39] OLIVIERI B F, MERCADANTE M E Z, CYRILLO J N D S G, et al. Genomic regions associated with feed efficiency indicator traits in an experimental Nellore cattle population[J]. PLoS One, 2016, 11(10): e0164390. DOI: 10.1371/journal.pone.0164390
[40] WANG X G, CAO X K, WEN Y F, et al. Associations of ORMDL1 gene copy number variations with growth traits in four Chinese sheep breeds[J]. Arch Anim Breed, 2019, 62(2): 571–578. DOI: 10.5194/aab-62-571-2019
[41] NICOLAE D, COX N J, LESTER L A, et al. Fine mapping and positional candidate studies identify HLA-G as an asthma susceptibility gene on chromosome 6p21[J]. Am J Hum Genet, 2005, 76(2): 349–357.