南京农业大学学报  2016, Vol. 39 Issue (01): 133-138   PDF    
http://dx.doi.org/10.7685/jnau.201501024
0

文章信息

贾先波, 陈仕毅, 王杰, 赖松家.
JIA Xianbo, CHEN Shiyi, WANG Jie, LAI Songjia.
中国荷斯坦牛泌乳曲线数学模型拟合及应用
Application of different models to the lactation curves in Chinese Holstein
南京农业大学学报, 2016, 39(01): 133-138
Journal of Nanjing Agricultural University, 2016, 39(01): 133-138.
http://dx.doi.org/10.7685/jnau.201501024

文章历史

收稿日期:2015-01-15
中国荷斯坦牛泌乳曲线数学模型拟合及应用
贾先波, 陈仕毅, 王杰, 赖松家     
四川农业大学畜禽遗传资源发掘与创新利用四川省重点实验室, 四川 成都 611130
摘要[目的]本文旨在建立拟合中国荷斯坦牛泌乳曲线的数学模型,计算出一套可靠的305 d产奶量校正系数。[方法]分别使用Wood不完全伽玛模型、逆多项式模型、Ali-Schaeffer模型、六次多项式回归模型、Wilmink模型和Pollott模型对71个奶牛场43 812头中国荷斯坦牛的609 784条测定日记录进行了拟合。参数的估计使用SAS 9.2软件中的非线性回归过程迭代求解实现。[结果]6种数学模型的拟合度(R2值)为0.940~0.947。其中,六次多项式回归模型的拟合度(R2值)最大,模型估计误差标准差最小,在本次试验中拟合效果最好。[结论]用六次多项式回归模型计算出各泌乳时间的累积产奶量,继而提出了计算305 d产奶量的校正系数。结合实际累积产奶量和相应的校正系数能将所有未达到305 d产奶量的记录校正到305 d。
关键词泌乳曲线     校正系数     非线性模型     305 d产奶量    
Application of different models to the lactation curves in Chinese Holstein
JIA Xianbo, CHEN Shiyi, WANG Jie, LAI Songjia     
Farm Animal Genetic Resources Exploration and Innovation Key Laboratory of Sichuan Province, Sichuan Agricultural University, Chengdu 611130, China
Abstract: [Objectives]The aim of this study was to investigate the use of six different mathematical functions(Wood,Inverse polynomial,Ali-Schaeffer,Six polynomial,Wilmink and Pollott models)for describing the lactation curve of Chinese Holstein. [Methods]Dairy herd improvement(DHI)records were collected from 43 812 Holstein cows of 71 farms. In number of 609 784 test-day records were divided into first three parties. Nonlinear regression procedure was performed in SAS 9.2 software to compute the parameters of models. [Results]The goodness of fit(R2 values)of models ranged from 0.940 to 0.947. Polynomial model of degree 6 gave the best R2 values as well as the lowest mean square prediction error. Therefore we selected the Polynomial model of degree 6 to estimate the cumulative milk yield,and further obtained adjustment factors of lactation milk yield to 305 days for Chinese Holstein. [Conclusions]Using the actual cumulative milk yields and the adjustment factors,we can adjust records of milk yields that do not meet all the 305 days to 305 days.
Keywords: lactation curve     adjustment factor     nonlinear model     305 days milk yield    

泌乳曲线作为描述牛群产奶特性的基本方法,在奶牛生产和育种中有重要作用。利用泌乳曲线,可以将奶牛不同泌乳时间的累积产奶量统一校正到305 d产奶量,以此作为奶牛一个泌乳期的生产记录,用于奶牛遗传评估或者评价奶牛的营养和健康状况。自1927年Gains首先利用数学模型描述了产奶量与时间的函数关系以来,各国研究者对泌乳曲线建立了许多数学模型[1],开辟了泌乳曲线的生物统计模型研究领域。1967年Wood[2]提出的不完全伽玛模型,是当前应用最广的模型。1987年Wilmink[3]在Wood模型的基础上提出了改进Wood模型。同年Schaeffer等[4]推出回归模型,并与Wood模型进行了全面比较。2000年Pollot等[5]提出了描述奶绵羊泌乳曲线的Pollot模型,其优势在于利用了2次对数曲线,2008年Pollot[6]将其用于描述奶牛泌乳曲线。

奶牛泌乳曲线的拟合研究,国内也有报道。1990年郭智群等[7]用北京郊区奶牛的数据对3个模型进行了拟合比较;1993年郭智群等[8]又对模型拟合的参数进行了遗传分析;1999年王雅春等[9]利用7个模型分别对西门塔尔牛、蒙贝利亚牛和黑白花牛进行了拟合。

近年来,随着我国荷斯坦牛群遗传素质的改良、饲养条件及生产管理技术的进步,牛群生产性能有了显著的提高,因此有必要根据最新的产奶数据拟合泌乳曲线。笔者选取6种描述泌乳曲线的数学模型,利用SAS 9.2非线性回归(NLIN)过程对中国荷斯坦牛各胎次产奶量进行拟合,筛选拟合效果最好的模型,进而根据此模型计算累积产奶量,提出产奶时间的校正系数。在此基础上,结合实际累积产奶量和相应的校正系数,将数据库中所有未达到305 d产奶量记录的奶牛校正到305 d。

1 材料与方法 1.1 数据来源

本研究收集了近10年黑龙江、北京、山东、陕西、上海、四川等10省市80个牛场213 818头荷斯坦奶牛的生产数据资料,形成了包含1 084 321条测定日记录的总数据库。在此基础上根据以下原则整理数据:①删除泌乳时间大于305 d或者小于5 d的记录;②删除产奶量小于0.5 kg的记录;③删除测定间隔大于60 d的记录;④删除测定记录少于5次的泌乳期记录;⑤对各个泌乳期的产犊年龄进行限制:第1胎的产犊年龄范围为18~48月龄,第2胎为25~66月龄,第3胎为30~80月龄。

数据经过整理后,共得到71个牛场43 812头中国荷斯坦牛77 490个泌乳期的609 784条测定日记录。其中第1胎奶牛35 141头,有测定日记录280 263条;第2胎奶牛26 213头,有测定日记录204 615条;第3胎奶牛16 136头,有测定日记录124 906条。

1.2 数学模型

本研究选用以下6种模型进行泌乳曲线拟合[2, 3, 4, 5, 6]:

Wood不完全伽玛模型(又称Wood模型):

逆多项式模型:

Ali-Schaeffer模型:

多项式回归模型(六次):

Wilmink模型:

Pollott模型:

以上各模型中:x为泌乳时间(d),y为第x天的产奶量。拟合曲线时,曲线参数的估计采用SAS 9.2软件非线性回归分析(NLIN)模块的Gauss-Newton迭代算法[10]

1.3 泌乳曲线拟合准确度的度量

采用拟合度(R2值)和估计误差标准差(SEE)为度量标准。前者表示回归模型中能够解释的变异占总变异的比例,其值越大越好;后者是实际数据与模型拟合数据之间差值的标准差,描述在平均数周围的分布情况,理想的曲线拟合结果估计标准误接近零。

1.4 泌乳时间校正系数的计算

利用拟合效果最好的泌乳曲线计算各泌乳时间的估计累积产奶量,以305 d的估计累积产奶量除以各泌乳时间的估计累积产奶量得到特定产奶时间的校正系数,即:

式中:αt d的校正系数;t为泌乳时间(d),通常小于305 d。当t≥305时,则α=1,F(305)为305 d的估计累积产奶量,F(t)为t d的估计累积产奶量。

1.5 泌乳时间校正系数的应用

校正305 d产奶量由实际累积产奶量乘以对应的校正系数得到,即:

式中:305为校正305 d产奶量;Ytt d的实际累积产奶量;αt d的校正系数。Yt的计算采用测定间隔法(test interval method,TIM)[11]:①获得测定日的产奶量;②估计测定间隔的产奶量,为(上一次测定记录+本次测定记录)/2×测定间隔时间;③将所有测定间隔相加得出特定泌乳时间的累积产奶量。

在计算Yt的程序中,为了更准确地估计产奶量,对第1次测定间隔进行了处理:针对第1次奶牛生产性能(DHI)测定等于5 d的记录,取实际产奶量为第1条记录进行计算;对第1次DHI测定大于5 d的记录,以F(5)即第5天的估计产奶量作为第1条记录进行计算。

2 结果与分析 2.1 泌乳曲线数学模型的比较和选择

通过执行SAS 9.2软件回归分析过程中的非线性(NLIN)回归过程,获得了中国荷斯坦牛第1、第2、第3胎次和总数据的6个泌乳曲线模型参数估计值、拟合度和拟合估计误差标准差(表1)。

表 1 中国荷斯坦牛产奶量记录不同泌乳曲线模型拟合结果 Table 1 Different models to the lactation curves of fitting to the data of Chinese Holstein
模型Models胎次Parity泌乳曲线方程的参数Parameters of lactation curve拟合度R2估计误差标准差SEE
Wood不完全
伽玛函数模型
Wood model
1y=18.206 6·x0.157 8·e0.002 135x0.957 45.948 4
2y=23.529 0·x0.157 9·e0.003 262x0.946 47.473 0
3y=22.371 5·x0.178 8·e0.003 630x0.942 97.714 6
Overally=31.370 0·x0.155 2·e0.002 792x0.945 77.166 6
逆多项式模型
Inverse
polynomial
model
1y=x/0.185 7+0.026 3x+0.000 047x20.957 45.952 9
2y=x/0.168 4+0.019 0x+0.000 078x20.946 27.481 4
3y=x/0.198 0+0.017 6x+0.000 087x20.942 57.743 9
Overally=x/0.147 0+0.022 5x+0.000 066x20.945 77.168 4
Ali-Schaeffer
模型
Ali-Schaeffer
model
1y=47.152 1-36.423 6·(x/305)+11.161 9·(x/305)2-6.541 3·(ln(305/x))-0.070 8·(ln(305/x))20.957 55.944 9
2y=37.023 0-23.349 4·(x/305)+6.934 8·(x/305)2-6.251 7·(ln(305/x))-2.329 3·(ln(305/x))20.946 57.463 6
3y=50.550 4-47.558 1·(x/305)+15.711 0·(x/305)2-1.248 7·(ln(305/x))-1.203 6·(ln(305/x))20.943 07.709 5
Overally=45.107 8-35.546 0·(x/305)+11.281 4·(x/305)2-1.551 2·(ln(305/x))-0.915 5·(ln(305/x))20.945 87.161 1
六次多项式
回归模型
Six polynomial
model
1y=21.226 6+0.427 3x-0.006 778x2+5.033 0e-5x3-1.976 0e-7x4+3.896 4e-10x5-3.002 8e-13x60.957 55.942 2
2y=25.734 3+0.672 0x-0.0131 3x2+1.146 0e-4x3-5.250 3e-7x4+1.209 3e-9x5-1.103 9e-12x60.946 57.463 0
3y=26.350 6+0.628 1x-0.011 72x2+9.732 0e-5x3-4.279 8e-7x4+9.532 1e-10x5-8.453 6e-13x60.943 07.708 3
Overally=24.165 2+0.535 0x-0.009 654x2+7.932 0e-5x3-3.452 5e-7x4+7.603 8e-10x5-6.664 4e-13x60.945 87.159 7
Wilmink模型
Wilmink model
1y=33.696 2-0.032 32x-14.931 2e-kx,k=0.050.957 55.943 2
2y=41.944 6-0.067 80x-15.376 4e-kx,k=0.050.946 57.468 2
3y=42.855 6-0.074 20x-16.920 9e-kx,k=0.050.943 07.711 6
Overally=38.348 5-0.052 74x-15.075 4e-kx,k=0.050.945 87.160 5
Pollott 模型
Pollott model
1y=(28.451 7/{1+z·exp{-0.1(x-150)}})·{2-exp(0.008 740(x-150))},z=(1-0.999 999 9)/0.999 999 90.956 85.993 8
2y=(31.669 2/{1+z·exp{-0.1(x-150)}})·{2-exp(0.001 860(x-150))},z=(1-0.999 999 9)/0.999 999 90.946 17.494 3
3y=(31.635 0/{1+z·exp{-0.1(x-150)}})·{2-exp(0.002 030(x-150))},z=(1-0.999 999 9)/0.999 999 90.942 57.746 5
Overally=(30.192 1/{1+z·exp{-0.1(x-150)}})·{2-exp(0.001 482(x-150))},z=(1-0.999 999 9)/0.999 999 90.945 37.191 4

由拟合结果可以发现:6种泌乳曲线在各胎次的R2值均较高,达到0.94以上。3个胎次间相比,第1胎的拟合度最高,第2胎次之,第3胎最低。在各胎次内,6种模型的拟合效果总体上非常接近,但也存在一定差异。六次多项式回归模型在3个胎次中R2值都是最大,Ali-Schaeffer模型和Wilmink模型在前2个胎次中R2也是最大的,其次是Wood不完全伽玛模型,再次是逆多项式模型,而Pollott模型由于其参数过少,所以在3个胎次中都是最小。六次多项式回归模型的估计误差标准差也最小,其次为Ali-Schaeffer模型,然后为Wilmink模型、Wood不完全伽玛模型和逆多项式模型,最差的仍是Pollott模型。由此得出6个模型在本研究中从优到劣依次为:六次多项式回归模型、Ali-Schaeffer模型、Wilmink模型、Wood不完全伽玛模型、逆多项式模型、Pollott模型。因此,本研究选择六次多项式回归模型作为泌乳曲线模型来拟合泌乳曲线,计算估计累积产奶量,进而计算产奶时间的校正系数。

2.2 泌乳曲线

选用六次多项式回归模型,绘制第1、第2、第3胎次和总数据的泌乳曲线(图1)。从图中可以看出,各条泌乳曲线波形趋势一致,都是在40~50 d间上升到一个峰值,然后再缓慢下降。第2胎和第3胎曲线十分接近,出现峰值的时间早于第1胎,同时峰值后的下降速度也明显快于第1胎,即第1胎的持续力高于后面的胎次。总体而言,第2、第3胎曲线高于第1胎曲线,第3胎曲线略高于第2胎曲线。

图 1 中国荷斯坦牛各胎次的泌乳曲线 Fig. 1 Lactation curves for different parities in Chinese Holsteins
2.3 泌乳时间的校正系数

根据拟合效果最好的模型,即六次多项式回归模型拟合泌乳曲线,利用公式计算出中国荷斯坦牛各胎次90~305 d产奶时间的校正系数,结果见表2。在实际应用中,用90 d或更早的实际累积产奶量去估计305 d累积产奶量的偏差非常大,而泌乳时间在200 d以上的产奶量记录校正具有高可靠性。

表 2 中国荷斯坦牛各胎次泌乳时间的校正系数 Table 2 Adjustment factors for lactation time in milk of Chinese Holstein

泌乳时间/d
Lactation time
胎次 Parity
123
泌乳时间/d
Lactation time
胎次 Parity
123
903.272 7352.880 1002.864 5042001.475 0171.379 9011.376 129
953.092 1962.729 7822.714 4462051.440 9671.351 7981.348 411
1002.931 3012.595 8202.580 8082101.408 6121.325 1741.322 141
1052.787 0442.475 6792.461 0542151.377 8301.299 9271.297 216
1102.656 9892.367 3142.353 1352201.348 5121.275 9601.273 545
1152.539 1432.269 0592.255 3802251.320 5571.253 1871.251 041
1202.431 8642.179 5462.166 4142301.293 8741.231 5251.229 625
1252.333 7872.097 6432.085 0992351.268 3781.210 8991.209 224
1302.243 7692.022 4072.010 4822401.243 9891.191 2381.189 770
1352.160 8481.953 0481.941 7642451.220 6361.172 4751.171 199
1402.084 2081.888 8981.878 2712501.198 2491.154 5511.153 453
1452.013 1541.829 3901.819 4272551.176 7651.137 4081.136 477
1501.947 0901.774 0411.764 7422601.156 1251.120 9941.120 221
1551.885 5031.722 4361.713 7942651.136 2721.105 2631.104 637
1601.827 9491.674 2171.666 2182701.117 1531.090 1711.089 685
1651.774 0421.629 0711.621 6982751.098 7181.075 6811.075 324
1701.723 4451.586 7271.579 9592801.080 9201.061 7611.061 521
1751.675 8621.546 9481.540 7572851.063 7141.048 3831.048 247
1801.631 0331.509 5221.503 8792901.047 0581.035 5291.035 475
1851.588 7281.474 2631.469 1382951.030 9121.023 1831.023 185
1901.548 7421.441 0041.436 3633001.015 2381.011 3391.011 363
1951.510 8921.409 5951.405 4053051.000 0001.000 0001.000 000
2.4 泌乳时间校正系数的应用

根据TIM方法计算出实际积累产奶量,泌乳时间大于等于305 d的取实际积累产奶量,泌乳时间不足305 d的,用本研究所得到的校正系数,根据其所在的胎次将其校正到305 d,即由实际积累产奶量乘以相应的校正系数(公式(8))得到。从中国荷斯坦牛各胎次的平均305 d产奶量(表3)可以看出,第1胎次的平均产奶量与第2、第3胎次存在极显著差异,而第2胎和第3胎的平均产奶量差异没有达到显著水平。

表 3 中国荷斯坦牛泌乳时间校正后各胎次305 d的 Table 3 Average milk yield after 305 days adjusted in Chinese Holstein
胎次
Parity
奶牛数/头
Number of cows
平均产奶量/kg
Average milk yield
第1胎1st parity35 1417 888.84bB
第2胎 2nd parity26 2138 568.10aA
第3胎 3rd parity16 1368 563.05aA
总数据 Overall data43 8128 340.00
3 讨论

本研究收集了80个牛场213 818头中国荷斯坦牛132 609个泌乳期的1 084 321条测定日记录,经过筛选后剩余71个牛场43 812头中国荷斯坦牛77 490个泌乳期的609 784条测定日记录,删除率达到43.76%。泌乳胎次大于3胎和1头牛在一个泌乳期内的测定条数过少是重要的原因。结合实际生产中奶样的采集和DHI数据的测定工作,反映出我国DHI测定工作开展的艰辛,当前奶牛DHI测定的系统性和完整性还有待提高,所以在数据分析前需要对异常记录进行识别和剔除,才能保证后续的研究。

国内对非线性拟合大都使用常规的线性化方法,本研究对6种模型均采用非线性最小二乘法求解。按照拟合度(R2)值和估计误差标准差(SEE)对6种模型从优到劣进行排序如下:模型4(0.943,7.708)、模型3(0.941,7.752)、 模型5(0.941,7.753)、模型1(0.941,7.756)、 模型2(0.940,7.775)、 模型6(0.940,7.788)。这与Santos等[12]给出的:模型4 、 模型3、模型5 、模型1排序一致,与王雅春[9]给出的几种模型按照R2排名的顺序也一致,说明六次多项式回归是对中国荷斯坦牛的产奶量性状拟合度效果最好的泌乳曲线模型。用6个模型对数据拟合,发现所有模型的R2值都较高,接近国外文献报道的0.89~0.95[13],高于国内滕晓红[11]报道的0.6~0.8,这主要原因是本研究数据量大,且数据都来源于大型高产牛场,牛群一致性较好。

胎次、饲养管理水平和产犊季节对泌乳曲线的形状均有影响[14]。对不同胎次的泌乳时间校正系数的比较可以看出,校正系数随着时间的增加而下降,相同时间时,第1胎的校正系数总是最大,其次是第2胎,再次是第3胎;3个胎次间的差异随着时间的增加逐渐缩小。这也印证了Togashi等[13]的报道,第1胎的持续力大于后面的胎次,第2胎的持续力大于第3胎次,即奶牛泌乳持续力随着胎次的增加而递减。不难看出,校正系数受胎次的影响很大,为了准确地计算校正305 d产奶量,对各胎次应分别使用一套校正系数。本研究中使用的数据都来自于大型高产牛场,牛群饲养管理水平比较一致。数据量较大,各产犊季节数据分布均匀。因此没有考虑不同牛场的饲养管理差异和产犊季节对泌乳曲线的影响,所得结果为大型高产牧场各产犊季节的平均校正系数。

本研究用校正系数计算获得中国荷斯坦牛各胎次的305 d产奶量从低到高依次是,1胎(7 888.84 kg)、3胎(8 563.05 kg)、2胎(8 568.05 kg),说明第1胎次的泌乳性能低于以后的胎次。但是第2胎次与第3胎次之间的关系和国内外其他文献报道不同[11, 15],本研究中第2胎次略高于第3胎次。其原因一方面是第3胎次数据量少于第2胎次,另一方面可能是我国荷斯坦奶牛随着胎次的增加,奶牛乳房炎的发病率有所增加[16],造成第3胎次牛的记录中低产牛增加。

综上,本研究利用中国荷斯坦牛大规模DHI测定日记录数据,进行泌乳曲线拟合研究,获得了拟合效果最好的泌乳曲线及其参数,并据此得到了305 d产奶量的校正系数,为奶牛产奶性能的早期预测和遗传评估提供了可靠的方法。

参考文献(References)
[1] Macciotta N P P,Vicario D,Cappio-Borlino A. Detection of different shapes of lactation curve for milk yield in dairy cattle by empirical mathematical Models[J]. Journal of Dairy Science,2005,88:1178-1191.
[2] Wood P D P. Algebraic model of the lactation curve in cattle[J]. Nature,1967,216:164-165.
[3] Wilmink J B M. Adjustment of test day milk,fat and protein yield for age,season and stage of lactation[J]. Livestock Production Science,1987,16:335-348.
[4] Schaeffer L R,Minder C E,Mcmillan I. Nonlinear techniques for predicting 305-day lactation production of holstein and Jerseys[J]. Journal of Dairy Science,1987,60:1636-1643.
[5] Pollot G E,Gootwine E. Appropriate mathematical models for describing the complete lactation of dairy sheep[J]. Journal of Animal Science,2000,71:197-207.
[6] Albarran-Portillo B,Pollott G E. Genetic parameters derived from using a biological model of lactation on records of commercial dairy cows[J]. Journal of Dairy Science,2008,91:3639-3648.
[7] 郭智群,陈幼春,张斌. 奶牛泌乳曲线数学模型的遗传分析[J]. 畜牧兽医学报,1993,24(3):136-142. Guo Z Q,Chen Y C,Zhang B. The genetic analysis of mathematical model of the lactation curve in dairy cattle[J]. Chinese Journal of Animal and Veterinary Sciences,1993,24(3):136-142(in Chinese with Enghlish abstract).
[8] 郭智群,陈幼春,徐慧如. 奶牛泌乳曲线数学模型拟合和早期预报[J]. 畜牧兽医学报,1990,21(2):115-120. Guo Z Q,Chen Y C,Xu H R. Research on fitting mathematical models of lactation curve in dairy cattle and their early stage prodiction[J]. Chinese Journal of Animal and Veterinary Sciences,1990,21(2):115-120(in Chinese with Enghlish abstract).
[9] 王雅春,陈幼春,柏荣,等. 奶牛泌乳曲线的拟合及其模型参数的遗传分析[J]. 畜牧兽医学报,1999,30(5):399-404. Wang Y C,Chen Y C,Bo R,et al. Simulating of lactation curves and genetic analysis of their mathematical model's parameters[J]. Chinese Journal of Animal and Veterinary Sciences,1999,30(5):399-404(in Chinese with Enghlish abstract).
[10] 高惠璇. SAS/STAT软件使用手册[M]. 北京:中国统计出版社,2003:183-197. Gao H X. SAS/STAT user's guide[M]. Beijing:China Statistics Press,2003:183-197(in Chinese).
[11] 滕晓红. 中国荷斯坦奶牛产奶量校正系数的研究[D]. 北京:中国农业大学,2006. Ten X H. Studies of adjustment factors for standardizing milking records of Chinese Holsteins[D]. Beijing:China Agricultural University,2006(in Chinese with English abstract).
[12] Santos A S,Silvestre A M. A study of lusitano mare lactation curve with wood's model[J]. Journal of Dairy Science,2008,91:760-766.
[13] Togashi K,Lin C Y. Economic weights for genetic improvement of lactation persistency and milk yield[J]. Journal of Dairy Science,2009,92:2915-2921.
[14] Horana B,Dillona P,Berry D P,et al. The effect of strain of Holstein—Friesian,feeding system and lactation on lacration curves characteristics of spring-calving dairy cows[J]. Livestock Production Science,2005,95:231-241.
[15] Dematawewa C M B,Pearson R E,Vanraden P M. Modeling extended lactations of Holsteins[J]. Journal of Dairy Science,2007,90:3924-3936.
[16] Wilson J,Grohn Y T,Bennett G J,et al. Milk production change following clinical mastitis and reproductive performance compared among J5 vaccinated and control dairy cattle[J]. Journal of Dairy Science,2008,91:3869-3879.