南京农业大学学报  2020, Vol. 43 Issue (2): 364-371   PDF    
http://dx.doi.org/10.7685/jnau.201903073
0

文章信息

黄芬, 高帅, 姚霞, 张小虎, 朱艳
HUANG Fen, GAO Shuai, YAO Xia, ZHANG Xiaohu, ZHU Yan
基于机器学习和多颜色空间的冬小麦叶片氮含量估算方法研究
Estimation of winter wheat leaf nitrogen concentration using machine learning algorithm and multi-color space
南京农业大学学报, 2020, 43(2): 364-371
Journal of Nanjing Agricultural University, 2020, 43(2): 364-371.
http://dx.doi.org/10.7685/jnau.201903073

文章历史

收稿日期: 2019-03-31
基于机器学习和多颜色空间的冬小麦叶片氮含量估算方法研究
黄芬1,2 , 高帅1 , 姚霞2 , 张小虎2 , 朱艳2     
1. 南京农业大学信息科学技术学院, 江苏 南京 210095;
2. 南京农业大学国家信息农业工程技术中心, 江苏 南京 210095
摘要[目的]基于冠层图像可见光颜色分量进行冬小麦叶片氮含量(leaf nitrogen concentration,LNC)估算的算法研究,旨在为构建LNC估算模型提供方法借鉴。[方法]用Olympus E-620单反相机采集不同种植条件(2个品种、2个种植密度、3个氮处理)下2年生育期(2013年和2014年)的小麦冠层图像。基于H颜色分量的K-means聚类分割冠层图像,分别提取3个颜色空间HSV、L*a*b*和RGB的3种基础颜色分量值,作为输入参数;分别使用多元线性回归(multivariate linear regression,MLR)、支持向量回归(support vector regression,SVR)、随机森林(random forest,RF)构建LNC估算模型,以决定系数R2和均方根误差(root mean square error,RMSE)为评价指标;10×10嵌套交叉验证法分析3个颜色空间下各算法模型的拟合能力与泛化性能。[结果]单颜色空间下,3个算法模型的拟合与泛化性能以HSV空间下最优,L*a*b*空间下其次,RGB空间下表现最弱;其中,RF拟合能力最强,但方差主导了泛化误差,模型过拟合;SVR拟合能力弱于RF,优于MLR,但该模型泛化性能最优;MLR拟合能力最弱,且偏差主导了泛化误差,模型欠拟合且受噪声干扰。融合3个颜色空间9种基础颜色分量的多颜色空间,3个模型拟合与泛化性能相对单颜色空间均更优,其中RF模型最优。与最优单色空间HSV相比,RF在训练集上R2提高2.67%,RMSE降低11.59%;测试集上R2提高7.57%,RMSE降低11.49%。多颜色空间下RF较SVR拟合更优,且泛化性能有效提升,提升比例高于SVR。[结论]基于3种算法构建的LNC估算模型,在融合3个颜色空间的9个基础颜色分量多颜色空间下,RF拟合与泛化性能最优,可为估算冬小麦LNC提供方法参考。
关键词冬小麦   叶片氮含量   颜色空间   机器学习   泛化性能   
Estimation of winter wheat leaf nitrogen concentration using machine learning algorithm and multi-color space
HUANG Fen1,2, GAO Shuai1, YAO Xia2, ZHANG Xiaohu2, ZHU Yan2    
1. College of Information Science and Technology, Nanjing Agricultural University, Nanjing 210095, China;
2. National Engineering and Technology Center for Information Agriculture, Nanjing Agricultural University, Nanjing 210095, China
Abstract: [Objectives] The paper aimed to provide a reference for constructing estimation models of winter wheat leaf nitrogen concentration(LNC), using visible color components of wheat canopy image. [Methods] The images of winter wheat canopy at different stages under different planting schemes(2 varieties, 2 planting density levels and 3 nitrogen fertilizer treatment) were taken from 2013 to 2014, with Olympus E-620 camera. All images were segmented using K-means clustering algorithm based on H component and the monochromatic components of 3 color spaces(HSV, RGB and L*a*b*) were extracted as independent variables of the model estimating wheat LNC. The estimation models were constructed using multivariate linear regression(MLR), support vector regression(SVR) and random forest(RF) algorithm. The models in 3 color space were studied through 10×10-nested cross-validation, taking the coefficient of determination(R2) and the root mean square error(RMSE) as evaluation index. [Results] In single color space, the fitting and generalization performance of 3 algorithm models was optimal in HSV color space, the second in L*a*b* color space, and the worst in RGB color space. RF had the best fitting performance, but it also had the problem of overfitting dominated by the variance; the fitting ability of SVR was weaker than that of RF, but was better than that of MLR, though the SVR had the best performance; MLR had the weakest fitting ability, and had the under-fitting problem dominated by the bias as well as the noise data. In multi-color space which fused 9 monochromatic features from 3 color spaces(HSV, RGB and L*a*b*), the fitting and generalization performance of each of the 3 algorithm models were respectively better than those in single color space and the RF had the best performance. Compared with the best single color space HSV, R2 of RF increased 2.67% and RMSE improved 11.59% in the training set and R2 increased 7.57% and RMSE improved 11.49% in the testing set. In multi-color space, the fitting performance of RF was better than that of SVR and the generalization performance was effectively improved, with a higher ratio of improvement than SVR. [Conclusions] Between 3 algorithm models, the RF is best in fitting and generalization performance in multi-color space which fused 9 monochromatic features from 3 color spaces, and the RF can provide a reference for estimating LNC of wheat.
Keywords: winter wheat    leaf nitrogen concentration    color space    machine learning    generalization performance   

小麦在全球范围内广泛种植, 是重要的粮食作物。我国作为小麦主产国, 小麦产量和消费量均最高, 提高小麦生产效率与产品品质, 是我国重要的粮食战略目标。氮素是作物生长的重要营养元素, 其影响作物产量与品质[1], 而过量施氮又会污染农田生态环境[2-3]。对作物及时准确的营养诊断, 制定施肥管理措施, 有助于提高肥料利用率, 改善农田生态环境, 对农业的可持续发展有重要意义。

目前, 作物氮营养无损诊断主要采用遥感方法。基于作物冠层多光谱反射率的航空以及卫星遥感技术适用于监测大尺度下的作物长势和氮素营养状态, 且受时空分辨率限制, 导致其操作难度大、成本高。基于光谱学原理的地面遥感技术中, 便携式叶绿素仪虽可快速无损测定叶绿素相对含量, 但其对作物氮饱和状态不敏感[4], 且测定结果受品种、生长期等因素的影响较大[5]。植物冠层光谱仪GreenSeeker、ASD等获取的冠层光谱数据是包含背景因素的混合光谱[6-8], 而背景因素影响作物冠层光谱的准确获取。作物叶片会根据自身不同营养状态, 呈现差异性颜色和形态, 以此反映自身生理状况。有研究表明, 基于连续投影算法提取光谱数据的波长位置, 大部分位于可见光区域, 光谱数据对叶片氮含量(leaf nitrogen concentration, LNC)最有研究意义的前2个波段均在可见光区域[9], 由此可知, 可见光区间对LNC较为敏感。数码相机作为一种可见光光谱的地面遥感工具, 因其高效、经济的特点而被广泛应用在作物营养状态监测领域。

相关研究结果显示, 不同作物与营养参数相关的图像参数不同。如:HSV空间下深绿指数(dark green color index, DGCI)与草地氮素水平、玉米叶片含氮量存在线性相关性[10-11]; RGB、HSB和L*a*b*空间下各颜色分量估算叶绿素相对含量(SPAD)的线性模型中, NRI、S以及b*分量与SPAD线性关系最强[12]; HSV颜色空间的H分量和L*a*b*颜色空间的b*分量与水稻叶片氮含量存在显著相关性[13]; 与拔节期小麦和灌浆期玉米氮素营养相关性较好的是作物冠层的红光标准值(normalized redness intensity, NRI)[14-15]; HSI空间的S分量以及L*a*b*颜色空间的b*分量分别与棉花的氮素浓度、SPAD的相关关系明显[16]。可见, 作物生长状况受品种、生育期等多个因素影响, 导致表征作物营养信息的图像参数随之变化。

任何一种颜色分量的变化都会引起作物冠层叶色不同程度的改变, 冠层叶色又与氮含量密切相关。上述研究或利用图像单一颜色分量与作物营养指标拟合线性回归方程, 未考虑剩余颜色分量对营养检测的影响; 或研究单一颜色空间下构建的颜色指数与营养指标的关系, 未对比其他颜色空间下构建的营养评价指标。Su等[17]和Riccardi等[18]综合考虑RGB空间下的各颜色分量, 基于最小二乘法建立了估算微藻和藜麦叶绿素含量的多元线性回归(multivariate linear regression, MLR)模型, 均取得较好的效果。在此基础上, Agarwal等[19]研究多个颜色空间下估算菠菜SPAD的线性模型, 指出L*a*b*空间下的MLR算法模型优于其他颜色空间。为提高估算精度, 梁亮等[20]比较了线性回归方法和支持向量回归(support vector regression, SVR)算法遥感反演小麦冠层叶绿素的效果, 认为支持向量回归显著提高反演精度。王丽爱等[21]比较了遥感估算小麦叶片SPAD的3种机器学习算法模型效果, 与支持向量回归和人工神经网络算法相比, 随机森林(random forest, RF)算法的学习和回归预测能力在小麦多个生育期都最优。

目前的研究大多基于高光谱, 利用机器学习算法进行农学参数估算, 缺少对不同算法泛化性能的比较。另外, 基于冠层图像可见光颜色分量估算农学参数的研究较少。本文以冬小麦为研究对象, 利用冠层颜色分量, 分别采用MLR、SVR及RF在3个颜色空间下(HSV、L*a*b*和RGB)构建叶片氮含量的估算模型, 比较不同颜色空间下各算法的估算精度以及泛化性能, 以期为叶片氮含量的估算提供算法模型借鉴。

1 材料与方法 1.1 试验设计

2012—2014年于南京农业大学国家信息农业工程技术中心如皋试验基地进行稻麦轮种, 采用随机裂区设计, 12个处理, 重复3次, 共36个试验小区。小区面积35 m2(7 m×5 m), 条播, 总面积约1 080 m2

2个供试品种:‘生选6号’(V1)、‘扬麦18号’(V2);2个密度处理:D1(行距40 cm, 1.5×106株· hm-2)、D2(行距20 cm, 3.0×106株· hm-2), 株距不变; 3个氮肥水平:不施氮(N0)、纯氮150 kg · hm-2(N1)、纯氮300 kg · hm-2(N2), 氮肥50%作为基肥于播种时施入, 50%在拔节期追施(3月中旬)。

1.2 数据采集与处理 1.2.1 冠层图像采集

小麦拔节期是其开花、结实积累养分的重要阶段, 此时小麦快速生长, 是监测氮素的重要时期[22]。生育前期小麦的冠层覆盖度较小, 生育后期的过大, 都不利于冠层图像的准确获取。试验取样日期2013年为3月14日、3月22日、4月1日, 2014年为3月8日、3月31日、4月15日。本研究采用单反相机奥林巴斯E-620, 相机设置为自动白平衡。在3—4月晴朗天气下, 距小麦冠层1 m高度、与地面90°拍摄采样。每区每次取样1次, 36个小区取样36张小麦冠层图像。

1.2.2 氮素营养参数测定

小麦氮含量测定与图像采集同期进行。拍摄当天对每个小区选择20株长势相近植株进行破坏性取样, 采用凯氏定氮法测定小麦叶片氮含量, 用单位叶片质量的氮含量表示, 即1 kg叶片的含氮量(g)。

1.2.3 冠层图像处理

大田环境下背景复杂, 表现为植株相互遮挡有阴影、光斑, 土壤、石砾、杂草造成干扰。这些因素会造成误分割现象。为提高分割精度, 本文利用基于图像H分量的K均值聚类方法[23]分割小麦冠层图像。图像处理环境为Windows 10, RAM 4GB, CPU Intel core i3-2348M, 工具为Matlab R2014b。

小麦冠层图像分割效果见图 1。H分量的K均值聚类方法能将相互遮挡有光斑的叶片与土壤较好分割开, 同时叶片边缘细节也处理很好。对分割后206幅冠层图像, 提取每张图像非0像素值的R、G、B、H、S、V、L*、a*、b*分量, 分别计算其平均像素值作为各分量的基础颜色特征参数值。

图 1 小麦冠层图像分割 Fig. 1 Segmentation of wheat canopy images V1:小麦品种‘生选6号’, V2:小麦品种‘扬麦18号’; D1:行距40 cm(1.5×106株· hm-2), D2:行距20 cm(3.0×106株· hm-2); N0:不施氮。 V1:Wheat variety'Shengxuan 6', V2:Wheat variety'Yangmai 18';D1:Row spacing is 40 cm(1.5×106 plant · hm-2), D2:Row spacing is 20 cm(3.0×106 plant · hm-2); N0:No nitrogen.
1.3 模型构建

2年试验共获取206组数据, 全部用于模型构建与验证。为评估模型的泛化性能, 使用嵌套交叉验证:内层交叉验证用来选取模型参数, 外层交叉验证用来估计模型泛化性能。嵌套交叉验证中, 为减少算法结果对数据划分的依赖, 外层循环对训练集和测试集的所有划分进行遍历, 对每种划分都运行1次带交叉验证的网格搜索, 每种划分下网格搜索可能得到不同的最佳参数。最后, 对于外层循环的每种划分, 利用最佳参数模型得到测试集上的评价指标。嵌套交叉验证得到的评价指标可以衡量在网格搜索找到的最佳参数下模型的泛化能力。

1.3.1 模型构建方法

采用3种算法建立模型, 分别是MLR、SVR和RF。模型的自变量为对应颜色空间下的基础颜色分量, 因变量为小麦LNC。回归算法的环境为Windows 10, RAM 4GB, CPU Intel core i3-2348M, 编程语言为python3.6, 工具为PyCharm。

MLR是描述多个自变量与1个因变量的线性模型。其模型参数通过最小二乘法求取, 使该回归直线到样本的残差平方和最小。

RF算法是决策树的集成, 通过自助法从训练集中提取n个子集来构建n棵树, 每棵树的分裂节点从含有d个属性的集合中随机选取1个包含k个属性的子集, 然后从这个子集中选择1个最优属性用于划分; 训练好的n棵回归树, 每棵树单独预测, 对n个预测值的简单平均作为最终结果; 剩下未被抽中的样本组成袋外数据, 用于对泛化性能的袋外估计。

SVR借助核函数可以将数据从低维映射到高维, 从而将非线性转化为线性。核函数的选取对算法影响较大, 本文选用的径向基核函数如式(1)所示, 其中γ是自由参数, 控制映射函数的空间分布复杂度。

(1)

本文选用的ε-SVR, 是一种基于有限的噪声样本集来估计未知的连续值函数, 同时采用以最小化结构风险的处理来减小模型复杂度的算法, 优化形式如式(2), 其中, C是正常数, ζζ*是非负松弛变量。

(2)
1.3.2 模型评价

选取以下指标衡量算法模型得到的LNC预测值和小麦LNC实际值的拟合程度:

(1) 决定系数(R2):相关系数的平方值, 表明预测值解释实际值变差的程度。计算公式:

(3)

式中:yi为样本i的测量值; y为样本的平均值; 是模型预测值; n为样本数;

(2) 均方根误差(root mean square error, RMSE):检验预测值和实测值的符合精度。计算公式:

(4)

式中:yi是标准仪器方法测定的实际值; 是模型预测值; n是样本数。

2 结果与分析 2.1 颜色分量与氮营养指标相关性

表 1为2012—2014年实测小麦叶片氮含量与3个颜色空间的9个颜色分量间的相关性分析结果。除颜色分量a*, 其余颜色分量与叶片氮含量均显著相关。3个颜色空间的分量中, 2个与LNC负相关, 1个与LNC正相关。按相关程度来看, 颜色分量b*与LNC相关性最高, 相关系数绝对值为0.69, B、H、S分量相关系数绝对值均达到显著水平, 且都大于0.45。

表 1 颜色分量与叶片氮含量(LNC)的相关系数 Table 1 Correlation coefficient between color component and leaf nitrogen concentration(LNC)
参数
Index
颜色分量Color components
R G B H S V L* a* b*
LNC -0.21** -0.19** 0.47** 0.56** -0.53** -0.21** -0.21** 0.11 -0.69**
Note:* *P < 0.01.
2.2 叶片氮含量估算模型的构建与验证

本文以冠层图像3个颜色空间HSV、L*a*b*和RGB的基础颜色分量为自变量, 分别使用MLR、SVR、RF, 构建各颜色空间的小麦LNC估算模型。SVR模型的主要参数设置如下:核函数类型为径向基核; 惩罚系数C与核函数参数gamma的范围均为[0.01, 100], 以步长10变化; 最佳参数以10折交叉验证和网格搜索法确定。RF模型的回归树数目候选值为{100, 200, 400, 800}, 用于划分回归树节点的k个属性, 其候选值为; 为避免过拟合, 给RF设置2个正则化超参数:回归树的最大深度(max_depth)和叶节点的最小样本数量(min_samples_leaf)的候选值分别为{4, 8, 12}和{4, 6, 8, 10}。算法泛化性能的评估采用10×10交叉验证, 即外层将数据按照训练集与测试集分为10折, 用交叉验证遍历所有数据的10种划分; 对每一种划分采用10折交叉验证寻找最佳参数。

表 2显示:HSV颜色空间, 各算法训练集的R2最高, RMSE最低; RGB空间, 各算法的R2最低, RMSE最高。与RGB相比, HSV训练集的R2在MLR、SVR和RF下分别提高14.96%、9.31%和6.54%, RMSE分别降低12.96%、20.90%和18.48%。表明, HSV各算法模型的拟合能力优于L*a*b*, L*a*b*优于RGB。

表 2 主要颜色空间叶片氮含量估算模型交叉验证结果 Table 2 Cross-validation results of the models for estimating leaf nitrogen concentration in main color space
颜色空间
Color space
模型
Models
训练集Training set 测试集Testing set
R2 RMSE/% R2 RMSE/%
RGB MLR
SVR
RF
0.618 3±0.012 2
0.802 6±0.030 6
0.836 7±0.006 5
0.547 0±0.008 0
0.391 9±0.033 8
0.357 7±0.006 3
0.577 6±0.133 5
0.705 6±0.124 2
0.622 0±0.134 8
0.557 8±0.074 2
0.460 6±0.091 5
0.526 2±0.068 9
HSV MLR
SVR
RF
0.710 8±0.009 2
0.877 3±0.007 8
0.891 4±0.007 1
0.476 1±0.006 4
0.310 0±0.010 1
0.291 6±0.010 6
0.685 0±0.102 5
0.783 7±0.082 7
0.737 2±0.118 6
0.480 3±0.062 1
0.398 4±0.083 2
0.434 7±0.077 4
L*a*b* MLR
SVR
RF
0.680 3±0.009 0
0.855 4±0.046 4
0.874 8±0.007 6
0.500 6±0.006 3
0.331 2±0.063 7
0.313 1±0.007 6
0.647 1±0.102 0
0.742 2±0.106 0
0.701 1±0.160 0
0.510 6±0.060 3
0.432 7±0.089 8
0.461 0±0.079 5

衡量模型泛化误差的偏差与方差, 分别用于描述模型的拟合能力和稳定性。算法模型的训练误差主要由偏差造成, 而由于模型的复杂度相对训练集过高导致的方差, 通常体现在测试误差相对训练误差的增量上。由表 2可知:3个颜色空间的训练集, RF的R2大于SVR和MLR, RMSE小于SVR和MLR, 可见, RF拟合能力最优。3个颜色空间的测试集, SVR的R2大于RF和MLR, RMSE小于RF和MLR, 表明SVR泛化能力最优。3个颜色空间下, RF的测试误差相对训练误差的增量最大, 训练误差最小, 但测试误差大于SVR, 虽然RF的拟合能力最优, 但方差大于偏差, 模型的方差主导了泛化误差, RF存在过拟合; MLR测试误差相对训练误差的增量最小, 训练和测试误差最大, 方差小于偏差, MLR泛化误差主要由偏差造成, 存在欠拟合。分析认为, RF不对训练数据作出假设, 且该模型参数较多, 扩大了模型的自由度, 易于紧密拟合训练数据以提高拟合能力; 虽然RF在构建每棵决策树的分裂节点时引入随机属性来避免过拟合, 但是输入变量小于等于3时会生成一些差异度较小的树, 从而降低算法的泛化性能。作为基于最小化结构风险的算法模型, SVR的惩罚系数C对模型的正则化效果优于RF模型的超参数对其正则化效果。

进一步分析表 2, MLR模型在3个颜色空间测试集R2RMSE的浮动区间均包含训练集及其变化区间, 可能出现测试集评价指标优于训练集。缺氮和过氮都会造成小麦生理状态异常, 影响小麦LNC测量的准确性, 形成噪声数据, 而基于最小二乘的MLR算法模型对噪声数据比较敏感。SVR模型在RGB空间下, 测试集的评价指标浮动区间也包含训练集区间, 说明SVR也受到噪声数据的干扰。反观RF在3个颜色空间均未受到噪声数据的影响, 说明其有很好的抗噪能力, 可能是RF自助法抽样建立决策树和从输入变量集合中随机抽取变量来构建树的分裂节点这2个随机性的引入降低了RF对噪声的敏感。

取3个颜色空间RGB、HSV、L*a*b*的3种基础颜色分量, 构成多颜色空间的9种基础分量, 3种算法MLR、SVR、RF分别构建LNC的估算模型。由表 3可知, 多颜色空间下MLR、SVR、RF训练集的R2较最优单色空间HSV分别提高9.83%、0.46%和2.67%, RMSE较HSV分别降低12.92%、2.35%和11.59%;MLR、SVR、RF测试集的R2较HSV空间分别提高6.23%、0.87%、7.57%, RMSE分别降低6.90%、0.95%、11.49%。说明融合3个颜色空间9种基础颜色分量的多颜色空间下, 3个模型算法的拟合能力与泛化性能更优。其中, RF在训练集和测试集的R2绝对值和提升比例均最高, RMSE绝对值和降低的比例均最低, RF拟合与泛化性能最优, 性能提升明显高于其他2个模型。多颜色空间下的9种基础颜色分量之间存在共线性, 使SVR性能提升不大, 为避免RF过拟合而引入随机属性构建每棵树的分裂节点, 多颜色空间下各基础颜色分量使RF具有更多的输入属性, 生成了差异度更大的决策树, 表现为RF对共线性不敏感[24], 从而有效提升其泛化性能。MLR测试集R2RMSE浮动区间均包含训练集的区间, 可能出现测试集评价指标优于训练集, 说明多颜色空间下MLR未能有效避免噪声数据的干扰, MLR模型的偏差高于方差, 模型欠拟合。

表 3 多颜色空间叶片氮含量估算模型交叉验证结果 Table 3 Cross-validation results of the models for estimating leaf nitrogen concentration in fusion color space
模型Models 训练集Training set 测试集Testing set
R2 RMSE/% R2 RMSE/%
MLR 0.780 7±0.006 0 0.414 6±0.005 7 0.727 7±0.082 0 0.449 3±0.055 6
SVR 0.881 3±0.030 2 0.302 7±0.038 2 0.790 5±0.061 3 0.394 7±0.062 1
RF 0.915 2±0.004 2 0.257 8±0.006 9 0.793 0±0.077 5 0.389 9±0.061 5
3 结论

基于数字图像处理的农作物营养参数估算研究, 应用较多的是RGB、HSV和L*a*b*颜色空间。本文基于这3个颜色空间进行了冬小麦LNC估算算法模型的研究, 结果显示, 单一颜色空间下, 3个算法模型的拟合能力与泛化性能, HSV空间下最优、RGB最弱。本文的试验数据包含高氮和缺氮2个处理。高氮处理小麦叶片叶绿素含量较高, 使植物冠层可见光波段的反射特征“绿峰”和“红边”的位置受到影响, 表现为绿峰向蓝光方向偏移, 波长变短, 红边向长波方向移动[25]。造成相关性较强的长波段红光反射率降低, 相关性弱的短波段蓝光反射率升高。当小麦缺氮时, 叶片叶绿素含量下降, 小麦冠层光谱反射率在可见光波段增加[26]。同时由于氮素的易运转特性, 冠层老叶片的氮素会转向新叶片, 表现为植株下部的叶片先退绿黄化, 逐渐扩展到上部叶片[27-28]。以上因素可能造成RGB空间叶色信息的获取存在偏差。HSV和L*a*b*颜色空间通过对RGB基础颜色分量的非线性转换, 一定程度上矫正RGB颜色空间叶色偏差。同时, RGB颜色空间的各单色分量包含亮度信息, 而大田环境里, 光照条件复杂, 小麦冠层反射光谱受土壤、杂草等干扰影响, HSV颜色空间与小麦冠层叶色相关的基础颜色分量H、S与亮度V分离, L*a*b*颜色空间中色度a*、b*与亮度L*分离, 因而减弱了大田复杂背景对冠层反射光谱的影响。

品种、光照强度、生育期以及施肥等因素不同, 作物的生长状况和营养状况也会改变, 导致冠层图像基础颜色分量对作物营养状况表达能力产生差异[29]。多颜色空间的基础颜色分量包含的信息多于单一颜色空间, 研究结果显示, 多颜色空间下3个算法模型表现出更优的估算效果。相较其他2个模型, RF在单颜色和多颜色空间下均具有最好的拟合能力, 多颜色空间下基础颜色分量的增多, 有效提高RF模型随机生成决策树的差异度, 模型泛化性能得以改善, 拟合能力与泛化性能提升明显高于其他2个模型, 但方差主导了泛化误差, 模型过拟合。SVR拟合能力弱于RF, 优于MLR, 但该模型泛化性能最优。MLR的泛化误差则由偏差主导, 模型欠拟合且受噪声干扰。

本文从颜色空间和算法模型泛化性能的角度对小麦LNC估算问题进行了探索研究, 研究结果显示多颜色空间下的RF算法模型具有较高的预测精度, 可为小麦LNC快速无损检测提供方法借鉴。需要指出的是, 图像分割算法影响后续颜色分量提取精度, 是影响算法模型精度的关键因素。同时随着生育期、施肥等因素改变, 作物生长状况及营养含量随之变化, 进而引起冠层图像指标对营养状况表达能力的差异。因此, 为提高估算精度, 图像分割算法有待进一步的研究:1)引入深度学习算法, 研究其对提升作物图像分割精度的适宜性与有效性; 2)不断丰富不同年份的试验数据, 分析与调优冬小麦叶片的氮含量估算方法。即在足够数据集的前提下, 应该分训练集和测试集来分别研究。

参考文献(References)
[1]
Dambreville C, Morvan T, Germon J. N2O emission in maize-crops fertilized with pig slurry, matured pig manure or ammonium nitrate in Brittany[J]. Agriculture, Ecosystems & Environment, 2008, 1/2/3: 201-210.
[2]
Li W, Qiao Y Q, Du S Z, et al. Analysis on absorption, utilization and transfer efficiency of nitrogen in high-yield wheat cultivars at different sowing dates[J]. Agricultural Science & Technology, 2016, 17(7): 1600-1606.
[3]
王德建, 林静慧, 孙瑞娟, 等. 太湖地区稻麦高产的氮肥适宜用量及其对地下水的影响[J]. 土壤学报, 2003, 40(3): 426-432.
Wang D J, Lin J H, Sun R J, et al. Optimum nitrogen rate for a high productive rice-wheat system and its impact on the groundwater in the Taihu lake area[J]. Acta Pedologica Sinica, 2003, 40(3): 426-432 (in Chinese with English abstract).
[4]
Lin F F, Qiu L F, Deng J S, et al. Investigation of SPAD meter-based indices for estimating rice nitrogen status[J]. Computers and Electronics in Agriculture, 2010, 71(Supple1): S60-S65.
[5]
赵满兴, 周建斌, 翟丙年, 等. 旱地不同冬小麦品种氮素营养的叶绿素诊断[J]. 植物营养与肥料学报, 2005, 11(4): 461-466.
Zhao M X, Zhou J B, Zhai B N, et al. Chlorophyll diagnoses of N nutrition for different winter wheat cultivars on dryland[J]. Plant Nutrition and Fertilizing Science, 2005, 11(4): 461-466 (in Chinese with English abstract).
[6]
Lu Y L, Li S K, Bai Y L, et al. Canopy spatial distribution and identification using hyperspectal data in winter wheat[J]. Communications in Soil Science and Plant Analysis, 2009, 40(7/8): 1240-1253.
[7]
Li F, Miao Y, Zhang F, et al. In-season optical sensing improves nitrogen-use efficiency for winter wheat[J]. Soil Science Society of America Journal, 2009, 73(5): 1566-1574.
[8]
肖春华, 李少昆, 王克如, 等. 基于多视角反射光谱的冬小麦冠层叶片氮素营养监测研究[J]. 作物学报, 2007, 33(7): 1141-1145.
Xiao C H, Li S K, Wang K R, et al. Prediction canopy leaf nitrogen content of winter wheat based on reflectance spectra in different directions[J]. Acta Agronomica Sinica, 2007, 33(7): 1141-1145 (in Chinese with English abstract).
[9]
黄宇.基于成像高光谱的小麦氮素营养监测研究[D].南京: 南京农业大学, 2015.
Huang Y. Monitoring nitrogen status with hyperspectral imaging in wheat[D]. Nanjing: Nanjing Agricultural University, 2015(in Chinese with English abstract). http://cdmd.cnki.com.cn/Article/CDMD-10307-1017042369.htm
[10]
Karcher D E, Richardson M D. Quantifying turfgrass color using digital image analysis[J]. Crop Science, 2003, 43(3): 943-951.
[11]
Rorie R L, Purcell L C, Karcher D E, et al. The assessment of leaf nitrogen in corn from digital images[J]. Crop Science, 2011, 51(5): 2174-2180.
[12]
Rigon J P G, Capuani S, Fernandes D M, et al. A novel method for the estimation of soybean chlorophyll content using a smartphone and image analysis[J]. Photosynthetica, 2016, 54(4): 559-566.
[13]
Wang Y, Wang D J, Shi P H, et al. Estimating rice chlorophyll content and leaf nitrogen concentration with a digital still color camera under natural light[J]. Plant Methods, 2014, 10(1): 36.
[14]
白金顺, 曹卫东, 熊静, 等. 应用数码相机进行绿肥翻压后春玉米氮素营养诊断和产量预测[J]. 光谱学与光谱分析, 2013, 33(12): 3334-3338.
Bai J S, Cao W D, Xiong J, et al. Nitrogen status diagnosis and yield prediction of spring maize after green manure incorporation by using a digital camera[J]. Spectroscopy and Spectral Analysis, 2013, 33(12): 3334-3338 (in Chinese with English abstract).
[15]
李红军, 张立周, 陈曦鸣, 等. 应用数字图像进行小麦氮素营养诊断中图像分析方法的研究[J]. 中国生态农业学报, 2011, 19(1): 155-159.
Li H J, Zhang L Z, Chen X M, et al. Image analysis method in application of digital image on diagnosing wheat nitrogen status[J]. Chinese Journal of Eco-Agriculture, 2011, 19(1): 155-159 (in Chinese with English abstract).
[16]
王方永, 王克如, 李少昆, 等. 利用数码相机和成像光谱仪估测棉花叶片叶绿素和氮素含量[J]. 作物学报, 2010, 36(11): 1981-1989.
Wang F Y, Wang K R, Li S K, et al. Estimation of chlorophyll and nitrogen contents in cotton leaves using digital camera and imaging spectrometer[J]. Acta Agronomica Sinica, 2010, 36(11): 1981-1989 (in Chinese with English abstract).
[17]
Su C H, Fu C C, Chang Y C, et al. Simultaneous estimation of chlorophylla and lipid contents in microalgae by three-color analysis[J]. Biotechnology and Bioengineering, 2008, 99(4): 1034-1039.
[18]
Riccardi M, Mele G, Pulvento C, et al. Non-destructive evaluation of chlorophyll content in quinoa and amaranth leaves by simple and multiple regression analysis of RGB image components[J]. Photosynthesis Research, 2014, 120(3): 263-272.
[19]
Agarwal A, Dutta G S. Assessment of spinach seedling health status and chlorophyll content by multivariate data analysis and multiple linear regression of leaf image features[J]. Computers and Electronics in Agriculture, 2018, 152: 281-289.
[20]
梁亮, 杨敏华, 张连蓬, 等. 基于SVR算法的小麦冠层叶绿素含量高光谱反演[J]. 农业工程学报, 2012, 28(20): 162-171.
Liang L, Yang M H, Zhang L P, et al. Chlorophyll content inversion with hyperspectral technology for wheat canopy based on support vector regression algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering, 2012, 28(20): 162-171 (in Chinese with English abstract).
[21]
王丽爱, 马昌, 周旭东, 等. 基于随机森林回归算法的小麦叶片SPAD值遥感估算[J]. 农业机械学报, 2015, 46(1): 259-265.
Wang L A, Ma C, Zhou X D, et al. Estimation of wheat leaf SPAD value using RF algorithmic model and remote sensing data[J]. Transactions of the Chinese Society for Agricultural Machinery, 2015, 46(1): 259-265 (in Chinese with English abstract).
[22]
张立周, 侯晓宇, 张玉铭, 等. 数字图像诊断技术在冬小麦氮素营养诊断中的应用[J]. 中国生态农业学报, 2011, 19(5): 1168-1174.
Zhang L Z, Hou X Y, Zhang Y M, et al. Diagnosis of the state of N in wheat via digital image processing technique[J]. Chinese Journal of Eco-Agriculture, 2011, 19(5): 1168-1174 (in Chinese with English abstract).
[23]
黄芬, 于琪, 姚霞, 等. 小麦冠层图像H分量的K均值聚类分割[J]. 计算机工程与应用, 2014, 50(3): 129-134.
Huang F, Yu Q, Yao X, et al. K-means clustering segmentation for H weight of wheat canopy image[J]. Computer Engineering and Applications, 2014, 50(3): 129-134 (in Chinese with English abstract).
[24]
Cutler D R, Edwards T C, J r, Beard K H, et al. Random forests for classification in ecology[J]. Ecology, 2007, 88(11): 2783-2792.
[25]
李映雪, 朱艳, 曹卫星. 不同施氮条件下小麦冠层的高光谱和多光谱反射特征[J]. 麦类作物学报, 2006, 26(2): 103-108.
Li Y X, Zhu Y, Cao W X. Characterizing canopy hyperspectral and multispectral reflectance under different N-application conditions in wheat[J]. Journal of Triticeae Crops, 2006, 26(2): 103-108 (in Chinese with English abstract).
[26]
薛利红, 杨林章, 沈明星. 缺素对小麦冠层反射光谱的影响[J]. 麦类作物学报, 2006, 26(6): 120-124.
Xue L H, Yang L Z, Shen M X. Effect of different element-deficient on wheat canopy reflectance spectra[J]. Journal of Triticeae Crops, 2006, 26(6): 120-124 (in Chinese with English abstract).
[27]
Vouillot M. Accumulation and remobilization of nitrogen in a vegetative winter wheat crop during or following nitrogen deficiency[J]. Annals of Botany, 1999, 83(5): 569-575.
[28]
Wang Z J, Wang J H, Liu L Y, et al. Estimation of nitrogen status in middle and bottom layers of winter wheat canopy by using ground-measured canopy reflectance[J]. Communications in Soil Science and Plant Analysis, 2005, 36(17/18): 2289-2302.
[29]
王仁红, 宋晓宇, 李振海, 等. 基于高光谱的冬小麦氮素营养指数估测[J]. 农业工程学报, 2014, 30(19): 191-198.
Wang R H, Song X Y, Li Z H, et al. Estimation of winter wheat nitrogen nutrition index using hyperspectral remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering, 2014, 30(19): 191-198 (in Chinese with English abstract).