农作物病虫害检测关键技术问题,如何破解?
数字图像处理技术在农作物病虫害识别中发挥重要作用。深度学习方法的特征提取能力更强,能准确捕捉细微特征,提高检测精度和可靠性。深度学习在农作物病虫害检测领域展现出强大的潜力和广阔的应用前景,为农业生产提供了重要的技术支持和解决方案。与传统的图像处理方法相比,基于深度学习的病虫害检测方法将病虫害检测统一为端到端特征提取,具有广阔的发展前景和巨大的潜力。虽然农作物病虫害检测技术发展迅速,但已经从学术研究向农业应用过渡,距离在真实自然环境中成熟应用还有一定的距离,仍需解决一些问题。
1 农作物病虫害小数据集检测问题
目前,深度学习方法广泛应用于各种计算机视觉任务,其中农作物病虫害检测是农业领域的具体应用之一。然而,农作物虫害检测面临一个重要挑战,即样本规模较小的问题。相比于公开可用的大规模标注库,自行收集农作物虫害数据样本困难且费时,导致数据集规模有限,标注数据的过程也相对耗费人力和时间。因此,小样本问题成为目前农作物病虫害检测领域的主要限制因素。对于小样本的问题,目前有3种不同的解决方案。
1.1数据扩增
深度学习数据扩增(Data augmentation) 是一种常用的数据增强技术,旨在通过对原始数据进行变换和扩展,生成更多样化、更丰富的训练数据,从而提升深度学习模型的泛化能力和性能。数据扩增是深度学习模型训练的关键组成部分。优化后的数据扩增策略可有效提高农作物病虫害检测效果。病虫害图像扩增最常用的方法是对原始病虫害样本进行镜像、旋转、平移、滤波、对比度调整等图像处理操作,获取更多的样本。此外,生成对抗网络 (GANs)和变分自动编码器(VAE)可以生成更多样化的样本,丰富有限的数据集。
1.2迁移学习
迁移学习(Transfer learning) 是一种机器学习技术,其核心思想是将已经在一个任务上训练好的模型的知识迁移到另一个相关任务上,从而加快新任务的学习过程和提升性能。在传统机器学习中,每个任务通常需要独立地进行数据收集、特征提取和模型训练。然而,某些任务的数据量较少,模型难以充分训练,或者需要大量计算资源。这时,迁移学习可以通过利用其他任务已经学到的知识来帮助新任务。迁移学习在计算机视觉、自然语言处理和语音识别等领域广泛应用。它不仅可以提高模型的泛化能力,还可以节省训练时间和资源。在对参数进行微调或修改成分后,可将其应用于农作物病虫害检测,从而降低模型训练的成本,使卷积神经网络适应小样本数据。LIU等基于 VGG16 和 InceptionResNet - v2 迁移学习网络构建相应的害虫图像识别和分析模型,然后,利用集成算法的思想,将两个改进的CNN系列害虫图像识别和分析模型有效融合,提高了模型对农作物害虫识别和分类的准确性,该方法对害虫识别的准确率为97.71%。
1.3合理的网络结构设计
通过设计合理的网络结构,可以大大减少对样本数量的需求。ZHANG等结合3 种颜色分量构建了农作物叶片病害识别的三通道卷积神经网络模型。每个通道TCCNN分量由3幅彩色RGB叶片病害图像组成。LIU 等提出了一种改进的识别葡萄叶片病害的CNN方法。该模型采用深度可分卷积代替标准卷积来减少过拟合和参数数量。针对不同大小的葡萄叶片病变,将初始结构应用于模型,提高多尺度特征提取能力。与标准的 ResNet 和GoogLeNet 结构相比,该模型具有更快的收敛速度和更高的训练精度。该算法的识别准确率为97. 22%。
2 农作物小目标病虫害检测与细粒度的识别问题
2.1 早期发现小目标病虫害
准确的早期病虫害发现对于提高农作物产量至关重要。然而,实际农作物病虫害早期识别面临挑战,尤其是小尺寸对象容易被忽略,复杂背景和低分辨率图像可能导致错误检测。为了解决这些问题,改进方向和策略被提出来提高小目标检测性能。其中包括引入注意机制,增强对小目标的关注和响应;采用超分辨率技术提高图像质量;使用多尺度特征融合来更全面地表示目标和背景;以及数据增强增加模型泛化能力。这些措施将有助于更好地实现农作物病虫害的早期发现和识别,提高农作物产量,降低损失,为农业生产带来更大的效益。注意机制的运用使资源配置更加合理。注意机制的本质是快速找到感兴趣的区域忽略不重要的信息。通过学习农作物病虫害图像的特征,采用加权系数加权求和法进行特征分离,对图像中的背景噪声进行抑制。具体来说,注意机制模块可以获得显著图像,将目标与背景隔离,利用Softmax 函数对特征图像进行操作,并将其与原始特征图像结合得到新的融合特征,达到降噪的目的。在未来农作物病虫害早期识别的研究中,可以利用注意力机制有效地选择信息,将更多的资源分配到感兴趣的区域,实现更准确的检测。HU等提出一种深度神经网络YOLO-GBS,融合全局上下文(GC) 注意力机制,在复杂背景下寻找目标,充分利用全局上下文信息的自注意力机制,对包含 Crambidae 的昆虫数据集进行实验,其中主要包括夜蛾科、斑鳅科和飞虱科,所提出模型的平均mAP高达79.8%。
2. 2 细粒度的识别问题
农作物病虫害检测面临3个主要挑战:①类内差异较大,即属于同一类的农作物病虫害在视觉特征上差异较大,由于光照、遮挡等因素导致样本差异。②类间存在模糊性,不同类的对象可能具有相似性,导致细粒度识别问题。③背景干扰使得现实世界中农作物病虫害很难出现在整洁背景中,增加了检测的难度。为了应对这些挑战,研究者提出了不少改进方法。例如,通过引入注意机制、提高模型特征提取能力、使用更适合复杂背景下的激活函数和损失函数等,来增强模型对复杂背景的识别效果。同时,对于类内差异大的问题,使用多尺度特征融合提高模型的泛化能力。另外,数据增强也是解决小样本问题的有效手段,通过扩充训练数据,提高模型的鲁棒性和准确性。ZHANG 等提出一种基于改进YOLOX 的实时高性能检测模型。该模型在YOLOX中引入了Efficient Channel Attention( ECA) 、hardSwish 激活函数、Focal Loss 函数,提高了模型提取图像特征的能力,增强复杂背景下棉花病虫害检测效果,平均精度达到94.60%。
通过引入注意机制是提高病虫害识别精度的重要手段。通过融合通道注意力和空间注意力这种方法,在病虫害识别领域取得了显著的进展。通道注意力机制使模型能够动态地分配不同通道的权重,从而更加关注对于病虫害识别具有重要贡献的特征,从而提高了模型的特征提取能力。而空间注意力机制则有助于在图像中定位病虫害的精确位置,通过对图像不同区域的加权,使模型更加关注病虫害可能出现的区域,进一步提升了识别精度。这种融合注意力机制的优势在于,它能够充分利用通道信息和空间信息的互补性,实现更准确的病虫害识别。通过联合考虑不同通道的特征和图像不同位置的特征,模型能够更好地理解图像的语义信息,从而对于复杂的农作物病虫害场景作出更精准的判断。
3 光照变化和遮挡影响下的检测性能问题
3.1光照变化对农作物病虫害检测的影响
过去的农作物病虫害图像采集主要集中在室内灯箱环境中。虽然这种方法可以有效消除外界光线干扰,简化图像处理过程,但与真实自然光下采集的图像存在较大差异。自然光的变化非常动态,而相机能够接受的动态光源范围是有限的,一旦超出或低于这个范围,图像颜色可能会失真。此外,由于图像采集时视角和距离的不同,农作物病虫害的表观特征发生较大变化,给准确识别带来了很大挑战。为了解决这些问题,对农作物病虫害的采集和识别应当更加接近真实自然光下的情况。可以选择在户外或农田中进行图像采集,以更好地反映农作物病虫害在实际生长环境下的表现。此外,在采集图像时要注意保持一致的视角和距离,以减小表观特征的变化。对于动态光照,可以考虑使用高动态范围( HDR) 技术或其他曝光调整方法来获取更准确的图像信息。此外,还可以通过引入更多的样本来增加数据多样性,采用数据增强技术来提高模型的泛化能力。同时,结合迁移学习等方法,可以将室内灯箱采集的数据与真实自然光下采集的数据相结合,提高模型在真实场景下的识别效果。通过这些措施,可以更好地应对自然光变化和视角差异带来的困难,提高农作物病虫害识别的精确度和鲁棒性。
3.2遮挡对农作物病虫害检测的影响
目前,大多数农作物病虫害识别研究都集中在简单背景下进行,避免了复杂环境的干扰。这些研究通常采用直接截取感兴趣区域的方法,但很少考虑遮挡问题。因此,在遮挡条件下的农作物病虫害识别精度较低,实际应用受到很大限制。遮挡问题在真实自然环境中很常见,包括由于叶片姿态变化引起的叶片遮挡、分支遮挡、外部光照引起的光遮挡以及不同遮挡类型引起的混合遮挡。在遮挡条件下,特征缺失和噪声重叠是农作物病虫害识别的难点,不同程度的遮挡影响识别算法的准确性,导致误检和漏检问题。近年来,随着深度学习算法在受限条件下的成熟,一些研究者开始研究遮挡条件下的农作物病虫害识别,并取得了重要进展,为其在真实场景中的应用奠定了基础。然而,遮挡问题是随机且复杂的,现有的基础框架训练难度较大,仍对硬件设备性能有较高依赖。因此,需要加强基础框架的创新和优化,包括设计更轻量级的网络架构。同时,需要加强对生成对抗网络(GAN) 等方法的探索,在保证检测准确性的同时,降低模型训练的难度。GAN在处理姿态变化和复杂背景方面有优势,但其设计还不成熟,容易出现训练困难和模型不稳定的问题。因此,需要加强对网络性能的探索,使模型的质量更容易量化和可控。综上所述,解决遮挡条件下的农作物病虫害识别问题需要不断创新和优化现有算法,并加强对轻量级网络架构和GAN等方法的研究。
4 农作物病虫害检测速度问题
深度学习算法在农作物病虫害检测任务中相较于传统方法表现更出色,然而其计算复杂度较高。为了获得较高的检测精度,深度学习模型需要充分学习图像的特征,这导致计算量的增加,从而降低了检测速度,难以满足实时性的需求。因此,为了保证检测速度,通常需要减少模型的计算量。然而,这种减少计算量的做法可能导致模型训练不足,进而造成错误检测或漏检。
因此,设计一种既能保证检测精度又能保证检测速度的高效算法变得尤为重要。在实际研究中,需要找到一个平衡点,既能确保模型足够复杂以学习图像的细微特征,又能尽量减少计算量以提高检测速度。这可以通过采用轻量级网络结构、优化计算流程、减少冗余参数等方式来实现。此外,数据增强、迁移学习和模型蒸馏等技术也可以用来提高模型的性能并加速模型训练过程。
在面对计算复杂度和检测速度之间的折衷时,还可以考虑使用硬件加速器如GPU、TPU等来提高深度学习算法的运行速度。此外,针对不同场景和任务需求,可以采取不同的策略,例如对于实时性要求较高的场景,可以选择牺牲一定的检测精度来获得更快的检测速度。
总体来讲,解决深度学习算法在农作物病虫害检测中的计算复杂度和检测速度之间的平衡问题是一个具有挑战性的任务。需要综合考虑多种因素,并采用合适的方法和技术来优化模型性能,以实现既精确又高效的农作物病虫害检测算法。
基于深度学习的农作物病虫害检测方法在农业应用中包括3个主要环节:数据标注、模型训练和模型推理。在实时农业应用中,模型推理越来越受到重视。目前,大多数农作物病虫害的检测方法都集中在识别的准确性上。很少有人关注模型推理的效率。RAHMAN 等提出了一种两级小型 CNN 架构,并与 MobileNet、NasNet Mobile 和 SqueezeNet 等最先进的内存高效CNN 架构进行了比较。实验结果表明,该模型在保持93.3%的精度的同时,将模型尺寸缩小了99%,适合在资源受限的移动设备上进行作物病害的实时诊断。
5 农作物病虫害检测的未来发展方向
未来农作物病虫害检测领域可以重点关注以下几个方面:
(1) 针对小样本问题的解决方案:针对农作物病虫害数据集小样本和类别不平衡的特点,进一步研究如何在少量样本下构建更准确和鲁棒的模型,提高模型在小样本情况下的泛化能力。
(2) 多模态数据融合:将不同传感器获得的多模态数据如红外图像、遥感数据和声音等,与图像数据进行融合,以提供更全面的信息,进一步提高农作物病虫害检测的精确性。
(3) 可解释性和可迁移性:加强对深度学习模型的可解释性研究,使其更易于被农户和专家理解和接受。同时,探索提高模型可迁移性的方法,使已训练的模型能够迁移到其他相关任务中,扩展应用范围。
(4) 弱监督和无监督学习:研究如何利用弱监督学习和无监督学习技术,以减少对标注数据的需求,提高模型的效率和泛化能力,降低数据采集成本。
来源:《农业机械学报》2023年11月
作者:慕君林,马博,王云飞,任卓,刘双喜,王金星