基于GR-YOLO轻量化模型的复杂环境下成熟期红枣裂果识别方法

王立军1 杨志磊1 王舒恒1 黄文耀1 高云鹏1 蒲吴霞2

(1.东北农业大学工程学院, 哈尔滨 150030; 2.塔里木职业技术学院纺织服装学院, 阿拉尔 843300)

摘要:针对现有模型在不同光照条件、遮挡情况、天气状况及远距离存在目标等复杂环境下对红枣果实识别精度低、正常果和裂果区分能力差的问题,本研究在自然环境下采集了田间红枣图像,通过模拟4种天气条件实现数据增强,创建了用于模型训练、验证和测试的数据集,以YOLO v8n模型为基础,引入GSConv、RFCAConv模块,构建了GR-YOLO模型,并在红枣数据集上进行了模型训练和测试。试验结果表明,GR-YOLO模型对红枣识别的精确率为95.14%,召回率为97.71%,平均精度均值为97.64%,模型存储量为4.9 MB,模型推理速度为289.8 f/s,参数量为2.38×106;相较于参数量相近的YOLO v5n、YOLO v6n、YOLO v7-tiny、YOLO v8n等模型,GR-YOLO模型的精确率提升1.82~2.61个百分点,召回率提升3.04~8.48个百分点,平均精度均值提升2.40~7.88个百分点;与现有主流模型相比,GR-YOLO模型在识别效果和参数量方面表现最优。改进后的模型不仅提高了红枣目标的识别精度,还能够有效区分正常果与裂果,同时实现了轻量化。

关键词:红枣; 果实品质识别; 复杂环境; YOLO v8n; GR-YOLO

0 引言

红枣营养丰富、药用价值高,是中国广泛种植的经济作物[1-2]。在成熟期红枣表面易出现开裂,若不及时采摘并进行加工处理,可能造成果实浆烂、霉变等情况,影响商品产量和价值[3-4]。为了避免这一情况,通常会提前人工采摘刚开裂的红枣,这一过程不仅劳动强度大,且裂果评判标准难以统一[5-6]。研究红枣裂果的自动识别方法具有一定的意义。

近年来,随着深度学习和机器视觉技术的发展,国内外科研工作者针对应用人工智能方法对水果进行识别、检测进行了大量研究[7-9]。目前关于自然环境下水果的检测与识别研究主要集中在苹果[10-11]、草莓[12-14]、柑橘[15-17]等果实。这为红枣裂果的识别提供了可行方案。

然而红枣果实体积小、分布密集,裂果与正常果颜色、形状及尺寸相似,且红枣多为户外种植,光照条件、天气状况时刻变化,果实表面易附着异物,这些因素均可能会对模型识别效果产生影响[18-20]。另一方面为加快识别速度,需要对模型进行轻量化设计。目前针对复杂自然环境中红枣裂果的智能识别尚缺少研究。

针对上述问题,本研究将在自然环境下采集田间红枣图像,通过数据增强模拟4种天气条件,创建用于模型训练、验证和测试的数据集,以YOLO v8n模型为基础,引入GSConv、RFCAConv模块,构建GR-YOLO模型,以提高对红枣目标识别性能和红枣裂果区分能力。

1 实验数据

1.1 数据图像采集

本研究于红枣成熟期(2023年9月15日至2023年10月15日)分别在新疆生产建设兵团第一师12团、第三师45团、第十四师225团红枣种植基地进行图像采集。为了确保数据的多样性,采集了不同光照条件、遮挡情况及远距离存在目标的红枣图像,共计采集2 400幅,其中部分样本图像如图1所示。

图1 复杂环境下红枣样本图像

Fig.1 Jujube sample images in complex environments

1.2 数据集构建和增强

将采集到的2 400幅图像按照比例6∶2∶2随机划分为训练集(1 440幅)、验证集(480幅)、测试集(480幅)。现有研究表明,通过模拟不同天气状况进行数据增强,可以有效提升模型的鲁棒性和泛化能力[21]。为避免因数据量不足导致模型过拟合[22-23],对训练集、验证集和测试集中的数据进行增强处理。利用Python模拟了4种典型天气状况:①晴天(阳光直射):通过增加亮度和对比度进行模拟。②阴天:通过降低亮度和对比度进行模拟。③雾天:通过高斯模糊和透明叠加进行模拟。④雨天:通过降低亮度和对比度,并随机生成雨滴与原图叠加进行模拟。增强效果如图2所示,增强后的图像数量为训练集7 200幅、验证集2 400幅、测试集2 400幅。

图2 数据增强

Fig.2 Augmentation of data

1.3 图像标注

使用LabelImg工具对数据集中的图像统一进行人工标注并添加TXT格式标签。标注原则为:在视野范围内,根据红枣表面是否存在裂纹进行标记。红枣表面不存在裂纹(正常果)标记为“haoguo”,红枣表面存在裂纹(裂果)标记为“lieguo”。

2 模型构建

2.1 GR-YOLO模型提出

现有研究表明,YOLO v8算法在目标识别中具有较好的效果[9,12-13]。然而,在红枣识别任务中,需要进一步改进YOLO v8算法,使其在精度和计算效率之间取得更好的平衡。因此,本研究选择YOLO v8n作为基础模型,以适应红枣识别的高效需求,并尽可能减小模型的参数量。针对YOLO v8n模型主干网络中的C2f模块复杂度较高、参数量大且特征信息交互能力不足的问题,用GSConv模块替换C2f模块,能够在尽可能保证模型性能的同时实现轻量化,有助于提升推理速度和计算效率[24];针对YOLO v8n模型颈部网络在多尺度目标特征信息融合方面的不足,以及对关键特征关注不够的问题,用C2f_RFCAConv模块替换C2f模块能够实现对不同尺度特征信息的融合,有助于增强模型的鲁棒性,提高模型的泛化能力[25]。以此构建的GR-YOLO模型如图3所示。

图3 GR-YOLO模型结构图

Fig.3 Structural diagram of GR-YOLO model

2.2 GSConv模块

GSConv作为轻量级卷积网络,通过将标准卷积分解为组卷积,有效减少计算量和参数量,同时保持较高的学习能力。其灵活性使得模型在降低计算复杂度的同时,能够提高推理速度和精度,适应不同任务需求,进而提升整体性能与效率[26]。GSConv的结构如图4所示,将Conv和DWConv进行混洗操作,使得Conv的信息均匀地交换不同通道上的局部特征信息,完全混合到DWConv的输出中。通过这种方式,GSConv不仅保留了Conv在捕捉全局特征方面的优势,同时又融入了DWConv的高效性,减少了计算冗余,实现了在模型准确性与计算速度之间的优化平衡。将GSConv模块引入到YOLO v8n模型主干网络中,针对红枣检测任务,有望提高模型对红枣目标的识别速度,减少参数量,实现模型轻量化。

图4 GSConv模型结构图

Fig.4 Structural diagram of GSConv model

2.3 RFCAConv模块

在YOLO v8n模型的颈部网络中引入RFCAConv模块,目的是将空间注意力机制与卷积操作相结合,以增强特征融合能力。RFCAConv的结构如图5所示,通过调整非对称卷积核的尺寸,精确控制感受野,使模型能够在不同尺度上捕捉特征,从而更好地处理局部和全局信息。RFCAConv模块突破传统卷积在空间维度上的限制,利用空间注意力机制灵活调整卷积核参数,解决参数共享问题,提升模型在多尺度特征融合、精度、鲁棒性和计算效率等方面的整体性能[27]

图5 RFCAConv模块结构图

Fig.5 Structural diagram of RFCAConv module

在YOLO v8n模型颈部网络部分引入C2f_RFCAConv模块替换C2f模块,其具体过程如图6和图7所示,首先用RCFAConv模块替换Bottleneck中的CBS模块,形成RFCA_Bottleneck模块,再用RFCA_Bottleneck模块替换C2f 模块中的Bottleneck模块,最终形成C2f_RFCAConv模块。相比于原始的C2f模块,C2f_RFCAConv模块能够提高模型对特征信息的融合能力,对远距离目标和遮挡目标的检测能力进一步提高。有望解决自然环境中红枣目标因遮挡导致的识别困难,以及远距离红枣识别精度低的问题。

图6 RFCA_Bottleneck模块形成过程

Fig.6 Formed process of RFCA_Bottleneck module

图7 C2f_RFCAConv模块形成过程

Fig.7 Formed process of C2f_RFCAConv module

2.4 试验环境配置与训练参数设置

本研究的训练和测试均在同一平台下进行,训练平台的具体参数如下:CPU为Intel(R) Xeon(R) Platinum 8352V CPU@2.10 GHz,GPU为RTX 4090 (24 GB),运行内存容量为64 GB,固态硬盘容量为 1 TB;计算机系统为Linux Ubuntu 22.04,GPU加速库为CUDA 11.3,深度学习框架PyTorch版本为1.10.0,编程语言为Python 3.8。

在训练参数设置方面,图像输入尺寸为960像素×960像素,批次大小为16,训练迭代次数为200,初始学习率设为0.001,优化器采用Adam,超参数设置为β1=0.9,β2=0.999,权重衰减为0.000 1。训练过程分为3个阶段:第1阶段(前3个epoch)为热启动,学习率从0线性增长至0.001;第2阶段(第4个epoch起)为常规训练,学习率固定为0.001;第3阶段(自第100个epoch起)为学习率衰减阶段,采用余弦退火策略将学习率逐步降低至约0.000 01,以提高训练稳定性和精度。此外,为避免过拟合并提升数据多样性,采用了隐数据增强技术,包括随机裁剪、旋转、缩放,所有增强操作在统一条件下应用于所有模型。为提高训练效率并防止过拟合,采用了早停机制,当验证集性能在5次迭代内未显著提升时,训练将提前停止以节省计算资源。

2.5 模型评价指标

在自然环境下识别树上红枣并区分正常果和裂果需要兼顾检测的精度和速度。选用精确率(Precision)、召回率(Recall)、平均精度均值(mAP)、模型存储量、模型推理速度和参数量作为指标来量化本研究所提出的改进模型对红枣的正常果和裂果识别的结果[28]

3 结果与分析

3.1 红枣识别试验

在完成GR-YOLO模型的训练后,得到最佳权重best.pt文件。为了检验GR-YOLO模型的性能,对测试集中的480幅红枣图像进行测试评价,评价结果为:GR-YOLO模型的模型存储量、模型推理速度和参数量分别为4.9 MB、289.8 f/s、2.38×106,其识别红枣正常果的精确率、召回率和平均精度均值分别为95.09%、97.12%、97.25%,其识别红枣裂果的精确率、召回率和平均精度均值分别为96.14%、97.92%、97.81%。GR-YOLO 模型在复杂环境中能够较为可靠地识别红枣目标,并区分正常果与裂果。

3.2 GR-YOLO模型消融试验

为了验证本研究所使用模块的性能,在相同的测试平台和软件运行环境中对同一红枣数据集进行了消融试验,试验结果如表1所示。结果表明,在YOLO v8n模型的主干网络上引入GSConv模块和在YOLO v8n模型的颈部网络中引入RFCAConv模块, 均能提升模型的识别性能和推理速度,并减小模型存储量和参数量。在YOLO v8n模型中同时引入GSConv、RFCAConv模块后,模型的识别性能、推理速度、存储量和参数量最优,模型存储量和参数量分别减少了1.2 MB、6.1×105。原因是GSConv模块的引入增强了模型主干网络的特征提取能力,而RFCAConv模块的引入提高了模型颈部网络的特征融合与增强能力。

表1 消融试验结果

Tab.1 Results of ablation test

注:×表示不采用该模块;√表示采用该模块。

模型模块GSConvRFCAConv精确率/%召回率/%平均精度均值/%模型存储量/MB模型推理速度/(f·s-1)参数量××93.2194.6795.246.1278.42.99×106YOLO v8n√×93.9695.6896.215.0286.62.43×106×√94.0396.6796.665.8282.52.91×106√√95.1497.7197.644.9289.82.38×106

采用Grad-CAM技术生成热力图并分别对改进前后的模型进行可视化研究。图8展示了改进前后模型在红枣识别中的热力图。热力图颜色深浅反映了模型对各局部区域的关注程度,其中红色区域表示关注程度最高[29]。通过对比热力图可以发现,改进前的模型在复杂多果和枝叶遮挡的情况下容易出现注意力不集中的现象;而改进后的模型能够减少复杂环境的干扰,将主要注意力准确集中在红枣上,减少了对枝叶等背景的关注。

图8 改进前后模型热力图

Fig.8 Heat maps of models before and after being improved

3.3 不同模型识别性能对比试验

为了验证本研究提出的GR-YOLO模型在自然环境下识别红枣的优越性能,在保持试验环境配置与训练参数设置一致的条件下,开展了不同模型识别红枣性能的对比试验。

为了证明GR-YOLO模型在识别性能方面存在优势,选取与GR-YOLO模型参数量相近的YOLO v5n、YOLO v6n、YOLO v7-tiny、YOLO v8n等模型进行对比试验。试验结果如表2所示,GR-YOLO模型的精确率、召回率和平均精度均值最优。以上结果表明,本研究提出的GR-YOLO模型在识别性能方面优于YOLO系列同量级模型。

表2 同量级参数量模型对比试验结果

Tab.2 Results of comparative test with models of similar parameter sizes

模型参数量精确率/%召回率/%平均精度均值/%YOLO v5n2.03×10692.5389.2389.76YOLO v6n4.72×10693.3292.2492.65YOLO v7tiny6.01×10692.8491.6291.96YOLO v8n2.99×10693.2194.6795.24GRYOLO2.38×10695.1497.7197.64

为进一步验证GR-YOLO模型在保持较高的识别性能的同时具备轻量化的有效性,选取Faster R-CNN[30]、YOLO v5s[15]、YOLO v6s[31]、YOLO v7[14]、YOLO v8s[13]等主流模型进行对比试验。对比试验结果如表3所示,GR-YOLO模型精确率、召回率、平均精度均值和推理速度均高于主流模型,且其参数量低于主流模型。以上结果表明,GR-YOLO模型具有较高的识别性能和推理速度,同时减少了参数量,实现了模型轻量化。

表3 不同模型对比试验结果

Tab.3 Results of comparative test with different models

模型精确率/%召回率/%平均精度均值/%模型推理速度/(f·s-1)参数量Faster RCNN79.5480.5477.5858.92.3365×108YOLO v5s93.2691.9292.23186.57.2100×106YOLO v6s94.6694.5393.25175.81.8520×107YOLO v793.5892.3492.86132.53.6480×107YOLO v8s94.8696.0995.89188.31.1190×107GRYOLO95.1497.7197.64289.82.3800×106

不同模型在不同光照条件、遮挡情况、天气状况以及远距离存在目标等复杂环境下红枣识别效果如图9~11所示。

图9 不同光照条件和远距离存在目标时不同模型识别红枣效果

Fig.9 Effects of jujubes recognized by different models under different lighting conditions and at long distances with target objects

根据图9可知:在顺光条件下识别红枣时,Faster R-CNN、YOLO v5s和YOLO v6s模型出现错检,其余模型能够准确识别。在逆光条件下,Faster R-CNN模型同时出现错检和重检,YOLO v5s模型出现错检,YOLO v7模型出现重检。在侧光条件下,Faster R-CNN模型出现重检,YOLO v5s模型和YOLO v7模型出现错检。在远距离存在目标的情况下,除GR-YOLO模型外,其余模型均未能识别出远距离红枣。

根据图10可知:在树叶遮挡情况下识别红枣时,GR-YOLO模型准确识别,YOLO v8s模型出现错检,其余的模型全部出现漏检。在果实遮挡情况下,Faster R-CNN模型和YOLO v5s模型同时出现漏检和错检,YOLO v6s模型和YOLO v7模型出现错检,YOLO v8s模型出现重检。在复杂多果情况下,Faster R-CNN模型出现漏检,YOLO v5s模型出现错检。在红枣表面存在异物的情况下,Faster R-CNN模型出现漏检,YOLO v5s模型和YOLO v7模型出现错检。

图10 不同遮挡情况时不同模型识别红枣效果

Fig.10 Effects of jujubes recognized by different models under various occlusion conditions

根据图11可知,在晴天(阳光直射)识别红枣时,Faster R-CNN模型与YOLO v5s模型出现漏检,YOLO v6s模型出现重检,YOLO v7模型与YOLO v8s模型出现错检。在阴天,Faster R-CNN模型和YOLO v6s模型出现漏检,YOLO v5s模型同时出现漏检和错检,YOLO v7模型和YOLO v8s模型出现错检。在雨天,Faster R-CNN模型出现漏检,YOLO v5s模型出现重检,YOLO v6s模型和YOLO v7模型出现错检。在雾天,Faster R-CNN模型同时出现重检和错检,YOLO v5s模型和YOLO v6s模型出现漏检,YOLO v7模型出现重检,YOLO v8s模型出现错检。

图11 不同天气状况下不同模型识别红枣效果

Fig.11 Effects of jujubes recognized by different models under different weather conditions

通过对不同模型在多种复杂环境条件下进行红枣识别效果分析,得出GR-YOLO模型在红枣目标识别及正常果与裂果区分方面的表现明显优于现有主流模型(Faster R-CNN、YOLO v5s、YOLO v6s、YOLO v7、YOLO v8s)。

3.4 GR-YOLO模型鲁棒性与实际应用性

采用单变量分析方法,针对不同光照条件、遮挡情况、天气状况及目标距离等因素,进行GR-YOLO模型的红枣识别性能试验,结果如表4所示。根据表4可知:光照条件的变化会影响 GR-YOLO 模型的识别性能,尤其在逆光条件下,模型的表现受到较大影响。逆光条件下,GR-YOLO 模型的精确率、召回率和平均精度均值分别为 95.84%、98.24%、97.88%,但模型依然展现了较高的识别能力。在不同遮挡情况下识别红枣时,遮挡因素普遍降低了 GR-YOLO 模型的识别性能,特别是在复杂多果下,模型的精确率、召回率和平均精度均值分别下降至 93.27%、95.54%、 94.32%,但总体上模型仍保持较高的识别水平。此外,天气状况变化也对 GR-YOLO 模型的识别性能产生了影响,其中雨天的影响最为明显。雨天环境下,模型的精确率、召回率和平均精度均值分别为 94.44%、93.26%、 94.16%,但模型仍能保持较高的识别性能。对于远距离目标识别,GR-YOLO 模型的精确率、召回率和平均精度均值最低,分别为 92.82%、94.28%、94.01%,但这一性能水平仍能满足实际应用中的基本需求。以上试验结果证明了 GR-YOLO 模型在不同环境下的良好鲁棒性,模型能够适应多种复杂条件,展现出较强的实际应用性。

表4 GR-YOLO模型在不同环境中的识别性能

Tab.4 Test results of GR-YOLO model in different environments %

类别环境情况精确率召回率平均精度均值顺光98.0399.0698.86光照条件逆光95.8498.2497.88侧光97.8898.5698.32树叶遮挡94.4696.5896.29遮挡情况果实遮挡93.8996.2695.96复杂多果93.2795.5494.32红枣表面存在异物93.7695.8894.49晴天(阳光直射)94.7894.0494.48天气状况阴天95.2697.9397.32雨天94.4493.2694.16雾天95.6397.9697.76目标距离远距离目标92.8294.2894.01

4 结论

(1)基于YOLO v8n模型,针对复杂环境下对红枣果实识别精度低、正常果和裂果区分能力差的问题,本研究在主干网络用GSConv模块替换C2f模块,并在颈部网络引入RFCAConv模块与C2f模块相融合形成C2f-RFCAConv模块,构建了GR-YOLO模型,其精确率、召回率、平均精度均值、模型推理速度分别为95.14%、97.71%、97.64%、289.8 f/s,其模型存储量和参数量分别减少了1.2 MB、6.1×105,可实现模型轻量化。

(2)设置了4组消融试验验证模型性能,分别为YOLO v8n模型、替换YOLO v8n模型主干网络中的C2f模块为GSConv模块、替换YOLO v8n模型颈部网络中的C2f模块为C2f_RFCAConv模块、GR-YOLO模型。从定量的角度分析4组模型性能,试验结果表明本研究提出的GR-YOLO模型精确率、召回率、平均精度均值、模型推理速度均高于其他3组,且模型存储量和参数量均低于其他3组。

(3)在相同的试验条件下开展对比试验,GR-YOLO模型在精确率、召回率、平均精度均值方面优于YOLO v5n、YOLO v6n、YOLO v7-tiny、YOLO v8n等同量级参数量模型;与Faster R-CNN、YOLO v5s、YOLO v6s、YOLO v7、YOLO v8s等主流模型相比,GR-YOLO模型的精确率、召回率、平均精度均值和模型推理速度最优,其参数量最小。GR-YOLO模型在红枣识别任务中表现良好,不仅具有较高的识别性能,还成功实现了模型的轻量化,具有良好的应用前景。

(4)为了验证GR-YOLO模型的鲁棒性并评估其在实际应用中的表现,采用单变量分析方法,对GR-YOLO模型在不同光照条件、遮挡情况、天气状况以及目标距离下对红枣的识别性能进行试验。试验结果表明,GR-YOLO模型在复杂环境下展现出了良好的鲁棒性,能够有效适应多种挑战性条件,从而展现出较强的实用性。

参考文献

[1] 吴喆,朱佳敏,刘军,等.红枣主要活性成分及其功能活性研究进展[J].现代食品科技,2024,40(9):1-12. WU Zhe, ZHU Jiamin, LIU Jun, et al. Progress of research on the main active components of jujube and their functional activities[J]. Moodern Food Science and Technology, 2024, 40(9): 1-12. (in Chinese)

[2] 曾窕俊,吴俊杭,马本学,等.基于帧间路径搜索和E-CNN的红枣定位与缺陷检测[J].农业机械学报,2019,50(2):307-314.ZENG Tiaojun, WU Junhang, MA Benxue, et al. Localization and defect detection of jujubes based on search of shortest path between frames and ensemble-CNN model[J]. Transactions of the Chinese Society for Agricultural Machinery, 2019, 50(2):307-314. (in Chinese)

[3] 黑淑梅,郝志前,李婷,等.枣果成熟期水分动态变化与裂果发生的相关性研究[J].北方园艺,2015(22):34-36.HEI Shumei, HAO Zhiqian, LI Ting, et al. The relationship between water dynamic changes and fruit cracking in the mature stage of jujube fruit[J]. Northern Horticulture, 2015(22):34-36. (in Chinese)

[4] 张桂然,王振亮,李开森,等.红枣裂果病防控技术[J].北方园艺,2012(17):145-148.ZHANG Guiran, WANG Zhenliang, LI Kaisen, et al. The red fruit anti-cracking technology on jujube[J]. Northern Horticulture, 2012(17):145-148. (in Chinese)

[5] 李小丽. 红枣裂果机理、原因与综合防控措施[J].农业工程技术,2020,40(26):47-49.LI Xiaoli. Mechanism, causes and comprehensive control measures of jujube fruit cracking[J]. Agricultural Engineering Technology, 2020, 40(26):47-49. (in Chinese)

[6] WU L, HE J, LIU G, et al. Detection of common defects on jujube using Vis-NIR and NIR hyperspectral imaging[J]. Postharvest Biology and Technology, 2016, 112:134-142.

[7] 苗荣慧,李港澳,黄宗宝,等.基于YOLO v7-ST-ASFF的复杂果园环境下苹果成熟度检测方法[J].农业机械学报,2024,55(6):219-228.MIAO Ronghui, LI Gang’ao, HUANG Zongbao, et al. Maturity detection of apple in complex orchard environment based on YOLO v7-ST-ASFF[J]. Transactions of the Chinese Society for Agricultural Machinery, 2024, 55(6):219-228. (in Chinese)

[8] CHEN J, CHEN H, XU F, et al. Real-time detection of mature table grapes using ESP-YOLO network on embedded platforms[J]. Biosystems Engineering, 2024, 246:122-134.

[9] LIU Z, ABEYRATHNA R R, SAMPURNO R M, et al. Faster-YOLO-AP: a lightweight apple detection algorithm based on improved YOLOv8 with a new efficient PDWConv in orchard[J]. Computers and Electronics in Agriculture, 2024, 223:109118.

[10] 宋怀波,马宝玲,尚钰莹,等.基于YOLO v7-ECA模型的苹果幼果检测[J].农业机械学报,2023,54(6):233-242.SONG Huaibo, MA Baoling, SHANG Yuying, et al. Detection of young apple fruits based on YOLO v7-ECA model[J]. Transactions of the Chinese Society for Agricultural Machinery, 2023, 54(6):233-242. (in Chinese)

[11] 张震,周俊,江自真,等.基于改进YOLO v7轻量化模型的自然果园环境下苹果识别方法[J].农业机械学报,2024,55(3):231-242,262.ZHANG Zhen, ZHOU Jun, JIANG Zizhen, et al. Lightweight apple recognition method in natural orchard environment based on improved YOLO v7 model[J]. Transactions of the Chinese Society for Agricultural Machinery, 2024, 55(3):231-242,262. (in Chinese)

[12] 刘莫尘,褚镇源,崔明诗,等.基于改进YOLO v8-Pose的红熟期草莓识别和果柄检测[J].农业机械学报,2023,54(增刊2):244-251.LIU Mochen, CHU Zhenyuan, CUI Mingshi, et al. Red ripe strawberry recognition and stem detection based on improved YOLO v8-Pose[J]. Transactions of the Chinese Society for Agricultural Machinery, 2023, 54(Supp.2):244-251. (in Chinese)

[13] YANG S, WANG W, GAO S, et al. Strawberry ripeness detection based on YOLOv8 algorithm fused with LW-Swin Transformer[J]. Computers and Electronics in Agriculture, 2023, 215:108360.

[14] DU X, CHENG H, MA Z, et al. DSW-YOLO: a detection method for ground-planted strawberry fruits under different occlusion levels[J]. Computers and Electronics in Agriculture, 2023, 214:108304.

[15] LU J, CHEN W, LAN Y, et al. Design of citrus peel defect and fruit morphology detection method based on machine vision[J]. Computers and Electronics in Agriculture, 2024, 219:108721.

[16] LU J, CHEN P, YU C, et al. Lightweight green citrus fruit detection method for practical environmental applications[J]. Computers and Electronics in Agriculture, 2023, 215:108205.

[17] 李丽,梁继元,张云峰,等.基于改进YOLO v5的复杂环境下柑橘目标精准检测与定位方法[J].农业机械学报,2024,55(8):280-290. LI Li, LIANG Jiyuan, ZHANG Yunfeng, et al. Accurate detection and localization method of citrus targets in complex environments based on improved YOLO v5[J]. Transactions of the Chinese Society for Agricultural Machinery, 2024, 55(8):280-290. (in Chinese)

[18] IGUEZ R, GUTIÉRREZ S, POBLETE-ECHEVERRA C, et al. Deep learning modelling for non-invasive grape bunch detection under diverse occlusion conditions[J]. Computers and Electronics in Agriculture, 2024, 226:109421.

[19] 肖伸平,赵倩颖,曾甲元,等.基于YOLO-DCL的复杂环境油茶果遮挡检测与计数研究[J].农业机械学报,2024,55(10):318-326,480.XIAO Shenping, ZHAO Qianying, ZENG Jiayuan, et al. Camellia oleifera fruits occlusion detection and counting in complex environments based on improved YOLO-DCL[J]. Transactions of the Chinese Society for Agricultural Machinery, 2024, 55(10):318-326, 480. (in Chinese)

[20] LI C, LIN J, LI Z, et al. An efficient detection method for litchi fruits in a natural environment based on improved YOLOv7-Litchi[J]. Computers and Electronics in Agriculture, 2024, 217:108605.

[21] ZHANG B, WANG Z, YE C, et al. Classification of infection grade for anthracnose in mango leaves under complex background based on CBAM-DBIRNet[J]. Expert Systems with Applications, 2025, 260:125343.

[22] WANG D, HE D. Channel pruned YOLO V5s-based deep learning approach for rapid and accurate apple fruitlet detection before fruit thinning[J]. Biosystems Engineering, 2021, 210:271-281.

[23] GAO W, ZONG C, WANG M, et al. Intelligent identification of rice leaf disease based on YOLO v5-Efficient[J]. Crop Protection, 2024, 183:106758.

[24] 廖娟,刘凯旋,杨玉青,等.基于RDN-YOLO的自然环境下水稻病害识别模型研究[J].农业机械学报,2024,55(8):233-242.LIAO Juan, LIU Kaixuan, YANG Yuqing, et al. Rice disease recognition in natural environment based on RDN-YOLO[J]. Transactions of the Chinese Society for Agricultural Machinery, 2024, 55(8):233-242. (in Chinese)

[25] WANG Q, CHEN B. A novel transfer learning model for the real-time concrete crack detection[J]. Knowledge-Based Systems, 2024, 301:112313.

[26] LI H, LI J, WEI H, et al. Slim-neck by GSConv: a lightweight-design for real-time detector architectures[J]. Journal of Real-Time Image Processing, 2024, 21(3):62.

[27] ZHANG X, LIU C, YANG D, et al. RFAConv: innovating spatial attention and standard convolutional operation[J]. Arxiv Preprint, arxiv:2304.03198, 2023.

[28] LI H, LI C, LI G, et al. A real-time table grape detection method based on improved YOLOv4-tiny network in complex background[J]. Biosystems Engineering, 2021, 212:347-359.

[29] WANG J, LIU M, DU Y, et al. PG-YOLO: an efficient detection algorithm for pomegranate before fruit thinning[J]. Engineering Applications of Artificial Intelligence, 2024, 134:108700.

[30] 李翠明,杨柯,申涛,等.基于改进Faster R-CNN的苹果采摘视觉定位与检测方法[J].农业机械学报,2024,55(1):47-54.LI Cuiming, YANG Ke, SHEN Tao, et al. Vision detection method for picking robots based on improved Faster R-CNN[J]. Transactions of the Chinese Society for Agricultural Machinery, 2024, 55(1):47-54. (in Chinese)

[31] HALDER S, ISLAM N, RAY B, et al. AI-based seagrass morphology measurement[J]. Journal of Environmental Management, 2024, 369:122246.

Identification Method for Cracked Mature Jujubes in Complex Environments Based on Lightweight GR-YOLO Model

WANG Lijun1 YANG Zhilei1 WANG Shuheng1 HUANG Wenyao1 GAO Yunpeng1 PU Wuxia2

(1.College of Engineering, Northeast Agricultural University, Harbin 150030, China2.College of Textile and Garment, Tarim Vocational and Technical College, Alar 843300, China)

Abstract:Aiming to solve the problem of low recognition accuracy of jujube fruits and poor ability to distinguish between normal and cracked fruits under various complex environmental conditions, such as different lighting, occlusion, weather conditions, and the presence of distant targets, field jujube images in natural environments were collected. Data augmentation was performed by simulating four weather conditions, and a dataset for model training, validation, and testing was created. Based on the YOLO v8n model, the GSConv and RFCAConv modules were incorporated to build the GR-YOLO model, which was then trained and tested on the jujube dataset. The experimental results showed that the GR-YOLO model achieved a precision of 95.14%, a recall of 97.71%, and a mean average precision (mAP) of 97.64%. The model size was 4.9 MB, the inference speed was 289.8 f/s, and the number of parameters was 2.38×106. Compared with models with the similar number of parameters, including YOLO v5n, YOLO v6n, YOLO v7-tiny, and YOLO v8n, the GR-YOLO model’s precision was improved by 1.82~2.61 percentages, recall was improved by 3.04~8.48 percentages, and mAP was improved by 2.40~7.88 percentages. Compared with existing mainstream models, the GR-YOLO model demonstrated optimal recognition performance and a lower number of parameters. The improved model not only increased the recognition accuracy of jujube targets but also effectively distinguished between normal fruits and cracked fruits, while achieving lightweight design.

Key words: jujube; fruit quality identification; complex environments; YOLO v8n; GR-YOLO

中图分类号:TP391.4; S24

文献标识码:A

文章编号:1000-1298(2026)07-0317-09

OSID:

doi:10.6041/j.issn.1000-1298.2026.07.029

收稿日期:2024-11-28 修回日期: 2025-02-18

基金项目:国家自然科学基金项目(52075091)

作者简介:王立军(1978—),女,教授,博士生导师,主要从事农业机械化和智能化研究,E-mail: wljszf@163.com