采集的齿轮图像数据来自某汽车齿轮生产公司,经过上述设计的图像采集硬件设备拍摄得到。齿轮端面共采集2675张图像数据,其中包含346张并不存在缺陷的齿轮端面负样本数据,剩余2329张图像则是含有端面缺陷的正样本。在实际工业齿轮端面的缺陷检测中,主要是检测齿轮有无倒角,磕碰、黑皮等缺陷问题很少会出现在齿轮的端面上;齿轮齿面共采集6763张图像数据,其中包含1337张并不存在缺陷的齿轮齿面负样本数据,剩余5426张图像则是含有齿面缺陷的正样本数据。
在收集并统计齿轮图像数据后,需要对数据集进行筛选剔除和适当的处理工作。对于含有缺陷的正样本数据来说,首先需要将由于曝光度不足而导致图像偏暗的数据进行剔除。如下图,此类图像数据由于曝光度不足,导致缺陷特征不明显难以进行后续的数据标注工作。
如下图,该类图像数据由于缺陷的边缘特征不明显,难以与周围背景区域进行明显的区分,将此类图像加入数据集会造成一定程度的干扰,导致YOLOv8s算法模型难以准确的进行缺陷特征的学习,提升算法缺陷识别的难度。
如下图,此类数据缺陷的信息占比过少而无用的信息占比过多,不仅会形成干扰而且会影响算法的检测速度,此类问题在磕碰类的缺陷数据尤为明显,因此对无用的背景信息过多的图像进行了适当的裁剪。同时对于无缺陷的负样本数据,并未选择全部丢弃,而是选取一部分清晰、明显、干净的数据加入数据集中。
在经过数据筛选操作后,齿轮端面的数据集共有2348张图像数据,其中包含2126张包含缺陷的正样本数据和222张不包含缺陷的负样本数据。齿轮齿面的数据集共有6215张图像数据,其中包含5138张图像则是含有齿面缺陷的正样本数据和1077张并不存在缺陷的负样本数据。
来源:人工智能感知信息处理算法研究院
注:文章版权归原作者所有,本文仅供交流学习之用,如涉及版权等问题,请您告知,我们将及时处理。