3D-ADAM: A Dataset for 3D Anomaly Detection in Advanced Manufacturing

作者:Paul McHard et.al.

论文链接:http://arxiv.org/abs/2507.07838

发布日期:2025-07-10

解读时间:2025-07-19 19:02:38

论文摘要

Surface defects are one of the largest contributors to low yield in the manufacturing sector. Accurate and reliable detection of defects during the manufacturing process is therefore of great value across the sector. State-of-the-art approaches to automated defect detection yield impressive performance on current datasets, yet still fall short in real-world manufacturing settings and developing improved methods relies on large datasets representative of real-world scenarios. Unfortunately, high-quality, high-precision RGB+3D industrial anomaly detection datasets are scarce, and typically do not reflect real-world industrial deployment scenarios. To address this, we introduce 3D-ADAM, the first large-scale industry-relevant dataset for high-precision 3D Anomaly Detection. 3D-ADAM comprises 14,120 high-resolution scans across 217 unique parts, captured using 4 industrial depth imaging sensors. It includes 27,346 annotated defect instances from 12 categories, covering the breadth of industrial surface defects. 3D-ADAM uniquely captures an additional 8,110 annotations of machine element features, spanning the range of relevant mechanical design form factors. Unlike existing datasets, 3D-ADAM is captured in a real industrial environment with variations in part position and orientation, camera positioning, ambient lighting conditions, as well as partial occlusions. Our evaluation of SOTA models across various RGB+3D anomaly detection tasks demonstrates the significant challenge this dataset presents to current approaches. We further validated the industrial relevance and quality of the dataset through an expert labelling survey conducted by industry partners. By providing this challenging benchmark, 3D-ADAM aims to accelerate the development of robust 3D Anomaly Detection models capable of meeting the demands of modern manufacturing environments.

AI解读

好的,我们来详细分析这篇关于3D-ADAM数据集的论文。

1. 核心方法与创新点

核心方法论:

这篇论文的核心是创建了一个新的、大规模的、工业相关的3D异常检测数据集,名为3D-ADAM。这个数据集旨在解决当前工业界在3D异常检测领域面临的挑战,即现有数据集的代表性不足,无法满足实际应用的需求。

主要创新点:

* 大规模与高质量: 3D-ADAM数据集包含了14,120个高分辨率的扫描数据,覆盖了217个独特的零件,使用了4个工业级的深度成像传感器。数据量远大于之前的数据集,例如MVTEC 3D-AD。
* 工业相关性: 数据集是在真实的工业环境中捕获的,考虑了零件位置和方向的变化、相机位置、环境光照条件以及局部遮挡等因素。这使得数据集更贴近实际工业场景,解决了之前数据集过于理想化的问题。
* 全面的异常类别: 包含了12个类别的工业表面缺陷,共计27,346个标注的缺陷实例。这些缺陷类别涵盖了工业生产中常见的各种表面缺陷类型(cuts, bulges, holes, gaps, burrs, cracks, scratches, marks, warping, roughness and, specific to the additive manufacturing process employed in producing this dataset, over extrusion and under extrusion defects)。
* 机器元素特征标注: 额外标注了8,110个机器元素特征,覆盖了16种相关的机械设计形式因素(faces and edges, internal and external fillets, internal and external chamfers, holes, kerfs, tapers, indents, counterbores, countersinks as well as the most common gear types; spur gear teeth, rack gear teeth, spiral gear teeth and both clockwise and counter-clockwise helical gear teeth)。这是其他数据集所没有的,有助于模型学习缺陷与零件几何特征之间的关系。
* 多相机,多模态数据: 数据集使用了多种不同的工业级3D传感器,提供RGB+3D数据,并对数据质量和成本进行了考量。使得模型能够更好地适应不同的传感器和光照条件。
* 行业专家验证: 通过行业专家进行的标注调查验证了数据集的工业相关性和标注质量,保证了数据集的可靠性。

技术亮点:

* 真实工业环境数据采集
* 多模态数据融合
* 细粒度的缺陷和机械元素标注

与现有方法的区别:

* 现有数据集(如MVTec 3D-AD、Eyecandies、Real3D-AD)在规模、缺陷类别、工业相关性等方面存在局限性。3D-ADAM试图解决这些问题,提供更具挑战性和实用性的数据集。

2. 算法细节与流程

这篇论文的核心贡献在于数据集的构建,而不是提出新的异常检测算法。因此,这里主要介绍数据集的构建流程,以及论文中用于评估数据集的基线模型的流程。

数据集构建流程:

1. 零件选择与制造:
* 基于开源的BCN3D-Moveo机器人手臂系统,并从Thingi10K数据集中添加了额外的组件,以确保覆盖所有相关的机器元素。
* 使用熔融沉积建模(FDM)技术,采用PLA材料制造零件。
* 通过调整打印参数或手动干预,创建缺陷零件。
2. 数据采集:
* 使用4个工业级3D传感器(MechMind LSR-L, MechMind Nano, Stereolabs Zed 2i, and Intel Realsense)采集数据。
* 传感器安装在ABB IRB 120机器人手臂上,或固定在单元格外部。
* 通过旋转零件,从多个角度进行扫描。
* 捕获六通道图像,包括RGB颜色信息和XYZ坐标信息,保存为PLY文件(点云)和PNG文件(RGB图像)。
3. 数据标注:
* 使用半自动分割方法(基于Cutie)创建零件前景掩码。
* 人工标注缺陷分割掩码和机器元素边界框,由专家完成,保证质量。
* 使用单应变换将标注从高精度传感器(MechMind Nano)传播到其他传感器的数据。
4. 数据集划分:
* 将数据集划分为三个集合:无缺陷训练集、缺陷测试集和验证集(60:40)。

基线模型评估流程:

1. 模型选择:
* 选择四个当前领先的或最近领先的3D和RGB+3D异常检测和分割任务的模型:Transfusion,CPMF,3DSR和Shape-Guided。
2. 模型训练:
* 使用无缺陷的训练集来训练模型。
3. 模型测试:
* 使用测试集和验证集来评估模型在3D异常检测和定位任务上的性能。
4. 性能评估:
* 使用Area Under Receiver Operator Curve (AUROC)指标评估图像级别的异常检测性能。
* 使用Area Under Per Region Overlap (AUPRO)指标评估像素级别的异常定位性能。

3. 详细解读论文第三部分

论文的第三部分详细介绍了3D-ADAM数据集的构建细节。下面是详细解读:

* 材料与制造:论文强调,使用熔融沉积建模(FDM)增材制造方式以及PLA材料,是因为这是工业界广泛应用的材料与工艺,与数据集的工业相关性相呼应。论文中提到了采用多个3D打印系统,包括Prusa i3、Ender 3 Pro和Ultimaker 2。良好样本通过优化设置打印,而缺陷样本则通过调整系统设置、手动干预等方式随机均匀地在这些系统上产生。
* 传感器配置:论文选择了多种传感器,旨在覆盖工业视觉中部署的不同技术。传感器在质量、成本、捕获分辨率和深度传感技术上各不相同。论文提到,使用ABB IRB 120机械臂来移动传感器,MechMind LSR-L固定。这么做的目的是保证所有传感器都在其最佳扫描范围内。
* 扫描过程: 扫描过程中,零件通过夹具进行2轴旋转,实现360度的旋转。作者特别提到,在需要更全面的覆盖时,会调整二级轴的位置以获得完整的视图。
* 数据格式:论文中明确,传感器捕获的是6通道图像,包括R,G,B,X,Y,Z信息,保存为.PLY(点云)和.PNG(RGB图像)。XYZ代表传感器局部坐标系下的3D点云。

论文第三部分虽然没有大量的公式推导,但它详细地描述了实验设置、数据采集和预处理过程。

4. 实现细节与注意事项

由于该论文的主要贡献是数据集,而不是算法,因此这里的实现细节和注意事项主要集中在如何使用该数据集以及可能遇到的问题。

使用数据集的注意事项:

* 数据格式理解: 务必理解.PLY文件(点云数据)和PNG文件(RGB图像)的对应关系。
* 数据预处理: 根据具体算法的需求,可能需要进行点云配准、降噪、归一化等预处理步骤。
* 硬件要求: 处理大规模点云数据可能需要高性能的计算资源(CPU、GPU、内存)。
* 评估指标选择: 根据任务目标选择合适的评估指标(如AUROC、AUPRO)。
* 数据集划分: 可以根据需要调整训练集、测试集和验证集的划分比例。
* 领域适应: 考虑到数据集是在特定工业环境下采集的,在应用到其他场景时可能需要进行领域适应。

优化建议和最佳实践:

* 数据增强: 尝试使用数据增强技术(如随机旋转、缩放、平移)来增加模型的鲁棒性。
* 多模态融合: 探索不同的RGB和3D数据融合方法。
* 迁移学习: 可以尝试使用在其他数据集上预训练的模型,然后在3D-ADAM数据集上进行微调。
* 结合领域知识: 结合机械设计和制造工艺的知识,可以设计更有效的特征和模型。

参数设置和调优方法:

* 由于数据集本身不涉及具体的算法参数,这里的参数主要是指在使用数据集进行模型训练时,模型本身的参数。
* 可以使用常见的超参数搜索方法(如Grid Search、Random Search、贝叶斯优化)来调整模型的参数。
* 关注训练过程中的loss曲线和验证集上的性能指标,及时调整学习率、batch size等参数。

希望这个详细分析能够帮助你更好地理解这篇论文。
返回论文列表