코그넥스 블로그

제조환경에서 딥러닝 프로젝트를 시작하는 것 – 파트 2 데이터를 수집 및 정확성 검증

회사가 딥러닝 프로젝트팀을 구성한 뒤, 목표수립, 진행할 프로젝트를 선정한 후, 데이터 수집과 수집한 데이터의 정확성을 검증하기 위한 실측을 진행한다.

절대 및 상대 데이터

이 단계에서는 이미지(절대) 데이터와 프로세스(상대) 데이터라는 두 가지 유형의 데이터를 수집해야 합니다. 딥 러닝 팀이 수집한 이미지 데이터는 결함 및 합격/불합격 결정에 대한 신경망을 최적화하고 교육하는 데 도움이 됩니다. 신뢰할 수 있는 이미지를 취득하기 위해서는 무엇보다도 적절한 해상도의 카메라와 적절한 조명 설정을 선택하고 구성하는 것 중요합니다.
프로세스 데이터를 통하여 최적으로 효율화 된 딥러닝 기반의 시스템을 개발할 수 있습니다. 여기에는 폐기하거나 되 살리는 데에 드는 단위비용, 합격/불합격 빈도 및 다양한 결점 유형 별 발생 빈도에 대한 데이터가 포함될 수 있습니다. 딥러닝 팀은 정확성 검증 대한 딥러닝 시스템의 성능은 물론, 유관 검사와 같은 기존 솔루션의 정확성 검증도 해야 합니다.

지속적인 프로세스의 유지

딥러닝 프로젝트의 모든 단계는 일반적으로 지속적으로 수행되어저야 합니다. 이 작업에는 이미지 및 프로세스 데이터 수집, 트레이닝, 데이터 라벨링, 지속적인 최신 데이터 라벨링 등이 포함됩니다.

기업은 이미지의 결함에 관하여 일관되고 신뢰할 수 있는 라벨링을 할 수 있는 인력이 필요하므로 딥 러닝 모델은 고품질의 데이터를 트레이닝 합니다. 트레이닝 프로세스를 지속적으로 진행하면 팀은 정확한 데이터의 수집 및 로깅을 간소화할 수있습니다.

통계적 이상을 방지하기 위해 팀은 제품 변형, 구성 요소 변경, 장비 드리프트 및 도구 마모를 캡처하고 추적해야 합니다. 이와 함께 모든 이미지 라벨링은 독립적으로 측정 및 명확한 기준 수립을 통해 일관되고 편향되지 않아야 합니다. 제품 사양의 변경, 새 제품의 추가, 오래된 제품의 단종 등 변경사항이 생기면 팀은 이미지 라벨을 업데이트해야 합니다. 또한 팀은 시간이 지남에 따라 지속적으로 정보를 캡처할 수 있는 프로세스를 수립하여 문제가 발생했을 때 팀이 대응하고 문제를 수정할 수 있도록 해야 합니다.

딥러닝 팀은 트레이닝 과정에서 가짜 결함을 사용하는 것을 피해야합니다. 부품의 표시, 균열 또는 긁힘과 같은 가짜 결함은 실제 결점을 대표하지 못할 수 있으며 트레이닝 과정에 부정적인 영향을 미칠 수 있습니다. 예를 들어, 팀의 누군가가 테스트를 위해 부품 중간에 스크래치를 수동으로 추가하는 경우 시스템은 해당 영역에서만 결함을 찾기 시작합니다

정확성 검증

팀은 정확성검증을 위해 매뉴얼로 검사한 결과와의 비교등 몇가지 옵션이 있다. 이 방법에서, 데이터를 읽을 수도 있고 적용 될 수있습니다. 틸팅과 같은 특수한 취급이 필요한 부품 검사에 적용할 수 있는 유일한 옵션일 수 있습니다. 반면에, 결과는 시간이 지남에 따라 검사자에 따라 달라질 수있고, 일부 이해관계자는 현재 사용중인 시스템을 더 선호 할 수있습니다. 기업이 보다 정확한 기준선을 결정하기 위해 데이터 수집 및 큐레이션에 투자해야 하므로 이 방법은 시작점으로만 사용해야 합니다.

Knapp 테스트는 동일한 검사자 그룹을 여러 번 통과하여 알려진 여러 부분 <104/> 좋고 나쁨 <105/>을 실행함으로써 기업이 인간 품질 검사자의 등급을 매기는 데 도움이 될 수 있다. Knapp 테스트에서는 개별 검사자가 생산 부품과 혼합된 제어 부품을 여러 번 확인하고, 각 개인의 결과를 종합하여 합격/불합격 결과를 도출한다. 이 방법을 통해 기업은 어떤 결함 유형이 일관되게 포착되고 어떤 검사자가 가장 정확한지 확인할 수 있지만, 소규모의 데이터로 국한되어 버릴 수 있습니다. 또한 결점의 유형이나 분포는 비현실적일 수 있기 때문에, 대표적이지 않은 결과를 초래할 수 있습니다. 기업은 개별 검사자의 정확성과 반복성을 평가하고 현실적인 결함이 있는 이미지를 사용하여 알고리즘 트레이닝을 위한 초기 라벨이 지정된 데이터 세트를 생성해야 합니다.

방법 이점 제한 추천
매뉴얼 검사
  • 데이터가 존재하면 승인됨
  • 검사를 위해 특수한 취급 (틸팅등)이 필요한 부품에 유일한 옵션이 될 수있습니다.
  • 시간의 경과나 검사자의 변경에 따른 지속적으로 안정적인 데이터를 수집하지 못함
  • 많은 이해관계자들이 현 시스템을 더 선호하는 경향이 있습니다.
  • 매뉴얼 검사의 결과를 시작점으로
  • 데이터 수집에 투자 <111/> 보다 정확한 기준을 결정하기 위한 큐레이션
Knapp 테스트
  • 실내 제조 환경에서의 실제 데모 테스트
  • 그 어떤 단일 검사관 보다 우수한 판단
  • 일부 산업에서는 테스트가 실질적이지 못함
  • 소규모 데이터 세트로 제한 됨
  • 결과는 종종 대표성을 갖기 힘듦
  • <113/> 개별 검사자의 정확성 평가 <114/> 반복성
  • 신경망 훈련을 위한 초기 라벨링 데이터 생성
  • 생산 검증

마지막으로, 기업은 회사의 품질 표준에 대해 잘 알고 있는 신뢰할 수 있는 전문가를 한 명 이상 확보해야 합니다. 먼저, 팀은 수동 및 자동 검사를 모두 사용하여 생산 중에 이미지와 검사 결과를 기록합니다 그런 다음 전문가는 이미지에서 합격/불합격 판정을 안정적으로 내릴 수 있는지 확인하고 레이블링 팀의 이미지 품질 표준을 설정하는 데 도움을 주어 정확한 데이터만 딥 러닝 모델에 입력되도록 합니다.

스폿 용접을 위한 딥 러닝 소프트웨어와 인간 검사관 비교 다이어그램

이 예시에서는 신뢰할 수 있는 전문가를 사용하여 스폿 용접 검사 응용 프로그램에서 접지 진위를 확인합니다

그런 다음 수동 및 자동 육안 검사 결과를 비교할 수 있습니다. 결과가 일치하면 팀은 결정이 올바르고 이미지를 데이터 세트에 추가할 수 있다고 가정할 수 있습니다. 만약 결과가 다르다면, 전문가는 그 결과를 검토하고 어떻게 해야 할지를 결정합니다. 전문가는 실제 생산 조건에서 추출한 실제 샘플이미지를 기반으로 정확도 검증 데이터베이스를 구축하는데 도움이 됩니다. <129/>전문가는 결함분포, 수동 및 자동화된 검사 성과 데이터 등 신뢰할 수 있는 성능 통계를 작성하는 동시에 검사 프로세스를 개선할 수 있도록 지원합니다 전문가는 향후 자동화 프로젝트에도 재적용할 수 있는 데이터도 제공합니다. 결함을 찾기 위해 부품을 조작하거나 처리하면 오히려 좋지 않은 결과를 준다는 것을 명심하십시오. 이 방법의 또다른 단점은 단일의 의사 결정자에게 의존해야 한다는 것입니다.

파트 3에서, 효율화 단계에 대해 살펴보도록 하겠습니다.

Tags:

추가 게시물 -

제품 지원 및 교육 신청

MyCognex 가입

질문이 있으십니까?

전 세계 어디에서든 코그넥스 담당자들이 여러분의 비전과 산업용 바코드 판독 관련 문제를 지원합니다.

연락처