코그넥스 블로그

보다 나은 애플리케이션 성공을 위해 5가지 핵심 딥러닝 분류 척도를 이해합니다

제품 품질은 대부분의 업체에서 가장 중요한 목표입니다 정확한 제품을 제공할 때 고객의 신뢰를 얻고, 긍정적인 피드백을 확보할 수 있으며, 고가의 비용이 드는 리콜을 줄이고, 궁극적으로 보다 나은 비즈니스 결과를 창출할 수 있습니다. 공장 또는 생산 라인의 각 생산 단계에서 머신 비전 시스템을 이용하는 것은 우수한 품질의 제품을 공급할 수 있는 가장 훌륭한 투자 계획 중 하나입니다. 특히, 분류장치와 같은 딥러닝 툴은 제조업체가 생산 라인에서 잠재적인 품질 관리 문제를 파악해 완성된 제품에서 전체적인 결점을 제한, 관리하는 데 도움을 줍니다.

이 분류장치는 단순히 생산 라인에서 결함이 있거나 손상된 부품을 식별해 생산에서 제거하는 것만으로 충분하지 않기 때문에 중요한 검사 툴입니다. 또한 검사 시스템이 패턴을 식별해 한 가지 결함이 긁힘 인지, 다른 결함은 흠집인지 등을 판별할 수 있도록 이러한 결함을 반드시 분류해야 합니다. 생산 결함의 올바른 분류는 시장에 불량 제품이 유입되는 것을 방지하는 동시에, 잘못된 `예측으로 정상 제품의 출하를 중지하거나 생산을 중단시켜 비용을 가중시키는 일을 미연에 차단할 수 있습니다.

빅데이터가 프로세스와 품질 관리에 결정적인 요인으로 작용하는 인더스트리 4.0 환경에서는, 이 데이터로부터 올바른 척도를 확보함으로써 조직이 딥러닝 분류 검사를 최적으로 수행하고 있는 것인지를 파악할 수 있습니다. 분류 분야는 4가지 주요 결과에 중점을 두어 이 데이터를 생성합니다.

  • 진짜 양품: 실지 검증 정보가 긍정이고 예측 클래스 또한 긍정입니다.
  • 거짓 양품: 실지 검증 정보가 부정이고 예측 클래스가 긍정입니다.
  • 진짜 불량품: 실지 검증 정보가 부정이고 예측 클래스가 부정입니다.
  • 거짓 불량품: 실지 검증 정보가 긍정이고 예측 클래스가 부정입니다.

실지 검증 정보는 자동차 범퍼에서 흠집을 식별하는 것과 같이 실제적인 검사 결과입니다. 개발자와 엔지니어는 딥러닝 애플리케이션을 연마해 예를 들어 실제 부품에서 발견된 실제 결함과 일치시키기 위해 결함을 올바로 예측하여 분류하길 원합니다.

분류 애플리케이션의 성공을 측정하기 위해 조직에서 사용할 수 있는 수많은 척도들이 존재하지만, 여기서는 그 중 5가지를 살펴봅니다.

정확도 및 오차율

딥러닝 애플리케이션 제작에서 가장 흔하게 사용되는 척도는 분류 정확도로, 단일 수치로 기본적인 메시지를 전달하는 데 있어 간단하고 효과적이기 때문입니다. 오차율은 정확도를 훌륭하게 보완해주는 역할을 합니다.

이 두 가지는 딥러닝 애플리케이션의 필수적인 효과를 식별하기 때문에 가장 기초적인 척도입니다.

딥러닝 검사에서 정확도 측정을 위한 공식

측정 정확도는 비교적 간단합니다. 즉, 정확한 예측 수를 수행한 총 예측 수로 나눈 값입니다. 오차율은 틀린 예측 수를 총 예측 수로 나눈 수치입니다.

분류 애플리케이션에서는 정확한 예측에 모든 진짜 양품과 진짜 불량품 결과가 포함된다는 점을 주목해 볼만합니다.

탈출 비율

딥러닝 검사에서 탈출 비율 측정을 위한 공식

결함 있는 부품을 양품으로 잘못 예측하는 분류 애플리케이션을 탈출이라고 합니다. 손상되거나 결함 있는 제품이 발견되지 않은 상태로 시장으로 ”탈출(유입)“ 될 경우, 양질품에 대해 회사의 평판을 저해할 위험이 있습니다. 또한 이처럼 탈출한 제품으로 인한 리콜은 수백만 달러의 비용을 초래할 수 있습니다.

탈출 비율은 거짓 불량품 수를 총 예측 수로 나눈 값으로 측정됩니다.

오버킬 비율

딥러닝 검사에서 오버킬 비율 측정을 위한 공식

거짓 양품 예측을 생성하는 분류 애플리케이션은 오버킬을 생성합니다. 즉, 실수로 결함 없는 양호한 제품 또는 부품을 생산 라인에서 제거함을 의미합니다. 라인에서 제거된 결함 없는 부품은 결국 폐기물로 버려지거나 수작업을 통해 재작업이 수반될 수 있습니다. 어떤 결과든 제조업체는 부품과 노동력에 추가적인 비용을 지불하게 됩니다.

오버킬 비율은 거짓 양품 수를 총 예측 수로 나눈 값으로 측정됩니다.

정밀도

딥러닝 검사에서 정밀도 측정을 위한 공식

정밀도는 양품 예측 비율이 정확한가에 대한 질문을 답해줍니다. 즉, 거짓 양품에 영향을 주지 않으면서 올바른 클래스를 예측하는 분류 애플리케이션입니다.

1 값은 분류 모델이 올바른 클래스를 예측하는 데 매우 효과적이며, 0% 오버킬을 달성함을 나타냅니다. 0 값은 모델이 기대되는 기능을 수행할 수 없음을 나타냅니다.

F1-점수

딥러닝 검사에서 F1 점수 측정을 위한 공식

F1-점수는 정밀도와 리콜의 조화 평균으로 정의됩니다. 즉, 테스트의 정확도를 측정하는 것입니다. 가능한 최고 값은 1인데, 완벽한 정밀도와 리콜을 나타냅니다.

이전에 언급한 바와 같이, 정밀도는 올바로 식별된 양품 결과 수를 올바로 식별되지 않은 결과를 포함한 모든 양품 결과 수로 나눈 값입니다. 리콜은 올바로 식별된 결과 수를 양품으로 식별되었어야 하는 모든 샘플 수로 나눈 값입니다.

그리고 나서 F1-점수는 분류 애플리케이션으로 생성된 정확한 예측 비율입니다.

중요 사항 측정

이들 예시는 단순성 면에서 가장 기초적인 요소로 여겨져 왔습니다. 실제 환경에서 딥러닝 알고리즘은 6가지 이상의 분류를 포함할 수 있습니다. 따라서 훨씬 더 정교한 오분류 매트릭스가 나타납니다. 또한 예를 들어, 학습 알고리즘의 리콜 및 정확도를 평가하기 위해 보다 복잡한 공식이 존재할 수 있습니다.

궁극적으로 이러한 분류 척도를 바탕으로 업체들은 성공의 기준선을 마련하고, 학교에서 교사들이 학생들의 등급을 매기는 것처럼 채점 메커니즘을 적용할 수 있습니다. 시간에 따라 딥러닝 개발자들은 이러한 척도를 활용해 애플리케이션을 보다 세부적으로 조정하고, 효과적이거나 효과적이지 못한 방법에 대해 훨씬 더 정확한 평가를 도출할 수 있습니다.

산업 자동화 측면에서 제조업체는 자신이 구축한 애플리케이션과 관련해서 효과적이거나 효과적이지 못한 요소를 파악해야 합니다. 중점을 두어야 할 척도의 선택은 각 조직의 독자적인 생산 라인, 해결하고자 하는 문제 그리고 가장 중요한 비즈니스 결과에 따라 좌우됩니다.

추가 게시물 -

제품 지원 및 교육 신청

MyCognex 가입

질문이 있으십니까?

전 세계 어디에서든 코그넥스 담당자들이 여러분의 비전과 산업용 바코드 판독 관련 문제를 지원합니다.

연락처