본문 바로가기

데이터사이언스/인공지능

머신러닝의 이상치 탐지 기법과 적용사례

이상치탐지(Anomaly Detection)란?

 - 데이터에서 예상과는 다른 패턴을 보이는 개체 또는 자료를 찾음

 - 학습데이터를 기반으로 기존 데이터들과는 다른 특성을 갖는 데이터를 찾는 모형을 만드는 방법임

 - 사이버보안, 의학분야, 금융분야, 행동패턴 분야 등 다양한 분야에 적용될 수 있음

 - 이상탐지는 종종 분류(Classification)문제와 혼동되는데 분류는 두 범주를 구분할 수 있는 경계면을 찾는 것

 - 이상탐지는 다수의 범주를 고려해서 이상치가 아닌 데이터들의 sector 를 구분짓는 것

 - 이상탐지는 크게 분류기반, NN기반, 군집화기반, 통계적 기법, 스펙트럴 기법 등으로 나뉜다.

 

이상치탐지기법 적용사례

 - 이상거래탐지: 신용, 카드, 보험과 같은 금융계에서 불법 및 악용 사례를 탐지

 - 침입 탐지 시스템: 컴퓨터 또는 네트워크 시스템에 대한 원치 않은 조작을 탐지

 - 설비 예지 보전: 설비가 고장나기 전 이상 신호를 탐지

 - 고객이탈: 제품 또는 서비스에서 구매와 사용을 중지하는 고객을 분석하는 분야

 

분류와 이상치 탐지의 차이

 - 분류는 가르는 영역을 만듦, 즉 경계면을 찾는 것

 - 이상치 탐지는 기본적으로 정상 데이터가 비정상 데이터보다 훨씬 더 많다는 것을 가정하고있다.

 - 이상치 탐지는 다수 범주 데이터만 가지고 접근을 함 이상치가 아닌 데이터들의 영역을 칠해주는 것

 - 예를들어 100만건 중 3건이 불량이라면 분류로는 접근이 불가능하고 이상치 탐지 기법으로 접근가능

분류와 이상치 탐지 비교

 

 

 

 

 

 

참고:

1. https://nanunzoey.tistory.com/entry/%EC%9D%B4%EC%83%81-%ED%83%90%EC%A7%80Anomaly-Detection-%EA%B8%B0%EB%B2%95%EC%9D%98-%EC%A2%85%EB%A5%98

2. https://velog.io/@vvakki_/Anomaly-Detection%EC%9D%B4%EC%83%81%EC%B9%98-%ED%83%90%EC%A7%80%EB%9E%80

3.https://jayhey.github.io/novelty%20detection/2017/10/18/Novelty_detection_overview/

 

Anomaly Detection(이상치 탐지)란?

[Post No.001] Anomaly Detection란?

velog.io

 

머신러닝 기반 이상 탐지(Anomaly Detection) 기법의 종류

이상 탐지(Anomaly Detection)란, 데이터에서 예상과는 다른 패턴을 보이는 개체 또는 자료를 찾는 것을 말한다. 즉 학습 데이터를 기반으로 기존 데이터들과는 다른 특성을 갖는 데이터를 찾는 모형

nanunzoey.tistory.com