2023 춘계 공동학술대회(KIIE2023)-강지연

페이지 정보

profile_image
작성자 강지연
댓글 0건 조회 276회 작성일 23-06-05 21:05

본문

<학회 후기>
 6월 2일 (금)
F sessions 4차 산업혁명/산업인공지능 (15)
다중 해상도 앙상블 및 예측 코딩을 활용한 순환 오토인코더 기반의 다변량 시계열 이상치 탐지

본 발표에서는 다중 해상도 복원과 예측 코딩을 통해서 시계열 데이터에서 다양한 특징을 잘 추출하여 이상치 탐지 성능을 향상 시키기 위해 시계열 이상치 탐지 모델인 RAE-MEPC 모델을 제안하고 있다.
시계열 이상치 탐지는 크게 두 가지 분야로 나뉘는데 먼저 예측 기반 시계열 이상치 탐지가 있다. 이 분야는 과거의 데이터를 가지고 미래 데이터를 예측하는 과정을 통해서 정상 데이터가 어떤 패턴을 가지고 있는지 모델을 학습하여 정상 패턴을 학습한 모델이 이상패턴을 예측할 수 없다는 가정을 한다. 하지만 이 분야는 하나의 포인트에 대해서는 잘 탐지하지만, 연속적으로 발생하는 구간에 대해서는 어려움이 있다는 단점이 있다.

두 번째 분야는 복원 기반의 시계열 이상치 탐지이다. 이 접근은 정상 시계열 데이터에 대해서 입력 시계열 데이터를 그대로 잘 복원하는 과정을 통해서 정상 패턴을 학습하게 되는데, 예측 기반 방법론 보다는 이상 구간을 탐지하는데 효과적이지만 복원 과정 자체에서 정보 손실 발생 가능성이 높아 시계열 정보를 잘 보존하는 것이 중요하다.

따라서 본 발표에서는 다중 해상도 앙상블 인코딩과 디코딩을 기반으로 다양한 해상도에서 정상 데이터를 압축하고 복원하여 시계열 데이터의 광역정보와 지역 정보를 포함한 정상 패턴을 학습하여 정상 시계열에서 더 풍부한 데이터를 추출하게 함으로써 이상치 탐지 성능을 향상시키는 모델을 제안하였다.

다중 해상도 앙상블 인코딩이란 간단하게 말해서 다양한 해상도에서 시계열 데이터를 인코딩하는 것으로 input시계열 보다 짧은 길이의 데이터로 함께 인코딩하여 로컬한 정보 뿐만 아니라 글로벌 정보까지 함께 인코딩하게 하였다. 또, 디코딩은 각각 다른 길이의 디코딩을 진행하는 서브 디코더가 있으며 디코더의 정보를 고해상도의 디코딩에 직접적으로 활용하는 방법으로 글로벌 정보를 먼저 복원, 이 정보를 반영해서 로컬 정보를 복원하는 과정을 거친다. 각 인코더와 디코더는 모두 lstm구조로 구성되어 있으며 각 서브 디코더의 길이는 매칭이 되는 것끼리 동일하게 설정이 되어있다.

마지막으로, 분포 기반으로 이상치를 탐지하였으며 잔차의 평균과 분산을 추정하여 잔차의 분포를 가우시안 분포로 추정하였고, AUROC, F1-score, AUPRC 세 가지 평가지표 모두에서 비교 모델보다 좋은 성능을 보였다.

현재 시계열 예측 및 탐지 강의를 수강 중인데, 이론으로 강의를 들을 때보다 다양한 방면에서 활용되고 있는 모습을 직접 보니 새로운 아이디어를 얻을 수 있었고, multi resolution 앙상블 인코딩과 predictive 모델이라는 두 가지 요소를 적용하여 성능을 향상시켰다는 점에서 연구에 대한 관점을 넓히는 계기가 되었다.

댓글목록

등록된 댓글이 없습니다.