[20230113 통합세미나] N-Beats+N-hits

페이지 정보

profile_image
작성자 오수빈
댓글 3건 조회 564회 작성일 23-01-17 10:57

본문

2023.01.13

제목: N-BEATS: NEURAL BASIS EXPANSION ANALYSIS FOR INTERPRETABLE TIME SERIES FORECASTING / N-HiTS: Neural Hierarchical Interpolation for Time Series Forecasting

요약: 절삭계수 프로젝트를 진행할 때 주어진 데이터에 대한 시계열 특성을 반영하기 위한 모델 적용이 필요했으며 본 발표에서 위의 두 논문을 리뷰하며 해당 프로젝트에 참고할 시계열 데이터의 특성을 더 반영헐 수 있는 딥러닝 아키텍쳐인 N-Beats와 N-Hits에 대한 소개한다.

후기: n-beats와 n-hits에 대해서 계산적 효율의 차이가 나타나는 이유에 대해서 제대로 설명하지 못해 추가적으로 설명을 드립니다. n-hits는 이전 모델과 다르게 Multi-rate sampling과 Hierarchical Interpolation 두가지 특징을 추가함으로써 계산적 효율을 높일 수 있습니다. Multi-rate sampling 단계에서는 각 block에서 주어진 데이터에 대한 sampling rate를 주어 분해하는 과정을 거치고 예측값을 Hierarchical Interpolation 방법을 통해 합하여 output을 도출하게 됩니다. 위의 특성으로 계산 효율성을 높이게 되고, Max pooling에 대해서는 muti-rate sampling을 위해 사용한 방법 중 하나라고 보시면 됩니다.

발표 링크:
https://us02web.zoom.us/rec/share/elpqj0d1xH5WSFvSukycgY0jG8yCJ2z_HzwCg67wm2BP1WUg2KDBcwGObrOZXHl9.VJ8XU_e_zebguhcO

첨부파일

댓글목록

profile_image

이상민님의 댓글

이상민 작성일

금일 세미나는 오수빈 연구원이 단변량 시계열 예측에 활용할 수 있는 두가지 알고리즘을 소개하였다. 본인이 연구 중인 CNC 설비의 절삭계수 추정을 위한 강화학습 연구 시 시계열적 패턴을 고려하기 위함이라고 시계열 예측 모델을 발표하게된 배경을 잘 설명해주었다. 소개한 알고리즘은 N-Beats와 N-Hits의 두가지 알고리즘으로, 둘 다 딥러닝 기반의 시계열 예측 모델임에도 intuitive approach로 block과 stack을 반복하여 쌓음으로써, 점진적으로 잔차(실제값과 예측값 차이)를 줄여감으로써 선형적인 조합으로 이해하기 쉬운 모델 구조를 갖고 있었다. weak learner를 반복적으로 사용하여 잔차를 점차 줄여가는 boosting 의 시계열 버전이라고 이해하면 쉽다. 특히, 시계열의 frequency 특징을 개별 block, stack이 담당하여 분해(decomposition)하듯 학습한다. 대다수의 시계열 모델에서 RNN 구조나 Attention, 또는 Transformer 모델이 주요한 최근 상황에서 순수 MLP 만의 구조를 갖는다는데 많은 학자들이 열광하는듯 하다. 전체 구조적 특징은 다음과 같다. 초기 block에서는 저주파 패턴(상대적으로 맞추기 쉽고 단일한 패턴)을 적합시킨다. 이후 block에서는 상대적으로 고주파에 가까운 패턴들을 차례로 적합시킨다. 전통적인 시계열 모델(conventional time series model)에서 trend, cycle, seasonality 등의 패턴으로 분해하는 것에 비교할 수 있다. 개별 block에서는 전 시점의 시계열 데이터를 적합시키는 서브 네트워크와 미래 시점의 시계열을 적합시키는 서브 네트워크 두가지로 나뉘어지는데, 과거 시점을 적합시키는 것은 잔차를 줄여가는 선형조합 계산하고 점진적으로 역전파를 통해 파라미터를 업데이트 하게 된다. N-Hits는 N-Beats의 다음 버전인데, multi-rate data sampling과 linear interpolation 기법을 통해서 더 적은 파라미터 수만으로 장기간(수백 time step)의 시계열 패턴을 예측할 수 있도록 해준다. 둘 다 좋은 기법의 계보라고 생각하며, 시계열 예측 시 연구실 구성원들이 잘 활용하기를 바란다.

수빈이는 아직 연구참여생이나 1년 넘게 연구실 활동을 하다보니 누구보다 연구 잔뼈(?)가 굵다. 특히, 발표를 할 때는 본인의 스토리라인을 어떻게 풀어갈지 잘 이해한듯 싶으며, 질문을 받는 태도도 좋고 매끄럽게 디펜스하여 쉽게 당황해하지 않는다. 앞으로 개인 연구의 깊이와 함께 더욱 좋은 학술 발표 및 집필을 해나가길 바란다. 세미나 발표 시 보충하기로 해준 N-Beats, N-Hits의 기법적 특징에 대해서는 재차 요약해주기를 바란다.

profile_image

강민정님의 댓글

강민정 작성일

CNC 절삭 계수 프로젝트 시 생산 효율 및 품질 향상을 위해 절삭공구를 제어하고자 강화학습을 적용하여 연구를 수행하고 있다. 시간이 지날수록 절삭 공구의 마모도의 증가로 공구에 가해지는 힘이 이전 대비 증가하게 된다.
이번 세미나에서는 보다 정확한 강화학습 모델 구축을 위해 시계열적 패턴을 반영하고자 time series forecasting 관련 두 가지 논문에 대해 진행되었다. N-hits는 선행 연구에 해당하는 N-Beats가 가지는 한계점을 보완한 방법이다. 단순한 MLP layer만으로 구성되어 있음에도 불구하고 multi-rate data sampling, hierarchical interpolation을 적용하여 기존의 N-beats 대비 계산 비용, 메모리, 성능 등에서 개선된 모델이다. 특히, seosonal stack과 trend stack을 통해 attention 구조를 사용하고 있지 않음에도 불구하고 계절성과 트렌드에 대한 해석력을 제공한다는 점이 주요한 특징이다. 현재 진행하고 있는 절삭 계수 추정 시 n-hits를 적용하면 절삭 공구 마모도의 시계열적 패턴을 반영할 수 있을 것 같다.

profile_image

이유진님의 댓글

이유진 작성일

절삭계수 프로젝트의 큰 목표는 공구 마모로 인한 절삭력 변화를 예측하여 동적으로 절삭 가공 공구를 제어하고 이를 통해 공구의 수명 예측하는 것이다. 시간이 지나면서 절삭 공구 마모에 영향을 미치는 데, 중요한 부분은 점점 시간이 지날 수록 힘이 더 들어가는 시계열적인 특성을 가지고 있었다는 점이다. 이러한 시계열적인 특성을 반영하기 위해 본 세미나에서는 N-Beats와 N-Hits를 소개하였다. N-beats는 시계열 데이터를 위한 딥러닝 아키텍쳐로 해석가능한 딥러닝 모델 구조를 가지고 있다. N-Beats 다음으로 등장한 것이 N-Hits이다. N-Hits는 N-Beats의 단점을 보완하여 나온 모델로 multi-rate data sampling과 linear interpolation을 적용해 계산 비용을 낮추고, 예측 변동성에 강하다는 특징이 존재한다. N-hits는 다양한 방식을 사용해 시계열적인 특징을 잘 잡아내는 방법으로 효과적일 것 같다.