[20230616 통합 세미나] Random Dilated Shapelet Transform : A New Approach f…

페이지 정보

profile_image
작성자 정종민
댓글 0건 조회 447회 작성일 23-07-06 18:43

본문

[일시] 2023.06.16

[세미나 주제] Random Dilated Shapelet Transform : A New Approach for Time Series Shapelets

[요약]
Time-series classification을 위한 approach는 다양하지만, 본 논문은 1)accuracy 2)scalability 3)interpretability의 관점에서 아래의 3가지 approaches에 대해 설명한다.
 
1)Deep Learning approaches & meta-ensemble methods : accuracy가 높으나 scalability가 낮음
2)ROCKET(RandOm Convolutional KErnel Transform) : accuracy와 scalability가 높으나 interpretability가 낮음
3)Shapelet based algorithm : interpretability가 높아 산업 현장 내 time-series 분류 task에서 활용 빈도가 높으나, accuracy와 scalability가 낮음

본 논문은 기존 shapelet based algorithm의 높은 interpretability에 주목하며, accuracy와 scalability를 높이기 위한 strategy를 제시한다. 먼저 accuracy를 높이기 위해 dilation의 concept을 apply했다. 이를 통해 time-series의 non-continuous한 pattern까지 recognize할 수 있으며 이는 classification의 performance 향상으로 이어진다. 
그리고 Shapelet occurrence의 조절 변수 λ를 통해 최적의 dilated shapelets을 brute force하게 탐색하는 것은 computation cost가 높기에, random approach를 통해 scalability를 확보한다. 

[발표추가내용]
모든 shapelet based algorithm은 shapelet을 통한 feature추출 protocol이 distance function에 기반하는 것으로 동일하다. distance function을 통해 distance vector를 산출할 수 있는데 이 값은 시계열 'X'와 shapelet 'S'의 euclidean distance를 의미하며, 시계열 'X'의 i번째 index부터 양의 방향으로 1만큼 이동하며 길이가 l인 X의 subsequence와, 길이가 l인 S와의 distance를 구한다.
위에서 언급한 distance vector의 최소값이 산출되는 지점에서의 subsequence가 X의 shapelet이며 이를 LRS(Localized Random Shapelets)이라고 한다.
Q: Localized Random shapelet이 왜 random한 것인지?
A: LRS에 따르면 time-series에서 추출되는 shapelet은 uniform distribution을 따라 random하게 select되는데, 이는 다른 shapelet-based 알고리즘과는 달리 사전에 정해진 shapelet이나 특정 패턴을 따르는 것이 아니라, 무작위로 추출되는 shapelet을 사용하기에 random하다고 할 수 있다.

첨부파일

댓글목록

등록된 댓글이 없습니다.