2023 하계 데이터마이닝학회(KDMS2023)-강민정
페이지 정보
본문
<발표 후기>
6월 23일 (금)
세션 : A-3 헬스케어
제목 : 구조 보존에 강건한 병리학 이미지 tranlsation을 위한 stain normalization 기법
오랜 기간 연구실에서 진행하고 있는 병리학 연구에 참여하게 되면서 관련한 첫 번째 학술 대회 발표였다. 그동안은 제조, concept drift와 같은 분야의 발표를 주로 했었는데 병리와 이미지 데이터 분야는 처음이라 연구하면서도 새로웠다. 그동안 매주 병리 미팅을 진행하면서 읽었던 많은 논문들과 공유했던 진행 상황들이 이번 학회를 준비하는데 있어서 많은 도움이 되었다. 갑작스럽게 주제를 정하고 촉박하게 실험을 진행하는 것이 아니라 꽤 오랫동안 관련되어 고민하였던 stain normalization 기법이라 후에도 좋은 자양분이 될 것 같다. 현재까지는 사람들이 stain noramlization의 필요성에 대해 깊게 공감하기는 어렵다는 생각이 들었지만 그럼에도 불구하고 나만의 좋은 스토리라인을 가지고 사람들을 설득해야 함을 다시 한 번 느꼈다.
<학회 후기>
6월 23일 (금)
세션 : B-3 Deep Learning with Uncertainty
제목 : 회귀 문제를 위한 불확실성 기반 준지도학습
의료(병리 세포 이미지)등의 특수 분야에서는 데이터 수집 시 전문가 지식이 필요하기 때문에 레이블 데이터 부족 및 수집의 어렵다는 문제점이 존재한다. 입력 데이터 수집은 상대적으로 쉽기 때문에 unlabeled 데이터와 적은 레이블 데이터를 함께 사용하는 기법이 연구되고 있다. 본 연구에서도 준지도학습 활용하여 신뢰할 수 있는 unlabed 데이터에 레이블을 부여하는 수도 레이블링을 적용했다. 또한 consistency regularization은 대부분 분류 문제에 특화되어 있다는 한계점이 존재하여 회귀에 적용해보고자 했다. 특히 label 데이터와 unlabel 데이터 사이의 유사도를 통해 정확한 수도 레이블링이 가능하도록 하였다. 회귀 문제를 위한 수도 레이블링을 생성하고 믿을 수 있는 수도 레이블 선택하는 것이 본 연구의 목적으로 레이블 데이터, strong augmentation, weak augmentation의 표현 벡터를 각각 산출해서 예측 값의 신뢰도가 높은 경우에만 수도 레이블로 사용하였다. 또한, 예측 값에 대한 mc dropout 분산을 불확실성으로 활용하여 불확실성이 임계치 값이 작은 경우에만 적용하였다. 해당 임계치는 iteration별 불확실성 상위 k% 미만의 값을 사용하였으며 특히 첫 iteration의 임계값은 임의로 크게 설정하여 적절한 임계값 선정이 가능하도록 설계하였다.
6월 23일 (금)
세션 : B-3 Deep Learning with Uncertainty
제목 : 리튬 이온 배터리 잔존 수명 예측을 위한 Test-Time Augmentation 기반 도메인 불확실성 추정
대부분 배터리 상태 진단 연구에서 활용한 딥러닝 기반 모델은 예측 시 과도한 확신을 가지는 경향이 존재한다. 배터리가 사용되는 환경이 변화함에 따라 그를 반영하는 domain uncertainty를 새롭게 정의하는 것이 필요하다. 실제 환경에서는 온도, 조도, 습도 등의 외부 환경 요인의 변화에 민감하며 학습 분포와 입력 값의 분포 차이로 발생하는 도메인 변화를 indomain uncertainty와 domain shift uncertainty를 정의한다. Domain shift는 데이터가 많아져도 해결하지 못하는 데이터 불확실성과 모델이 학습을 제대로 하지 못한 모델 불확실성이 존재한다. 본 연구에서는 계산 효율적이며 외부 환경 변화를 반영할 수 있는 불확실성 도출 방법을 제안하였다. 이를 위해 temporal convolutional network-AutoEncoder(TCN-AE)를 back-bone으로 하여 오토인코더 사전학습을 거친 후에 fine tuning을 거친 모델을 최종 상태 진단 모델로 활용하였다. 또한 사전 학습된 회귀 모델에 추론 과정 증강 기법을 적용하여 예측값과의 불확실성을 도출하여 도매인 내 불확실성과 도메인 변화 불확실성을 파악하고자 하였다. 특히 본 연구에서는 leave-one-domain-out을 적용하여 온도별 주행 환경에 대한 domain shift 시나리오를 개별 설정하여 성능차이가 가장 큰 데이터에 대해 성질이 다른 특성을 가질 것으로 유추하였으며 domain 내 불확실성 및 도메인 변화 불확실성에 대해 정량적으로 평가한 점이 인상 깊었다.
6월 23일 (금)
세션 : A-3 헬스케어
제목 : 구조 보존에 강건한 병리학 이미지 tranlsation을 위한 stain normalization 기법
오랜 기간 연구실에서 진행하고 있는 병리학 연구에 참여하게 되면서 관련한 첫 번째 학술 대회 발표였다. 그동안은 제조, concept drift와 같은 분야의 발표를 주로 했었는데 병리와 이미지 데이터 분야는 처음이라 연구하면서도 새로웠다. 그동안 매주 병리 미팅을 진행하면서 읽었던 많은 논문들과 공유했던 진행 상황들이 이번 학회를 준비하는데 있어서 많은 도움이 되었다. 갑작스럽게 주제를 정하고 촉박하게 실험을 진행하는 것이 아니라 꽤 오랫동안 관련되어 고민하였던 stain normalization 기법이라 후에도 좋은 자양분이 될 것 같다. 현재까지는 사람들이 stain noramlization의 필요성에 대해 깊게 공감하기는 어렵다는 생각이 들었지만 그럼에도 불구하고 나만의 좋은 스토리라인을 가지고 사람들을 설득해야 함을 다시 한 번 느꼈다.
<학회 후기>
6월 23일 (금)
세션 : B-3 Deep Learning with Uncertainty
제목 : 회귀 문제를 위한 불확실성 기반 준지도학습
의료(병리 세포 이미지)등의 특수 분야에서는 데이터 수집 시 전문가 지식이 필요하기 때문에 레이블 데이터 부족 및 수집의 어렵다는 문제점이 존재한다. 입력 데이터 수집은 상대적으로 쉽기 때문에 unlabeled 데이터와 적은 레이블 데이터를 함께 사용하는 기법이 연구되고 있다. 본 연구에서도 준지도학습 활용하여 신뢰할 수 있는 unlabed 데이터에 레이블을 부여하는 수도 레이블링을 적용했다. 또한 consistency regularization은 대부분 분류 문제에 특화되어 있다는 한계점이 존재하여 회귀에 적용해보고자 했다. 특히 label 데이터와 unlabel 데이터 사이의 유사도를 통해 정확한 수도 레이블링이 가능하도록 하였다. 회귀 문제를 위한 수도 레이블링을 생성하고 믿을 수 있는 수도 레이블 선택하는 것이 본 연구의 목적으로 레이블 데이터, strong augmentation, weak augmentation의 표현 벡터를 각각 산출해서 예측 값의 신뢰도가 높은 경우에만 수도 레이블로 사용하였다. 또한, 예측 값에 대한 mc dropout 분산을 불확실성으로 활용하여 불확실성이 임계치 값이 작은 경우에만 적용하였다. 해당 임계치는 iteration별 불확실성 상위 k% 미만의 값을 사용하였으며 특히 첫 iteration의 임계값은 임의로 크게 설정하여 적절한 임계값 선정이 가능하도록 설계하였다.
6월 23일 (금)
세션 : B-3 Deep Learning with Uncertainty
제목 : 리튬 이온 배터리 잔존 수명 예측을 위한 Test-Time Augmentation 기반 도메인 불확실성 추정
대부분 배터리 상태 진단 연구에서 활용한 딥러닝 기반 모델은 예측 시 과도한 확신을 가지는 경향이 존재한다. 배터리가 사용되는 환경이 변화함에 따라 그를 반영하는 domain uncertainty를 새롭게 정의하는 것이 필요하다. 실제 환경에서는 온도, 조도, 습도 등의 외부 환경 요인의 변화에 민감하며 학습 분포와 입력 값의 분포 차이로 발생하는 도메인 변화를 indomain uncertainty와 domain shift uncertainty를 정의한다. Domain shift는 데이터가 많아져도 해결하지 못하는 데이터 불확실성과 모델이 학습을 제대로 하지 못한 모델 불확실성이 존재한다. 본 연구에서는 계산 효율적이며 외부 환경 변화를 반영할 수 있는 불확실성 도출 방법을 제안하였다. 이를 위해 temporal convolutional network-AutoEncoder(TCN-AE)를 back-bone으로 하여 오토인코더 사전학습을 거친 후에 fine tuning을 거친 모델을 최종 상태 진단 모델로 활용하였다. 또한 사전 학습된 회귀 모델에 추론 과정 증강 기법을 적용하여 예측값과의 불확실성을 도출하여 도매인 내 불확실성과 도메인 변화 불확실성을 파악하고자 하였다. 특히 본 연구에서는 leave-one-domain-out을 적용하여 온도별 주행 환경에 대한 domain shift 시나리오를 개별 설정하여 성능차이가 가장 큰 데이터에 대해 성질이 다른 특성을 가질 것으로 유추하였으며 domain 내 불확실성 및 도메인 변화 불확실성에 대해 정량적으로 평가한 점이 인상 깊었다.
- 이전글2023춘계 정보처리학회(ASK2023)-오수빈 23.07.06
- 다음글2023 하계 데이터마이닝학회(KDMS2023)-강지연 23.06.28
댓글목록
등록된 댓글이 없습니다.