RA-GCN: Graph Convolutional Network for Disease Prediction Problems wi…

페이지 정보

profile_image
작성자 방성진
댓글 1건 조회 309회 작성일 22-08-16 16:55

본문

● 논문제목: RA-GCN: Graph Convolutional Network for Disease Prediction Problems with Imbalanced Data

● 논문내용 요약: 병리학에서 Disease prediction는 미리 예방을 위한 측면에서 임상 영역에서 중요한 task입니다. 하지만 Imbalance data 문제가 있어 분류 모델의 신뢰도가 낮습니다. 이 논문에서는 이를 학습 과정에서 샘플들의 class 기반 weight를 학습함으로써 minority class 샘플들에 대한 분류 성능을 향상시킴으로써 imbalance data에 대해 효과적임을 여러 실험을 통해 증명하였습니다.

● 논문의 시사점: 본 논문에서는 data imbalance 문제를 해결하기 위해서 샘플링 기법 기반으로 가지 않고 비용기반 방법으로 새로운 SOTA 모델인 RA-GCN을 제시합니다. 여러 실험을 통해 이 모델의 성능이 높음을 증명하였습니다. 본 논문에서는 모델의 복잡도를 올리거나 학습의 방법을 바꾸는 방법이 아닌 일반적인 classification 학습 방법에 weight 학습을 추가하여 간단한 방법으로 접근하였습니다. 추가적으로 실제 병리 데이터 뿐만 아니라 이를 더 확장하여 일반적인 여러 상황을 시뮬레이션 데이터를 통해 구현한 뒤 실험함으로써 다른 domain에도 적용 가능성이 높다는 것을 보였습니다.

첨부파일

댓글목록

profile_image

강민정님의 댓글

강민정 작성일

본 논문은 GCN 모델을 기반으로 환자가 질병에 걸렸는지 안 걸렸는지를 예측하는 task이다. GCN 모델은 Adjacency matrix와 feature matrix를 사용해서 convolution 시키는 모델로, 최근 disease prediction 분야에서 활발히 연구되고 있는 분야이다. 그러나 해당 task들에는 한 쪽 class에 대한 sample의 분포가 치우쳐져 있는 class imbalance 문제가 존재한다. 본 논문은 Cost sensitive 접근법을 통해 data imbalance 문제를 해결하려고 하였다. 또한, 기존의 모델들은 outlier들을 무시하고 최적의 performence를 가져오도록 학습된다. 그러나 이상치로 데이터 수집이나 레이블링 또한 실험에서 오류가 나서 발생한 데이터로 abnormal distance가 존재하기 때문에 이를 고려해야 한다.
본 논문에서 제안하는 RA-GCN 모델은 classifier의 예측 결과를 기반으로 달라지는 class에 속하는 샘플들의 weight를 학습하는 모델이다. 본 연구는 minority class에 해당하는 샘플의 경우에 loss 계산시 weight를 더 줘서 class imbalanace 문제를 해결하였다. RA-GCN은 majority 샘플들은 오분류 하지 않으면서 outlier 샘플은 minority 샘플이기 때문에 weight 값을 높게 주도록 학습된다. 실험 결과에서는 class가 많아질수록 성능이 전반적으로 하락하기는 하지만 본 논문에서 제안하는 RA-GCN의 성능이 가장 좋은 것을 확인할 수 있다. 여러 의학 데이터셋에 적용한 경우에도 제안한 방법론이 높은 성능을 보여줬으며, weighted 기반 학습 방법이 중요한 것을 확인할 수 있다.