Reducing annotation effort in digital pathology: A Co Representation l…

페이지 정보

profile_image
작성자 김채윤
댓글 1건 조회 328회 작성일 22-08-23 02:40

본문

● 논문제목: 
Reducing annotation effort in digital pathology: A Co Representation learning framework for classification tasks

● 논문 내용 요약:
Histopathological는 암 진단에 필수적입니다. 하지만, 관찰자, 관찰 방법 등에 따라, 관찰 결과의 일치율은 48%로 낮을 수 있습니다.
컴퓨터 비전과 딥러닝 분야가 발전함에 따라 이를 해결하기 위한 대안으로 디지털 병리학이 제시가 되었지만, 상당한 규모의 데이터 셋이 필요합니다.
하지만, 전문가들이 직접 데이터셋을 구축하기에는 많은 비용과 시간이 소모되기에, 이런 수고를 줄이고자, 본 논문에서는 적은 데이터 셋으로 학습을 시킬 수 있는 framework를 제안하였고, 이에 대해 실험적으로 증명하였습니다.

● 논문의 시사점:
본 논문에서는 적은 데이터 셋으로 학습을 시키고, nerual network의 성능을 극대화 하기 위해, co-representation을 통한 classification framework를 제안합니다.
이 framework는 class-label 정보와 local spatial 분포를 학습하며, Deep Matric Learning (DML)과 Categorical Cross-Entropy(CCE)로 구성됩니다.
이를 그대로 활용할 경우, 2가지의 문제점이 발생하는데, 첫번째는 DML과 CCE의 수렴되는 속도는 다르고, 두번째는 anchor 당 하나의 positive, negative만 고려하여 학습 속도가 느린 문제점이 있습니다. 따라서, 이를 해결하기 위해 Soft-multi-pair Loss를 제안하여 2가지의 문제점을 해결하였고, 적은 dataset에서도 state-of-the-art(sota)에 버금가는 성능을 실험적으로 증명하였습니다.

첨부파일

댓글목록

profile_image

방성진님의 댓글

방성진 작성일

해당 논문은 co-representation을 통한 classification framework를 제안하였다. 병리 특성상 많은 데이터를 사용하지 못하는 경우가 많은데 적은 데이터를 가지고 학습할 때 embedding space 상에 데이터를 컨트롤하는 알고리즘을 제시하였다. 이 때, anchor 의 classification을 위해 데이터 embedding space 상에서 유사도 기준 positive cluster와 negative cluster에 대해 local spatial를 학습하게 되고 cluster의 몇 node들의 spatial한 위치 또한 변경하게 된다. 지금까지 기존 데이터의 spatial한 정보를 컨트롤할 생각은 해보지 못했는데 classification의 성능 향상을 위해 이러한 방법은 직관적이며 의미가 있다고 생각이 들었다. 또한 여러 실험적인 증명을 통하여 sota와 비슷한 그 이상의 성능 또한 보였다. 확장성 관점에서 볼 때도 많은 분류 문제를 다룰 때 embedding space상에서 데이터 분포를 보며 boundary를 확인하게 되는데 해당 논문에서 제안하는 유사도 기반의 weight를 가지고 데이터의 spatial한 구조를 컨트롤하는 방법은 많은 task에 적용이 가능할 것으로 보인다.