Topological Feature Extraction and Visualization of Whole Slide Images…

페이지 정보

profile_image
작성자 방성진
댓글 2건 조회 371회 작성일 22-07-13 16:45

본문

● 논문제목: Topological Feature Extraction and Visualization of Whole Slide Images using Graph Neural Networks

● 논문내용 요약: 조직학 데이터의 복잡성은 데이터 해석에 어려움을 초래한다. 해당 논문은 TDA 방법인 Mapper를 사용하여 이 문제를 해결한다. 또한 전체적으로 WSI 에 대해 GNN 기반 feature extraction과 Mapper 기반 clustering을 수행하는 전반적인 workflow 인 "WSI-GTFE" 를 제안한다.

● 논문의 시사점: 본 논문에서는 Mapper라는 node clustering 하는 방법을 통해 graph데이터의 topology를 유지하면서 의미있는 graph data를 만드는 것을 볼 수 있다. 학습의 성능을 더 올리기 위해서 적절한 데이터 전처리 과정이 필요함을 보여준다.

첨부파일

댓글목록

profile_image

강민정님의 댓글

강민정 작성일

디지털 병리학을 적용하게 되면 아날로그 병리학에 대비 진단하는 절차에서 중간 과정들이 많이 생략될 수 있다. 따라서 딥러닝 기술을 활용하는 것이 디지털 병리학에 큰 영향을 끼치고 있다. 특히 CNN을 통해 높은 복잡도를 가지는 이미지를 낮은 차원의 feature들로 임베딩할 수 있게 되면서 더욱 중요해졌다. 또한, GNN은 tissue 하위 지역의 혼합 정보들을 추출할 수 있게 해주기 때문에 병리학 Whole Slide Image에서 single patch 간 이항 관계를 모델링하는데 적합한 기법이다.
본 논문에서 조직학 데이터는 다른 데이터 대비 복잡성이 높아 해석이 어려운 특징을 가지기 때문에 GNN 방식과 TDA(Topological Data Analysis) 도구 중 하나인 mapper를 합쳐서 이러한 문제를 해결하려고 하였다. TDA는 데이터를 분리하지 않고 해당되는 전체 토폴로지의 모양과 성질을 분석하는 기법으로 본 논문에서는 이러한 TDA와 mapper를 합친 WSI-GTFE(WSI GNN Topological Feature Extraction workflow)를 제안하였다. 제안하는 방법론을 통해 대장 하위 구간에 대한 암 침입 정도를 정량화 하고 TIS(Tumor Invasion Scores)를 측정하였다. TIS란 암 침입 정도를 말하며 tumor와 adjacent tissue region 사이의 overlap 정도를 측정하는 지표이다. 본 논문에서 언급했던 것처럼 Embedding 결과에 대한 해석을 진행하는데 있어 차원의 수가 너무 높고 복잡하여 기존에 GNN 기반 모델에 사용하는 GNNExplainer로 해석하기 어려워 mapper를 이용하였다는 점이 흥미로웠다. mapper를 사용하면 결국에는 차원의 수가 높거나 복잡하여도 이러한 관계들을 시각화할 수 있다고 하는데 명확하게 어떤 식으로 이루어져서 가능하게 되는지, 또한 걸리는 시간은 기존 모델 대비 어떤지에 대한 내용이 추가적으로 궁금했다.

profile_image

김재윤님의 댓글

김재윤 작성일

디지털 병리학을 통한 진단 기술은 계속해서 발전하고 있다. 딥러닝이 디지털 병리학에 큰 영향력을 줄 수 있음을 보여주는 논문에 대한 발표였다. 해당 논문에서는 GNN을 사용하면, invariant 상태를 유지하면서 이미지 내 영역의 관계성을 확인할 수 있음을 보여준다. 논문에서는 대장암 데이터(CRC)를 통해 실험을 진행하며, 이를 통해 조직의 상태와 림프절의 상태를 확인할 수 있다고 하였다.
조직학 데이터는 복잡성이 높기 때문에 데이터 해석이 어렵다고 한다. 그래서 전체적인 구조를 분석하는 기법인 TDA의 mapper라는 도구와 GNN 기법을 합쳐 WSI-GTFE 방법론을 제안한다. 6단계에 거쳐 암 침입의 정도 측정하고자 하며, 최종적으로는 TIS라는 지표를 통해 이를 수치화할 수 있다고 하였다. 이 중 두번째 단계에서 clustering을 통한 representation만 보았을 때는 기존 manifold 방식의 clustering과 큰 차이점을 알 수 없었다. 하지만, 암 침입 정도 측정에 있어서 GNN을 통한 접근방식이 좋은 퍼포먼스를 보여주는 것을 확인할 수 있었다.