[20230331 통합 세미나] Hybrid U-Net model for segmentation and classificati…
페이지 정보
본문
[세미나 주제] Hybrid U-Net model for segmentation and classification in histopathology images
[논문 제목] A hybrid U-Net model with attention and advanced convolutional learning modules for simultaneous gland segmentation and cancer grade prediction in colorectal histopathological images
[요약]
병리학 이미지를 분석하고자 하는 연구들이 많이 진행되고 있다. 특히 병리학 이미지에서 segmentation 및 classification 관련 연구들이 진행되고 있는데, 그 중 segmentation 모델로 U-Net이 자주 사용된다. 본 논문에서는 기존의 U-Net의 구조를 활용하면서 3가지의 주요 module을 사용하여 기존 U-Net이 가지고 있던 한계점을 극복하고자 하였다. 또한 segmentation과 classification을 동시에 구할 수 있도록 multitascking learning을 사용하는 모델을 제안한다.
[발표 추가 내용]
Dice loss를 background와 조직인 부분을 구별하기 위해 사용한다고 설명 드렸었는데, 왜 dice loss를 사용했는지 말씀드립니다. 병리학 이미지 segmentation task에서 대부분 background인 부분이 조직인 부분보다 훨씬 많기 때문에 class imbalance로 인해 적게 분포하는 class에 대해 예측 하지 않도록 학습이 진행될 수 있습니다. 이러한 문제를 dice loss로 보정할 수 있습니다. dice loss는 1-dice score로 정의할 수 있고, 여기서 dice score는 GT와 prediction이 겹치는 부분에 대해 매우 중요하다고 보는 score값입니다. 그렇기 때문에 이러한 score를 이용한 loss값은 class의 imbalance를 보정해줄 수 있습니다.
첨부파일
-
1-s2.0-S266652122300008X-main.pdf (9.5M)
DATE : 2023-03-31 15:44:37 -
230331_Hybrid_U-Net_이유진.pdf (2.3M)
DATE : 2023-03-31 15:44:37
- 이전글[20230421 통합 세미나] Stain transfer using Generative Adversarial Networks and disentangled features 23.04.24
- 다음글[20230324 통합 세미나] Multimodal spatial–temporal graph attention network for time series anomaly detection 23.03.24
댓글목록
이상민님의 댓글
이상민 작성일
금일 세미나는 병리 이미지에 U-Net 기반의 아키텍처가 갖는 한계점을 극복하기 위한 방법론에 대해서 소개하였다. 병리 이미지는 200~400배줌으로 촬영하여 한장에 500MB~1.2GB에 해당할 정도로 고차원 이미지이며, 조직병리의 특성상 복잡한 모양을 갖는다. 특히, 병변의 분류를 명확하게 파악하기에는 스펙트럼성 레이블을 갖고 있기에 명확하게 분류를 나누기도 어렵다. 본 연구에서는 U-Net을 활용할 때 갖는 요소기술적 한계를 극복하고자 atrous convolutions(=dilated convolutions)를 기본 요소로 하는 세가지 기법을 제안했다. 대부분 atrous spatial pyramid pooling의 방식을 기반으로 하고 있다. 제안하는 hybrid architecture의 당위성은 이해하기 어렵고 실험으로 증명하는 딥러닝 아키텍처의 전형을 보여준다. (왜 저 구조가 좋은지는 몰라도 확실한건 성능은 좋다는 식)
유진이가 내용을 잘 정리해서 영어로 발표하는 것을 보고, 조금 더 준비하면 해외학회에서 얼마든지 발표할 수 있을거라는 점을 스스로 느꼈으리라 생각한다. 수고 많았고, 본인의 연구에도 도움이 될만한 연구 재료를 많이 얻었기를 바란다.
혹시 atrous convolutions에 관심이 있는 학생들은 다음 영상을 보면 도움이 되리라 생각한다. https://www.youtube.com/watch?v=MU_KmowxkMQ
이재원님의 댓글
이재원 작성일
유진이가 진행해주었던 이번 세미나에서는 병리 이미지 segmentation의 기존 methods들이 가지고 있었던 challenging한 부분들과 그것을 해결하기 위해 제안한 Hybird U-Net 모델을 잘 설명해주었다. 병리 이미지는 병리학자들이 실제로 확인하거나 진단할 때에도 시간이 많이 들어가는 만큼 복잡하고 형태가 다양할 뿐만 아니라 진단에 차이도 존재한다. 따라서 기존의 모델에서 원하는 Output을 얻기 위한 Important feature 추출하는 것은 매우 어렵다. 본 연구에서는 그 feature를 더 잘 추출하기 위해 ACLM, AM, MTM 3가지 모듈을 사용하여 아키텍처를 만들었고 기존의 convolution과 다른 atrous convolution 기법을 활용하였다. 이런 여러가지 모듈의 combination 으로 우수한 실험 결과와 성공적인 computation time을 확보하였다. atrous convolution은 필터 내부에 공간을 띄워 conv연산하여 receptive field를 확장시키는 방법이다. 개인적으로 complex 하고 various한 Gland를 찾기 어려웠던 문제를 해결하기 위해 사용했던 문제를 atrous convolution과 attention mechanism의 조합을 제안하였던 것이 본 연구의 가장 큰 contribution이 아닐까 생각든다. 기법들의 combination의 당위성에 대해 실험적으로 밖에 보여주지 못한 것은 아쉬웠다.
이번 유진이의 영어 발표를 들으며 복잡한 hybrid method에 대해서 설명하는 것이 쉽지 않았을 텐데 잘 설명해 주어 대단하다고 생각한다. 또한 병리학 최신 연구의 background에 대해서 설명을 잘해주어, challenging 부분들을 이해하며 생각해볼 수 있는 시간을 갖게 되었다. 유진이가 연구하고 있는 부분에도 발표 논문에서 제안하였던 모듈 컨셉을 잘 활용하여 적용한다면 성공적인 퍼포먼스를 낼 수 있다고 생각한다.
강민정님의 댓글
강민정 작성일
이번 통합 세미나에서는 디지털 병리학을 통해 암을 진단하는 과정에서 기존의 연구들이 가지는 한계점을 해결하기 위해 제안된 hybrid U-Net에 대한 논문 리뷰가 진행되었습니다. 특히 본 논문에서는 scanning이나 염색 프로세스가 표준화 되지 않아서 생기는 variability를 해결하고자 하였습니다. 제안하는 hybrid U-net은 ACLM, AM, MTM 3가지 모듈을 결합하였으며 atrous convolution 기법을 사용한 모델입니다. 해당 논문에서 흥미로웠던 점은 multi tasking이 가능하다는 부분이었습니다. 병리학 이미지에 대한 segmentation 뿐만 아니라 classification을 동시에 수행하며 보다 효율적인 모델 아키텍처를 제안하고 있다는 생각이 들었습니다. 병리학자를 위한 보조 tool로 digital pathology가 사용되는 것을 고려해 봤을 때 segmentation, classifcation 결과 모두 진단 과정에서 중요한 부분이니만큼 이 두 개를 함께 해결할 수 있다는 점이 인상 깊었습니다. 그러나 제안하는 multi-tasking 기반의 hybrid U-net의 성능을 입증하기 위해서는 single head일 경우와의 속도 비교가 필요하다는 생각이 드는데 이 부분이 명확하게 실험적으로 나와있지 않은 것 같아 아쉬웠습니다. Segmenation과 classification을 각각 수행하는 모델만큼의 정확도를 유지하되 빠른 속도로 처리할 수 있다면 해당 아키텍처를 참고해보면 좋을 것 같다는 생각이 들었습니다.
병리학 분야에 관심을 갖고 연구하고 있기 때문에 이번 유진언니의 영어 발표가 더 흥미로웠습니다. 논문의 내용이 많았지만 발표 자료를 잘 만들어 주어서 이해하는데 도움이 많이 되었습니다. 아키텍처 내에 해결이 명확하게 되지 않은 사항들을 잘 정리하면 우리가 원하는 task에 맞는 모듈들을 잘 활용할 수 있을 것 같습니다. 발표 잘 들었습니다. 감사합니다!
김채윤님의 댓글
김채윤 작성일
이번 세미나에서는 병리학 이미지에서 U-Net 기반 아키텍처의 한계를 극복하는 방법에 대한 논문에 대한 리뷰가 진행되었습니다. 이를 위해 Advanced Convolutional Learning Modules, Attention Modules, Multi-Scalar Transitional Modules 등의 세 가지 구조적 요소를 U-Net 아키텍처에 결합하여 multi-level conv learning을 수행하는 논문이 소개되었습니다. 실험 결과에서 위 기법들을 활용한 이러한 구조가 U-Net의 기술적 한계를 극복하고 성능이 우수하다는 것이 입증되었습니다. 병리학 이미지들은 복잡한 형태를 띄기 때문에 사람마다 다른 결과가 나올 수 있는데, 이 모델의 결과를 가지고 조직병리학 이미지에서 형태학적 평가 및 진단에 참고할 수 있으며, 이는 병리학자들의 오판을 줄이고 암을 진단하는 시간을 줄일 수 있다는 것을 알게 되었습니다. 이번 연구는 atrous convolution을 기반으로 하는 세 가지 기술을 결합하여 U-Net의 기술적 한계를 극복하는데 기여했으며, 특히 매커니즘의 조합으로 U-Net의 한계를 극복했다는 점이 이 연구의 기여로 생각됩니다. 그러나 논문 내에서 하이브리드 아키텍처의 합리성과 당위성에 대한 이론적 근거는 실험적으로만 제시되어 이해하기 어려웠던 부분이 있었습니다.
좋은 발표였습니다. 감사합니다.
오수빈님의 댓글
오수빈 작성일
이번 세미나는 기존 U-net의 한계를 극복하기 위한 새로운 아키텍처를 소개하는 논문 리뷰였습니다. Hybrid U-Net의 전반적인 구조를 보면 세가지 모듈(Advanced convoloutional learning modules(ACLM), Attention modules(AM), Multi-scalar transitional modules(MTM))을 결합하여 사용하는 구조로 이루어져있습니다.
특히 ACLM에서는 atrous conv를 이용하여 학습하는데, 이때 여러 rate를 주어 마지막에 concat하는 방식으로 학습이 진행됩니다. 이 점이 기존 U-Net과의 차이이며 atrous conv를 이용하면 Locally한 부분을 globally하게 보여줌으로써 주 Task인 병리 이미지에서 구분하고자 하는 glam에 대한 구분을 더 잘할 수 있다고 합니다. 전반적인 구조적 측면으로는 단순한 모델 결합으로 보여 해당 방법론의 구조가 아쉬운 부분이 있었지만 전체 구조를 가져가지 않아도 atrous conv를 사용하는 등의 Hybrid U-Net에서 차용한 아이디어들을 하나의 세팅으로 가져가면 기존 구조에서도 좋은 결과를 낼 수 있겠다는 생각이 들었습니다.
해당 세미나를 들으면서 이미지 처리에 대해서는 많은 경험이 없지만, 해보고 싶은 task 중 하나인 저에게는 좋은 경험이 되는 발표였습니다. 좋은 발표 감사합니다!
강지연님의 댓글
강지연 작성일
이번 세미나에서는 병리학 이미지의 segmentation 파트에서 많이 사용 되는 U-Net 아키텍처의 한계점 극복을 소개하는 논문을 리뷰하였습니다.
세포학적 연구나 진단 등을 위해서는 조직학적 이미지에서 세포나 조직 구조를 정확하게 분리하고 분석하는 것이 매우 중요합니다. 따라서 정확하고 효과적인 segmentatiom은 병리학적 이미지 분석에서 매우 중요한 부분입니다.
논문에서 제안하고 있는 Hybrid U-Net은 U-Net에 dvanced Convolutional Learning Modules, Attention Modules, Multi-Scalar Transitional Modules를 추가하여 구성된 아키텍처 입니다. 따라서 다양한 크기의 커널을 사용하여 병렬적으로 합성곱을 수행하는 확장형 합성곱 모듈 어텐션 모듈을 통해 과 입력 이미지에서 중요한 부분을 강조하여 더욱 정확한 분할 결과를 생성할 수 있도록 합니다. 하지만 이 Hybrid U-Net 아키텍처는 매개변수가 많아 모델이 복잡하기 때문에 학습 시간이 길어질 수 있다는 단점이 있을 수 있습니다. 또한 대장암 뿐만 아니라 다른 조직학적 이미지 분석에도 적용 가능할 지 의문을 가지게 되었습니다. 또한 실험 시 사용한 데이터 셋은 한정된 환자의 수에서 얻어진 것이기 때문에 일반화 성능을 평가할 필요성이 있다고 생각하였습니다.
좋은 발표 들려주셔서 감사합니다.
정종민님의 댓글
정종민 작성일
이번 통합 세미나에서는 이유진 연구원이 'A hybrid U-Net model with attention and advanced convolutional learning modules for simultaneous gland segmentation and cancer grade prediction in colorectal histopathological images' 라는 논문을 리뷰해주었다.
해당 논문에서 제시된 hybrid U-Net은 multi-tasking이 가능하여 이미지 segmentation과 classification을 동시에 수행할 수 있고 기존의 U-Net보다 예측력이 뛰어나다. 이러한 hybrid U-Net과 U-Net의 차이점은 기존의 U-Net에 ACLM, AM, MSTM 3가지의 모듈을 결합했다는 것과, attention 메커니즘을 뒤에 추가했다는 것이다.
hybrid U-Net은 기존 U-Net의 encoding&decoding part에 attention 메커니즘을 추가한 architecture을 가진다. attention 메커니즘으로 더 연관있는 feature들에 focus 할 수 있고, 상관 없는 feature들을 배제 할 수 있다. 따라서 hybrid U-Net 은 기존 U-Net 보다 이미지 segementation, 암의 병기를 예측에 더욱 효과적이기에 병리학자들의 의사결정에 더욱 강력한 도구로써 사용될 수 있을 것 같다.
이유진 연구원이 랩 세미나 발표 준비를 굉장히 열심히 하는 것을 보았는데, 잘 발표해주어서 청취자들도 많이 배울 수 있는 시간이었던것 같다.