2023 하계 데이터마이닝학회(KDMS2023)-김채윤

페이지 정보

profile_image
작성자 김채윤
댓글 0건 조회 242회 작성일 23-07-08 20:39

본문

<발표 후기>
6월 23일 (금)
세션 : C-2 이상탐지/특징매칭
제목 : 3D Whole Slide Image Registration via Pairwise Feature Matching for Prostate Cancer Detection and Diagnosis
병리학과 관련된 도메인이 부족하기에 빌드업 하는 과정에서 논리적인 weak point를 많이 느꼈던 것 같다.
개인적으로 생각했을 때 지금 진행되는 연구에서 기법적인 부분은 거의 다 진행되었다고 생각했기에 진행 상황에서 많이 느슨해진 부분이 있었는데,
이번 학회 발표를 통해서 미완성인 연구로 발표를 한다는 것이 어느 정도 부담이 되었고, 기법적인 설명과 정당성이 부족했던 점, 정량/정성적 분석이 없었던 점 등..
다른 사람들과 비교하며 내 연구 발표에서 부족한 부분을 깊이 깨닫게 되었고, 추후 진행되어야 할 방향성을 다시금 생각해볼 수 있었던 좋은 기회였던 것 같다.


<학회 후기>
6월 23일 (금)
세션 : A-2 자연어  처리
제목 : 프롬프트  기반  추상적  텍스트  요약  모델
NLP 분야에서 요약 모델은 활발하게 연구 중인 분야 중 하나이며 본 발표에서는 프롬프트를 기반으로 해서 택스트를 요약해주는 하이브리드 모델을 제안하였다.
요약 task에 적합한 모델 아키텍쳐를 구축하기 위해서 primary 프롬프트와 elaborate 프롬프트를 구성하였다.
primary 프롬프트에서는 soft와 hard 프롬프트를 결합하였는데, 문장 단위의 텍스트 앞에 soft 프롬프트를 붙여 모델을 fine-tunning할 수 있도록 설계하였고,
입력된 문장들에 대해 깊이 있는 텍스트 요약을 위해 수동으로 작성하는 hard prompt를 추가로 설계하였으며, 요약 모델이기에 하이퍼 파라미터 변수로는 길이로 정하였다.
입력값의 크기를 줄이기 위해  elaborate 프롬프트에서는 고정된 word 기준으로 나누는데 문장을 기준으로 구성하였으며,
생성된 요약문과 기존 요약문 사이의 유사성을 측정하여 우수한 성능을 보임을 입증하였다.


6월 23일 (금)
세션 : A-2 자연어  처리
제목 : 감성  분석을  위한  다중  소스  비지도  도메인  적응  방법론
대량의 리뷰 데이터 확보가 용이해짐에 따라 리뷰어의 감정 분석을 통해 객관적인 인사이트와 제품/서비스를 개선하기 위해서
본 연구가 진행되었다. 그러나, 리뷰 데이터들 모두 labeled 하기에 불가능하며, labeled된 리뷰 데이터의 분포와 target 데이터의 분포가 불일치 하는 경우 모델의 성능 하락 문제가 발생한다.
이를 해결하기 위해 labeled data의 추가적인 학습 없이도 새로운 도메인에 적합한 표현 벡터를 활용하여 tager에 대한 성능 향상을 목표로 한다.
본 연구에서는 multi-source 상황에서 target에 대해 도움이 되는 source domain을 찾아내고, 반대되는 domain에 대해서는 낮은 가중치를 부여해서 negative transfer를 방지한다.
source domain별 적절한 가중치를 부여하기 위해서 discrepancy loss를 제안하였다.

댓글목록

등록된 댓글이 없습니다.