2023 추계 정보처리학회(ASK2023)-오수빈

페이지 정보

profile_image
작성자 오수빈
댓글 0건 조회 233회 작성일 23-11-08 14:17

본문

<발표 후기>
11월 3일 (금)
세션 : [P1] S4.인공지능
제목 : Anomaly Detection by Human Pose Estimation On Surveillance Videos in Bridge

이번 정보처리학회는 포스터 발표로 진행했다. CCTV 데이터에 대한 이상 탐지를 하기 위해 장소에 따른 이상 정의의 다양함을 보완하고자 독립적인 모델 구축을 하고자 하였고, 본 발표에서는 특징이 분명한 교량에 초점을 맞춘 새로운 구조를 제안했다. 교량의 특성상 사람의 움직임이 다른 장소보다 중요하며 이를 이용하기 위해 기존의 이상 탐지 모델에 HPE(human pose estimation)의 17개의 키포인트 피를 추가하였다. 포스터 전시 중 유사 연구를 진행하는 분께서 "기존 이상 탐지는 정상 데이터만을 가지고 이와 유사하지 않은 것을 이상이라 탐지하는데 이상, 정상을 먼저 정의하는 해당 연구에서는 로스 값의 의미가 무엇인가?"에 대한 질문을 하셨다. 해당 연구는 기존의 이상 탐지와 다르게 적은 label을 효율적으로 이용하는 것이 목표였기에 해당 질문을 받고 내가 하고 있는 연구에서 로스 값의 활용이 중요해질 것이라는 생각이 들었다. 그 외에 질문들을 주고받으면서 앞으로 어느 부분에 초점을 맞춰 연구를 진행해야 좋을지 고민하는 시기에 의미 있는 생각을 하게 해줬던 시간인 것 같다.

<청취 후기1>
11월 3일 (금)
세션 : [T1-7] S4. 인공지능
제목 : 조명을 위한 인간 자세와 다중 모드 이미지 융합 - 인간의 이상행동에 대한 강력한 탐지

해당 발표는 이번 학회에 제출했던 연구 주제와 유사한 내용의 발표였다. 내 연구와 비슷하게 HPE를 추가한 이상 탐지를 제안하였고, 해당 발표에서는 추가로 CCTV 상에서의 빛에 따른 환경 변화를 잡고자 하였다. 기존 이미지 데이터와 Thermal Camera에 대한 데이터를 fusion 하여 조명에 영향을 줄이고자 하였다. 해당 발표를 듣고 기존에 내가 진행하고 있던 연구로는 CCTV 데이터의 한계를 보완하기 어렵다는 생각이 들었고, 해당 연구 주제에 대한 다양한 연구가 많이 나오고 있구나를 깨닫는 시간이었다.

<청취 후기2>
세션 : 초연결·고신뢰 산업지능 연구센터 세션논문
제목 : Dual Supervision을 이용한 이미지 객체 간 관계 추출

해당 발표는 같은 연구실을 사용하는 빅컴랩 김민규 연구원이 진행한 발표였다. 같은 연구실을 사용하지만 어떤 연구를 하는지는 잘 알지 못해 처음으로 민규의 연구 주제를 보는 시간이었다. NLP에서 사용하는 relation extraction을 이용하여 비전에서의 객체 관계를 확인하고자 하는 주제였고, dual supervision을 통해 사람의 주석과 모델의 결과를 통합하여 모델의 성능을 향상시키는 연구였다. 해당 발표를 듣고 현재 진행 중인 CCTV 데이터를 통한 이상 탐지 연구에 대해 기존 아이디어가 생각나게 되었다. 기존 아이디어는 이상에 대한 정의를 text prompt를 통해 상황을 파악하여 해당 문맥에 맞는 이상 객체들을 image segmentation을 하여 이상 탐지를 하고자 했던 아이디어다. 해당 구현을 진행하려 하는 단계에서 NLP의 모델을 추가 구현해서 객체 탐지를 하는 게 관건이었는데, 민규의 연구를 듣고 생각보다 가능성이 있을 것 같다는 생각을 하게 되었다.

댓글목록

등록된 댓글이 없습니다.