Quasi-Dense Similarity Learning for Multiple Object Tracking

페이지 정보

profile_image
작성자 rohyujin
댓글 1건 조회 539회 작성일 23-01-25 15:35

본문

발표일자: 2023.01.13

내용요약: 기존 detection에 의존해서 tracking을 하던 방법은 화면 속에서 객체가 겹치거나 사라지게 될 때는 tracking을 제대로 하지 못하는 문제가 있다. 따라서 객체가 제대로 검출이 되면 인스턴스를 연관 짓고 구별하는 것이 중요하다. 본 논문에서는 기존의 faster r-cnn을 각 RoI에 대한 기능을 추출하기 위해 원래 bbox head와 병렬로 추가되는 초경량 embedding head를 추가하여  대조 학습으로 인스턴스 유사성을 학습한다. FP, ID 스위치, 새로 나타난 객체 및 종료된 tracking은 모두 매칭을 불확실하게 하는 요인이다. 이는 매칭 된 후보를 유지하고 인스턴스 similarity를 측정하는 방법을 포함한 임베딩 space에서 bi-directional matching이 이를 완화 가능하다.

첨부파일

댓글목록

profile_image

이상민님의 댓글

이상민 작성일

금일 발표는 영상내 다중객체들을 추적(tracking)하기 위해 탐색 속도와 정확도를 높이기 위해 가능성이 높은 후보군 내에서만 객체 후보군을 찾도록 만다는 Quasi-Dense similarity를 적용하는 연구이다. 연구실내 성진, 채윤, 민정이가 함께 걸어가는 모습을 찍고 있다고 가정하자. 세사람은 종민이와 화용이를 만나서 잠시 이야기를 나누었는데 민정이는 종민이 뒤에, 채윤이는 화용이 뒤에 가려졌다가 다시 화면에 등장했다. 이 때 채윤이를 채윤이로, 민정이를 민정이로 인지하려면, 잠시 가려졌다 나타난 두 사람을 동일 인물임을 인식해야 하는 occlusion 문제가 발생한다. 또 다른 예시로는 마라톤 경주에서 사람들을 식별하거나 혼잡도가 높은 고속도로에서 주변 차량들을 인지하는 문제가 될 수 있다. 본 연구에서는 contrastive learning을 적용하여 가장 가능성이 높은 후보군(embedding space 에서 가장 근거리에 위치한 관측치들을 positive pair라고 한다)을 표현학습하는 방법을 활용하였다. 뒤에 가려졌다가 재등장한 채윤이와 민정이가 기존에 인식하던 채윤, 민정 객체와 가장 유사함을 인지하는 것이다. 본 연구에서는 객체탐지(object detection) 시 faster rcnn을 backbone으로 활용하였고, 객체 인식에 필요한 region 차이에 따른 loss, 객체 분류 오류에 따른 loss, 그리고 bounding box의 차이 loss를 선형조합하는 cost function을 구성하였다. 이미지 pair 간 dense matching 되는 부분과 객체 연관 과정에 잇어서는 좀 더 설명이 필요할듯 싶다. 유진이는 누구보다 연구 욕심이 많은 대학원생이다. 처음 만나서 이야기를 나눈 날 본인이 논문 한편을 작성하여 가져왔을 정도로 무엇을 하겠다는 '의지 뿜뿜'이 확실한 연구원이라 생각한다. 연구를 하다보면 생각보다 산출물이 도출되지 않아 지칠 때도 있고, 풀리지 않은 실마리와 실험 결과가 좋지 못하여 어려움을 겪을 때도 많다. 그럴 때 일수록 한걸음 한걸음 천천히 나아가야 한다. 학회에 참석하여 발표를 하거나 소논문을 작성하다보면 연구 아이디어에 대해서 정리가 되는데, 이런 작은 산출물들이 본인이 쉬이 지치지 않고 자신만의 연구를 지속하게 만드는 쉼표가 될 수 있다. 권투에서 강펀치만으로 승부 보려하지 말고 잽이 필요한 이유와 같다. 최근 유진이 연구를 중심으로 옆집 연구실과 콜라보 연구를 추진하고 있다. 함께 연구하는 교수님들과 대학원생들이 함께 웃고 의견을 나누며 연구조직 활동의 즐거움을 느끼고 가시적인 성과가 나오기를 기대해본다.