2023 추계 데이터마이닝학회(2023 Data Conference)-정화용

페이지 정보

profile_image
작성자 정화용
댓글 0건 조회 223회 작성일 23-11-08 17:38

본문

<발표 후기>
11월 7일 (화)
세션 : C-1. 이미지/영상분석
제목 : 효율적인 CCTV 객체검출을 위한 프레임 샘플링 및 데이터 퓨전 학습

이번 발표는 효율적인 CCTV 객체검출을 위한 프레임 샘플링 및 데이터 퓨전 학습에 대하여 발표를 진행했다. CCTV 환경에서는 기존 많은 선행 연구들에서 확인한 "양질의 데이터"의 기준이 다르게 적용될 필요성이 있음을 제시하며, CCTV 데이터 고유 특성을 고려한 Frame Sampling 과 Data Fusion에 대해 제안한 연구였다. 질문 중 Data Fusion 시 Fustion 하고자 하는 data를 CCTV의 데이터적인 특성을 반영하여 색상을 일부 흑백처리하는 방식을 통해 전처리를 수행하는 것에 대한 제안을 받았다. Sampling의 방식을 주된 향후 연구 주제로 고민했지만 fusion 도 병렬적으로 실험해볼 필요성에 대해 느꼈다.


<청취 후기>
11월 7일 (화)
세션 : B-1. 딥러닝
제목 : 디퓨전 모델 기반 Personalization을 위한 개념 수준 분해

본 연구는 기존 생성형 모델에서 이미지 자체를 하나의 토큰 임베딩에 담기도록 학습을 진행했기 때문에, 윤곽이나 색상과 같은 이미지의 일부 특성만을 입력으로 활용할 수 없다는 한계점을 제시하며, 이를 보완하기 위한 스페셜 토큰 학습 방안에 대해 제안했다. 입력된 이미지(A)에 포함된 객체(a)로부터 윤곽, 색상, 질감 토큰을 구분지어 학습시키는 방식을 활용했으며, 생성 단계에서 이미지(B)에 객체(b)가 객체(a)의 윤곽만을 반영할 수 있도록 입력하는 방식을 활용했다. 다만, 본 연구에서는 윤곽, 색상, 질감 토큰을 사용했는데 각 토큰간의 관계성이 학습단계에서 고려되지 않아 특정 토큰만을 명령으로 입력했음에도 불구하고 일부 다른 토큰까지 반영되는 듯한(곰인형의 윤곽만을 입력으로 넣었음에도 불구하고 색상까지도 과하게 반영되는 듯한) 결과가 확인되어 각 토큰이 의도된 대로 학습이 진행되었는지에 대한 검증 과정이 추가되어야 할 것으로 보인다.


세션 : C-1. 이미지/영상처리
제목 : 디퓨전 모델 기반 3D 깊이 인식 합성 이미지 생성

본 연구는 이미지 생성 분야에서 foreground와 background를 고려하지 못한다는 점을 한계로 제시하며, depth를 고려한 이미지 생성에 관한 연구를 진행했다. input/output 양쪽 측면에서 각각 윤곽/색상/질감 토큰을 구분 학습 시키는 방식을 통해 사용자가 의도한 대로 입력 이미지의 background feature가 출력 이미지에 포함된 객체(Local)에 반영되지 않도록 하여 깊이 정보가 담긴 이미지를 생성할 수 있는 것을 입증했다. 생성형 모델에 대한 사전 지식이 부족해 이해하지 못한 부분이 많았지만, 화두되고 있는 연구 분야인 만큼 좀 더 공부해볼 필요성을 느낀 발표였다.

댓글목록

등록된 댓글이 없습니다.