2023 추계 정보처리학회(ASK2023)-노유진

페이지 정보

profile_image
작성자 rohyujin
댓글 0건 조회 178회 작성일 23-11-21 17:05

본문

<발표 후기>
11월 7일 (화)
이번 추계 데이터마이닝학회에서 "The Crowd Density Estimation Using Pedestrian Depth Information"에 대해 발표하였다. 본 연구는 이미지에서 손실된 거리 정보를 복원하기 위해 보행자의 평균 머리를 사용하는 것을 제안한다. 발표 상에서 받은 질문에서 연구의 향상을 위해 생각해 볼 필요가 있는 부분이 있었던 것 같다.


*글자 단위 텍스트 인식 기반의 이미지 내 한글 글꼴 분류 시스템 개발(숙명여자대학교)
이미지나 온라인 상에 있는 텍스트의 글꼴을 찾는 것은 모든 글꼴을 비교하여 수작업으로 찾아야하는 비효율을 보여왔다. 본 연구는 다양한 글꼴 형태(10가지)를 선정하여 모델을 학습시켰다. 학습시킨 모델은 trasform mode이다.
추가로 모델을 학습시키기 위해 데이터인 텍스트를 분석하였다. 자음,모음 형태/단어/하나의 음절로 나누어 모델이 학습한 성능을 기반으로 단어를 선정하였다. 제안된 모델의 성능은 TINY OBJECT에 대해 낮은 성능을 보였지만 일반적인 데이터셋에 대해 좋은 성능을 보인것으로 보아 이미지에서 텍스트의 글꼴을 학습하는 연구에 대한 가능성을 확인했다.

최근 컴퓨터비젼과 AI 활용한 텍스트 인식에 대한 연구가 진행되고있다.
다만 글꼴을 10개를 학습하였는데, 학습 모델의 구조를 보아 학습이 되지 않은 글꼴을 찾지 못했을때 학습된 글꼴 중 유사한 글꼴로 분류하는 것으로 보였다. 하지만 이런 경우에 사용자 입장에서는 잘못된 지식인지 알 수 없기 때문에 신뢰성에 어려움이 보인다. class로 무조건 분류하기 보단 기존 분류에서 찾지 못할 경우 class분류를 안하는 방법에 대해 생각해봤다. 또한 텍스트는 TINY OBJECT인 경우가 존재하기 때문에 제안하신 모델이 아닌 TINY OBJECT DETECTION모델을 이용하면 어떤 성능이 나타나는지 궁금증이 생겼다.


*이미지 분류 정확도 향상을 위한 텍스트 활용 이미지분류 모델
이미지의 학습 모델로 많이 사용되는 CNN모델의 경우 이미지의 특징을 학습하고 이를 기반으로 분류하게 된다. 하지만 이미지가 설명하는 상황이 복잡해질수록 인공지능 모델이 학습하여야하는 특징은 무수히 많아진다. 이는 낮은 성능으로 이어졌다. 또한 생성 모델과 같이 텍스트에 매핑되는 이미지를 찾거나 이미지의 분류에 대해 설명이 필요한 경우 어렵다는 문제가 있다. 본 연구는 이런 문제를 해결하기 위해 이미지와 텍스트를 이용한 다중 모델을 제안한다. 이미지는 기존 방식과 같이 CNN모델로 학습하고, 텍스트는 LSTM모델을 학습한다. 이를 기반으로 두 모델을 피리즈 시켜 이미지의 분류를 출력한다.

본 연구에서 이미지만을 분류한 것과 제안한 다중 모델의 성능이 얼마나 향상되어는지 보여지면 좋았을거 같다.

댓글목록

등록된 댓글이 없습니다.