[20240220 통합 세미나] Scene Text Image Super Resolution

페이지 정보

profile_image
작성자 장유나
댓글 0건 조회 403회 작성일 24-02-21 10:00

본문

[일시] 2024. 02.20

[세미나 주제] Scene Text Image Super Resolution

[요약]
본 발표에서는 기존의 Scene Image Super Resolution 과는 다르게 Text Image 에 대해서 적용되어야 하는 Super Resolution 기법들을 다룬다. Text Image 상의 특징을 이용하여 기존의 SR 네트워크에 변형을 가해 만들어진 TSRN 네트워크가 제안되었고 이후에 텍스트 자체의 categorical한 성격을 반영한 Text prior를 이용한 SR 기법들이 소개되었다. 야외 상황에서는 바람에 날리는 현수막이나 기울어진 간판 등으로 인해 text image상의 text가 공간적으로 왜곡될 수 있다는 점에 착안하여 이러한 점에 있어서 강건한 성능을 보일 수 있는 네트워크인 TATT가 제안되었다. 추가적으로 해당 발표에서는 Text image와 관련하여 다양한 아이디어가 제안되고 있지만, 그 언어가 여전히 영어로 한정되어 있다는 점에서 더 다양한 언어에 적용될 수 있는 Text Image Super Resolution의 기법이 필요하다는 점과 text image 상의 특징을 더 잘 평가할 수 있는 지표가 필요하다는 점을 언급한다.

[참고 논문]
- [TATT] A Text Attention Network for Spatial Deformation Robust Scene Text Image Super Resolution https://arxiv.org/abs/2203.09388
- [TSRN] Scene Text Image Super Reoslution in the Wild https://arxiv.org/abs/2005.03341
- [TPGSR] Text Prior Guided Scene Text Image Super-resolution https://arxiv.org/abs/2106.15368

[녹화 영상 링크]
https://us02web.zoom.us/rec/share/jAhWbidRpHIwagZOwLudYO9N5p9gbFPJf_jKs6RTr7IclLcouYcKPi_gwj32PXac.JIT1D-iGS1Z8kkvZ

첨부파일

댓글목록

등록된 댓글이 없습니다.