[20240722 특별 세미나] Searching for Best Practices in Retrieval-Augmented …

페이지 정보

profile_image
작성자 장효영
댓글 0건 조회 17회 작성일 24-07-26 11:33

본문

[일시]
2024.07.25

[세미나 주제]
Searching for Best Practices in Retrieval-Augmented Generation

[발표자]
장효영

[요약]
대규모 데이터 셋으로 훈련된 Large Language Mode(LLM)은 범용적인 문장을 생성하거나 번역, 복잡한 언어 관련 작업에 특화되어있으나, 정해진 과거 시점까지의 데이터를 학습하였고, 정제되지 않은 대규모 데이터를 학습했기 때문에 hallucination의 문제가 발생한다. 특히 Knowledge-intensive task에서 이러한 문제를 해결하기 위해 Retrieval Augmented Generation(RAG)가 제안되었다. RAG는 retrieval based model의 강점을 활용하여, 최신 정보를 통합하여 LLM의 성능향상을 도모했다. 다만 여전히 구현이 복잡하고 오랜 응답시간이 소요된다는 단점이 존재하였다.
본 연구는 이러한 한계점들을 직시하고 복잡한 RAG 의 processing step을 해부하여 효과성과 효율성을 고려한 각 처리 단계에서 선택된 method들의 조합으로 성능 향상 및 생성 속도를 가속화하고자 하였다. 사용자의 필요에 따라 성능과 효율성을 고려하여 각 processing step에서 적합한 method들을 선택할 수 있으며, 특히 Query classification module의 중요성 및 Retrieval Module이 RAG process의 처리 시간 대부분을 차지한다는 것을 알 수 있었다. 또한 RAG 방법론의 Mutlimodal로의 확장성을 설명하며, Text-to-Image retrieval과 image-to-text retrieval기능을 통합하였고, Generation 기반의 방법론보다 정보 신뢰성이나, 효율성, 신속성 등 모두에서 더 나음을 제시하였다. 또한 다른 여타 modality에 대한 확장성을 고려해볼 수 있을 것이라 생각되고, 또 본 논문에서 Neural Architecture Search, AutoML concept과 같이 RAG process에서도 최적의 method를 domain specific하게 search해주는 알고리즘의 개발 또한 좋은 연구 방향이 될 수 있을 꺼라 생각되었다.

[관련 논문]
- Searching for Best Practices in Retrieval-Augmented Generation

[발표 링크]
https://us02web.zoom.us/rec/share/BgB5G2P5OJCAj-QXnuT4UWB48m190YiEAHzYvm-nX4XUXvd-uLJvYwzXQxkV5T_H.zOM-siDUGlLDwt2H?startTime=1721871619000

첨부파일

댓글목록

등록된 댓글이 없습니다.