[20230113 통합 세미나] DRL and State Aggregation for Knapsack problems

페이지 정보

profile_image
작성자 강민정
댓글 0건 조회 394회 작성일 23-02-13 11:10

본문

2023.02.10 통합 랩 세미나에서 진행했던 발표 자료 및 링크를 공유 드립니다.

제목: DRL and State Aggregation for Knapsack problems

참고논문: A state aggregation approach for solving knapsack problem with deep reinforcement learning

요약: Deep reinforcement learning에 기반하여 knapsack problem을 해결하려고 한 논문입니다. KP solver는 A2C 알고리즘을 이용하여 policy network와 value network를 학습시키며, q-learning에 기반한 state aggregation을 통해 state space를 줄이려고 하였습니다. 제안하는 KP solver가 KP 유형의 화물 적재와 같은 application에 활용할 수 있을 것으로 기대하고, 또한 DRL을 기반으로 하고 있기 때문에 후속 프로젝트에도 도움이 될 것이라고 생각합니다.

발표 링크: https://us02web.zoom.us/rec/share/6LtLGAYmu5IPEHxA6lyMBLqMGsuNpdr8kb4y84NBzPhRmq0XlvjLj6kKUGnQDKHf.QCuXZIqWgZqc7Npj?startTime=1676004809000

첨부파일

댓글목록

등록된 댓글이 없습니다.