[20230113 통합 세미나] DRL and State Aggregation for Knapsack problems
페이지 정보
본문
2023.02.10 통합 랩 세미나에서 진행했던 발표 자료 및 링크를 공유 드립니다.
제목: DRL and State Aggregation for Knapsack problems
참고논문: A state aggregation approach for solving knapsack problem with deep reinforcement learning
요약: Deep reinforcement learning에 기반하여 knapsack problem을 해결하려고 한 논문입니다. KP solver는 A2C 알고리즘을 이용하여 policy network와 value network를 학습시키며, q-learning에 기반한 state aggregation을 통해 state space를 줄이려고 하였습니다. 제안하는 KP solver가 KP 유형의 화물 적재와 같은 application에 활용할 수 있을 것으로 기대하고, 또한 DRL을 기반으로 하고 있기 때문에 후속 프로젝트에도 도움이 될 것이라고 생각합니다.
발표 링크: https://us02web.zoom.us/rec/share/6LtLGAYmu5IPEHxA6lyMBLqMGsuNpdr8kb4y84NBzPhRmq0XlvjLj6kKUGnQDKHf.QCuXZIqWgZqc7Npj?startTime=1676004809000
제목: DRL and State Aggregation for Knapsack problems
참고논문: A state aggregation approach for solving knapsack problem with deep reinforcement learning
요약: Deep reinforcement learning에 기반하여 knapsack problem을 해결하려고 한 논문입니다. KP solver는 A2C 알고리즘을 이용하여 policy network와 value network를 학습시키며, q-learning에 기반한 state aggregation을 통해 state space를 줄이려고 하였습니다. 제안하는 KP solver가 KP 유형의 화물 적재와 같은 application에 활용할 수 있을 것으로 기대하고, 또한 DRL을 기반으로 하고 있기 때문에 후속 프로젝트에도 도움이 될 것이라고 생각합니다.
발표 링크: https://us02web.zoom.us/rec/share/6LtLGAYmu5IPEHxA6lyMBLqMGsuNpdr8kb4y84NBzPhRmq0XlvjLj6kKUGnQDKHf.QCuXZIqWgZqc7Npj?startTime=1676004809000
첨부파일
-
20230210_DRN_knapsack.pdf (1.2M)
DATE : 2023-02-13 11:10:54 -
refaei-afshar20a.pdf (668.9K)
DATE : 2023-02-13 11:10:54
- 이전글[20230210] Multiple Object Tracking(SORT, DeepSORT) 23.02.13
- 다음글[20230201 최적화] Introduction to Operation Research 23.02.02
댓글목록
등록된 댓글이 없습니다.