제어 (최적화/ 강화학습)

강화학습 기반 마이크로그리드 control - 5) TD3/ SAC 등 ‘진보된’ continuous control을 쓴다면?

2023-07-01

Deep Deterministic Policy Gradient (DDPG) 로 도출한 수전/송전의 continuous control이, 놀랍게도(?) Vincent의 마이크로그리드 사례에서는, DQN으로 도출한 3-actions discrete control 대비 더 좋지 않았다 ...

강화학습 기반 마이크로그리드 control - 4) DDPG를 이용한 ‘continuous’ control 도출

2023-06-25

실제로는 수전/송전이 continuous action임에도, Vincent의 마이크로그리드 사례에선 ‘discrete’ action (1.1kW 수전/ 1.1kW 송전/ idle)으로도 충분히 economic control이 가능했다. 그렇다면, continuous action을 ...

강화학습 기반 마이크로그리드 control - 3) Deep Q-Network를 통한 3-action control 도출

2023-06-11

Vincent의 마이크로그리드 사례에서 Q-learning의 concept를 이용하기 위해, 실제로는 수전/송전이 continuous한 값임에도 불구하고, 1.1kW 수전/ 1.1kW 송전/ idle 의 3가지 action만을 고려하기로 했다. 각 action 별 인덱스는 0, 1...

강화학습 기반 마이크로그리드 control - 2) 강화학습의 기본, Q-learning 리뷰

2023-06-10

지난 포스팅에서, Vincent의 태양광 기반 마이크로그리드의 누적 비용을 최소화하는 최적 control 문제를 소개했다. 또한 이를 선형계획법으로 풀 경우 ‘미래의 태양광 발전량과 부하를 안다’라는, ‘비현실적’인 가정 하의 control을 도출함을 보였다.

Jeonghun Song

제어 (최적화/ 강화학습)

강화학습 기반 마이크로그리드 control - 5) TD3/ SAC 등 ‘진보된’ continuous control을 쓴다면?

강화학습 기반 마이크로그리드 control - 4) DDPG를 이용한 ‘continuous’ control 도출

강화학습 기반 마이크로그리드 control - 3) Deep Q-Network를 통한 3-action control 도출

강화학습 기반 마이크로그리드 control - 2) 강화학습의 기본, Q-learning 리뷰