에너지시스템 planning/ scheduling 관련 연구자라면 고급 최적화 기법, 시장 문제에서의 게임이론적 접근, 시계열 데이터 예측 등의 지식들이 필요하다고 느낀 적이 있을 것이다. 관련해 좋은 교육 자료를 소개한다. Technical University of Denmark에서 매년 주최하는 summer school이다.

(홈페이지 (강의 슬라이드들 포함)) (Youtube 채널)

박사과정 동안 해당 채널에서 다루는 주제들의 존재 자체는 알았으나, 이를 체계적으로 공부할 길이 없어 막막했던 기억이 있다. DTU summer school의 존재를 알게 되었을 때, 필자의 박사과정 때 이런 강의들이 제공되었더라면 하는 아쉬움이 들면서도, 이제라도 이 주제들을 공부할 수 있게 되어 그 아쉬움을 덜 수 있어 기뻤다.

해당 채널에서 특히 유익했던 강의들 몇 개를 들자면 아래와 같다.


Market Design for Integrated Energy Systems (Prof. Jalal Kazempour)

이 강의는 크게 3개 파트로 구성되어 있다.

첫번째 파트에서는 유럽과 미국의 전력시장에서 하루전 시장/ 당일 시장/ 실시간 시장의 구성 및 두 대륙 간 차이점, 보조서비스 시장의 유연성 자원 서비스, 유연성 자원에서 커뮤니티의 역할 등을 설명한다. 두번째 파트에서는 전력시장에서의 가격결정 메커니즘을 최적화 문제와 Nash 균형 탐색 문제로써 설명한다. 세번째 파트에서는 섹터커플링 시장 컨셉 및 현실적 한계점에 대해 설명한다.

전력시장의 일반적 구성, 그리고 전력시장에서의 가격결정에 대한 수학적 모델링 등 주제들에 대한 대략적 이해를 단시간 내에 하고 싶은 분들에게 추천한다.


Distributed Optimization (Prof. Jalal Kazempour)

에너지 설비 용량 결정 문제를 연구하는 사람이라면, 긴 기간을 고려할 경우 최적화 문제의 규모가 커져 계산 결과를 제 때 얻기 어렵다는 난점에 대해 고민해 본 적이 있을 것이다.

그리고 이에 관해 Bender’s decomposition 등의 decomposition method 공부를 시도해 본 사람들도 있을 것이다. 그러나 해당 주제는 책 및 논문 등의 텍스트로만 공부하기에는 비교적 어려운 주제이다 (박사과정 당시의 필자가 그랬다…).

이 강의를 통해, Bender’s decomposition의 원리를 이해할 수 있을 것이다. 또한 에너지 설비 용량 같은 ‘공통의 변수’ 는 없지만 ‘공통의 제약’ 이 있어서 문제 크기가 큰 경우에 쓸 수 있는 Lagrangian Relaxation (LR), Alternating Direction Method of Multipliers (ADMM) 기법도 공부할 수 있다.

Jalal Kazempour 교수가 위 두 개 강의 내용을 묶어 구성한 PhD-level course “Advanced Optimization and Game Theory for Energy Systems” 가 있는데, 조만간 해당 강의 영상을 보고 공부하면서 각 강의 별 요약을 블로그에 게재할 계획이다.


Statistical and Machine Learning for Forecasting (Prof. Pierre Pinson)

재생발전량 예측에 필요한 주요 데이터들, 데이터의 특성에 따른 실제 적용 방안 (uncertaint 기반 계산 시 temporal correlation이 강한 경우 단순한 신뢰구간 기반 계산보다 시나리오 기반 계산이 더 좋을 수 있다 등), 예측 오차를 나타내는 지표 등을 설명한다.

또한 최근 무지성으로 범람하고 있는 딥러닝 기반 예측이 아닌, 전통적인 선형회귀 기반 예측 방법에 대해서도 설명한다. 특히 풍속-풍력발전량 간 관계처럼 nonlinear이면서 단순한 polynomial basis로 fitting이 어려운 경우의 local methods, non-stationary data를 plot할 때 주의해야 할 점 및 online-learning을 위한 recursive least square 등의 실제 적용 시 유용한 방법들을 설명한다.


Data Markets for Energy (Prof. Pierre Pinson)

데이터를 ‘사고 파는’ 경우의 비즈니스 모델에 대해 생각해 본 적이 있는가?

아직까지 대부분의 데이터 시장에서는 가격이 ‘Data point 갯수 당’ 또는 ‘데이터 생산 원가에 마진을 붙인 판매가’ 기반으로 결정되거나, 일종의 ‘힘의 논리’ 기반으로 결정되곤 한다.

이 강의에서는, 이러한 단순한 접근을 넘어서 ‘해당 data를 활용하는 특정 분석에서 data 추가로 인한 improvement’ 를 기준으로 가격을 책정하는 방법을 제시한다.

이를테면 특정 회귀분석 대상의 DGP에 관여하는 설명변수들 x1, x2, x3 중 구매자는 x1만 갖고 있을 때 (y는 구매자도 갖고 있음), x1만 사용한 회귀모델의 Mean Squared Error (MSE) 대비 판매자의 data x2와 x3을 구매해 추가한 모델의 MSE가 더 줄어들었다면, MSE의 감소량에 비례하게끔 revenue를 책정하는 것이다.

이 과정에서 data 판매자가 둘 이상일 경우 각 판매자에 대한 금액 분배는 Shapely value나 leave-one-out 등 방법으로 결정한다.

MSE 감소량 기준으로 revenue 책정 시, 판매자가 가짜 데이터가 아닌 진짜로 유익한 데이터를 제공해야 revenue가 증가하므로, 판매자 입장에서 truth-telling이 최적전략이 된다는 장점이 있다고 한다.

물론 몇 가지 현실적인 문제들이 있지만 (모델의 MSE를 구매자가 수긍할 것인지, 수긍 못 하니 모델과 x1을 공개하라고 하면 판매자가 이를 받아들일 지 등), data pricing에 대한 체계적 논의의 출발점으로는 좋은 강의로 보인다.


Trustworthy AI for Power Systems (Prof. Spyros Chatzivasileiadis)

전력시스템의 안전성 여부를 머신러닝/ 딥러닝 모델 기반으로 판단하려는 시도가 이루어지고 있다.

그러나 모델 사용 시 training points 외의 point에 대해서는 필연적으로 interpolation/ extrapolation을 하게 되는데, 딥러닝 모델에서는 아주 조금의 input 차이로도 output이 바뀔 수 있으므로 모델을 마음놓고 쓸 수 없다.

(팬더 사진에 사람 눈으로 볼 수 없는 noise를 추가하니 원숭이로 분류한다든가, 자율주행차량이 신호등을 판단하는 사진에서 픽셀 하나만 바꾸니 틀린 판단을 한다든가 등 사례들을 예시로 든다.)

이 강의에서는, 딥러닝 모델이 ReLU activation들로 구성되었다는 전제 하에 mixed-integer linear programming problem을 구성해서 해당 모델이 제대로 interpolation/ extrapolation을 하는지를 검증할 수 있는 방법을 제시한다.

물론 정수선형계획법 특성상 큰 모델에는 쓸 수 없지만, 정수선형계획법을 이렇게도 활용할 수 있다는 사실에 놀랐던 기억이 있다. 더불어 실제 물리적 시스템에 딥러닝을 적용한다는 것이 쉽지 않다는 교훈도 얻을 수 있었다.


2023년 강의도 조만간 공개될 것으로 예상됨

현재는 Youtube 채널에 2022년 강의까지만 공개되어 있으나, 조만간 2023년 강의가 공개될 것으로 보인다. 2023년을 포함해 매년 summer school 현장 강의가 6월 후반에 열렸고, 2022년 강의 영상이 2022년 8월 초에 공개되었기 때문이다.

2023년 강의 프로그램에도 여러 가지 흥미로운 주제들이 있어, 강의가 공개되면 바로 시청할 계획이다. (data-driven modeling, privacy, online decision-making, business models for hybrid power plants 등)