用GAIL及Pytorch解出MountainCar有賞金 - 財經

Table of Contents

用GAIL(Generative Adversarial Imitation Learning)及Pytorch解出MountainCar-v0
, 賞金五千元。
使用原始的TRPO或PPO來訓練policy均可,也可將原始的GAN換成Wasserstein GAN 。 底
下連結可供參考,至少專家軌跡是可用的。

一旦成功完成,請寄給我結果和部份程式的截圖,我就會將錢匯入指定帳戶,然後再把原
始碼寄給我即可

https://github.com/alanyuwenche/GAIL_MountainCar_CartPole

--

All Comments

Madame avatarMadame2020-12-28
交易完成,問題已解決