IM 即时通讯-在线客服新闻资讯

TensorFlow 2.0深度强化学习指南

发布于 2019-03-05 15:13:09 | 阅读 46532

在本教程中，我将通过实施Advantage Actor-Critic(演员-评论家，A2C)代理来解决经典的CartPole-v0环境，通过深度强化学习（DRL）展示即将推出的TensorFlow2.0特性。虽然我们的目标是展示TensorFlow2.0，但我将尽最大努力让DRL的讲解更加平易近人，包括对该领域的简要概述。

TensorFlow 深度强化学习深度学习