IM 即时通讯-在线客服新闻资讯 - 环信

TensorFlow 2.0深度强化学习指南

发布于 2019-03-05 15:13:09 | 阅读 40090

在本教程中，我将通过实施Advantage Actor-Critic(演员-评论家，A2C)代理来解决经典的CartPole-v0环境，通过深度强化学习（DRL）展示即将推出的TensorFlow2.0特性。虽然我们的目标是展示TensorFlow2.0，但我将尽最大努力让DRL的讲解更加平易近人，包括对该领域的简要概述。

TensorFlow 深度强化学习深度学习

AlphaGo是怎么做强化学习

发布于 2017-11-29 11:23:48 | 阅读 35310

本文是强化学习名作——“Reinforcement Learning: an Introduction”一书中最为重要的内容，旨在介绍学习强化学习最基础的概念及其原理，让读者能够尽快的实现最新模型。毕竟，对任何机器学习实践者来说，RL（强化学习，即Reinforcement Learning）都是一种十分有用的工具，特别是在AlphaGo的盛名之下。

周排行

▲环信私有化即时通讯 PaaS 全面升级！助力企业打造更安全、可控、稳定的通信系统！

技术咨询已转移到管理后台，请先登录

即时通讯云使用者请在应用详情页面咨询
客服云使用者请进入管理员模式咨询

登录即时通讯云

登录客服云

×

电话咨询

微信咨询

注册客服

环信即时通讯云——100注册用户永久免费

环信MQTT——免费开通每月赠送额度

环信PUSH——1000个DAU免费

注册享福利、赢好礼