TF-Agents使新的 Bandits 和 RL 算法的实施、部署和测试变得更加容易。它提供了经过良好测试的模块化组件,可以修改和扩展。它支持快速代码迭代,具有良好的测试集成和基准测试。要开始使用,我们建议您查看我们的 Colab 教程之一。如果您需要 RL 简介(或快速回顾),请 从此处开始。否则,请查看我们的 DQN 教程以在 Cartpole 环境中启动和运行智能体。当前稳定版本的 API 文档位于 tensorflow.org上。
TF-Agents 正在积极开发中,接口可能随时更改。欢迎反馈和评论。
在 TF-Agents 中,RL 算法的核心元素被实现为Agents
. 智能体包含两个主要职责:定义与环境交互的策略,以及如何从收集的经验中学习/训练该策略。
目前在 TF-Agents 下可以使用以下算法:
TF-Agents 库包含一个全面的 Multi-Armed Bandits 套件,包括 Bandits 环境和智能体。RL 智能体也可以在 Bandit 环境中使用。里面有教程 bandits_tutorial.ipynb
。和准备运行的示例 tf_agents/bandits/agents/examples/v2
TF-Agents 每晚发布稳定版本。有关版本列表,请阅读 版本部分。下面的命令包括从pypi.org以及从 GitHub 克隆安装 TF-Agents stable 和 nightly 。
运行以下命令以安装最新的稳定版本。该版本的 API 文档位于 tensorflow.org上。
You can't use 'macro parameter character #' in math mode
Math input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input error$Math input error$ git clone Math input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input error$Math input error$ git checkout v0.12.0
如果你想安装 TF-Agents 和被 pip 依赖检查标记为不兼容的 Tensorflow 或 Reverb版本,使用下面的模式需要你自担风险。
Math input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input error$Math input error$ pip install --user dm-reverb $ pip install --user tf-agents
如果您想在 TensorFlow 1.15 或 2.0 中使用 TF-Agents,请安装 0.3.0 版:
\#较新版本的 tensorflow-probability 需要较新版本的 TensorFlow。 Math input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input errorMath input error$Math input error$ pip install tf-agents==0.3.0
. 我们建议安装 TensorFlow ( tf-nightly
) 和 TensorFlow Probability ( tfp-nightly
) 的夜间版本,因为这些是 TF-Agents nightly 测试的版本。
# `--force-reinstall 有助于保证正确的版本。 $ pip install --user --force-reinstall tf-nightly $ pip install --user --force-reinstall tfp-nightly $ pip install --user --force-reinstall dm-reverb-nightly #使用 `--upgrade` 标志安装可确保您获得最新版本。 $ pip install --user --upgrade tf-agents-nightly
来自 GitHub
克隆存储库后,可以通过运行来安装依赖项pip install -e .[tests]
。TensorFlow 需要独立安装:pip install --user tf-nightly
有关如何贡献的指南,请参阅。本项目遵守 TensorFlow 的 行为准则。通过参与,您应该遵守此准则。
TF Agents 有稳定的夜间版本。每晚发布通常很好,但由于上游库不断变化,可能会出现问题。下表列出了在每个 TF 智能体版本中测试的 TensorFlow 版本,以帮助可能被锁定到特定 TensorFlow 版本的用户。0.9.0 是与 Python 3.6 兼容的最后一个版本。0.3.0 是与 Python 2 兼容的最后一个版本。
释放分支/标签TensorFlow 版本每晚掌握tf-nightly0.12.0v0. 和 2.0.0
该项目遵循Google 的 AI 原则。通过参与、使用或为本项目做出贡献,您应遵守这些原则。
我们要感谢以下个人为创建 TF-Agents 库所做的代码贡献、讨论和其他工作。
Summer Yue
Kuang-Huei Lee
Yao Lu
@misc{TFAgents, title = {{TF-Agents}: A library for Reinforcement Learning in TensorFlow}, author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and Vincent Vanhoucke and Eugene Brevdo}, howpublished = {\\url{}}, url = "", year = 2018, note = "[Online; accessed 25-June-2019]" }
这不是 Google 的官方产品。