请输入您要查询的英文单词:

 

单词 expected reward
例句
原声例句
问答进行中

Now, remember, the goal of an agent in a reinforcement learning problem is to learn how to interact with it environment to maximize an expected reward.

现在,请记住,强化学习问题中代理的目标是学习如何与其环境交互以最大化预期奖励。

随便看

 

英语例句辞典收录519880条英汉例句词条,基本涵盖了全部常用单词的造句方法及例句,是英语学习的有利工具。

 

Copyright © 2004-2022 Newdu.com All Rights Reserved
京ICP备09058993号 更新时间:2025/7/16 8:26:48