蒙特卡洛树搜索(MCTS)的核心思想是什么?单项选择题
A
它通过对模拟推广活动进行抽样,并参考以往收益统计数据来估算行动价值。
B
它对所有可能的动作序列进行穷举搜索。
C
它利用策略梯度直接优化预期收益
D
它仅从终端节点反向传播精确奖励。
登录即可查看完整答案
我们收录了全球超50000道真实原题与详细解析,现在登录,立即获得答案。
类似问题
Select all of the following statements that are true about Monte Carlo Tree Search (MCTS)
Select all of the following statements that are true about Monte Carlo Tree Search (MCTS)
What is the key idea behind Monte Carlo Tree Search (MCTS)
In a single iteration of the Monte-Carlo Tree Search (MCTS) algorithm, what is the primary purpose of the "Simulate" step (also known as rollout)?
更多留学生实用工具
希望你的学习变得更简单
加入我们,立即解锁 海量真题 与 独家解析,让复习快人一步!