博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Monte Carlo tree search 学习
阅读量:6217 次
发布时间:2019-06-21

本文共 334 字,大约阅读时间需要 1 分钟。

 

 

UCT算法(Upper Confidence Bound Apply to Tree),即信任度上限树,是一种博弈树搜索算法,该算法将蒙特卡洛树搜索(Monte—Carlo Tree Search,MCTS)方法与UCB公式结合,在超大规模博弈树的搜索过程中相对于传统的搜索算法有着时间和空间方面的优势。

 

UCB1(Upper Confidence Bound) 公式

AMAF(All Moves As First) 它视使棋盘达到某一相同状态的着法都等价的,不论由谁在何时完成

RAVE(Rapid Action Value Estimation) 快速动作值估计

 

 

 

转载于:https://www.cnblogs.com/revoid/p/8865879.html

你可能感兴趣的文章
Ace - Responsive Admin Template
查看>>
redis数据存储系统原理
查看>>
tengine(nginx)安装,lua模块安装
查看>>
Confluence 6 的小型文字档案(Cookies)
查看>>
我的友情链接
查看>>
2016-02-23
查看>>
dstat用法
查看>>
memcache的一致性hash算法使用
查看>>
IP访问控制列表知识要点
查看>>
iOS通过ASIHTTPRequest提交JSON数据
查看>>
Spring IOC源码解析
查看>>
Linux学习常用命令
查看>>
【Python模块】sqlalchemy orm模块--基础(连接数据库,建表,增删改查)
查看>>
高仿微信导航页开门效果
查看>>
Java异常处理
查看>>
MD5、SHA、AES、Rabit 、RC4、TripleDES Ripemd160 加密解密工具
查看>>
js数组相关method
查看>>
php扩展的安装及连接mongo测试
查看>>
计算机的启动过程(详细)
查看>>
关于DDOS简单防范
查看>>