搜索页_Sarsa算法

中图分类法(12)

工业技术(12)

在“CNKI学位论文”中，命中：12条，耗时：0.011992 秒

1.强化学习方法及其应用研究

作者：黄炳强

关键词：强化学习(RL) ; 归一化径向基函数(NRBF) ; 函数逼近 ; 模糊控制 ; 递阶遗传算法(HGA) ; 神经网络 ; Multi-Agent ; 分布式Q-学习 ; 联合动作

论文级别：博士

学位年度：2007

2.具有认知能力的智能机器人行为学习方法研究

作者：王作为

关键词：认知模型 ; ODMDP ; 时空联想记忆网络 ; SLAM ; (k-M)(k-P) ; Sarsa算法

论文级别：博士

学位年度：2010

3.基于巩固学习的网络蜘蛛搜索策略研究

作者：李学勇

关键词：网络蜘蛛 ; 专业搜索引擎 ; 巩固学习 ; 模拟退火

论文级别：硕士

学位年度：2003

4.强化学习在足球机器人仿真中的应用

作者：刘飞

关键词：强化学习 ; 多智能体 ; SARSA算法 ; 仿真足球机器人 ; 瞬时差分算法

论文级别：硕士

学位年度：2012

5.软件体系结构自适应模型及其智能化研究

作者：王苹

关键词：软件体系结构 ; 自适应 ; 在线规划 ; 强化学习

论文级别：硕士

学位年度：2011

6.强化学习在仿真足球机器人决策中的应用研究

作者：韦庆丹

关键词：强化学习 ; Sarsa ; 足球机器人 ; 状态空间 ; 离散化

论文级别：硕士

学位年度：2011

7.机器人足球防御仿真中强化学习方法的研究

作者：范建明

关键词：强化学习 ; MAS ; Actor-Critc ; RoboCup ; 函数近似

论文级别：硕士

学位年度：2006

8.径向基函数网络和实例学习在强化学习中的应用

作者：林联明

关键词：强化学习 ; 智能主体 ; 马尔可夫决策过程 ; 径向基函数网络 ; 值函数近似 ; 即时差分 ; 实例学习

论文级别：硕士

学位年度：2005

9.基于模拟退火-Q学习的移动机器人路径规划技术研究

作者：郭娜

关键词：机器人 ; 路径规划 ; 强化学习 ; Q学习 ; 模拟退火 ; 模糊推理

论文级别：硕士

学位年度：2009

10.基于强化学习的模糊神经网络控制研究及应用

作者：侯志鹏

关键词：模糊神经网络 ; 强化学习 ; 非线性系统

论文级别：硕士

学位年度：2007

1

2

按检索点细分(12)

目录(7)

关键词(2)

摘要(6)

按论文级别细分(12)

博士(2)

硕士(10)

按学位年度细分(12)

2003年(1)

2005年(1)

2006年(3)

2007年(2)

2009年(1)

2010年(1)

2011年(2)

2012年(1)