专题首页
中图分类法(12)
工业技术(12)
在“
CNKI学位论文
”中,
命中:
12
条,耗时:0.011992 秒
1.
强化学习方法及其应用研究
作者:
黄炳强
关键词:
强化学习(RL)
;
归一化径向基函数(NRBF)
;
函数逼近
;
模糊控制
;
递阶遗传算法(HGA)
;
神经网络
;
Multi-Agent
;
分布式Q-学习
;
联合动作
论文级别:
博士
学位年度:2007
2.
具有认知能力的智能机器人行为学习方法研究
作者:
王作为
关键词:
认知模型
;
ODMDP
;
时空联想记忆网络
;
SLAM
;
(k-M)(k-P)
;
Sarsa算法
论文级别:
博士
学位年度:2010
3.
基于巩固学习的网络蜘蛛搜索策略研究
作者:
李学勇
关键词:
网络蜘蛛
;
专业搜索引擎
;
巩固学习
;
模拟退火
论文级别:
硕士
学位年度:2003
4.
强化学习在足球机器人仿真中的应用
作者:
刘飞
关键词:
强化学习
;
多智能体
;
SARSA算法
;
仿真足球机器人
;
瞬时差分算法
论文级别:
硕士
学位年度:2012
5.
软件体系结构自适应模型及其智能化研究
作者:
王苹
关键词:
软件体系结构
;
自适应
;
在线规划
;
强化学习
论文级别:
硕士
学位年度:2011
6.
强化学习在仿真足球机器人决策中的应用研究
作者:
韦庆丹
关键词:
强化学习
;
Sarsa
;
足球机器人
;
状态空间
;
离散化
论文级别:
硕士
学位年度:2011
7.
机器人足球防御仿真中强化学习方法的研究
作者:
范建明
关键词:
强化学习
;
MAS
;
Actor-Critc
;
RoboCup
;
函数近似
论文级别:
硕士
学位年度:2006
8.
径向基函数网络和实例学习在强化学习中的应用
作者:
林联明
关键词:
强化学习
;
智能主体
;
马尔可夫决策过程
;
径向基函数网络
;
值函数近似
;
即时差分
;
实例学习
论文级别:
硕士
学位年度:2005
9.
基于模拟退火-Q学习的移动机器人路径规划技术研究
作者:
郭娜
关键词:
机器人
;
路径规划
;
强化学习
;
Q学习
;
模拟退火
;
模糊推理
论文级别:
硕士
学位年度:2009
10.
基于强化学习的模糊神经网络控制研究及应用
作者:
侯志鹏
关键词:
模糊神经网络
;
强化学习
;
非线性系统
论文级别:
硕士
学位年度:2007
1
2
按检索点细分(12)
目录(7)
关键词(2)
摘要(6)
按论文级别细分(12)
博士(2)
硕士(10)
按学位年度细分(12)
2003年(1)
2005年(1)
2006年(3)
2007年(2)
2009年(1)
2010年(1)
2011年(2)
2012年(1)