军棋机器人UCT算法及计算机博弈行为研究

发布时间：2023-02-21 11:06

　　机器人技术是当今世界备受关注的前沿课题,伴随着近年来人工智能技术不断的发展,机器人技术也成为了一个令人浮想联翩的技术领域。本文以大家喜闻乐见的中国传统的非完备信息二人军棋计算机博弈作为研究对象,军棋博弈的每方拥有25个棋子、12种类型棋子,每个棋子的级别、灵活性、价值都不相同,且双方都对彼此的策略一无所知,只能靠推理猜测决定走步,博弈过程中既要学会预防对方的欺骗又要学会蒙骗对手,加入机器人技术的情感识别能够帮助计算机博弈算法更好的识别对方策略,减少因对手欺骗而造成的损失,进而提升计算机博弈程序的战斗力。论文创新工作体现在如下几点:1)利用历史启发表来指导蒙特卡罗算法对敌方棋子隶属度进行模拟,极大的节省了模拟时间,并在我方棋子估值上针对军棋棋子种类多,估值缺乏适时性等问题上提出一种基于探索与收益均衡思想的Q-learning学习算法,完善了博弈过程中的动态估值系统,提高了估值的时效性。2)提出基于UCT搜索策略的高价值棋子筛选方法,形成一种多棋子协同博弈方法,实现了多棋子协同对弈,提升了军棋计算机博弈系统中棋子的团体协同性、沟通性、欺骗性、引诱性等高级对抗能力。3)结合博弈机器人意图情感...

【文章页数】：60 页

【学位级别】：硕士

【文章目录】：
摘要
Abstract
第1章绪论
    1.1 课题研究背景
        1.1.1 机器人学
        1.1.2 计算机博弈
    1.2 国内外研究现状
        1.2.1 国外研究现状
        1.2.2 国内研究现状
    1.3 本课题研究意义
    1.4 本文主要工作
        1.4.1 具体研究内容
        1.4.2 本文组织结构
第2章计算机博弈关键技术分析
    2.1 博弈基本原理
    2.2 博弈相关研究方法
        2.2.1 博弈搜索树
        2.2.2 搜索复杂度分析
        2.2.3 开局库与残局库分析
    2.3 经典博弈算法介绍
        2.3.1 极大极小值算法
        2.3.2 alpha-beta剪枝算法
        2.3.3 蒙特卡罗算法
        2.3.4 UCT算法
        2.3.5 强化学习算法
    2.4 本章小结
第3章军棋计算机博弈模型构建
    3.1 博弈分类及军棋博弈简介
    3.2 军棋非完备信息博弈分析
        3.2.1 非完备信息棋局处理
        3.2.2 启发式棋子隶属度估计
    3.3 动态估值策略实现
        3.3.1 棋子四大要素介绍及初始化
        3.3.2 棋子动态估值及实现
    3.4 动态估值参数优化及性能对比
    3.5 本章小结
第4章基于UCT的协同搜索策略
    4.1 多棋子协同定义
    4.2 Q学习算法应用
    4.3 UCT算法进行高价值棋子的发现
    4.4 改进性能对比
    4.5 本章小结
第5章意图博弈机器人行为规划
    5.1 博弈机器人行为规划模型
    5.2 对手意图的识别与行为预测
        5.2.1 对手行为序列预估
        5.2.2 引入意图对手行为序列
        5.2.3 行为序列集
    5.3 系统设计及效果展示
        5.3.1 意图博弈机器人系统设计
        5.3.2 实验结果分析
    5.4 本章小结
第6章总结与展望
    6.1 本文的主要工作及创新点
    6.2 未来工作与展望
致谢
参考文献
个人简历、在学期间发表的学术论文及取得的研究成果

本文编号：3747600

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3747600.html

上一篇：基于分步式自适应学习的参数辨识方法
下一篇：基于多策略融合的混合多目标蝗虫优化算法

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|