李羽戈:桥牌叫牌机器博弈模型及算法研究论文

李羽戈:桥牌叫牌机器博弈模型及算法研究论文

本文主要研究内容

作者李羽戈(2019)在《桥牌叫牌机器博弈模型及算法研究》一文中研究指出:研究牌类机器博弈对推动经济社会非完备信息场景下决策与控制具有实际意义。桥牌作为规则最复杂的牌类游戏之一,分为叫牌博弈和打牌博弈,本文针对叫牌研究机器博弈算法。在传统叫牌机器博弈研究中,基于专家经验的蒙特卡洛采样作为目前效果最好的技术,已经面临发展壁垒,难以实现突破。本文创造性地将叫牌问题域分解为首叫、无争叫、有争叫三个具有演进关系的子问题域,并分别运用深度学习和强化学习进行研究,降低研究坡度,试图让机器在一定程度上理解叫牌含义,摆脱人类叫牌经验的限制。本文以新睿桥牌公司线上平台玩家在中国桥牌协会标准自然体系CCBA下叫牌产生的大量数据为研究支点,以模型学会在CCBA体系下进行首叫为基本目标,然后将模型从首叫问题域演进到无争叫和有争叫问题域,用强化学习方法尝试优化模型动作策略。针对叫牌机器博弈研究面临的非完备信息特性、正确学习叫牌体系、手牌和叫牌序列信息表示、准确表达叫牌传递信息、方位通用、信息离散、PASS特殊性、合作性、博弈性等关键问题,本文设计了7种不同的神经网络输入层,每种输入层解决多个关键问题。然后以7种神经网络输入层为核心,设计了首叫算法、无争叫算法、有争叫算法,进行了算法实现。结果显示,首叫算法达到了设计目的,无争叫算法与有争叫算法效果不佳,并且首叫算法和无争叫算法中分功能一维占位输入层的表现最好,有争叫算法中三维占位输入层的表现最好。最后,根据算法实现结果,分析了可能存在的问题,并根据问题确定了未来的工作方向。

Abstract

yan jiu pai lei ji qi bo yi dui tui dong jing ji she hui fei wan bei xin xi chang jing xia jue ce yu kong zhi ju you shi ji yi yi 。qiao pai zuo wei gui ze zui fu za de pai lei you hu zhi yi ,fen wei jiao pai bo yi he da pai bo yi ,ben wen zhen dui jiao pai yan jiu ji qi bo yi suan fa 。zai chuan tong jiao pai ji qi bo yi yan jiu zhong ,ji yu zhuan jia jing yan de meng te ka luo cai yang zuo wei mu qian xiao guo zui hao de ji shu ,yi jing mian lin fa zhan bi lei ,nan yi shi xian tu po 。ben wen chuang zao xing de jiang jiao pai wen ti yu fen jie wei shou jiao 、mo zheng jiao 、you zheng jiao san ge ju you yan jin guan ji de zi wen ti yu ,bing fen bie yun yong shen du xue xi he jiang hua xue xi jin hang yan jiu ,jiang di yan jiu po du ,shi tu rang ji qi zai yi ding cheng du shang li jie jiao pai han yi ,bai tuo ren lei jiao pai jing yan de xian zhi 。ben wen yi xin rui qiao pai gong si xian shang ping tai wan jia zai zhong guo qiao pai xie hui biao zhun zi ran ti ji CCBAxia jiao pai chan sheng de da liang shu ju wei yan jiu zhi dian ,yi mo xing xue hui zai CCBAti ji xia jin hang shou jiao wei ji ben mu biao ,ran hou jiang mo xing cong shou jiao wen ti yu yan jin dao mo zheng jiao he you zheng jiao wen ti yu ,yong jiang hua xue xi fang fa chang shi you hua mo xing dong zuo ce lve 。zhen dui jiao pai ji qi bo yi yan jiu mian lin de fei wan bei xin xi te xing 、zheng que xue xi jiao pai ti ji 、shou pai he jiao pai xu lie xin xi biao shi 、zhun que biao da jiao pai chuan di xin xi 、fang wei tong yong 、xin xi li san 、PASSte shu xing 、ge zuo xing 、bo yi xing deng guan jian wen ti ,ben wen she ji le 7chong bu tong de shen jing wang lao shu ru ceng ,mei chong shu ru ceng jie jue duo ge guan jian wen ti 。ran hou yi 7chong shen jing wang lao shu ru ceng wei he xin ,she ji le shou jiao suan fa 、mo zheng jiao suan fa 、you zheng jiao suan fa ,jin hang le suan fa shi xian 。jie guo xian shi ,shou jiao suan fa da dao le she ji mu de ,mo zheng jiao suan fa yu you zheng jiao suan fa xiao guo bu jia ,bing ju shou jiao suan fa he mo zheng jiao suan fa zhong fen gong neng yi wei zhan wei shu ru ceng de biao xian zui hao ,you zheng jiao suan fa zhong san wei zhan wei shu ru ceng de biao xian zui hao 。zui hou ,gen ju suan fa shi xian jie guo ,fen xi le ke neng cun zai de wen ti ,bing gen ju wen ti que ding le wei lai de gong zuo fang xiang 。

论文参考文献

  • [1].基于状态抽象和残局解算的二人非限制性德州扑克策略的研究[D]. 胡开亮.哈尔滨工业大学2017
  • [2].非完备信息机器博弈算法及对手模型的研究[D]. 吴天栋.武汉理工大学2018
  • [3].基于深度强化学习的3D游戏的非完备信息机器博弈研究[D]. 朱航宇.哈尔滨工业大学2018
  • [4].基于深度强化学习的非完备信息机器博弈研究[D]. 王鹏程.哈尔滨工业大学2017
  • [5].基于虚拟遗憾最小化算法的非完备信息机器博弈研究[D]. 代佳宁.哈尔滨工业大学2017
  • [6].基于Q学习算法的非完备信息机器博弈的研究[D]. 李昌.哈尔滨工业大学2015
  • [7].围棋博弈机器学习算法的研究及应用[D]. 唐艳.重庆理工大学2012
  • [8].基于虚拟遗憾最小化算法的德州扑克机器博弈研究[D]. 滕雯娟.哈尔滨工业大学2015
  • [9].Q-学习在非完备信息机器博弈中的应用[D]. 林靖.哈尔滨工业大学2009
  • [10].幻影围棋非完美信息机器博弈问题关键算法研究[D]. 李洪业.东北大学2014
  • 读者推荐
  • [1].基于深度强化学习的无人驾驶车道保持决策的研究[D]. 方川.南京大学2019
  • [2].基于群体的深度强化学习超参数自适应方法研究[D]. 周银达.中国科学技术大学2019
  • [3].基于强化学习的文本情感分析算法研究[D]. 陈锐奇.北京邮电大学2019
  • [4].基于深度强化学习的视频游戏模拟算法研究[D]. 许江涛.哈尔滨理工大学2019
  • [5].基于样本增强的强化学习在对话管理中的应用[D]. 鲁科烃.中国科学技术大学2019
  • [6].基于强化学习的倒立摆控制算法研究[D]. 杨文乐.西安理工大学2019
  • [7].基于深度迁移学习的赖氨酸乙酰化位点预测问题的研究[D]. 李佳根.东北师范大学2019
  • [8].基于深度强化学习的自供能UDN网络下资源分配方案[D]. 李瀚.北京邮电大学2019
  • [9].利用深度强化学习实现智能网络流量控制[D]. 杨冉.北京邮电大学2019
  • [10].基于DQN的主动人员感知与定位技术研究[D]. 高峰.山东大学2018
  • 论文详细介绍

    论文作者分别是来自北京邮电大学的李羽戈,发表于刊物北京邮电大学2019-07-19论文,是一篇关于桥牌叫牌论文,非完备信息论文,博弈论文,问题域分解论文,北京邮电大学2019-07-19论文的文章。本文可供学术参考使用,各位学者可以免费参考阅读下载,文章观点不代表本站观点,资料来自北京邮电大学2019-07-19论文网站,若本站收录的文献无意侵犯了您的著作版权,请联系我们删除。

    标签:;  ;  ;  ;  ;  

    李羽戈:桥牌叫牌机器博弈模型及算法研究论文
    下载Doc文档

    猜你喜欢