基于三元多臂赌博机的树结构最优动作识别

基于三元多臂赌博机的树结构最优动作识别

论文摘要

蒙特卡罗树搜索(MCTS)在棋类博弈问题中展现出卓越的性能,但目前多数研究仅考虑胜负两种反馈从而假设博弈结果服从伯努利分布,然而这种设定忽略了常出现的平局结果,导致不能准确地评估盘面状态甚至错失最优动作。针对这个问题,首先构建了基于三元分布的多臂赌博机(TMAB)模型并提出了最优臂确认算法TBBA;然后,将TBBA算法应用到三元极大极小采样树(TMST)中,提出了简单迭代TBBA算法的TBBA_tree算法和通过将树结构转化成TMAB的TMST最优动作识别(TTBA)算法。在实验部分,建立了两个精度不同的摇臂空间并在其基础上构造了多个具有对比性的TMAB和TMST。实验结果表明,相比均匀采样算法,TBBA算法准确率保持稳步上升且部分能达到100%,TBBA算法准确率基本保持在80%以上且具有良好的泛化性和稳定性,不会出现异常值和波动区间。

论文目录

  • 0 引言
  • 1 相关工作
  • 2 三元多臂赌博机的最优臂确认
  •   2.1 基于三元分布的多臂赌博机
  •   2.2 三元多臂赌博机的最优臂确认算法
  • 3 三元极大极小采样树最优动作识别
  •   3.1 基于三元分布的极大极小采样树
  •   3.2 TMST最优动作识别算法
  • 4 实验与结果分析
  •   4.1 度量标准
  •   4.2 TBBA算法实验结果
  •   4.3 TBBA_tree、TTBA算法实验结果
  • 5 结语
  • 文章来源

    类型: 期刊论文

    作者: 刘郭庆,王婕婷,胡治国,钱宇华

    关键词: 蒙特卡罗树搜索,三元多臂赌博机,最优臂确认,序列决策,纯探索

    来源: 计算机应用 2019年08期

    年度: 2019

    分类: 信息科技,基础科学

    专业: 数学

    单位: 山西大学大数据科学与产业研究院,计算机智能与中文信息处理教育部重点实验室(山西大学),山西大学计算机与信息技术学院

    基金: 国家自然科学基金资助项目(61672332,61432011,U1435212),山西省自然科学基金资助项目(201701D121052)~~

    分类号: O225

    页码: 2252-2260

    总页数: 9

    文件大小: 376K

    下载量: 66

    相关论文文献

    • [1].基于视频的学生动作识别方法研究[J]. 仪器仪表用户 2020(01)
    • [2].基于双流独立循环神经网络的人体动作识别[J]. 现代电子技术 2020(04)
    • [3].基于视频的人体动作识别算法研究[J]. 南方农机 2020(11)
    • [4].融合双重注意力机制的复合头部动作识别[J]. 电子测量技术 2020(11)
    • [5].视频中动作识别任务综述[J]. 智能计算机与应用 2020(03)
    • [6].基于运动注意力模块的多分支动作识别网络[J]. 工业控制计算机 2020(07)
    • [7].基于特征蒸馏的实时人体动作识别[J]. 工业控制计算机 2020(08)
    • [8].基于多特征融合的舞蹈动作识别技术研究[J]. 电子设计工程 2020(18)
    • [9].基于异构多流网络的多模态人体动作识别[J]. 信号处理 2020(09)
    • [10].基于视频的人体动作识别算法综述[J]. 计算机应用研究 2020(11)
    • [11].基于深度学习的视频场景下的人体动作识别研究[J]. 数字技术与应用 2020(09)
    • [12].基于规则的连续动作识别[J]. 高技术通讯 2019(09)
    • [13].基于深度学习的动作识别方法简述[J]. 中国传媒大学学报(自然科学版) 2019(05)
    • [14].实时动作识别方法研究[J]. 计算机工程与应用 2017(03)
    • [15].基于多示例多特征的人体动作识别[J]. 信息技术 2016(12)
    • [16].基于关节点运动轨迹的人体动作识别[J]. 宁夏大学学报(自然科学版) 2017(02)
    • [17].基于表面肌电信号特征的动作识别[J]. 辽东学院学报(自然科学版) 2017(01)
    • [18].特征降维和高斯混合模型的体育运动动作识别[J]. 现代电子技术 2017(11)
    • [19].结合特权信息的人体动作识别[J]. 中国图象图形学报 2017(04)
    • [20].基于关节间夹角变化序列的动作识别算法研究[J]. 计算机应用与软件 2017(06)
    • [21].基于隐任务学习的动作识别方法[J]. 北京理工大学学报 2017(07)
    • [22].基于深度学习框架的多模态动作识别[J]. 计算机与现代化 2017(07)
    • [23].基于局部保持典型相关分析的零样本动作识别[J]. 天津大学学报(自然科学与工程技术版) 2017(09)
    • [24].基于时序深度置信网络的在线人体动作识别[J]. 自动化学报 2016(07)
    • [25].人体动作识别中的深度学习模型选择[J]. 电子世界 2016(15)
    • [26].基于视频的动作识别研究[J]. 黑龙江科技信息 2016(26)
    • [27].智能手机动作识别系统线性反馈控制算法[J]. 科技通报 2015(06)
    • [28].基于层级化特征的人体动作识别[J]. 信息技术 2015(11)
    • [29].动作识别技术及其发展[J]. 电视技术 2013(S2)
    • [30].基于视觉的人体动作识别综述[J]. 计算机学报 2013(12)

    标签:;  ;  ;  ;  ;  

    基于三元多臂赌博机的树结构最优动作识别
    下载Doc文档

    猜你喜欢