基于改进Q-学习算法的多阶段群体决策模型

基于改进Q-学习算法的多阶段群体决策模型

论文摘要

多阶段群体决策问题是一类典型的动态群体决策问题,主要针对离散的确定状态下的最优群体决策问题求解.但由于现实环境面临的大部分是不确定状态空间,甚至是未知环境空间(例如状态转移概率矩阵完全未知),为了寻求具有较高共识度的多阶段群体最优策略,决策者需要通过对环境的动态交互来获得进一步的信息.针对该问题,利用强化学习技术,提出一种求解多阶段群体决策的最优决策算法,以解决在不确定状态空间下的多阶段群体决策问题.结合强化学习中的Q-学习算法,建立多阶段群体决策Q-学习基本算法模型,并改进该算法的迭代过程,从中学习得到群体最优策略.同时证明基于Q-学习得到的多阶段群体最优策略也是群体共识度最高的策略.最后,通过一个计算实例说明算法的合理性及可行性.

论文目录

文章来源

类型: 期刊论文

作者: 张峰,刘凌云,郭欣欣

关键词: 群体决策,多阶段群体决策,强化学习,学习,群体共识,不确定性

来源: 控制与决策 2019年09期

年度: 2019

分类: 信息科技,基础科学

专业: 数学,自动化技术

单位: 河北大学数学与信息科学学院,河北省机器学习与计算智能重点实验室

基金: 国家自然科学基金项目(61672205),河北省自然科学面上基金项目(F2017201020,F2018201115),河北省教育厅青年基金项目(QN2015026,QN2017019)

分类号: TP18;O225

DOI: 10.13195/j.kzyjc.2018.0082

页码: 1917-1922

总页数: 6

文件大小: 266K

下载量: 315

相关论文文献

  • [1].混合信息下的多属性大规模群体决策方法[J]. 系统工程与电子技术 2020(11)
  • [2].群体决策的α-偏差比较规则及其在科研评审中的应用[J]. 赤峰学院学报(自然科学版) 2018(12)
  • [3].群体决策的研究范式及决策质量评估方法[J]. 心理技术与应用 2017(10)
  • [4].个体决策与群体决策的对比分析[J]. 智富时代 2017(05)
  • [5].国外群体决策研究进展[J]. 现代情报 2018(05)
  • [6].决策偏好不确定条件下群体决策收敛一致性研究[J]. 运筹与管理 2017(01)
  • [7].群体决策中的群体动力学困境研究--以美国猪湾事件为例[J]. 新闻传播 2017(08)
  • [8].群体决策中从众行为的负效应、成因及应对[J]. 现代商贸工业 2014(18)
  • [9].群体决策研究综述[J]. 吉林省教育学院学报(上旬) 2013(05)
  • [10].普氏原羚集群的群体决策过程[J]. 兽类学报 2013(04)
  • [11].我国政府战略性项目群体决策组织方式研究——基于战略张力理论[J]. 中央财经大学学报 2012(04)
  • [12].基于目标规划的多指标群体决策[J]. 数学的实践与认识 2011(03)
  • [13].菜单中的群体决策[J]. 商界(评论) 2011(04)
  • [14].子群体间交互对动态群体决策观点收敛时间的影响研究[J]. 工业工程 2011(04)
  • [15].群体决策的不良效应[J]. 企业管理 2009(02)
  • [16].群体决策的k-偏差比较规则及在科研评审中的应用[J]. 哈尔滨师范大学自然科学学报 2018(05)
  • [17].基于Digraph-DEMATEL算法的群体决策研究[J]. 北京信息科技大学学报(自然科学版) 2019(05)
  • [18].政府战略项目群体决策组织方式与效果提升研究[J]. 中央财经大学学报 2013(01)
  • [19].多轮次群体决策中专家权重的贝叶斯修正方法研究[J]. 河北企业 2013(08)
  • [20].群体决策法在杜绝护理差错中的应用[J]. 中外妇儿健康 2011(08)
  • [21].教学质量评价中群体决策理论的应用及效能[J]. 教学与管理 2010(03)
  • [22].小议群体决策中的极端性转移与趋中现象[J]. 商业文化(学术版) 2008(06)
  • [23].群体惩罚评分映射的几个性质[J]. 滨州学院学报 2008(03)
  • [24].群体决策中的“沉默螺旋”现象及应对之策[J]. 领导科学 2019(05)
  • [25].基于相容关系协调下群体意见集结方法[J]. 统计与决策 2017(06)
  • [26].基于复杂网络的群体决策个体影响力分析[J]. 西南科技大学学报 2017(02)
  • [27].论群体决策的极端性转移与趋中现象[J]. 商业文化(学术版) 2008(07)
  • [28].企业群体决策的困境[J]. 现代营销(学苑版) 2014(01)
  • [29].基于直觉模糊距离的黑启动群体决策一致性分析与优化[J]. 电力系统自动化 2012(10)
  • [30].体育教学中群体决策的优缺点及影响因素[J]. 教学与管理 2010(27)

标签:;  ;  ;  ;  ;  ;  

基于改进Q-学习算法的多阶段群体决策模型
下载Doc文档

猜你喜欢