• 计及运行风险的无功优化强化学习智能算法

    计及运行风险的无功优化强化学习智能算法

    论文摘要为提高电力系统的运行安全性,文中将电力系统风险评估理论引入到传统无功优化中,建立了考虑运行风险的多目标无功优化数学模型,并为此提出了一种全新的迁移部落强化学习算法,该算...
  • 基于强化自组织映射和径向基神经网络的短期负荷预测

    基于强化自组织映射和径向基神经网络的短期负荷预测

    论文摘要径向基(radialbasisfunction,RBF)神经网络因其泛化能力强、收敛速度快的特点广泛应用于负荷预测。但传统采用K-means和自组织映射(self-or...
  • 基于Q学习算法的土石方调配模型及应用

    基于Q学习算法的土石方调配模型及应用

    论文摘要土石方调配问题是水利水电工程设计和施工中一个重要问题,传统解决方法包括线性规划、大系统分解协调、动态规划等,存在一定的局限性。本文尝试运用强化学习中离散型Q学习的方法解...
  • 基于D3QN的交通信号控制策略

    基于D3QN的交通信号控制策略

    论文摘要交叉口是城市路网的核心和枢纽,合理优化交叉口的信号控制可以极大地提高城市交通体系的运行效率,而将实时交通信息作为输入并动态调整交通信号灯的相位时间成为了当前研究的重要方...
  • 考虑源荷随机性的跨区互联电网直流联络线调度学习优化

    考虑源荷随机性的跨区互联电网直流联络线调度学习优化

    论文摘要在跨区互联电网中,充分利用直流联络线调度能力可以有效地平衡电力资源的配置,促进新能源的消纳.本文针对源荷不确定性的跨区互联电网直流联络线调度问题,首先用连续马尔科夫过程...
  • 基于改进强化学习的无人艇集群一致性控制

    基于改进强化学习的无人艇集群一致性控制

    论文摘要针对传统的建模研究方法在应用于无人水面艇集群时会遇到复杂的动态海洋环境问题,提出了一种新的多智能体马尔可夫决策过程控制框架,将一致性控制和势博弈理论结合起来.在强化学习...
  • 基于多线程并行强化学习的建筑节能方法

    基于多线程并行强化学习的建筑节能方法

    论文摘要提出一种基于并行强化学习的建筑节能方法,该方法结合多线程技术和经验回放方法提出一个多线程并行强化学习算法框架,其新颖点在于:在经验回放过程中引入自模拟度量方法,通过计算...
  • 基于机动预测的强化学习无人机空中格斗研究

    基于机动预测的强化学习无人机空中格斗研究

    论文摘要在无人机空中格斗过程中,由于无人机自身状态以及空战态势,敌我双方机动动作及行为策略的选择具有极强的不确定性。针对这个问题,将强化学习方法引入无人机空中格斗过程,建立无人...
  • 固定翼无人机强化学习控制建模与算法设计

    固定翼无人机强化学习控制建模与算法设计

    论文摘要为了高效利用专家飞行示范数据,使固定翼无人机在面对重复性任务时具有一定的学习能力,提出了一种针对同类任务的强化学习控制算法。在建立无人机动力学模型与学习模型的基础上,考...
  • 支持强化学习多智能体的网电博弈仿真平台

    支持强化学习多智能体的网电博弈仿真平台

    论文摘要多智能体博弈仿真平台,可为智能网电作战单元提供智能体训练和验证环境,可为网电智能体提供任务场景、训练数据并评估训练结果.分析并设计了网电作战多智能体博弈仿真平台的主要功...
  • 基于DDPG的无人车智能避障方法研究

    基于DDPG的无人车智能避障方法研究

    论文摘要本文中提出一种基于强化学习的无人车智能避障方法。鉴于无人车运动必须满足内外约束,包括汽车动力学约束和交通规则约束,且动作输出必须连续,而传统强化学习无法应对连续动作空间...
  • 强化学习在城市交通信号灯控制方法中的应用

    强化学习在城市交通信号灯控制方法中的应用

    论文摘要悉尼自适应交通控制系统(SCATS)、绿信比-周期-相位差优化技术(SCOOT)及Smooth着深圳城市交通流量急剧增长,深圳交警在自主研发Smooth分布式、自适应调...
  • 无人驾驶车辆路径规划算法综述

    无人驾驶车辆路径规划算法综述

    论文摘要路径规划作为无人驾驶领域重点研究问题之一,近年来越来越受到人们的关注。在深入研究路径规划的基础上,对现有路径规划算法进行了分析。首先介绍了传统算法、智能优化算法、基于强...
  • 社区居家养老随机路径规划问题研究

    社区居家养老随机路径规划问题研究

    论文摘要随着中国老龄化情况的加重,居家养老行业的需求在数量和质量两个维度都稳步上升,因此本文将研究重点定位于此领域内一个新颖但复杂度很高的问题——人口密集型社区背景下的居家养老...
  • 基于强化学习的部分线性离散时间系统的最优输出调节

    基于强化学习的部分线性离散时间系统的最优输出调节

    论文摘要本文针对同时具有线性与非线性未知动态干扰情况下的离散时间的部分线性系统的输出调节问题,提出了仅利用在线数据的基于强化学习的数据驱动控制方法.首先,该问题可拆分为一个受约...
  • 复杂网络中自组织接种策略研究

    复杂网络中自组织接种策略研究

    论文摘要一直以来,传染病对人类健康和生命造成了严重的威胁,了解人类自愿接种疫苗行为在根除疫苗可预防传染病方面发挥着至关重要的作用。近年来,复杂网络理论与流行病学相结合已经成为流...
  • 一种高效的经验回放模块设计

    一种高效的经验回放模块设计

    论文摘要针对深度Q网络(DQN)应用中基于python数据结构直接实现的经验回放过程时常成为性能瓶颈,提出一种具有高性能及通用性的经验回放模块设计方案。该设计方案具有两层软件结...
  • 基于深度时序差分强化学习的非置换流水车间调度问题研究

    基于深度时序差分强化学习的非置换流水车间调度问题研究

    论文摘要流水线是制造系统中广泛采用的一类生产模式。业已证明机器数超过三台的流水车间调度问题为NP难问题,对该问题的研究有重要的理论和工程价值。传统调度问题解决方法包括数学建模、...
  • 基于强化学习的智能通信干扰决策技术研究

    基于强化学习的智能通信干扰决策技术研究

    论文摘要随着人工智能的发展,将人工智能与电子战结合的认知电子战技术也得到了越来越多的重视。而智能通信干扰决策则是认知电子战的一个重要研究方向。智能通信干扰决策本质上是一个决策问...
  • 复杂空战环境下基于博弈模型的无人机机动决策方法研究

    复杂空战环境下基于博弈模型的无人机机动决策方法研究

    论文摘要随着无人机技术的发展,对无人机空战机动决策的问题提出了新的要求。本文以博弈论为基础,结合智能求解算法,对复杂空战环境下的无人机机动决策的方法进行研究,主要研究内容包括:...