学习自动机论文_周剑敏,胡海刚,钱云霞

导读:本文包含了学习自动机论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:自动机,网络,传感器,信道,节点,算法,时分多址。

学习自动机论文文献综述

周剑敏,胡海刚,钱云霞[1](2019)在《WSN中利用广义学习自动机和休眠机制的部分覆盖方法》一文中研究指出为了解决无线传感器网络(WSN)部分覆盖中的能耗问题,提出一种基于广义学习自动机(GLA)和休眠机制的部分覆盖方法。首先,将WSN网络构建成一个连通图模型。然后,通过GLA算法从中选择一定数量的节点构成主干网络。最后,检查主干网络是否满足部分覆盖要求,并根据各节点的覆盖性能来选择合适的休眠节点进行激活,从而以最少数量的节点来满足覆盖要求,并保持节点之间的连通性。仿真结果表明:该方法能选择传感器节点来满足覆盖条件,减少了工作节点数量,提升了WSN的寿命。(本文来源于《重庆理工大学学报(自然科学)》期刊2019年11期)

王冲,姜金川[2](2019)在《基于分布式学习自动机和用户反馈的网页排序算法研究》一文中研究指出为了改善传统PageRank算法存在的不足,例如平分链接权重、主题漂移和忽略用户兴趣,提出一种基于分布式学习自动机和用户反馈的网页排序算法。利用页面内容的相似性、网页之间的超链接和用户遍历的路径,根据分布式学习自动机来确定网页间的超链接权重。考虑到用户反馈包含大量的价值信息,选择用户的转载、回复以及有效点击特征作为用户的行为特征,获得用户反馈因子。根据网页间的超链接权重和用户反馈因子计算每个网页的排名。仿真实验表明,与传统的PageRank算法和WPR算法相比,该算法在一定程度上提高了信息检索的精准度和用户满意度。(本文来源于《计算机应用与软件》期刊2019年03期)

狄冲,齐开悦,吴越,苏宇,李生红[3](2018)在《基于双重竞争策略的学习自动机算法》一文中研究指出学习自动机是增强学习理论体系中的重要组成部分,在应用数学的随机函数优化、信息安全的异常检测等理论和实际问题中发挥着重要作用.估计器算法是目前学习自动机中最为主流的一类算法,具有最高的算法性能.但是,由于估计器本身的局限性导致在学习初期估计值不准确,行为选择概率向量无法一直保持最优更新,且概率向量的更新完全依赖于固定步长,一次错误的更新需要大量额外的迭代来对其进行弥补,算法的收敛效率仍存在提升空间.针对上述问题,通过改进估计器算法的概率向量更新策略,提出一种基于双重竞争策略的学习自动机算法,并对其ε-收敛特性进行数学证明.实验结果显示,该算法提高了学习自动机的收敛效率,从而验证并确立了所提策略的有效性和算法的优越性.(本文来源于《上海交通大学学报》期刊2018年10期)

李明,胡江平[4](2018)在《基于学习自动机的异构有向传感器节点调度算法》一文中研究指出现有有向传感器网络调度算法多数只面向同构传感器节点,而未考虑节点异构性对算法性能的影响。为此,提出一种基于学习自动机的异构有向节点调度算法。将节点调度问题转化为集合覆盖问题后,利用学习自动机的特性自适应地更新所选取感知方向的概率,从而构建多个满足条件的节点覆盖集合。仿真结果表明,与贪婪算法相比,该算法能有效减少能量消耗并延长网络寿命。(本文来源于《计算机工程》期刊2018年08期)

檀华丽,夏娜,伊君,欧元肖[5](2018)在《基于协作型学习自动机的多信道TDMA调度算法研究》一文中研究指出无线传感器网络是一个资源受限的网络系统,因此该系统中的数据汇聚存在通信冲突多、最小调度长度大的缺点。目前主要采用多信道技术优化网络性能,其中多信道时分多址(time division multiple access,TDMA)调度是一个关键问题。文章首先将多信道TDMA调度问题描述为图的顶点着色问题;然后提出一种基于协作型学习自动机的顶点着色算法,该算法利用学习自动机与周围环境进行信息交互以更新动作概率矢量,并合理利用顶点间的约束关系和各顶点的度提高自身和相邻顶点的学习效率,根据这种协作机制使得在有限次迭代之后获得最优的资源调度方案;最后通过大量的仿真实验证明了该算法所求解的网络资源调度方案相比于现有方法具有更小的网络冲突和最小调度长度。(本文来源于《合肥工业大学学报(自然科学版)》期刊2018年03期)

郝圣,张沪寅,宋梦凯[6](2018)在《基于学习自动机理论与稳定性控制的自适应移动无线Ad Hoc网络分簇策略》一文中研究指出移动无线Ad Hoc网络(MANET)是一种自组织、自配置的多跳无线网络.它不依赖于预先存在的基础通信设施或中心管理方式.分簇策略已被证明是一种能够模仿固定通信设施并提高网络可扩展性的有效途径.它能够将网络划分成若干子网并且被广泛地用于网络管理、资源管理、层次路由设计、服务质量改善与网络安全检测.在移动无线Ad Hoc网络中,频繁的节点移动、不佳的节点分布会减少簇的生存时间、降低通信质量并增加通信开销,而这些问题势必会降低簇的稳定性.此外,如何在动态环境下有效地调整分簇结构也是我们需要重点考虑的问题.一种高效的分簇策略应该是自适应的并且能够根据当前的网络环境与节点状态预测自身的分簇行为变化.针对上述问题,该文提出了基于学习自动机理论与稳定性控制的自适应MANET分簇策略(LASCA).文中首先推导出簇的期望生存时间模型与簇的可靠性通信度量模型.在此基础上,该文设计了簇首的稳定性度量模型进行簇首选择.该模型能够保证所选择的簇首节点构成的簇具有较好的生存时间且节点分布产生较小的通信开销,同时具有较高的通信可靠性,即提高了分簇的稳定性.针对以往工作并未考虑如何在动态分簇重构过程中降低簇首选择开销的情况,该文随后利用学习自动机理论构建了分簇行为认知模型,给出了节点簇首选择行为与概率函数的映射关系,并通过感知网络环境反馈对概率函数进行更新,从而有效地调整动态环境下的分簇结构,减少了不必要的簇首选择计算开销.实验结果表明,该文提出的分簇策略在稳定性指标方面有很好的表现,有效地降低了簇首节点与成员节点的更新次数,并在一定程度上降低了通信开销与簇首选择的计算开销.其中,在最大移动速度为10m/s的Random waypoint移动模型中,WCA、FCA、TVCA的簇首节点累积更新次数与该文提出的算法相比平均增多了39.4%、18.0%、20.4%,WCA、FCA、TVCA的成员节点累积更新次数与该文提出的算法相比平均增多了44.7%、7.2%、36.5%.该文提出的算法为后续设计具有分层结构的路由协议提供了良好的拓扑稳态控制机制,同时为后续构建复杂动态网络的行为认知模型提供了一定的理论启示.(本文来源于《计算机学报》期刊2018年09期)

顾金媛,章国安[7](2018)在《认知无线mesh网络中基于协作学习自动机的自适应信道分配算法》一文中研究指出在认知无线mesh网络多信道环境中处理繁重的数据业务是一项具有挑战性的任务。为了解决这个问题,提出了一种新的基于协作学习自动机(learning automata,LA)的自适应信道分配算法(CLACAA)。在所提出的算法中,LA被部署在邻近的互相协作的次用户上。为了LA能自适应地更新其动作概率向量,设计了一种线性奖赏无为方案;定义了一种新的信道利用率因子用于信道选择,以解决信道冲突发生的问题;给出了当信道由于大量输入请求而过载时的信道切换方案。实验仿真结果表明,该算法在提升网络吞吐量和数据传输率、降低切换时延和缓冲时延上有明显的优势。(本文来源于《计算机应用研究》期刊2018年11期)

葛昊[8](2017)在《学习自动机理论及其在信息传播最大化中的应用研究》一文中研究指出加强学习(Reinforcement Learning)作为机器学习的一大分支,也作为人工智能的支撑技术,近年来受到了研究人员的广泛关注。加强学习对于待学习的问题不需要有任何先验知识和模型假设,并且与监督学习不同,加强学习的训练过程是通过环境反馈完成的,不需要提供带有正确标签的训练样本,而学习过程则是仅仅把环境当作一个黑盒子,以闭环的结构,通过试错的方式,在环境反馈的指导下,收敛到在该环境中的最优行为。由于这个特性,加强学习被广泛的运用在智能决策、自适应控制等方面。学习自动机(Learning Automata)作为最早被研究的非关联(non-associative)加强学习算法,其形式简单、易于实现,具有快速随机优化能力、较强的抗噪声能力以及完备地收敛性等优点。学习自动机在解决图着色、随机最短径、随机函数优化等理论问题和无线网络频谱分配、图像处理、模式识别等工程问题上都得到了广泛的应用。但是随着近年来应用场景的不断复杂化以及待求解问题规模的不断增大,传统学习自动机算法面临着新的困难与挑战。追求收敛更加快速、准确的学习自动机算法,在此基础上,拓展学习自动机理论使之适应新的应用场景成为领域内的研究热点与发展趋势。有鉴于此,本文深入研究了学习自动机算法,从多种不同角度在收敛速率等性能方面对基于估计器的学习自动机算法做出了改进。并且,在上述理论研究成果的基础上,将学习自动机运用到解决信息传播最大化问题。具体的研究工作简述如下:第一,本文基于对前人研究的总结,深入探讨了学习自动机数学模型和学习框架、性能评价指标及评估方法,详细介绍了经典结构可变学习自动机算法等基础知识,并进行了相应的归纳和总结。第二,针对目前基于最大似然估计器学习自动机算法收敛速率相对较慢的问题,本文分析了现有最大似然估计的优势与局限性,研究了基于置信区间估计器的学习自动机算法。相对于最大似然估计器,置信区间估计器不但能给出对于行为奖励概率的精确估计,并且能够反映估计误差的大小,为学习自动机的决策提供了更丰富的信息,从而有利于学习自动机更快的收敛。基于这个思想,本文提出了适用于所有估计器学习自动机算法的通用估计技术。该技术可以通过改造估计器的方式提升现有基于估计器学习自动机的收敛速率,严格的收敛性证明和充分的仿真实验证实了所提出方法的优越性。第叁,针对某些学习自动机与环境交互的代价比较高的特殊应用场景中,学习自动机的参数调节消耗巨大的问题,研究了无需参数调节学习自动机算法。基于贝叶斯理论,提出了基于贝叶斯推断的收敛判断机制。利用最优化的思想,提出了一种确定性的行为采样策略,选取最优的行为使之尽快收敛。在上述收敛判断机制和行为采样策略的基础上,提出了参数免调节的学习自动机(PFLA:parameter-free learning automata)。从理论上证明了,PFLA的准确率下界与环境特性无关,进一步证明了PFLA的ε-最特优性。从实验仿真上验证了,一组通用的参数可以使PFLA适应不同的环境,而不用针对每个环境单独调参。仿真结果还说明了,PFLA的收敛速度快于大部分确定性估计器算法。第四,鉴于目前大多数环境反馈是利用计算机仿真生成的,为了利用当前丰富的多核、多CPU甚至集群等硬件资源来加速算法的收敛过程,本文对传统的并行化算法CP P A和基于分散学习的并行化方案DLP S进行了结合改进。基于前述提出的置信区间估计,提出了可以通用于大多数基于估计器学习自动机算法的并行化方案EPS。仿真实验说明利用EPS方案优于传统并行化算法CPPA和DLPS方案。此外,本文还讨论了针对的参数免调节学习自动机PFLA的并行化算法,提出的并行化PFLA算法有效地继承了参数免调节的优良特性,并具有更快的收敛速度。第五,基于前述提出的置信区间估计器学习自动机算法,研究了社交网络中的信息传播最大化问题。首先,将信息传播最大化问题映射成学习自动机的学习问题。其次,对于映射问题的实际特点,将P-型随机环境中的置信区间估计器学习自动机算法拓展到S-型随机环境中;最后,利用学习自动机迭代式地选取种子节点,在选取节点的过程中,利用了传播范围函数的子模型,并以一定的方式继承每次迭代后的估计值。基于此,本文提出了基于学习自动机的信息传播最大化方法(IMLA:Influence Maximization Learning Automata)及两种改进算法。IMLA算法及其改进算法避免了传统贪婪算法需要大量蒙特卡洛仿真的缺点,也避免了其他启发式算法收敛效果差的缺点,适合在大规模社交网络上运行。在叁个真实世界网络数据集上的仿真实验表明,提出的信息传播最大化方法具有更快的计算速度和更好的传播范围。综上所述,本文对平稳随机环境中的学习自动机算法进行了深入的探索和研究,提出了一系列有效的学习自动机改进算法,为基于学习自动机解决方案的广泛应用提供了理论依据和实验参考。(本文来源于《上海交通大学》期刊2017-10-12)

杜丽艳,李磊,姚庆华,刘宏君[9](2016)在《基于学习自动机的智能变电站多目标无功优化》一文中研究指出针对风电场的无功优化和电压稳定问题,结合其并网的智能变电站内的静止无功补偿器(SVC),提出了一种综合考虑SVC和双馈风电机组(DFIG)的无功电压协调控制策略。采用学习自动机求解多目标无功优化的最优权衡解,在满足风电场公共接入点的电压要求的同时,使得风电场无功源的无功裕度更大。最后,以华东某风电场进行算例分析,验证了所提无功电压协调控制策略的可行性和有效性。(本文来源于《电测与仪表》期刊2016年24期)

张峰[10](2016)在《基于元胞学习自动机的机会网络路由算法研究》一文中研究指出近年来,为了解决在网络被频繁分裂成多个不同子网的极端环境下的消息通信问题,在已有移动自组网(Mobile Ad-hoc Networks,MANETs)的基础上提出了机会网络(Opportunistic Networks)的概念,并被广泛应用于各种复杂场景中,例如,灾难救助、野生动物追踪、交通网络等。机会网络的特点是间歇性的节点连接,比较大的消息传输延迟,经常性的传输中断。不同于传统的MANETs,在机会网络中消息传输路径上不会始终存在端到端的连接,如何在这种情况下进行消息的路由转发引起了研究者们极大的兴趣和关注,并提出了存储-携带-转发的新型路由方式。为了刻画机会网络中拓扑结构的动态性、节点相遇的随机性,引入元胞学习自动机(Cellular Learning Automata,CLA)理论来刻画机会网络中移动节点之间通过相互作用、互相影响、互相协助完成网络中消息的路由转发过程。通过对网络中研究对象定义相应的状态和动作,使之和元胞学习自动机中的元胞状态和动作空间一一对应,利用元胞学习自动机可以根据周围随机环境状态自动调整自身动作的概率,从而作出当前状态下最优策略的特点,达到提升机会网络路由算法性能的目的。论文的主要工作概括如下;(1)提出了一种基于动态不规则元胞多学习自动机的拥塞控制策略,利用元胞学习自动机和周围邻居交互来更新动作概率的方法,根据当前节点和所有邻居节点上对相同消息的存储情况,刻画局部网络中消息的分布和状态。当机会网络中的节点由于存储空间不足而产生拥塞时,按照当前量化的消息丢弃概率对消息进行丢弃处理。实验仿真结果表明,相比已有的根据节点和消息自身状态进行节点拥塞控制的方法,所提出的拥塞控制策略,可以有效地提高消息的投递成功率,降低网络的负载率和端到端的传输延迟。(2)提出了一种能量均衡的节点缓存管理策略,根据节点当前所处局部网络环境中能量的使用情况,制定相应的规则来动态地调整各自节点上所要接收消息的门限阈值。当节点缓存空间溢出时,只接收符合当前门限范围内消息,从而有效地降低了在局部范围内相对静止的节点之间由于频繁乒乓传输相同消息造成的能量浪费。实验仿真结果表明,提出的缓存管理策略提升了消息的投递成功率,降低了网络的负载率,改善了节点的剩余能量和节点剩余能量之间的标准差,从而延长网络寿命,保证了网络连通性。(3)提出了一种基于元胞学习自动机的机会网络路由算法,综合考虑了存储-携带-转发路由模式中各个阶段的因素。在存储过程中计算了消息的投递概率并按照消息的丢弃概率进行节点的拥塞控制;在携带过程中通过设定节点接收消息的门限阈值来均衡节点之间的能量消耗;在转发过程中估算节点之间的连接持续时间来减少消息碎片对节点能量的浪费。通过ONE仿真环境下的实验表明,提出的路由算法能够有效提升机会网络中消息投递成功率、降低消息投递延迟、均衡节点之间的能量消耗,从而提升网络整体性能。(4)提出了 一种自适应的n-Epidemic路由算法,动态地根据节点和所有邻居节点组成的局部环境中能量的使用情况对算法中的参数n进行调整。可以减缓机会网络中n-Epidemic路由算法采用静态参数n时,造成的网络中不同活跃度节点在能量消耗方面不均衡的现象。基于ONE的仿真实验表明,根据节点和邻居节点剩余能量情况来各自独立地动态调整参数n的自适应n-Epidemic路由算法,能够更好地满足节点对能量适应性的要求,均衡网络中不同节点之间的能量消耗,有效地延长了节点的使用寿命。本文从机会网络存储-携带-转发的消息路由机制出发,利用动态不规则元胞学习自动机理论来刻画机会网络中节点独立移动、节点资源有限、节点间歇连通的特性,提出了一系列基于元胞学习自动机的路由模型和算法,完善和丰富了机会网络路由问题的研究方法。通过大量实验验证了所提出方法的有效性,并且设计的算法和已有算法有良好的兼容性,具有重要的理论意义和应用价值。(本文来源于《陕西师范大学》期刊2016-11-01)

学习自动机论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

为了改善传统PageRank算法存在的不足,例如平分链接权重、主题漂移和忽略用户兴趣,提出一种基于分布式学习自动机和用户反馈的网页排序算法。利用页面内容的相似性、网页之间的超链接和用户遍历的路径,根据分布式学习自动机来确定网页间的超链接权重。考虑到用户反馈包含大量的价值信息,选择用户的转载、回复以及有效点击特征作为用户的行为特征,获得用户反馈因子。根据网页间的超链接权重和用户反馈因子计算每个网页的排名。仿真实验表明,与传统的PageRank算法和WPR算法相比,该算法在一定程度上提高了信息检索的精准度和用户满意度。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

学习自动机论文参考文献

[1].周剑敏,胡海刚,钱云霞.WSN中利用广义学习自动机和休眠机制的部分覆盖方法[J].重庆理工大学学报(自然科学).2019

[2].王冲,姜金川.基于分布式学习自动机和用户反馈的网页排序算法研究[J].计算机应用与软件.2019

[3].狄冲,齐开悦,吴越,苏宇,李生红.基于双重竞争策略的学习自动机算法[J].上海交通大学学报.2018

[4].李明,胡江平.基于学习自动机的异构有向传感器节点调度算法[J].计算机工程.2018

[5].檀华丽,夏娜,伊君,欧元肖.基于协作型学习自动机的多信道TDMA调度算法研究[J].合肥工业大学学报(自然科学版).2018

[6].郝圣,张沪寅,宋梦凯.基于学习自动机理论与稳定性控制的自适应移动无线AdHoc网络分簇策略[J].计算机学报.2018

[7].顾金媛,章国安.认知无线mesh网络中基于协作学习自动机的自适应信道分配算法[J].计算机应用研究.2018

[8].葛昊.学习自动机理论及其在信息传播最大化中的应用研究[D].上海交通大学.2017

[9].杜丽艳,李磊,姚庆华,刘宏君.基于学习自动机的智能变电站多目标无功优化[J].电测与仪表.2016

[10].张峰.基于元胞学习自动机的机会网络路由算法研究[D].陕西师范大学.2016

论文知识图

基于学习自动机的电力系统混杂控...基于多维学习自动机阵列的模糊控...基于学习自动机算法的FNN输出序...3层递阶结构的学习自动机模式基于学习自动机的学习系统结构开关多级学习自动机

标签:;  ;  ;  ;  ;  ;  ;  

学习自动机论文_周剑敏,胡海刚,钱云霞
下载Doc文档

猜你喜欢