导读:本文包含了计算机围棋论文开题报告文献综述、选题提纲参考文献,主要关键词:围棋,计算机,神经网络,人工智能,深度,算法,网络。
计算机围棋论文文献综述写法
崔恺旭[1](2019)在《计算机围棋强化学习中的神经网络》一文中研究指出近年来人工智能领域,作为计算机科学领域热门的分支之一,其研究发展迅速,尤其在深度学习领域有了很多重要的发现与成果。围棋作为最古老的策略游戏,因为其庞大的搜索空间和任务复杂度,使得计算机围棋一直以来都是人工智能领域的一个难题,而随着人工智能领域的研究和发展,一直困扰着科学界的计算机围棋问题也逐渐得以解决,DeepMind提出将深度学习应用与计算机围棋,并且与强化学习结合的方法,该方法在计算机围棋领域取得了不错的成绩。但是因为DeepMind的方法需要使用大量的TPU和GPU资源作为计算基础,所以在国内还没有一个成熟的计算机围棋系统。因此如何摆脱TPU和GPU资源的依赖,使用国产的计算资源和深度学习框架,构建一套成熟的计算机围棋深度强化学习系统流程结构,以及其中的深度神经网络模型,成为了国内学者研究的问题。本论文工作研究了深度学习,强化学习,深度强化学习,计算机围棋四者之间的关系,从而设计出一套成熟的计算机深度强化学习系统。根据计算机围棋深度强化学习系统的需求设计出一套流程结构并实现,包括自对弈系统,围棋样本的存储,深度神经网络输入特征的提取与读取,深度神经网络模型结构,深度神经网络模型超参数等。本文主要讲述计算机围棋深度强化学习系统中的流程结构与深度学习部分。本次研究在国产计算节点上使用国产深度学习框架,构建了完整的计算机围棋深度强化学习系统,并且进行了大规模的分布式训练,得到一个有效的计算机围棋模型。(本文来源于《北京邮电大学》期刊2019-06-05)
程思雨,林锋[2](2019)在《计算机围棋AlphaGo算法对人类围棋算法的影响》一文中研究指出作为一种具有时代意义的计算机围棋算法,深度学习方法使得计算机围棋AlphaGo迅速击败人类高手,本文在分析了计算机围棋深度学习算法的同时,发展变化了几种人类传统围棋算法和定式,并将其应用到实战中。概述现代围棋由19*19个纵横交叉点组成,每个交叉点可以有黑、白和空叁种状态,其变化度约有10的300次方,(本文来源于《中国科技信息》期刊2019年02期)
余磊,陈涵[3](2018)在《基于模式匹配和静态评估的计算机围棋布局问题求解算法》一文中研究指出提出了一种基于模式匹配和静态评估的计算机围棋布局问题求解方法,包括候选棋步的产生、量化以及最佳棋步的确定等;并据此实现了一个围棋布局问题求解程序BeginGame。通过测试,职业棋手评估BeginGame处理布局问题的水平约为业余1段,其棋力完全可以应用于当前的围棋对弈软件中,在计算机博弈、人工智能、游戏软件的研究中具有实际应用意义。(本文来源于《数字技术与应用》期刊2018年12期)
袁溪[4](2018)在《浅谈计算机围棋中的搜索算法》一文中研究指出围棋讲究的是下棋者之间的博弈,这种博弈人工智能的开发也成为相关人员研究开发的的重点课题。可以说,发展人工智能,和棋类博弈有着密不可分的关系,研究发现,大部分棋类博弈人工智能的结果是不错的,但是围棋的成效和突破却不太有明显,本文主要对计算机围棋中的搜索算法进行了简要分析,希望对计算机围棋研究有所帮助。(本文来源于《科技风》期刊2018年12期)
王力[5](2018)在《价值神经网络在计算机围棋的优化研究》一文中研究指出对于人工智能来说,棋类由于其巨大的复杂度一直是最具有挑战的游戏。围棋自从被创造出来,已经有数千年的历史了,在19路围棋中,即棋盘是由19*19个纵横交叉点组成的,每个交叉点都有黑白空叁种不同的状态,则博弈树的复杂度在10的300次方左右,其天文数字远远的超过了宇宙中原子的个数。在象棋与国际象棋被计算机用穷举加上搜索的方法战胜了世界上顶级的棋手后,围棋成为了人工智能最想要征服的游戏。但是,传统的计算机围棋程序面对职业围棋棋手时仍然被让3到4子,在2015年国际学术界普遍认为解决围棋问题至少需要10年到20年的时间。但是,2016年3月,DeepMind团队的人工智能程序AlphaGo以4比1的成绩战胜了韩国棋手世界围棋冠军李世乭九段,引起了围棋界以及人工智能界的广泛关注,这对于计算机围棋来说具有跨时代的意义,AlphaGo所使用的深度学习技术也成为人们关注和讨论的热点。AlphaGo围棋程序程序通过决策与评估两个大脑的组合进行围棋的对弈,策略大脑对当前盘面进行下一步棋的选择,评估大脑对当前的盘面进行大局观的评价。本文主要研究AlphaGo的价值神经网络的设计与实现,通过从围棋数据集的制作,到价值神经网络模型的复现,从网络训练过程中的算法优化,到实现一个36层深度残差价值神经网络,最后进行大规模分布式的神经网络的训练,并训练出更为精确的价值神经网络。本文研究的目的在于设计出一个更为精确的价值神经网络,该网络可以准确的预测出当前盘面的黑子与白子的胜率,具有很好的大局观,从而可以提升计算机围棋的水平,同时价值神经网络的工作模式可以应用解决生活中的估值问题。本文相较于AlphaGo的价值神经网络在数据集制作,网络模型的构建和大规模分布式训练方面都有较大的改进,从而提升了估值的准确性。(本文来源于《北京邮电大学》期刊2018-03-17)
吴修竹[6](2018)在《残差策略网络在计算机围棋的应用研究》一文中研究指出虽然近年来人工智能技术在各个领域中迅速发展,但是围棋因其自身的复杂度一直以来都是人工智能领域中的难解之题,一直到两叁年前,国际学术界仍普遍认为真正解决围棋问题至少需要10到20年的时间。为了解决这一问题,DeepMind公司设计的AlphaGo计算机围棋将卷积神经网络带入到计算机围棋的问题中,通过该方法AlphaGo战胜了代表围棋职业棋手顶尖水平的李世石九段与柯杰九段,宣告了人类真正在人工智能领域上解决了围棋问题,而如何进一步提高计算机围棋棋力成为学者们继续探索的方向。提高计算机围棋棋力的主要方法是提高计算机围棋中卷积神经网络的正确率,但是随着网络层数加深,卷积神经网络会因为网络过于复杂出现过拟合的情况。前微软研究员何凯明法发明的深度残差网络有效的解决了这一问题,深度残差网络可以极大的增强深度学习网络的表达能力,使其能够轻松的训练高达150层的网络,从而实现网络精度的提高。本文在研究AlphaGo中策略网络模型的基础上,设计了策略网络与深度残差网络相结合的残差策略网络,从而实现计算机围棋棋力的提高。本文首先对AlphaGo中的策略网络模型以及深度残差网络的基本原理进行了研究。其次根据策略网络的要求进行数据收集、整理以及处理的工作,并根据这些数据复现了 AlphaGo的策略网络。之后本在此基础上本文完成了对残差策略网络的数据,并使用相同数据对残差策略网络进行了实现与训练。最终经过实验比较发现,残差策略网络与比原始的策略网络相比具有更高的精度,可以有效的提高计算机围棋的棋力。(本文来源于《北京邮电大学》期刊2018-03-17)
贺天琦[7](2017)在《浅谈计算机围棋中的搜索算法》一文中研究指出随着科技的发展,人工智能的开发很受追捧,博弈已经成为人工智能研究的重点目标。他们是相互促进的关系,因为人工智能的发展在很大程度上依靠博弈的发展。虽然棋类博弈的结果令人满意,但是在围棋领域却依旧不理想,没有较大的突破。因此,近年来才有众多的人力和物力投入到计算机围棋研究上。(本文来源于《新校园(中旬)》期刊2017年09期)
陈经[8](2017)在《计算机处理围棋复杂的能力压倒了人类》一文中研究指出2016年3月以及2017年5月,在与李世石和柯洁两位最顶尖人类棋手的两次围棋人机大战中,Alpha Go分别以4:1和3:0的比分获胜。围棋界从对计算机围棋评价不高,到承认计算机已经彻底战胜了人类棋手,只有短短的一年多时间。文章介绍蒙特卡罗树形搜索、策略网络、价值网络、强化学习等围棋算法思想,回顾计算机围棋算法不断发展直至处理复杂的能力超过人类棋手的历程,并展望人工智能对围棋与社会的影响。(本文来源于《物理》期刊2017年09期)
高春生[9](2017)在《计算机围棋中落子预测与死活问题的研究》一文中研究指出计算机围棋一直以来都是计算机博弈和人工智能领域关注的焦点。计算机围棋虽然规则简单,但其棋面变化多端,也由此造成了计算机围棋博弈的高复杂度,纯粹地靠暴力搜索去计算围棋的落子点是现代计算机根本无法完成的任务,因此必须引入人工智能的方法去解决这一问题。从计算机围棋研究至今,大量的人工智能算法应用于计算机围棋,例如模式匹配、UCT算法、神经网络、K-means算法等机器学习的算法都在不同程度上促进了计算机围棋研究的不断发展。在9*9大小的棋盘上,经过海内外学者的不断研究,计算机围棋水平已经达到职业棋手的棋力水平,但通常在大型的正式比赛中,围棋棋盘大小多采用的是19*19大小的棋盘,在19*19大小的棋盘上,计算机围棋的棋力也已经达到专业棋手水平。本文主要通过最大熵算法对19*19大小的棋盘上的落子预测进行研究以及通过UCT算法对围棋死活题的求解进行研究,本文主要内容如下:1)对计算机围棋进行简单介绍,引出本文的主要研究工作以及解决方案,为研究工作的开展做出相应的准备。2)本文采用最大熵算法和 OWL-QN(Orthant Wise Limited-memory Quas i-Newton)算法对计算机围棋落子进行预测,通过使用不同大小的模式模板对棋盘进行模式匹配,为每个提取到的模式使用Zobrist哈希进行编码,通过最大熵算法和OWL-QN算法对提取到的模式数据进行训练得到模型,然后使用该模型在测试数据上进行测试。实验表明在500个棋谱上获得20.58%的正确率,训练所采用的时间和空间性能上均有很大的提升。3)在围棋死活问题的求解上,传统的求解只能处理封闭边界的死活题。本文提出了一种开放边界围棋死活题的UCT(Upper Confidence bounds for Trees)求解算法。首先根据给定阈值,通过计算棋盘上每一空点的隶属度来确定搜索区域,然后用包围色的搜索区域比被包围色大一圈的特殊UCT算法求解给定开放边界死活题。实验表明,该算法能够在不使用围棋专有知识,不添加额外棋子的条件下,正确求解《李昌镐精讲围棋死活》第一卷中全部123道死活题中的101道,正确率为82.1%,并且大部分死活题都能在较宽的阈值区间里求得正确解,只有一小部分死活题对阈值敏感,其求得正确解的阈值区间较小。(本文来源于《昆明理工大学》期刊2017-05-01)
赵冬斌,邵坤,朱圆恒,李栋,陈亚冉[10](2016)在《深度强化学习综述:兼论计算机围棋的发展》一文中研究指出深度强化学习将深度学习的感知能力和强化学习的决策能力相结合,可以直接根据输入的图像进行控制,是一种更接近人类思维方式的人工智能方法.自提出以来,深度强化学习在理论和应用方面均取得了显着的成果.尤其是谷歌深智(Deep Mind)团队基于深度强化学习方法研发的计算机围棋"初弈号–Alpha Go",在2016年3月以4:1的大比分战胜了世界围棋顶级选手李世石(Lee Sedol),成为人工智能历史上一个新里程碑.为此,本文综述深度强化学习的发展历程,兼论计算机围棋的历史,分析算法特性,探讨未来的发展趋势和应用前景,期望能为控制理论与应用新方向的发展提供有价值的参考.(本文来源于《控制理论与应用》期刊2016年06期)
计算机围棋论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
作为一种具有时代意义的计算机围棋算法,深度学习方法使得计算机围棋AlphaGo迅速击败人类高手,本文在分析了计算机围棋深度学习算法的同时,发展变化了几种人类传统围棋算法和定式,并将其应用到实战中。概述现代围棋由19*19个纵横交叉点组成,每个交叉点可以有黑、白和空叁种状态,其变化度约有10的300次方,
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
计算机围棋论文参考文献
[1].崔恺旭.计算机围棋强化学习中的神经网络[D].北京邮电大学.2019
[2].程思雨,林锋.计算机围棋AlphaGo算法对人类围棋算法的影响[J].中国科技信息.2019
[3].余磊,陈涵.基于模式匹配和静态评估的计算机围棋布局问题求解算法[J].数字技术与应用.2018
[4].袁溪.浅谈计算机围棋中的搜索算法[J].科技风.2018
[5].王力.价值神经网络在计算机围棋的优化研究[D].北京邮电大学.2018
[6].吴修竹.残差策略网络在计算机围棋的应用研究[D].北京邮电大学.2018
[7].贺天琦.浅谈计算机围棋中的搜索算法[J].新校园(中旬).2017
[8].陈经.计算机处理围棋复杂的能力压倒了人类[J].物理.2017
[9].高春生.计算机围棋中落子预测与死活问题的研究[D].昆明理工大学.2017
[10].赵冬斌,邵坤,朱圆恒,李栋,陈亚冉.深度强化学习综述:兼论计算机围棋的发展[J].控制理论与应用.2016