导读:本文包含了遗传聚类论文开题报告文献综述、选题提纲参考文献,主要关键词:算法,籽粒,自交系,数据,牧草,近邻,拓扑。
遗传聚类论文文献综述写法
王杰,王艳[1](2019)在《基于量子遗传聚类算法的质量控制方法》一文中研究指出提出一种基于量子遗传聚类算法的质量控制图识别方法。该方法分为质量特征提取和模式分类2个流程。将量子遗传算法和K-means算法相结合,基于一种量子旋转门旋转方向确定机制提出一种量子遗传聚类算法,采用实验仿真的方式验证了该算法的性能。运用所提量子遗传算聚类算法对质量数据进行聚类分析,基于此提出一种控制图特征描述方法。以该特征为输入,运用支持向量机识别所对应的质量控制图模式。所提方法得到了更好的聚类结果,且该控制图识别方法识别精度达到了98.63%。(本文来源于《系统仿真学报》期刊2019年12期)
宋飞豹[2](2019)在《遗传聚类算法的改进及其在基因表达数据分析中的应用》一文中研究指出近年来,cDNA微阵列技术的出现和应用,使得基因表达数据被大量检测出来,从而为人类在分子层级分析疾病提供了充足的样本数据。而如何通过海量的基因表达数据挖掘出有用的信息,便成了当前的研究热点。聚类算法作为数据挖掘中的重要算法,是对基因表达数据分析的一个有效手段,科研人员常利用聚类算法找出相似基因,从而利用已知的基因表达数据分析出样本的显着性特点。在众多聚类算法中,k-means作为最常用的聚类算法之一,常用在基因表达数据的分析中。但k-means本身具有初始中心点敏感,局部收敛等问题,遗传算法作为求解多目标优化问题的一个常用手段,可以有效地提升k-means的聚类效果。本文研究并编码实现了遗传聚类(遗传k-means算法、遗传k-meanS++算法);为了提升遗传聚类算法的收敛速度和种群多样性对遗传聚类算法进行了改进,并用实验验证了改进算法的有效性,进一步将该算法运用于基因表达数据分析领域。具体改进之处如下:(1)初始种群的选择,在遗传聚类算法中,一个进化个体代表着一种聚类中心点的分布方案,此时的初始种群相当于k-means聚类中的初始中心点集合。而在基因表达数据中存在着大量的无关基因,此类基因占比大,所含的信息量少。为了避免无关基因的影响。本文采用波动最大属性(Most volatile attribute,简称MVA)的划分法。基因在不同样品的表达数据波动越大,表明该基因包含的信息越丰富。本文将数据波动最大的前m个属性按照层次聚类的方法划分为k个区间,然后再随机的从每个区间内选取数据作为聚类的初始中心点。通过多个数据集上的对比实验证明了基于MVA划分法的遗传聚类算法聚类效果要好于传统的初始中心点划分法。(2)基于差异度的选择策略,传统的选择策略完全依赖个体适应度,容易选择出两个较为相似的个体作为进化个体进行交叉,那么交叉后的新个体可能与原有的交叉个体相差不大,交叉操作也就失去了意义。为了在一定程度上避免这一现象,本文提出一种基于差异度(Degree of difference,简称DD)的选择策略,当已确定一个交叉个体后,通过引入差异度作为适应度的权重以避免早熟收敛。通过实验证明,基于差异度的选择策略可以有效的提高遗传聚类算法的准确性。(3)双精英种群的进化框架,本文参考分层遗传算法的思想,将进化种群分成A,B两个种群,两个种群均由精英个体主导以保证种群的全局收敛性,两个种群在各自的进化操作期间互不干扰。种群A采用自适应的交叉变异率和保优进化来加快进化效率,种群B通过引入一定数目的随机个体来扩大种群的多样性。在种群A和种群B各自独立运行一定进化代数后,将两个种群进行种群间的交叉操作,使得两个种群能够协同进化,优势互补,完成种群的进化。(本文来源于《安徽大学》期刊2019-03-01)
董兆鑫,华翔,姜冰清,谢勤,孙一阳[3](2019)在《一种改进的遗传聚类拓扑分簇算法》一文中研究指出针对标准遗传算法在拓扑分簇中由于收敛速度慢而引发网络时延能耗不均的问题,提出了一种快速收敛的最优簇聚类算法。文中在网络能耗最小的基础上引入了遗传搜索最优簇原理,设计了网络能耗最优模型。通过P矩阵改进簇心编码,缩小最优簇心的搜索空间;构造自适应遗传算子操作,定向指导搜索方向,提高局部寻优的搜索效率;利用一步迭代策略改善全局搜索,提高迭代过程中的分簇精度。实验结果表明,该算法能够高效实现网络拓扑均匀划分,节点聚类准确率比标准遗传算法提高约15%;与REDDC算法和粗糙C-Leach算法相比,最高可延长网络生存寿命84%。(本文来源于《西安工业大学学报》期刊2019年01期)
张玉婷[4](2019)在《Spark框架下保护数据差分隐私的遗传聚类算法》一文中研究指出针对分布式计算框架下海量数据聚类分析过程中的数据隐私泄露问题,提出了一种Spark下支持差分隐私保护的遗传k-means聚类算法。首先利用遗传算法实现对k-means聚类方案的全局寻优,提高算法的准确率;并采用种群迁移策略将遗传k-means算法部署于Spark框架中,实现基于内存读写的分布式聚类;然后利用差分隐私保护的Laplace Spark每轮迭代的mapvalues算子中,对各聚簇中记录数量num和聚簇中各记录之和sum上添加随机噪声。根据差分隐私保护的性质,通过理论分析证明了算法达到ε-差分隐私保护要求。最后实验分析表明了算法在Spark框架下的时效性高于MapReduce框架,其运行时间主要受迭代次数的影响,并且得出了使算法隐私性和准确性达到平衡的最优隐私保护预算取值。(本文来源于《电脑知识与技术》期刊2019年04期)
张扬,廖长见,林建新,卢和顶,陈山虎[5](2019)在《9个新育甜玉米自交系遗传聚类和主要农艺性状配合力分析》一文中研究指出【目的】利用遗传聚类和配合力分析来了解新育成9个甜玉米自交系的遗传背景和配合力,为组配新品种提供科学依据。【方法】以TS01-1、BS02-1、GS132、AS67、SS1等5个白粒自交系为母本,闽甜系688、闽甜系G73、闽甜系197、X90-34等4个高配合力黄粒自交系为父本,按5×4不完全双列杂交设计组配20个杂交组合,并对其株高、穗位高、穗长、穗粗、穗行数、行粒数、百粒重、出籽率、带苞叶穗重和去苞叶穗重等10个性状的配合力进行研究。【结果】从去苞叶穗重的一般配合力值得出,供试甜玉米自交系的配合力大小顺序,白粒自交系为AS67>GS132>TS01-1>BS02-1>SS1,黄粒自交系为闽甜系688>X90-34>闽甜系G73>闽甜系197。从特殊配合力值得出,杂交组合AS67×闽甜系688的特殊配合力值最大,实际测产产量也最高。从分子水平对9个亲本的亲缘关系进行聚类分析,将9个亲本分成黄粒和白粒两个群。【结论】黄、白粒自交系间杂交具有一定的杂种优势;聚类分析结果与试验设计的父母本划分一致。(本文来源于《福建农业学报》期刊2019年01期)
陈超,张宇君,赵丽丽,王普昶,申记[6](2017)在《高粱属牧草分子指纹图谱构建及遗传聚类分析》一文中研究指出【目的】为建立快速有效的高粱属牧草品种鉴定分析方法。【方法】采用基于DNA混池的ISSR分子标记技术,遵循多态性高、稳定性强的原则,构建高粱(Sorghum bicolor)、甜高粱(Sorghum dochna)、苏丹草(Sorghum Sudanense)、高丹草(Sorghum bicolor×S.sudanense)4个高粱属牧草共12个品种的数字指纹,并进行鉴定分析和聚类分析。【结果】利用DNA混池技术从110个ISSR引物中筛选出13个多态性高、重复性好的扩增引物,计算出12个高粱属牧草品种的遗传相似系数在0.6867~0.9036。当Gs为0.786时,12个品种可以聚为4类,第一类群包括6个高丹草品种和2个高粱品种;第二类群为2个甜高粱品种;第叁类群为苏丹草品种超级丹;第四类群为苏丹草品种布鲁赛。根据引物扩增位点的特异性,挑选出3条核心引物(引物S37结合S35和S50),构建出能区分12个高粱属牧草品种的ISSR数字指纹。【结论】利用ISSR分子标记技术能有效鉴定高粱属牧草品种的纯度、真伪,揭示品种间遗传差异。(本文来源于《西南农业学报》期刊2017年10期)
陈荣赏[7](2017)在《遗传聚类的协同推荐方法在点餐系统中的应用设计》一文中研究指出电子信息服务平台的普及,使用户数据急剧增长,如何在有限的时间里,寻找用户需要的信息是当前推荐系统应用的研究热点。协同过滤推荐技术是当前应用最为广泛的推荐技术,但其存在两大重要问题,即扩展性问题和推荐质量问题。目前大部分研究都是集中在推荐质量问题上,对扩展性问题的研究较少。扩展性问题导致推荐响应时间的增长,用户能否忍受长时间的等待,是衡量推荐系统性能的根本指标。本文分析了协同推荐技术中推荐质量与扩展性两大问题,为较好解决这两大问题,提出在传统协同过滤推荐技术中引入遗传操作的方法。该方法过程分为两步:首先,对原始数据进行遗传聚类得到初始集;其次,在初始集的基础上进行融合遗传算法的协同过滤推荐。通过采用国际通用的Glass、Heart、Soybean、Movie Lens等数据样本集进行实验验证,实验结果数据显示该方法有效地解决了传统协同过滤推荐系统的扩展性问题和推荐质量问题。在验证本文提出的推荐方法有效性的基础上,把该融合遗传聚类的协同推荐方法设计应用于点餐系统中。该点餐系统主要由用户点餐模块、系统后台管理模块、服务员功能管理模块、厨师功能管理模块构成。智能推荐模块是用户点餐模块的核心子模块,通过应用本文所述方法,该子模块实现了基于用户评价、菜品属性加权的协同过滤推荐。(本文来源于《华侨大学》期刊2017-05-18)
徐聪,黄文准,黄世奇[8](2017)在《基于自组织映射的遗传聚类算法》一文中研究指出遗传聚类算法往往需要较大的种群规模才能得到最优解,导致收敛速度慢,针对这一问题,本文提出一种基于自组织映射的超启发遗传聚类算法。首先利用自组织映射把数据空间转换到特征空间,再在特征空间里利用遗传算法进行搜索,然后进行反映射,即把聚类结果在数据空间里表现,从而得到一组解,同时利用K-means算法在数据空间里进行粗聚类,获得另一组解,最后比较2组解的聚类结果,相同的样本保留,不同的再次聚类,进而有效地保证了最优解的获得。计算机仿真实验验证了所提算法在种群规模较小的情况下,可以获得较高的准确率。(本文来源于《计算机与现代化》期刊2017年04期)
苏亮,宋明亮,董石麟,罗尧治[9](2017)在《循环遗传聚类法稳定图自动分析》一文中研究指出提出一种迭代的基于遗传算法和模糊聚类(IG-FC)技术的稳定图自动分析方法.该算法通过任意给定一个初始聚类数目,迭代使用遗传算法和模糊聚类技术搜索出代表真实模态的聚类中心,最终自动剔除稳定图中的虚假模态.一旦程序参数给定后,可在没有任何人为主观干扰的情况下自动识别出结构的真实模态.使用一个七自由度的弹簧质量数值模型以及加拿大某座钢筋混凝土框架结构大楼、瑞士Z24桥的加速度实测数据验证所提出算法的准确性.算例模态频率的识别结果表明:该算法可以自动且较准确地剔除稳定图上的虚假模态;可以自动判别并识别出相邻模态以及弱激励模态.(本文来源于《浙江大学学报(工学版)》期刊2017年03期)
朱江峰,单林森,黄建杨[10](2016)在《基于遗传聚类的配电变压器运行状态参数数据修复研究》一文中研究指出为了减少配网设备运行大数据在采集以及传输的过程中容易发生的丢失或者损坏,保证配网设备运行检修工作质量,提高整个电网的安全稳定性。本文结合了不完整信息系统原理、近邻传播聚类原理以及遗传优化算法原理,提出了一种面向配网设备运行状态的遗传聚类数据修复方法,充分有效的对大规模、复杂、不完整的配网设备运行参数进行分析以及修复。通过对实际配电变压器设备运行状态参数数据进行验证,结果表明所提出的方法有效的分析和修复了配电变压器设备运行状态参数数据,具有实际应用价值。(本文来源于《科技风》期刊2016年18期)
遗传聚类论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
近年来,cDNA微阵列技术的出现和应用,使得基因表达数据被大量检测出来,从而为人类在分子层级分析疾病提供了充足的样本数据。而如何通过海量的基因表达数据挖掘出有用的信息,便成了当前的研究热点。聚类算法作为数据挖掘中的重要算法,是对基因表达数据分析的一个有效手段,科研人员常利用聚类算法找出相似基因,从而利用已知的基因表达数据分析出样本的显着性特点。在众多聚类算法中,k-means作为最常用的聚类算法之一,常用在基因表达数据的分析中。但k-means本身具有初始中心点敏感,局部收敛等问题,遗传算法作为求解多目标优化问题的一个常用手段,可以有效地提升k-means的聚类效果。本文研究并编码实现了遗传聚类(遗传k-means算法、遗传k-meanS++算法);为了提升遗传聚类算法的收敛速度和种群多样性对遗传聚类算法进行了改进,并用实验验证了改进算法的有效性,进一步将该算法运用于基因表达数据分析领域。具体改进之处如下:(1)初始种群的选择,在遗传聚类算法中,一个进化个体代表着一种聚类中心点的分布方案,此时的初始种群相当于k-means聚类中的初始中心点集合。而在基因表达数据中存在着大量的无关基因,此类基因占比大,所含的信息量少。为了避免无关基因的影响。本文采用波动最大属性(Most volatile attribute,简称MVA)的划分法。基因在不同样品的表达数据波动越大,表明该基因包含的信息越丰富。本文将数据波动最大的前m个属性按照层次聚类的方法划分为k个区间,然后再随机的从每个区间内选取数据作为聚类的初始中心点。通过多个数据集上的对比实验证明了基于MVA划分法的遗传聚类算法聚类效果要好于传统的初始中心点划分法。(2)基于差异度的选择策略,传统的选择策略完全依赖个体适应度,容易选择出两个较为相似的个体作为进化个体进行交叉,那么交叉后的新个体可能与原有的交叉个体相差不大,交叉操作也就失去了意义。为了在一定程度上避免这一现象,本文提出一种基于差异度(Degree of difference,简称DD)的选择策略,当已确定一个交叉个体后,通过引入差异度作为适应度的权重以避免早熟收敛。通过实验证明,基于差异度的选择策略可以有效的提高遗传聚类算法的准确性。(3)双精英种群的进化框架,本文参考分层遗传算法的思想,将进化种群分成A,B两个种群,两个种群均由精英个体主导以保证种群的全局收敛性,两个种群在各自的进化操作期间互不干扰。种群A采用自适应的交叉变异率和保优进化来加快进化效率,种群B通过引入一定数目的随机个体来扩大种群的多样性。在种群A和种群B各自独立运行一定进化代数后,将两个种群进行种群间的交叉操作,使得两个种群能够协同进化,优势互补,完成种群的进化。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
遗传聚类论文参考文献
[1].王杰,王艳.基于量子遗传聚类算法的质量控制方法[J].系统仿真学报.2019
[2].宋飞豹.遗传聚类算法的改进及其在基因表达数据分析中的应用[D].安徽大学.2019
[3].董兆鑫,华翔,姜冰清,谢勤,孙一阳.一种改进的遗传聚类拓扑分簇算法[J].西安工业大学学报.2019
[4].张玉婷.Spark框架下保护数据差分隐私的遗传聚类算法[J].电脑知识与技术.2019
[5].张扬,廖长见,林建新,卢和顶,陈山虎.9个新育甜玉米自交系遗传聚类和主要农艺性状配合力分析[J].福建农业学报.2019
[6].陈超,张宇君,赵丽丽,王普昶,申记.高粱属牧草分子指纹图谱构建及遗传聚类分析[J].西南农业学报.2017
[7].陈荣赏.遗传聚类的协同推荐方法在点餐系统中的应用设计[D].华侨大学.2017
[8].徐聪,黄文准,黄世奇.基于自组织映射的遗传聚类算法[J].计算机与现代化.2017
[9].苏亮,宋明亮,董石麟,罗尧治.循环遗传聚类法稳定图自动分析[J].浙江大学学报(工学版).2017
[10].朱江峰,单林森,黄建杨.基于遗传聚类的配电变压器运行状态参数数据修复研究[J].科技风.2016