一、广义的关联规则挖掘算法(论文文献综述)
赵明静[1](2021)在《基于公共安全视角的城市物流风险分析及预测研究》文中研究说明我国城镇化人口超过60%,城市成为人口的主要聚集地,城市中各类要素高频流动的需求带动城市物流的蓬勃发展,同时城市物流公共安全事件呈现出多样性、复杂性、紧迫性和不确定性等特点,城市公共安全、经济社会运行秩序和人民生命财产安全受到严重威胁。为实现城市物流公共安全风险的有效治理,一方面需要认清城市物流运营对公共安全影响较大的风险因素,完善治理方案,另一方面需要对现实困境进一步分析,归纳当前城市物流公共安全事件的发生特征及规律,进而构建高效且精细的城市物流公共安全风险治理方案。以前的物流企业为保证物流运营安全,大多采取加强监管、安全宣传等传统手段。但是,巨大的人力和物力等资源的耗费给物流企业增加较大的经济负担。虽然目前物流风险研究领域已存在大量的理论思想与方法,但是仍亟需解决很多现实问题。目前的物流风险管理研究过度依赖经验判断和专家知识,风险分析方法理论研究需要继续完善;此外,由于事故数据记录没有统一的规范,导致数据的结构化程度不同,如何对非结构化以及半结构化的数据进行风险分析成为当前研究的热点问题之一。基于以上问题,本文依据风险管理理论的流程,完成的主要工作有:(1)统计分析2008~2020年城市物流公共安全事故。分别对事故类型、事故时间、风险源、后果等多个角度作统计,并结合死亡人数、事故等级等指标对事故特征进行分析,详细梳理事故风险因素及相关规律,使后续风险因素集的建立有据可依;(2)利用文献法与业务流程分析法对事故风险因素进行识别,建立风险因素候选集,采用NASA-TXL量表法得到各因素权重,在风险发生概率和风险损失程度两个属性下利用逼近于理想值的排序法对候选风险因素的重要性程度进行筛选梳理,建立最终的关键风险因素集。并对风险因素的独立性进行检验,为后续建立贝叶斯网络评估模型奠定基础;(3)提出了改进的Apriori算法快速挖掘频繁项集,设计出标准化的公共安全视角下的城市物流风险因素关联规则挖掘流程,运用数据分析和处理等手段,基于建立的关键风险因素集,对统计的235起事故进行分析,共得到374条风险因素关联规则,并对高支持度关联规则、高置信度关联规则以及所有关联规则进行可视化展示。通过可视化结果可以得出城市物流风险因素关联规则呈现显着的聚集特征;(4)基于解释结构模型建立贝叶斯网络的初始结构,通过因果映射方法进行改进建立最终的贝叶斯网络动态风险评估模型。利用贝叶斯网络的推理功能对风险进行结果评估及原因推理,通过敏感度分析,揭示了“人-车-货”是造成事故的重要因素,结果表明贝叶斯网络在提升城市快递物流作业能力、规避公共安全风险方面是有效的。(5)提出了粒子群算法与广义回归神经网络算法相结合的风险等级预测模型优化方法。将模型预测结果与BP神经网络算法预测结果对比,结果显示PSOGRNN模型具有预测准确率高、稳定性高、误差较小的优点,对风险等级进行预测并提前相应的风险防控机制,降低事故造成的人民生命财产损失。本文共有图53幅,表49个,参考文献144篇。
杨洋[2](2020)在《考虑区域类型差异的高速公路事故风险识别与交通安全评价研究》文中指出近年来,随着高速公路里程的飞速增长,其给人们的生活生产带来便捷的同时,伴随而来的交通事故和安全隐患等问题亦不容忽视。在既有高速公路事故风险相关研究中,研究对象主要聚焦于特定地理地貌或单一路段类型,忽略了区域类型特征差异对高速公路事故致因分析、事故征兆因子识别以及交通安全水平评估带来的影响,并且缺乏各区域类型间并行层面比较。随着高精度交通流数据的获取成为可能,静态、被动的传统高速公路安全提升方法逐渐被基于实时动态交通数据的主动安全控制技术取代,但在动态交通流特征与交通安全关系的研究中,仍然存在区域类型差异针对性不强的问题。此外,传统的高速公路交通安全评价研究主要集中在微观路段层面,多以“事故强度分析”思路为主,缺乏考虑宏观区域类型差异的高速公路综合交通安全水平评价相关研究。因此,传统的高速公路交通安全分析方法难以对不同区域类型高速公路的安全管理工作提供精确指导。鉴于此,本文以区域类型差异条件下的高速公路为研究对象,依照“事故致因差异判断—动态交通流事故风险识别—交通安全水平评价”的逻辑,逐层展开研究。重点解答如下关键科学问题:不同区域类型高速公路风险因子与事故间的关联关系是否相同;事故维度及致因维度各变量间存在何种深层次的自相关规律;各区域类型高速公路的交通流运行状态与交通安全之间的关系存在何种差异;如何利用高精度交通流数据对不同区域类型和交通状态下的高速公路动态事故风险机理进行有效研判;区域类型差异条件下的高速公路交通安全水平如何定量判别。具体研究内容主要包括以下四个方面:(1)基于改进WODMI-Apriori关联规则挖掘算法的区域类型差异条件下的高速公路交通事故致因分析将研究区域分为城区、乡区和山区高速公路,提出了一种考虑定向约束和指标赋权的多维度交互改进Apriori关联规则挖掘算法(Weighted Orientated Multiple Dimension Interactive-Apriori,WODMI-Apriori),以基于区间层次分析法(IAHP)和灰色关联度的主客观联合赋权模型对数据字段进行权重优化,应用改进的关联规则挖掘算法,分别对三个不同区域类型的高速公路进行了全映射事故致因角度、维度交互角度、事故维度自相关角度等多维度交互的关联规则挖掘计算。挖掘结果显示,不同区域类型高速公路具有不同的事故发生机理,其中的各维度层次,也都具有不同的关联规律。结果表明,改进的WODMI-Apriori算法能更好的揭示不同区域类型高速公路中事故致因和风险的差异性,其算法精确度较传统Apriori关联规则算法在城区、乡区、山区高速公路条件下分别提高了82.7%、88.5%、80.5%。(2)区域类型特征差异条件下的高速公路交通流状态安全风险评估首先基于六级服务水平将交通状态划分为饱和流与非饱和流,结合三个区域类型的划分共建立了6个待评单元;进而应用病例—对照配对方法对交通流和事故数据进行了数据匹配和样本结构化设计;最后利用基于MCMC的条件Logistic回归定量评估了不同区域类型和交通状态下的高速公路事故风险。结果表明:流量、速度和占有率与高速公路区域类型及交通状态都具有高度相关性,高速公路区域类型和交通状态均与交通安全存在显着相关性。其中,运行在城区/饱和流状态下的事故风险最大,其事故风险是乡区/非饱和流状态下事故风险的29.6倍。(3)基于动态交通流特征的不同区域类型高速公路交通事故内在机理研究首先,从交通流基础信息、交通流中车队、车辆变道行为、交通流变量短时间内的突变、车辆跟驰行为等反映交通流动态特征的5个维度,共选取了20个相关的交通流变量;随后,利用随机森林算法计算了不同区域类型和交通状态下的事故征兆交通流变量;最后,根据随机森林分析结果中筛选的事故征兆变量,针对不同区域类型和交通状态分别以贝叶斯Logistic回归方法进行建模,构建了交通流变量与事故风险在不同区域类型和交通状态下的统计关系。结果显示,不同区域类型中,影响交通安全的因素各不相同,且同一因素在不同区域类型中的重要度也存在差异,进一步验证了不同区域类型高速公路具有不同的事故发生机理。此外,多个模型结果均表明,同时考虑高速公路区域类型和交通状态差异的实时事故风险评估方法能够更加全面准确地捕捉交通流动态特征与交通安全的关系。(4)考虑区域类型差异的高速公路交通安全评价方法选取5个不同区域类型高速公路作为待评单元,从安全、效率、经济、环境4个方面共考虑了8项评价指标,构建了高速公路综合交通安全评价体系;应用信息熵权重理论,对传统的密切值模型进行了改进,提出了一种基于熵权改进的密切值评价模型;分别从年度、季度划分两个视角对各区域高速公路进行了综合交通安全水平评价。评价结果显示,在年度视角与季度划分视角的结果中,各路段的优劣排序各有不同,各指标在评价过程中也体现出了不同的重要程度,说明不同区域类型高速公路的交通安全水平存在显着差异。此外,改进密切值法计算结果与传统密切值法存在明显差异,主要是由于传统密切值法将评价指标进行了等权重处理,为避免造成结果偏差,有必要对传统密切值模型进行权重优化改进。密切值法无需确定主观参量、计算快捷、结果分辨率高,可作为高速公路交通安全评价工作中行之有效的一种方法。论文共包括图75幅,表48个,参考文献235篇。
杨洋[3](2020)在《贝叶斯优化和关联规则挖掘的若干问题研究》文中研究表明学术界和工业界存在着大量的设计类问题。超参数优化是机器学习领域一个非常重要的设计类问题,即从不同的超参数组合中选择最合适的超参数配置使机器学习模型的训练效果达到最优。机器学习模型的训练过程是迭代进行的,训练时间较短或较长分别对应非充分训练效果或充分训练效果。本文提出一种基于截断可加高斯过程的贝叶斯优化方法来进行机器学习模型的超参数优化。在该方法中,我们提出用一种新的统计模型对两种训练效果联合建模,并采用贝叶斯优化的序贯优化策略不断追加更优的超参数配置。一系列数值模拟和机器学习模型的实验结果验证了该方法比现有方法具有更高的超参数优化效率。在材料科学领域,引起学术界和工业界广泛关注的另一个设计类问题是超材料设计。超材料由大量结构基元构成,通过微结构设计能呈现出一般自然材料所不具备的超常电磁性能。本文研究的超材料设计需要设计多个结构基元,每个结构基元对应的电磁响应是函数型数据,这在传统设计类问题中并不常见,具有很大挑战性。本文将超材料设计表述为一个多目标设计问题,提出了一种基于贝叶斯优化的协同设计方法,能实现超材料的快速设计。该方法通过定义超材料响应曲面的均值函数和方差函数,将无穷维的响应曲面函数降维成两个简单函数用代理模型建模,同时利用不同目标间的相似性构造一个联合采集函数实现对所有设计目标的协同优化。我们从理论上证明了该协同设计方法收敛。大量数值实验和仿真实验证实了该方法的有效性和优越性,因此该方法在超材料领域具有较大的应用潜力。随着大数据的应用普及,学术界和工业界关心的另一个重要问题是从大量结构复杂的数据中挖掘隐藏的、具有价值的关联规则。假设每个关联规则是由一些元素组成的主题,并且每个观测数据由主题词典中的主题生成,主题词典模型(TDM,Theme Dictionary Model)通过概率生成模型进行统计推断,提供了有效进行关联规则挖掘的新思路。本文拓展了现有的TDM方法,允许观测数据中包含多个类别的元素,同时允许每个观测数据中元素的数量信息缺失。本文提出的拓展模型可以解决现有TDM无法解决的更多实际问题。数值模拟实验表明,拓展模型优于TDM。最后我们应用拓展模型分析期刊数据和中医电子病历数据,挖掘其中的关联规则。
陈梦蝶[4](2020)在《数据驱动的慢性疾病风险因素关联分析及再入院预测研究》文中研究表明随着大数据时代的来临,现如今,各行各业都离不开对数据的处理、分析,和发现新的学习模式。数据挖掘技术中包含的时间序列分析、关联分析,以及机器学习中分类、预测、聚类分析等方法也已经广泛应用到了现实生活中。慢性非传染性疾病对全球人类健康造成了巨大的影响以及严重的疾病负担,在中国,慢病已成为城乡居民的主导疾病。近年来,对慢病风险因素的研究也逐渐增多。本文针对高血压、糖尿病等27种慢病,有效利用了数据挖掘技术中的时间序列分析、聚类分析和关联规则挖掘技术、以及机器学习方法对慢病患者的住院医疗数据进行分析处理,为防治慢病提供科学依据。本文重点研究了大气污染对慢病患者的健康影响、慢病并发症的关联挖掘以及慢病住院患者的再入院风险预测,主要研究内容分为以下三个部分:(1)空气污染物与慢病的健康效应分析。利用广义相加模型(GAM),研究空气污染物对慢病患者的急性健康效应,并将年龄、性别以及季节等分层实验作为敏感性分析,确保了实验结果的稳定性。(2)基于聚类分析的慢病及其并发症的关联规则挖掘。本文结合聚类分析和关联规则挖掘技术进行了慢病并发症挖掘。首先利用三种聚类方法(k-mean++、平均连接法和离差平方和法)对27种慢病进行聚类处理,并在每个聚类簇中利用FP-growth算法获取慢病间并发症关系,建立了疾病网络;然后针对三种重点慢病在全疾病组间寻找共病组合。(3)基于机器学习的慢病住院患者再入院风险预测。本文基于逻辑回归以及随机森林、梯度提升树、light GBM三种集成学习模型建立了再入院风险预测基本模型。然后在基本模型进行了改进,提出了一种基于压缩存储的混合模型,结合树模型与逻辑回归模型,进一步提高了预测性能。
曹岩[5](2020)在《多粒度区间关联规则挖掘模型构建》文中研究表明区间概念格是最近几年给出概念格结构,它是定义在一个给定的参数区间上的,能巧妙体现确定及不确定性信息的格结构,这种格结构为不确定规则提取的研究奠定了新的基础。以此为着眼点,通过对区间概念格多粒度结构特征进行深入分析后,将区间概念格结构与之前提出的其它概念格进行对比分析,给出多粒度区间关联规则挖掘模型,进而设计一种新的三支决策方法。首先,研究了区间概念格的多粒度格结构特点,为后期区间概念格的构建和规则挖掘模型奠定了基础。其次,针对多粒度的格结构特点,结合其他概念格的规则挖掘方法,定义了多粒度区间关联规则,并给出了具体的规则度量标准,为下一部分多粒度区间关联规则的挖掘模型提供了理论支撑。再次,采用广度优先的搜索方法,对区间概念节点的两个外延集合分别提取出a-上界关联规则和b-下界关联规则,建立了多粒度区间关联规则提取模型,提高了规则强度的同时更能反映不确定性。最后,基于多粒度区间关联规则提取模型,构建了一种新的可为不决策域内的个体采取决策动作进而减少决策代价的三支决策模型。由区间概念格中的上下界两个概念外延切割了三支决策中的正域、负域和边界域,进而在这三个不同的区域基础上制定了决策规则;文章给出了基于多粒度区间关联规则的三支决策模型的度量方法和决策代价函数的定义,根据区间概念格结构得到三支决策概念,进而得建立了三支决策策略优化模型,通过具体实例验证了模型的可行性和先进性。图12幅;表17个;参58篇。
钱怡欣[6](2019)在《基于Apriori算法和证据推理的大气环境关键规则挖掘研究》文中进行了进一步梳理空气污染是人类健康的主要威胁之一,如何治理空气污染已成为社会关注的焦点和研究的重点。网格化监测系统通过提供全方位信息为治理空气染污发挥了积极成效,在其监测数据基础上,单源监测数据挖掘和多源数据直接融合挖掘的方法相继被提出,用以解释属性间的相互影响。已有方法未充分考虑环境监测数据浓度分布不均匀且随气候变化的特点,因此反映出的污染成因不够全面和准确。针对已有方法的局限性,本文在系统分析网格化监测数据基础上,从数据挖掘和不确定性信息融合理论的角度,开展大气环境关键规则挖掘方法和技术研究。主要研究内容如下:(1)提出了基于Apriori算法和Dempster-Shafer理论的大气环境监测数据关键规则挖掘方法。首先,对预处理后的单监测站数据利用Apriori算法进行关联规则挖掘,得到高可信的强关联规则;然后,对上述强关联规则通过Dempster-Shafer理论进行融合,得到多个监测站数据中隐藏的相关规则。该方法能够解决多个监测站点数据信息挖掘过程中存在的数据差异化问题,适用于多元化规则挖掘需求和规则集不相同情况下的融合需求。(2)提出了基于Apriori算法和Evidential Reasoning算法的大气环境监测数据关键规则挖掘方法。首先,引入权重指标体系,根据融合过程中重要性的不同,赋予利用Apriori算法挖掘得到的强关联规则集相应权重;然后,通过Evidential Reasoning算法对多个规则集进行融合,得到高可信度融合规则集。该方法能够解决特殊情况下融合数据集重要性非均匀及部分规则冲突问题,适用于高精度挖掘需求和重要性不同的融合需求。本论文提出的方法挖掘结果表示了不同参数之间的影响模式,具有可解释性和现实意义,能够为空气污染的治理和预防提供理论和技术支持。
程国尧[7](2019)在《基于信息熵的事务型数据关联规则挖掘研究》文中研究说明数据挖掘是大数据时代蓬勃发展的新技术,它通过计算机技术对庞大且复杂的数据库进行数据分析,解决传统统计学无法解决的问题。关联分析是数据挖掘研究中的一个重要分支,又被称作关联规则挖掘。它主要面向的数据类型是事务型数据,用于探寻事物间的关联关系。FP-Growth算法作为关联规则挖掘中的经典算法,通过分而治之的策略发现数据集中各项目间的关联关系。但是,由于其视数据集中各项目“平等一致”的缺陷,会导致挖掘过程中一些重要的关联关系遗漏。因此,加权关联规则挖掘应运而生。然而,现有的加权关联规则算法也存在局限性:没有考虑到数据集系统本身的混乱程度或不确定性。本论文将通过研究事务型数据,提出一种改进的加权关联规则挖掘算法,可有效处理高度混乱的事务型数据集,发现更多潜在或有价值的关联关系。本论文主要包括以下四个方面的内容:第一,从传统统计学以及数据挖掘的角度研究事物间的关联问题,并对事务型数据的类型和特点进行了归纳和总结;第二,对关联分析的相关理论进行了研究和探讨,分析了经典关联算法将数据集中各项目视作“平等一致”的问题,并对现有的一些关联分析算法进行了研究;第三,针对现有加权关联算法不能解决数据集系统本身混乱程度,从而导致在挖掘结果中潜在的关联关系遗漏的问题,引入信息熵的相关理论,提出基于FP-Growth的加权关联规则挖掘改进算法——IEFP-Growth;第四,分别采用经典FP-Growth与IEFP-Growth算法挖掘Crime数据集中的关联规则,对关联结果进行分析与对比,发现改进的算法确实能够发现与经典算法不同且有价值的关联规则,并研究了其适用条件;同时,通过挖掘检验数据集——IMDB数据集中的关联规则,验证了算法对不同数据集的适用性。研究结果表明:第一,由于各项目的重要程度不尽相同,因此对项目加权是关联规则挖掘算法过程中必要的改进;第二,改进的算法——IEFP-Growth在处理庞大的事务型数据集时,通过引入信息熵加权模型用以量化信息的不确定性,确实能够有效挖掘数据集中的关联关系;第三,改进关联算法相比于经典关联算法,挖掘到的关联规则既有相同也有不同的结果,在挖掘关联关系时能够发现一些潜在的或有价值的关联规则,具有一定的适用条件。在实际应用中若将两者结合使用,可以使得挖掘到的关联关系更加丰富完整。
王琳[8](2015)在《卫星典型构件工艺挖掘与配置方法研究》文中认为机械结构是卫星平台的重要组成部分,其作用是支撑其他各分系统和有效载荷。结构板、中心承力筒、框类零件等都是组成卫星机械结构的典型构件。我国卫星制造企业的生产实际表明,典型构件的生产能力已经成了卫星制造企业提高快速响应能力的关键。随着卫星朝系列化和平台化方向的发展,典型构件在结构上也逐步呈现出相似性和系列化的特征。总结典型构件现行的制造工艺,基于制造特征分析归纳不同卫星中同类典型构件制造工艺的相似性,从中挖掘典型构件系列的典型工艺,并形成典型工艺库,据此实现典型构件制造工艺的快速配置,对于实现典型构件制造工艺的规范化,提高卫星制造企业的快速响应能力具有重要的理论意义和实际应用价值。这也是本文的主要研究内容和希望实现的研究目标。在大规模定制生产模式下,相对于产品族与配置技术在产品设计阶段中的巨大推动作用,工艺族的概念与配置技术在工艺设计中的应用还只处于起步阶段。对此,本文首先对工艺族的概念进行拓展,提出了广义工艺族的概念,明确广义工艺族的内涵,包括通用工艺特征、工艺知识和通用工艺结构三个方面,并基于工艺平台建立了广义工艺族的体系架构。为保证广义工艺族信息在各制造系统之间的传递和共享,建立了广义工艺族的UML模型,并采用XML对广义工艺族的信息模型进行表达。为了建立完善的卫星典型构件的广义工艺族,需要从卫星典型构件的历史工艺数据中对广义工艺族中的工艺知识与通用工艺结构进行挖掘。对此,首先根据卫星典型构件工艺设计中常用的典型工序序列和工艺决策规则可以表示为关联规则形式的特点,采用关联规则的经典挖掘算法Apriori算法对这两类两者进行挖掘。针对大规模数据量的情况下,Apriori算法挖掘效率低的问题,采用二进制粒子群优化算法对工艺数据进行预处理,获得关联规则的最小支持度与最小置信度,以提高挖掘效率。并以卫星结构板成型工艺中典型工序序列的挖掘和卫星管路焊装工艺中工艺决策规则的挖掘验证了算法的有效性。通过挖掘获得的典型工序序列和工艺决策规则为完善卫星典型构件的广义工艺族的工艺知识的完善奠定了基础。其次,针对工艺数据往往以非结构化的自然语言存储的问题,采用属性有向图对工艺进行描述,并基于工艺单元的二分图最优匹配和工艺路线的邻接矩阵研究了工艺的相似度计算方法。针对工艺聚类具有聚类数量未知的特点,基于近邻传播聚类算法,建立了典型工艺挖掘的半监督聚类算法,并以Silhouette指标和IGP指标作为聚类结果的评价指标。以卫星结构板面板机加的典型工艺聚类实例验证了算法的有效性。由于广义工艺族的通用工艺结构往往体现为工艺路线的形式,而通过聚类挖掘获得的典型工艺具有代表性,其工艺路线即可用于表示广义工艺族的通用工艺结构。针对卫星典型构件工艺设计效率低、工艺重用率低的问题,提出将配置技术应用于工艺设计过程中。针对工艺设计过程中出现多个中间变量与约束的情况,采用生成式约束满足问题进行工艺的配置,确定了模型变量与模型约束,基于广义工艺族建立了工艺配置的约束模型,并基于回溯搜索算法实现了工艺配置问题的求解。对卫星结构板面板的机加工艺进行配置,可获得多个工艺配置方案。针对最优方案的选取问题,提出了工艺配置方案评价的重用度指标和有效性指标,研究了各指标的计算方法,并建立了工艺配置方案的评价模型,实现了对工艺配置方案的权衡评价。最后,以北京卫星制造厂的卫星典型构件为应用验证对象,探讨了相关技术的实际应用。从卫星制造厂工艺设计部门的实际需求出发,开发了基于Siemens UG NX8.0和基于Web的卫星典型构件工艺配置系统工具,详细讨论了系统体系结构的搭建,介绍了相关信息模型及主要功能模块的设计,给出了系统运行实例,对系统的应用进行了分析。
王畅[9](2012)在《模糊关联规则挖掘及其应用》文中认为关联规则挖掘作为数据挖掘的重要任务之一,凭借其广泛的应用性,越来越受到各领域研究者的重视。随着研究的深入,专家学者们提出了一些经典的关联规则挖掘算法,这些算法都是针对布尔型属性提出来的,然而现实中的数据库中往往存在着大量的数量型属性,为了发现数量型属性间的相关关系,模糊关联规则应运而生,FP-growth算法就是一种模糊关联规则挖掘算法。本文对模糊关联规则挖掘算法进行了深入的研究,针对隶属度函数优化以及FP-growth算法的不足提出了改进算法,并且对模糊关联规则进行了扩展,提出了广义模糊关联规则及其挖掘算法。研究内容主要包括以下三个方面:(1)针对原有隶属度函数模糊区域划分结果的应用局限性,重新定义遗传算法的适应度函数,并根据实际数据标准对隶属度函数进行修正,最后得到较优的隶属度函数。将优化算法应用于影响机场噪声属性数据集,使用优化后的隶属度函数对数量型属性进行模糊化,使模糊区域的划分更加合理,更加适合实际问题。以模糊属性数据库作为关联规则挖掘算法的输入数据,增强了模糊关联规则的可信度。(2)针对数量型模糊关联规则的FP-growth算法在模糊属性数据库生成过程中人为过滤掉多个模糊属性的不足,提出了FP-growth算法的改进算法。改进后的算法弥补了原算法在模糊属性筛选过程中丢失大量有用信息的不足,挖掘到的关联规则比原算法包含更多模糊属性间的相关关系。本文将改进后的模糊关联规则挖掘算法应用于分类系统。(3)传统模糊关联规则仅能反应前提属性与结论之间的相关性,不能够反应前提属性以及结论属性间的相对重要性。本文针对这一问题在传统模糊关联规则基础之上加入了前提属性权重以及结论属性置信度,提出了一种广义模糊关联规则以及相应的规则挖掘算法。前提属性的权重更清楚的反映出该属性对于结论的相对重要性,结论属性的置信度体现了该结论的相对可信程度,广义模糊关联规则比传统的模糊关联规则具有更强的可解释性。
刘俊[10](2012)在《基于离散Morse理论的数据挖掘研究》文中研究表明数据挖掘技术是从大量的、随机的、有噪声的、无序的、模糊的数据中提取隐含在其中有效的、有价值的、可理解的模式,进而发现有用的或是潜在有用的信息,并得出事件之间的趋向和关联程度,为用户求解问题提供决策支持。在数据泛滥的今天,数据挖掘对人们提取有效信息从而进行高效的知识管理有着重要的意义。本文重点介绍了数据挖掘中的两个重要技术——关联规则和聚类分析,以及着名的离散Morse理论,并将离散Morse理论分别应用于聚类分析和关联规则挖掘中,提出了基于离散Morse理论的网格聚类算法和基于广义离散Morse理论的强关联规则挖掘两个新的算法。Morse理论是分析平滑流形的拓扑结构的一种工具,最初是由Marton Morse提出,并分析了黎曼流形上Morse函数的临界点和流形拓扑之间的关系。随后Forman将离散结构引入Morse理论形成了应用更为广泛的离散Morse理论,它通过对单元复形建立其离散Morse函数或离散梯度向量域并进行分析研究,从而得到单元复形的拓扑信息和属性。离散Morse理论将空间图形的拓扑结构转化为数学函数进行计算分析,是一种强大的优化工具。本文将离散Morse理论应用于网格聚类中,提出了一种新的网格聚类算法——基于离散Morse理论的网格聚类算法。该算法首先利用网格聚类将大量数据分散到每个小网格中,并将每个稠密网格视为一个点同时舍弃稀疏网格,然后相互连接各个点形成单元复形,以代表稠密网格的点作为单元复形的顶点,点与点之间的链接作为单元复形的边,随后在该单元复形上构造离散Morse函数从而达到聚类的目的。实验表明该算法对于形状不规则的数据集有很好的聚类效果。此外,本文将离散Morse理论和关联规则的概念扩展为广义离散Morse理论和强关联规则,给出了广义离散Morse理论和强关联规则的定义,并将广义离散Morse理论应用到强关联规则的挖掘中,得到了基于广义离散Morse理论的强关联规则挖掘算法。该算法将事物数据库的每个项看做一个顶点并连接顶点形成单元复形,然后在单元复形上构造广义离散梯度,根据离散梯度中箭头的方向来表示置信度和支持度,从而得到超强关联规则,并通过仿真实验对该算法进行了分析验证。新算法使得对于特殊关联规则的挖掘变得更加简单、直观。本文最后对全文进行了总结,列举了该文的创新点和各章的内容,同时指出了两个新算法存在的不足之处,给出了有待进一步研究的方向。
二、广义的关联规则挖掘算法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、广义的关联规则挖掘算法(论文提纲范文)
(1)基于公共安全视角的城市物流风险分析及预测研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 引言 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外相关研究综述 |
1.2.1 物流风险研究综述 |
1.2.2 事故模型综述 |
1.2.3 主要存在问题 |
1.3 研究内容与研究方法 |
1.3.1 研究问题界定 |
1.3.2 研究内容 |
1.3.3 研究思路及方法 |
1.4 本章小结 |
2 相关理论基础及事故统计分析 |
2.1 城市物流系统概述 |
2.1.1 城市物流系统的概念 |
2.1.2 城市物流系统的特征 |
2.1.3 城市物流系统的体系结构 |
2.1.4 城市物流系统的复杂性 |
2.2 风险的相关理论 |
2.2.1 风险的基本概念 |
2.2.2 风险管理概述 |
2.3 城市物流公共安全事故统计分析 |
2.3.1 城市物流公共安全事故因果连锁理论 |
2.3.2 城市物流公共安全事故统计分析 |
2.4 本章小结 |
3 公共安全视角下的城市物流风险因素分析 |
3.1 风险因素分析 |
3.1.1 风险因素分析流程 |
3.1.2 风险因素识别方法 |
3.1.3 风险因素评价方法 |
3.1.4 城市物流公共安全领域风险因素分析 |
3.2 风险因素识别 |
3.2.1 文献法识别 |
3.2.2 业务流程分析法识别 |
3.2.3 城市物流公共安全风险因素集 |
3.3 关键风险因素集的构建 |
3.3.1 关键风险因素集构建的基本流程 |
3.3.2 关键风险因素集构建原则 |
3.3.3 关键风险因素的选择 |
3.4 本章小结 |
4 风险因素关联规则挖掘和可视化分析 |
4.1 风险因素关联规则挖掘方法 |
4.1.1 关联规则挖掘方法 |
4.1.2 快速挖掘频繁项集的VS_Apriori算法 |
4.1.3 关联规则挖掘流程 |
4.2 风险分析、数据分析和处理 |
4.2.1 风险分析 |
4.2.2 数据分析 |
4.2.3 数据处理 |
4.3 风险因素关联规则挖掘 |
4.3.1 高支持度关联规则 |
4.3.2 高置信度关联规则 |
4.4 风险因素关联规则的可视化分析 |
4.4.1 高支持度关联规则可视化分析 |
4.4.2 高置信度关联规则可视化分析 |
4.4.3 所有关联规则的可视化分析 |
4.5 本章小结 |
5 公共安全视角下的城市物流动态风险评估 |
5.1 贝叶斯网络概述 |
5.1.1 贝叶斯网络原理 |
5.1.2 参数学习 |
5.1.3 结构学习 |
5.1.4 贝叶斯网络推理 |
5.2 解释结构模型概述 |
5.3 基于贝叶斯网络的城市物流公共安全风险评估 |
5.3.1 初始网络构建 |
5.3.2 网络结构改进 |
5.3.3 贝叶斯网络模型的确定 |
5.4 动态风险评估贝叶斯网络模型应用 |
5.4.1 后验概率分析 |
5.4.2 敏感度分析 |
5.5 本章小结 |
6 公共安全视角下的城市物流风险预测研究 |
6.1 城市物流公共安全风险预测方法 |
6.1.1 广义回归神经网络理论概述 |
6.1.2 粒子群算法概述 |
6.1.3 PSO-GRNN预测模型概述 |
6.1.4 模型性能评价标准 |
6.2 基于PSO-GRNN的城市物流风险预测模型 |
6.2.1 数据准备 |
6.2.2 基于PSO-GRNN算法的风险预测 |
6.2.3 预测结果分析 |
6.3 城市物流风险预防及控制措施 |
6.3.1 风险预防措施 |
6.3.2 风险控制措施 |
6.4 本章小结 |
7 研究结论与展望 |
7.1 主要结论 |
7.2 研究创新点 |
7.3 研究展望 |
参考文献 |
附录A 物流公共安全事故详表 |
附录B 物流公共安全风险因素评估调查问卷 |
作者简历及攻读博士学位期间取得的研究成果 |
学位论文数据集 |
(2)考虑区域类型差异的高速公路事故风险识别与交通安全评价研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 立题背景与选题意义 |
1.1.1 研究背景 |
1.1.2 选题意义 |
1.2 国内外研究现状综述 |
1.2.1 相关理论方法发展动态和应用现状 |
1.2.2 针对区域类型的高速公路事故风险和交通安全研究进展 |
1.2.3 基于实时交通流状态的高速公路动态安全研究现状 |
1.2.4 国内外研究现状评述 |
1.3 高速公路区域类型划分依据 |
1.3.1 高速公路区域类型划分的必要性 |
1.3.2 国内外高速公路常见的分类方法 |
1.3.3 本文高速公路区域类型划分依据 |
1.4 研究内容及研究目标 |
1.5 论文组织结构与技术路线 |
2 高速公路交通事故要素与特征分析 |
2.1 高速公路交通安全相关研究数据概述 |
2.1.1 我国相关数据现状 |
2.1.2 美国相关数据现状 |
2.1.3 本文所应用数据的合理性 |
2.2 区域类型差异条件下的高速公路交通事故主要影响因素分析 |
2.2.1 驾驶人维度影响因素分析 |
2.2.2 车辆维度影响因素分析 |
2.2.3 道路维度影响因素分析 |
2.2.4 外部环境维度影响因素分析 |
2.3 高速公路交通事故时空分布规律 |
2.3.1 城区高速公路时空分布规律分析 |
2.3.2 乡区高速公路时空分布规律分析 |
2.3.3 山区高速公路时空分布规律分析 |
2.4 高速公路交通事故特征统计 |
2.4.1 城区高速公路事故特征统计分析 |
2.4.2 乡区高速公路事故特征统计分析 |
2.4.3 山区高速公路事故特征统计分析 |
2.5 本章小结 |
3 基于关联规则挖掘的区域类型差异条件下的高速公路事故致因分析 |
3.1 引言 |
3.2 研究区域介绍与数据收集处理 |
3.2.1 研究区域介绍与研究数据来源 |
3.2.2 样本数据集特征 |
3.2.3 样本结构设计 |
3.3 基于WODMI-APRIORI关联规则挖掘算法的高速公路事故风险识别方法建模 |
3.3.1 关联规则挖掘算法基本参数 |
3.3.2 关联规则分类 |
3.3.3 Apriori算法特性与基本步骤 |
3.3.4 主客观联合赋权改进的Apriori关联规则挖掘算法 |
3.3.5 考虑定向约束和指标赋权的多维度交互改进的Apriori关联规则挖掘算法(WODMI-Apriori) |
3.4 实例分析 |
3.4.1 不同区域类型高速公路全映射事故致因关联规则挖掘 |
3.4.2 不同区域类型高速公路维度交互关联规则挖掘 |
3.4.3 不同区域类型高速公路事故维度自相关关联规则挖掘 |
3.5 本章小结 |
4 区域类型差异条件下的高速公路动态交通流状态与事故风险关系评估 |
4.1 引言 |
4.2 研究数据介绍与样本结构设计 |
4.2.1 数据源文件介绍 |
4.2.2 事故数据预处理 |
4.2.3 交通流数据预处理 |
4.2.4 病例—对照配对式样本结构设计 |
4.2.5 数据匹配 |
4.3 相关理论与研究方法 |
4.3.1 六级服务水平理论 |
4.3.2 马尔科夫链蒙特卡洛方法(MCMC) |
4.3.3 基于MCMC的贝叶斯方法 |
4.3.4 贝叶斯条件logistic回归 |
4.3.5 随机森林算法 |
4.3.6 贝叶斯logistic回归 |
4.4 实例分析 |
4.4.1 不同区域类型高速公路事故风险等级分析 |
4.4.2 各区域高速公路事故征兆危险交通流变量识别 |
4.4.3 不同区域类型高速公路事故发生机理 |
4.5 本章小结 |
5 区域类型差异条件下的高速公路综合交通安全水平评价 |
5.1 引言 |
5.2 基于熵权改进的密切值法 |
5.2.1 密切值评价方法概述 |
5.2.2 信息熵赋权理论 |
5.2.3 基于信息熵权重优化改进的密切值评价方法 |
5.3 研究区域介绍 |
5.4 基于熵权改进密切值法的高速公路交通安全评价建模 |
5.4.1 评价矩阵建立 |
5.4.2 模型基本假设 |
5.4.3 评价指标数据的收集与处理 |
5.4.4 数值评价矩阵的建立 |
5.5 实例分析 |
5.5.1 年度视角的评价指标权重计算 |
5.5.2 季节划分视角的评价指标权重计算 |
5.5.3 年度视角下的不同区域类型高速公路交通安全评价 |
5.5.4 季节划分视角下的不同区域类型高速公路交通安全评价 |
5.5.5 考虑区域类型和季节差异的全样本高速公路交通安全评价 |
5.6 本章小结 |
6 结论与展望 |
6.1 主要研究结论 |
6.2 论文创新点 |
6.3 研究展望 |
参考文献 |
附录A 缩略词注释表 |
附录B 交通事故源数据字段注释表 |
作者简历及攻读博士学位期间取得的研究成果 |
学位论文数据集 |
(3)贝叶斯优化和关联规则挖掘的若干问题研究(论文提纲范文)
摘要 |
abstract |
主要符号对照表 |
第1章 引言 |
1.1 选题背景和意义 |
1.2 研究问题和现状 |
1.2.1 机器学习模型的超参数优化 |
1.2.2 超材料的多目标设计 |
1.2.3 关联规则挖掘 |
1.3 本文的贡献 |
1.4 本文结构安排 |
第2章 预备知识 |
2.1 初始化方法 |
2.2 基于高斯过程的代理模型 |
2.3 采集函数 |
第3章 基于贝叶斯优化的超参数优化方法 |
3.1 准备工作 |
3.1.1 嵌套拉丁超立方体设计 |
3.1.2 贝叶斯分层模型 |
3.2 统计模型与算法 |
3.2.1 截断可加高斯过程 |
3.2.2 统计推断 |
3.2.3 基于截断可加高斯过程的贝叶斯优化算法 |
3.3 实验 |
3.3.1 数值模拟实验 |
3.3.2 支持向量机 |
3.3.3 全连接神经网络 |
3.3.4 卷积神经网络 |
3.4 小结 |
第4章 基于贝叶斯优化的超材料多目标设计 |
4.1 超材料响应曲面建模 |
4.1.1 物理实验和仿真实验 |
4.1.2 函数型响应转化为简单响应 |
4.1.3 代理模型 |
4.2 协同设计策略 |
4.2.1 采集函数 |
4.2.2 采集函数的上界 |
4.2.3 追加设计点 |
4.2.4 基于贝叶斯优化的协同设计算法 |
4.2.5 BO_(syn)算法的收敛性 |
4.3 其他设计策略 |
4.4 实验 |
4.4.1 简单测试函数的数值模拟 |
4.4.2 函数型测试函数的数值模拟 |
4.4.3 仿真实验 |
4.5 小结 |
第5章 广义主题词典模型 |
5.1 准备工作 |
5.1.1 主题词典模型 |
5.1.2 统计推断 |
5.1.3 分解过程 |
5.2 广义主题词典模型 |
5.2.1 多类别主题词典模型 |
5.2.2 联合主题词典模型 |
5.3 广义主题词典模型的统计推断 |
5.3.1 联合主题词典模型的分解 |
5.3.2 覆盖分解 |
5.3.3 带约束的覆盖分解 |
5.4 数值模拟实验 |
5.4.1 多类别主题词典模型评估 |
5.4.2 联合主题词典模型评估 |
5.5 应用实例 |
5.5.1 期刊数据的关联规则挖掘 |
5.5.2 中医电子病历数据的关联规则挖掘 |
5.6 小结 |
第6章 总结与展望 |
参考文献 |
致谢 |
附录A 超材料多目标设计中的相关公式证明 |
附录B 广义主题词典模型中的相关公式证明 |
个人简历、在学期间发表的学术论文与研究成果 |
(4)数据驱动的慢性疾病风险因素关联分析及再入院预测研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究工作的背景与意义 |
1.2 数据挖掘应用于慢病领域的国内外现状 |
1.2.1 数据挖掘应用于空气污染健康效应分析 |
1.2.2 数据挖掘应用于并发症分析 |
1.2.3 数据挖掘应用于再入院风险预测 |
1.3 本论文的研究内容 |
1.4 本论文的结构安排 |
第二章 相关理论与技术介绍 |
2.1 时间序列分析概述 |
2.1.1 时间序列分析的概念 |
2.1.2 广义相加模型(GAM) |
2.2 聚类分析 |
2.2.1 聚类分析的原理 |
2.2.2 聚类分析的相关算法 |
2.3 关联规则挖掘 |
2.3.1 关联规则挖掘的原理 |
2.3.2 关联规则挖掘相关算法 |
2.3.3 FP-growth算法 |
2.4 机器学习预测模型 |
2.4.1 机器学习简介 |
2.4.2 降维处理 |
2.4.3 分类预测算法 |
2.4.4 模型性能度量 |
2.5 本章小结 |
第三章 大气污染与慢病关联分析 |
3.1 大气污染物与慢病住院数据 |
3.1.1 研究区域 |
3.1.2 数据范围 |
3.2 大气污染与慢病关联分析方法 |
3.2.1 广义相加模型的建立 |
3.2.2 敏感性分析 |
3.3 大气污染物与慢病关联分析结果 |
3.4 本章小结 |
第四章 基于聚类分析的慢病并发症关联规则挖掘 |
4.1 慢病并发症挖掘数据 |
4.1.1 数据范围 |
4.1.2 数据预处理 |
4.2 慢病并发症挖掘方法 |
4.2.1 慢病聚类分析 |
4.2.2 慢病并发症关联规则挖掘 |
4.2.3 慢病并发症挖掘结果 |
4.3 重点单病种并发症挖掘 |
4.3.1 糖尿病并发症挖掘结果 |
4.3.2 缺血性心脏病并发症挖掘结果 |
4.3.3 高血压并发症挖掘结果 |
4.4 本章小结 |
第五章 基于机器学习的慢病患者再入院风险预测 |
5.1 再入院风险预测目标 |
5.2 再入院风险预测数据 |
5.2.1 数据范围 |
5.2.2 数据预处理 |
5.2.3 特征编码 |
5.2.4 特征降维 |
5.2.5 样本分布不平衡处理 |
5.2.6 特征工程结果 |
5.3 再入院风险预测基本模型 |
5.3.1 样本集切分 |
5.3.2 模型训练与调参 |
5.3.3 模型测试与评估 |
5.3.4 基本预测模型结果 |
5.4 基于压缩存储的再入院风险预测混合模型 |
5.4.1 稀疏矩阵的压缩存储 |
5.4.2 利用树模型构造特征 |
5.4.3 基于压缩存储的再入院风险预测混合模型 |
5.4.4 基于压缩存储的混合模型结果 |
5.5 本章小结 |
第六章 总结与展望 |
致谢 |
参考文献 |
在学期间取得的与学位论文相关的研究成果 |
(5)多粒度区间关联规则挖掘模型构建(论文提纲范文)
摘要 |
abstract |
引言 |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 研究内容与论文结构 |
第2章 基本理论 |
2.1 概念格 |
2.1.1 概念格 |
2.1.2 粗糙概念格 |
2.1.3 区间概念格 |
2.2 关联规则挖掘 |
2.2.1 基于概念格的规则挖掘 |
2.2.2 区间关联规则挖掘 |
2.2.3 三支决策理论 |
2.3 本章小结 |
第3章 区间概念格的多粒度特征分析 |
3.1 问题的给出 |
3.2 区间概念格的特征 |
3.2.1 区间概念格的节点特征 |
3.2.2 区间概念格的多粒度结构特征 |
3.2.3 应用分析 |
3.3 多粒度区间概念格的构造算法 |
3.3.1 构造算法原理 |
3.3.2 构造算法代码 |
3.3.3 算法分析 |
3.3.4 实例验证 |
3.4 本章小结 |
第4章 区间关联规则及其度量 |
4.1 问题给出 |
4.2 区间关联规则定义 |
4.3 区间关联规则的度量 |
4.4 实际应用 |
4.5 本章小结 |
第5章 多粒度区间关联规则的挖掘算法 |
5.1 问题给出 |
5.2 多粒度区间关联规则挖掘算法 |
5.3 实例验证 |
5.4 本章小结 |
第6章 基于多粒度区间关联规则的三支决策模型 |
6.1 问题给出 |
6.2 基于多粒度区间关联规则的三支决策模型 |
6.2.1 三支决策域的划分 |
6.2.2 决策度量函数 |
6.2.3 决策代价函数 |
6.3 基于多粒度区间关联规则的动态决策 |
6.4 实例验证 |
6.5 本章小结 |
结论 |
参考文献 |
致谢 |
导师简介 |
作者简介 |
学位论文数据集 |
(6)基于Apriori算法和证据推理的大气环境关键规则挖掘研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
序言 |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 国内外研究现状 |
1.2.2 目前面临的挑战 |
1.3 本文研究内容 |
1.4 本文结构安排 |
2 相关理论基础 |
2.1 引言 |
2.2 Apriori算法 |
2.2.1 关联规则挖掘 |
2.2.2 Apriori算法 |
2.3 D-S证据理论 |
2.4 ER算法 |
2.5 本章小结 |
3 基于Apriori算法和D-S理论的关键规则挖掘研究 |
3.1 引言 |
3.2 关联规则挖掘模型 |
3.2.1 问题描述 |
3.2.2 系统模型 |
3.3 实验结果及分析 |
3.3.1 实验环境及数据介绍 |
3.3.2 实验结果 |
3.4 本章小结 |
4 基于Apriori算法和ER算法的关键规则挖掘研究 |
4.1 引言 |
4.2 关联规则挖掘模型 |
4.2.1 问题描述 |
4.2.2 系统模型 |
4.3 实验结果与分析 |
4.3.1 实验结果 |
4.3.2 实验结果对比 |
4.4 本章小结 |
5 总结与展望 |
5.1 本文工作总结 |
5.2 未来研究展望 |
参考文献 |
插图 |
表格 |
作者简历及攻读硕士学位期间取得的研究成果 |
学位论文数据集 |
(7)基于信息熵的事务型数据关联规则挖掘研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 文献综述 |
1.2.1 关联关系研究 |
1.2.2 关联规则挖掘研究 |
1.2.3 加权关联规则挖掘研究 |
1.2.4 文献综述小结 |
1.3 研究思路及研究内容 |
1.3.1 研究思路 |
1.3.2 研究内容 |
1.4 论文的创新之处 |
第二章 理论基础与理论模型 |
2.1 事务型数据的统计特征 |
2.1.1 事务型数据的基本理论 |
2.1.2 事务型数据的性质 |
2.2 关联规则挖掘研究理论 |
2.2.1 关联规则挖掘的理论基础 |
2.2.2 关联规则挖掘的分类模型 |
2.2.3 关联规则挖掘的具体算法 |
2.3 关联规则挖掘算法的不足与改进 |
2.4 一个加权关联规则挖掘理论模型 |
2.4.1 信息熵理论的引进 |
2.4.2 理论模型 |
2.5 本章小结 |
第三章 基于FP-GROWTH的加权关联规则挖掘算法改进 |
3.1 FP-GROWTH算法 |
3.1.1 FP-Growth算法思路与步骤 |
3.1.2 多维FP-Growth算法 |
3.2 加权模型选择 |
3.2.1 一般加权模型 |
3.2.2 信息熵加权模型 |
3.3 改进的加权关联算法——IEFP-GROWTH |
3.3.1 IEFP-Growth算法思路与步骤 |
3.3.2 IEFP-Growth算法概述 |
3.4 本章小结 |
第四章 实证分析 |
4.1 数据集介绍 |
4.2 数据预处理 |
4.2.1 属性选择 |
4.2.2 数据编码与清洗 |
4.3 关联算法实现 |
4.3.1 FP-Growth算法实现 |
4.3.2 IEFP-Growth算法实现 |
4.4 关联结果 |
4.4.1 FP-Growth关联结果 |
4.4.2 IEFP-Growth关联结果 |
4.5 本章小结 |
第五章 IEFP-GROWTH算法的有效性验证 |
5.1 关联结果对比 |
5.1.1 方差检验 |
5.1.2 关联结果分析 |
5.1.3 适用条件 |
5.2 适用性验证 |
5.2.1 验证数据集介绍 |
5.2.2 适用性验证结果 |
5.3 本章小结 |
结论 |
参考文献 |
附录:IEFP-GROWTH算法PYTHON程序代码 |
攻读硕士学位期间取得的研究成果 |
致谢 |
附件 |
(8)卫星典型构件工艺挖掘与配置方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题背景及研究的目的和意义 |
1.1.1 课题来源及背景 |
1.1.2 课题研究的目的及意义 |
1.2 工艺规划技术研究现状 |
1.3 工艺配置相关技术研究现状 |
1.3.1 制造业中的知识挖掘与知识重用 |
1.3.2 产品与工艺配置方法 |
1.3.3 配置方案评价技术 |
1.4 卫星典型构件工艺设计现状 |
1.4.1 卫星结构板工艺设计现状 |
1.4.2 壁板工艺设计现状 |
1.4.3 卫星管路工艺设计现状 |
1.5 现有研究存在的不足 |
1.6 本文的主要研究内容 |
第2章 基于工艺平台的工艺族建模 |
2.1 引言 |
2.2 广义工艺族的概念 |
2.3 广义工艺族信息模型表达 |
2.3.1 广义工艺族UML模型 |
2.3.2 广义工艺族模型信息表达 |
2.4 卫星结构板面板机加广义工艺族实例 |
2.5 本章小结 |
第3章 典型工序序列与工艺决策规则挖掘 |
3.1 引言 |
3.2 典型工序序列与工艺决策规则挖掘问题描述 |
3.2.1 典型工序序列与工艺决策规则挖掘框架 |
3.2.2 典型工序序列与工艺决策规则关联规则 |
3.3 基于BPSO的关联规则挖掘算法 |
3.3.1 粒子群优化算法 |
3.3.2 二进制转化 |
3.3.3 关联规则编码 |
3.3.4 适应度计算 |
3.3.5 关联规则挖掘流程 |
3.4 卫星典型构件典型工序序列与工艺决策规则挖掘实例 |
3.4.1 卫星结构板典型工序序列挖掘 |
3.4.2 卫星管路焊装工艺决策规则挖掘 |
3.5 本章小结 |
第4章 基于近邻传播聚类的典型工艺挖掘 |
4.1 引言 |
4.2 典型工艺挖掘问题描述 |
4.3 典型工艺的相似性度量 |
4.3.1 基于属性有向图的工艺建模 |
4.3.2 工艺单元相似度量 |
4.3.3 工艺路线相似度量 |
4.4 典型工艺聚类挖掘 |
4.4.1 工艺聚类的有效性及评价 |
4.4.2 基于近邻传播聚类的典型工艺挖掘算法 |
4.5 卫星结构板面板典型机加工艺挖掘 |
4.6 本章小结 |
第5章 基于生成式约束满足问题的工艺配置 |
5.1 引言 |
5.2 工艺配置问题描述 |
5.3 基于GCSP的工艺配置建模 |
5.3.1 生成式约束满足问题 |
5.3.2 工艺配置的GCSP模型 |
5.4 基于GCSP的工艺配置问题求解算法 |
5.4.1 回溯搜索算法 |
5.4.2 基于BT的GCSP求解 |
5.5 卫星结构板面板机加工艺配置实例 |
5.6 本章小结 |
第6章 工艺配置方案综合评价 |
6.1 引言 |
6.2 工艺配置方案评价描述 |
6.2.1 工艺配置描述 |
6.2.2 可选工艺配置方案形成的原因 |
6.2.3 工艺配置方案评价指标 |
6.3 工艺配置方案评价模型及算法 |
6.3.1 工艺配置方案评价重用性指标的计算 |
6.3.2 工艺配置方案评价有效性指标的计算 |
6.3.3 工艺配置方案的权衡评价 |
6.4 工艺配置方案评价实例 |
6.5 本章小结 |
第7章 工艺配置系统设计与软件开发 |
7.1 引言 |
7.2 系统需求分析 |
7.3 系统设计及实现 |
7.3.1 系统技术路线分析 |
7.3.2 系统体系结构设计 |
7.3.3 系统功能模型设计 |
7.3.4 系统信息模型设计 |
7.4 系统应用示例及分析 |
7.4.1 产品信息提取与工艺附件输出 |
7.4.2 工艺知识挖掘与模块管理 |
7.4.3 典型工艺挖掘与模板管理 |
7.4.4 工艺配置管理与方案评价 |
7.4.5 系统应用效果分析 |
7.5 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文及其它成果 |
致谢 |
个人简历 |
(9)模糊关联规则挖掘及其应用(论文提纲范文)
摘要 |
ABSTRACT |
图表清单 |
注释表 |
缩略词 |
第一章 绪论 |
1.1 引言 |
1.2 研究现状 |
1.2.1 数据挖掘的研究现状 |
1.2.2 关联规则挖掘算法的研究现状 |
1.2.3 遗传算法的研究现状 |
1.3 本文的研究内容及结构安排 |
1.3.1 本文研究内容 |
1.3.2 本文的结构安排 |
第二章 隶属度函数的遗传算法优化及修正 |
2.1 概述 |
2.2 获得隶属度函数的过程 |
2.3 隶属度函数优化算法及举例说明 |
2.3.1 隶属度函数优化算法 |
2.3.2 隶属度函数优化算法应用举例 |
2.4 隶属度优化算法的实验结果 |
2.6 本章小结 |
第三章 模糊关联规则挖掘算法 |
3.1 算法概述 |
3.2 改进模糊 FP-growth 算法具体步骤 |
3.2.1 算法相关知识介绍 |
3.2.2 算法的步骤 |
3.2.3 改进模糊 FP-growth 算法应用举例 |
3.3 改进模糊 FP-growth 算法实验结果 |
3.4 算法应用 |
3.4.1 基于最长模糊关联规则的分类系统 |
3.4.2 基于短模糊关联规则的分类系统 |
3.5 本章小结 |
第四章 广义模糊关联规则 |
4.1 广义模糊关联规则概述 |
4.1.1 传统模糊关联规则的形式 |
4.1.2 广义模糊关联规则的形式 |
4.1.3 广义模糊关联规则库的表示形式 |
4.2 广义模糊关联规则挖掘算法 |
4.2.1 符号含义 |
4.2.2 算法的步骤 |
4.3 广义模糊关联规则挖掘算法应用举例 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 全文总结 |
5.2 进一步的工作 |
参考文献 |
致谢 |
在学期间的研究成果及发表的学术论文 |
附录 I 第四章示例 |
(10)基于离散Morse理论的数据挖掘研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题研究的背景与意义 |
1.2 国内外应用研究现状 |
1.2.1 离散 Morse 理论 |
1.2.2 数据挖掘 |
1.3 本文研究的主要内容 |
1.3.1 数据挖掘中的聚类分析和关联规则挖掘 |
1.3.2 离散 Morse 理论综述 |
1.3.3 基于离散 Morse 理论的网格聚类算法 |
1.3.4 基于广义离散 Morse 理论的超强关联规则挖掘 |
1.4 本文的组织结构及创新点 |
1.4.1 论文组织结构 |
1.4.2 论文主要创新点 |
第二章 数据挖掘中的聚类分析和关联规则挖掘 |
2.1 聚类算法概述 |
2.1.1 聚类的基本概念 |
2.1.2 主要的聚类算法 |
2.1.3 聚类算法的研究现状 |
2.1.4 聚类算法的应用 |
2.2 关联规则挖掘概述 |
2.2.1 关联规则的基本概念 |
2.2.2 关联规则挖掘算法 |
2.2.3 关联规则挖掘的应用 |
第三章 离散 Morse 理论综述 |
3.1 离散 Morse 理论的相关概念 |
3.1.1 离散结构 |
3.1.2 代数拓扑的基本概念 |
3.2 离散 Morse 理论 |
3.2.1 离散 Morse 函数 |
3.2.2 离散梯度向量域 |
3.2.3 二者构建算法及关系 |
3.3 离散 Morse 理论的应用 |
第四章 基于离散 Morse 理论的网格聚类算法 |
4.1 网格聚类概述 |
4.1.1 网格的划分方法 |
4.1.2 网格聚类方法研究现状 |
4.2 基于离散 Morse 理论的新算法 |
4.2.1 算法思想 |
4.2.2 算法描述 |
4.2.3 算法过程 |
4.2.4 实例说明 |
4.3 实验结果和分析 |
4.3.1 实验平台 |
4.3.2 实验数据 |
4.3.3 实验结果 |
第五章 基于广义离散 Morse 理论的超强关联规则挖掘 |
5.1 问题的提出 |
5.2 基于广义离散 Morse 理论的新算法 |
5.2.1 相关定义 |
5.2.2 算法思想 |
5.2.3 算法过程 |
5.3 仿真实例 |
第六章 总结与展望 |
6.1 本文主要工作总结 |
6.2 研究展望 |
参考文献 |
攻读硕士学位期间发表的论文及参与的项目 |
致谢 |
四、广义的关联规则挖掘算法(论文参考文献)
- [1]基于公共安全视角的城市物流风险分析及预测研究[D]. 赵明静. 北京交通大学, 2021(02)
- [2]考虑区域类型差异的高速公路事故风险识别与交通安全评价研究[D]. 杨洋. 北京交通大学, 2020
- [3]贝叶斯优化和关联规则挖掘的若干问题研究[D]. 杨洋. 清华大学, 2020
- [4]数据驱动的慢性疾病风险因素关联分析及再入院预测研究[D]. 陈梦蝶. 电子科技大学, 2020(07)
- [5]多粒度区间关联规则挖掘模型构建[D]. 曹岩. 华北理工大学, 2020(02)
- [6]基于Apriori算法和证据推理的大气环境关键规则挖掘研究[D]. 钱怡欣. 北京交通大学, 2019(01)
- [7]基于信息熵的事务型数据关联规则挖掘研究[D]. 程国尧. 华南理工大学, 2019(02)
- [8]卫星典型构件工艺挖掘与配置方法研究[D]. 王琳. 哈尔滨工业大学, 2015(02)
- [9]模糊关联规则挖掘及其应用[D]. 王畅. 南京航空航天大学, 2012(02)
- [10]基于离散Morse理论的数据挖掘研究[D]. 刘俊. 山东师范大学, 2012(01)