导读:本文包含了叁维数据模型论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:模型,数据,方差,系数,颗粒,指标,数据模型。
叁维数据模型论文文献综述
宋梅青[1](2019)在《面向高维数据环境的个性化推荐质量控制模型研究》一文中研究指出[目的/意义]在高维数据环境下,推荐的精准度和实时性存在相互制约的现象。如何在精准度与实时性之间取得平衡,实现对推荐质量的有效控制是值得研究的问题。[方法/过程]本文首先分析了高维数据环境的成因及其对推荐质量的影响,在此基础上构建了一种个性化推荐质量控制模型,该模型先评估推荐质量在精准度和实时性两个方面的损失,再结合应用环境,得到相应的质量控制策略。[结果/结论]实验分析的结果证明该模型可以在高维数据环境下实现对推荐质量的有效控制,让推荐系统可以更好地适应不同的应用环境。(本文来源于《现代情报》期刊2019年11期)
刘怡彤[2](2019)在《超高维数据下无模型约束特征选择方法研究》一文中研究指出伴随着计算机技术的不断革新以及数据挖掘技术的深化和推广,科学研究所使用数据在数量和复杂性方面经历着前所未有的爆炸式发展,现有的数据分析与挖掘方法在超高维数据的应用中同时面临着统计准确性和计算代价等多方面的挑战,因此首先需要对超高维的数据进行一定程度的降维处理,才能继续利用现有模型和方法进行下一步处理。变量选择的结果直接影响统计建模的质量,进而对模型的精度和可解释性产生巨大影响,故而变量选择是超高维背景下数据分析及挖掘中至关重要的一步。SIS及其改进方法广泛应用于超高维数据变量选择中,然而这类方法在关系更复杂的超高维数据中进行变量选择时效果不尽人意。本文从上述背景着手,首先简要介绍了一些传统变量选择或模型选择方法,并指出这些方法在处理超高维数据中存在理论性质大打折扣、计算量指数增长或根本无法计算等种种不足。其次介绍了在超高维数据中广泛应用的SIS方法和能够识别变量间更复杂关系的最大信息系数MIC,剖析了SIS的主要思想及原理,揭示了SIS方法中最关键的部分是相关性度量。同时简要提及了部分SIS改进方法所使用的其他相关性度量,并结合例子将这些相关性度量与MIC进行系统全面的比较,结果显示SIS及其改进方法所使用的相关性度量都具有一定程度的局限性,即便是放松了模型要求的改进方法,也仅能在线性模型、广义线性模型或其他具有单调函数关系的少数几种模型中有较好的表现,而MIC能在各种各样的函数关系模型中都保持良好的可用性,故而得到MIC能比其他相关系数更全面地度量变量之间相关性的结论。接着提出了一种基于MIC的超高维数据无模型约束变量选择方法MIC-SIS,理论上它能够所有的函数关系模型甚至非函数关系模型中进行变量选择,填补了SIS及其改进方法在复杂函数模型中几乎不能选择出正确变量的缺陷,是SIS方法族的一个有力补充与完善。MIC-SIS相比其他SIS及其改进方法而言能够处理更广泛、更多变、更复杂的模型关系,因而具有极大的优势,这一点将在第叁章的数值模拟研究和真实数据研究中直观地表现出来。最后一章对MIC-SIS方法进行总结,概述本论文所取得的主要研究成果,并指出研究中存在的部分问题和下一步研究的方向。(本文来源于《山东大学》期刊2019-04-20)
张峰耀[3](2019)在《基于有限测点的桥梁监测四维数据模型建立》一文中研究指出随着我国交通基础建设的稳定快速发展,现有的与正在建设中的交通设施数量连年增长,为保证此类设施能够长期安全稳定的服务于社会,其后期的管理监测变得日益重要。桥梁作为交通基础建设中一大重要组成部分,保证它的安全稳定可靠相较其他交通建设基础设施来说更为重要,因此多种桥梁安全监测与评估技术体系逐渐发展起来。笔者提出建立基于有限测点的桥梁监测四维数据模型的构想。(本文来源于《中国科技信息》期刊2019年08期)
黄毅,徐翀,Nadhir,Al-Anasari[4](2018)在《使用改进型一维数据模型对采矿工业区域较大粒径土石颗粒运动的模拟研究》一文中研究指出在最近的环境工程研究发展中,针对较大粒径土石颗粒运动的模拟研究成为了大气污染物溯源和控制的一种解决方案。本研究利用国际合作调研北欧瑞典马尔贝特采矿工业地区数据,以巴格诺尔德(Bagnold)的经典风蚀砂石颗粒运动公式为基础建立计算模型,使用MATLAB等计算机程序辅助计算过程,最终结合计算流体动力学模型与现场观测数据对该地区空气中较大粒径颗粒污染物的运动影响进行了合理解释。结论表明:从颗粒的基础运动入手,利用动力学模型计算的方法可以较为快速准确的判定较大粒径颗粒物的运动影响范围,为该领域进一步多维度细致深入的研究奠定了良好的基础。(本文来源于《《环境工程》2018年全国学术年会论文集(上册)》期刊2018-08-20)
郑世秀,潘振宽,徐知磊[5](2018)在《基于图的高维数据分类Ratio Cut模型及其快速算法》一文中研究指出数据分类是数据挖掘研究的重要内容,随着数据量以及数据维度的增加,对大规模、高维数据的处理成为关键问题。为提高数据分类的准确率,受计算机视觉中图像分割算法的启发,针对经典的Ratio Cut分类模型提出一种基于非局部算子的实现算法。引进拉格朗日乘子,建立新的能量泛函,并采用交替优化的策略来求解该能量泛函。数值实验表明,算法的准确率及计算效率与传统分类方法相比都有较大提高。(本文来源于《计算机科学》期刊2018年S1期)
秦晔玲[6](2018)在《超高维数据中非线性模型的交互作用研究》一文中研究指出关于超高维数据的统计模型研究,多数现有的变量选择和筛选研究都集中在线性回归模型。然而,在一些复杂情况下,响应变量和预测变量为非线性相关,简单的线性模型不够灵活,无法涵盖非线性模型结构。基于复杂的非线性问题,本文研究超高维情况下稀疏性非参数可加模型的变量选择问题,即确定模型中响应变量的相关变量,包括主成分和交互作用两部分。本论文的主要内容和结论如下:1.变量选择第一部分,本文提出非参数向前选择法(Nonparametric For-ward Selection)选择模型的主成分变量,该方法简单高效且易于实现。由理论分析可得,其在一定的正则条件下具有变量筛选一致性,这一结果在预测变量维数远大于样本量的情况同样成立。模拟部分和实际数据分析部分一致表明,该方法适用于非参数可加模型中一定样本量和大尺寸数据的主成分变量筛选;且在一定程度上,该方法优于一些其他方法。2.变量选择第二部分,关于非参数模型的交互作用选择,本文提出基于向前选择的两步法:交互作用的非参数向前选择法(inter-Nonparametric FORward-Two)。该算法只涉及最小二乘法(Ordinary Least Squares)计算,不需要其他复杂的优化工具,解决了传统算法中的计算可行性问题。模拟部分和实际数据分析表明,该算法具有良好的选择效果,为非参数可加模型的交互作用选择提供了新的思路。3.更深入的研究中,将提出的非参数向前选择法(NFS)扩展到广义形式的非参数可加模型,解决响应变量为分类变量的变量选择问题。结果表明,这一扩展对非参数模型中分类问题的解决有一定的帮助和指导意义。(本文来源于《太原理工大学》期刊2018-06-01)
苏炜航,程祥[7](2018)在《一种基于隐树模型的满足差分隐私的高维数据发布算法》一文中研究指出针对满足差分隐私的高维数据发布问题,我们提出一种基于隐树模型的满足差分隐私的高维数据发布算法.该算法由隐变量生成、隐树结构学习、隐树参数学习和数据生成四个阶段组成.特别地,在该算法中,为了在对显变量进行分组并生成隐变量的过程中保护隐私,我们提出一种满足差分隐私的隐变量生成方法.此外,为了在构建隐树的过程中保护隐私,我们提出了一种满足差分隐私的隐树模型结构学习方法.分析结果表明本文提出的算法满足ε-差分隐私.实验结果表明,与现有算法相比,所提出的算法可以获得更好的数据效用.(本文来源于《小型微型计算机系统》期刊2018年04期)
孙娇[8](2017)在《高维数据情形下单指标模型的方差估计》一文中研究指出随着科学技术的发展,各个领域每时每刻都在产生大量的数据,并且数据的复杂程度也越来越高。当数据维数大于样本量9)时,称这样的数据为“高维”数据。本文研究了高维数据情形下单指标模型的方差估计,一方面因为方差估计是统计推断中一个非常重要的问题,另一方面单指标模型具有灵活性与降维的特性,使得其成为处理高维数据的一种有效的模型。因此,本文的研究不仅在理论上有重要的意义而且在实际应用中具有广泛的用途。针对单指标模型,本文提出用RCV(Refitted Cross-Validation)方法对其进行方差估计,并在理论上证明具有Oracle性质,该方法能够很好地完善常见的两步方差估计(第一步选取变量,第二步方差估计)的低估。同时基于B样条近似的方法我们给出了该模型的蒙特卡洛模拟,并计算了RCV-LASSO方法、RCV-SCAD方法的方差估计量,还对比Oracle方法、CV-LASSO、CV-SCAD方法进行了分析。研究结论表明,运用RCV方法估计的方差,其偏差、标准误差的表现均好于运用其它的方法。RCV方法的方差估计量与选择的模型的平均大小更加接近Oracle模型的估计量,充分降低了伪相关变量对方差估计带来的影响,随着变量维数的增加RCV方法更加有效。最后,我们还运用实际数据集说明理论结果和数值模拟的效果的有效性。(本文来源于《暨南大学》期刊2017-06-30)
刘志坚[9](2017)在《高维数据下半参数可加危险率模型中基于ISIS的变量选择方法及其应用》一文中研究指出目的本文主要介绍高维数据下半参数可加危险率模型中基于ISIS的变量选择方法,并探讨AHAZISIS模型,AHAZLASSOISIS模型,AHAZENISIS模型,AHAZSSCADISIS模型在高维数据生存分析中的优劣。从而揭示死亡或其他生存结局发生的时间与基因表达之间的关系,从基因层面上为疾病的诊疗和预后以及改进治疗方案提供依据。方法介绍AHAZISIS模型,AHAZLASSOISIS模型,AHAZENISIS模型和AHAZSSCADISIS模型的基本方法原理。针对生物信息学高维度,强相关,小样本量的数据特征进行数据模拟,并比较四种模型在不同模拟数据下的表现情况。最后利用来源于TCGA的前列腺癌数据进行实证研究。结果(1)各种模拟数据情形下,叁种初次惩罚函数的模拟结果在一致性和精确性的表现上差别不大。(2)各种数据情形下,四种再次惩罚函数在一致性方面OS-SCAD表现最好,SSCAD次之,Lasso第叁,EN表现最差;而在精确性方面,OS-SCAD和SSCAD较好,Lasso次之,EN表现最差。(3)各种数据情形下,再次惩罚函数SSCAD的不同steps在一致性方面,steps=1表现最好,steps=2,3,4,5比较接近;在精确性方面,steps=1表现最差,steps=2,3,4,5比较接近。(4)叁种初次惩罚函数,四种再次函数以及再次惩罚函数SSCAD的不同steps在精确性方面与协变量相关系数大小呈负相关,即相关系数较小则精确性高,反之精确性则低。(5)AHAZISIS模型、AHAZSSCADISIS模型在实证研究中筛选出基因数目少,模型可解释性较好。根据log-rank检验的p值大小,AHAZISIS模型、AHAZSSCADISIS模型在实证研究中预测能力方面表现较好。结论在模拟研究和实证研究中,各模型表现一致。AHAZISIS模型和AHAZSSCADISIS模型的模型解释性较好,估计精确性也较高,是处理高维度、强相关、小样本量的数据比较可靠的模型。而AHAZLASSOISIS模型和AHAZENISIS模型在处理高维度、强相关、小样本量的数据时表现较差,尤其是AHAZENISIS模型可解释性最差且估计精确性也最差。(本文来源于《重庆医科大学》期刊2017-05-01)
王一存[10](2017)在《高维数据情形下变指标系数模型的方差估计》一文中研究指出高维数据的研究是统计理论与应用研究的热点。在高维数据情形下,也就是变量的维度大于或远大于样本量时,会产生所谓的“维数祸根”。此时,数据是稀疏的且变量间存在伪相关。传统的残差方差估计技术例如基于最小二乘法的简单两阶段法是不可取的,会严重低估模型误差方差的水平。而重新调整的交叉验证法(Refitted Cross-Validation,RCV)改进了传统的简单两阶段法,在方差估计以及变量选择方面表现出了传统方法没有的准确性以及稳定性。为了避免维数诅咒的问题,半参数回归模型能够很好的解决,半参数回归模型同时拥有着非参数回归模型适应性广以及参数回归模型解释性强的优点。本文重点研究了重新调整的交叉验证法以及变指标系数模型这种半参数回归模型。运用轮廓最小二乘法估计变指标系数模型(Varying Index Coefficient Model,VICM)的参数部分系数,未知函数部分利用B样条进行展开。并在高维数据的的假定条件下,将二者相结合。数据模拟以及实证分析的研究结果显示,针对于一般线性模型以及变指标系数模型,重新调整的交叉验证法相对于基于普通最小二乘等传统方法在准确性以及稳定性等方面有更好地表现。(本文来源于《暨南大学》期刊2017-05-01)
叁维数据模型论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
伴随着计算机技术的不断革新以及数据挖掘技术的深化和推广,科学研究所使用数据在数量和复杂性方面经历着前所未有的爆炸式发展,现有的数据分析与挖掘方法在超高维数据的应用中同时面临着统计准确性和计算代价等多方面的挑战,因此首先需要对超高维的数据进行一定程度的降维处理,才能继续利用现有模型和方法进行下一步处理。变量选择的结果直接影响统计建模的质量,进而对模型的精度和可解释性产生巨大影响,故而变量选择是超高维背景下数据分析及挖掘中至关重要的一步。SIS及其改进方法广泛应用于超高维数据变量选择中,然而这类方法在关系更复杂的超高维数据中进行变量选择时效果不尽人意。本文从上述背景着手,首先简要介绍了一些传统变量选择或模型选择方法,并指出这些方法在处理超高维数据中存在理论性质大打折扣、计算量指数增长或根本无法计算等种种不足。其次介绍了在超高维数据中广泛应用的SIS方法和能够识别变量间更复杂关系的最大信息系数MIC,剖析了SIS的主要思想及原理,揭示了SIS方法中最关键的部分是相关性度量。同时简要提及了部分SIS改进方法所使用的其他相关性度量,并结合例子将这些相关性度量与MIC进行系统全面的比较,结果显示SIS及其改进方法所使用的相关性度量都具有一定程度的局限性,即便是放松了模型要求的改进方法,也仅能在线性模型、广义线性模型或其他具有单调函数关系的少数几种模型中有较好的表现,而MIC能在各种各样的函数关系模型中都保持良好的可用性,故而得到MIC能比其他相关系数更全面地度量变量之间相关性的结论。接着提出了一种基于MIC的超高维数据无模型约束变量选择方法MIC-SIS,理论上它能够所有的函数关系模型甚至非函数关系模型中进行变量选择,填补了SIS及其改进方法在复杂函数模型中几乎不能选择出正确变量的缺陷,是SIS方法族的一个有力补充与完善。MIC-SIS相比其他SIS及其改进方法而言能够处理更广泛、更多变、更复杂的模型关系,因而具有极大的优势,这一点将在第叁章的数值模拟研究和真实数据研究中直观地表现出来。最后一章对MIC-SIS方法进行总结,概述本论文所取得的主要研究成果,并指出研究中存在的部分问题和下一步研究的方向。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
叁维数据模型论文参考文献
[1].宋梅青.面向高维数据环境的个性化推荐质量控制模型研究[J].现代情报.2019
[2].刘怡彤.超高维数据下无模型约束特征选择方法研究[D].山东大学.2019
[3].张峰耀.基于有限测点的桥梁监测四维数据模型建立[J].中国科技信息.2019
[4].黄毅,徐翀,Nadhir,Al-Anasari.使用改进型一维数据模型对采矿工业区域较大粒径土石颗粒运动的模拟研究[C].《环境工程》2018年全国学术年会论文集(上册).2018
[5].郑世秀,潘振宽,徐知磊.基于图的高维数据分类RatioCut模型及其快速算法[J].计算机科学.2018
[6].秦晔玲.超高维数据中非线性模型的交互作用研究[D].太原理工大学.2018
[7].苏炜航,程祥.一种基于隐树模型的满足差分隐私的高维数据发布算法[J].小型微型计算机系统.2018
[8].孙娇.高维数据情形下单指标模型的方差估计[D].暨南大学.2017
[9].刘志坚.高维数据下半参数可加危险率模型中基于ISIS的变量选择方法及其应用[D].重庆医科大学.2017
[10].王一存.高维数据情形下变指标系数模型的方差估计[D].暨南大学.2017