逆概率论文_吕大刚,刘洋,于晓辉

导读:本文包含了逆概率论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:概率,缺失,危险性,稳健,自变量,模型,性能。

逆概率论文文献综述

吕大刚,刘洋,于晓辉[1](2019)在《第二代基于性能地震工程中的地震易损性模型及正逆概率风险分析》一文中研究指出第二代基于性能地震工程理论中的地震易损性主要是指结构构件以及非结构构件的抗震能力,与传统地震风险理论中的地震易损性定义和内涵并不相同。为了澄清二者的不一致性,首先介绍传统地震风险理论中地震易损性的定义和概率模型,然后指出第二代基于性能地震工程理论存在五个层次的地震易损性模型:地震需求易损性模型、抗震能力易损性模型、地震损伤易损性模型、地震损失易损性模型和抗震决策易损性模型,指出了这五种模型的区别及其相互关系,推导得到了地震需求易损性模型和地震损伤易损性模型分布参数的解析表达式。在此基础上,根据不同的不确定性传递路径,提出了正向PBEE和逆向PBEE的概念,以通过不同方式求解第二代基于性能地震工程理论的风险积分公式。基于地震危险性函数的近似表达式以及地震易损性模型及其分布参数的解析表达式,通过正向PBEE和逆向PBEE方法,分别得到了具有相同表达形式的工程需求参数EDP、地震损伤DM和决策变量DV叁个层次的概率地震风险表达式。通过该文的研究,将传统地震风险分析理论与第二代基于性能地震工程理论统一在一致的理论框架之中。(本文来源于《工程力学》期刊2019年09期)

程豪[2](2019)在《逆概率加权多重插补法在中国居民收入影响因素中的应用研究》一文中研究指出在分位回归中,自变量缺失是一种重要的数据缺失问题。尤其当自变量缺失与因变量有关时,已有的多重插补法会带来有偏估计。通过逆概率加权,将修正后的逆概率加权多重插补法用于模拟研究和应用研究。模拟研究表明,在不同的缺失相关程度下,逆概率加权多有效解决了同工作时间的数据缺失问题,同时重插补法能够有效减少估计偏差,并在一定程度上保证估计量的有效性。在中国综合社会调查(CGSS)的应用研究中,该方法有效解决了周工作时间的数据缺失问题,同时揭示了影响年收入的重要因素,说明该方法具有一定的应用价值。(本文来源于《统计与信息论坛》期刊2019年07期)

吕大刚,刘洋,于晓辉[3](2018)在《第二代基于性能地震工程中的地震易损性模型及正逆概率风险分析》一文中研究指出第二代基于性能地震工程理论中的地震易损性主要是指结构构件以及非结构构件的抗震能力,与传统地震风险理论中的地震易损性定义和内涵并不相同。为了澄清二者的不一致性,首先介绍传统地震风险理论中地震易损性的定义和概率模型,然后指出第二代基于性能地震工程理论存在五个层次的地震易损性模型:地震需求易损性模型、抗震能力易损性模型、地震损伤易损性模型、地震损失易损性模型和抗震决策易损性模型,指出了这五种模型的区别及其相互关系,推导得到了地震需求易损性模型和地震损伤易损性模型分布参数的解析表达式。在此基础上,根据不同的不确定性传递路径,提出了正向PBEE和逆向PBEE的概念,以通过不同方式求解第二代基于性能地震工程理论的风险积分公式。基于地震危险性函数的近似表达式以及地震易损性模型及其分布参数的解析表达式,通过正向PBEE和逆向PBEE方法,分别得到了具有相同表达形式的工程需求参数EDP、地震损伤DM和决策变量DV叁个层次的概率地震风险表达式。通过本文的研究,将传统地震风险分析理论与第二代基于性能地震工程理论统一在一致的理论框架之中。(本文来源于《第27届全国结构工程学术会议论文集(第Ⅰ册)》期刊2018-10-13)

邰凌楠,王春雨,田茂再[4](2018)在《缺失数据下的逆概率多重加权分位回归估计及其应用》一文中研究指出数据缺失问题普遍存在于应用研究中。在随机缺失机制假定下,本文从模型推断角度出发,针对线性缺失分位回归模型,提出一种新的有效估计方法——逆概率多重加权(IPMW)估计。该方法是在逆概率加权(IPW)估计的基础上,结合倾向得分匹配及模型平均思想,经过多次估计,加权确定最终参数估计结果。该方法适用于响应变量是独立同分布或独立非同分布的情形,并适用于绝大多数数据缺失场景。经过理论推导及模拟研究发现,IPMW估计量在继承IPW估计量的优势上具有更稳健的性质。最后,将该方法应用于含有缺失数据的微观调查数据中,研究了经济较发达的准一线城市中等收入群体消费水平的影响因素,对比两种估计方法的估计结果,发现逆概率多重加权估计量的标准偏差更小,估计结果更稳健。(本文来源于《统计研究》期刊2018年09期)

郭威[5](2018)在《基于统计学习的逆概率加权方法研究及其在医学中的应用》一文中研究指出研究背景:探讨处理/暴露因素与结局之间的因果效应是医学研究中的重要课题。随机对照试验通常被认为是因果效应估计的金标准。在观察性研究中,研究对象的处理分配机制通常不是随机发生的,而是会受到众多混杂因素的影响。在比较处理组间的暴露效应时,如果忽略这些混杂因素,效果估计就会发生偏倚。基于边际结构模型的逆概率加权法(inverse probability weighing,IPW)是一类可用于观察性资料处理效应估计的重要方法。IPW在应用时需要满足一些前提假设,比如无遗漏未观测混杂因素、非负性假设、稳定单元处理值假设以及要正确设定权重估计模型等。对于IPW而言,第一阶段的逆概率权重估计非常关键,这是因为最终的处理效应估计对于第一阶段的权重估计准确与否非常敏感。如果权重估计模型设定错误(如遗漏二次项或交互项等),估计的权重就不准确,且容易产生极端权重,导致最终的效应估计发生偏倚。近年来,越来越多的研究人员推荐采用包括许多统计学习算法在内的数据适应性方法估计逆概率权重,取得了良好的效果。然而,目前的研究大多局限于二分类处理因素资料以及单一结局纵向生存资料。医学实践中存在着许多处理/暴露因素为连续性变量的资料以及时依性竞争风险生存资料。对于处理因素为连续性变量的资料类型而言,采用IPW进行效应估计要比二分类处理因素的情况更复杂,比如要考察处理因素的分布类型、控制较多的极端权重对于效应估计的影响等。对于时依性竞争风险生存资料而言,传统的边际结构原因别风险模型(marginal structural cause specific hazard models,MSCSHM)中的逆概率权重是多次随访所得的权重累乘所得。即使权重估计模型设定发生了比较轻微的错误,最终处理效应估计都将可能发生严重的偏倚。有鉴于此,探索基于统计学习算法的逆概率加权法在连续性处理因素资料以及时依性竞争风险生存资料中的适用效果具有潜在的理论意义和实际应用价值。研究目的:1、针对连续性处理因素的资料,通过模拟研究比较包括一般线性模型在内的7种逆概率权重估计方法在不同数据情境下的估计效果。同时,以一般线性模型为例,探讨权重截断方法对于效应估计的影响。2、针对时依性竞争风险生存资料,在MSCSHM的基础上,引入8种统计学习方法估计逆概率权重。通过模拟研究比较logistic回归与这8种方法在不同数据情境下的估计效果,筛选出其中表现较优的方法。另外,探讨不同程度的权重截断水平对于各个估计方法的影响。研究方法:针对以上两个研究目的,均分别采用数据模拟→模型构建→模型筛选→实例应用的研究流程开展研究。分述如下:1、连续性处理因素的逆概率加权方法研究采用蒙特卡洛法模拟处理因素为连续性变量的观察性队列资料。模拟实验设置叁种不同大小的样本量(250、1000和2500)和四种不同复杂程度的处理因素生成模型(线性可加、非线性、非可加以及非线性非可加模型),比较一般线性模型(general linear model,GLM)、gamma回归模型、分位数分组法(quantile binning,QB)、协变量均衡性倾向性评分(covariate-balancing propensity score,CBPS)、非参数CBPS(nonparametric CBPS,npCBPS)、boosted分类与回归树(boosted classification and regression trees,boosted CART)和随机森林(random forest,RF)等7种方法估计广义倾向性评分和逆概率权重,另外,对由GLM得到的稳定权重分别在双侧1%和5%分位点进行截断处理,得到相应的截断权重。进一步,利用得到的9个权重变量对原始样本加权,通过加权结局回归模型得到各自的处理效应估计量。采用平均绝对相关系数(average absolute correlation coefficient,AACC)、相对偏倚(relative bias)、经验标准差(standard deviation,SD)、模型输出的标准误(standard error,SE)、均方根误差(root mean squared error,RMSE)和95%置信区间(confidence interval,CI)覆盖率等指标评价估计效果。最后通过研究吸烟量对于医疗总支出的影响,比较不同的IPW估计方法在实际数据分析时的应用效果。2、时依性竞争风险生存数据的逆概率加权方法研究首先提出采用MSCSHM作为本研究的基础框架,引入LASSO、贝叶斯logistic回归、CART、bagged CART、boosted CART、随机森林、支持向量机(support vector machine,SVM)和EL(ensemble learner)算法等8种统计学习方法构造第一阶段的逆概率权重。然后采用蒙特卡洛法模拟时依性竞争风险生存数据。模拟设置了两种不同大小的样本量(250和1000)、不同强度的处理因素序列的自相关性(相关系数为log(4)和0.5)、不同的竞争终点事件数(2和3)以及四种处理因素生成模型(线性可加、非可加、非线性以及非线性非可加模型)。分别采用logistic回归和上述8种统计学习方法估计稳定权重。另外,分别在稳定权重分布的双侧1%、5%、10%、25%、35%和50%分位点进行截断处理,探讨不同的截断水平对于处理效应估计的影响。采用绝对偏倚、相对偏倚、SD、SE、RMSE和95%CI覆盖率等指标评价估计效果,探索不同数据情境下的最优方法。最后,将筛选得到的最优方法应用于评估硫唑嘌呤暴露对于炎症性肠病患者的(I)恶性肿瘤及死亡的发生风险以及(II)非恶性肿瘤相关死亡的发生风险,与传统的分析方法得到的结果进行对比,评价研究方法在实际数据分析时的应用效果。上述研究过程均采用统计分析软件R 3.4.3中实现。研究结果:1、连续性处理因素的逆概率加权方法研究(1)模拟研究结果:(1)在均衡协变量的能力方面,CBPS在所有方法中表现最好,其次为npCBPS。直接采用GLM法得到的原始稳定权重对样本加权,协变量分布仍然不均衡,通过权重截断方法去除极端值后,采用GLM(1,99)加权后的样本的协变量均衡性显着改善。(2)Boosted CART和RF在不同程度的权重估计模型误设的情况下的估计偏倚均较小,在减小偏倚方面优于其他方法。(3)由GLM、GLM(1,99)和GLM(5,95)叁者的SD可以看出,权重截断方法可以减小估计量的方差,且随着截断水平的提高,方差逐渐变小。(4)CBPS、npCBPS和boosted CART的RMSE较小,估计精度较高。由于权重截断减小了方差,致使GLM(5,95)和GLM(1,99)的RMSE小于前述叁种方法。(5)随着处理因素生成模型复杂度的上升,各个方法的95%CI覆盖率均有不同程度的下降。GLM(1,99)、CBPS、npCBPS和boosted CART四种方法的表现相对稳健。(2)实例研究结果:通过“考察处理因素的分布-逆概率权重的估计-考察权重的分布-协变量均衡性的评价-剂量反应函数的估计”的分析流程研究了吸烟数量对于医疗总支出的影响。结果表明,随着吸烟量的增加,个人的医疗总支出也随之增加;在调整了相关混杂因素后,吸烟量对于医疗总支出的效应虽有所减弱,标准误增大,但是除了boosted CART(1,99)加权法得到的估计量具有临界统计学意义外,GLM(1,99)和RF(1,99)加权法得到的估计量仍具有显着的统计学意义。2、时依性竞争风险生存数据的逆概率加权方法研究(1)模拟研究结果:(1)当处理因素生成模型仅包括主效应项(线性可加)时,boosted CART估计量的偏倚较小,且在SD和RMSE方面表现最优,而基于参数logistic回归的估计量的SD较大,估计精度较差。(2)当处理因素生成模型仅包括二阶交互项(非可加)时,在大样本且处理因素序列强自相关时,boosted CART和RF的估计效果非常接近,且均优于其他方法;在小样本或处理因素序列中度自相关时,RF在偏倚和RMSE方面表现最优。(3)当处理因素生成模型包括非线性项时,boosted CART在偏倚、RMSE和95%CI覆盖率方面最优。(4)当处理因素生成模型同时包括二阶交互项和非线性项时,RF在RMSE和95%CI覆盖率方面表现最优。(5)低水平(如双侧1%分位点)的权重截断能够进一步减小boosted CART和RF两种方法的RMSE。(6)在相同的模拟情境下,多数估计方法的最优截断水平不尽相同;在不同的模拟情境下,同一种方法的最优截断水平也有差异。最优截断水平的选择具有数据依赖性。(2)实例研究结果:采用带有时依性协变量的Cox比例风险模型、分别基于logistic回归和boosted CART的MSCSHM分析硫唑嘌呤暴露对炎症性肠病患者的两个竞争终点事件的风险大小。结果显示,无论处理因素定义为过去3个月暴露还是累积暴露,各个模型的效应估计结果均未显示暴露效应具有统计学意义。研究结论:对于连续性处理因素资料,CBPS和npCBPS在均衡协变量方面的能力较强;在减小估计偏倚方面,boosted CART和RF等统计学习算法的表现较优;在采用IPW进行效应估计时,应首先考察权重变量的分布,若存在较多离群点,应首先对权重作截断处理,然后进行下一步的效应估计。对于时依性竞争风险生存资料,在采用MSCSHM模型进行效应估计时,由于实际资料中的处理分配机制往往未知,建议采用boosted CART和RF两种方法替代传统的logistic回归构建逆概率权重,以减小模型设定错误对于效应估计的影响。(本文来源于《中国人民解放军海军军医大学》期刊2018-05-01)

田野,马洁,黄璐,杜泽玉,吕军城[6](2018)在《逆概率加权法评价CAF和TAC化疗方案治疗乳腺癌疗效的回顾性队列研究》一文中研究指出目的探索TAC化疗方案和CAF化疗方案治疗乳腺癌的真实疗效。方法采用回顾性队列研究的方法选择乳腺癌患者800例,其中接受CAF者(CAF组)513倒,接受TAC者(TCA组)287例,分别采用倾向性评分(PS)匹配、回归法、加权法,以生存时间和结局为效应指标,探索不同的化疗方案对乳腺癌患者的生存率的影响。结果 PS匹配法匹配后两组乳腺癌患者的年龄、婚姻状况、肿瘤性质在匹配前不均衡,在匹配以后均衡,后经过Log-rank检验两组生存曲线之间差别有统计学意义(P<0.05),得出TAC化疗方案治疗乳腺癌的效果优于CAF化疗方案。PS匹配前利用Cox回归模型和Logistic回归模型,分别采用PS回归调整法、PS逆概率处理加权法(IPTW)、PS标化死亡比加权法(SMRW)、双稳健半参模型法(PS回归调整与加权法的结合,DRW)进行两种化疗方案的生存分析,加权之后基线协变量得到均衡,并经过调整的Log-rank检验两组生存曲线之间差别均有统计学意义(P<0.05),且结果均显示TAC化疗方案治疗乳腺癌的效果优于CAF化疗方案。通过对不同模型之间的比较,利用DRIPTW模型和DRSMRW模型的得出的处理效应的偏倚显着减小,且减小偏倚的效果优于与之相对的IPTW和SMRW法,同时也优于匹配法和回归调整法,其中DRSMRW模型法最优,相对偏倚为0 037。结论在回顾性队列研究中,采用双稳健半参模型法对不同化疗组中乳腺癌患者的因果效应和预后结果的影响做出处理之后,TAC化疗方案治疗乳腺癌的效果优于CAF化疗方案,为乳腺癌患者指定了最佳的治疗方案。(本文来源于《健康中国-第四届亚太卫生应急与救援国际大会论文集》期刊2018-03-31)

钟细华[7](2015)在《双稳健逆概率加权方法的建立及其在临床试验数据缺失中的应用》一文中研究指出一、研究背景和研究目的随机对照试验被认为是当前评价试验产品是否具有治疗效果的研究设计金标准。然而在随机对照试验中,各种原因导致的数据缺失有其自身特点,但仍然十分普遍。由于数据缺失,导致结果产生偏倚。这势必会影响到数据的意向性分析,以及进一步威胁到研究结论的有效性。数据缺失处理方法的研究由来已久,迄今为止主要包括完整病例分析、填补法、基于似然的分析方法和逆概率加权法等。这些方法的应用都受制于数据缺失的机制,数据呈随机缺失的假设较易满足。当数据呈随机缺失时,除非缺失不影响结果,否则不建议直接采用完整病例法分析;而多重填补法和极大似然估计方法都有其各自的特点和局限性。例如,多重填补时,分析模型不能含有填补模型之外的变量、非线性项和交互项,因此,该兼容性要求对结局分析模型的构建有一定的限制,而且两模型容易产生冲突。此外多重填补牵涉随机抽样,决策考虑要点也较多,结果不确定不唯一。应用极大似然估计法时,其依赖于参数假设,如数据呈正态性;需合理构建似然函数;缺失比例不宜过大;当采用贝叶斯后验推断时,结果依赖于先验信息等。逆概率加权法增加完整病例的权重,分析直观;但是单纯性逆概率加权不能利用部分缺失病例的信息,并且权重采用Logistic回归获得受制于回归模型且有时过大。因此,本研究基于随机缺失数据,对单纯性逆概率加权方法加以改进,一方面改进结局分析模型,改进后能同时利用完整病例和部分缺失病例的信息;另一方面,采用随机森林非参数的方法优化未缺失概率的估计,且尽量避免权重过大。此外,对缺失数据进行敏感性分析应用新方法,其不需要额外满足统计假设,且从临床角度看,结果也容易解释。二、研究方法首先,理论上合理构建双稳健逆概率加权方法。一方面我们在单纯性逆概率加权方法的算式中,增加期望值为0的项,而该项可以加入部分缺失病例的信息。另一方面,未缺失概率模型中倾向性评分的估计还采用随机森林非参数的方法加以比较。其次,我们利用模拟数据建立双稳健逆概率加权方法并采用SAS和R语言加以实现,同时与其它方法进行模拟数据处理效果的比较。模拟数据时从随机对照试验数据缺失的特点出发,预设研究主要终点呈单调性缺失,其缺失机制呈随机缺失,即采用Logit模型基于每个受试者的基线协变量和研究中辅助变量的信息对其主要终点是否缺失进行模拟。研究中主要终点的模拟在其呈正态分布的基础上,还增加了另外叁种情景,即结局分析模型有随机中心效应、主要终点呈非正态分布、未缺失概率模型错误结局分析模型正确。这四种情景中,我们均考虑了4种大小的样本量(N=120;240;600;1,000),每种样本量下又进一步设计了不同的研究总缺失比例(10%;20%;30%)。统计分析时,首先对Logit建模和随机森林法的倾向性评分进行比较;然后再对单纯性逆概率加权、双稳健逆概率加权与多重填补法等进行分析方法比较。评价指标包括疗效组间差异的绝对误差均值、95%可信区间覆盖率和组间差异的误差均方。最后,还进一步在一个非劣效设计的糖尿病随机对照试验中进行应用比较。对Logit建模和随机森林法进行了倾向性评分的比较,还比较了这几种缺失处理方法的表现。为了支持研究结论的稳健性,采用反转点方法,分缺失填补数据的标准差等于零、等于组内观测值的标准差、填补后整组的标准差等于观测值的标准差叁种情况,对主要分析结果进行敏感性分析。叁、结果基于II型糖尿病的初步临床规律,设立未缺失概率模型和结局分析模型的函数关系。各种模拟情形中,通过调整未缺失概率模型函数的系数,均达到了预期的研究总缺失比例。模拟数据倾向性评分不论是试验组或对照组、不同的预设缺失比例或不同的研究样本量时,均是随机森林的倾向性评分值变异度小,并且极端小的倾向性评分值少,平均值或中位数均稍微较大。此外,不同研究样本量之间,两种算法内部各自的倾向性评分估计值十分接近。在相同缺失比例的试验组或者对照组内,随着研究样本量的增加,随机森林算法的倾向性评分值几乎都逐渐增加向1接近;而Logit回归模型算法的倾向性评分值在四种情景中的趋势并不完全一致,有时增加有时降低。模拟数据疗效差异的绝对误差均值和误差均方由于偶然性,模拟中无缺失数据仍然有一定的误差,但误差均是最小的。不论采用何种缺失处理方式,样本量越大绝对误差均值越小;缺失比例越大绝对误差均值越大。四种情景中,均是双稳健逆概率加权法优于单纯性逆概率加权法。除结局变量呈非正态分布的情景外,随机森林倾向性评分加权法往往表现最优。Logit模型倾向性评分加权法的表现往往较差。另外,同步采用误差均方进行评价时,各种方法表现出来的规律与采用绝对误差均值发现的规律类似。模拟数据疗效差异的95%可信区间覆盖率可信区间覆盖率的规律性不如绝对误差均值指标的明显,并未出现双稳健逆概率加权法一致优于单纯性逆概率加权法,也未出现随机森林算法一致优于Logit模型。但多重填补法具有良好的覆盖率。实际应用数据分析不论试验组、对照组还是两组合计,随机森林算法的倾向性评分的平均水平(平均值和中位数)均较高,但倾向性评分的标准差并不总是随机森林算法的小。从疗效的组间差值看,多重填补法的结果最大,其最小二乘均数及95%可信区间为0.069(-0.148,0.286);Logit的单纯性逆概率加权法的结果最小,其最小二乘均数及95%可信区间为0.014(-0.207,0.235);其余处理方法的结果十分接近。总体而言,不论采用哪一种处理方法,研究的非劣效结论均成立。反转点分析结果表明,从临床角度看,非劣效结论在叁种情况下均成立是可信的。四、结论在模拟随机对照临床试验数据中,当主要终点呈单调性缺失且属于随机缺失时,采用双稳健逆概率加权法,尤其随机森林双稳健逆概率加权法处理具有良好的表现,优于单纯性逆概率加权法,且除主要终点呈非正态分布情况下甚至优于广受欢迎的多重填补法,值得考虑应用。在实际应用中,随机森林结合逆概率加权的方法以及Logit双稳健逆概率加权法,均获得了稳健的分析结果。反转点分析作为一种敏感性分析方法,不要求额外统计假设,临床上亦易于解释。总之,本研究建立了随机森林结合双稳健逆概率加权法处理缺失的方法,尽量避免了过大的权重,同时利用了部分缺失病例的信息,为随机对照临床试验主要终点呈单调性随机缺失时的分析提供了一种值得考虑的处理方法。(本文来源于《第二军医大学》期刊2015-05-01)

杨丹[8](2014)在《小的单结节肝细胞癌:利用逆概率加权法比较经导管肝动脉化学栓塞、射频消融和肝切除术》一文中研究指出目的利用逆概率加权法来控制选择性偏差,比较经导管肝动脉化学栓塞术(TACE)、射频消融术(RFA)和肝切除术(HR)治疗小单结节肝细胞癌的有效性。材料与方法(本文来源于《国际医学放射学杂志》期刊2014年04期)

王历容,秦永松,罗志军[9](2014)在《逆概率加权填补下两线性模型中响应变量分位数差异的经验似然统计推断》一文中研究指出本文对两个样本数据不完全的线性模型展开讨论,其中线性模型协变量的观测值不缺失,响应变量的观测值随机缺失(MAR).我们采用逆概率加权填补方法对响应变量的缺失值进行补足,得到两个线性回归模型"完全"样本数据,在"完全"样本数据的基础上构造了响应变量分位数差异的对数经验似然比统计量.与以往研究结果不同的是本文在一定条件下证明了该统计量的极限分布为标准χ_1~2,降低了由于权系数估计带来的误差,进一步构造出了精度更高的分位数差异的经验似然置信区间.(本文来源于《应用概率统计》期刊2014年01期)

孙建州[10](2012)在《解释概率》一文中研究指出20世纪,特别是其上半叶,是数理统计学发展史上一个辉煌的时代。从现代数理统计学框架的建立到发展成为一个成熟的学科,是在这个时期完成的。在统计学界,由于观点不同存在多种学派。其中主要是早在十九世纪就存在的频率学派和贝叶斯学派。费歇尔(R.A. Fisher)和杰弗里斯(H. Jeffreys)分别是两种学派的代表人物。两人在20世纪30年代,以写论文一应一答的形式,进行了长时间的辩论。论文内容主要是在介绍费歇尔和杰弗里斯两位科学家的学术背景和工作成果之后,分析他们这场辩论的主要内容,深入探究频率学派和贝叶斯学派之间的分歧和联系。费歇尔致力于遗传学研究,而杰弗里斯是个地球物理学家,所以两人的论战反映了对科学研究过程的两种不同态度。有些学者认为,21世纪统计学的一个动向是“频率学派与客观贝叶斯学派的合流”。所以了解频率学派与贝叶斯学派之间统计思想的区别和联系,对于学习现代统计学理论和把握统计学未来的发展方向都有重要意义。论文的写作思路是首先简要介绍一下从17世纪中期到19世纪末统计学的发展历史。可以看到,逆概率尽管在理论上并未取得很大进展,但是人们一直在用逆概率方法解决各种实际问题。然后,介绍费歇尔和杰弗里斯两位科学家的学术背景和主要研究工作,特别是在概率方面的成就。能够看出两人的统计哲学思想深受各自研究思路和研究方法的影响。接着,就是本文的主要内容,两人在概率解释上的辩论。虽然两人有一些误解,但是能够从中看出他们代表的两种学派之间的主要分歧点。最后部分对全文内容进行了简单总结。(本文来源于《天津财经大学》期刊2012-05-01)

逆概率论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在分位回归中,自变量缺失是一种重要的数据缺失问题。尤其当自变量缺失与因变量有关时,已有的多重插补法会带来有偏估计。通过逆概率加权,将修正后的逆概率加权多重插补法用于模拟研究和应用研究。模拟研究表明,在不同的缺失相关程度下,逆概率加权多有效解决了同工作时间的数据缺失问题,同时重插补法能够有效减少估计偏差,并在一定程度上保证估计量的有效性。在中国综合社会调查(CGSS)的应用研究中,该方法有效解决了周工作时间的数据缺失问题,同时揭示了影响年收入的重要因素,说明该方法具有一定的应用价值。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

逆概率论文参考文献

[1].吕大刚,刘洋,于晓辉.第二代基于性能地震工程中的地震易损性模型及正逆概率风险分析[J].工程力学.2019

[2].程豪.逆概率加权多重插补法在中国居民收入影响因素中的应用研究[J].统计与信息论坛.2019

[3].吕大刚,刘洋,于晓辉.第二代基于性能地震工程中的地震易损性模型及正逆概率风险分析[C].第27届全国结构工程学术会议论文集(第Ⅰ册).2018

[4].邰凌楠,王春雨,田茂再.缺失数据下的逆概率多重加权分位回归估计及其应用[J].统计研究.2018

[5].郭威.基于统计学习的逆概率加权方法研究及其在医学中的应用[D].中国人民解放军海军军医大学.2018

[6].田野,马洁,黄璐,杜泽玉,吕军城.逆概率加权法评价CAF和TAC化疗方案治疗乳腺癌疗效的回顾性队列研究[C].健康中国-第四届亚太卫生应急与救援国际大会论文集.2018

[7].钟细华.双稳健逆概率加权方法的建立及其在临床试验数据缺失中的应用[D].第二军医大学.2015

[8].杨丹.小的单结节肝细胞癌:利用逆概率加权法比较经导管肝动脉化学栓塞、射频消融和肝切除术[J].国际医学放射学杂志.2014

[9].王历容,秦永松,罗志军.逆概率加权填补下两线性模型中响应变量分位数差异的经验似然统计推断[J].应用概率统计.2014

[10].孙建州.解释概率[D].天津财经大学.2012

论文知识图

逆概率加权前后的样本中处理因...样本量为1000时四种模拟情境下的不同...6-16相邻区域平均温度差随时间的变化...2-9业务参数逆概率分布亟数的拟...3.4:缺失概率0.34的模拟研宄基于...3.2:缺失概率0.34的模拟研究基于...

标签:;  ;  ;  ;  ;  ;  ;  

逆概率论文_吕大刚,刘洋,于晓辉
下载Doc文档

猜你喜欢