摘 要:运用广义回归神经网络(GRNN)方法对小样本多维项目反应理论(MIRT)补偿性模型的项目参数进行估计,尝试解决传统参数估计方法样本数量要求较大的问题。MIRT双参数Logistic补偿模型被设置为二级计分的二维模型。首先,模拟二维能力参数、项目参数值与考生作答矩阵。其次,把通过主成分分析得到的前两个因子在每个题目上的载荷作为区分度的初始值以及题目通过率作为难度的初始值,这两个指标的初始值作为神经网络的输入。集成100个神经网络,其输出值的均值作为MIRT的项目参数估计值。最后,设置2×2种(能力相关水平:0.3和0.7;两种估计方法:GRNN和MCMC方法)实验处理,对GRNN和MCMC估计方法的返真性进行比较。结果表明,小样本的情况下,基于GRNN集成方法的参数估计结果优于MCMC方法。
关键词:多维项目反应理论;补偿性模型;广义回归神经网络;参数估计
1 引言
1.1 问题提出
自20世纪50年代起,美国心理测量学家Lord进行大量的数据分析,提出项目反应理论(Item Response Theory,IRT)双参数正态肩型模型及其参数估计方法以来,IRT模型不断发展,从二值计分到多级计分,从双参数到多参数,并应用到被试潜在特质分析、测验等值分析、题库建设以及计算机自适应测试等方向,是较为重要的心理与教育测量理论(罗照盛,2012)。随着IRT模型演变,IRT参数估计的方法也随之发展完善,影响比较大的方法有,Birnbaum(1968)提出的联合极大似然方法(Joint Maximum Likelihood Estimation,JMLE),Bock与Aitkin(1981)提出的EM算法(Baker,2004),以及马尔科夫蒙特卡洛(Markov Chain Monte Carlo,MCMC)算法(Jiang,2005;Bolt & Lall,2003;Béguin & Glas,2001)。项目以及能力参数的估计是IRT的重要组成部分,传统的IRT参数估计方法要求测验必须有较大的题目数量与考生数量,才可以获得较为理想的参数估计结果(关潮辉,丁树良,2014)。就这一问题,余嘉元(2009)提出了基于广义回归神经网络(Generalized Regression Neural Network,GRNN)集成的IRT二分法计分参数估计,应用于小样本的参数估计,在其研究情境下,该方法比BILOG-MG软件所估计出来的参数精度要高。
早期项目反应理论有三大基本假设:单维性假设,局部独立性假设和项目反应函数假设,但这三种理论假设都存在着一定的局限性。后来,Reckase(2009)曾提出项目反应理论的单维性假设在心理与教育测量的很多应用中不符合实际,因此提出了多维项目反应理论(Multidimensional Item Response Theory,MIRT),该理论突破了单维性假设,是对IRT理论的扩展。同样,前文所列举出来的IRT参数估计方法,有些也可勉强适用于MIRT的参数估计。但由于MIRT的参数个数以及维度过多,这些方法不能够有效的实现参数估计。在引入MCMC参数估计方法之后,许多复杂或者高维的模型得以实现参数估计。研究表明,对于IRT的参数估计来说,只有一个参数的IRT模型就需要200考生数量,双参数以及三参数的模型则至少需要1000考生数量(Thissen & Wainer,1982;Barnes & Wise,1991)。Badcock(2011)在模拟研究中发现,对于多维项目反应理论非补偿模型的估计来说,样本量为4000且单个维度要求六个单独的题目,才能取得较高的返真性。因此,与IRT的参数估计类似,通过传统参数估计方法,MIRT的参数估计同样需要较大的样本量以及题目量,这给实践中小样本的参数估计需求带来困扰。
基于此,该研究对运用GRNN神经网络集成的方法估计二维项目反应理论双参数二分法计分补偿性模型的项目参数进行了探索。二分法计分MIRT模型开始出现主要是通过扩展二分法计分IRT的形式(Yao & Schwarz,2006),目前广泛使用的MIRT补偿性模型有两种,分别是McDonald的正态肩形模型(Christoffersson,1975;McDonald,1997)和Reckase的Logistic模型(Reckase & McKinley,1997),研究中所使用的模型为Logistic模型,其公式如下:
P(Uij=1│
(1)
其中为MIRT的维度个数,a为斜率,b为截距,i为题目数量。
采用主成分分析法(Principal Component Analysis,PCA)分析作答矩阵,将前两个因子在每道题目上的因子载荷作为GRNN神经网络的输入,其对应的输出则为两个维度的MIRT区分度参数,因MIRT借鉴了因子分析(Factor Analysis,FA)的方法(Mcdonald,2000),所以MIRT与因子分析本质上必然存在着内隐关系。但两者所认同的观点是不同的,MIRT理论认为题目之间的变异是需要重视,有必要进行分析;而因子分析则认为题目间的变异会不利于分析的结果。然后将经典测量理论(Classic Test Theory,CTT)的难度即通过率作为GRNN神经网络的输入值,对应的输出则是MIRT中的MID。CTT的难度与MIRT中的MID都表示题目难易程度,因此两者之间会存在有内隐关系。研究原理是,对上述具有内隐关系两类变量建立回归关系,用输入值来预测输出值是可以用GRNN神经网络的方法表征和实现的,对于神经网络的输入值——CTT的难度与PCA的因子负荷来说,可以较为迅速、容易地获得。
1.2 GRNN集成
GRNN是径向基函数(Radial Basis Function,RBF)神经网络的一种改进,相较于RBF来说,其具有更强的优势,该网络的结构如图1所示。GRNN由Specht(1991)提出,具有很强的非线性映射能力与学习速度,在样本的数据量比较少时,其预测效果较为理想。该网络同时能处理不稳定的数据,且神经网络的参数单一,较为容易控制与调节。
图1GRNN的结构
使用Python语言编写的neupy包中提供的GRNN类来构建模型(Home-NeuPy,2018)。其中有个GRNN的参数称为STD,即概率密度函数(Probability Density Function)的标准差,其默认值为0.1。对于该值,neupy官方网站上的解释为,输入的特征值高,那么标准差应该高。例如,输入的值在0~20之间,那么标准差应该取值为10或者15,较小的标准差会影响预测结果。
在GRNN用于IRT的参数估计时,神经网络集合估计的误差值比单一神经网络的误差小(余嘉元,2009),因为单一的模型往往会产生过拟合的现象。Bagging(bootstrap aggregating,自举汇聚法)方法可以减小过拟合现象,通常在复杂模型的表现的较为理想。Bagging的方法有许多种,主要区别在于随机抽取训练子集的方法不同,抽取子集如果是有放回的,那么则称为Bagging(Breiman,1996)。采用Bagging方法对训练集进行有放回抽样(Oza,2005),最终形成一个神经网络的集成,并用每个GRNN的输出值的均值作为MIRT项目参数的估计值。
1.3 MCMC估计方法
研究使用的是MCMC方法中的M-H算法(Metropolis-Hastings sampling;Metropolis,1953),该方法可估计出多种MIRT模型的项目和能力参数,可以处理二级计分乃至多级计分模型。Clib和Greenberg(1995)对该方法做出了比较全面的阐述,联合似然函数看作在给定作答矩阵后未知参数的后验分布,并将其看作成平稳分布。
项目参数矩阵和能力参数矩阵可以表示为:
选取2016年11月至2017年11月在医院接受治疗的新发急性呼吸道传染病患者50例作为研究对象。将其随机的分为观察组和对照组,每组25例。对照组男性13例,女性12例,年龄10至70岁,平均年龄(47.8±7.4)岁,文化程度:小学9例,初中7例,高中5例,大专及以上4例,观察组男性13例,女性12例,年龄11至71岁,平均年龄(48.1±6.9)岁,文化程度:小学9例,初中6例,高中6例,大专及以上4例。观察组和对照组性别、年龄、文化程度等一般资料对比无统计学意义(P>0.05)。
β=(β1,β2,…,βM)T,θ=(θ1,θ2,…,θN)
(2)
其中M代表的是题目的数量,N代表的是考生的数量。
仁里铌钽矿床位于幕阜山复式岩体西南缘,大地构造上位于扬子陆块东南缘江南新元古代造山带中段北缘之湘东北断隆带, 处于扬子陆块与华夏陆块过渡部位的中生代构造岩浆隆起带,主要经历了弧盆与岩浆作用阶段、裂谷盆地阶段、陆表海盆地阶段、陆内构造-岩浆阶段和断陷盆地阶段[2]。
似然方程可以表示为,
P(X│θ,β)│θj,βi)
(3)
在某次考试中,所有考生的能力分布记作P(θ│γ),其分布的参数为γ。θ符合正态分布,则γ=(μ,σ),μ为平均数,σ为方差与协方差矩阵,根据贝叶斯原理,其联合后验分布可写为,
2.4.1 误差统计指标
(4)
P(θ│γ)(θ_j│γ)
(5)
研究中的两种评价标准,分别是RMSE与MAB计算公式如下:
在MCMC方法中,其转移核t(transition kernel)为在某个给定当前参数值状态下的条件密度:
t[(θk,βk),(θ(k+1),β(k+1))]=P[(θ(k+1),β(k+1))|(θk,βk)]
当使用GRNN估计方法时,在两种相关系数作为实验变量的情况下,首先,两类参数估计的误差都要比MCMC估计方法产生的误差低;其次,GRNN估计方法对于区分度参数的估计来说,结果要更为稳定,没有受到考生能力维度相关高低的影响;最后,除去GRNN建模的时间,GRNN估计方法运行的时间要大大少于MCMC估计方法。
(6)
其中上标k与k + 1 代表前一状态和后一状态。然后将转移核t设置成两个条件概率的乘积:
t[(θk,βk),(θ(k+1),β(k+1))]=P(θ(k+1)|X,βk)P(β(k+1)|X,θ(k+1))
(7)
转移核的过程中,一共分成了两个成分,所以对观察值的抽样也可以分两步。首先从条件分布中抽取出θ;其次将其可设定为项目参数的条件分布。
如果转移核可用马尔科夫链的模拟步骤,把每一步的观察数据作为一个抽样样本来保存,MCMC方法中一般需要很长的马尔科夫链才能够达到比较稳定的分布。初始值的设置也会影响到结果。在迭代前期的观察数据一般应予以抛弃,这一阶段被叫做“烧制(Burn-in)”阶段。“Burn-in”阶段之后的观察数据用于估计稳定分布的项目参数与能力参数。即分布的标准差为参数估计的标准误(王鹏,朱新立,王芳,2015)。
2 研究方法
2.1 研究思路
最近几年,武当山积极地推进武当武术的发展,倾力打造以武当武术为核心的武当文化展示区、健康养生体验区、武当太极品牌以及精品赛事活动系列,促进武当山旅游产业的转型、升级。2017年太极拳公开赛在武当山举行,届时,武当山景区的自媒体传播效果将会进一步提高。除此之外,第四届国际道教论坛将在武当山举行,这将大大提高武当山景区的知名度,为此,武当山景区专门设计了第四届国际道教论坛宣传口号有奖征集活动,通过对自媒体技术的运用,为武当山景区进行宣传。
图2研究流程图
2.2 研究数据
利用BMIRT(Yao,2013)软件随机产生n个被试能力参数θ,能力参数服从标准正态分布,即θ~N(0,1)。自编Python程序随机生成i个项目参数,其中区分度参数a1,a2服从均匀分布,即a~U(0.5,1.5),难度参数服从标准正态分布,即b~N(0,1)。
(5)三个项目参数,分别为a1、a2、b,最终会得到3×100个神经网络。将测试集代入到神经网络,得到测试集项目参数的估计值,与真值对比计算出RMSE与MAB,获得参数估计的返真性。
(1)将上面的能力参数与项目参数代入二维项目反应理论双参数补偿性模型的公式(1)中,得到n中,i的概率值矩阵Pni;
(2)产生一个 [ 0,1] 范围内n围内i随机数矩形Rni;
(3)假如Pni<Rni,认为被试答错项目,否则,答对项目。
经过上述步骤即可获得n×i二分作答矩阵,3000 × 1000与2000 × 1000的二分作答矩阵在被试能力参数两个维度的相关系数分别为0.7与0.3情况下共产生4份作答矩阵,以此用于训练GRNN。200 × 100的二分作答矩阵根据相关的高低分为两组,高相关组和低相关组,即在被试能力参数相关系数分别为0.7与0.3情况下产生30份作答矩阵,共有2×2种(能力相关水平:0.3和0.7;两种估计方法:GRNN和MCMC方法)实验处理,其中由计算机程序模拟出来的参数值叫做真值,由作答矩阵通过上述两种方法估计出来的值叫做估计值(Bolt & Lall,2003),通过计算,两类值的返真性用来评估MCMC方法与GRNN方法的优劣。其中BMIRT软件估计的迭代次数为15000,内燃值为3000,可以获得平稳收敛的马尔科夫链(Yao & Schwarz,2006)。
2.3 神经网络建模
神经网络具体的建模步骤如下:
(1)用生成的二分作答矩阵训练神经网络。其中样本数量和能力参数的相关系数作变量,共有2×2种(能力相关水平:0.3和0.7;样本数量:2000和3000)实验处理,共四份作答矩阵。
(2)运用SPSS 22对(1)中的二分作答矩阵进行PCA降维,把前两个因子在每道题目的载荷作为神经网络对应二维项目反应理论双参数补偿性模型区分度的输入值,每道题目的CTT的难度(该题得分比该题总分)二维项目反应理论双参数补偿性模型难度的输入值。
(3)对(2)中得到的神经网络输入值进行随机划分,80%作为训练集,20%作为测试集。
(4)运用Bagging方法(Mordelet & Vert,2014)对训练集进行重复有放回抽取700个项目参数,共抽取100次。每次抽取都会得到一个神经网络,即神经网络的集合共100个。将100个神经网络输出的均值作为MIRT的项目参数的估计值。
作答矩阵的生成步骤如下:
2.4 估计方法评估
P(θ,β,γ│X)∝P(X│θ,β,γ)P(θ│β,γ)P(β)P(γ)=P(X│θ,β)P(θ│γ)P(β)P(γ).
对于(4)公式的右边来说,P(X│θ,β)由(3)可以获得。
(8)
其中n代表的是项目参数(难度或区分度)的真值,代表项目参数估计的真值。I代表的是题目的数量,J代表测验的重复次数。
2.4.2 方法比较
对统计的所有数据均采用SPSS17.0进行统计分析。计数资料采用n表示。以(P<0.05)为差异有统计学意义。
用MCMC参数的估计方法与GRNN参数的估计方法进行对比。选择2.3中结果最优的条件下的GRNN集合用以参数估计,将2.2中的200 × 100的二分作答矩阵在被试能力参数相关系数分别为0.7与0.3情况下共30份作答矩阵,以此作为实验数据,进行参数估计,并算出每种条件与每种估计方法下的RMSE与MAB,然后进行比较。
3 研究结果
3.1 测试集误差结果
用2.2中的数据来构建神经网络集合的二分作答矩阵为3000 × 1000与2000 × 1000,被试能力的相关系数为0.3与0.7。在1000个题目里面,其中80%作为训练集,20%作为测试集。其中测试集项目参数估计的误差如表1所示。相较于2000个被试量来说,3000个被试量的所产生的项目参数估计的误差有所减小,因此,3000被试量所产生的模型用于接下来方法评估的过程。
表13000与2000样本量下测试集参数估计的误差
参数θ相关系数RMSEMAB2000300020003000a10.70.2980.2970.2590.2590.30.2970.2970.2590.258a20.70.2980.2980.2640.2640.30.2980.2970.2640.263b0.70.1980.1980.1210.1180.30.1900.1900.1140.111
3.2 估计误差结果
被试数量为200,题目数量为100,被试能力的相关系数为0.3、0.7,得到两组,每组15份二分作答矩阵,其在MCMC项目参数估计方法的误差与GRNN神经网络集合的项目参数估计方法的误差如表2所示。GRNN估计方法在两种相关系数下,估计的误差都要比MCMC估计方法要低。在两种估计方法下,MCMC估计方法在低相关组的项目参数估计的误差普遍要比高相关组的小;但是在GRNN估计方法下,对于区分度参数来说,高相关组与低相关组项目参数估计误差基本一致,对于难度参数来说,结果与MCMC方法的结果一致,即低相关组的项目参数估计的误差普遍要比高相关组的小。
主要使用计算机编程模拟的方法进行相关研究。研究问题为基于广义回归神经网络的二维双参数项目反应理论二分补偿性模型下的小样本参数估计方法。首先,运用Python自编程序以及BMIRT(Yao,2013)软件生成一份作答矩阵,对作答矩阵进行PCA降维以及获得作答矩阵的CTT难度作为神经网络的输入,将其划分为训练集与测试集,训练出GRNN集合。然后,再生成一批小样本作答矩阵对MCMC方法以及神经网络方法的优劣进行评估,利用MCMC方法估计项目参数,同样对这批作答矩阵进行PCA降维以及获得作答矩阵的CTT难度作为神经网络的输入,神经网络输出的均值作为项目参数的估计值。最后,通过均方根误差(Root Mean Square Error,RMSE)以及平均绝对偏差(Mean Absolute Bias,MAB),比较两种方法下项目参数的返真性。具体的操作流程如下图所示。
表2各种条件下的项目参数估计的误差
项目参数RMSEMABMCMCGRNNMCMCGRNN0.30.70.30.70.30.70.30.7a10.5040.5250.2870.2860.4210.4430.2480.247a20.5090.5270.2960.2950.4240.4400.2590.258b0.6300.6520.2430.2670.5030.5190.1800.204
4 讨论
4.1 当前方法与MCMC方法的对比
在结果部分中,当使用MCMC估计方法时,无论是低相关组的项目参数估计的误差还是难度参数估计的误差普遍全都要比高相关组的低。Bolt与Lall(2003)在模拟数据研究中使用了MCMC方法对MIRT补偿性模型和MIRT非补偿模型进行参数估计,以此来考察两种模型参数的返真性,在实验的研究变量中设置了考生能力维度之间相关程度(0.0,0.3,0.6)。结果显示,随着考生能力相关程度的变高返真性反而会变低,即参数估计的误差增加。Badcock(2011)在其研究中表明,非补偿性模型取得比较好的参数估计结果的前提之一是潜在特质之间不存在高度相关的条件下。实验结果与前人文献中的研究结果相一致。
顾名思义,学困生主要是指学习成绩较为落后、自律能力较差的学生。通常来讲,学困生在任何班级中都会存在,所以帮助学困生提高学生水平是教师的重要任务之一。要想实现学困生的转化,首先要弄清学困生出现的原因。从当前农村小学数学的教学情况来看,学困生出现的原因主要有两个:第一,一些学生在数学方面的理解能力较差,还有一些学生并没有将注意力放到学习上,这是学生的主观原因;第二,教师采用的教学方法不恰当,这是客观原因。因此,本文也将结合这两个方面的原因,阐述实现学困生转化的具体方式。
此外,在施工阶段,技术人员可以方便快捷地在模型上完成测量、定位等工作,以配合现场施工,提高了工作效率,减轻了劳动强度。
基于Dijkstra算法的电网故障行波定位方法//李泽文,唐平,曾祥君,肖仁平,赵廷//(18):162
4.2 关于估计方法精度的提高
对输入值进行预处理,例如标准化与归一化等,会提高神经网络的估计精度,这有利于对神经网络的学习(汪存友,余嘉元,2006)。例如,GRNN神经网络集合的输入值为[0,1],可以将其标准化到[-3,3],与MIRT的难度参数范围一致。
设计意图:从学生举例出发,对条件、结论及其否定进行自由组合,并从8种简化到4种,对学生来说,这是一个发现、认识的过程,给学生一个自主思维的空间,让他们在思维整合及表现过程中培养观察、发现、归纳、总结的能力,事实证明学生学习积极主动热情高.
另外,也可以调节GRNN神经网络参数STD,可以固定某一批数据作为训练集,该数据不变,每次训练改变的是STD参数,然后寻找到最小的误差所对应的STD参数,当然这有可能会产生过拟合的现象。但对于小样本的参数估计来说无历史性的数据可以使用,神经网络的训练、测试样本是同时产生的,关于STD参数什么时候取到最优值是不可知的,也即,对神经网络的泛化能力是未知的(汪存友,2007)。
4.3 研究的局限性
探索了基于GRNN神经网络集合的二维项目反应理论双参数二分法补偿性模型下的项目参数估计方法,虽然当该方法用于小样本的情况下时,参数估计的误差要比MCMC项目参数估计方法要小,然而并未考察样本量进行一定步长变化时,参数估计的误差会怎样变化。
罗蒂把杜威和维特根斯坦、海德格尔称为现代最伟大的三位哲学家,三者都对于传统的形而上学进行了最严厉的批判,都反对基础主义、确定主义和二元主义的本体论和知识论。海德格尔从基础存在论入手,批判传统的“在场的形而上学”,试图发掘存在者背后的存在之本真意义;维特根斯坦从语用学入手,分析词语在日常语言中的语用学意义,从而消解各种哲学概念的本质意义;而杜威则从自然主义和发生学方法入手,对于传统形而上学体系的二元论和确定性进行了批判和重新阐释。本文试图遵循杜威自身思想的发展,结合当代哲学语境对其形而上学进行分析和评论。
此外,所构建的模型仅适用于实验中所创设情境中,当情境有所改变时,可能会产生不可预测的误差,应当重新构建相关的模型,这也是该神经网络的自身泛化能力所决定的,GRNN是有监督的前馈式的神经网络,在实际应用中可能会造成困难。
清污水分离主要是把厂区内村民生活水及职工澡堂水汇集回收再处理复用,保证污水不外排;减少生产系统内补加清水量。
张培锋先生《学术论文该“查”什么》,讲各类学位论文“查重机制”,利用了计算机所谓“大数据”快速检索功能,如发现某文有大段与已发表的论文完全重复的文字,就被断定为“抄袭”。张先生既承认它针对某些“文抄公”确实有效,同时又指出它也有可能让隐蔽的、变相的抄袭成为“漏网之鱼”。也有可能将合理引用他人材料,脱胎换骨,点铁成金,可贵的真正原创判为“抄袭”。张先生用的就是辩证思维。
并且,使用MCMC方法进行项目参数估计的时,并未进行自编程序,使用时有很多受限之处:使用了BMIRT(Yao,2003)软件进行参数估计时,在建立马尔科夫链的时使用了M-H的抽样方法,这种方法固然简便,但是有可能会造成未知的误差(严娟,2014)。
4.4 进一步研究的问题
参数估计的模型是二维项目反应理论双参数二分法计分补偿性模型,构造神经网络集合的方法,当补偿性模型变为非补偿性模型时,此时难度参数不是一维,而是转变成了多维,神经网络的输入值如何确定是一个需要去研究的问题。该模型仅仅适用于二分法计分双参数以及二维,如果这些条件改变,比如变成三维及以上,此种建模方法是否依然适用值得探讨。二分法计分变为多级计分,双参数变多参数等,这些问题该如何去进行相关实验,值得讨论。
5 结论
(1)在研究所设情境中,估计小样本下的二维项目反应理论双参数二分法计分补偿性模型项目参数,GRNN集成神经网络要优于MCMC方法。
“咬碎了牙齿怎么办?咬碎了牙齿我就吻你的牙床呀。”陈留两只手环过去,裹住裙子,不让风再吹起来,然后把头凑过去,轻轻亲了易非一下,易非一偏头,照着他啐了一口,说:“牙齿还没碎,小心你的舌头!”
(2)在研究所设情境中,增大训练GRNN集成神经网络的样本量会减少GRNN集成神经网络对二维项目反应理论双参数二分法计分补偿性模型项目参数估计的所带来的误差。
(3)在研究所设情境中,在MCMC方法下,低相关组的项目参数估计的误差普遍要比高相关组的小,参数估计的误差不稳定;在GRNN方法下,对于区分度参数来说,低相关组的项目参数估计的误差与高相关组的基本一致,高相关组与低相关组的参数估计的误差较为稳定,对于难度参数来说,低相关组的项目参数估计的误差普遍要比高相关组略小。
其实,书籍真的是治愈伤口的良药,我相信书籍是有灵性的,它能成为你的朋友,你的知己,甚至是你的爱人。只要选对了合适的书籍,你会觉得整个世界都豁然开朗,一切的人间疾苦都似与你无关。放开一切,尽情地徜徉在书海里,你会发现这个世界是那么广阔,那么美好。现在的苦难,都是你成功的基石。笑一笑,没什么大不了,一切都是上天对你的考验。
参考文献
关潮辉,丁树良.(2014).基于IRT模型的BP神经网络参数估计的进一步研究.江西师范大学学报(自然科学版),(4),434-436.
罗照盛.(2012).项目反应理论基础(pp.8-9).北京师范大学出版社.
汪存友,余嘉元.(2006).一种新的基于神经网络的IRT项目参数估计模型.计算机应用,26(4),992-994.
汪存友.(2007).运用ANN估计小样本的IRT参数研究(硕士学位论文).南京师范大学.
王鹏,朱新立,王芳.(2015).多维项目反应理论的计量模型、参数估计及应用.心理学进展,05(6),365-375.
严娟.(2014).MIRT补偿模型与非补偿模型的比较研究及其应用(硕士学位论文).江西师范大学.
余嘉元.(2009).基于神经网络集成的irt参数估计.江南大学学报(自然科学版),8(5),505-508.
Babcock,B.(2011).Estimating a noncompensatory irt model using metropolis within gibbs sampling.AppliedPsychologicalMeasurement,35(4),317-329.
Baker,F.B.(2004).Itemresponsetheory:Parameterestimationtechniques(2nd,pp.8-9,158-169).New York:Marcel Dekker.
Béguin,A.A.,& Glas,C.A.W.(2001).Mcmc estimation and some model-fit analysis of multidimensional irt models.Psychometrika,66(4),541-561.
Bolt,D.M.,& Lall,V.F.(2003).Estimation of compensatory and noncompensatory multidimensional item response models using markov chain monte carlo.AppliedPsychologicalMeasurement,27(6),395-414.
Breiman,L.(1996).Baggingpredictors.Kluwer Academic Publishers.
Chib,S.,& Greenberg,E.(1995).Understanding the metropolis-hastings algorithm.TheAmericanStatistician,49(4),327-335.
Christoffersson,A.(1975).Factor analysis of dichotomized variables.Psychometrika,40(1),5-32.
Jiang,Y.L.(2005).EstimatingparametersformultidimensionalitemresponsetheorymodelsbyMCMCmethods.Unpublished doctoral dissertation,Michigan State University.
Laura,L.B.,Barnes,& Steven,L.W.(1991).The utility of a modified one-parameter irt model with small samples.AppliedMeasurementinEducation,4(2),143-157.
Mcdonald,R.P.(1997).Normal-Ogive Multidimensional Model.HandbookofModernItemResponseTheory.Springer New York.
Mcdonald,R.P.(2000).A basis for multidimensional item response theory.AppliedPsychologicalMeasurement,24(2),99-114.
Metropolis,N.,Rosenbluth,A.W.,Rosenbluth,M.N.,Teller,A.H.,& Teller,E.(1953).Equation of state calculations by fast computing machines.TheJournalofChemicalPhysics,21(6),1087-1092.
Mordelet,F.,& Vert,J.P.(2014).A bagging SVM to learn from positive and unlabeled examples.PatternRecognitionLetters,37,201-209.
Reckase,M.D.(2009).18 multidimensional item response theory.HandbookofStatistics,26(06),607-642.
Specht,D.F.(1991).A general regression neural network.IEEETransNeuralNetw,2(6),568-576.
Thissen,D.,& Wainer,H.(1982).Some standard errors in item response theory.Psychometrika,47(4),397-412.
Yao,L.(2003).BMIRT:Bayesianmultivariateitemresponsetheory[Software].Monterey,CA:Defense Manpower Data Center.
Yao,L.,& Schwarz,R.D.(2006).A multidimensional partial credit model with associated item and test statistics:An application to mixed-format tests.AppliedPsychologicalMeasurement,30(6),469-492.
Yao,L.(2013).Thebmirttoolkit.http://www.bmirt.com/.
CompensatoryMIRTModelParameterEstimation:BasedonGeneralizedRegressionNeuralNetworksEnsemble
Wang Peng1,Meng Weixuan1,Zhu Gancheng1,Zhang Denghao2,3,Zhang Lihui1,Dong Yixuan1,Si Yingdong1
(1.School of Psychology,Shandong Normal University,Jinan 250358;2.The Department of Psychology,Renmin University of China,Beijing 100872;3.The Laboratory of the Department of Psychology,Renmin University of China,Beijing 100872)
Abstract:Estimating compensatory MIRT model item parameters with Generalized Regression Neural Networks Method(GRNN)under the condition of small sample.It is a tentative solution for the problem of conventional parameter estimation methods needing large sample.Multidimensional two-parameter logistic model is set the two-dimension binary model up.Firstly,latent traits parameters,item parameters and response matrices aregenerated examinees’ based on two-dimension model with computer simulation.Then,the load of the first two factors obtained by principal component analysis on each topic is taken as the initial value of the item discrimination parameters and the passing rate as the initial value of the item difficulty parameters.And they are taken as the input of the neural network.Train 100 neural networks,and take the mean of their output as the estimated value of MIRT’s item parameters.Finally,compare the parameter recovery of the GRNN and MCMC estimation methods by 2×2(latent traits correlation level:0.3 and 0.7;estimation methods:GRNN and MCMC)experimental design.The results show that GRNN ensemble method could get better parameter estimate than MCMC method in the case of small sample.
Keywords:Multidimensional Item Response Theory;compensatory MIRT model;Generalized Regression Neural Networks;parameter estimation
*基金项目:中国人民大学中央高校建设世界一流大学(学科)和特色发展引导专项资金支持(Supported by fund for building world-class universities(disciplines)of Renmin University of China),山东师范大学大学生创新创业训练计划项目。
通讯作者:朱干成,E-mail:1683130861@qq.com。
中图分类号:B841.2
文献标识码:A
文章编号:1003-5184(2019)03-0244-06
标签:参数论文; 神经网络论文; 方法论文; 项目论文; 模型论文; 哲学论文; 宗教论文; 心理学论文; 心理学研究方法论文; 《心理学探新》2019年第3期论文; 中国人民大学中央高校建设世界一流大学(学科)和特色发展引导专项资金支持 山东师范大学大学生创新创业训练计划项目论文; 山东师范大学心理学院论文; 中国人民大学心理学系论文; 中国人民大学心理学系实验室论文;