导读:本文包含了计算机化自适应测验论文开题报告文献综述、选题提纲参考文献,主要关键词:自适应,测验,理论,计算机,项目,方法,情绪。
计算机化自适应测验论文文献综述写法
徐玲玲,金如意,张敏强[1](2019)在《情绪调节的计算机化自适应测验》一文中研究指出情绪调节是决定人们幸福、成功的一个重要因素,在人们的日常生活、学习、工作中也起着重要的作用。基于此,学者们开发了测量情绪调节的多个纸笔测验。在实际应用中,有关情绪调节的单一测验难以评估受测者情绪调节的各个方面。研究发现,通过增加项目可实现该目标,同时也会加强受测者的作答负担。因此,本研究旨在开发一种关于情绪调节的计算机化的自适应测验(CAT-ER)。从六个常用的情绪调节量表中选择154道项目形成情绪调节的计算机化自适应测验的初始题库。被试样本为887名大学生。初始题库经过以下步骤检验:单维性检验、项目反应理论模型(IRT models)比较与选择、IRT框架下的项目分析(局部独立性检验,参数估计,项目拟合和项目功能差异)。将满足测量学要求的项目保留形成情绪调节的计算机化的自适应测验的最终题库。为了评估最终版题库的有效性,本研究开展了基于实证数据的模拟研究。结果表明:(1)基于计算机化自适应测验估计出的被试能力与使用完整题库估计的被试能力呈现高度相关;(2)在终止规则设定为标准误(7)(8)SE?0.3的计算机化自适应测验中,平均大约需要11题即可完成对受测者情绪调节的整体评估。因此,本研究所提出的情绪调节的计算机化的自适应测验在不损失测量精度的情况下大大减少了测试项目的数量和测试时间。(本文来源于《第二十二届全国心理学学术会议摘要集》期刊2019-10-19)
张龙飞,刘凯,宋鸽,蔡艳,涂冬波[2](2019)在《CAT-EI的开发:计算机化自适应测验技术在情绪智力智能测评中的应用》一文中研究指出情绪智力是当前心理学的研究热点之一,情绪智力能够解释以下现象:有些在传统意义上智力较低的个体却常常能够取得比其他传统智力较高的个体更高的学业和工作成就。以往研究发现在对于个体成就的预测上,情绪智力能够比传统意义上的智力表现得更好。现阶段对于情绪智力的测量主要通过经典测量理论(CTT)框架下的纸笔测验来实施,纸笔测验的耗时较长,测量误差较大,且CTT作为传统的测量理论具有许多固有的缺点。而本研究建立在新一代的测量学理论——项目反应理论(IRT)框架下,首次尝试采用计算机化自适应测验(CAT)技术实现对情绪智力的智能测评。计算机化自适应测验技术可以根据被试当前作答情况,实时计算并更新其特质水平,并把能提供最大信息量的项目匹配给被试进行作答,以此获得耗时短、精度高的测量效果。本研究首先基于IRT系列分析(含单维性检验、模型拟合检验、局部独立性检验以及项目质量分析),构建了符合IRT测量学要求的情绪智力测评的题库,并以此为基础探讨了计算机化自适应测验技术在情绪智力智能测评(CAT-EI)中的应用。结果表明:(1)CAT-EI相关算法具有较高的参数估计精度,同时具有较理想的测量信度和效度;(2)CAT-EI可以使用较少的题量(Mean=9.88题)达到使用整个题库67题的测量精度,它一方面能做到减轻被试的测试负担,另一方面实现了对情绪智力的高效、快速、准确的智能测评。总而言之,计算机化自适应测验技术可以克服传统纸笔测验的缺陷,通过使用该项技术,本研究能够开发一种新型的、基于计算机的、自适应的情绪智力智能测评。(本文来源于《第二十二届全国心理学学术会议摘要集》期刊2019-10-19)
刘怡婷,蔡艳,涂冬波[3](2019)在《情绪调节的计算机化自适应测验开发:CAT-ER》一文中研究指出计算机自适应测试(Computerized Adaptive Test, CAT)在过去的几十年里不断发展,在此方面,大多数测试均有很大的前景,包括通过计算机准确地管理主题内容测试。为了更严格、更有效地评估情绪调节,本研究开发了情绪调节项目库(题库),并将其作为开发CAT中题目选取的资源基础。首先,本研究对大学生的样本数据(N=915)进行了心理测量学分析,表明情绪调节项目库具有CAT管理所需要的并可接受的心理测量特性,包括足够的单维性、模型拟合、局部独立性、区分度、项目拟合检验和项目功能差异。研究结果也表明,项目库的内容效度较佳,涵盖了情绪调节的10个主要领域,为衡量情绪调节的全局提供了良好的保障。其次,本研究利用模拟数据和真实数据进行了两项CAT模拟研究,验证和评估情绪调节的计算机化自适应测验(the CAT for Emotion Regulation, CAT-ER)。本研究表明计算所得模拟数据结果与实际数据结果情况非常相似,CAT-ER具有可接受的边际信度和同时效度。模拟研究也表明,CAT-ER验证了在测试项目较少并不损失测量精度的前提下,可以缩短被试测试时间和减轻被试测试负担。同时,CAT-ER对情绪调节障碍被试的区分方式也与已开发的问卷相似,表明CAT-ER确实表现出了理论预期的优势。最后,本研究还进一步讨论了CAT-ER的发展前景和局限性,并对其临床应用前景进行了展望。(本文来源于《第二十二届全国心理学学术会议摘要集》期刊2019-10-19)
梁崇理,许慧惠[4](2019)在《计算机自适应测验在人才测评中的实践与效度验证》一文中研究指出基于项目反应理论的计算机自适应测验有诸多优势,已被应用到各个领域,如军队职业测验,GRE考试,K-12教育。在员工评价领域中,Kantrowitz, Craig和Michael (2011)最早提出将CAT技术应用到员工雇用前测试的优势,认为这是一种"更快速,更明智的和更安全的雇用员工前测方法"。北森云计算开发了基于云平台的计算机自适应认知能力测验(Computeradaptivetestforcognitiveability,以下简称CATA),用于评估作答者的言语能力、数学能力、逻辑推理和空间能力。CATA相较于纸笔作答,能以更少题量更快探测到作答者的能力水平,缩短了应聘者的作答时间,提高了评估准确性和作答体验。此外由于测验路径因人而异,有效地降低了漏题风险和雇主对于应聘者作弊的担忧。在设计测验过程中,北森在项目选择、能力估计、终止原则方面采取以下方法:1)项目选择环节采用最大信息量选择法,并兼用曝光控制措施;2)能力估计环节采用贝叶斯期望后验估计;3)终止原则同时采用题目定长策略和变长策略。除了传统的CAT技术策略,北森的优势还在于,将分布式计算用于高速执行作答者能力估计和项目选择。同时可扩展的云服务器能够应对校园招聘情境下短时间内庞大的作答人数带来的系统并发计算压力。针对CATA运行和效度验证,我们选取了两家合作公司作为数据来源。2018年A公司有效作答CATA有19299名应聘者,公司在筛选环节未参考CATA结果。使用SPSS19.0进行t检验,发现在CATA总分和各维度分上录用组(n=1181)均显着大于淘汰组(n=18118)(ps <.05; CATA总分,言语能力,数学能力,逻辑推理的Cohen’d依次为.41,.26,.30,.26)。B公司近3年通过简历筛选且有效作答CATA有29031名应聘者,以是否通过专业笔试作为效标,结果得到在CATA总分和各维度分上通过笔试组(n=7244)均显着大于笔试淘汰组(n=21787)(ps<.05;CATA总分,言语能力,数学能力,逻辑推理的Cohen’d依次为.13,.07,.10,.09)。研究结果均表明CATA得分能够预测应聘者的专业笔试结果以及录用结果,验证了北森CATA效度良好。(本文来源于《第二十二届全国心理学学术会议摘要集》期刊2019-10-19)
刘凯,张龙飞,涂冬波,蔡艳[5](2019)在《基于项目反应理论的计算机化自适应测验在进食障碍疾病检测中的应用》一文中研究指出[背景]进食障碍(EDs)是一组以各种异常饮食行为和态度为特征的精神障碍,是由环境事件与个体生物学和发育特征相互作用而引起的。在EDs的筛查和诊断方面,众多学者们在经典测量理论的框架下开发了大量的进食障碍量表并在临床中得到了广泛的应用。然而,由于采用了经典测量理论,这些量表会存在一些不足,例如使用均值的标准误差使得测量精度不理想等,因此有必要寻找一种新的测量模式来克服经典测量理论的缺点。[目的]:本研究的核心目标是开发一个用于筛查进食障碍的计算机化自适应测验(CAT-ED),以此来提高测量精度,减轻受测者需要作答大量题目的负担。[方法]:一共有1025名大学生(平均年龄为19.7岁,标准差为2.2岁)参与了这项研究并且回答了131道题目,这些题目选自4个被广泛使用的进食障碍筛查量表。研究主要包括两个部分:CAT-ED的题库建设和心理测量学特性分析。第一部分中通过分析题库的单维性、模型拟合度、局部独立性、项目拟合、区分度以及是否存在项目功能差异以确保CAT-ED的科学性和高质量性。第二部分中分别进行了基于模拟被试和真实被试的模拟研究以检验CAT-ED的有效性和合理性,并且分析了其信度、效标关联效度以及敏感性和特异性。[结果]:最终的题库包含77道题目,这些题目满足了计算机自适应测验在单维性、局部独立性、项目拟合性、高区分度和无项目功能差异(DIF)等方面的基本心理测量学要求。在标准误为0.3的情况下,平均每个被试作答题库中的11道题目时,CAT-ED便能够对其进食障碍的严重程度进行较为准确的估计,并且与作答题库所有题目的测验总分保持r=0.942的相关性。此外,CAT-ED效标关联效度也是可接受的。同时,在不同终止规则下所计算的灵敏度和特异度也很好地体现了CAT-ED对于不同进食障碍严重程度的大学生的有效区分。[结论]:CAT-ED可作为一种在心理门诊中用于筛查进食障碍高危人群的有效检测工具,同时也为使用心理量表诊断进食障碍(EDs)提供了一个全新的视角。(本文来源于《第二十二届全国心理学学术会议摘要集》期刊2019-10-19)
孙小坚,王钰彤,张世夷,辛涛[6](2019)在《认知诊断计算机自适应测验中平衡属性收敛的新方法》一文中研究指出提出两种认知诊断计算机自适应测验下平衡属性收敛的新方法(MABI、RTA),模拟研究系统探讨和比较了此二者与已有方法(ABI、IABI和RABI)的表现。结果发现:(1)新方法较不考虑属性收敛的方法有更高的准确率以及更均衡的题目使用率;(2)新方法较ABI和RABI有稍低的准确性,但有更平衡的题目使用率;(3)新方法与IABI的准确性和题目使用率在不同选题策略下各有优势。总之,两种新方法较好地兼顾测量准确性、题目使用率以及题库曝光情况。(本文来源于《心理科学》期刊2019年05期)
田赟[7](2019)在《计算机自适应测验环境下考生能力水平和大五人格对试题作答行为的影响》一文中研究指出科学测评学生学业成就和能力水平对于改进学校教育质量、公平评价学生、促进学生发展具有重要意义。《国家中长期教育改革和发展规划纲要(2010-2020年)》指出:“尊重教育规律和学生身心发展规律,为每个学生提供适合的教育。”要求教育领域变革发展,倡导实施以学生为中心、尊重学生个性差异的教育和测评。教育测评作为教学过程的重要组成部分,其公平性和有效性始终备受关注。而传统考试存在很多不足,难免使考试结果有失公平和有效。而且考试过程中学生的心理和行为差异,传统考试也无法监测到。随着测量理论和计算机技术的发展,计算机自适应测验能够克服传统考试的一些不足,对学生的考试行为也有一定的监测作用。本研究从传统考试的不足及考试公平有效引起人们的思考、考生的作答行为及个体心理差异引起人们的关注、计算机自适应测验能更有效测量考生的能力水平叁方面背景,综合了文献研究法、问卷调查法、测验法和数学模型法等研究方法,在项目反应理论和网页开发技术指导下,构建计算机自适应测验环境,对测验样本进行了研究,以探测考生的能力水平和人格特质对考试作答行为的影响。鉴于此,本研究工作主要有以下几点:(1)理论基础方面的研究。主要是在阅读和分析相关文献,即对项目反应理论及以此为理论基础的计算机自适应测验的相关技术、大五人格理论及其发展脉络、以及两大理论的相关文献进行分析和梳理的基础上,厘清计算机自适应测验的原理和大五人格特质理论的维度框架。(2)根据项目反应理论构建计算机自适应测验环境并组织实施测验,收集考生的作答信息,包括能力估值、作答结果和作答时间;采用信、效度较好的现有大五人格量表,对测验对象施测,获取考生的大五人格特质信息。(3)对测验收集的考生作答信息和人格特质信息进行数据处理,尝试分析它们之间的影响关系,并就考生的能力水平和大五人格对试题作答行为的影响关系建立Logistic回归模型,并提出对策和建议,为后续的相关研究和教师的教学实践提供参考和帮助。本研究测验结果显示:考生的能力水平对作答行为有显着影响;考生的大五人格对作答行为有显着影响;考生的能力水平和大五人格对试题作答行为有交互影响。本研究结论对教育测量与评价具有一定的理论意义和实践价值。理论意义:(1)本研究拓展了大五人格在教育领域尤其是教育测量与评价领域的应用,在一定程度上丰富了大五人格理论。(2)本研究在计算机自适应测验环境下实施的测验,能更有效测量考生的能力水平,能更真实展现考生的大五人格特质,并利用作答时间判别考生的作答行为,进而探讨了能力水平和大五人格对作答行为的影响,为研究考试作答行为提供了一种新的切入和思路。实践价值:(1)本研究开发的计算机自适应测验系统,能够提供给考生一种既有挑战又能最佳激励的测验环境,使考生能够最大限度地表现出真实能力水平;同时,在这种“轻松而充实”的评估环境中实施测验,考生的大五人格能得到充分而真实展现,这对测量结果的客观真实性至关重要。因此,结合计算机自适应测验形式,对考试作答行为及其影响因素进行探讨,为后继相关研究提供了方法和技术参考。(2)本研究所探讨的能力水平和大五人格对试题作答行为的影响机制,将这种影响机制应用到教育教学中,对于教师在教学实践中通过作答行为反推考生的人格,进而针对不同人格特质和能力水平的考生,采取不同措施、进行不同干预,具有一定的实践价值。(本文来源于《山东师范大学》期刊2019-06-09)
李佳,丁树良[8](2019)在《计算机化自适应测验中能力估计新方法》一文中研究指出能力估计的极大似然估计方法(MLE)不能处理全0或全1的被试反应模式,若事先设置好能力估计的上下界,则会导致能力估计的有效范围缩小的后果;而贝叶斯估计方法需要选择先验分布,先验分布的选择必须很慎重.在原有似然函数的基础上,构建2个新的项目,提出了改进的MLE方法(NMLE).NMLE既不需要能力先验分布,也不会缩小能力估计范围,而且可以处理各种反应模式.蒙特卡洛实验结果表明新方法表现良好.(本文来源于《江西师范大学学报(自然科学版)》期刊2019年02期)
毛秀珍,王娅婷,杨睿[9](2019)在《多维计算机化自适应测验中项目曝光控制选题策略的比较》一文中研究指出在MCAT中考查四种项目选择指标在有无曝光控制条件下的选题表现。项目选择指标分别是:(1)贝叶斯的D优化方法(D-optimality)、后验期望Kullback-Leibler方法(KLP)、基于等权重复合分数的最小误差方差方法(the minimized error variance of the linear combination scorewith equal weight,V1)和基于最优权重复合分数的最小误差方差方法(the minimized error variance ofthe composite score with optimized weight,V2)。将针对认知诊断CAT项目曝光控制的的限制阈值方法(Restrictive Threshold,RT)和限制进度(Restrictive Progressive,RPG)方法、单维CAT中的最大优先指标方法(Maximum Priority Index,MPI)推广到MCAT。模拟研究表明:(1) KLP,D-优化和V1对领域分数估计准确,能力返真性比V2更好。(2)尽管V1和V2方法相比KLP和D-优化方法提高了题库利用率,但这四种选题指标都产生不均匀的项目曝光率分布。(2)叁种曝光控制策略都极大地提高项目曝光均匀性,且不明显降低测量精度。(3) MPI与RPG方法在曝光控制方面表现类似,且比RT的方法表现更好。(本文来源于《心理学探新》期刊2019年01期)
谢宇欣,戴步云[10](2018)在《CAT-SRS的开发——大学生社会责任感的计算机自适应测验》一文中研究指出在文献回顾的基础之上,根据项目反应理论和社会责任感的相关理论结合五个国内外社会责任感量表,根据IRT分析选择高质量的题目构建大学生社会责任感的计算机自适应测验(Computerized adaptive testing-Social Responsible Scale, CAT-SRS),并分析其可行性和有效性。首先使用单维性IRT模型进行数据分析构建题库。IRT分析包括:对测验进行探索性因素分析,直至满足单维性的假设前提;删除Q3统计量大于0.36的题目,使测验满足局部独立性检验;根据AIC、BIC、-2LL估计结果,选择等级反应模型进行进一步的测验项目分析;删除IRT区分度小于0.8和项目拟合S-χ~2小于0.01的题目;同时证实各题在性别水平上均不存在项目功能差异。至此,最终符合IRT测量要求的80题的社会责任感题库构建完成。接下来基于纸笔测验的数据进行CAT模拟,最开始先将每个被试的特质水平初始值设定为0,然后采用随机选题方式,随机抽取一题作为初始题。并采用最大Fisher信息法,选择对当前被试特质水平下能够提供最大信息量的题目作为下一题;采用叁种不同的终止策略方法进行比较:定长度、定精度和"精度为主,定长为辅"。当被试作答的标准误达到一定精度或作答题达到一定长度时,即终止作答;最后根据被试在各题上的得分,估计出被试的特质水平(θ)。最后对CAT-SRS的有效性进行验证,考虑到极端人格人群需要作答所有题目方能终止测验的情况,本研究最终采用"精度为主,定长为辅"的终止规则:在CAT过程中,当满足SE<0.3或测验长度达到20题时即终止测验。结果表明:可以在80个项目中提取大部分信息,CAT-SRS的平均作答项目数减少到了12.21题,题量节省比例达到了84.73%,这说明CAT-SRS可以大大减少被试的作答负担,提高被试的作答效率;模拟结果还表明,在纸笔测验总分与CAT-SRS估计的结果之间存在高相关(r=0.961),边际信度也达到了0.90,这说明CAT-SRS具有较高的测量效度。由此凸显了将CAT应用于社会责任感测量中的优势:在相近的测验准确度下,CAT-SRS能够大大缩短测验所需的长度,节省施测时间,对实现高效准确的大学生社会责任感测量具有现实意义。(本文来源于《第二十一届全国心理学学术会议摘要集》期刊2018-11-02)
计算机化自适应测验论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
情绪智力是当前心理学的研究热点之一,情绪智力能够解释以下现象:有些在传统意义上智力较低的个体却常常能够取得比其他传统智力较高的个体更高的学业和工作成就。以往研究发现在对于个体成就的预测上,情绪智力能够比传统意义上的智力表现得更好。现阶段对于情绪智力的测量主要通过经典测量理论(CTT)框架下的纸笔测验来实施,纸笔测验的耗时较长,测量误差较大,且CTT作为传统的测量理论具有许多固有的缺点。而本研究建立在新一代的测量学理论——项目反应理论(IRT)框架下,首次尝试采用计算机化自适应测验(CAT)技术实现对情绪智力的智能测评。计算机化自适应测验技术可以根据被试当前作答情况,实时计算并更新其特质水平,并把能提供最大信息量的项目匹配给被试进行作答,以此获得耗时短、精度高的测量效果。本研究首先基于IRT系列分析(含单维性检验、模型拟合检验、局部独立性检验以及项目质量分析),构建了符合IRT测量学要求的情绪智力测评的题库,并以此为基础探讨了计算机化自适应测验技术在情绪智力智能测评(CAT-EI)中的应用。结果表明:(1)CAT-EI相关算法具有较高的参数估计精度,同时具有较理想的测量信度和效度;(2)CAT-EI可以使用较少的题量(Mean=9.88题)达到使用整个题库67题的测量精度,它一方面能做到减轻被试的测试负担,另一方面实现了对情绪智力的高效、快速、准确的智能测评。总而言之,计算机化自适应测验技术可以克服传统纸笔测验的缺陷,通过使用该项技术,本研究能够开发一种新型的、基于计算机的、自适应的情绪智力智能测评。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
计算机化自适应测验论文参考文献
[1].徐玲玲,金如意,张敏强.情绪调节的计算机化自适应测验[C].第二十二届全国心理学学术会议摘要集.2019
[2].张龙飞,刘凯,宋鸽,蔡艳,涂冬波.CAT-EI的开发:计算机化自适应测验技术在情绪智力智能测评中的应用[C].第二十二届全国心理学学术会议摘要集.2019
[3].刘怡婷,蔡艳,涂冬波.情绪调节的计算机化自适应测验开发:CAT-ER[C].第二十二届全国心理学学术会议摘要集.2019
[4].梁崇理,许慧惠.计算机自适应测验在人才测评中的实践与效度验证[C].第二十二届全国心理学学术会议摘要集.2019
[5].刘凯,张龙飞,涂冬波,蔡艳.基于项目反应理论的计算机化自适应测验在进食障碍疾病检测中的应用[C].第二十二届全国心理学学术会议摘要集.2019
[6].孙小坚,王钰彤,张世夷,辛涛.认知诊断计算机自适应测验中平衡属性收敛的新方法[J].心理科学.2019
[7].田赟.计算机自适应测验环境下考生能力水平和大五人格对试题作答行为的影响[D].山东师范大学.2019
[8].李佳,丁树良.计算机化自适应测验中能力估计新方法[J].江西师范大学学报(自然科学版).2019
[9].毛秀珍,王娅婷,杨睿.多维计算机化自适应测验中项目曝光控制选题策略的比较[J].心理学探新.2019
[10].谢宇欣,戴步云.CAT-SRS的开发——大学生社会责任感的计算机自适应测验[C].第二十一届全国心理学学术会议摘要集.2018