对齐(Alignment) —— 一种新的多群组分析法
温聪聪1伍伟平1林光杰2
(1厦门大学海外教育学院/国际学院, 厦门 361102) (2厦门大学新闻传播学院, 厦门 361005)
摘 要 进行跨群组的因素均值比较需要检验测量工具的可比较性, 常见的做法是使用多群组CFA检验各群组的截距恒定性, 但截距恒定假设因其过于苛刻而往往无法满足。对齐法在这一背景下应运而生, 通过检验构置恒定模型中参数的近似恒定性而进行跨群组因素均值比较。文章介绍了多群组CFA和对齐法的原理, 运用某省4个学校的本科生职业价值观研究实例来演示如何在Mplus软件中使用对齐法进行研究, 并总结了对齐法的优势与局限, 回顾了对齐法近年的研究进展。
关键词多群组分析; 多群组CFA; 测量恒定性; 对齐法; 蒙特卡洛模拟研究
1 研究背景
在传统的实证研究中, 因素分析可以将众多观测变量降维, 提取出少量的因素来解释观测变量, 让研究者对题项的分类有更清楚的认识, 也可以运用更简洁的因素得分进行进一步研究。后来, 当研究者们希望使用同一测量工具进行跨群体比较时, 发现因素分析降维所得到的维度对组成总样本的不同子样本来说含义可能有所不同, 将因素均值和因素得分直接进行比较可能存在问题。所以, 检验维度的可比较性(comparability)成为越来越受关注的问题。一些跨国研究探究了测量工具的跨群体间的可比较性, 获得了许多有价值的发现。Billiet对欧洲各国男女性的宗教信仰进行了研究, 发现相比其他欧洲国家的女性, 土耳其女性是唯一回答参与宗教服务的频率比男性低的群组, 有些研究者可能会下“土耳其是欧洲唯一的男性比女性更信教的国家”的结论。但当及时了解到在土耳其这样的伊斯兰国家, 即使女性信教, 一般也不允许女性参与宗教服务, 作者判断这一题项对土耳其回答者的含义要不同于其他欧洲国家的回答者, 题项仅在其他欧洲国家间具备可比较性。正是发现了特殊的国情差异, 作者没有因为这一题项的异常而低估土耳其女性的信教程度(Billiet, 2013)。Piurko等人研究了东欧和西欧国家公民的“左”和“右”的政治态度, 发现对“左”和“右”的理解可能在欧洲的自由主义国家(如瑞典)、传统主义国家(如希腊)、后共产主义国家(如捷克)间是不一样的(Piurko et al., 2011), 所以根据“左”和“右”的政治倾向把国家归类, 比较不同国家公民之间的回答可能并不合理。总之, 检验所研究维度在不同群体之间的可比较性十分重要。如果不具备可比较性, 因素分析所得出的因素得分或是因素均值就不能直接进行跨群组比较。
目前, 比较常用的一种检验维度可比较性的方法是多群组验证性因素分析(多群组CFA, multiple-group confirmatory factor analysis)。研究者可以运用多群组CFA检验所得模型的测量恒定性(measurement invariance, Davidov et al., 2014; Millsap, 2011)来得出量表维度是否具备跨群体可比较性的结论。检验测量恒定性包括检验构置恒定(configural invariance或pattern invariance)、因素载荷恒定(metric invariance或weak measurement invariance)、截距恒定(scalar invariance或strong measurement invariance)、残差恒定(uniqueness invariance或strict measurement invariance)、因素方差−协方差恒定(factor variance-covariance invariance)、因素均值恒定(factor mean invariance)等。构置恒定1表示对于不同的群组, 量表所包含的因素数目和各因素设为定值和设为自由估计的因素载荷是相同的(Marsh et al., 2017; Millsap, 2011; Vandenberg & Lance, 2000; Wang & Wang, 2012; Widaman & Reise, 1997), 检验该假设需要设定模型中不同群组有相同的因素数目, 相同估计模式的因素载荷; 因素载荷恒定表示对于不同的群组, 因素上每一单位的变化使观测变量产生的变化是相同的, 检验该假设需要在设定相同因素数目和因素载荷估计模式的基础上进一步设定模型中不同群组有相等的因素载荷; 截距恒定表示对于不同的群组, 观测变量的初始参照值是相同的, 检验该假设需要在设定相同因素结构、相同的因素载荷的基础上进一步设定模型中不同群组有相等的截距; 残差恒定等以此类推。由于这些依次限定参数恒定的模型具有嵌套关系, 所以检验这些测量恒定性假设需要计算所研究模型两两间的卡方变化值和自由度变化值, 进而计算出显著性, 得出是否拒绝原假设。通常情况下, 只要不同群组的构置、因素载荷和截距都满足测量恒定, 就说明不同群组对研究维度的理解相同, 进而可以对不同群组的因素均值进行直接比较, 探究不同群组在所得维度上的表现差异。
(1)空间分布上,新疆地区多年平均降水量126.8mm,北疆地区多年平均降水量246.2mm,南疆地区多年平均降水量41.5mm,北疆>全疆>南疆。
大多数的实证研究都希望通过多群组CFA探究不同群组在潜在因素上的表现差异, 也就是进行因素均值比较。但多群组CFA最大的不足是依赖严苛的截距恒定假设才能进行群组间因素均值比较, 而截距恒定假设在许多情况下无法满足。在这些情况下, 多数研究者会试图借助于修正指数(modification index)释放一些参数限定来改善模型拟合, 可能会得到部分截距恒定模型, 继续进行均值比较。但Asparouhov和Muthén在2014年指出, 通过修正指数进行模型修正需要人工手动选择, 存在主观性。另外, 通过修正指数进行模型修正可能导致得出并不正确的部分恒定模型, 因为截距恒定模型本来就和真实模型相差甚远(Asparouhov & Muthén, 2014)。Marsh等人也在2017年指出, 虽然通过修正指数释放参数可以得到模型拟合度较好的部分截距恒定模型, 但这样做并不能保证得到没有偏差的因素均值(Marsh et al., 2017)。因此, 当截距恒定被拒绝时, 如何继续进行组间比较一直以来都是难题。
3.2 甲状旁腺的保护 甲状旁腺功能低下会导致低钙,造成手足搐搦等临床表现,是甲状腺癌术后常见并发症。有0~13%的甲状腺癌患者术后出现永久性低钙血症[9]。特别是在甲状腺全切除,或者合并Ⅵ区淋巴结清扫时,并发甲状旁腺损伤的机会大大增加,严重影响手术治疗效果和患者生活质量。因此在切除病灶清扫淋巴结的同时还要保护好甲状旁腺的功能。
Asparouhov和Muthén在2014年提出了一种“对齐” (Alignment)方法, 并不依赖截距恒定, 只需要模型中的大多数参数满足近似恒定就可以进行因素均值比较(Asparouhov & Muthén, 2014)。对齐方法相比传统方法拥有众多优势, 但可能由于对传统方法的依赖、新方法理解有一定难度、新方法只能在Mplus软件上实现等原因, 对齐法目前只在少数国外实证研究中被使用。本文希望对新方法的原理和优势进行介绍, 并运用我国某省4个学校的本科生职业价值观研究实例来演示如何使用对齐法进行实证研究。
2 对齐方法的原理
从最一般的线性回归模型入手, 其一般形式如下式所示:
y=a+bx+ε(1)
其中y为因变量, 也可称为结果变量, 对应坐标轴y轴上的数值。x为自变量, 也可称为预测变量, 用来解释因变量, 对应坐标轴x轴上的数值。a为截距, 是直线与y轴的交点的数值, 此时x = 0, 截距值是y的初始参考值。b为斜率, 也就是回归系数, 直接反映了自变量x每变化一个单位因变量y所改变的值。ε为残差, 代表观测值与预测值的偏离, 服从正态分布。线性回归描述了自变量和因变量间最一般的线性关系。
对齐法作为一种新方法, 在实证研究中的使用并不多。笔者根据研究经验, 针对在Mplus软件2中使用对齐法分析数据的步骤进行了一个总结。总得来说, 使用对齐法可以遵循以下四个步骤:
同时, 笔者也提出一些使用对齐法分析的注意事项:当群组数较多, 模型较为复杂时, 准确的对齐法参数估计要求有较大的样本量(Asparouhov & Muthén, 2014)。当模型中不恒定的参数比率达到25%时, 需要进一步使用模拟研究检验对齐法的有效性(Asparouhov & Muthén, 2014)。如果需要进行模拟研究, 则需要注意在Mplus中使用svalues指令保存对齐法计算出的参数估计结果, 作为模拟研究的真实值。如果模型中的大多数参数不恒定性非常强, 无法满足近似恒定, 对齐法也不会有较好的分析效果。
(2)对于任意一对群组g1、g2, 截距和因素载荷的差异通过成分衰减函数(component loss function) ƒ的缩放被纳入进总衰减函数F进行计算。在Mplus中使用对齐法分析时所使用的成分衰减函数ƒ如下式所示:
仪表(图3)通过CAN网络通信,将其他控制单元传来的信息通过多功能显示屏显示相应的指示灯和提示或警告信息,在必要时还会通过扬声器提醒驾驶员。
4)根据研究需要进行蒙特卡洛模拟研究。此时进行模拟研究的目的可以是为了选择适当的优化算法, 可以是检验对齐法估计各个参数的有效性, 也可以是检验参数近似恒定性等。
需求情况:农业需求方面,秋季二铵市场缓慢推进,下游询价明显增多,但实际成交有限。出口方面,东南亚需求进入下半场,采购放缓,印度市场采购节奏放缓,但受汇率影响,价格持续保持平稳,企业出口商谈价坚挺在420美元/吨FOB。
在多群组CFA构置恒定模型设定下, 因素均值和因素方差被设为定值, 无法被自由估计, 个案间的因素得分比较和群组间的因素均值比较都无法进行。只有分别限制了因素载荷恒定和截距恒定, 因素方差和因素均值才能被自由估计。与基于截距恒定模型进行组间因素均值比较的多群组CFA不同, 对齐法进行组间因素均值比较是基于构置恒定模型。
假设构置恒定模型为M0, 将其截距和因素载荷分别记为vpg0和λpg0。M0要求将因素转化为均值为0, 方差为1, 各群组需要做如下变换:
如果多群组CFA测量恒定性检验满足了截距恒定, 就可以判定所得出的因素分析模型适用于所有群组, 维度具备可比较性, 可以直接对各群组的因素均值进行比较。但截距恒定假设所有群组的因素载荷和截距完全相等的条件过于苛刻, 在实际研究中很难得到满足, 尤其是当模型较为复杂, 群组数较多的时候。如果多群组CFA测量恒定性检验不满足截距恒定, 那么如上文所述, 研究者即使依靠部分截距恒定模型也很难得到正确的模型, 组间因素均值比较变得无从下手。
ηg0= (ηg−αg) /(3)
同时, 为了让所有变量拥有相同的单位(metric), 方便不同观测变量进行比较, 对齐法也要求标准化所有观测变量。
观测变量的方差和均值如下式所示:
V(ypg) =λ2pgψg=λ2pg,0(4)
E(ypg) = vpg+λpgαg=vpg,0(5)
因此通过公式变换可以得到 :
λpg,0=λpg(6)
vpg,0=vpg+(7)
对于任意群组的αg和ψg, 总有对应的截距vpg和因素载荷λpg, 使得所得模型和M0具有相同的似然值, 并且由下式所得到:
λpg,1=(8)
vpg,1=vpg,0-αg(9)
通过赋予每个组别不同的因素均值αg和因素方差ψg, 利用待分析模型和最初构置恒定模型有相同模型拟合度的关系计算出对应的因素载荷λ和截距v, 如此不断重复、迭代, 直到以下总衰减函数(total loss function) F被最小化, 模型的参数不恒定性也被最小化, 此时就找到了最优测量恒定模型。
(10)其中y为观测变量, 属于因变量; v为截距, 与一般线性回归类似, 代表观测变量初始参照值(蔡华俭, 林永佳, 伍秋萍, 严乐, 黄玄凤, 2008); λ为因素载荷, 相当于一般线性回归中的斜率, 代表因素η每变化一个单位在相应观测变量上的变动值;η为因素, 也就是问卷量表中各观测变量所包含的维度, 相当于一般线性回归中的自变量x; 残差仍然为ε。这些参数可以属于不同的群组、因素、观测变量、不同群组中的个案, 所以有了下标。其中p = 1, 2…, p,为观测变量序数;m = 1, 2…, m, 为因素序数; g = 1, 2…, g,为群组序数;i = 1, 2…, i,为群组g中的独立个案序数。假设εipg均值为0, 方差为θpg, 服从正态分布; 假设ηig均值为αg,方差为ψg,服从正态分布。
阿姨如果没有长期的规划和考虑,就很难踏实、认真地进行学习和自我完善,引导阿姨做好职业设计和规划可以从以下几个方面着手。
在步骤3中,如果标签符合标签选择条件,并且标签状态标志为初始态或与清点状态标志相同,则标签被选中。在步骤4中,将被成功清点的标签状态标志改变为第一中间态和第二中间态中与清点状态标志不同的中间态。
(11)
此处ε为一个很小的正值, 保证了ƒ具有一阶连续导数。利用ƒ的一阶连续导数, 总衰减函数F的优化过程(optimization process)变得更容易, 方便了总衰减函数F的计算。成分衰减函数ƒ约等于。总丢失函数F取得最小值解将是当模型中有少数较大的不恒定参数和大部分近似恒定的参数的时候。此时, 大部分参数近似恒定, 不同群组相应参数的差异x接近为0, ƒ(x)=, 取得最小值; 对于少数较大的不恒定参数, 需要考虑两种情况:当x<1时, ƒ(x)>x, 参数不恒定性被放大, 较大的不恒定参数比较小的不恒定参数放大模型不恒定性的程度更小; 当x>1时, ƒ(x)<x, 参数不恒定性得到衰减, 较大的不恒定参数比较小的不恒定参数使模型不恒定性衰减的程度更大。所以, 根据ƒ的特点, x接近零本身取得最小值。如果必须有少量的x不接近零, 那么x应当尽量大。因为x越大, 函数衰减的越多, 模型的不恒定性衰减的越多。这和EFA中的旋转函数保留较大和较小载荷, 排除中等载荷的特点类似。
在公式(10)中, 总衰减函数F中的Wg1,g2是用来反映群组大小和特定群组参数估计的确定性。较大的群组比较小的群组对总丢失函数的贡献更大。具体计算如下式所示:
Wg1,g2=(12)
其中Ng1和Ng2为任意一对群组g1、g2的样本量。
当总衰减函数F被最小化后, 由于有一个群组被设为了方差为1的参照组(在Mplus中为第一组), 所以可以得到除了参照群组外的所有因素均值和因素方差和参照群组中的因素均值, 共计2g−1个参数。为了计算参照群组中的因素方差相对值, 需要利用以下参数限定, 令ψ1 = (ψ2´…´ψg)-1:
邓瑞平(1963-),男,四川蓬安人,西南大学法学院教授、博士生导师,法学博士,西南大学-西南政法大学金砖国家法律研究院负责人,研究方向:国际经济法、海商法、国际商事仲裁法;
ψ1´ψ2´…´ψg = 1 (13)
在这里, 对齐法又可以分为固定优化和自由优化两种算法, 其区别是固定优化假设参照群组的均值α1为0, 自由优化则将α1自由估计。Asparouhov和Muthén所做的模拟研究显示, 当群组数目为2或是模型中没有不恒定参数时, 固定优化算法要优于自由优化算法; 在群组数目大于2并且模型不恒定时, 自由优化算法要优于固定优化算法(Asparouhov & Muthén, 2014)。
3 案例应用
制定心电图危急值制度提高了急危重症患者的急救成功率和生存率,适用于院内及互联网医院实时心电诊断模式。对于医院回顾性分析的24 h动态心电图,或是家庭记录的非实时传输、非实时诊断的动态心电图,如果发现有可能引发严重后果的一过性心肌缺血、严重传导阻滞、停搏或短阵室速等,建议进行重大阳性值提示,提醒非心血管内科、全科或体检中心的医生关注患者潜在的临床风险。
1)首先要运行EFA, 检验分析出的量表结构是否和设计时的结构相同, 如果不同, 则证明量表设计有问题。
2)其次进行多群组CFA分析, 检验各群组间的测量恒定性。如果模型满足截距恒定, 则该模型是较为简洁的模型, 已经可以进行群组间因素均值比较, 没有必要再使用对齐法; 如果模型拒绝截距恒定, 则可以考虑使用对齐法。
3)如果需要使用对齐法, 则根据所研究数据的实际情况选择固定优化算法或是自由优化算法进行分析。
前文所提到的构置恒定模型就是要限制各群组η的数目和对应的设为定值和设为自由估计的λ相同, 因素载荷恒定就是要在构置恒定前提下继续限制各群组因素载荷λ相同, 截距恒定就是要在构置恒定和因素载荷恒定前提下继续限制各群组截距v相同。
我国环境建设的基本思想是充分发挥社会主义制度的优越性,坚持从我国的基本国情出发,遵循自然规律, 用先进的科学技术来达到治理环境,实现经济效益与生态消息同时发展的目标。改善环境,提高人民的生活质量,从而实现可持续发展已经成为当前的主要目标。在当前严峻的环保形势下,相关部门应该推行可持续发展的策略,在可持续发展的前提下进行环境的保护,促进我国资源的可持续发展。相关的工作部门也应该建立保护环境的相关法律法规,从实际出发,根据不同的情况进行相应的治理措施,加强对天然林以及相关资源的保护措施,大力开展植树造林,改善生产条件,加强综合治理的力度,达到保护环境和资源可持续的目标。
如果把一般线性回归模型推广至因素分析, 那么假设多群组CFA模型为下式:
接下来, 将运用某省4个学校的本科生职业价值观研究实例3来演示当多群组CFA模型不满足截距恒定假设时, 应当如何使用对齐法检验模型参数的近似恒定性, 进而进行因素均值比较。参与本次调研的4个学校的本科生总样本共计4692名学生, 其中A学校2729名, B学校615名, C学校455名, D学校893名。4个学校各自的样本量较多, 可以满足对齐法分析的大样本量要求。研究共分为4个步骤, 供读者参考。
3.1 EFA分析
本研究使用的职业价值观量表是印第安纳大学问卷(Assessing Multinational Interest in STEM)的简化修改版(Maltese et al., 2014), 如表1所示。量表预设为个人兴趣、社会责任和经济动机三个维度, 使用4点量表(1.不重要、2.不太重要、3.比较重要、4.重要)的形式进行测量, 设问为“考虑到您自己的未来发展, 您认为下列因素的重要程度如何”。
表1 问卷中职业价值观量表的维度设计
维度设计题号题项内容 社会责任Q1有助于可持续发展和环境保护 Q5帮助他人 Q9做对社会发展有重要意义的事情 个人兴趣Q2自我发展 Q3做我感兴趣的事情 Q4获得一份有保障的工作 Q6发挥我的天赋和能力 经济动机Q7获得高薪的机会 Q8尽快开始赚钱
使用Mplus软件运行EFA后, 所得的表2所示的旋转后因素载荷矩阵结构和问卷的维度设计完全一致, 量表设计得到了数据样本的支撑。
服务区域内的每一个信息系统作为一个单独的安全域,安全域内可以互相访问,安全域之间默认无法互访;同一服务区域内的不同应用之间如果有互访需要,则可以通过安全域防火墙授权访问。
表2 旋转后的因素载荷(N = 4692)
题项F1F2F3 1. 有助于可持续发展和环境保护0.767 2. 自我发展0.742 3. 做我感兴趣的事情0.833 4. 获得一份有保障的工作0.625 5. 帮助他人0.828 6. 发挥我的天赋和能力0.689 7. 获得高薪的机会0.671 8. 尽快开始赚钱0.705 9. 做对社会发展有重要意义的事情0.717
注:*黑体数值在5%的置信区间上显著
3.2 多群组CFA分析
分别限制模型构置恒定、因素载荷恒定、截距恒定, 使用Mplus软件运行多群组CFA测量恒定性检验, 得到表3所示的模型拟合结果。构置恒定模型的卡方值最低, 表明拟合度最好。经过嵌套模型计算后, 卡方变化值与自由度变化值对应的p值在5%的置信区间上拒绝截距恒定和因素载荷恒定模型,构置恒定模型是最优模型。由于截距恒定模型被拒绝, 因此可以继续使用对齐法检验近似测量恒定性, 进而尝试进行因素均值比较。
表3 使用多群组CFA进行测量恒定性检验得到的模型拟合结果(N = 4692)
模型参数数目卡方值自由度p值 构置恒定1201028.00996<0.001 因素载荷恒定1021058.646114<0.001 截距恒定841120.288132<0.001 载荷恒定对构置恒定–30.638180.0317 截距恒定对构置恒定–92.27936<0.001 截距恒定对载荷恒定–61.61418<0.001
3.3 对齐法分析
分别使用固定优化算法和自由优化算法在Mplus软件中执行对齐法分析, 得到以下参数近似恒定结果和因素均值估计结果。(后文通过模拟研究证明固定优化算法得出的结果较为可靠, 此处仅展示部分固定优化算法得到的参数估计结果)从表4所示的参数近似恒定结果来看, 所有截距和因素载荷都近似恒定, 对齐法得到了理想的结果, 群组间因素均值比较切实可行。而在上一步使用多群组CFA时, 因素载荷恒定模型和截距恒定模型都被拒绝, 因素均值比较无法进行。从这一方面来看, 对齐法克服了群组间因素载荷和截距完全恒定的苛刻假设, 通过检验因素载荷和截距参数的近似恒定性使不同群组因素均值间的直接比较成为可能, 这是其相较多群组CFA的一大优势。从表5所示的个人兴趣因素均值比较来看, 群组4显著高于群组1,2,3; 从表6所示的经济因素均值比较来看, 群组2和群组3显著高于群组1,4。考虑到4所院校层次的排序为4>1>2≈3, 对齐法的研究结果与之前全国样本“985院校学生相比211院校和普通本科院校学生更注重个人兴趣; 普通本科院校学生相比985院校学生和211院校学生更注重经济因素”的研究结论相一致(温聪聪, 伍伟平, 蒋玉塔, 2016)。
表4 参数近似恒定结果(N = 4692)
参数类型近似恒定组别参数类型近似恒定组别 截距因素载荷 Y11,2,3,4Y11,2,3,4 Y21,2,3,4Y21,2,3,4 Y31,2,3,4Y31,2,3,4 Y41,2,3,4Y41,2,3,4 Y51,2,3,4Y51,2,3,4 Y61,2,3,4Y61,2,3,4 Y71,2,3,4Y71,2,3,4 Y81,2,3,4Y81,2,3,4 Y91,2,3,4Y91,2,3,4
表5 个人兴趣因素的均值比较结果(N = 4692)
排名群组号因素均值因素均值显著小于该组 140.1622,3,1 220.038 330.028 410.000
表6 经济因素的均值比较结果(N = 4692)
排名群组号因素均值因素均值显著小于该组 120.1631,4 230.1271,4 310.000 44-0.014
3.4 蒙特卡洛模拟研究
在第三步对齐法分析中并不清楚应该使用固定优化算法还是自由优化算法比较好, 所以在这一步中, 应当分别利用两种优化算法得到的参数估计结果进行蒙特卡洛模拟研究, 探究使用特定算法的对齐法能否较好分析参数间的恒定与不恒定性, 能否无偏估计各个参数。本研究中检验使用不同算法的对齐法是否无偏估计各个参数的标准有两个, 一是相应算法的因素均值真实值和估计值的比较, 体现因素均值出现了多少数值的偏差。二是相应算法因素均值的均方误差, 通过将该因素均值的方差和因素均值的期望偏差的平方加和得到, 体现参数估计的效果。均方误差越小越好, 且当等于所估计参数的方差的时候说明是无偏估计。模拟研究的条件基本模仿真实情况, 选择4个群组, 与真实数据相同的群组样本量(2729、615、455、893), 生成数据组数为500。使用第三步固定优化算法得到的参数估计结果进行固定优化对齐分析, 使用自由优化算法得到的参数估计结果进行自由优化对齐分析, 得到以下因素均值估计结果和因素均方误差计算结果。从表7所示的因素均值估计结果来看, 使用固定优化算法的对齐法能较好估计各群组的因素均值; 但使用自由优化算法的对齐法因素均值估计出现了较大偏差, 尤其是在经济因素, 偏差超过了1.3。从表8所示的因素均方误差计算结果来看, 两种算法在因素方差上的均方误差完全相同, 但自由优化算法在各因素均值上的均方误差都要大于固定优化算法。尤其是在经济因素, 自由优化算法估计因素均值的均方误差均值达到1.527, 而固定优化算法的这一数值仅为0.041。综上所述, 在本部分模拟研究所设定的研究条件下, 使用固定优化算法的对齐法可以几乎无偏估计因素均值, 均方误差较小, 效果明显优于使用自由优化算法的对齐法。回想第三步中所有因素载荷和截距都近似恒定, 这一结论和Asparouhov和Muthén所做模拟研究中“当模型中没有不恒定参数时, 固定优化算法要优于自由优化算法”的结论相一致(Asparouhov & Muthén, 2014)。所以, 第三步仅列出了使用固定优化算法的对齐法计算出的参数估计结果。
表7 两种算法的因素均值估计结果(N=4692)
均值类别固定优化算法真实值估计值自由优化算法真实值估计值 群组1 个人兴趣因素0.0000.0000.3140.221 社会责任因素0.0000.000–0.081–0.072 经济因素0.0000.0001.8480.520 群组2 个人兴趣因素0.0380.0400.3510.261 社会责任因素0.0750.079–0.0040.008 经济因素0.1630.1642.0090.682 群组3 个人兴趣因素0.0280.0330.3390.252 社会责任因素0.0650.070–0.018–0.002 经济因素0.1270.1291.9750.648 群组4 个人兴趣因素0.1620.1630.4720.381 社会责任因素–0.005–0.006–0.086–0.077 经济因素–0.014–0.0211.8100.484
表8 两种算法的因素均方误差计算结果(N = 4692)
因素固定优化算法均方误差自由优化算法均方误差 均值标准差均值标准差 个人兴趣因素 因素均值0.0360.0160.2240.179 因素方差0.0460.0200.0460.020 社会责任因素 因素均值0.0380.0170.1840.141 因素方差0.0500.0220.0500.022 经济因素 因素均值0.0410.0181.5271.139 因素方差0.0600.0250.0600.025
4 方法总结与展望
通过前文所述, 对齐法可以被认为是传统多群组CFA的有益补充, 其最大贡献是可以克服苛刻的截距恒定假设, 通过检验参数的近似恒定性而达到群组间的因素均值比较的目的。相比传统的多群组CFA, 对齐法可以有效拟合参数近似恒定的模型, 模型拟合度和拟合度较好的构置恒定模型完全相同, 还可以处理数目繁多的群组、较为复杂的量表结构, 可以为模型中因素载荷和截距的近似恒定性提供详细的诊断。通常情况下, 如果研究数据的样本量很大, 群组较多, 模型较复杂, 那么使用多群组CFA很难满足截距恒定假设。此时, 使用对齐法检验模型参数近似恒定性而进行因素均值比较可能是较好的选择。如果研究者希望了解模型中因素载荷和截距等参数的恒定性, 从而对模型进行诊断或是希望改进量表设计, 使用对齐法也是更好的选择, 因为传统的使用修正指数释放参数的方法受研究者主观判断的影响较大, 修正指数的多重共线性也会误导研究者的判断。
同时, 对齐法作为一种新方法, 也存在着一些局限性。首先, 对齐法是基于构置恒定模型, 潜在的前提是构置恒定模型拟合较好, 且要优于因素载荷恒定模型或是截距恒定模型。但有的时候会出现构置恒定模型本身拟合就很不好或是因素载荷恒定模型拟合更好, 此时使用对齐法就会有一定的问题。其次, 对于较多的群组和较为复杂的模型, 对齐法要求待分析的各个群组的样本量足够大, 而这一条件不一定总能满足。再次, 对齐法的提出者仅仅指出当模型中的不恒定参数比率小于等于25%时对齐法参数估计能取得较好效果(Asparouhov & Muthén, 2014), 但25%的依据并不充分, 今后的研究可以探究这一比率是否更小或更大。最后, 对齐法仍然是基于传统CFA, 只允许观测变量在一个因素上有因素载荷, 不允许因素拥有跨因素载荷(cross-loadings), 所以研究的CFA模型可能本身就不是正确的模型。
对齐法自2014年提出以来也在不断更新, 方法被应用于更多领域, 也有许多新进展。对齐法提出同年, Muthén和Asparouhov将对齐法应用于项目反应理论(item response theory)研究(Muthén & Asparouhov, 2014)。他们介绍了在项目反应理论情境下对齐法的计算方法, 运用蒙特卡洛模拟研究检验了对齐法的适用性。2017年, Muthén和Asparouhov比较了对齐法和随机效应法(random effects method)两种研究多群组测量恒定性的方法, 详细叙述了在不同研究条件下选取对齐法或是随机效应法分析数据的准则, 比较了两种方法各自的优势与缺陷。随机效应法的引入进一步填补了测量恒定性研究领域的空白, 是对齐法的有益补充。2017年, Marsh等人基于标准对齐法提出了CFA对齐法(alignment within CFA), 将更倾向于探索性的对齐法变为了验证性的对齐法(Marsh et al., 2017)。相比标准对齐法, CFA对齐法可以更广泛地应用于结构方程模型, 引入协变量进行多指标多因素(MIMIC)模型分析, 并且在Mplus软件中还可以得到标准对齐法无法提供的修正指数等指标。
随着研究者越来越深入了解对齐法的原理, 有越来越多的研究开始使用对齐法进行多群组分析, 研究群组间的可比较性。Munck等人使用对齐法研究了1999年教育成就评价国际委员会收集的欧洲22国公民教育研究数据和2009年该机构收集的欧洲24国国际公民与公民身份教育研究数据(Munck & Torney, 2017)。研究者以国别和性别两个变量区分不同群组, 运用对齐法研究了92个研究组别的测量恒定性, 成功比较了样本中国别与性别的差异, 解决了没有满足截距恒定无法进行群组间因素均值比较的问题。Lomazzi使用对齐法研究了世界民众价值观调研收集的关于男女性承担角色的态度的全球59国数据样本 (Lomazzi, 2018), 比较了部分截距恒定模型和对齐法各自的特点和优势。
最后, 基于对齐法的局限性, 可能仍然有许多等待研究者挖掘的领域。例如, 不同情境下对齐法需要的群组样本量大小, 对齐法取得较好估计效果所能接受的不恒定参数率, 对齐法与探索性结构方程模型(ESEM)结合的可能性, 运用对齐法研究跨时序模型中参数近似恒定性的可能性, 对齐法和多水平随机效应法的适用性等等。
参考文献
蔡华俭, 林永佳, 伍秋萍, 严乐, 黄玄凤. (2008). 网络测验和纸笔测验的测量不变性研究——以生活满意度量表为例. 心理学报, 40(2), 228–239.
王孟成. (2014). 潜变量建模与Mplus应用•基础篇.重庆大学出版社.
温聪聪, 伍伟平, 蒋玉塔. (2016). 厦门大学理工科本科生职业发展研究. 职大学报,(3), 94–99.
Asparouhov, T., & Muthén, B. (2014). Multiple-group factor analysis alignment. Structural Equation Modeling A Multidisciplinary Journal,21(4), 495–508.
Billiet, J. (2013). Quantitative methods with survey data in comparative research. Urology,76(76), S2–S3.
Davidov, E., Meuleman, B., Cieciuch, J., Schmidt, P., & Billiet, J. (2014). Measurement equivalence in cross-national research. Annual Review of Sociology,40(40), 55–75.
Lomazzi, V. (2018). Using alignment optimization to test the measurement invariance of gender role attitudes in 59 countries. Methods, Data, Analyses: A Journal for Quantitative Methods and Survey Methodology (MDA),12(1), 77–103.
Maltese, A. V., Ross, H., Wang, L., & Wang, Y. (2014). Assessing multinational interest in STEM: Implementing a comparative survey research study in China. International Journal of Chinese Education,3(1), 109–131.
Marsh, H. W., Guo, J., Parker, P. D., Nagengast, B., Asparouhov,T., & Muthén, B., et al. (2017). What to do when scalar invariance fails: The extended alignment method for multiple-group factor analysis comparison of latent means across many groups. Psychological Methods. Advance online publication.
Millsap, R. E. (2011). Statistical approaches to measurement invariance. New York, NY, US: Routledge/Taylor & Francis Group.
Muthén, B., & Asparouhov, T. (2014). IRT studies of many groups: the alignment method. Frontiers in Psychology,5(5), 978.
Muthén, B., & Asparouhov, T. (2017). Recent methods for the study of measurement invariance with many groups: alignment and random effects. Sociological Methods & Research, DOI: 10.1177/0049124117701488.
Munck, I., Barber, C., & Torney-Purta, J. (2017). Measurement invariance in comparing attitudes toward immigrants among youth across Europe in 1999 and 2009: The alignment method applied to IEA CIVED and ICCS. Sociological Methods & Research, DOI: 10.1177/ 0049124117729691.
Piurko, Y., Schwartz, S. H., & Davidov, E. (2011). Basic personal values and the meaning of left-right political orientations in 20 countries. Political Psychology,32(4), 537–561.
Vandenberg, R. J., & Lance, C. E. (2000). A review and synthesis of the measurement invariance literature: Suggestions,practices, and recommendations for organizational research.Organizational Research Methods,3(1), 4–70.
Wang, J. C., & Wang, X. Q. (2012). Structural equation modeling: Applications using Mplus. John Wiley & Sons.
Widaman, K. F., & Reise, S. P. (1997). Exploring the measurement invariance of psychological instruments: Applications in the substance use domain. In K. J. Bryant, M. Windle, & S. G. West (Eds.), The science of prevention: Methodological advances from alcohol and substance abuse research (pp. 281–324). Washington, DC, US: American Psychological Association.
① 国内有研究者使用“形态恒定”这一中文翻译(王孟成, 2014)。但形态恒定的英文原文为pattern invariance, 与configural invariance有所不同。对于configural invariance, 国内许多研究者译为“结构恒定”, 笔者认为这一译法并不妥当。一方面, “结构的”对应的英文为structural, 将其和configural等同似乎并不恰当; 另一方面, 如上文所述, configural invariance代表各群组因素结构、数目相同, 还代表各因素设为定值和设为自由估计的因素载荷相同, 所以configural不仅有因素结构一致的含义, 还有因素载荷配置情况一致的含义。综上所述, configural invariance的中文译文不应当是“结构恒定”, 笔者认为应当是“构置恒定”。
② Mplus 7.1以上的软件版本都提供了使用对齐法分析数据的功能。
教师应对学生在阅读过程中的心理状态、思维方式、阅读方法和阅读习惯等加以分析、指导,重视利用学习策略,提高教学的科学性。如在培养略读技巧时,可利用幻灯片设置连线题。
③ 本研究实例的数据和相关Mplus语法文件已经上传至OSF网站供读者参阅。项目链接为:https://osf.io/k34sg/
Alignment: A new method for multiple-group analysis
WEN Congcong1; WU Weiping1; LIN Guangjie2
(1 Overseas Education College/International College, Xiamen University, Xiamen 361102, China) (2 School of Journalism and Communication, Xiamen University, Xiamen 361005, China)
Abstract: Comparing the latent factor means across groups need to test the comparability of the instrument. Researchers usually test the scalar invariance to achieve this goal but often get unsatisfactory results. The alignment is proposed under this background. It allows the comparison of the latent factor means by testing the approximate invariance of the configural model parameters and has become a significant complement to multiple-group CFA. This article gives a detailed description of the multiple-group CFA and alignment, summarizes the research procedures and points to which researchers need to pay attention when applying alignment, uses an undergraduates’ work value data to illustrate how to use alignment to do a research with Mplus. In the end, this article summarizes the advantages and limitations of alignment and reviews its research developments and empirical applications.
Key words:multiple-group analysis; multiple-group CFA; measurement invariance; alignment; Monte Carlo simulation study
DOI:10.3724/SP.J.1042.2019.00181
收稿日期:2018-03-08
通信作者:温聪聪, E-mail: wencong001@xmu.edu.cn
分类号B841
标签:因素论文; 群组论文; 模型论文; 载荷论文; 均值论文; 哲学论文; 宗教论文; 心理学论文; 心理学研究方法论文; 《心理科学进展》2019年第1期论文; 厦门大学海外教育学院; 国际学院论文; 厦门大学新闻传播学院论文;