邱世芳:无金标准部分核实数据下基于风险差的等价性检验论文

摘要：基于2个有误判分类器下的部分核实数据对2组疾病流行率进行比较研究，在2种模型下考虑了基于风险差的wald型检验、似然比检验、Score检验、基于反双曲正切变换的检验等6个统计量，通过随机模拟考察了各种检验犯第一类错误的概率和经验功效，用实际数据分析进一步验证了所提方法的有效性。

关键词：风险差；有误判分类器；部分核实数据；Score检验

在流行病学研究中，为了估计某种疾病的流行率，常使用价格便宜的筛检方法对个体进行第一次诊断。由于筛检方法常存在误判，从而导致基于有误判数据的估计常常是有偏的[1]。在实际中，完全的金标准是不存在的，同时其花费很高且非常耗时。为此，Tenenbein[2]提出了二重抽样方法，即从感兴趣的总体中随机抽取N个个体接受易犯错的分类器分类，再从中随机抽取n个个体接受金标准检验。这种方法叫作二重抽样方法，得到的数据称为部分核实数据[3]。

基于Tenenbein[2]提出的二重抽样方法得到的部分核实数据，Tang等[3]研究了单个总体下的疾病流行率的假设问题，考虑了基于Score检验、似然比检验以及2种Wald型检验的大样本渐近的检验过程以及小样本近似非条件检验过程；Tang等[4]基于上述检验统计量提出了关于疾病流行率的12种区间估计方法；并从显著性检验的角度和区间估计的角度考虑了样本量的确定方法[5]；对于2组样本情形，Tang等[6]基于比例差考虑了2组疾病流行率的显著性差异的假设检验过程，以及从检验功效的角度研究了样本量的确定问题；同时，Qiu等[7]考虑了2组样本下关于疾病流行率差的区间估计方法，从置信区间的角度研究了2组样本的疾病流行率的显著性差异问题。

以上研究中有一个重要的假定是存在一种完全无误判的金标准。但在实际应用中，完全准确的金标准检验也许根本不存在。为此，安金兵等[8]考虑了在无金标准条件下的诊断试验；Qiu等[9]在2种分类器都有误判的情况下，基于单组样本下的部分核实数据考虑了基于疾病流行率的假设检验过程以及样本量的确定，以及邱世芳等[10]从区间估计的角度研究了在给定置信水平下区间宽度控制下的样本量的估计问题。但Qiu等[9-10]只考虑单组样本下的部分核实数据对疾病流行率的显著性检验过程。而实际生活中，疾病流行率可能会受到年龄、生活习惯等的影响。为此，本文在此基础上进一步考虑2组独立的无金标准部分核实数据下基于风险差的显著性检验问题。

1数据结构

在2种分类器都有误判的情况下，假设从第j组感兴趣总体中随机抽取了Nj个个体进行初级分类器(J)分类，再从Nj个个体中随机抽取nj个个体进行高级分类器(S)分类，得到频数为nikj(i,k=0,1,j=1,2)。其中，Nj-nj个个体只接受了初级分类器的分类；xj表示检验为阳性的个体数；yj表示检验为阴性的个体数，数据结构由表1所示。

表1 第j组的数据结构

初级分类器Jj=1Jj=0合计高级分类器Sj=1n11jn10jn1+jSj=0n01j n00jn0+j合计n+1jn+0jnj只接受初级分类器的个体xjyjNj-nj

令Dj=1表示患病，Dj=0表示不患病，Jj=1表示初级分类器诊断个体呈阳性，反之Jj=0；Sj=1表示高级分类器诊断个体呈阳性，反之Sj=0。令πj=P(Dj=1)为第j组感兴趣总体真实的患病率，ηj=P(Jj=1|Dj=1)和θj=P(Sj=1|Dj=1)分别表示第j组样本下初级分类器和高级分类器的敏感度。本文假定两种分类器都不存在假阳性。

2假设检验

本文感兴趣的问题是如下的假设检验：

H0:π1=π2↔H1:π1≠π2

令δ=π2-π1，上述的假设检验就可变为：

H0:δ=0↔H1:δ≠0

2.1模型1和检验统计量

假定初级分类器和高级分类器的分类结果是条件独立的，即满足P(Jj,Sj|Dj)=P(Jj|Dj)P(Sj|Dj),j=1,2。在此假定下，可得如下的概率模型(Nedelman[11])，其概率分布如表2所示。

表2 第j组的概率分布

参数初级分类器Jj=1Jj=0合计高级分类器Sj=1πjηjθj πj(1-ηj)θjπjθjSj=0 πjηj(1-θj)πj(1-ηj)·(1-θj)+(1-πj)1-πjθj合计 πjηj1-πjηj1.0

令m={(n11j,n10j,n01j,n00j,xj,yj):j=1,2}为观测数据，则观测数据m的对数似然函数为：

l1(m;π1,δ,η1,θ1,η2,θ2)=

其中，

(n11j+n10j)logθj+n01jlog(1-θj)+

特里波迪认为，这款产品类似于橄榄油，但是却没有橄榄油那种刺激性的味道，毕竟有很多人因接受不了橄榄油味道，连加了橄榄油的奥利奥饼干或燕麦棒都不愿意食用。正因为新大豆油继承了橄榄油的健康，却没有刺激性味道，而赢得了一家非营利公共利益科学中心组织的盛赞。

yjlog(1-πjηj)}

(1)

其中，π2=π1+δ；C1是一个与参数无关的常数。

简单计算可得π1、δ、ηj、θj(j=1,2)的非限制性极大似然估计，分别为：

(2)

其中从而得到和的方差分别为：

(3)

在H0:δ=0下，π1的限制性极大似然估计为：

(4)

其中的限制性极大似然估计可通过求解方程组(5)得到：

(5)

此方程组的解没有显表达式，可用迭代方法如牛顿迭代法求解。

2.1.1Wald型检验统计量

式(3)得到的的方差可通过2种方式获得其估计，一是不考虑原假设下的估计；二是考虑原假设下的估计，即将参数π1、δ、ηj、θj用相应的非限制性极大似然估计代替，得到不考虑原假设下的方差估计三是用相应的限制性极大似然估计代替，得到原假设下的方差估计从而得到Wald型检验统计量，分别为：

和

在原假设H0:δ=0下，当N1和N2趋近无穷大时，Tl的渐近分布为自由度为1的卡方分布。

辽宁销售针对定向群体客户，制定差异化促销方案。如利用“春耕惠农”政策开展油卡非润互动促销，进一步挖掘了农业客户对润滑油的潜在需求。今年春耕期间，铁岭分公司50多名加油站经理对周边971个村屯进行了划片走访，特别是加强与农村合作社等大客户的联系，登记润滑油客户306个。走进政府农机博览会，宣传春耕惠农政策，发放传单5000份，现场摆置昆仑润滑油，当场卖出机油30多桶。截至9月20日，铁岭分公司店销润滑油243.3吨，同比增长344.79%。

2.1.2似然比检验统计量

根据式(1)给出的对数似然函数，对于假设检验H0:δ=0↔H1：δ≠0有如下的似然比检验统计量：

在原假设H0:δ=0下，当N1和N2趋近无穷大时，Tw1和Tw2的渐近分布为标准正态分布。

经过简单计算，可得π1,δ,ηj,θj(j=1,2)的非限制性极大似然估计，分别为：

根据Rao[12]提出的score理论，对于假设检验H0:δ=0↔H1：δ≠0，经过推导得到如下的score检验统计量：

地质勘察工作是项目施工的技术支撑，是施工顺利开展的保障，勘探质量的优劣对施工至关重要，因此，必须全面把握勘探工作质量管理。

城乡关系最终发展成为城乡二元结构是生产力发展和社会分工的产物。马克思一语道破资本空间与其他空间矛盾、城乡空间分裂失衡的根本原因：资本逻辑下社会资源由农村向城市集聚，乡村社会关系断裂碎片化为城市化发展的附庸，社会矛盾集中于城市，空间对立与矛盾压力逐步加大的情况下，城市进一步向农村索取社会资源、转嫁社会压力。而资本空间拜物教时刻将空间资本化的冲动，更是直接催生城乡社会空间和主体的分裂对抗。经济、社会空间和主体的排斥，演变为文化礼俗习惯之间的对立，以至于滕尼斯直言，城乡空间排斥对立就是礼俗社会与法制社会之间的矛盾对立。

其中是第j组的Score函数，是第j组中关于(πj,ηj,θj)的3×3 Fishier信息阵的逆矩阵中第1行第1列的元素(j=1,2)，具体推导见附录1。在原假设H0:δ=0下，当N1和N2趋近无穷大时，Tsc的渐近分布为自由度为1的卡方分布。

1.3 统计学处理采用SPSS18.0统计软件进行分析。计量资料以表示，采用配对t检验。相关性分析应用Spearman变量相关性分析，以P<0.05为差异有统计学意义。

2.1.4基于反双曲正切变换的检验统计量

对进行反双曲正切逆变换可得：通过delta方法可得的渐近方差为:基于2.1.1中得到的的方差估计，可得如下的反双曲正切变换的检验统计量：

和

在原假设H0:δ=0下，当N1和N2趋近无穷大时，Ttan1和Ttan2的渐近分布为标准正态分布。

2.2模型2和检验统计量

假定初级分类器和高级分类器存在假阳性且条件不独立时，根据Lie[13]提出的模型，其概率分布如表3所示。

表3 第j组的概率分布

参数初级分类器Jj=1Jj=0合计高级分类器Sj=1πj(ηj-1+θj)πj(1-ηj)πjθjSj=0πj(1-θj)1-πj1-πjθj合计πjηj1-πjηj1.0

注：j=1,2

观测样本m的对数似然函数为：

l2(m;π1,δ,η1,θ1,η2,θ2)=

C2+(nj-n00j+xj)log(πj)+

n00jlog(1-πj)+xjlogηj+

n10jlog(1-ηj)+n01jlog(1-θj)+

采取SPSS 26.0统计学软件进行数据分析，其中计数资料以[n（%）]表示；计量资料应用（±s）表示，分别行χ2检验和t检验，P<0.05为差异有统计学意义。

yjlog(1-πjηj)+n11jlog(ηj+θj-1)

(6)

其中：π2=π1+δ；C2是一个与参数无关的常数。

2.1.3Score检验统计量

(7)

的方差估计为：

(8)

其中，

在H0:δ=0下，π1的限制性极大似然估计为：

(9)

ηj,θj(j=1,2)的限制性极大似然估计可通过求解以下方程组得到：

n00jlog[1-πj(ηj+θj-ηjθj)]+

在竹韵胡思乱想间，海力笑容可掬地坐到了她对面，并提来了一台笔记本电脑：“这是送给你的，啊，不，是送给你家先生龙斌的。”

由此，得到如下的估计：

(10)

n01j+xj)logηj+n10jlog(1-ηj)+

2.2.1Wald型检验统计量

同理，用2种不同的方法得到的方差，从而可得到2种Wald检验统计量：

和

其中，和是式(8)给出的方差中参数分别用式(7)给出的非限制性极大似然估计和式(9)(10)给出的限制性极大似然估计代替得到。在原假设H0:δ=0下，当N1和N2趋近无穷大时，Tw1和Tw2的渐近分布为标准正态分布。

2.2.2似然比检验统计量

由式(6)可得到如下的似然比检验统计量：

在原假设H0:δ=0下，当N1和N2趋近无穷大时，Tl的渐近分布为自由度为1的卡方分布。

2.2.3Score检验统计量

在原假设H0:δ=0成立下，可以得到Score检验统计量：

新兴权利保护的问题，意味着某种在社会公众或群体或某个作者看来应当是“权利”，应当得到司法的承认、保护和救济的东西，在现行法的框架内找不到明确的立法依据，为了解决其是否能够得到司法保护的问题，必须对其应当得到司法救济的能力(可诉性)进行论证和证成，“主体权利的实质在于实施特定行为的可能性有保证”[2]。

其中是第j组的score函数，是模型2下的第j组中关于(πj,ηj,θj)的3×3 Fishier信息阵的逆矩阵中第1行第1列的元素(j=1,2)，具体推导见附录2。在原假设H0:δ=0下，当N1和N2趋近无穷大时，Tsc的渐近分布为自由度为1的卡方分布。

2.2.4基于反双曲正切变换的检验统计量

同模型1，可以得到2种反双曲正切逆变换的检验统计量：

和

在原假设H0:δ=0下，当N1和N2趋近无穷大时，Ttan1和Ttan2的渐近分布为标准正态分布。

3模拟研究

为评估Tw1、Tw2、Tsc、Tl、Ttan1和Ttan2检验方法的有效性，考虑了如下样本量的模拟研究：① 小样本：(n1,n2,N1,N2)=(20,20,30,30),(30,30,50,50)；② 中等样本(n1,n2,N1,N2)=(50,50,100,100)；③ 大样本：(n1,n2,N1,N2)=(200,200,500,500)。

在不同的样本量设置下，考察犯第一类错误的概率时考虑了如下参数设置：π1=0.1(0.2)0.5，η1=0.5(0.1)0.7，θ1=0.7(0.1)0.9，η2=η1+0.05，θ2=θ1+0.05，即考虑了3(π1的值)×3(η1(η2)的值)×3(θ1(θ2)的值)=27种参数组合。对于检验功效考虑了：δ=0.1(0.01)0.3，π1=0.1(0.2)0.5，(η1,θ1)=(0.5,0.7),(0.6,0.8),(0.7,0.9)，η2,θ2同以上设置，即考虑了3(δ的值)×3(π1的值)×3((η1,θ1)的值)=27种参数组合。这里的a(b)c表示取值是从a以步长b变化到c。在每个样本量设置和每种参数设置下，随机产生5 000组数据m={(n11j,n10j,n01j,n00j,xj,yj):j=1,2}，在显著性水平α=0.05下，对于每个检验统计量Ti(i=w1,w2,sc,l,tan1,tan2)，其犯第一类错误的概率可通过以下公式计算：基于统计量Ti拒绝原假设的次数/5 000(δ=0)，经验功效通过以下公式计算基于统计量Ti拒绝原假设的次数/5 000(δ≠0)。犯第一类错误概率的模拟结果见表4～7。由于篇幅的限制，只列出了小样本和中等样本下的部分功效的模拟结果，见表8～9。

表4 小样本(n1,n2,N1,N2)=(20,20,30,30)下犯第一类错误的概率(显著性水平α=0.05)

π1η1θ1模型1Tw1Tw2Tsc Tl Ttan1Ttan2模型2Tw1Tw2Tsc Tl Ttan1Ttan20.100.500.700.044.723.260.040.024.300.500.523.260.620.380.400.800.064.303.140.100.003.980.640.603.700.660.480.340.900.103.942.840.080.063.640.760.464.540.720.580.320.600.700.044.642.680.060.044.220.420.403.880.420.280.240.800.063.882.320.040.043.640.720.404.600.600.480.260.900.123.082.180.040.102.840.620.244.320.560.460.160.700.700.083.982.600.120.043.760.620.464.020.520.400.240.800.083.802.460.020.063.500.680.304.680.580.520.180.900.102.481.500.000.082.260.600.344.440.540.540.220.300.500.701.046.824.961.220.524.424.564.423.663.243.643.280.801.325.904.461.400.984.124.264.464.683.443.423.460.901.624.143.681.201.042.663.964.385.183.343.063.100.600.700.986.304.421.220.504.224.083.884.603.183.063.180.801.485.504.541.320.983.844.024.005.123.403.062.940.901.943.723.521.141.362.783.983.965.063.343.203.020.700.701.125.324.440.980.743.443.783.685.003.022.982.820.801.564.504.241.141.043.183.503.304.862.742.642.340.902.143.864.181.321.662.783.583.525.103.082.842.720.500.500.702.205.725.182.981.183.226.425.484.425.105.163.780.802.244.744.182.101.342.605.945.224.744.904.603.620.903.184.204.242.362.002.805.885.845.665.004.684.380.600.702.485.645.223.101.243.226.325.305.345.244.743.880.802.984.724.922.942.063.085.484.824.684.464.203.640.903.324.504.762.822.323.125.285.045.144.344.043.560.700.702.845.525.062.961.703.305.504.665.144.724.163.440.803.445.205.143.022.663.425.465.065.324.664.343.840.904.365.025.263.443.423.745.445.205.544.904.463.88

表5 小样本(n1,n2,N1,N2)=(30,30,50,50)下犯第一类错误的概率(显著性水平α=0.05)

π1η1θ1模型1Tw1Tw2Tsc Tl Ttan1Ttan2模型2Tw1Tw2Tsc Tl Ttan1Ttan20.100.500.700.106.104.140.280.045.840.941.123.480.960.861.000.800.206.365.080.300.186.101.141.024.881.181.040.840.900.364.623.420.240.284.501.381.304.461.381.241.120.600.700.325.343.960.160.245.020.941.003.920.820.760.880.800.225.023.900.260.204.781.060.764.420.860.960.680.900.403.883.100.220.343.801.521.244.961.361.461.140.700.700.185.544.100.120.165.301.241.024.721.081.040.840.800.204.263.460.080.184.181.161.064.501.061.080.840.900.463.022.700.140.402.981.520.944.501.261.300.84

续表(表5)

π1η1θ1模型1Tw1Tw2Tsc Tl Ttan1Ttan2模型2Tw1Tw2Tsc Tl Ttan1Ttan20.300.500.701.326.985.082.600.865.384.984.723.644.044.243.960.801.885.724.422.261.384.404.844.544.264.324.324.060.902.744.184.342.422.523.585.305.405.665.024.804.460.600.702.027.005.582.601.545.644.644.484.604.244.103.940.802.285.524.942.261.684.604.804.765.044.484.243.980.902.984.244.322.262.363.444.424.384.784.063.963.660.700.701.485.504.862.061.224.604.624.385.004.104.023.920.802.484.484.362.041.963.783.543.564.243.263.122.800.902.563.903.861.922.123.364.444.505.384.003.863.700.500.500.702.485.705.224.421.463.625.825.284.805.044.984.200.803.345.465.143.842.263.846.425.705.485.705.484.660.903.764.965.003.282.783.606.045.365.465.384.984.460.600.703.465.745.104.522.204.066.085.565.145.625.284.660.804.224.924.804.283.043.745.544.984.684.904.743.960.904.084.724.843.743.363.945.465.265.164.904.784.520.700.703.564.564.383.842.743.385.545.025.165.064.724.080.804.725.065.284.643.864.225.565.165.225.144.984.360.904.785.545.364.223.824.345.024.764.904.384.204.02

表6 中等样本(n1,n2,N1,N2)=(50,50,100,100)下犯第一类错误的概率(显著性水平α=0.05)

π1η1θ1模型1Tw1Tw2Tsc Tl Ttan1Ttan2模型2Tw1Tw2Tsc Tl Ttan1Ttan20.100.500.700.307.885.320.920.247.542.562.963.862.482.502.900.800.547.124.920.880.506.842.823.004.682.802.662.840.901.265.144.181.061.124.983.023.465.462.922.903.28 0.600.700.486.724.840.720.466.462.582.784.322.142.482.700.800.725.904.660.680.685.722.342.584.962.322.282.420.901.244.563.920.921.124.322.322.405.142.482.222.30 0.700.700.465.924.660.540.385.662.222.184.942.022.142.040.800.764.663.860.500.724.482.402.325.122.322.362.220.901.304.624.441.001.264.482.882.405.542.722.682.360.300.500.702.485.564.563.842.084.845.605.304.725.225.204.820.802.464.964.683.242.144.345.365.244.985.124.884.780.903.504.744.583.263.084.244.844.945.184.604.464.540.600.703.185.425.044.402.704.645.405.284.825.365.264.940.804.085.185.104.623.504.645.785.405.425.565.265.060.904.185.045.083.963.824.565.205.225.345.104.924.800.700.703.685.525.584.303.205.024.884.684.704.744.624.280.804.385.305.264.323.904.805.344.965.205.164.824.620.903.664.284.343.343.363.945.065.105.224.964.764.84

续表(表6)

π1η1θ1模型1Tw1Tw2Tsc Tl Ttan1Ttan2模型2Tw1Tw2Tsc Tl Ttan1Ttan20.500.500.703.885.324.784.942.464.324.924.524.284.564.444.060.804.425.385.324.803.504.485.485.145.105.185.144.620.903.864.844.603.923.364.224.924.684.584.444.484.100.600.703.984.984.924.903.164.305.645.204.945.245.144.760.804.585.105.085.063.784.465.745.245.105.305.204.800.904.645.105.044.544.204.385.405.145.025.104.964.720.700.704.925.405.425.604.284.845.725.465.265.405.385.100.804.744.844.844.724.144.325.845.545.405.605.484.92 0.905.425.345.285.104.864.845.625.265.225.205.084.88

表7 大样本(n1,n2,N1,N2)=(200,200,500,500)下犯第一类错误的概率(α=0.05)

π1η1θ1模型1Tw1Tw2Tsc Tl Ttan1Ttan2模型2Tw1Tw2Tsc Tl Ttan1Ttan20.100.500.703.005.485.164.922.945.445.505.444.805.685.445.400.803.184.944.984.283.184.905.365.285.045.565.325.280.903.825.145.104.103.785.125.285.505.525.485.265.440.600.703.685.265.024.843.625.225.084.944.785.245.044.900.803.784.564.644.283.744.545.465.485.265.585.405.460.903.904.764.884.003.864.724.784.905.024.884.684.880.700.704.044.905.024.864.024.884.984.964.865.184.964.940.803.984.504.524.503.964.404.724.704.764.924.664.640.903.804.344.403.943.764.324.464.584.644.644.444.480.300.500.704.304.904.904.984.064.685.505.484.705.465.485.360.804.765.345.145.184.645.184.644.584.284.584.584.480.905.485.605.745.565.365.545.085.004.925.145.064.900.600.704.645.065.045.104.524.965.084.964.745.004.984.900.804.224.344.384.464.104.244.204.203.984.204.204.140.905.005.285.345.204.965.205.125.025.005.105.004.980.700.705.044.964.945.184.844.925.145.105.005.145.084.980.805.005.205.125.244.865.105.004.884.865.044.924.840.904.945.004.945.004.844.965.365.225.285.385.265.120.500.500.704.965.565.505.384.705.285.445.304.745.305.285.160.805.345.645.565.545.045.525.405.225.085.285.225.120.904.824.804.764.804.744.684.904.824.764.884.824.760.600.705.145.205.165.264.925.004.824.704.504.724.684.540.805.025.064.925.084.804.985.445.385.265.445.365.280.905.244.985.145.085.104.885.024.884.905.004.904.800.700.705.425.525.525.645.325.325.064.964.945.084.964.880.805.165.165.185.145.065.045.165.065.105.085.004.92 0.904.664.684.664.704.644.585.265.165.065.165.165.08

表8 小样本(n1,n2,N1,N2)=(20,20,30,30)下的经验功效(显著性水平α=0.05)

δπ1η1θ1模型1Tw1Tw2Tsc Tl Ttan1Ttan2模型2Tw1Tw2Tsc Tl Ttan1Ttan20.100.100.500.700.984.346.580.640.663.705.766.4012.385.284.685.160.600.801.964.166.320.561.403.486.906.3415.106.125.825.300.700.803.403.306.220.402.582.768.306.3617.147.267.065.06 0.300.500.703.246.927.062.582.184.1810.5610.207.968.248.828.200.600.805.065.987.423.103.764.3610.569.9210.629.088.888.100.700.907.386.868.744.465.805.4611.1610.2612.229.749.268.080.500.500.704.445.225.984.162.502.7811.5610.108.1410.009.507.820.600.807.565.987.445.805.483.9412.7411.3811.1811.5610.829.320.700.909.948.789.647.407.886.3412.4411.4411.5010.9010.308.860.200.100.500.706.965.0813.722.724.864.1228.0831.2232.7225.1624.9827.480.600.8012.325.9016.422.909.525.0229.4429.9040.4227.0826.5226.340.700.9019.908.4420.805.7417.047.5833.5829.8244.1230.9030.6626.560.300.500.7010.146.6612.887.346.124.4829.4428.0620.2624.7025.5823.820.600.8016.969.5616.8410.1812.927.4429.6229.3227.7626.8826.4025.300.700.9022.6814.5021.1614.3018.5411.5830.6429.6630.9228.4427.1225.560.500.500.7013.526.7612.569.988.384.1630.6228.0623.2227.9226.9423.660.600.8020.8210.5817.3614.9215.927.5431.3429.2828.5429.0228.0625.140.700.9026.2818.3023.6620.9822.8414.3832.6430.3430.6630.2629.2026.700.300.100.500.7021.744.4422.327.3816.123.8659.4462.7250.6453.9856.0658.220.600.8033.806.3030.1611.8628.585.7062.6865.2465.6658.6859.0460.760.700.9047.8810.4238.2818.8442.909.3866.8664.5471.2064.0463.4660.400.300.500.7024.967.4222.2015.7616.905.4857.2254.9839.1851.3252.4849.300.600.8037.4012.8630.9823.9230.4410.0056.2855.1651.4453.1852.0250.120.700.9047.2422.2241.0633.7042.4018.7456.8656.5057.1054.9453.3652.020.500.500.7027.847.2221.5419.5819.004.6859.5656.5648.0456.8655.5651.200.600.8040.9014.7232.0630.3634.7410.6461.4458.9257.7258.9257.9254.420.700.9053.6230.3846.4644.1249.0825.0461.5659.7259.6459.2858.2455.56

表9 中等样本(n1,n2,N1,N2)=(50,50,100,100)下的经验功效(显著性水平α=0.05)

δπ1η1θ1模型1Tw1Tw2Tsc Tl Ttan1Ttan2模型2Tw1Tw2Tsc Tl Ttan1Ttan20.100.100.500.7011.747.9616.528.2410.887.3035.2236.2626.3631.2034.2835.520.600.8019.8410.6220.8612.6018.849.9635.2437.0835.4632.8234.4236.380.700.9028.7616.8627.6219.2228.0016.1637.4836.7641.0836.2836.6435.920.300.500.7013.509.0612.2012.2011.987.5623.1222.2220.0421.9422.1221.140.600.8018.2212.0415.1415.0016.6010.7624.0423.5022.8223.2423.0622.320.700.9023.3020.0621.8021.1422.2018.9625.3624.2024.1624.4624.5422.98

续表(表9)

δπ1η1θ1模型1Tw1Tw2Tsc Tl Ttan1Ttan2模型2Tw1Tw2Tsc Tl Ttan1Ttan20.500.500.7013.007.9011.2611.7010.926.3821.0219.8218.8220.1419.6018.660.600.8017.1612.7614.8415.2015.9611.0222.4421.4621.2821.6821.3220.380.700.9021.7419.2220.1420.3020.4817.9423.5822.3622.1622.8022.4621.100.200.100.500.7050.446.2639.3430.3447.745.7082.9483.3258.5079.6482.3082.700.600.8065.9410.8050.3243.3664.4010.2684.6085.1277.8282.9483.8084.660.700.9077.7422.0264.0260.7076.9220.9487.2087.8886.6486.3286.6487.260.300.500.7039.0414.1630.5631.5836.1211.3065.0464.0060.0064.1863.6262.700.600.8053.9827.9644.3045.8252.0424.7267.3466.5666.0066.4866.1465.420.700.9066.1452.2860.5261.9064.7049.3470.9669.9069.7469.8869.8468.660.500.500.7035.3416.5627.6629.7831.7211.9461.1260.1658.3060.1459.6458.320.600.8050.2033.5042.2644.2047.7228.8465.0263.8663.3464.1663.5862.120.700.9061.8255.9657.9058.9460.2053.2668.0867.1266.9067.3266.9066.000.300.100.500.7077.542.6054.6447.0874.962.1898.5498.6872.0298.1498.4698.560.600.8087.405.2467.6064.0486.604.4498.6698.9491.7898.5698.6698.820.700.9096.9011.6883.9683.8096.7810.3899.0099.1497.8498.9498.9899.100.300.500.7069.2613.9051.9653.8065.869.9293.2492.8888.1092.8692.6892.280.600.8083.4836.2271.2474.1882.1028.5294.5094.1893.5894.0894.0493.780.700.9093.3869.8289.0090.7892.8663.3695.4494.9894.9695.0695.0494.620.500.500.7062.5223.0248.8851.0059.0614.4094.0093.6493.0493.6893.5693.200.600.8082.2654.6073.9876.3081.0045.0494.8094.5094.4294.6494.3494.200.700.9092.6286.3490.1690.9892.1481.9096.0495.7295.5295.7295.5695.38

通过模拟结果可以得到以下结论：① 对于2个模型，即使在极小样本(如(n1,n2,N1,N2)=(20,20,30,30))下，Score检验统计量(Tsc)犯第一类错误概率接近给定的显著性水平(α=0.05)，相应的功效也比较大，随着样本量的增大，犯第一类错误的概率越来越接近显著性水平0.05且功效越来越大；② 对于模型1，除了小样本情形，考虑原假设下方差的Wald检验统计量(Tw2)、Score检验(Tsc)以及反双曲正切变换统计量(Ttan2)都表现良好，它们犯第一类错误的概率都比较接近于给定的显著性水平0.05，且有较大的功效；③ 对于模型2，在中等样本和大样本且犯病率不是极小时，所有检验统计量犯第一类错误的概率都基本接近名义水平且具有较高的功效。综上所述，在模型1下，推荐使用Tw2、Tsc和Ttan1；在模型2下，当样本量极小时(如(n1,n2,N1,N2)=(20,20,30,30))，推荐使用Score统计量，在样本量不是极小时，所有统计量都可以推荐使用。

4实例分析

为了验证本文提出方法的有效性，利用Nedelman[11]研究中的疟疾数据进行分析。考虑了未成年组(即9～18岁)的2个不同组的疟疾数据，数据结构见表10。

表10 实例数据

参数初级分类器J1=1J1=0合计高级分类器S1=134438S1=051520只接受初级分类器的个体328188516合计367207574参数初级分类器J2=1J2=0合计高级分类器S2=1461056S2=0111930只接受初级分类器的个体337159496合计394188582

对于假设检验：H0:δ=0↔H1:δ≠0，在模型1下，基于本文考虑的检验统计量Tw1、Tw2、Tl、Tsc、Ttan1、Ttan2的检验p值分别为：0.113、0.130、0.129、0.184、0.115、0.132。由此，没有充分理由拒绝原假设，认为疟疾的患病率与不同的调查组无关。在模型2下，本文所提出的检验统计量的检验p值分别为：0.127、0.141、0.143、0.145、0.128、0.142，同样认为没有充分理由拒绝原假设，即认为疟疾的患病率与不同的调查组无关。

习近平总书记深刻指出：“政治问题，任何时候都是根本性的大问题。干部在政治上出问题，对党的危害不亚于腐败，有的甚至比腐败问题更严重。”[3]P87实践证明，加强党的政治建设是党的一项根本性建设，增强政治领导力是加强党的政治建设的一个重要环节和检验标准，这是全面回归党的政治传统的宝贵经验和重大成果，也是新时代坚持党的全面领导、推进全面从严治党向纵深发展的重要政治保证。

5结束语

本文基于2个有误判分类器下的二重抽样数据对2组患病率进行了比较研究，分别考虑2个二重抽样模型的6种检验统计量，并通过不同样本量和不同参数设置考察了它们犯第一类错误的概率和检验功效。对于模型1，即使在极小样本下，Score检验以及反双曲正切统计量都表现良好，在样本量不太小时，似然比统计量也能很好地控制犯第一类错误的概率；对于模型2，本文所考虑的所有检验统计量(在中等样本和大样本下且犯病率不是极小时)都表现很好。在2个模型中，考虑初级分类器和高级分类器不存在假阳性，在实际的模型中该条件可能不存在，但如果2种分类器都存在假阳性分类时，本文考虑的模型是不可识别的。此时，可以考虑采用贝叶斯统计方法进行研究，这是一个将来值得研究的问题。

参考文献：

[1] BROSS I.Misclassification in 2×2 tables[J].Biometrics,1954,10(4):478-486.

[2] TENENBEIN A.A double sampling scheme for estimating from binomial data with misclassifications[J].Journal of the American Statistical Association,1970,65(331):1350-1361.

[3] TANG M L,QIU S F,POON W Y,et al.Test procedures for disease prevalence with partially validated data[J].Journal of Biopharmaceutical Statistics,2012,22(2):368-386.

[4] TANG M L,QIU S F,POON W Y.Confidence interval construction for disease prevalence based on partial validation series[J].Computational Statistics & Data Analysis,2012,56(5):1200-1220.

[5] QIU S F,POON W Y,TANG M L.Sample size determination for disease prevalence studies with partially validated data[J].Statistical Methods in Medical Research,2016,25(1):37-63.

[6] TANG M L,QIU S F,POON W Y.Comparison of disease prevalence in two populations in the presence of misclassification[J].Biometrical Journal,2012,54(6):786-807.

[7] QIU S F,POON W Y,TANG M L.Confidence intervals for proportion difference from two independent partially validated series[J].Statistical Methods in Medical Research,2016,25(5):2250-2273.

[8] 安金兵,曹波,王强.无金标准条件下的诊断试验一致性检验[J].中国卫生统计,2007,24(1):76-78.

[9] QIU S F,ZENG X S,TANG M L,et al.Test procedure and sample size determination for a proportion study using a double-sampling scheme with two fallible classifiers[J].Statistical Methods in Medical Research,2019,28(4):1019-1043.

[10] 邱世芳,曾小松.不完全无误判金标准下二重抽样设计中样本量的确定[J].重庆理工大学学报(自然科学),2018,32(1):195-204.

[11] NEDELMAN J.The prevalence of malaria in Garki,Nigeria:double sampling with a fallible expert[J].Biometrics,1988,44(3):635-655.

[12] RAO C R.Linear statistical inference and its applications(2nd ed)[M].New York:Wiley,1985.

[13] LIE RT,HEUCH I,IRGENS L M.Maximum likelihood estimation of the proportion of congenital malformations using double registration systems[J].Biometrics,1994,50:433-444.

附录：

There were vessels,white adipocytes,fibroblasts and collagen as the mesenchyma(Figure 3D).16

Score检验统计量的有关推导：

良好的情感可以促进和补偿学生的非智力活动，并产生持久的学习动力。教师对学生真挚热烈的情感能打开学生心扉唤起学生相应的情感，使之对教师产生亲近感、信赖感，进而把教师之爱转化为听老师的话，爱上老师的课，积极认真完成老师交给的任务，从而改变“要我学”为“我要学”。形成自主的学习行为。

(2)固定衰减器2的衰减量的选择应保证发射机的调谐信号到达信号源后的功率低于信号源的最大允许反向输入功率3dB；

1.模型1下的Fisher信息矩阵

lj(m;πj,ηj,θj)=C+(nj-n00j+xj)logπj+(n11j+n01j+xj)logηj+n10jlog(1-ηj)+

(n11j+n10j)logθj+n01jlog(1-θj)+n00jlog[1-πj(ηj+θj-ηjθj)]+yjlog(1-πjηj),j=1,2

Fisher信息阵的元素分别为：

Fisher信息阵的逆矩阵中第一个对角元素为：

在MoS2表面也存在着类似的水氧电化学反应过程,该反应是可逆的,可以在MoS2表面存储大量动态电荷。当突然加负的扫描电压时,动态电荷的平衡瞬间被改变,大量电子释放出来,进入沟道并形成漏极电流,使Cit变成负电容,从而在电压扫描的开始部分,亚阈值斜率非常陡峭。

2.模型2下的Fisher信息矩阵

lj(m;πj,ηj,θj)=C+(nj-n00j+xj)logπj+xjlogηj+n10jlog(1-ηj)+n01jlog(1-θj)+

n00jlog(1-πj)+yjlog(1-πjηj)+n11jlog(ηj+θj-1),j=1,2

Fisher信息阵的元素分别为：

Fisher信矩阵的逆矩阵中第一个对角元素为：

EquivalenceTestofRiskDifferenceforPartiallyValidatedSerieswithTwoFallibleClassifiers

QIU Shifang, HE Jie

(College of Science, Chongqing University of Technology, Chongqing 400054, China)

Abstract: Comparison of disease prevalence in two populations based on partially validated series with two fallible classifiers is considered in this article. The wald-type tests, likelihood ratio test, Score test and tests based on the inverse hyperbolic tangent transformation are proposed under two models, respectively. The performance of the various tests is evaluated in term of type I error rates and empirical powers via simulation studies. A real data is used to illustrate the proposed methodologies.

Keywords: risk difference; fallible classifier; partially validated series; score test

收稿日期：2018-11-28

基金项目：国家自然科学基金资助项目(11471060,11871124)；国家统计局统计科研重点项目(2017LZ27)；重庆市科委项目(cstc2018jcyjAX0241)

作者简介：邱世芳,女,博士,教授,主要从事生物医学统计研究,E-mail:sfqiu@cqut.edu.cn;何杰,女,硕士研究生,主要从事应用统计研究,E-mail:962738857@qq.com。

doi:10.3969/j.issn.1674-8425(z).2019.10.030

本文引用格式：邱世芳，何杰.无金标准部分核实数据下基于风险差的等价性检验[J].重庆理工大学学报(自然科学)，2019,33(10):191-202.

Citationformat：QIU Shifang, HE Jie.Equivalence Test of Risk Difference for Partially Validated Series with Two Fallible Classifiers[J].Journal of Chongqing University of Technology(Natural Science)，2019,33(10):191-202.

中图分类号：C815

文献标识码：A

文章编号：1674-8425(2019)10-0191-12

(责任编辑陈艳)

标签：样本论文; 模型论文; 概率论文; 方差论文; 数据论文; 社会科学总论论文; 统计学论文; 统计方法论文; 统计图示法论文; 《重庆理工大学学报(自然科学)》2019年第10期论文; 国家自然科学基金资助项目(11471060; 11871124)国家统计局统计科研重点项目(2017LZ27)重庆市科委项目(cstc2018jcyjAX0241)论文; 重庆理工大学理学院论文;