朱宝生:数据漏报对总和生育率与出生率确定性函数关系的影响论文

人口动态与形势

摘要：根据总和生育率与出生率确定性函数关系，利用国家统计局人口统计数据，分别计算了四种出生人口数据漏报模式下总和生育率与出生率的关系系数。并与官方公布数据(有数据漏报)情况下估算的关系系数进行对比分析，发现虽然出生数据漏报对总和生育率和出生率有明显的影响，但是对总和生育率与出生率关系系数影响很小，可以忽略。因此，可以认为出生人口数据漏报对总和生育率与出生率具有同等的影响，而对两者之间的关系系数没有影响。并利用不受数据漏报影响的K值，估算出中国1990年以来的总和生育率，研究结果是官方和非官方都可以接受的生育水平。最后，文章还对今后的研究方向提出了建议。

关键词：数据漏报；总和生育率；出生率；函数关系；人口统计

一、问题的提出

出生率和生育率是反映人口生育水平的两个常用指标，出生率也称为粗出生率，它的优点是资料容易得到，能够从官方统计数据中获得，但是由于受到人口年龄构成和性别构成的影响，不能够很准确地反映生育水平，难以进行比较研究。生育率通常包括：一般生育率、分年龄生育率、终身生育率以及总和生育率等，通常所说的生育率一般都是指总和生育率。总和生育率是比出生率更好的指标，它能够准确地反映现有生育水平，避免了育龄妇女构成的影响，可以直接用于比较研究，是最具有代表性的人口统计指标，具有直观、易理解的特点。在社会相对稳定的情况下，总和生育率可反映妇女生育率变化的趋势。但是除了普查年及小普查年，人们很难获得总和生育率的数据，而官方可以通过每年一度的人口变动抽样数据估计出历年的出生率数据。如果能够建立总和生育率与出生率之间的确定函数关系，就可以利用公布的出生率数据估计每年各个地区的生育率数据。我们曾经给出过总和生育率与出生率有确定性函数关系：总和生育率(β)=出生率(CBR) /常数(K)，即β=CBR/K[1]，再根据人口统计数据估计出K值，这样如果已知出生率，就能够在K值给定的情况下估算出历年的总和生育率。

然而，自20世纪90年代以来中国出生人口漏报是一个很普遍的现象。这可能会导致对K值的估计不准确，进而会影响到使用出生率对总和生育率所进行的估计。本文的目的就是在假定出生人口存在漏报的情况下，分析漏报对K值的影响，最终来判断利用出生率来估计总和生育率的有效性[1-4]。

二、以往研究的回顾

长期以来，出生人口数据漏报一直困扰着中国的人口学者，用漏报的出生人口数据计算出来的总和生育率与出生率总是不准确的，为此，人口学者尝试着利用各种间接数据来研究中国的总和生育率和出生率。关于出生人口数据漏报对生育率影响的研究文献很多，根据数据处理方法和来源的不同，可以分为三类不同的研究。一类是假定普查数据是可信和准确的，直接利用普查数据估计总和生育率，这类得到的结果是最低的，认为自2000年以来中国的总和生育率不超过1.5[5-7]。第二类研究对普查数据提出质疑，通过各类方法调整后，再进行总和生育率的估计，由于使用的调整和估计方法不同，估计的结果也存在较大的差异，估计的总和生育率水平在1.42—1.75[8-11]。第三类研究利用教育数据、公安数据等其他系统数据来校对、调整普查数据，进而估计总和生育率，估计的生育率水平在1.6—1.7[12-14]。也有学者采用其他方法对生育率水平进行估算，比如，陈卫、杨胜慧采用布拉斯(Brass)提出的生育率间接估计P/F比值方法，对中国2010年的总和生育率进行间接估计，得到的结果为1.66[15]；陈卫、张玲玲利用普查同队列人口的比较计算，估算出2005—2010年间的生育水平基本上在1.5以上[16]。研究出生人口数据漏报的学者，主要有孙学礼和秦凯世,张广宇和原新，夏乐平,郭志刚等[12，17-19]，其中郭志刚和夏乐平具体给出了育龄妇女分年龄别的出生人口数据漏报说明和各个年龄别出生人口数据漏报的比例[12，19]。

不同于已有文献关注于调整出生人口和育龄妇女人数来估计生育水平的方法，本文通过研究在有出生人口数据漏报情况下，总和生育率与出生率确定性关系系数的稳定性，并利用不受出生人口数据漏报影响的关系系数K值，对1990年以来的中国人口生育率给予大致的估计。

三、数据和方法

1.数据来源及预处理

本研究所采用的年平均总人口数、分年龄别育龄妇女人数和每年对应的分年龄别出生人口数(活产数)取自国家统计局《中国人口年鉴》、《中国人口统计年鉴》和《中国人口和就业统计年鉴》，共获得了1986年到2015年近30年的数据。经过对数据进行处理[注]由于早期的统计数据没有经过信息化处理，不是电子数据，本文作者花费大量时间把纸质的统计数据完全电子化，为后续的研究分析创造了条件，在此要特别感谢周小青、秦雪姣同学的大力帮助。，获得了可以用来计算总和生育率与出生率函数关系系数的数据：得到分年龄别妇女人数、分年龄别活产数、年平均总人口数、分年龄别育龄妇女结构数据、分年龄别生育率数据、分年龄别标准生育模式数据。

根据上述公式，进行进一步的推导，建立K值与实际人口统计数据之间的直接关系，以便能够清楚地研究统计数据漏报对K值的影响程度：

2) 副溶血性弧菌菌落：圆形，边缘整齐，湿润，稍浑浊，半透明，多数具有尖心、斗笠装，蓝绿色菌落，直径为2～4 mm。

根据假设定义：关系系数K=出生率CBR/总和生育率TFR(β)，即：

K=CBR/β

(1)

根据出生率定义：

(2)

为了便于研究，本文把分年龄别出生人口数(活产数)漏报对K值的影响分为四种模式。

(3)

根据分年龄别生育率定义：

农业支撑着我国长久以来的发展，虽然随着科学技术的发展，农业生产更加的便利，但是种子储藏管理在农业生产管理中还是非常的重要的。种子的储藏管理技术并不是一成不变的，而是根据地区环境的不同采取更加合适的种子储藏技术，这样才能够对种子进行更好地保护。本文主要针对张家川县的地理环境的特点对当地的种子储藏管理技术进行分析与讨论。

(4)

设定标准生育模式：

(5)

根据总和生育率定义：

在“中央军入晋”一节写叶剑英施行“空城计”和打“地道战”，就属于这一类。在叶剑英的“空城计”下，一边是叶剑英指挥部队休息，“有抱着枪睡觉的，有吃干粮的，战士们嬉笑着在隐蔽处看热闹”，一边是“邢家骧举着望远镜观察，看见中弹的‘红军’都烧成了灰烬，这才发现上当了，赶紧命令停止射击……”使一愚一智两种打仗方法对比分明，也使小说增加了阅读趣味。

(6)

1.成比例漏报情况下K值的稳定性研究结果与分析

(7)

则根据上述公式可以推导出关系系数K值的计算公式：

CBR=

(8)

即：

(9)

这里，Cx表示分年龄别育龄妇女结构、hx表示标准生育模式、fx表示分年龄别生育率、x表示年龄别、Wx表示分年龄别育龄妇女人数、B表示出生人口数(活产数)、Bx表示分年龄别出生人口数(分年龄别活产数)、P表示平均总人口数、β(TFR)表示总和生育率、CBR表示粗出生率。

2.总和生育率与出生率关系系数K值的计算公式

2.固定漏报情况下K值的稳定性研究结果与分析

(10)

通过上面的公式(10)能够清楚地发现，影响K值的主要因素是分年龄别出生人口数(分年龄别活产数)、分年龄别育龄妇女人数以及平均总人口数。在计划生育政策的影响下，会出现一定程度的出生数据漏报，并可以表现为分年龄别出生人口数(分年龄别活产数)的漏报。人口漏报主要集中在0—9岁的少年儿童阶段，由于上学申报户口等原因，漏报的人口随着年龄的增长会逐步补报，而15—49岁育龄妇女漏报很少，其漏报率只有0.159%，这个漏报情况对地区育龄妇女总和生育率的影响很小，可以忽略[20]；即使在出生人口漏报严重的20世纪90年代，人口漏报也不超过10%，国家统计局对1993年和1994年人口变动情况进行了抽样调查，发现1993年和1994年人口漏报率分别为6.9%和6.4%[21]，而人口出生率漏报也多是在5%以下[22]，漏报的出生人口对总人口数量的影响微乎其微，也可以忽略。因此在数据漏报对总和生育率与出生率确定性函数关系影响研究中，不考虑分年龄别育龄妇女人数和平均总人口数这两个变量的变化[20-28]。

本文主要研究出生人口数据漏报，特别是分年龄别出生人口数(分年龄别活产数)的漏报对K值的影响。

3.研究方法

1.5 统计学方法本研究数据均采用SPSS 19.0软件进行统计分析，以±s)的形式对计量资料进行表示，采用t检验。以n和%的形式对计数资料进行表示，采用χ2检验，以P<0.05为差异有统计学意义。

出生人口数(活产数)：

(1)每个年龄别的出生人口数成比例漏报。举例说明，对15，16，…，48，49等35个育龄妇女年龄段的出生人口数(活产数)，假定每个年龄段漏报的出生人口数都具有相同的比例，比如都是30%，则每个年龄段漏报前的出生人口数(活产数)然后用漏报前的出生人口数(活产数)作为该年龄别的出生人口数(活产数)，代入K值计算公式估算K值，再对计算结果进行分析。

(2)每个年龄别漏报的出生人口数据固定。举例说明，对15，16，…，48，49等35个育龄妇女年龄段的出生人口数(活产数)，假定每个年龄段都漏报1000个活产，则每个年龄段漏报前的出生人口数(活产数)然后用漏报前的出生人口数(活产数)作为该年龄别的出生人口数(活产数)，代入K值计算公式估算K值，再对计算结果进行分析。

(3)每个年龄别漏报的出生人口数据没有规律，每个年龄别漏报人数不确定，而是随机漏报。举例说明，对15，16，17，…，48，49等35个育龄妇女年龄段的出生人口数(活产数)，假定每个年龄段漏报的出生人口数都不一样，也没有规律，假定按照随机函数RAND()的50%比例漏报，则每个年龄段漏报后的出生人口数(活产数)漏报前的出生人口数在Bx(官方公布的数据)和1.5Bx之间随机变化，(随机函数RAND()返回大于等于 0 且小于 1 的均匀分布随机实数，每次计算工作表时都将返回一个新的随机实数，这里用随机函数RAND()来产生随机数据)，然后用漏报前的出生人口数(活产数)作为该年龄别的出生人口数(活产数)，代入K值计算公式估算K值，再对计算结果进行分析。

(4)根据已有文献关于育龄妇女分年龄别出生人口漏报分布，研究出生人口漏报对K值的影响。根据文献的论述，40岁以上育龄妇女生育已经极少，因此在研究漏报对K值的影响时，这个年龄段的漏报可以忽略。15—19岁及35—49岁两个年龄段育龄妇女，占整个生育群体的比例从1980年的12%逐步减少到5%，他们对整个生育率的影响是有限的，在研究漏报对K值的影响时也不予考虑，而20—34岁是高生育率年龄段，该年龄段出生人口数据漏报对总和生育率、出生率及K值的影响最大，这个年龄段出生人口数据漏报是研究的重点。根据文献的研究结果，由于官方制定的晚婚晚育的限制，导致20岁、21岁和22岁育龄妇女出生人口漏报问题严重，漏报比例分别达到63%、28%和18%，而进入可以生育第一胎的23—26岁年龄的育龄妇女群体，漏报情况很少。进入27岁的年龄段，由于进入第二胎生育期，漏报的数据再次升高，在27—34岁的年龄段漏报的数量超过20%[12,19,24-25]。

本文首先利用已知年份的出生人口数、妇女人数和总人口数，求出官方公布数据下的K值，然后再把该年份的出生人口数作为有漏报的出生人口人数，分别采用上述四种模式的数据漏报方法获得漏报前的出生人口数，并用漏报前的出生人口数代替原来的出生人口数，利用K值计算公式分别求出四种出生人口漏报模式下的K值，再用四种漏报模式下求出的K值与官方公布的数据(有数据漏报)下求出的K值进行对比分析，研究四种出生人口数据漏报对K值的影响程度。

四、结果与讨论

在下面的讨论过程中用到的一些变量，在这里分别作如下的定义说明：Bx表示官方公布(有漏报数据)的活产数；代表每个年龄别出生人口数成比例漏报前的活产数；代表漏报了固定出生人口数前的活产数；代表随机漏报了出生人口前的活产数；代表根据已有文献漏报了出生人口前的活产数；fx表示官方公布数据情况下的分年龄别生育率；fx1表示成比例漏报下的分年龄别生育率；fx2表示固定漏报情况下的分年龄别生育率；fx3表示随机漏报下的分年龄别生育率；fx4表示根据已有文献漏报比率下的分年龄别生育率；hx表示官方公布数据下的标准生育模式；hx1表示成比例漏报下的标准生育模式；hx2表示固定漏报下的标准生育模式；hx3表示随机漏报下的标准生育模式；hx4表示根据已有文献漏报比率下的标准生育模式；K表示官方公布数据下的总和生育率与出生率关系系数；K1表示成比例漏报情况下的系数；K2表示固定漏报情况下的系数；K3表示随机漏报情况下的系数；K4表示根据已有文献漏报比率情况下的系数。

根据K值计算公式(10),在平均总人口P和分年龄别育龄妇女Wx没有漏报的情况下，即可以把公式中的P和Wx看作固定值。现在只研究出生人口数漏报，也即分年龄别出生人口数漏报对K值计算结果的影响。本文利用国家统计局《中国人口统计年鉴》和《中国人口和就业统计年鉴》获得了1986年到2015年近30年的人口统计数据，并对每一年的数据进行了分析处理。首先利用上述数据求出每一年的K值，然后，分别针对四种数据漏报模式，求出四种漏报情况下的K值，并对填补了漏报数据求出的K值与官方公布数据(有漏报数据)情况下求出的K值进行比较分析，研究数据漏报对K值的影响。通过对每一年数据的研究分析，发现每一年数据漏报对K值的影响是一致的。为了能够清楚地展示研究过程，下面以1995年和2015年两个年份的研究过程为例，展示分析出生人口数据在四种漏报模式下，数据漏报对K值的计算结果的影响。

医院发展因面临形势、政策、自身所处阶段和员工的需求而出现变化。秦环龙表示，首先，根据申康中心“转方式、调结构、转机制”的要求，他提出五个转型，但这个五个转型是有前提、有基础的，就是学科的基本实力、医院软硬件的程度、内部运行管理水平等条件成熟，转型方可开始。“如果基础很差，就转型不过去；如果拖延，就耽误时机。就是要恰到好处、恰逢其时才能顺利转型发展。”其次，“申康绩效考核就像是一个指挥棒，让院长有抓手，进而推动医院的建设和发展，绩效考核的主要内涵，落地的就是我们五个转型的内容。”再次，医院自身由原来的粗犷型发展逐步转向内涵建设发展需求。

设定分年龄别育龄妇女结构：

4.最后一旦找出潜在的解决方案，就可以商定一个结束冲突的计划，并继续推进。这个计划要尽可能圆满地完成工作，同时还要维系良好的关系。

一是进一步加强市场和疫情预警信息，引导养殖户加强生产管理，防控疫病；二是加强市场监管，打击屠宰企业压价行为，减少养殖户损失；三是推广疫病保险，减少养殖户的损失，如安华保险推出非洲猪瘟保险（育肥猪和母猪分别支付保费5元和10元/头，赔付500元和1000元）；四是强化疫区尤其是主产区屠宰能力，减缓疫情发生时出栏压力；五是完善调运监管方案，通过大区域划分等形式实现种猪和仔猪的点对点调运，保障生猪生产的稳定性。

=1 (x=15,16,…,49)

表1 1995年官方公布数据的K值计算

年龄Wx育龄妇女人数Cx人口结构系数Bx活产数fx分阶段生育率hx标准生育模式Cx X hx15942020.00762250.000265390.000185941.41636E-06…………………49574700.00465250.000435010.000304791.41636E-06合计 1.4272600310.009449001

注：1.1995年的K值=0.009449001；2.年份：1994-10-01日至1995-09-30日抽样；P(总人口数抽样)=12366955；Cx=Wx/P；fx=Bx/Wx；hx=fx/(f1+f2+…+f49)；K=sum(CxXhx)

2015年官方公布数据情况下，K值的计算过程及计算结果参见表2。

表2 2015年官方公布数据的K值计算

年龄Wx育龄妇女人数Cx人口结构系数Bx活产数fx分阶段生育率hx标准生育模式Cx X hx15976590.0045821060.00108540.001036384.749E-06…………………491811700.0085015580.003080.002940852.49994E-05合计1.04730910.007854348

注：1.2015年的K值=0.007854348；2.年份:2014-11-01日至2015-10-31日抽样；P(总人口数抽样)=21312241；Cx=Wx/P；fx=Bx/Wx；hx=fx/(f1+f2+…+f49)；K=sum(CxXhx)

1995年成比例数据漏报情况下(按照30%的漏报比例)，K值的计算过程及计算结果参见表3。

表3 1995年成比例数据漏报的K值计算

年龄Wx育龄妇女人数Cx人口结构系数 B1x活产数成比例漏报fx1hx1Cx X hx115942020.007617330.0003450030.0001859421.41636E-06…………………49574700.004647330.0005655120.0003047861.41636E-06合计 1.85543804310.009449001

注：1.1995年的K1值=0.009449001; 2.年份：1994-10-01日至1995-09-30日抽样；P(总人口数抽样)=12366955；Cx=Wx/P；fx=Bx/Wx；hx=fx/(f1+f2+…+f49)；K=sum(CxXhx)

2015年成比例数据漏报情况下(按照50%的漏报比例)，K值的计算过程及计算结果参见表4。

表4 2015年成比例数据漏报的K值计算

年龄Wx育龄妇女人数Cx人口结构系数B1x活产数成比例漏报fx1hx1Cx X hx115976590.00458231590.0016281140.0010363794.749E-06…………………491811700.00850078370.004619970.0029408512.49994E-05合计 1.57096355210.007854348

注：1.2015年的K1值=0.007854348;2.年份:2014-11-01日至2015-10-31日抽样；P(总人口数抽样)=21312241；Cx=Wx/P；fx=Bx/Wx；hx=fx/(f1+f2+…+f49)；K=sum(CxXhx)

根据表1官方公布数据的1995年K值计算过程及结果，求出的K_1995=0.009449001；根据表3成比例数据漏报的1995年K值计算过程及结果，求出的K1_1995=0.009449001；根据官方人口统计数据查到1995年的人口出生率CBR_1995=17.12(‰)，则根据总和生育率与出生率确定性函数关系公式可以得到TFR_1995=CBR/K=(17.12/0.009449001)/1000=1.811831748,TFR1_1995=CBR/K=(17.12/0.009449001)/1000=1.811831748, 可以发现TFR_1995=TFR1_1995=1.811831748，两者的结果完全一样。同样根据表2没有数据漏报的2015年K值计算过程及结果，求出的K_2015=0.007854348；根据表4成比例数据漏报的2015年K值计算过程及结果，求出的K1_2015=0.007854348；根据官方人口统计数据查到2015年的人口出生率CBR_2015=12.07(‰)，则根据总和生育率与出生率确定性函数关系公式可以得到TFR_2015=CBR/K=(12.07/0.007854348)/1000=1.536728446,TFR1_2015=CBR/K=(12.07/0.007854348)/1000=1.536728446, 可以发现TFR_2015=TFR1_2015=1.536728446，两者的结果也完全一样。因此可以得出结论，出生人口数据在每个年龄别成比例漏报的情况下，对K值计算没有任何影响。其实这个结论从K值的计算公式(10)也能清楚地得出，在式(10)中，由于Wx和P是固定值(根据前面的阐述)，则在两次K值的计算过程中，Wx和P保持不变，设定(此处C为一个比例常数)，则可以得到：

K1/K

1995年官方公布数据情况下，K值的计算过程及计算结果参见表1。

(11)

即：K1=K

因此在每个年龄别的出生人口数成比例漏报情况下，估算出的K值与官方公布数据情况下估算出的K值一样，也就是说成比例漏报对K值的结果没有影响。

(x=15,16,…,49)

金色的秋天，层林尽染，丹桂飘香，硕果累累。在群山环抱、风景如画的鞍子镇干田村7组，一张张白色的防护网罩在稻田上，村民任昌奎正手端小盆，将一碗碗饲料撒向田间。一群群黑黝黝的泥鳅不时探出头来抢食，又以极快的速度钻入水中，一派祥和、静谧、丰收、天人合一的美丽乡村自然景象。

1995年每个年龄别漏报的出生人口数为固定数值情况下(固定漏报500人数)，K值的计算过程及计算结果参见表5。

表5 1995年固定漏报人数的K值计算

年龄Wx育龄妇女人数Cx人口结构系数B2x活产数固定漏报fx2hx2Cx X hx215942020.007625250.005573130.0034394112.61988E-05…………………49574700.004655250.0091352010.0056377132.61988E-05合计 1.62037351410.009196178

注：1.1995年的K2值=0.009196178；2.年份：1994-10-01日至1995-09-30日抽样；P(总人口数抽样)=12366955；Cx=Wx/P；fx=Bx/Wx；hx=fx/(f1+f2+…+f49)；K=sum(CxXhx)

2015年每个年龄别漏报的出生人口数为固定数值情况下(固定漏报2000人数)，K值的计算过程及计算结果参见表6。

[44] US Department of State, Testimony Before the House Committee on Foreign Affairs Subcommittee on Asia and the Pacific, February 5, 2014, https://2009-2017.state.gov/p/eap/rls/rm/2014/02/221293.htm.

表6 2015年固定漏报人数的K值计算

年龄Wx育龄妇女人数Cx人口结构系数B2x活产数固定漏报fx2hx2Cx X hx215976590.004582321060.0215650.0144346.61414E-05…………………491811700.008500725580.0141190.0094518.0337E-05合计 1.4940191 0.00770434

注：1.2015年的K2值=0.00770434；2.年份:2014-11-01日至2015-10-31日抽样；P(总人口数抽样)=21312241；Cx=Wx/P；fx=Bx/Wx；hx=fx/(f1+f2+…+f49)；K=sum(CxXhx)

根据表1没有数据漏报的1995年K值计算过程及结果，求出的K_1995=0.009449001；根据表5固定漏报人数的1995年K值计算过程及结果，求出的K2_1995=0.009196178；根据官方人口统计数据查到1995年的人口出生率CBR_1995=17.12(‰)，则根据总和生育率与出生率确定性函数关系公式可以得到TFR2_1995=CBR/K=(17.12/0.009196178)/1000=1.861642956,TFR_1995=1.811831748, 求两者的差TFR_1995-TFR2_1995=-0.049811208，虽然两者的结果不完全一样，但是可以看出两者的差很小，误差在5%的置信区间内，在误差范围内可以认为两者是一样的。同样根据表2没有数据漏报的2015年K值计算过程及结果，求出的K_2015=0.007854348；根据表6固定漏报人数的2015年K值计算过程及结果，求出的K2_2015=0.00770434；根据官方人口统计数据查到2015年的人口出生率CBR_2015=12.07(‰)，则根据总和生育率与出生率确定性函数关系公式可以得到TFR2_2015=CBR/K=1.566649447,TFR_2015=1.536728446, 求两者的差TFR_2015-TFR2_2015=-0.029921001，虽然两者的结果不完全一样，但是可以看出两者的差很小，误差在5%的置信区间内，在误差范围内可以认为两者是一样的。因此可以得出结论，出生人口数据在每个年龄别漏报人数固定的情况下，对K值计算结果影响很小，可以忽略。

3.随机漏报情况下K值的稳定性研究结果与分析

1995年每个年龄别漏报的出生人口数为随机数值情况下(漏报前的活产数值的计算过程及计算结果参见表7。

表7 1995年随机漏报出生人数的K值计算

年龄Wx育龄妇女人数Cx人口结构系数 B3x活产数随机漏报fx3hx3Cx X hx315942020.00762300.00032040.00017641.34384E-06…………………49574700.00465280.00048140.00026511.2318E-06合计 1.816218310.009485175

注：1.1995年的K3值=0.009485175；2.年份：1994-10-01日至1995-09-30日抽样；P(总人口数抽样)=12366955；Cx=Wx/P；fx=Bx/Wx；hx=fx/(f1+f2+…+f49)；K=sum(CxXhx)

2015年每个年龄别漏报的出生人口数为随机数值情况下(漏报前的活产数值的计算过程及计算结果参见表8。

（3）炸类的菜品要酥，要金黄色，油不能大，不能腻。个别外焦里嫩的菜要保持好原料的水分和鲜嫩度。严格控制炸油的重复使用次数。

根据表1没有数据漏报的1995年K值计算过程及结果，求出的K_1995=0.009449001；根据表7随机漏报出生人数的1995年K值计算过程及结果，求出的K3_1995=0.009485175；根据官方人口统计数据查到1995年的人口出生率CBR_1995=17.12(‰)，则根据总和生育率与出生率确定性函数关系公式可以得到TFR3_1995=1.804921891, TFR_1995=1.811831748, 求两者的差TFR_1995 - TFR3_1995=0.006909857，虽然两者的结果不完全一样，但是可以看出两者的差很小，误差在5%的置信区间内，在误差范围内可以认为两者是一样的。

表8 2015年随机漏报人数的K值计算

年龄Wx育龄妇女人数Cx人口结构系数B3x活产数随机漏报fx3hx3Cx X hx315976590.00458231270.001300.000873.97787E-06…………………491811700.00850079540.005270.003522.99009E-05合计 1.4971010.007871837

注：1.2015年的K3值=0.007871837；2.年份:2014-11-01日至2015-10-31日抽样；P(总人口数抽样)=21312241；Cx=Wx/P；fx=Bx/Wx；hx=fx/(f1+f2+…+f3)；K=sum(Cx X hx)

同样根据表2没有数据漏报的2015年K值计算过程及其结果，求出的K_2015=0.007854348；根据表8随机漏报出生人数的2015年K值计算过程及结果，求出的K3_2015=0.007871837；根据官方人口统计数据查到2015年的人口出生率CBR_2015=12.07(‰)，则根据总和生育率与出生率确定性函数关系公式可以得到TFR3_2015=1.53331427,TFR_2015=1.536728446, 求两者的差TFR_2015 - TFR3_2015=0.003414176，虽然两者的结果不完全一样，但是可以看出两者的差很小，误差在5%的置信区间内，在误差范围内可以认为两者是一样的。因此可以得出结论，出生人口数据在每个年龄别随机漏报的情况下，对K值计算结果影响很小，可以忽略。

4.已有文献漏报情况下K值的稳定性研究结果与分析

根据已有文献研究结果，对总和生育率、出生率及K值产生影响的出生人口数据漏报，主要是20至34岁的高生育年龄段出生人口数据漏报。根据文献给出的20至34岁年龄段出生人口漏报比率，以1995年的人口统计数据作为研究数据，展示数据漏报对K值的影响。

北宋驸马王诜其交游，有米芾、苏轼兄弟、黄庭坚、李公麟等书画名家，或诗酒流连，或鉴赏书画。山谷沉浸其中，从容优游。又如其《子瞻去岁春侍立迩英子由秋冬间相继入侍作诗》：“乐天名位聊相似，却是初无富贵心。只欠小絩蛮素在，我知造物爱公深。”以白居易喻苏东坡，以白居易之小蛮、樊素调侃之。其中自有一种风流洒落。

1995年20—34岁高生育年龄段出生人口漏报估计的K值计算过程及计算结果参见表9。

表9 1995年根据文献漏报人数的K值计算

年龄Wx育龄妇女人数 Cx人口结构系数 B4x活产数文献漏报fx4hx4Cx X hx415942020.0076250.00026540.0001518311.15653E-0619890380.007232140.03609690.0206514140.00014868320962930.0078226620.23534590.1346436740.001048378221131880.0092233840.20659560.1181953690.001081778261308930.0106143370.10953220.0626644440.000663246271225270.0099130080.10616030.0607353250.00060174234666630.005410710.01606960.0091935944.95573E-0535713410.00586830.00957370.0054772283.15964E-0549574700.0046250.0004350.0002488731.15653E-06合计 1.747916510.00927879

注：1995年的K4值=0.00927879;年份：1994-10-01日至1995-09-30日抽样；P(总人口数抽样)=12366955；Cx=Wx/P；fx=Bx/Wx；hx=fx/(f1+f2+…+f49)；K=sum(Cx X hx)

根据表1没有数据漏报的1995年K值计算过程及结果，求出的K_1995=0.009449001；根据表9(为了简化表的内容，省略了部分年份数据)高生育年龄段出生人口漏报的1995年K值计算过程及结果，求出的K4_1995=0.00927879，根据官方人口统计数据查到1995年的人口出生率CBR_1995=17.12(‰)，则根据总和生育率与出生率确定性函数关系公式可以得到TFR4_1995=CBR/K=1.8450681608, TFR_1995=1.811831748, 求两者的差TFR_1995-TFR4_1995=0.0332364128，虽然两者的结果不完全一样，但是可以看出两者的差很小，误差在5%的置信区间内，在误差范围内可以认为两者是一样的。因此可以得出结论，出生人口数据在20至34岁高生育年龄段出生人口漏报的情况下，对K值计算结果影响很小，可以忽略。

5.与已有文献研究结果的比较与分析

通过上述的研究，可以得出，出生人口数据漏报对总和生育率与出生率确定性关系系数影响较小，可以忽略。这样就可以利用人口统计数据求出关系系数K值，并通过官方公布的人口出生率数据估算出每一年的生育率。

表10 1990年以来的TFR值对比

年份199019911992199319941995199619971998刘金塘(2000)2.121.971.951.911.861.841.801.75本文TFR2.2992.1201.8621.8681.7851.8111.8351.7651.723于学军(2000)2.031.821.811.811.781.801.821.85人口信息中心(2003)2.141.861.801.791.781.781.821.83王金营(2003)2.211.961.801.771.731.751.751.75夏乐平(2005)2.442.081.871.761.761.771.681.63崔红艳(2013)米红(2016)2.762.051.921.871.871.691.511.471.45赵梦晗(2015)陈卫(2015)乔晓春(2018)1.854年份199920002001200220032004200520062007刘金塘(2000)本文TFR1.7431.6631.6341.6451.6591.6621.7641.7351.723于学军(2000)人口信息中心(2003)1.751.80王金营(2003)1.721.72夏乐平(2005)崔红艳(2013)1.641.621.591.601.621.541.54米红(2016)1.391.451.411.411.401.501.52赵梦晗(2015)1.671.651.601.561.571.581.531.52陈卫(2015)1.7501.7351.717乔晓春(2018)1.7351.6631.5861.5241.7661.7491.7641.7201.722年份200820092010201120122013201420152016刘金塘(2000)本文TFR1.7141.6711.5831.4601.4901.4981.5381.5361.648于学军(2000)人口信息中心(2003)王金营(2003)夏乐平(2005)崔红艳(2013)1.541.511.50米红(2016)赵梦晗(2015)1.531.511.49陈卫(2015)1.7051.6681.5141.4671.5031.515乔晓春(2018)1.6151.5891.5831.5871.6091.5921.6311.5911.707

资料来源：引自张广宇、原新2004年研究及参考文献中各位作者的论文[4, 10-12,16, 18,26]。

表10 是本文和部分学者估算的20世纪90年代以来的总和生育率数据。可以看出，本文研究结果与多数专家的研究结果基本保持一致，也是官方和多数学者认可的生育水平。本文研究数据显示，20世纪90年代初，生育率水平已经接近更替水平，以后就逐渐下降，到世纪之交，尽管数据还保持在1.6以上，但是中国人口生育率已经很低的事实已经毋庸置疑。与官方登记的生育率数据在2005年有所升高对应的是，估算的生育率值在2005年也有所提升，达到了1.764，然后又一路下滑，到2010年降到了1.58。由于2013年末“单独二孩”和2015年末“全面两孩”政策的影响，总和生育率在2014年和2016年又出现了一波小幅反弹，到2016年上升到1.648。

五、归纳和总结

有关20世纪90年代以来中国生育水平的学术研究中，数据质量问题成为研究中国生育水平的关键问题。在众多的研究中，有关生育率水平的探讨主要通过两大类方法来处理。一类是调整出生人口数据，通过考察各类调查、普查数据之间的关系，调整、回推出生人口数据；或者利用教育、公安等其他系统数据，通过校对、调整出生人口数。另一类是采用一些对普查数据质量要求较低的计算方法，比如采用生育率间接估计的P/F比值方法、变量r方法等。

孵化器的空置率不均衡，2017年上半年个别孵化器如松山湖创新科技园空置率高达95%，中科创新广场空置率高达77.7%，这是值得关注和解决的问题。一方面说明他们对加入孵化器企业的标准高，另一方面也要注意适当对招商引资策略和方向进行调整。

不同于已有研究关注于出生人口数据质量对生育率的影响，本文从总和生育率与出生率确定性函数关系系数入手，研究出生漏报对关系系数K值的影响，研究发现数据漏报对K值的影响很小，足以忽略，从而可以利用人口统计数据求出K值，并利用官方公布的出生率估算出每年的总和生育率数据，本研究提供了一种利用人口统计数据计算生育率的新方法，可以计算出每一年的生育率数据，计算结果是官方和非官方都接受的生育水平。

K值随着时间的变化规律，以及与K值有关的标准生育模式hx的变化规律是今后需要进一步研究的问题。

3）课后复习方面，可以让学生设计思维导图来帮助他们复习所学知识，提升各方面的核心素养。在思维导图设计过程中，既可以加深重点词汇、语言点的记忆，进一步锻炼学生的语言应用能力和自主学习能力，又可以引导学生对中西方文化意识和文化差异做出正确判断，形成良好的思维方式。课后学生完成手机学习平台的作业和单元测试，检测学习效果。在完成练习过程中，学生可以随时和任课教师通过手机学习平台课程群聊、手机学习平台话题等信息化手段进行实时沟通。学生在学习平台完成单元学习效果调查问卷，进行课后反思，评估学习效果，提升自主学习能力和评估能力。

(致谢：作者感谢安徽农业大学教授徐俊博士在论文撰写过程中给予的支持！)

参考文献：

[1] 乔晓春,朱宝生.如何利用(粗)出生率来估计总和生育率？[J].人口与发展，2018(2)：65-70，100.

[2]CAMPBELLAA.Manualoffertilityanalysis[M].London:ChurchillLivingstone,1983：3-10.

[3]ENTWISLEB.CBRversusTFRincross-nationalfertility[J].Demography,1981,18(4):635-643.

[4] 佟新.人口社会学[M]. 北京：北京大学出版社，2000：63-93.

[5] 郭志刚.六普结果表明以往人口估计和预测严重失误[J].中国人口科学,2011(6): 2-13，111.

[6] 郝娟,邱长溶.2000年以来中国城乡生育水平的比较分析[J].南方人口,2011(5): 27-33.

[7] 朱勤.2000—2010年中国生育水平推算——基于“六普”数据的初步研究[J].中国人口科学,2012(4):68-77，112.

[8] 李汉东,李流.中国2000年以来生育水平估计[J].中国人口科学,2012(5):75-83，112.

[9] 王金营,戈艳霞.2010年人口普查数据质量评估以及对以往人口变动分析校正[J].人口研究,2013(1):22-33.

[10] 崔红艳,徐岚,李睿.对2010年人口普查数据准确性的估计[J]. 人口研究,2013(1):10-21.

[11] 米红,杨明旭.总和生育率、出生性别比的修正与评估研究——基于1982—2010年历次人口普查、1%抽样调查数据[J].人口与发展,2016(2):12-19.

[12] 夏乐平.1979—2000年中国人口生育趋势:出生数据和教育数据的比较分析[J].人口研究,2005(4):2-15.

[13] 杨凡,赵梦晗. 2000年以来中国人口生育水平的估计[J]. 人口研究,2013(2): 54-65.

[14] 陈卫.2000年以来中国生育水平评估[J].学海,2014(1):16-25.

[15] 陈卫,杨胜慧. 中国2010年总和生育率的再估计[J].人口研究,2014(6):16-24.

[16] 陈卫，张玲玲. 中国近期生育率的再估计[J].人口研究，2015(2): 32-39.

[17] 孙学礼，秦凯世.出生漏报的症结及建议采取的措施[J].人口与经济，1993(1):49-51.

[18] 张广宇,原新.对1990年代出生漏报和生育水平估计问题的思考[J].人口研究,2004(2):29-36.

[19] 郭志刚.再论队列平均子女数不能作为当前总和生育率的估计[J].中国人口科学，2008(5): 26-33，95.

[20] 王金营,何云艳，王志成，等.中国省级2000年育龄妇女总和生育率评估[J].人口研究，2004(2):20-28.

[21] 贾同金,赛音.人口变动情况抽样调查现状与问题分析[J].人口研究,1995(5):28-31.

[22] 周夷谷,于丽莎.出生人口数量增多是我国第三次出生高峰的主要内容——兼与查瑞传老师商榷[J].人口研究,1992(5):25-28.

[23] 乔晓春.“单独二孩”,一项失误的政策[J].人口与发展,2015(6): 2-6，18.

[24] 周皓.我国第四次人口普查漏报情况的重新估计——基于第五次人口普查的分析[J].人口研究，2003(2):36-41.

[25] 李若建.历次人口普查中低年龄组人口漏报研究[J].中山大学学报(社会科学版)，2013(2):145-152.

[26] 赵梦晗.2000—2010年中国生育水平估计[J].人口研究,2015(5):49-58.

[27] 乔晓春.实施“普遍二孩”政策后生育水平会达到多高?——兼与翟振武教授商榷[J].人口发展,2014(6):2-15.

[28] 郭志刚.中国的低生育水平及其影响因素[J].人口研究,2008(4):1-12.

TheEffectofDataLeakageontheRelationshipbetweenTotalFertilityRateandBirthRateDeterminateFunction

ZHU Baosheng1，QIAO Xiaochun2

(1. Changzhou Vocational Institute of Engineering，Changzhou 213164，China；2.Institute of Population Research，Peking University，Beijing 100871，China)

Abstract:Based on the deterministic function relationship between the total fertility rate and the birth rate, the relationship coefficients between the total fertility rate and the birth rate under four birth data leakage modes are calculated by using the National Statistical Bureau’s demographic data. Comparison to the relationship coefficient of the estimation with official publication of data(data missing), it is found that although the missing report of birth data has a significant effect on the total fertility rate and birth rate, it has little effect on the relationship coefficient between the total fertility rate and the birth rate and the impact of data leakage can be ignored. Therefore, it can be considered that the birth population data leakage exert the same influence on the total fertility rate and the birth rate, but has no effect on the relationship coefficient between the two. The total fertility rate in China since 1990 has been estimated using K values unaffected by missing data. The fertility is that both official and non-official are acceptable. Finally, the paper also puts forward some suggestions on the future research works.

Keywords:data leakage；total fertility rate；crude birth rate；function relation；demographic statistics

中图分类号：C921

文献标识码：A

文章编号：1000-4149(2019)01-0001-13

DOI：10.3969/j.issn.1000-4149.2019.01.001

收稿日期：2018-03-04；

修订日期：2018-10-02

基金项目：国家社会科学基金一般项目“生育率与出生率关系研究”(15BRK006)。

作者简介：朱宝生，常州工程职业技术学院副教授，北京大学高级访问学者；乔晓春(通讯作者)，北京大学人口研究所教授，博士生导师，中国人口学会副会长，中国人口学会人口信息和人口统计专业委员会主任。

[责任编辑方志]

标签：生育率论文; 人口论文; 数据论文; 出生率论文; 总和论文; 社会科学总论论文; 人口学论文; 世界各国人口调查及其研究论文; 《人口与经济》2019年第1期论文; 国家社会科学基金一般项目"; 生育率与出生率关系研究"; (15BRK006)论文; 常州工程职业技术学院论文; 北京大学人口研究所论文;