侯海桂:我国2000年人口普查数据修正之我见论文

侯海桂:我国2000年人口普查数据修正之我见论文

摘 要:2010年和2000年两次人口普查的年龄段数据存在多处矛盾,如2010年10~14岁年龄段人数75532610人比2000年的0~4岁年龄段的人数68978374人还要多(考虑死亡因素,2010年10~14岁年龄段人数应比2000年的0~4岁年龄段的人数少)。这些矛盾告诉我们应该是2000年的人口统计数据是有水分的。文章试图通过前后两次人口普查数据的联系,利用死亡剔除法来修正2000年人口普查数据。

关键词:人口数 人口普查 人口普查数据

在最近两次人口大普查的统计数据(见表1)中,出现了前后数据的多处矛盾。如2010年10~14岁年龄段的人数(74908462人)比2000年0~4岁年龄段的人数(68978374人)多了近8.6%,类似的情况共有5处之多(见表2)。2000年普查时的0~4岁人口,在2010年普查时正好是10~14岁年龄段,在不考虑死亡情况下,后者也不应该高于前者;况且0~4岁的死亡率是较高的,理论上后者应大大小于前者才对。另外4对年龄段矛盾的理由同样出于此。

表1

(数据摘自中国统计局网)

?

表2 2000年和2010年对应年龄段数据矛盾对比表

?

数据的矛盾,要么说明2000年人口普查的统计数据有水分,要么说明2010年的统计数据有水分。如果是2000年统计数据有水分,则问题在于少统计,如果是2010年统计数据有水分,则问题是多统计。由于瞒报、漏报或漏统计等原因,人口数据的统计,只会少统计,而不会多统计。这说明两次普查中对应年龄段前后数据的矛盾原因,肯定前面少统计,而不是后面多统计。也鉴于此,就为我们利用后面的数据去调整前面数提供了可行性。本文试图通过前后数据的联系来修正2000年人口普查的数据。

将2000—2017年公开的全部期刊数据转化成WoS数据格式导入CiteSpace软件,节点类型设置为“keyword”,时间间隔选择1年,其他都选择默认格式。运行软件进行初步分析,生成的关键词共现网有207个节点,828条连线,这导致共现网络太密集,重点不突出,故利用软件自带的网络裁剪功能,对合并后的网络进行裁剪,结果如图3所示。裁剪后的网络共有207个节点,224条连线。由图3获取了高频节点信息表格,如表4所示。

一、数据修正的可行性

要利用后面的数据调整前面的数据需要有三个假设:第一,在数据矛盾的对应年龄段中,后面的数据是正确的;第二,各年龄段的死亡率是已知的;第三,除死亡外,其他因素对人口数变动的影响程度小到可以忽略。

1914年,Kane最早将音乐疗法报道于文献[6]。由于留声机在康复病房中起到的有益作用,于是Kane将它带入了手术室,他发现几乎所有的患者都能更好地耐受麻醉诱导,并能减轻因恐惧手术导致的焦虑。随后有学者研究发现,节奏自然舒缓、平稳流畅的小调音乐可减慢脉率、降低血压,节奏强烈、变化大的刺激音乐会升高血压和心率[7-9]。而在牙科治疗过程中,无论是喧闹的音乐或是背景音乐,都有助于减少患者对止疼药的需求量。但直到二次世界大战以后,音乐疗法才正式登场,在临床开始推广应用[10]。

基于以下原因,第一个假设应该是成立的。首先,从统计手段及统计经验来看,后面的统计数据应比前面的统计数据来得可靠。其次,从瞒报或漏报的可能性来看,年纪小的人容易瞒报或漏报;年纪大的不好瞒报,也不必瞒报。瞒报的主要原因是超生,年纪小的由于未被周围人所熟知容易被瞒报,也由于未被周人所熟知,容易被居委会、村委会等机构漏报。年纪大不好瞒报是因为他(她)已经被周围的人所熟知;不必瞒报是因为他(她)需要工作。正是这第二个原因使得10年前统计时被瞒报、漏报的人,在10年后不再被瞒报和漏报。在后一次的统计(2010年普查)中可能仍有人被瞒报或漏报,但被瞒报或漏报的应集中低年龄段。也是这个原因告诉我们,2010年的统计数据中,低年龄段的统计数可能仍有水分,但高年龄段的统计数据要真实得多。

瘦客户机(thin client)与传统PC机的功能相似,不同的是瘦客户机其实就类似于一个无盘工作站,数据和应用都存储在后台服务器上。瘦客户机自身只包含嵌入式高运算处理器、本地闪存、网卡、显卡和一些常用的外设等硬件。正是由于瘦客户机硬件配置简单优质的特性和后台服务器高速运算处理能力,才使得瘦客户机能够快速替代传统PC机得以推广应用。目前,瘦客户机作为服务器客户终端被应用在教育、政务、医疗等多个领域中,多媒体教学和计算机实训教室的应用是高校云终端最主流的应用场景。

通过前面的分析,笔者认为对应年龄段的同一批人(如2000年0~4岁年龄段人口和2010年10~14岁年龄段人口是同一批),十年前和十年后的差异主要受死亡因素影响,将时间拆碎后就是上一年份的人口数乘以该年龄段的存活率(1~死亡率)后等于后一年份的同一批人口数。如2000年0~4年龄段人口数乘以该年龄段的存活率(1-8.63‰)后就等于2001年的1~5年龄段的人口数。如此连续计算十次,就可得到2010年10~14年龄段的人口数。

花鸟画最早可以追溯到原始社会时期,发展至两汉时期,花鸟画已经初具雏形。东晋画家谢赫凭借其作品《画品》成为中国绘画史上第一位有迹可循的花鸟画家。随着唐朝,宋朝的国家经济发展日趋繁荣,国泰民安,在艺术文化领域夜呈现一派欣欣向荣的景象,花鸟画在这一时期也渐渐发展成熟。元朝时期出现了一些以“水墨梅竹”为主要绘画对象的画家。明朝则是以徐渭和陈道复的花鸟作品见著,清代则是出现了笔墨独具风格的画家,如“八大山人”等。发展至现代,花鸟画在绘画领域的总体发展平平,但是不可否认的是,在花鸟画的不同风格都各有成者,他们为花鸟画的未来发展注入了新的力量。

我们已知的死亡率并非每1岁年龄的死亡率,而是5岁为一个年龄段的死亡率。每过一年后,原年龄段死亡率就不再适用。如0~4岁年龄段的死亡率是8.63‰,但过1年后,原0~4岁年龄段将变成1~5岁年龄段,1~5岁年龄段的死亡率当然就不再是8.63‰了。为了利用2010年的数据还原2000年数据,我们需要计算连续年龄段的死亡率(见表4)。具体做法是,根据已知的年龄段死亡率(表3),通过加权算术平均法计算连续年龄段的死亡率(见表4)。由于需要修正的数据全部集中在低年龄段,因此表4仅计算了部分年龄段的死亡率。具体算方法是以新年龄段交已知死亡率年龄段的年数为权数,结合已知年龄段的死亡率,用加权算术平均法来计算新年龄段的死亡率。如1~5年龄段交已知死亡率的0~4年龄段4年,交已知死亡率的5~9年龄段1年,则1~5年龄段的死亡率计算过程如下:

表3

(摘自《CEC中国市场营销环境年鉴1998》)

?

表4

?

既然我们假定2010年的数据是正确的,我们就可以通过剔除死亡因素的方法来修正2000年的人口统计数据。根据上述同一批人前后数据的关系,我们可得到以下数据还原公式:

通过以上分析,笔者认为,根据2010年人口普查数据和适当的数学方法修正我国2000年的人口普查数据的做法是可行的。

第三个假设是最有理由成立的。国家统计局没有提供相关我国公民外迁及外国人加入我国国籍的相关数据,说明这个数据就非常小。新浪新闻在2006年8月23日有一篇题为《中国人移居国外世界第一》的报道称:中国每年净移出56万人。56万的数字,相对于中国人口数来说确实是微乎其微的,再分摊到不同年龄段后更是小到不必理会了。

二、修正方法及修正结果

在现有条件下,第二个假设也是成立的。《CEC中国市场营销环境年鉴1998》发表过一次1997年中国分年龄段人口死亡率统计数据(见表3)。我国历年的死亡率变化本来就不大,该数据的发表年份离两次大普查时间距离不算远,在很大程度上应可代表2000年到2010年间各年龄段的死亡率。

1~5年龄段死亡率=

式中N00(i,i+4)代表2000年度第i到第i+4年龄段的修正人数,其中i=0,5,10,15…,是年龄段的下限;式中N10(i+10,+14)代表2010年第i+10到第i+14年龄段的实际人数(具体数据见表1),i的意义与前述相同;式中S(k)表示以k为下限的第k到第k+4年龄段的死亡率(具体数据见表4),另外k还是表4中的序号。

例:2000年15~19年龄段的修正数计算如下:=102151202人

利用上述公式对2000年数据进行修正时,若出现修正数小于原数时应保留原数,说明该年龄段没有漏统计情况。比如说2000年15~19年龄段修正数计算结果为102151202人,比原15~19岁年龄段的实际统计人数103031165人为少,应保留原数。根据此原则,修正后的2000年全国人口数应为1270660508人,比修正前人数高出2.257%。各年龄段具体修正结果如表5。

表5

?

三、本文的缺陷

本文的修正是建立在假定基础之上的,从文中的分析来看,这些假定应该是成立的,但其在多大程度上成立,本文仅作抛砖引玉之意。

中图分类号:F22

文献标识码:A

文章编号:1004-4914(2019)07-230-02

(作者单位:广东理工学院 广东肇庆 526114)

[作者简介:侯海桂,统计高级讲师、统计师,统计专业本科学历,广东理工学院教师。]

(责编:贾伟)

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

侯海桂:我国2000年人口普查数据修正之我见论文
下载Doc文档

猜你喜欢