摘 要:新兴大数据反映了人、物、信息在空间上的流动和聚集,体现了社会经济要素的动态分布和相互关系。结合自然资源部下达的2018年国家地理国情监测项目“武汉市大数据城市空间格局变化监测试点”,创新开展了“地理国情+大数据”融合研究,从城际人口流动和城市人口分布2个方面开展了武汉市人口空间格局识别,揭示了武汉市对外人口流动规模和方向,城市内部居住和就业人口分布的圈层差异、人地关系和跨江出行特征。
关键词:手机信令;百度热力;城际人口流动;城市人口分布
传统人口领域研究中,数据源主要包括人口普查统计数据、人流量观测统计数据、交通调查数据、高分辨率遥感数据等,存在更新时效慢、空间粒度粗、获取成本高等特点。传统研究内容主要聚焦在人口的时空分布[1-3]、迁移模式[4]、演变机制[5]、影响因素[6]和模拟预测[7]等方面。随着新兴网络技术的发展,以腾讯位置、手机信令、百度热力等数据为代表的新兴大数据以其时效性高、空间粒度细、人力成本低等优势弥补了传统人口数据的缺陷,为多尺度、高精度的人口格局识别与分析提供了可靠的数据来源和崭新的技术思路。基于新兴大数据的人口研究侧重于对人口迁徙[8]、集聚区分布[9]、职住关系[10-11]、交通通勤行为[12-13]、消费行为[14]、活动模式[15]的识别,以及人口分布与产业、用地等相关要素之间的耦合关系研究[16]等方面。
本文以武汉市为例,利用腾讯位置大数据,从人口流入与流出、人口腹地范围等方面开展城际间人口流动分析。基于联通手机信令、百度热力数据,在交叉验证的基础上,识别城市居住与就业人口分布,进行了分圈层、分三镇、分区域的多尺度人口格局研究,并从人地关系视角分析了居住人口与城镇综合功能单元的关系以及跨江流动特征。
1 数据处理及研究方法
1.1 数据获取
本文获取的新兴大数据主要包括腾讯位置大数据、联通手机信令数据和百度热力数据。
腾讯位置数据基于腾讯地图定位,每5min更新一次,几乎覆盖全球范围内智能手机中 QQ、微信以及滴滴出行等多种应用的用户定位信息,能反映每日实时人口流动情况。本文通过聚合分析,获取了2018-02-01~2018-02-15(腊月十六—腊月三十)武汉与全国地级以上城市和省直辖行政单位间的每日人口出入总量数据。
联通手机信令数据源于智慧足迹大数据,主要涵盖中国联通2G/3G/4G用户的日常信令数据。经过智慧足迹SmartSteps(SS)联通手机信令大数据平台处理后得到分辨率为250 m的人口格网数据(包含居住、就业等类型),时点为2018年6月,其中居住人口判断规则为:①居住地观测时段为21:00到次日8:00;②用户每日在观测时间段内被观测到的秒数,进行月度累加,并进行排名,取排名最高的为用户的居住地;③一个月内工作日出现天数超过10 d。就业人口判断规则为:①就业地观测时段为9:00到17:00;②用户工作日在观测时间段内被观测到的秒数,进行月度累加,并进行排名,取排名最高的为用户的就业地;③年龄段在16~64岁;④一个月内工作日出现天数超过10 d,百度热力大数据,源于百度用户定位信息数据,是由百度大数据平台聚合所得的分辨率为250 m的人口格网数据(包含居住、就业等类型),时间为2018年6月。
1.2 数据预处理
截至2017年底,全市农村承包耕地流转面积4万亩,占承包耕地总面积的38%;近两年来,土地流转速度明显加快,流转比例提高幅度逐年扩大,2016年提高3.1%,2017年提高4.2%,有的地方还实现了土地流转整村推进。
将联通手机信令和百度热力的250 m格网数据聚合至社区单元,以社区人口统计数据为检验依据,分别进行k-s检验,结果如表1所示。2套大数据的双侧显著性均小于0.10,说明均不符合正太分布,因此采用Spearman相关系数检验大数据人口与真实社区人口的相关性和可靠性。如表2、3所示,2套数据检验所得Spearman相关系数分别为0.565和0.608,与真实社区人口的相关性都较为显著,说明联通手机信令和百度热力数据统计结果可信,可用于人口格局的识别研究。
表1 联通手机信令与百度人口单样本Kolmogorov-Smirnov检验
联通手机信令人口 百度热力人口N 3 357 3 357正态参数a,b 均值 1 837.246 6 7 510.269 9标准差 4 474.583 7 16 578.097 6最极端差别绝对值 0.341 0.325正0.296 0.270负-0.341 -0.325 Kolmogorov-SmirnovZ 0.341 0.325渐近显著性(双侧) 0.000 0.000
表2 联通手机信令数据Spearman相关系数
联通手机信令人口 实际结果联通手机信令人口Spearman相关系数相关系数 1.000 0.565**Sig.(双侧) . 0.000 N 3 357 3 357相关系数 0.565** 1.00 0 Sig.(双侧) 0.000 .N 3 357 3 357**.在置信度(双测)为0.01时,相关性是显著的。社区人口
表3 百度热力数据Spearman相关系数
百度热力人口 实际结果百度热力人口Spearman相关系数相关系数 1.00 0 0.608**Sig.(双侧) . 0.000 N 3 357 3 357相关系数 0.608** 1.000 Sig.(双侧) 0.000 .N 3 357 3 357**.在置信度(双测)为0.01时,相关性是显著的。社区人口
1.3 研究模型与方法
1.3.1 势力范围模型
Studies on tourism development planning of traditional village---A case of Xisanduhe village in Laixi City
在特定时段内,城市之间的人流从侧面表征了中心城市对边缘城市的影响能力,也体现了边缘城市对中心城市的依赖程度,一般采用势力范围模型识别中心城市的人口腹地范围。例如,春节前,中心城市的人口会向其人口腹地流出,而在春节后又会流回中心城市;在十一黄金周节假日前期,游客从居住城市涌向旅游目的地,而后又回到居住的城市。通常基于绝对流入指数、相对流入指数和竞争流入指数3个指标描述城市A和B之间的人口流动。
绝对流入指数,即特定时间内从城市A流入城市B的人口总量。
相对流入指数,即特定时间内从城市A流入B的人口总量占流入城市B的人口总量比例。
式中,{Bi|i∈[1,N]∩N+}为除城市A以外其他城市构成的集合。
1.3.2 核密度
根据耦合度和协调度的计算值并采用均匀分布函数法,参考王坤等的研究结果[4],将耦合协调发展情况进行类型划分.耦合度可划分为4种类型:0≤C≤0.3,说明城镇化和旅游经济之间是低水平耦合阶段;0.3
式中,{Bi|i∈[1,M]∩N+}为所有中心城市构成的集合。
当FCompetetiv(eA→ B)> 0. 6时,表示来自城市A的跨城出行过半前往城市B,说明城市A处于城市B的紧密影响区;当FCompetetiv(eA→ B)∈(0 .4, 0 .6]时,表示城市A处于城市B的次紧密影响区;当FCompetetiv(eA→ B)≤ 0. 4时,说明城市A处于城市B的边缘影响区。
2、亲子游戏:将软垫子铺在地上,把镜子和小玩具也放在垫子上,然后让宝宝舒服地趴在垫子上的镜子前,此时宝宝会很自然地被漂亮的小玩具和镜子里的自己的样子吸引。在好奇心驱动下,宝宝往往会非常专注地盯着镜子里自己的样子看啊看,如果看累了,他会自己爬过去拿玩具玩,如此反复;如果宝宝还不会爬,也应坚持做这样的小游戏,能够促进宝宝爬行。
核密度估计(KED)是研究城市热点常用的一种基于密度的空间点模式非参数估计方法,它是根据已有点要素估计未知点要素的密度函数。核密度值随离中心点距离的变化而变化,离中心点越近,密度值越大;离中心点越远密度越小;当距离等于带宽r时密度为零。核密度的计算公式为:
式中,oi表示研究点i的核密度;Kj为研究点j的权重值;dij为空间点i与研究对象j的距离;r为带宽;n为带宽r范围内研究对象j的个数;在带宽r范围内,研究点j的权重值jK相同。
从环线分布看,全市居住和就业人口密度沿环线从中心向外逐级递减(如图4所示),但二环至三环内居住与就业总人口占比最高(如图5所示)。后湖、四新、杨春湖、南湖、白沙洲等区域逐步形成居住新组团,位于近郊的东湖高新区、经济开发区等已形成就业次中心。
渐渐地,安吉的朋友越来越多。回忆起小象安琪儿时,安吉不再哭泣了。代替悲伤的,是一种淡淡的幸福,那是只属于他和小象的回忆。
热点区域是由高值对象在局部空间内频繁聚集出现形成。冷热点分析常采用局部Getis-OrdG*指数法,用来检验局部区域是否存在统计显著的高值和低值,采用可视化的方法显示热点区域和冷点区域。热点分析的显著性Z得分计算公式为:
根据相关实验证明,变频器的使用寿命是和温度有关的,所处环境温度的升高会对变频器的使用寿命有很大的损害。所以,在日常的使用时要定期对变频器进行检修。可以从以下方面着手:
对(d)进行标准化处理得:
式中,E()和Var()分别是的数学期望和方差;Wij是空间权重;若Z()为正,且数值高,表明i周围的值较高,属于空间集聚区域,即为热点区域;反之,若Z()为负,表明i周围的值比较低,属于低空间集聚区域,即为冷点区域。Z()得分越高,热点的集聚就越紧密;Z()得分越低,冷点的聚类就越紧密。
回到乌鲁木齐,吃到盖在棉被里出售的苹果和西红柿,洗到20天以来的第一个热水澡,每个人都泡到浑身起皱,感觉幸福得像做梦一样。
2 研究成果
2.1 城际人口流动
根据春节前腾讯位置大数据,识别春节前夕离汉与来汉人口的出行规律,近似反映城际之间的人口流动状况。
基于核密度法和热点分析法开展了居住和就业人口的热点区域识别。
从全国层面看,春节前夕离开武汉市的人口主要前往湖北、四川、重庆、云南和辽宁,如图1所示。其中,前往长江经济带区域的占比近72%,前往湖北省内其他城市的占比约为58%。从省内来看,接近2/3去往“1+8”城市圈内其他城市,前往孝感、黄冈两市的占比近20%。
图1 2018年春节前夕离汉人口分布及排名前20位城市统计图
春节前夕来武汉市的人口主要来自北京、深圳、广东、上海等一线城市(如图2所示),总占比达四成,4个城市的占比分别约为13%、11%、9%、6%。
其中,ω1和ω2是权重,和是剔除第k个变量XK和YK后计算的NWE。此处,ω1和ω2也可以选用Y和X得样本标准差的倒数来表示。
图2 2018年春节前夕来汉人口分布及统计图
根据春节前夕的人口出行数据和势力范围模型推算武汉对湖北省内城市的人口吸引程度。从腹地范围看,武汉市人口腹地主要为湖北省内,与鄂、孝、黄、黄联系紧密,略向河南信阳、驻马店延伸,如图3所示。从省内来看,“1+8”城市圈及荆门流出到重点城市的人口有40%以上流入武汉,其中鄂州流出人口有70%流入武汉;恩施、宜昌流出重点城市的人口中只有不到30%来到武汉,受重庆吸引较强。
(2)建立最小聚类单元的边界点位置矢量I。文中定义最小聚类单元是算法搜索时的最小单位,它可以是集合Li或者单个构件。在同一个最小聚类单元中的构件,聚类过程中始终保持在同一个模块中。边界点位置矢量记录了最小聚类单元边界点在染色体中的位置。例如,图3中边界点对应的位置矢量为I=(1,2,5,7,8,9,10,11)。该矢量用在优化算法中,作为搜索最小聚类单元的索引地址。
2.2 城市人口分布
利用2018年6月联通手机信令和百度热力等大数据,识别了居住和就业人口,重新认知了城市内部人口的分布格局。
2.2.1 圈层分布
1.3.3 热点分析(Getis-OrdG*)
竞争流入指数,即特定时间内从某一中心城市流入该城市的总量占来自其他重点城市流入该城市的总量比例。
图3 2018年武汉市人口腹地分布图
图4 武汉市居住和就业人口密度分布图
图5 武汉市各环线居住和就业人口密度与占比统计图
2.2.2 热点区域分析
由于联通手机信令和百度热力数据均具有样本有偏性,因此本文结合社区人口统计数据,对2套大数据开展交叉验证和可靠性分析。
歌手陈奕迅年初参加某活动,一个粉丝高呼“游泳健身要不要了解一下”,现场画风特别喜感。正是如此,这句话渐飙升成为当下最恶毒又带点玩笑口吻的问候,比如吐槽别人太瘦了你可以说汉堡奶茶了解一下、吐槽青蛙旅行不听话的呱儿子你可以说干锅牛蛙了解一下等等。
从区域分布看,中心城区中,江汉区的居住、就业人口密度处于全市最高水平;硚口区、武昌区次之,且与江汉区差异较小;青山区居住、就业人口密度相对较低。功能区和新城区中,东湖高新区和东西湖区由于临近中心城区、交通较为发达,居住、就业人口密度远高于同圈层内其他区域。
从街道分布看,居住人口密度在50 000人/km2以上的街道有11个;就业人口密度在30 000人/km2以上的街道有9个,均集中分布于江汉区、江岸区和硚口区。
从热点区域分布看,如图6所示,①居住人口:江汉区、硚口区、武昌区拥有大量居住人口显著聚集区域,占各区面积的50%~80%;江岸区、洪山区和汉阳区的居住人口集聚现象也较为显著,比例大于各区总面积的10%。②就业人口:江汉区就业人口显著集聚区面积占比最高,超过85%;其次是硚口区、武昌区,占比均超过五成;东湖高新区就业人口集聚现象也较为显著,但集中在三环以内。③居住与就业人口:江汉区、硚口区、武昌区的居住与就业人口热点区域面积比总和超过100%,具有居住用地与就业用地功能交叉的特征。
图6 武汉市各街道居住和就业人口密度三维分布图
2.2.3 人地关系分析
如图7所示,从“人地关系”视角看,全市居住小区只承载了约60%的居住人口,其次以大型机关、高等院校为主的单位院落承载了超30%的居住人口,还有部分居住人口分布于其他功能单元。
本文设计了基于红外视觉的智能装甑撒料区域的实时检测算法,但是并不是任何的装甑酿酒系统都可以适用,因为它十分有助于提高甑桶的出酒效率,但是当对出酒质量有较高要求时,需要做到不同酒品不同装甑方式具体对待,故而难以与有经验的“老师傅”装甑出酒的品质相比较.但是在减少人员劳动量和提高产量上,使用红外相机作为“眼睛”指引装甑机器进行装甑操作,在未来还有很大的期待.相信随着研究的不断深入,智能装甑系统在酒的酿造中将会得到更加广泛的应用,进一步推动酿酒生产的标准化、智能化.
图7 武汉市不同城镇综合功能单元上居住人口热点集聚地分布与统计图
2.2.4 三镇分布及跨江流动分析
从三镇分布看,武昌、汉口、汉阳三镇居住人口占比分别约为26%、20%和8%;东湖高新区占比超10%;经济开发区(汉南区)占比超4%。武昌、汉口、汉阳三镇就业人口占比分别约为26%、22%和7%;东湖高新区占比超12%;经济开发区(汉南区)占比近5%。其中,东湖高新区居住和就业人口占比均超过10%,远远高于常住人口统计结果,人口聚集程度和经济活力凸显。
由于武汉两江三镇的特殊地理形态,跨江出行是居民生活中不可或缺的一个出行特征。如图8所示,从三镇跨江流动看,武昌-汉口、汉口-汉阳、汉阳-武昌日均双向累计出行人次比例约为6∶3∶2,武昌和汉口联系紧密,出行人次占总跨江出行人次的50%以上。
图8 武汉三镇居民跨江出行比例图
3 结 语
本文基于腾讯位置大数据、联通手机信令和百度热力数据,识别了武汉市对外人口流动规模和方向。结果表明,春节前夕离开武汉市的人口近六成去往湖北省内,来武汉市的人口近四成来源于北上广深等一线城市。重新认知了武汉市居住和就业人口格局及职住通勤关系,发现武昌居住和就业人口均超过汉口,武昌-汉口跨江出行人次超过50%,东湖高新区的居住和就业人口占比均超过常住人口统计数据,人口集聚活力凸显。
本研究验证和解释了武汉市人口分布和流动特征,但由于大数据时间和空间粒度的局限性,还缺乏对城际之间、城市内部人口流动轨迹、出行目的、交通方式等的深入研究。下一步将深入挖掘大数据的过程轨迹和标签特征,深度刻画城际之间、城市内部人口分布和流动的时空动态特征,并加强交叉验证,克服大数据的有偏性。通过“地理国情+大数据”融合研究,推动地理国情监测从土地利用扩展到社会经济活动、从静态专业工作走向动态大众生活、从对地观测走向对人观测。
参考文献
[1]柏中强,王卷乐,杨雅萍,等.基于乡镇尺度的中国25省区人口分布特征及影响因素[J].地理学报, 2015,70(8):1 229-1 242
[2]胡曾曾,赵志龙,张贵祥.非首都功能疏解背景下北京市人口空间分布形态模拟[J].地球信息科学学报, 2018,20(2):205-216
[3]赵利利, 孟芬, 马才学. 基于多源遥感数据的武汉市人口空间分布格局演化[J]. 地域研究与开发, 2016,35(3):165-169
[4]李扬,刘慧,汤青. 1985~2010年中国省际人口迁移时空格局特征. 地理研究, 2015,34(6):1 135-1 148
[5]牟宇峰.长三角核心区就业人口格局演变研究[J].地理与地理信息科学, 2014,30(1):70-75
[6]田燕, 余东航, 孙小虎. 武汉轨道交通对城市空间形态与人口密度变化的影响研究[J]. 城市建筑, 2017(14):17-20
[7]林文棋,陈会宴,谢盼,等.基于多源数据的北京市朝阳区人口时空格局评估与预测[J].地球信息科学学报, 2018,20(10):1 467-1 477
[8]李原.贝叶斯层次时空模型在省际人口流入分析中的应用[J].统计与决策, 2018(6):73-77
[9]Deville P, Linard C, Martin S, et al. Dynamic Population Mapping Using Mobile Phone Data[J]. Proceedings of the National Academy of Sciences,2014,111(45):15 888-15 893
[10]钮心毅,丁亮.利用手机数据分析上海市域的职住空间关系——若干结论和讨论[J].上海城市规划, 2015(2):39-43
[11]张天然.基于手机信令数据的上海市域职住空间分析[J].城市交通, 2016,14(1):15-23
[12]丁亮, 钮心毅, 宋小冬. 利用手机数据识别上海中心城的通勤区[J].城市规划, 2015,39(9): 100-106
[13]张维. 基于手机定位数据的城市居民出行特征提取方法研究[D].南京:东南大学, 2015
[14]钟炜菁,王德,谢栋灿,等.上海市人口分布与空间活动的动态特征研究——基于手机信令数据的探索[J].地理研究,2017,36(5):972-984
[15]曹劲舟,涂伟,李清泉,等.基于大规模手机定位数据的群体活动时空特征分析[J].地球信息科学学报, 2017,19(4):467-474
[16]刘鹏程. 基于“人、地、业”视角下的城市空间簇群特征及耦合研究[D]. 南京:东南大学, 2016
中图分类号:P208
文献标志码:B
文章编号:1672-4623(2019)10-0001-06
doi:10.3969/j.issn.1672-4623.2019.10.001
收稿日期:2019-06-06。
项目来源:自然资源部地球观测与时空信息科学重点实验室经费资助项目(201903)。
第一作者简介:罗名海,博士,正高职高级工程师,主要从事地理国情监测与大数据研究工作。
标签:人口论文; 数据论文; 城市论文; 武汉市论文; 热点论文; 社会科学总论论文; 人口学论文; 世界各国人口调查及其研究论文; 《地理空间信息》2019年第10期论文; 自然资源部地球观测与时空信息科学重点实验室经费资助项目(201903)论文; 武汉市测绘研究院论文; 武汉大学论文;