郭长帅:基于数据挖掘算法的流动人口定居意愿研究论文

郭长帅:基于数据挖掘算法的流动人口定居意愿研究论文

[摘要]通过评估5种数据挖掘、机器学习算法,选出评估效果最好的算法模型,对流动人口的定居意愿进行研究和分析。研究发现,定居意愿更多的受到工作收入与生活成本的约束。低学历者在流入地定居为工作机会导向,高学历者定居为收入导向。

[关键词]流动人口;定居意愿;数据挖掘

一、 背 景

近年来中国经济增速逐渐放缓,根据国家统计局的统计,GDP同比增速从2007年14.2%的高点逐渐降低至2018年的6.6%。关于中国经济增速放缓的原因,学术界亦有所争论。其中的一个重要观点即是资源的空间错配导致了中国经济增长速度的下滑[1]。根据索洛模型中的生产函数,对于特定的经济体,长期经济增长的动力来自于技术进步、劳动力的增长以及资本的增长。若将中国不同的区域视为不同的经济体,则人口在不同区域间的流动将导致劳动力资源的变化,其本质是劳动力在空间上的重新分配。从微观个体角度,人口流动是为了获得更好的发展机会或取得更高的劳动报酬。这个过程也将改进劳动力资源配置的效率。然而由于中国的特定历史遗留问题、复杂的人口管理政策以及各种行政力量的存在,人口流动并不是处于完全的自由状态,由此导致了经济资源的空间分布和人口的空间分布存在扭曲。横向来看,在世界范围内,经济发展或增长方式的转变,往往带动人口流动特点的转变。以美国为例,根据美国人口调查局的统计,铁锈地带*主要由美国中西部和五大湖地区等工业衰退的地方组成,包括纽约州西部、宾夕法尼亚州、西弗吉尼亚州、俄亥俄州、印第安纳州、密歇根州下半岛、伊利诺伊州北部、爱荷华州东部和威斯康星州东南部。1850—1970年人口从1 023万快速增至7 203万,人口增量贡献达34%,成为人口聚集的核心。20世纪1970年代开始,伴随着传统制造业的衰落,以及先进制造和现代服务业的崛起,铁锈地带人口增幅逐渐下降,加利福尼亚州、德克萨斯州、佛罗里达州等地区成为新的人口聚集中心。1970—2017年,上述三个州人口增量贡献高达41.7%。纵向来看,根据国家统计局的统计,1978—2010年中国城市化率从17.9%快速提升至49.9%,数亿人从乡村进入城市。大量人口从中西部向珠三角、长三角以及京津流动。在此背景下,对人口流动的研究是当前经济学研究的热点问题。

按照是否在流入地定居,流动人口可以分为两种,一种是定居于流入地,另一种是在经济相对发达的地区获取较好的就业机会或较高的收入,但不在流入地定居,而是往返于流出地与流入地之间。流动人口的迁移或定居具有以下特点:第一,根据《2015年全国流动人口动态监测调查》,被调查流动人口中84%是农业户口,农村人口在城市定居是城镇化的进程,因此定居意愿的情况是进一步认识城镇化进程的一个窗口[2]。第二,人口迁移定居关系到房产政策调控、学籍改革、高铁网络建设、医保异地结算等国计民生的大问题,分析定居意愿的影响因素有利于给上述问题的政策制定提供有效指导。第三,分析定居意愿有助于理解人口迁移定居的过程中涉及到社会融入、文化认同甚至地域歧视、语言歧视以及其他社会矛盾等社会敏感问题。因此,明白影响流动人口定居意愿的因素,对于理解劳动力资源的空间配置,进而理解中国当前经济效率问题提供了提供了良好的视角。

二、 关于流动人口的定居意愿的文献综述与研究假设

当前已有的关于流动人口定居意愿的研究,对其影响因素做出了较为广泛的研究。关于个人及家庭因素因素对于流动人口定居意愿的影响,王玉君[3]认为,受教育时间越长、未婚以及配偶或恋人在同一个城市的农民工,有更加强烈的意愿在城市定居。王伟等[4]用交互分类比较以及Logistic回归模型,分析了三四线城市新生代农民工定居意愿的影响因素及机制,其模型计算结果表明青壮年、已婚的新生代农民工定居意愿较强。Fokkema和Haas[5]研究了西班牙的摩洛哥和塞内加尔移民,以及意大利的埃及和加纳移民,其结果发现移民之前受过良好教育、了解当地情况的年轻移民展现出更强烈的定居意愿和更高水平的社会融合。关于社会因素对于流动人口定居意愿的影响,李振刚[6]对新生代农民工居留意愿的影响因素进行了实证研究,结果表明社会文化融合对居留意愿有较为显著的影响;且流动的距离也对新生代农民是否愿意定居于流入地有显著影响。刘于琪等[7]对广州、东莞、沈阳、成都、杭州、郑州6城市新移民进行了问卷调查,以研究中国城市新移民的定居意愿,其研究表明影响新移民是否愿意定居于流入地主要因素包括户籍因素、社会网络、社会认同、城市生活评价和地理因素。卜庆国[8]通过调查问卷和实地访谈的形式对郑州市新生代农民工进行调研并运用随机森林模型,分析了影响郑州市新生代农民工留城意愿的特征和因素结果表明在城市居住的时间长短能够显著的影响流动人口的定居意愿。关于经济因素对于流动人口定居意愿的影响,郭云贵等[9]分析了2013年全国流动人口动态监测数据并得出结论:流动人口定居于流入地意愿普遍不高且内部差异大;其决定受到职业类别、行业、就业、工作年限、个人收入、家庭收入、劳动合同类型等因素的影响。Newbold[10]通过对1981年加拿大人口普查微观数据的研究发现,省际的人口流动对于省和省之间的经济形势和就业机会比较敏感。

也有一些研究将流动人口的定居意愿与特定的政策或区域经济背景相结合,侯慧丽[11]通过研究北京市流动人口定居意愿发现,北京市产业疏解的政策与流动人口定居意愿存在背离。被疏解的产业其流动人口在主观上更加倾向于留在北京,这对北京市的产业疏解实施造成了障碍。蔡翼飞和张车伟[12]的研究表明,经济发展过程中,人口与产业的不匹配呈现出先升后降的趋势。

现有文献对于定居意愿的研究范围在不断拓展,研究深度也在不断深入,它们对本文的研究提供了有益的参考,但是在以下几点存在可以改进的地方,第一,研究的数据来源局限于单一的数据库,这样研究的因素较为局限,难以形成完整的体系;第二,研究的方法有待丰富,已有的文献大部分采用Logit模型对流动人口定居意愿进行回归分析,随着机器学习、数据挖掘的不断发展,一些前沿的集成算法可以被应用于该领域,以充分利用数据提高模型精度;第三,现有文献较少对不同受教育程度的流动人口进行研究,不同低受教育程度的人口流动至流入地的目的可能是迥异的[13],各城市针对不同学历的外来人口制定的落户门槛也是不同的,因而不同受教育程度的流动人口有着较强的异质性,显然将它们区分开来研究更有意义。

本文试图在以下三个方面有所贡献,第一,研究数据上,本文综合了2015年全国流动人口动态监测数据、《中国城市统计年鉴(2015)》、《中国社会统计年鉴(2015)》三个数据库来构建个人和城市层面的影响因素,务求在本文的一系列假设基础上涵盖所考虑的全部因素;第二,量化分析方法上,本文在传统的逻辑回归模型基础上,使用了决策树模型、随机森林模型、梯度提升决策树分类模型、LightGBM等机器学习、数据挖掘领域的常用和前沿的集成算法,对上述模型效果进行评价并选出效果最好的LightGBM模型对流动人口的定居意愿进行深入研究;第三,对不同的受教育程度的流动人口做进一步深度的研究,分析不同受教育程度的流动人口在定居意愿方面的异同点以及背后的经济学含义。本文是对人口流动方面研究的有益补充。

三、 假设与模型

(一)假设

根据微观经济学的观点,理性行为人的决策主要由其无差异曲线和约束曲线决定。对于流动人口的定居意愿,影响其偏好的因素涵盖了自身人生规划、婚姻状态、在流入地人脉以及流入地的发达水平、城市规模、基础设施、环境、文化、医疗、教育以及未来发展等诸多因素,其约束曲线主要由劳动收入、生活成本以及家庭财富所决定。

基于此,本文提出以下假设。

利用LightGBM模型对所有样本进行回归,得出个人层面和城市层面的特征重要性如图3。

假设二:经济发展水平、城市规模、习俗、医疗设施、教育条件等诸多城市层面的因素影响流动人口对其偏好。

个人因素中,定居意愿最重要的影响因素是在流入地居住的时间。根据前文的假设,在流入地的时间会影响流动人口对城市的偏好,随着在城市居住时间的增加,一个人对城市环境的了解,对于城市融入的加深,在城市中人脉资源的增加都会增加流动人口对流入地的感情,影响个人偏好。因为这种感情随时间增加,和受教育程度无直接关系,因此无论何种受教育程度,流动时间对定居意愿的影响程度变化都不大。

假设三:对于城市的定居意愿受到自身收入、生活成本、家庭财富、流动距离以及落户门槛的约束。买房是大多数中国人的人生头等大事,也是流动人口迁移定居的最大约束。一个城市的房价和房租水平是影响个人当前与未来现金流的重大因素。同时,由于多数定居并非举家搬迁,可能家中会有亲属仍然居住于流出地,因此流入地与流出地的距离也是一项约束条件。于由于高铁网络的建设、通讯的发展,地区之间的流动便捷程度使得这一约束有所减小,因而放假方便流动人口向更远、经济更加发达的城市定居[14-15]。

脑卒中诊断符合公认的中、西医诊断标准[9-10]且经CT/MRI确诊为脑血管疾病,同时肩手综合征诊断标准参照依据为《脑卒中的康复评定与治疗》[11]的病人。排除非脑卒中引发肩手综合征的病人。

(二)数据与描述性统计

本文所使用个体层面数据来源于2015 年全国流动人口动态监测数据,2015年度人口动态监测调查数据以31个省(区、市)和新疆生产建设兵团2014年全员流动人口年报数据为基本抽样框,采取分层、多阶段、与规模成比例的PPS方法对在流入地居住一个月以上、非本区(县、市)户口的15周岁及以上流动人口进行抽样,样本量为20.6万个。全国流动人口动态监测调查数据具有较好的完整性和较强的代表性。本文城市层面数据来源于《中国城市统计年鉴(2015)》及《中国社会统计年鉴(2015)》。相关变量的描述性统计见表1。

表1 变量统计性描述

变量均值标准差定居意愿(不愿意=0,愿意=1)0.8200.380 性别 (男性=0,女性=1)0.4200.490 年龄34.9509.260 户籍类型(农业户口=0,其他=1)0.1800.390 婚姻状况(未婚/离婚/丧偶=0,初婚/再婚=1)0.8200.390 子女数量1.1200.820 受教育程度(未上过学=1,小学=2,初中=3,高中/中专=4,大学专科=5,大学本科=6,研究生=7)3.5001.090 同住人数2.5501.120 民族(汉族=0,其他=1)0.0400.200 流动范围(省内流动=0,跨省/跨境流动=1)0.5900.490 流动时间(月)60.04059.600 每月支出(元)1 550.5801 146.210 每月收入(元)3 230.1203 573.710 每月租房总支出(元)401.330512.370 每月食品总支出(元)675.640411.590 流入地人均GDP(元)91 977.57031 057.690 流入地人口规模(万人)481.160423.550 流入地医院数量232.200219.190 流入地普通高等学校数量35.75027.900 流入地产业结构(第三产业产值/第二产业产值)1.4100.810 流入地与流出地人均收入之差(元)13 047.82019 509.400 流入地样本住宅平均价格(元)13 158.5609 847.440流入地企业科研项目经费支出(万元)5 324 951.0005 166 539.000流入地工业企业总产值(万元)131 000 000.00090 200 000.000流入地固定资产投资(万元)31 500 000.00021 400 000.000 样本量65 535

从表1描述性统计中可以看出,剔除回答“没想好”的样本后,超过80%的流动人口愿意在流入地定居。

(三)模型构建与比较

本文使用Python语言来实现模型,首先对数据进行去重、打乱数据排序等前期工作,然后随机将数据划分为训练集和测试集,其中80%样本为训练集,其余20%为测试集。使用逻辑回归模型、决策树模型、随机森林模型、梯度提升决策树分类模型以及LightGBM模型共计5种机器学习模型进行建模并进行比较分析,对比算法的F1值(F1Score=P*R/2(P+R))、准确度AUC值。其中P为精密度Precision(Precision=TP/(TP+FP))、R为召回率Recall(Recall=TP/(TP+FN)),TP为真阳性,FP为假阳性,TN为真阴性,FN为假阴性(图1)。

(1)机遇与挑战。在创新、协调、绿色、开放、共享五大理念,资源节约与环境保护,坚守生态红线,保护优先,绿色发展贯穿于矿产资源勘查开发利用全过程监管模式下,对矿产资源开发利用企业的生存与发展提出了严格的要求和挑战。如何变困难为动力、化挑战为机遇,倒逼矿山开采企业力行节能降耗、转型升级、技术革新、创新发展、走绿色开发之路,是矿山企业面临的新课题和必须攻克的重要关口,也是河北省矿产资源开发利用面临的机遇与挑战[9]。

表2 五种算法模型效果评估结果

评估指标逻辑回归模型决策树模型随机森林模型梯度提升决策树分类模型LightGBM模型F1 Score0.9040.8570.8940.9070.910 AUC值0.7760.6170.7570.8020.808

上述5种模型的ROC曲线如图2所示。

从上述图表可以看出,不管何种评论指标,LightGBM模型均表现出最好的效果,其次为梯度提升决策树分类模型。同时,在计算的过程中注意到,相比于传统的逻辑回归模型,LightGBM模型具有更快的训练效率、更低的内存使用、更好的准确率。

四、 结果与分析

(一)基于LightGBM模型的流动人口定居意愿研究

根据本文文献综述部分,流动人口的定居意愿受到多重因素影响,这些因素有以下两个特征:第一,如此多的因素中必然有轻重,本文选取了24个因素来研究其对定居意愿的影响,他们对模型都有贡献,但显然贡献的程度是不一样的,重要性程度的排序可以通过Python语言中的特征重要性来实现;第二,由于本文所选取的24个因素来源于不同的数据库,其中的个人层面的因素(如个人收入、受教育程度、年龄等)精确到每一个样本,而城市层面的因素(如流入地城市的人均GDP、高校数量等)只能精确到城市,对于同一城市中的每一个样本,该因素的取值是相同的。因此城市层面的指标和个人层面指标对模型贡献的重要性程度是不可比的,也是没有意义的,只需分别关注个人层面和城市层面对定居意愿影响最大的因素是什么即可。

图1 机器学习流程图

图2 五种算法模型ROC曲线

(a)个人层面特征重要性排名 (b)城市层面特征重要性排名
图3 定居意愿影响因素的特征重要性

假设一:流动人口的年龄、教育程度、婚姻状态、在流入地居住时间长短会影响其对流入地的偏好。迁移与定居是人生大事,微观个体在考虑定居的事情时会综合考虑自己、父母、配偶以及子女的方方面面,居住时间长短也会影响对城市的感情以及在城市的人脉资源等。

海岛固体废弃物中较难处理的是生活垃圾。生活垃圾的常见处置方法有:填埋、堆肥、焚烧、热解、固化等,其中焚烧法可使垃圾减容85%以上,减量75%以上[5],适用于海岛。由于我国多施行垃圾混合回收,含水率普遍高于50%[6-7],热值低于进入焚烧炉最低要求6 002 kJ/kg[8],为垃圾焚烧处理带来一系列问题:焚烧效率低、腐蚀焚烧设备、易产生二恶英等有毒有害物质[9]等。因此我国海岛垃圾处理的关键问题在于垃圾干燥,降低含水率[8-10]。

总体而言,在城市居住时间长短是影响流动人口定居意愿的最重要因素。除此之外个人层面定居意愿的选择更多是成本导向型,每月住房支出、每月总支出、每月食品支出都在定居意愿的决定中发挥了较为重要的作用。在城市层面的影响因素中,人均GDP、流入地与流出地的收入水平差是影响定居意愿的最重要因素,前者代表了流入地的“拉力”,后者则既能表示流入地的“拉力”,又能代表流出地的“推力”,这符推拉理论[16]。

稳定型战略是企业期望当下经营状况能够基本保持已有经济效益或有小幅增长的一种战略。这是一种以安全经营为宗旨、不希望冒太大风险的经营战略。稳定型战略适合企业处于成熟期与衰退期时的发展需求。

(二)不同受教育程度流动人口定居意愿

不同受教育程度的流动人口之间具有较强的异质性[17],将流动人口按受教育程度不同划分为“小学及以下”、“初中”、“高中及中专”、“大专”和“本科及以上”五组,对五组样本分别进行基于LightGBM模型的定居意愿影响因素分析。得出模型的各类评估指标如下表,从表中的各项评估指标来看,五组机器学习均得到了较好的效果。

表3 不同受教育程度分组的模型评估情况

评估指标小学及以下初中高中及中专大专本科及以上精密度0.8270.9000.9140.9330.953 召回率0.9510.7900.7940.7430.745 F1 Score0.8850.9640.9730.9850.983 AUC值0.7840.8430.8610.8850.924

随着学历的增加,年龄对定居意愿的影响逐渐减小,这可以用生命周期理论来解释,当预期收入随着年龄增长,年龄就变得不那么重要。

图4 个人层面特征重要性排名

图5 城市层面特征重要性排名

如同人的语言,计算机之间必须使用相同的通讯协议才能进行通信,共同遵守一组通信标准,才能在网络中互通信息。我们日常使用的因特网正是基于TCP/IP协议所建立的,是目前使用最为广泛的协议。

在北大我是没有休息日的,我每天都要工作和学习,一般早上6点30分起床,先到未名湖畔读书散步,有时还会帮清洁工阿姨打扫厕所,我不觉得这样的生活有什么艰难和委屈的,我始终相信一句话:合理的要求是训练,不合理的要求是磨炼,不管是合理还是不合理,只要你不用对立的眼光去看,都是一种人生的锻炼。

随着受教育程度的增加,收入的重要性逐渐超过成本。这说明高学历的流动人口是收入导向型的,低学历的流动人口是成本导向型。高学历的流动人口人为,只要自己有足够高的收入就能够在城市定居。而低学历的流动人口则认为,只有当在城市的生活成本较低时才愿意在城市定居。这是因为学历会影响收入和收入预期,高学历者认为未来收入会有提高,因而高生活成本可能只是暂时的,而低学历者则相反,他们从事的工作有着较低的天花板,收入成长空间较小,因此更加看重平衣食住行的成本。

上述建立的制造活动含义,表示制造活动执行所必须的资源、工序和任务的基本需求,而约束条件与上述3个对象的逻辑关系可以形式化描述为

分别从个人层面和城市层面来分析影响定居意愿的各项指标,选取其中重要性特征值较大的因素可得到图4和图5。

加利埃尼下令巴黎的3000辆出租车全部征用。到晚间10时,将军院子门前广场上已经聚集了数十辆出租车。第一批车队在夜幕下开往巴黎西北小镇特朗布雷。次日清晨,又一批出租车会聚将军院启程,浩浩荡荡离城奔向东边另一处军队集结地。

城市层面的因素中,对定居意愿影响程度较大的是流入地与流出地收入水平差额、流入地房价水平、流入地人均GDP以及流入地的产业结构。

本工程选矿工艺中磨机电机等设备需要大量冷却水冷却,因此需设置循环冷却水系统。冷却循环水管道系统,包括冷却循环给水管道系统及冷却循环回水管道系统。冷水通过冷却循环给水管道输送至选矿设备,冷却排出的升温水通过冷却循环回水管道输送至冷却塔进行冷却,冷却后进冷水集水池循环使用。

从城市层面的特征来看,随着学历的增加,流入地与流出地的收入差距对定居意愿的影响呈现出“V”型的变化趋势,也就是说,根据推拉理论,最低学历与最高学历者,受到发达城市高人均收入的“拉力”更明显。结合前文对个体层面影响因素的分析,低学历者对个人收入相对不敏感而对流入地与流出地收入水平差较敏感,唯一的解释是这些低学历者来大城市的目的是找一份工作,他们认为越发达的城市蕴含的工作机会越多。初中、高中等学历人口大多数从事高机械性、高重复性的车间工作,这些工作会涉及到对鼠标的简单操作或是对机器、文字以及符号的识别,对于小学及以下的流动人口,可能无法胜任大多数制造业车间的工作。他们中男性多在工地等基建领域劳动,女性则多从事保姆、清洁等工作。这些工作由于无正规劳动协议的保障,常常处于不稳定状态,其与产业关系并不密切,而对城市的规模较为敏感。因此更发达的城市蕴藏着更多的低学历流动人口的工作机会。学历最高的是以来发达城市获得高收入为目的,他们认为越发达的城市未来能够实现的收入越多。

对上述模型的F1 Score以及准确度AUC值评估结果如表2。

高学历的流动人口对城市的产业结构更加敏感。产业结构代表着一个城市的长远发展规划与产业发展趋势。深层次来看,改革开放初期,由于中国内部有效需求不足,生产的大量产品,不能被内部消化掉,所以出口到国外,以外汇的方式进行储存。且当时人口结构以壮年劳动力为主,社会剩余产品的生产能力较强,因此发展出口导向型经济,借助发达国家商品和金融市场实现现期生产能力向未来消费能力的跨时期转移。这一时期,出口导向型经济充分调动了我国资源禀赋优势,取得巨大成功。但这种经济的高增长,是靠廉价劳动力、廉价资本加廉价资源高投入支撑的,它具有内在的不可持续性,近年来这种迹象越来越明显。随着人口红利的消失,中国正在经历产业转型与产业升级,原来沿海城市的低端制造业等低附加值、劳动密集型产业被转移到了内地或者东南亚,转而发展高端制造业或者高端服务业,过去简单、重复的工作正在逐渐被被工业机器人、服务机器人、智能装备等替代,从而产生低端劳动力的过剩和高端劳动力的缺口。未来这种缺口引致出对高学历劳动者巨大的需求,因此,高学历者在考虑是否在城市定居时,会更多的考虑一个城市的未来规划、产业结构等因素。

五、结论与建议

(一)结论

本文基于数据挖掘与机器学习,使用逻辑回归模型、决策树模型、随机森林模型、梯度提升决策树分类模型,以及LightGBM模型共计5种机器学习模型进行建模和评估分析,最后选出效果最好的LightGBM模型对流动人口的定居意愿作进一步的研究。基于本文假设,通过计算模型的重要性特征值,本文有以下三个发现。

第一,LightGBM作为当前机器学习领域最为前沿的算法,可以被应用于流动人口定居意愿的研究领域,通过对数据进行机器学习,可以取得比传统Logit回归更精确可靠的计算结果,这为以后的研究提供了新的思路。

1.1 资料来源 选取2015年7月-2017年7月在吉林大学第一医院实施Ⅰ类剖宫产术的129例患者为研究对象,其中2015年7月-2016年7月未采取缩短DDI措施的患者77例为对照组,2016年8月-2017年7月采取缩短DDI措施的患者52例为观察组。两组病例中,10 min恢复正常水平的胎儿心动过缓及急性胎儿窘迫94例,前置胎盘大出血5例,严重的胎盘早剥18例,先兆子宫破裂2例,足先露5例,脐带脱垂5例。两组孕妇年龄、孕周、孕次、产次以及是否有合并症比较,差异无统计学意义(P>0.05),具有可比性。见表1。本研究获得医院医学伦理委员会批准,所有研究对象对本研究知情并签署知情同意书。

第二,在流入地定居时间长短是影响偏好的最重要因素,除此之外,定居意愿更多的受到收入成本的约束。

第三,不同学历的流动人口其定居意愿对各影响因素的敏感程度不同,影响最高和最低学历的流动人口定居意愿最重要的因素均为流入地与流出地的收入水平差距,他们有着充足的动力逃离家乡,但背后原因不尽相同,低学历者是为了寻求工作机会,高学历者是为了获得更多收入。

(二)建议

基于上述结论,本文提出如下建议。

首先,降低低收入者生活成本,建立更加丰富的税收体系,合理降低低收入者的税负成本。建立立体、多元化的补贴制度,例如针对低学历、低收入者的食品、住房补贴。

其次,加强职业教育培训,让流动人口适应经济社会对劳动力需求的发展与变化,随着经济转型升级,让更多的劳动力提高自身素质,从而从事更高附加值的工作,提高经济运转效率的同时增加他们的收入。

最后,提高流动人口尤其是高学历流动人口在城市的归属感和舒适感,例如降低他们的落户门槛,解决家属的就业、就医,解决子女的教育问题,以更多地吸引高学历人才,适应经济发展由“量”到“质”的转变。

[参考文献]

[1] 陆铭,向宽虎.破解效率与平衡的冲突——论中国的区域发展战略[J].经济社会体制比较,2014(04).

[2] 童玉芬, 王莹莹. 中国流动人口的选择:为何北上广如此受青睐?——基于个体成本收益分析[J]. 人口研究, 2015(04).

[3] 王玉君.农民工城市定居意愿研究——基于十二个城市问卷调查的实证分析[J].人口研究,2013(04).

[4] 王伟, 陈杰, 艾玮依.新生代农民工在三四线城市定居意愿及其影响机制研究——基于2014年长三角地区流动人口动态监测数据的考察[J]. 华东师范大学学报(哲学社会科学版), 2016(04).

[5] Fokkema T, Haas H D. Pre-and Post-Migration Determinants of Socio-Cultural Integration of African Immigrants in Italy and Spain[J]. International Migration, 2011, 53(06):3-26.

[6] 李振刚.社会融合视角下的新生代农民工居留意愿研究[J]. 社会发展研究, 2014(03).

[7] 刘于琪, 刘晔, 李志刚.中国城市新移民的定居意愿及其影响机制[J]. 地理科学, 2014(07).

[8] 卜庆国.新型城镇化背景下郑州市新生代农民工城市定居意愿影响因素研究[J]. 中国农业资源与区划, 2017(10).

[9] 郭云贵, 张丽华, 刘睿.流动人口就业状况、歧视知觉对定居意愿的影响——基于2013年全国流动人口动态监测数据的分析[J]. 北京交通大学学报(社会科学版), 2017(01).

[10] Newbold K B. Return and Onward Migrations in Canada, 1976—1981: An Explanation Based on Personal and Ecological Variables[J]. Can Geogr, 2010, 39(01):16-30.

[11] 侯慧丽. 产业疏解能带动人口疏解吗?——基于北京市流动人口定居意愿的视角[J]. 北京社会科学, 2016(07).

[12] 蔡翼飞, 张车伟. 地区差距的新视角:人口与产业分布不匹配研究[J].中国工业经济, 2012(05).

[13] 马银坡, 陈体标, 史清华. 人口流动:就业与收入的区域差异[J].农业经济问题, 2018(05).

[14] 巫锡炜, 郭静, 段成荣. 地区发展、经济机会、收入回报与省际人口流动[J].南方人口, 2013(06).

[15] 马小红, 段成荣, 郭静. 四类流动人口的比较研究[J].中国人口科学, 2014(05).

[16] 李强. 影响中国城乡流动人口的推力与拉力因素分析[J].中国社会科学, 2003(01).

[17] 马岩, 杨军, 蔡金阳,等. 我国城乡流动人口教育回报率研究[J].人口学刊, 2012(02).

[中图分类号]C922

[文献标识码]A

[文章编号]1003-1154(2019)03-0081-06

[基金项目]国家自然科学基金项目(71673186)。

DOI:10.19634/j.cnki.11-1403/c.2019.03.020

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

郭长帅:基于数据挖掘算法的流动人口定居意愿研究论文
下载Doc文档

猜你喜欢