基于随机森林模型的高精度人口数据空间化 ——以郑州市区为例

基于随机森林模型的高精度人口数据空间化 ——以郑州市区为例

论文摘要

人口数据是反映人类活动最直观的指标之一。传统的人口数据主要以各级行政单元为单位每十年进行一次普查统计,有着时间分辨率低、不支持高精度空间分析的弊端。随着遥感与地理信息科学技术的发展,代表人口分布信息的人口空间化数据,特别是高分辨率的人口格网数据对于理解和响应众多的社会、经济及环境问题起着越来越至关重要的作用。目前,主流的大尺度人口格网数据的空间分辨率以1KM为主,对于精细化尺度的研究和应用(如城市尺度)有一定的局限性。同时,由于这些研究使用的辅助数据多为传统的土地利用/覆盖类型数据等,并未使用较多的新型数据,其空间化精度有待提高。本研究着重关注主流人口格网数据空间分辨率较低及辅助地理数据使用不全面这两项问题,以河南省郑州市市区为研究区域,获取了多源遥感数据(土地利用/覆盖,夜间灯光,数字高程数据等),及社会经济数据(如商业兴趣点,建筑轮廓数据等)。本研究以乡镇/街道级别行政区划相对应的人口及辅助数据为样本,在随机森林模型中进行建模。随后,根据100M的格网进行分区密度制图,将区/县级别人口普查数据空间化至100M网格内。空间化后的100M人口格网数据随后通过箱线图与乡/镇街道级别人口普查数据进行对比,探究空间化后异常误差出现的原因,并据此重新建模寻求最优建模参数及辅助数据。(1)根据本研究人口空间化结果,郑州市人口大体上呈向中心集中的放射状分布,人口主要集中在中原区东部,二七区东北,及金水区西部。其中,人口密度较高的街道为绿东村街道,建设路街道,平均每百米格网人口密度均超过200人,古荥镇人口密度较低,且人口分布均匀,平均每百米格网人口仅为6.004人。(2)经过本研究结果与其他主流人口格网数据在郑州市市区进行对比,发现本研究人口数据空间化总体精度较好,其中,本文选取的特征库中的特征与郑州市各乡镇/街道级别行政单元人口密度的相关度:R~2=91.28;空间化后的人口与客观人口在郑州市内所有乡镇/街道行政单元上的均方根误差(RMSE)=25783.59,超过了Worldpop(RMSE=31543.66)、中国公里网格人口分布数据集(RMSE=35800.90)、及Gridded Population of the World(RMSE=33791.59)。(3)根据平均精度减少法及Boruta法,本研究对随机森林建模的辅助数据的变量重要度进行了研究,并发现在较为复杂的城市环境下,兴趣点数据,特别是代表居民小区位置的兴趣点,停车场位置点,银行位置点,对于人口的空间分布有着较大的影响,相反的,气温,降水等较为宏观的变量对小区域人口数据空间化建模贡献不大。在今后的小区域城市快速建模中,可使用本研究特征重要度较高的特征对人口的空间分布进行模拟。

论文目录

  • 中文摘要
  • abstract
  • 1 引言
  •   1.1 研究背景与意义
  •   1.2 国内外研究现状
  •     1.2.1 国内外主要研究方法
  •     1.2.2 国内外主要数据集
  •   1.3 研究内容与技术路线
  •     1.3.1 研究内容
  •     1.3.2 技术路线
  • 2 研究区概况与数据处理
  •   2.1 研究区概况
  •   2.2 数据来源与处理
  • 3 人口数据空间化模型特征库建立
  •   3.1 随机森林算法理论基础
  •     3.1.1 分类回归树
  •     3.1.2 拔靴法与袋外数据
  •     3.1.3 随机森林原理与优点
  •   3.2 人口数据空间化模型特征库
  •     3.2.1 土地覆盖特征
  •     3.2.2 其他栅格类型数据特征
  •     3.2.3 道路数据特征
  •     3.2.4 建筑数据特征
  •     3.2.5 兴趣点数据特征
  • 4 高精度人口数据空间化
  •   4.1 基于随机森林模型的人口分布权重层建立
  •     4.1.1 特征变量归一化与人口数据对数变换
  •     4.1.2 构建随机森林模型
  •     4.1.3 基于模型的权重层生成
  •   4.2 基于人口分布权重层的人口数据空间化
  •   4.3 特征库异常样本的检测与处理
  •   4.4 精度评价方法
  •   4.5 高精度人口数据空间化结果
  •     4.5.1 空间化结果
  •     4.5.2 精度评价结果
  • 5 人口空间分布相关特征分析
  •   5.1 特征贡献度分析
  •   5.2 特征重要度划分
  • 6 结论与讨论
  •   6.1 结论
  •   6.2 展望
  • 参考文献
  • 附录
  •   随机森林建模代码与描述
  •   第一次随机森林建模结果
  •   第二次随机森林建模结果
  • 在读期间的学术研究
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 邱歌

    导师: 包玉海,贾鹏

    关键词: 人口空间分布,随机森林,郑州市,遥感,兴趣点,建筑轮廓

    来源: 内蒙古师范大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 自然地理学和测绘学,自然地理学和测绘学,计算机软件及计算机应用

    单位: 内蒙古师范大学

    分类号: P208;P237

    总页数: 59

    文件大小: 3189K

    下载量: 291

    相关论文文献

    • [1].夜光遥感与人口空间化的相关性研究初探——以成都市为例[J]. 现代盐化工 2019(06)
    • [2].青年销售员与空间化的情感劳动——以S市I品牌W门店为案例[J]. 青年研究 2020(01)
    • [3].面向地震应急的人口空间化方法研究——以云南省大理白族自治州为例[J]. 地震研究 2020(04)
    • [4].论弗兰克三种时间“空间化”叙事[J]. 大连大学学报 2020(05)
    • [5].试论资本空间化的影响[J]. 未来与发展 2017(07)
    • [6].论演出叙述中两种时间“空间化”方式[J]. 淮阴师范学院学报(哲学社会科学版) 2015(06)
    • [7].诗人如何想象上海?——城市心态的空间化表述[J]. 诗歌月刊 2017(05)
    • [8].历史的空间化:蒋蓝作品的叙事研究[J]. 阿来研究 2017(01)
    • [9].台湾的历史寓言和历史的空间化——读骆以军的《西夏旅馆》[J]. 励耘学刊 2017(01)
    • [10].基于地理国情数据的人口空间化研究[J]. 测绘与空间地理信息 2020(12)
    • [11].基于夜间灯光与土地利用的长沙市人口空间化[J]. 智能城市 2020(02)
    • [12].基于土地利用类型数据的统计人口空间化模型研究:以福建省为例[J]. 云南大学学报(自然科学版) 2020(04)
    • [13].城镇尺度人口空间化的地理国情数据反演——以石蟆镇为例[J]. 工程勘察 2020(11)
    • [14].历史唯物主义与空间化问题溯源[J]. 开封教育学院学报 2019(03)
    • [15].马克思资本空间化思想的现实启示[J]. 重庆社会科学 2018(05)
    • [16].当代西方叙事理论的空间化转向[J]. 南京师范大学文学院学报 2016(01)
    • [17].浅析小说《砂女》的空间化情景[J]. 语文学刊 2009(14)
    • [18].人口数据空间化研究综述[J]. 地理科学进展 2013(11)
    • [19].“阶层的空间化”:青藏高原村落的人群分类与空间区隔[J]. 原生态民族文化学刊 2020(06)
    • [20].历史唯物主义为何与如何面对空间化问题?[J]. 天津社会科学 2011(01)
    • [21].历史唯物主义的空间化解释:历史与可能[J]. 天津社会科学 2011(01)
    • [22].社会空间化与文化拓扑学[J]. 文化艺术研究 2010(03)
    • [23].可空间化经济信息指标识别研究[J]. 现代经济信息 2008(06)
    • [24].网络“空间化”的时代演变与刑法对策[J]. 法制博览 2017(31)
    • [25].海洋数据的空间化整合流程解析[J]. 海洋开发与管理 2014(05)
    • [26].论福柯的空间化转向与本质性写作[J]. 天津社会科学 2010(06)
    • [27].下一个长期波动——世纪之交的空间化、技术官僚控制和工作重构[J]. 政治经济学季刊 2019(02)
    • [28].《长夜行》的空间化表现[J]. 文教资料 2019(35)
    • [29].资本空间化过程中的城市设计:一个分析性的框架[J]. 新建筑 2013(06)
    • [30].基于站点观测数据的气温空间化方法评述[J]. 地理科学进展 2014(08)

    标签:;  ;  ;  ;  ;  ;  

    基于随机森林模型的高精度人口数据空间化 ——以郑州市区为例
    下载Doc文档

    猜你喜欢