论文摘要
现有网格空间多尺度聚类方法未能显式将尺度因子作为模型参数,难以实现尺度驱动的阈值自适应提取,导致聚类算法调参困难,从而无法全面挖掘空间数据分布模式。海量空间点数据蕴含的信息更加丰富且层次结构更加复杂,对聚类算法的参数设置与计算效率进一步提出了更高要求。针对上述问题,本文从数据尺度和观察尺度两种尺度维度,提出了一种适用于海量数据的多尺度聚类挖掘算法处理流程。该方法分别通过网格多分辨率和低通保边滤波器的尺度拓展机制实现数据尺度和观察尺度上的尺度变换,并在聚类算法中显式引入观察尺度作为模型参数,通过改进大津法实现多个观察尺度密度阈值的自动提取。本文主要内容如下:1)提取出两个影响多尺度空间聚类结果的尺度因子。本文从可塑性面积单元问题和遥感多分辨率影像识别问题引出数据尺度的定义,从信号的多尺度低通滤波处理引出观察尺度的定义。2)设计了多尺度聚类算法流程。根据数据尺度和观察尺度对聚类结果的影响,设计了两个维度联合的空间多尺度聚类算法整体流程。首先,算法根据应用需求,将原始空间数据划分为的多个数据尺度,然后针对每个数据尺度建立多个观察尺度上的聚类结果,最终形成多维多尺度的空间聚类结果。3)设计了低通保边滤波器以提取观察尺度低频信息。观察尺度的低频信息提取是多尺度聚类算法流程的一个关键步骤,本文针对常见的低通滤波存在的问题进行改进,设计了一种简化的低通保边滤波器。4)设计了基于尺度约束大津法的密度阈值提取。密度阈值提取是观察尺度迭代中的另一个关键步骤,本文针对大津法、直方图凹面分析法等阈值分割方法存在的问题,将观察尺度层级作为约束加入到目标公式中,实现了尺度驱动的密度阈值提取。实验结果表明,在聚类精度和算法时间复杂度方面,相比于DBSCAN聚类方法,本文算法能在精度损失较小的情况下,实现多观察尺度上参数阈值的自适应提取避免了调参过程,同时也能为其他算法的参数选择提供参考。且本算法时间复杂度低(O(n)),能够实现近实时的海量空间点聚类。在中国大陆基础设施POI的实际应用上,本文的多尺度聚类算法能够在一定程度上反映中国大陆多层次的经济结构,结果与观察者多层次的空间认知结果较为符合,能够一定程度上辅助海量空间点数据多层次空间结构的挖掘与可视化分析,具有一定的应用价值。相比于传统低通滤波,本文滤波方法具有良好的去噪保边效果,自适应多尺度密度阈值算法能够较为有效地捕捉数据集丰富的多层次信息,且计算复杂度低。该方法可用于各类海量空间点数据多层次空间结构的快速挖掘与可视化分析。
论文目录
文章来源
类型: 硕士论文
作者: 隆玺
导师: 宋爱红,吴华意
关键词: 空间聚类,空间多尺度,空间层次性,网格聚类,尺度驱动
来源: 武汉大学
年度: 2019
分类: 基础科学,信息科技
专业: 自然地理学和测绘学,计算机软件及计算机应用
单位: 武汉大学
基金: 国家重点研发计划项目(项目编号:2017YFB0503704,项目名称:全球位置信息叠加协议与位置服务网技术),国家重点研发计划项目(项目编号:2018YFC0809806,项目名称:社区风险监测与防范关键技术研究),国家自然科学基金项目(项目编号:41501434,项目名称:基于非均衡时空访问模式的网络地图服务计算资源弹性分配方法),国家自然科学基金项目(项目编号:41371372,项目名称:支持质量约束的地理信息资源在线搜索关键技术研究),武汉大学人才计划-珞珈青年学者项目(项目名称:海量 POI 高性能空间点模式可视分析关键技术研究)
分类号: P208
总页数: 54
文件大小: 1863K
下载量: 16
相关论文文献
- [1].基于聚类树的多类标文本分类算法研究[J]. 信阳师范学院学报(自然科学版) 2017(01)
- [2].一种基于启发式的分层聚类[J]. 计算机应用与软件 2014(05)
- [3].一种基于GMM-聚类树的面向大规模服装图像检索的索引结构[J]. 北京服装学院学报(自然科学版) 2016(03)
- [4].基于自寻优层次聚类的孤立点分析[J]. 计算机系统应用 2008(04)
- [5].基于顶点重要度和层次聚类树的地形网格简化[J]. 计算机工程与设计 2016(06)
- [6].一种基于层次聚类的全局孤立点识别方法[J]. 计算机应用研究 2011(05)
- [7].新生儿坏死性小肠结肠炎研究趋势的共词分析[J]. 临床儿科杂志 2015(01)
- [8].我国高校知识服务领域研究热点的可视化分析[J]. 知识经济 2016(05)
- [9].Ward系统聚类法在农村居民收入情况分析中的应用研究[J]. 大理学院学报 2015(06)
- [10].国内图书馆嵌入式服务研究热点可视化分析[J]. 图书馆工作与研究 2013(12)
- [11].地沟油的高光谱数据聚类分析[J]. 国土资源遥感 2014(01)
- [12].聚类集成技术在地铁站点类型研究中的应用[J]. 小型微型计算机系统 2019(01)
- [13].基于聚类的连续型数据缺失值充填方法[J]. 计算机工程 2019(09)
- [14].中国城市化的出路在中小城市[J]. 调研世界 2011(03)
- [15].棘腹蛙线粒体局部重复序列非排序聚类[J]. 四川动物 2018(03)
- [16].运用生物信息学方法鉴别易混种射干和鸢尾[J]. 佳木斯职业学院学报 2014(12)
- [17].角倍蚜mtDNA基因序列遗传多样性分析[J]. 科技与创新 2014(04)
- [18].k-modes聚类方法的改进与在可追溯猪肉消费偏好研究中的应用[J]. 系统管理学报 2019(04)
- [19].四川泸州桂圆的RAPD分析[J]. 安徽农业科学 2012(23)
- [20].基于形态距离的日负荷数据自适应稳健聚类算法[J]. 中国电机工程学报 2019(12)
- [21].聚类分析在汉语方言研究中的运用[J]. 语文研究 2015(04)
- [22].基于新型图论聚类法的物流系统多设施选址策略研究[J]. 中国管理科学 2012(06)
- [23].国内儿童语言发育研究的文献计量分析[J]. 中国儿童保健杂志 2013(03)
- [24].政务公开研究的共词网络可视化分析[J]. 现代情报 2014(07)
- [25].一种基于凝聚K-means的决策簇分类器[J]. 信阳师范学院学报(自然科学版) 2013(04)
- [26].鸽(Columbam)ESRα基因的扩增及序列分析[J]. 畜牧兽医科技信息 2012(08)
- [27].孤立点检测改进径向基神经网络动态预测模型[J]. 计算机工程与应用 2009(28)
- [28].芡种质资源及其杂种后代的初步遗传分析与评价[J]. 长江蔬菜 2012(16)
- [29].MapReduce框架下常用聚类算法比较研究[J]. 河北省科学院学报 2019(02)
- [30].船舶AIS轨迹聚类方法研究进展综述[J]. 广州航海学院学报 2019(02)