地质大数据功能分析及其分类算法研究

地质大数据功能分析及其分类算法研究

论文摘要

在数字地质科学研究中,地质大数据已经成为地学空间分析不可或缺的基础素材。地质大数据分析的科学本质是在数据海洋中提取对地学目标有重大贡献或重要作用的地质变量。因此,对地质变量的内涵与外延做精准分析构成了地质变量自身研究的主要内容,也是确保地学空间信息模型可靠性与精准性的关键所在。按照这一要求,本文将地质大数据及地质变量功能分析作为主体研究内容,通过对地质变量功能分类、作用性质以及作用方向的讨论,在算法研究上提出地质变量建模分析的适用条件、建模标准及目标要求,并在理论上阐明地质大数据的精准分类与空间建模依据,为地质大数据空间建模质量提供基础保证。为分析地质变量在地质建模中所发挥的全部效能,将模型中变量作用能力的总体性评价称为地质变量的功能,所谓功能即地质变量所承载的作用性质及作用方向、变量的连接力在整个空间分析中所呈现的一种度量。本文将地质变量的功能划分为信息转换、程度度量、判别分类、组合关联、结构优化五项功能,并逐一讨论。在地质变量功能讨论的基础上,针对变量的模型应用,将机器学习和深度学习应用于地球化学观测数据的分类研究中,并给出了计算流程与精度分析,最终达到地质变量功能分类的效果,从而提高地质大数据的精准性。事实上,地质变量的每项功能研究均可进行细分研究,前人已经积累了大量的研究成果。鉴于分类是科学研究的首选性课题,本文将地质变量分类判别功能作为重点问题进行讨论,将地质大数据功能分析模型及分类算法作为主要研究内容,以云南哀牢山矿集区地球化学元素观测数据为研究对象,分别运用支持向量机、k最近邻、随机森林、梯度提升、朴素贝叶斯和集成学习分类器等方法,通过模拟实验对比的方式,选择出相对最优的学习类型及其对应的分类效果。论文的主要研究成果如下:1.讨论了地质大数据及地质变量功能的内涵与外延,阐述地质大数据与地质变量的逻辑关系,给出了从地质大数据集合中提取地质变量的普适性原则、构置条件、地质变量赋值的一般性方法。2.详细论述了地质变量的五项功能,并针对每项功能分别建立数学模型,从定量分析的角度确立各项功能模型的定义范围及应用前提。3.在应用案例分析中,针对云南哀牢山地区的地球化学观测数据进行分类研究,采用两种无监督学习方法进行层次聚类和k均值聚类,从中得出离差平方和法与k均值聚类法计算结果具有相对一致性,均出现三类划分结果,表明云南哀牢山地区地球化学元素数据划分为三个类别是合理的。4.基于层次聚类与k均值聚类法得出的分类标准,继续建立“高精度”的分类模型,分别采用不同核函数的支持向量机、k最近邻、随机森林、梯度提升、朴素贝叶斯和集成学习等方法,进行重复模拟实验分析。结果显示随机森林分类法精度最高,达到99.83%;而朴素贝叶斯分类效果相对较差,达到97.74%。这说明在地球化学类数据分类中,随机森林的分类效果要优于其他方法。尝试进一步提高数据量的分类精度,论文提出将多“分类器”进行融合的集成学习分类法。在实验分析中具体构建了三个集成学习模型,包括基于随机森林、支持向量机和神经网络三个基本分类器的融合模型,结果显示分类精度最高达到99.83%。5.运用深度神经网络、Elman神经网络及Jordan神经网络进行数据分类。其中深度神经网络法,获得4个隐藏层数的分类结果,精度达到最高的99.65%。Elman神经网络法获得4个隐藏层数,分类精度为99.3%。Jordan神经网络法获得6个隐藏层数,分类精度为99.48%。证明深度神经网络的分类效果要优于Elman和Jordan神经网络分类效果。

论文目录

  • 中文摘要
  • abstract
  • 第1章 绪论
  •   1.1 选题背景及依据
  •   1.2 国内外研究现状
  •     1.2.1 大数据研究现状
  •     1.2.2 地质大数据的研究现状
  •     1.2.3 基于机器学习的地学研究现状
  •   1.3 论文的研究目标与意义
  •   1.4 论文研究内容
  •   1.5 论文所用的数据类型、标准与质量评述
  •   1.6 论文的采用的技术路线
  •   1.7 论文的预期成果与创新点
  •   1.8 本章小结
  • 第2章 地质大数据的定义、特征及其应用
  •   2.1 大数据概念
  •   2.2 地质大数据的基本概念
  •   2.3 地质大数据的获取与存储
  •   2.4 地质大数据的特征
  •   2.5 地质大数据与云计算
  •     2.5.1 云计算理论
  •     2.5.2 地质大数据云计算执行功能
  •   2.6 地质大数据的应用
  •   2.7 本章小结
  • 第3章 地质变量及其功能研究
  •   3.1 地质数据与地质变量
  •   3.2 地质变量提取构置方法
  •     3.2.1 提取地质变量的基本原则
  •     3.2.2 地质变量的构置方法
  •     3.2.3 地质变量的赋值
  •   3.3 地质变量的作用方向与作用性质
  •   3.4 地质变量功能研究
  •     3.4.1 程度度量功能
  •     3.4.2 判别分类功能
  •     3.4.3 信息转换功能
  •     3.4.4 组合关联功能
  •     3.4.5 结构优化功能
  •   3.5 地质变量功能研究的本质
  •   3.6 本章小结
  • 第4章 地质变量研究中的机器学习方法
  •   4.1 机器学习概念
  •   4.2 机器学习的发展历程
  •   4.3 机器学习的常用方法
  •     4.3.1 决策树
  •     4.3.2 支持向量机
  •     4.3.3 贝叶斯分类器
  •     4.3.4 k最近邻学习
  •     4.3.5 集成学习
  •   4.4 机器学习应用现状
  •   4.5 机器学习在地学信息分析中的应用
  •   4.6 本章小结
  • 第5章 基于机器学习方法的地球化学数据定量分类研究
  •   5.1 案例分析区域的地质背景介绍
  •   5.2 基于地球化学元素变量的聚类分析
  •     5.2.1 聚类的目标
  •     5.2.2 性能度量
  •     5.2.3 距离计算
  •   5.3 层次聚类
  •   5.4 动态聚类
  •   5.5 地球化学数据的定量分类研究
  •     5.5.1 基于层次聚类方法的地球化学数据分类
  •     5.5.2 基于k均值方法的地球化学数据分类
  •   5.6 基于有监督机器学习方法的地球化学数据分类
  •     5.6.1 基于支持向量机的数据分类
  •     5.6.2 基于k最近邻方法的数据分类
  •     5.6.3 基于随机森林方法的数据分类
  •     5.6.4 基于梯度提升机方法的数据分类
  •     5.6.5 基于朴素贝叶斯方法的数据分类
  •     5.6.6 基于集成学习模型的数据分类
  •   5.7 本章小结
  • 第6章 基于深度学习的地球化学元素定量分类研究
  •   6.1 深度学习
  •   6.2 神经网络
  •     6.2.1 神经网络的概念
  •     6.2.2 神经元模型
  •   6.3 深度神经网络
  •   6.4 Elman神经网络
  •   6.5 Jordan神经网络
  •   6.6 基于深度学习方法的地球化学数据分类
  •     6.6.1 基于深度神经网络的分类
  •     6.6.2 基于Elman神经网络的分类
  •     6.6.3 基于Jordan神经网络的分类
  •   6.7 本章小结
  • 第7章 结论与存在问题
  •   7.1 结论
  •   7.2 存在问题
  • 参考文献
  • 作者简介及在学期间所取得的科研成果
  • 致谢
  • 文章来源

    类型: 博士论文

    作者: 王娜

    导师: 路来君

    关键词: 地质大数据与地质变量,作用性质与作用方向,判别分类功能分析,机器学习与深度学习,深度神经网络

    来源: 吉林大学

    年度: 2019

    分类: 基础科学,工程科技Ⅰ辑

    专业: 地质学,矿业工程

    单位: 吉林大学

    分类号: P628

    总页数: 123

    文件大小: 2838K

    下载量: 716

    相关论文文献

    • [1].基于优化神经网络的地质灾害监测预警仿真[J]. 计算机仿真 2019(11)
    • [2].基于进化神经网络的304不锈钢车削加工表面粗糙度预测[J]. 轻工机械 2019(06)
    • [3].时频联合长时循环神经网络[J]. 计算机研究与发展 2019(12)
    • [4].几种典型卷积神经网络的权重分析与研究[J]. 青岛大学学报(自然科学版) 2019(04)
    • [5].基于GA-BP神经网络异纤分拣机检测参数优化[J]. 棉纺织技术 2020(01)
    • [6].基于集成神经网络的织物主观风格预测研究[J]. 纺织科技进展 2020(01)
    • [7].试析神经网络技术在机械工程中的应用及发展[J]. 网络安全技术与应用 2020(02)
    • [8].一种深度小波过程神经网络及在时变信号分类中的应用[J]. 软件 2020(02)
    • [9].不同结构深度神经网络的时间域航空电磁数据成像性能分析[J]. 世界地质 2020(01)
    • [10].基于深度神经网络的航班保障时间预测研究[J]. 系统仿真学报 2020(04)
    • [11].基于生成对抗网络和深度神经网络的武器系统效能评估[J]. 计算机应用与软件 2020(02)
    • [12].基于循环神经网络的双轴打捆机智能换挡策略研究[J]. 安徽工程大学学报 2020(01)
    • [13].基于图神经网络的实体对齐研究综述[J]. 现代计算机 2020(09)
    • [14].基于改进的循环神经网络深度学习跌倒检测算法[J]. 电脑编程技巧与维护 2020(03)
    • [15].神经网络探索物理问题[J]. 物理 2020(03)
    • [16].基于GA-BP神经网络的城市用水量预测[J]. 现代电子技术 2020(08)
    • [17].基于深度神经网络的药物蛋白虚拟筛选[J]. 软件工程 2020(05)
    • [18].基于轻量级神经网络的人群计数模型设计[J]. 无线电工程 2020(06)
    • [19].高效深度神经网络综述[J]. 电信科学 2020(04)
    • [20].含磁场耦合忆阻神经网络放电行为研究[J]. 广西师范大学学报(自然科学版) 2020(03)
    • [21].基于神经网络及特征运算的老年人平衡能力分析[J]. 重庆工商大学学报(自然科学版) 2020(04)
    • [22].神经网络技术在机械工程中的应用及发展探析[J]. 科技创新与应用 2020(18)
    • [23].基于竞争神经网络的变电站巡视周期分类[J]. 科技创新与应用 2020(18)
    • [24].基于双向循环神经网络的语音识别算法[J]. 电脑知识与技术 2020(10)
    • [25].结合相似日与改进神经网络的短期光伏发电预测[J]. 广西电业 2020(04)
    • [26].基于神经网络的流感大数据分析[J]. 中华医学图书情报杂志 2020(03)
    • [27].长短时记忆神经网络在地电场数据处理中的应用[J]. 地球物理学报 2020(08)
    • [28].基于门控循环单元神经网络的公交到站时间预测[J]. 南通大学学报(自然科学版) 2020(02)
    • [29].鼠脑神经网络的同步辐射3D成像研究[J]. 核技术 2020(07)
    • [30].基于长短记忆神经网络的短期光伏发电预测技术研究[J]. 华北电力大学学报(自然科学版) 2020(04)

    标签:;  ;  ;  ;  ;  

    地质大数据功能分析及其分类算法研究
    下载Doc文档

    猜你喜欢