基于概率主题模型的京津冀协同发展研究主题演化分析

基于概率主题模型的京津冀协同发展研究主题演化分析

论文摘要

京津冀协同发展是当前各学科领域共同关注的热点话题。为深入了解京津冀协同发展话题的研究趋势,以2009~2019年中国知网收录的14 235篇与京津冀协同发展相关的期刊论文为研究对象,采用概率主题模型方法,提出以困惑度、主题平均相似度为指标确定最优主题数,结合文献发表时间挖掘期刊论文潜在主题,从主题强度和主题相似度等多个角度分析主题演化趋势。通过数据分析,挖掘10个潜在主题,生成主题强度年度变化趋势,构建主题内容演化路径,分析主题演化规律。以期为深刻认识京津冀协同发展和科学决策提供理论依据。

论文目录

  • 1 概率主题模型
  • 2 基于LDA模型的主题演化分析方法
  •   2.1 主题演化分析流程
  •   2.2 主题识别方法
  •   2.3 主题强度检测
  •   2.4 主题相关性分析
  •   2.5 主题演化路径构建
  •     2.5.1 全局主题发展状态
  •     2.5.2 相邻时间段主题关系
  •     2.5.3 主题演化方式
  • 3 实验与分析
  •   3.1 数据采集与预处理
  •     3.1.1 数据来源
  •     3.1.2 数据预处理
  •   3.2 主题检测与识别
  •     3.2.1 确定最优主题数
  •     3.2.2 文献-主题分布与主题-词语分布
  •   3.3 主题强度年度分析
  •   3.4 主题内容演化分析
  •     3.4.1 热点主题
  •     3.4.2 趋热主题
  •     3.4.3 新兴主题
  • 4 结论
  • 文章来源

    类型: 期刊论文

    作者: 赵杰,李海峰,李纯果

    关键词: 京津冀协同发展,概率主题模型,主题提取,主题演化

    来源: 科学技术与工程 2019年36期

    年度: 2019

    分类: 工程科技Ⅱ辑,信息科技

    专业: 计算机软件及计算机应用

    单位: 河北大学电子信息工程学院,河北大学计算机教学部,河北大学数学与信息科学学院

    基金: 河北大学研究生创新资助项目(hbu2020bs006),河北大学校内人才培养项目(521000981094)资助

    分类号: TP391.1

    页码: 225-234

    总页数: 10

    文件大小: 2668K

    下载量: 197

    相关论文文献

    标签:;  ;  ;  ;  

    基于概率主题模型的京津冀协同发展研究主题演化分析
    下载Doc文档

    猜你喜欢