基于双通道词向量的卷积胶囊网络文本分类

基于双通道词向量的卷积胶囊网络文本分类

论文摘要

基于向量空间模型的文本分类方法的文本表示具有高纬度、高稀疏的特点,特征表达能力较弱,且特征工程依赖人工提取,成本较高。针对该问题,提出基于双通道词向量的卷积胶囊网络文本分类算法。将Word2Vec训练的词向量与基于特定文本分类任务扩展的语境词向量作为神经网络的2个输入通道,并采用具有动态路由机制的卷积胶囊网络模型进行文本分类。在多个英文数据集上的实验结果表明,双通道的词向量训练方式优于单通道策略,与LSTM、RAE、MV-RNN等算法相比,该算法具有较高的文本分类准确率。

论文目录

  • 0 概述
  • 1 分布式特征提取方法
  • 2 卷积胶囊网络模型
  •   2.1 双通道词向量层
  •   2.2 N-gram卷积层
  •   2.3 初始胶囊层
  •   2.4 动态路由
  •   2.5 分类胶囊层
  •   2.6 卷积胶囊网络架构
  • 3 实验结果与分析
  •   3.1 实验数据集
  •   3.2 实验参数
  •   3.3 结果分析
  • 4 结束语
  • 文章来源

    类型: 期刊论文

    作者: 康雁,李晋源,杨其越,崔国荣,王沛尧

    关键词: 双通道词向量,卷积胶囊网络,动态路由机制,文本分类,特征表达

    来源: 计算机工程 2019年11期

    年度: 2019

    分类: 信息科技

    专业: 计算机软件及计算机应用,自动化技术

    单位: 云南大学软件学院

    基金: 国家自然科学基金(61762092),云南省软件工程重点实验室开放基金(2017SE204)

    分类号: TP391.1;TP183

    DOI: 10.19678/j.issn.1000-3428.0052829

    页码: 177-182

    总页数: 6

    文件大小: 802K

    下载量: 241

    相关论文文献

    标签:;  ;  ;  ;  ;  

    基于双通道词向量的卷积胶囊网络文本分类
    下载Doc文档

    猜你喜欢