论文摘要
基于向量空间模型的文本分类方法的文本表示具有高纬度、高稀疏的特点,特征表达能力较弱,且特征工程依赖人工提取,成本较高。针对该问题,提出基于双通道词向量的卷积胶囊网络文本分类算法。将Word2Vec训练的词向量与基于特定文本分类任务扩展的语境词向量作为神经网络的2个输入通道,并采用具有动态路由机制的卷积胶囊网络模型进行文本分类。在多个英文数据集上的实验结果表明,双通道的词向量训练方式优于单通道策略,与LSTM、RAE、MV-RNN等算法相比,该算法具有较高的文本分类准确率。
论文目录
文章来源
类型: 期刊论文
作者: 康雁,李晋源,杨其越,崔国荣,王沛尧
关键词: 双通道词向量,卷积胶囊网络,动态路由机制,文本分类,特征表达
来源: 计算机工程 2019年11期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用,自动化技术
单位: 云南大学软件学院
基金: 国家自然科学基金(61762092),云南省软件工程重点实验室开放基金(2017SE204)
分类号: TP391.1;TP183
DOI: 10.19678/j.issn.1000-3428.0052829
页码: 177-182
总页数: 6
文件大小: 802K
下载量: 241