论文摘要
针对通过Extractive方式实现自动文摘而存在文本连贯性欠缺和出现未登录词问题,提出一种基于改进Encoder-Decoder模型的新闻摘要生成方法。首先,在数据预处理的过程中融入额外的语言特征,如词语的词性和TF-IDF,使词语具有多维度的含义;其次,采用Decoder/Pointer机制在摘要中指向原文本中的位置对低频词进行处理;最后,采用注意力机制来协助模型记忆输入数据并确定其注意程度。在News2016zh数据集上进行实验,结果表明基于改进Encoder-Decoder模型与基线Encoder-Decoder相比,ROUGE-1、ROUGE-2和ROUGE-L值分别提高了32.1%、30.5%和32.5%,在摘要连贯性方面也得到了较好提升。
论文目录
文章来源
类型: 期刊论文
作者: 李晨斌,詹国华,李志华
关键词: 自动文摘,新闻摘要,融入特征,注意力机制,连贯性
来源: 计算机应用 2019年S2期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用
单位: 杭州师范大学信息科学与工程学院
基金: 浙江省自然科学基金资助项目(LY17D060005)
分类号: TP391.1
页码: 20-23
总页数: 4
文件大小: 410K
下载量: 145