本文以层次聚类模型和SVM算法为基础,结合统计学方法,来证明《红楼梦》前八十回和后四十回作者不同。利用MATLAB统计十个特征汉字"红、忖、困、倦、很、其、吗休、之、吃"在前八十回和后四十回中出现的次数,并以10回为一个步长将120回分为12个样本,用层次聚类法进行聚类分析,根据聚类结果可以分成两类,分别是前8个样本为一类,后4个样本为一类,由此证明了前八十回和后四十回的作者不同。本文从《红楼梦》前八十回和后四十回中某些字的使用频率的不同,通过建立数学模型证明了前八十回和后四十回作者不同。
类型: 期刊论文
作者: 王晔,王翰琦,苑博伟
关键词: 作者解析,层次聚类,算法,频率
来源: 中国新通信 2019年13期
年度: 2019
分类: 信息科技,基础科学,哲学与人文科学
专业: 数学,中国文学
单位: 大连理工大学
分类号: I207.411;O213
页码: 191
总页数: 1
文件大小: 975K
下载量: 141
本文来源: https://www.lunwen90.cn/article/d0e738979c274212572825e5.html