【摘要】近年来,大量的有关产品或服务的在线评论信息在众多网站涌现,如何基于在线评论进行决策分析是一个值得关注的研究问题。提出了一种基于情感分析和证据理论的多属性在线评论决策方法,在该方法中,首先针对决策者关注的备选方案及属性采集相应的在线评论;然后针对采集的多属性在线评论进行情感分析并得到在线评论针对各属性在不同情感强度等级上出现的频次;进一步,依据证据理论,将在线评论在不同情感强度等级上出现的频次转化为针对不同情感强度等级的信任度,并依据证据合成规则将备选方案各属性的信任度集结为综合信任度;在此基础上,通过计算所有备选方案的效用值,进而得到方案的排序结果用于决策者购买决策;最后,以基于汽车之家网站的在线评论信息进行汽车购买决策为例说明了该方法的可行性和有效性。
关键词:多属性在线评论决策;情感分析;证据理论;方案排序
近年来,随着互联网和电子商务的迅猛发展,在众多网站涌现大量的消费者关于产品或服务的在线评论[1],如亚马逊、汽车之家等网站。研究表明[2-3],在线评论对于广大消费者了解产品或服务并做出购买决策具有重要作用。需要指出的是,如何依据大量的在线评论支持决策者(如消费者)进行决策分析(如产品购买决策),这是一个需要解决的决策问题。由于方案(如产品或服务)针对属性的在线评论通常为文本数据形式,故基于文本信息的多属性决策问题与传统的基于清晰数[4]、区间数[5]、模糊数或语言评价短语[6]等信息形式的多属性决策问题有着明显的区别。因此,研究多属性在线评论决策方法具有重要意义。
目前,关于多属性在线评论决策方法的研究还不多见,但可以看到一些相关的研究成果[7-14]。Peng等[7]通过分析产品的在线评论从中提取产品特征词并统计特征词出现频率来确定产品特征权重,再依据专家给出的产品关于特征的模糊决策矩阵,使用模糊PROMETHEE法对竞争产品进行排序。Kang等[8]通过分析移动服务的在线评论从中提取名词短语,并由专家基于名词短语确定评价移动服务的特征(属性)词典,提取评论中的动词短语、形容词短语和副词短语构建情感词典,并将情感词依据情感强度划分为5个强度等级,每个等级赋不同的值;基于特征(属性)词在评论中出现的频次确定属性权重,并通过计算移动服务各属性情感词得分确定基于情感词得分的评价矩阵;进一步,依据权重和评价矩阵,利用VIKOR方法对备选移动服务客户满意度进行排序。Chen等[9]利用主题建模方法从产品在线评论中提取并确定正向评论和负向评论的产品属性及属性初始权重矩阵,并利用WVAP方法获得最终产品正向评论和负向评论的属性权重矩阵,应用MDS方法绘制可视化产品市场结构图。进一步,利用TOPSIS方法对可视化产品市场结构中竞争产品进行排序。Zhang等[10]通过将在线评论拆分为句子并标记词语判断产品在线评论语句的情感极性,依据产品评论的情感极性建立有向加权特征图确定产品排序。Zhang等[11]通过分析产品在线报告建立产品特征集以及标注各产品特征在线评论的情感极性(正向或负向),并依据产品评论的情感极性建立有向加权特征图确定产品排序;在此基础上,Zhang等[12]通过引入评论帮助性投票和评论发布日期等信息确定在线评论的重要性权重进而对文献[11]中的方法进行了扩展。Najmi等[13]依据产品在线评论及产品说明书选择并确定产品特征(属性),并依据用户的优先级确定产品属性权重;采用改进Page-Rank排序算法对产品品牌排序,利用支持向量机对产品评论进行有用性分析并利用有用性分析计算结果对产品在线评论进行排序;在此基础上,根据产品品牌排序结果以及产品在线评论排序结果对产品进行排序。Wang等[14]通过情感分析提取在线评论中产品特征-意见对,将特征-意见对作为变量构建反映在线评论和消费意向的计量经济学模型,并基于该模型确定基于在线评论的产品特征(属性)排序。上述方法的提出为解决多属性在线评论决策问题提供了较好的思路和支撑。但需要指出的是,已有的关于利用在线评论对方案(产品或服务)进行排序的方法所考虑的在线评论均是针对方案(产品或服务)的整体给出的,并没有考虑在线评论是针对方案(产品或服务)特征(属性)给出的情形。另外,已有方法较少考虑在线评论信息中评论情感词的强度(大多只分为正向情感和负向情感[7,9-13]),即使一些方法考虑了情感词强度[8]也是通过给各档情感词赋不同值计算各方案关于特征(属性)情感得分评价矩阵,这样处理不能体现在线评论信息在各情感强度上的评价结果,虽然文献[14]中给出了基于情感强度分析的产品特征(属性)排序,但没有给出综合产品各特征(属性)情感的总体排序。
美国对伊朗的制裁是一种国家间的系统性政治风险,最好的解决办法是由中国政府出面,同美国一起寻找到合适的长期解决办法。同时,从中美经贸摩擦的深层矛盾分析,无论美国在180天后是否会延长给与中国的“重大削减例外”豁免,中国都应该对美国的制裁政策制定和出台系统应对措施。
最近,争创“双一流”大学已然成为热词。人们都在思考,怎样才能创好这个双一流?在我看来,这个问题虽然说复杂也够复杂的了,但也并非不能“简而言之”。那就是,什么时候能使高校的师生们有了免于干“无意义的工作”的自由,有了免于“无事忙”的自由,有了免于搞各种形式主义弄虚作假的自由,给他们一个安安静静的办公桌和课桌,这“双一流”也就“行百里半五十”了。(注意,不是“行百里半九十”的意思)
基于此,本文给出一种基于情感分析和证据理论的多属性在线评论决策方法。在该方法中,首先从备选方案(产品或服务)各属性的在线评论信息中提取评论的情感词,通过情感分析确定评价各属性的情感强度等级词典,并依据属性情感强度等级词典,识别属性各条在线评论信息归属的情感强度等级或不确定性情感等级,并统计属性被评论为各情感强度等级的频次,进一步给出基于证据理论的决策方法。
1 问题描述
将情感强度等级指示矩阵中第r列求和,得到方案Ai关于属性Cj的Gij条在线评论中情感强度等级的评论频次为
A={A1,A2,…,Am}——决策者关注的m个备选方案的集合,其中Ai为决策者关注的第i个备选方案,i=1,2,…,m。
C={C1,C2,…,Cn}——决策者关注的n个属性的集合,其中Cj为决策者关注的第j个属性,j=1,2,…,n。
w=(w1,w2,…,wn)—— 决策者关注的属性的权重向量,其中wj为属性Cj的权重或重要程度,满足wj≥0且,j=1,2,…,n,属性权重向量由决策者给出。
Gij——参与方案Ai关于属性Cj的在线评论的用户数,i=1,2,…,m;j=1,2,…,n。
本文要解决的问题是依据备选方案(产品或服Rij=——方案Ai关于属性务)的在线评论和属性权重w=(w1,w2,…,wn),如何从备选方案集A={A1,A2,…,Am}中选择最佳方案或对备选方案进行排序。Cj的在线评论的集合,其中Rgij为第g个用户给出的方案Ai关于属性Cj的在线评论,i=1,2,…,m;j=1,2,…,n;g=1,2,…,Gij。
当心缝隙 电信号通过突触时,会转化成一种叫作“神经递质”的化学物质。神经递质在碰到下一个神经元的受体时,又会重新转化为电信号。
2 决策方法
(5)运用式(11)构建方案Ai各属性不同情感
2.1 在线评论的采集与预处理
利用爬虫软件从相关网站采集备选方案(产品或服务)关于各属性的在线评论。对采集的在线评论进行预处理,主要包括删除停用词、分词及词性标注两个部分。首先,利用人工收集整理的中文停用词表(无实在意义的词语,如“在”“的”“了”等)对在线评论中的停用词进行过滤并删除。例如,关于汽车属性油耗的在线评论“油耗低,个人的感觉已经是很省油了”,删除停用词“的”“了”后,该条在线评论变为“油耗低,个人感觉已经是很省油”。然后,采用NLPIR汉语分词系统[15]作为辅助工具对删除停用词后的在线评论进行分词、词性标注等处理,例如,“油耗/n低/a,个/q人/n感觉/n已经/d是/v很/d省/v油/n”。从完成分词和词性标注后的在线评论中,依据文献[16]中给出的准则提取形容词(如低)、否定-形容词和程度副词-形容词(如很省油)作为构建各属性情感强度等级词典的情感词。
2.2 属性评论情感强度等级词典的构建
首先,基于各属性的特点预定义各属性评论的情感强度等级参照词集;然后,将从各属性在线评论中提取的情感词与预定义的属性评论情感强度等级参照词比对,依据同义词合并的规则,确定提取的情感词的归属等级进而建立各属性评论情感强度等级词典。具体构建过程:
记是由决策者预先定义由v个奇数情感强度等级构成的评论属性Cj的有序情感强度参照词集合,其中,Lrj为评论属性Cj的第r个情感强度等级参照词,j=1,2,…,n,r=1,2,…,v。记表示负向有序情感强度等级参照词集合,表示中性
表示正向情感强度等级参照词集合。例如,决策者关注的轿车第4个属性C4为性价比(j=4),决策者预定义的由5个情感强度等级构成的有序情感强度参照词集合
特应性皮炎是一种常见的慢性复发性炎症性疾病 [12],15%-30%的儿童,2%-10%的成人受到影响,主要症状有剧烈的瘙痒、湿疹样皮损、干皮症等。AD影响12-15%的儿童,对儿童的影响包括使儿童睡不着(restless)/感到沮丧(frustrated)、影响儿童的社会化技能(social skills),导致与其他人交流退缩或缺乏,并带来潜在的心理问题,而且影响患病儿童和家长的关系。另外,AD患儿家长更感到苦恼、疲惫以及承受更大的经济负担,解决这部分患者病痛显得日益紧迫。
其中:
记为从所有备选方案关于属性Cj的在线评论中提取的情感词集合,其中,为评论属性Cj的第s个情感词,s=1,2,…,qj,qj为从属性Cj的在线评论中提取的情感词个数。对于任意一个情感词,依据其表达的情感强度与预先定义的情感强度等级参照词集}中情感词进行比对并归入相应的情感强度等级中。在对情感词进行情感强度等级归档时,可依据《同义词词林(扩展版)》[17]中的同义词词群和How Net[18]包含的评价词语集、情感词语集和程度副词词集,将情感词Wsj与预先定义的情感强度等级参照词进行比对,依据同义词归并的规则确定情感词Wsj归属的情感强度等级。这里需要指出的是,如果针对特定领域提取的情感词无法通过与文献[17-18]中同义词比对方法识别其情感强度等级时,可通过人工识别方法将该类词语归入相应的情情感强度等级参照词,感强度等级中。
记为将情感词集合中的情感词进行情感强度等级归档后建立的评论属性Cj的情感强度等级词典,其中,表示情感词集Wj中归属于情感强度等级的情感词集合,
记表示情感强度等级词典Dj中负向情感强度等级的情感词集合,表示中性情感强度等级的情感词集合,
表示正向情感强度等级的情感词集合。
2.3 在线评论的情感强度等级识别
考虑在线评论的特点:如某条在线评论不含情感词;某条在线评论既含有正向情感词又含有负向情感词;某个情感词在一条在线评论中多次出现或某个情感强度等级出现不同词语的情感词;某条在线评论含有正向或负向多个等级的情感词。本文在识别各条在线评论情感强度等级时遵循如下规则:①若某条在线评论含有正向多个等级的情感词,则将该条在线评论归入正向最高等级的情感强度集合中;若某条在线评论含有负向多个等级的情感词,则将该条在线评论归入负向最低等级的情感强度集合中。②若某条在线评论不含情感词或某条在线评论既含有非负向情感词又含有负向情感词,则将该条在线评论归入情感不确定集合中。
记为方案Ai关于属性Cj的在线评论中含有的情感词集合,其中:为方案Ai关于属性Cj的在线评论中含有情感词的个数;为第g条在线评论中包含第ψ个情感词,ψ=1,2,…,。在线评论的情感强度等级识别过程:
(1)识别并确定在线评论的非负向情感强度等级。记在线评论的情感词集合与情感强度等级词典Dj中非负向情感强度等级词典
的交集指示向量
综合上述,合肥夜间旅游尚处于起步阶段,旅游产品开发完成的是旅游景点经营时间轴上的延伸,对景点做了亮化处理和景观美化,政府或商业组织不定期地开展夜间出游活动,如夏季的广场纳凉晚会、元宵节公园赏花灯等。
其中,为方案Ai关于属性Cj的第g条在线评论与第k个非负情感强度等级的交集标注值,计算公式为
记在线评论的非负向情感强度等级指示向量,其中,为方案Ai关于属性Cj的第g条在线评论归属于情感强度等级为r的指示值,依据准则①,指示值的确定公式为
(2)识别并确定在线评论的负向情感强度等级。记在线评论的情感词集合与情感词典Dj中负向情感词典的交集指示向量,其中为方案Ai关于属性Cj的第g条在线评论与第k个情感强度等级的交集标注值,计算公式为
大会在嘹亮的国歌、队歌声中拉开帷幕,鲜艳的红领巾映红大家的脸庞。在这次大会召开之前,学校67个中队上交了100多项提案。这些提案都出自少先队员之手,涉及实践活动、学校课程、运动健身、学习环境等诸多方面,体现出少先队员浓厚的小主人翁意识。大会上,校长也对大家提出的各项提案作出回复,表示学校将会以此为出发点继续努力,争取早日实现大家的想法。
(3)确定方案Ai关于属性Cj的在线评论情感强度等级指示矩阵。基于(1)、(2),记为在线评论情感强度等级指示向量,且,则方案Ai关于属性Cj的在线评论情感强度等级指示矩阵为。
记在线评论的负向情感强度等级指示向量,其中为方案Ai关于属性Cj的第g条在线评论归属于情感强度等级为r的指示值,依据准则①,指示值的确定公式为
(4)判断在线评论是否为情感不确定。若在线评论不含情感词或与属性情感强度等级词典Dj中非负向情感强度等级词集和负向情感强度等级词集均有交集,则依据准则②,该条在线评论归入情感不确定等级集合中,记为不确定情感强度等级列指示向量,其中指示值确定公式为
(5)计算方案Ai关于属性Cj的在线评论情感强度等级的评论频次。记为方案Ai关于属性Cj的第g条在线评论的情感强度等级为时的隶属度,其判断公式为
考虑多属性在线评论决策问题,该决策问题中所涉及的集和量如下:
记为方案Ai关于属性Cj的在线评论情感强度等级为不确定的评论频次,其计算公式为
在我国教育教学改革力度不断加大的新形势下,后进生的转化工作受到了高度重视,而在小学语文教育教学活动中出现后进生的主要原因有:
(1)采集方案Ai各属性的在线评论,从各属性的在线评论中提取情感词;
2.4 基于证据理论的情感强度等级信息融合方法
由于一些在线评论的发布者对所评论方案(产品或服务)认识的局限性,其发表的关于方案(产品或服务)属性的评论可能没有表达出其情感倾向,或其发表的评论既包含正向情感倾向又包含负向情感倾向,这类评论并没有真实反映其情感倾向,具有不确定性。为了更好地处理这类既包含确定情感倾向又包含不确定情感倾向信息的多属性在线评论决策问题,本文给出一种基于证据理论的信息融合方法。证据理论是Shafer在Dempster合成法则的基础上提出的,它能够处理不知道和不确定信息[19]。基于证据理论的情感强度等级信息融合方法的具体过程:
设L={L1,L2,…,Lv}为评论备选方案(产品或服务)的情感强度等级集合,其中,Lr表示第r个情感强度等级,r越大,情感强度等级越高。将评论方案的情感强度等级集合L={L1,L2,…,Lv}视为识别框,将属性集合C={C1,C2,…,Cn}视作证据集。
首先,依据方案Ai关于属性Cj的在线评论中情感强度等级Lrj的评论频次trij和不确定情感强度等级的评论频次,计算方案Ai关于属性Cj的在线评论在情感强度等级、不确定情感强度等级的概率分别为:
式中,且。
然后,依据证据理论,将方案Ai第j个属性的在线评论关于识别框L情感强度等级为Lr的概率、不确定情感强度等级Lu的概率可用分布形式分别表示为:
式中,分别为方案Ai相对于第j个证据在情感强度等级Lr、不确定情感强度等级Lu的信任度,有,且。
式中,U(L1)=0,U(Lv)=1,且对所有评价等级的效用有U(L1)<U(L2)<…<U(Lv)。这里需要说明的是,关于情感强度等级的效用评估,可以认为各情感强度等级服从等距分布[20-21],也可以依据决策者的偏好信息进行估计[22]。
PANG Tao, LU Wen-quan, CHEN Xiao-ling, CHEN Wan-sheng
之后,将方案Ai针对多个证据的不同情感强度等级的信任度分配函数进行集结。记CJ(j)={C1,C2,…,Cn}为前j(j=1,2,…,n-1)个证据的集合,为CJ(j)中所有证据支持方案Ai被评为情感强度等级Lr的信任度分配函数,为不确定情感强度等级的信任度分配函数,则和可以通过对前j个证据的信任度分配函数进行合成得到,具体计算公式为:
式中,Ki,J(j+1)为归一化因子,反映了各证据间相互冲突的程度,即各属性不同时支持方案Ai被评价为某一情感强度等级的程度。特别地,有
入库河道中丰富的生物物种,形成了一个复杂、动态平衡的生态系统。多样的生物物种和适宜的河道环境(水环境、地形条件、水文条件等)是河流系统可持续发展的基本要素条件。因此,入库河道生态建设需综合考虑生物的栖息条件,为生物生长、发育、捕食、繁殖等创造适宜条件,保护和恢复入库河道生态系统的完整性和多样性,从而维持河道的可持续发展需要。
因此,对n个证据下的情感强度等级信任度分配函数进行集结,可得方案Ai关于各情感强度等级的综合信任度为
式中,表示方案Ai被评为不确定情感强度等级的信任度。
2.5 基于效用值的方案优选(排序)方法
基于方案Ai关于各属性情感强度等级的综合信任度,可对备选方案进行排序。首先,需要对v个情感强度等级的效用进行评估。依据文献[20-21],本文假设v个情感强度等级的效用服从等距分布,记情感强度等级Lr的效用为
进一步,构建方案Ai关于属性Cj的在线评论在情感强度等级Lr、不确定情感强度等级Lu上的信任度分配函数分别为:
然后,依据U(Lr)和βri计算方案Ai的总效用值为强度等级上的信任度分配函数;
显然,U(Ai)越大,方案Ai越好。因此,依据U(Ai)值的大小,可以选择最优方案或对所有备选方案进行排序。
综上所述,基于情感分析和证据理论的多属性在线评论决策方法的计算步骤如下:
依据式(7)、(8)可得各情感强度等级的评论频次,记集合,其中,为针对方案Ai关于属性Cj的在线评论情感强度等级的评论频次。
(2)构建评论各属性的情感强度等级词典Dj;
新疆轮台工程位于天山南麓,为典型的暖温带大陆性干旱气候,平均气温为11.1 ℃,历年极端最低温度-25.5 ℃,暖风器的进风温度按冬季采暖室外计算温度-11 ℃,暖风器出口空气温度30 ℃。经咨询电厂暖风器的运行情况,暖风器出口风温能满足系统设计要求。
(3)依据属性情感强度等级词典Dj,利用式(1)~(6)识别方案Ai各属性的每条在线评论归属的情感强度等级,并运用式(7)、(8)计算不同情感强度等级的评论频次;
(4)运用式(9)、(10)将方案Ai各属性在不同情感强度等级的评论频次转化为不同情感强度等级的信任度;
本文给出的决策分析方法的基本思路:首先,采集备选方案关于各属性的在线评论,提取各属性在线评论中的情感词;然后,预定义各属性评论的情感强度等级参照词集,将提取的情感词与情感强度等级参照词集比对进行同义词归类来构建属性评论的情感强度等级词典,依据构建的属性评论的情感强度等级词典,识别每条在线评论归属的情感强度等级,统计属性在各情感强度等级下的评论频次;进一步,依据证据理论,将各情感强度等级下的评论频次转化为关于评论方案的情感强度等级的信任度,并基于证据合成规则计算各备选方案关于评论方案的各情感强度等级的综合信任度;在此基础上,通过计算所有备选方案的效用值来确定备选方案排序或优选方案。
(6)运用式(12)针对不同属性的各情感强度等级的信任度分配函数进行合成;
(7)运用式(13)计算每个方案关于各情感强度等级的综合信任度;
但这样的“灰姑娘和王子幸福地生活在一起”,却让人感到满满的安全感和信任感。或许是因为,他们都是有能力把日子过好的人。
(8)运用式(14)、(15)计算每个方案的总效用值U(Ai),并依据U(Ai)值的大小对方案进行优选或对所有备选方案进行排序。
解析:A选项,标准状况下,三氧化硫是固体,错误。B选项,气体应为SO2和H2的混合气,只有在标准状况下,结论才正确。C选项,CH4分子中C、H原子个数比与状况及CH4的多少无关,正确;D选项,质量与状况无关,11.2g乙烯的物质的量为0.4 mol,1mol乙烯分子中共用电子对数目为6个,故11.2g乙烯中含有的共用电子对数目为2.4NA。
3 实例分析
为说明本文给出方法的可行性,下面考虑一个轿车购买的决策问题。假设某潜在消费者欲购置一辆价格在15~20万元的轿车,其关注的4款轿车分别是别克君威(A1)、本田雅阁(A2)、起亚K5(A3)和雪佛兰迈锐宝(A4),较为关注轿车的4个属性分别为动力(C1)、油耗(C2)、舒适性(C3)和性价比(C4)。该潜在消费者给出的属性权重向量w=(0.2,0.35,0.15,0.3)。为了辅助该潜在消费者购买决策,下面运用本文提出的决策方法给出部分计算过程与结果。
首先,利用爬虫软件(火车头采集器)从汽车之家(www.autohome.com.cn)网站采集潜在消费者关注的4款备选轿车关于4个属性的在线评论,采集得到的在线评论信息示例如表1所示,4款备选轿车关于4个属性的在线评论用户数如表2所示。对采集的在线评论中的停用词进行删除,并采用NLPIR汉语分词系统对删除停用词后的在线评论进行分词、词性标注。从完成分词和词性标注后的在线评论中,提取各属性评论的情感词(示例)如表3所示。
表1 采集的在线评论示例
动力 力量较好,提速快动力 动力平顺,油门响应快油耗 稍微偏高,拥堵路段能上十五六个油油耗 油耗还行,能够接受,购车到现在,一直没有将油耗清零,平均时速37,油耗10.2舒适性 座椅着实舒服,家用首选车舒适性 绝对舒适,80码音乐15高速完全与在家听歌一样性价比 性价不错,这个价格的中级车,还是豪华版,挺值得性价比 车子的价格与性能外观综合来说,这个价位值
表2 各备选轿车不同属性下的在线评论用户数
C 1 C 2 C 3 C 4 A 1 227 257 228 174 A 2 172 184 166 225 A 3 174 225 170 173 A 4 206 238 204 204
表3 各属性的在线评论提取的情感词示例
C 1较好快不错够劲尚可平顺很猛很足很喜欢很舒服很好一般强劲有点慢C 2偏高很低一般不错还行正常非常省良好很满意很省比较多 十分满意 较满意C 3比较好好不错还好一般非常好很好稍硬舒服绝对舒适非常满意 适中 太硬 不满意C 4高一般还可以稍微贵很值很贵超值很高值确实高不错不合适 不划算
其次,根据关注的备选轿车的4个属性的特点,预定义各属性评论的情感强度等级参照词集分别为:
将从各属性的在线评论中提取的情感词与预定义的各属性在线评论的情感强度等级参照词进行比对,可建立各属性在线评论的情感强度等级词典。依据构建的属性情感强度等级词典,运用式(1)~(6)可识别每款备选轿车每个属性每条在线评论的情感强度等级。进一步,运用式(7)、(8)可计算每款备选轿车关于每个属性不同情感强度等级、不确定情感强度等级的评论频次。运用式(9)可计算每款备选轿车针对每个属性在线评论分布在不同情感强度等级的概率。运用式(10)可将关于各属性在线评论在不同情感强度等级的概率转化为关于评论方案各属性的情感强度等级的信任度,结果如表4所示。
表4 关于评论方案各属性的情感强度等级的信任度
C 1 C 2 C 3 C 4 A 1A2 A 3(L 1,0.017 6),(L 2,0.123 3),(L 3,0.132 2),(L 4,0.167 4),(L 5,0.506 6)(L 1,0.017 4),(L 2,0.058 1),(L 3,0.180 2),(L 4,0.412 8),(L 5,0.261 6)(L 1,0.017 2),(L 2,0.172 4),(L 3,0.201 1),(L 4,0.298 9),(L 5,0.264 4)(L 1,0.038 9),(L 2,0.280 2),(L 3,0.369 6),(L 4,0.124 5),(L 5,0.027 2)(L 1,0.005 4),(L 2,0.070 7),(L 3,0.146 7),(L 4,0.250 0),(L 5,0.304 3)(L 1,0.008 9),(L 2,0.160 0),(L 3,0.204 4),(L 4,0.217 8),(L 5,0.173 3)(L 1,0.017 5),(L 2,0.149 1),(L 3,0.179 8),(L 4,0.263 2),(L 5,0.372 8)(L 1,0.024 1),(L 2,0.114 5),(L 3,0.180 7),(L 4,0.319 3),(L 5,0.319 3)(L 1,0.011 8),(L 2,0.158 8),(L 3,0.147 1),(L 4,0.229 4),(L 5,0.394 1)(L 1,0.027 0),(L 2,0.022 5),(L 3,0.225 2),(L 4,0.319 8),(L 5,0.373 9)(L 1,0.029 1),(L 2,0.122 1),(L 3,0.232 6),(L 4,0.279 1),(L 5,0.267 4)(L 3,0.109 8),(L 4,0.260 1),(L 5,0.566 5)A 4(L 1,0.019 4),(L 2,0.053 4),(L 3,0.101 9),(L 4,0.257 3),(L 5,0.524 3)(L 1,0.021 0),(L 2,0.176 5),(L 3,0.340 3),(L 4,0.155 5),(L 5,0.117 6)(L 1,0.009 8),(L 2,0.078 4),(L 3,0.161 8),(L 4,0.392 2),(L 5,0.333 3)(L 3,0.019 6),(L 4,0.259 8),(L 5,0.701 0
再次,依据证据理论,运用式(11)构建每款备选轿车针对各属性的不同情感强度等级上的信任度分配函数,计算结果如表5所示。运用式(12)将每款备选轿车针对不同属性的各情感强度等级信任度分配函数进行合成。运用式(13)计算每款备选轿车关于各情感强度等级的综合信任度,计算结果如表6所示。
听安文浩这样问,伯虎心中猛地一阵惊喜,仿佛得知自己中了彩票一般,看样子请他出山这事,这会儿总算有着落了。这样看来,自己未来即将实施的“那个”重要计划此时也算成功走出了第一步……想到这儿,他正准备好好答复安文浩。刚要开口,没成想就在此刻忽然又出现了“黑天鹅”——他手腕上的智能手环这时猛地亮了起来,像是突然闪起的照明灯一般,随即便又是一阵苍蝇飞过般的骚动。这不由得使伯虎一惊,他马上低下头,只见智能手环上的消息灯此时正不停地闪烁——而且是急速查看消息。
表5 各备选轿车针对各属性的信任度分配函数
A i C j m 1ij m 2 ij m 3 ij m 4 ij m 5 ij m u ij A 1 C 1 0.003 5 0.024 7 0.026 4 0.033 5 0.101 3 0.010 6 C 2 0.007 8 0.056 0 0.073 9 0.024 9 0.005 4 0.031 9 C 3 0.003 5 0.029 8 0.036 0 0.052 6 0.074 6 0.003 5 C 4 0.006 9 0.005 7 0.057 5 0.081 6 0.095 4 0.008 0 A 2 C 1 0.006 1 0.020 3 0.063 1 0.144 5 0.091 6 0.024 4 C 2 0.001 9 0.024 7 0.051 4 0.087 5 0.106 5 0.078 0 C 3 0.008 4 0.040 1 0.063 3 0.111 7 0.111 7 0.014 8 C 4 0.007 8 0.032 7 0.062 2 0.074 7 0.071 6 0.018 7 A 3 C 1 0.002 6 0.025 9 0.030 2 0.044 8 0.039 7 0.006 9 C 2 0.001 3 0.024 0 0.030 7 0.032 7 0.026 0 0.035 3 C 3 0.001 8 0.023 8 0.022 1 0.034 4 0.059 1 0.008 8 C 4 0 0 0.016 5 0.039 0 0.085 0 0.009 5 A 4 C 1 0.005 8 0.016 0 0.030 6 0.077 2 0.157 3 0.013 1 C 2 0.006 3 0.052 9 0.102 1 0.046 6 0.035 3 0.056 7 C 3 0.002 9 0.023 5 0.048 5 0.117 6 0.100 0 0.007 4 C 4 0 0 0.005 9 0.077 9 0.210 3 0.005 9
表6 备选轿车关于各情感强度等级的综合信任度
A i L 1 L 2 L 3 L 4 L 5 A 1 0.000 8 0.023 0 0.165 8 0.206 1 0.551 9 A 2 0.001 4 0.017 9 0.102 4 0.475 6 0.351 8 A 3 0.000 5 0.019 6 0.065 5 0.247 2 0.616 1 A 4 0 0 0.009 5 0.197 7 0.737 9
最后,运用式(14)计算各情感强度等级的效用值分别为:
运用式(15)计算每款备选轿车的效用值分别为:
从而得到4款备选轿车的排序结果为:A4≻A3≻A1≻A2,最优方案为A4(雪佛兰迈锐宝)。
4 结 语
本文给出了一种基于情感分析和证据理论的多属性在线评论决策方法。该方法首先依据方案各属性的在线评论,通过情感分析,确定方案各属性的在线评论在不同情感强度等级的评论频次;然后,依据证据理论,将各属性不同情感强度等级的评论频次转化为不同情感强度等级的信任度,并利用证据合成规则集结不同属性的信任度得到方案的综合信任度;在此基础上,计算方案的效用值进而对所有方案进行排序或优选。与已有相关方法不同的是,本文方法考虑的在线评论是针对方案(产品或服务)属性给出的情形,并着重考虑了在线评论中评论情感词的强度以及评论信息包含不确定情感(如某一条在线评论中不含情感词或某一条在线评论中既含有非负向情感词又含有负向情感词)的情况,进而运用证据理论来解决此问题。本文给出的方法具有概念清晰、计算过程简单等特点,具有较强的可操作性和实用性,对于解决现实中的多属性在线评论决策问题提供了一种途径,具有实际应用价值。
参考文献:
[1]Chen H,Chiang R H L,Storey V C.Business intelligence and analytics:From big data to big impact[J].MIS Quarterly,2012,36(4):1165-1188.
[2]Ye Q,Law R,Gu B,et al.The influence of usergenerated content on traveler behavior:An empirical investigation on the effects of e-word-of-mouth to hotel online bookings[J].Computers in Human Behavior,2011,27(2):634-639.
[3]张紫琼,叶强,李一军.互联网商品评论情感分析研究综述[J].管理科学学报,2010,13(6):84-96.
[4]樊治平.多属性决策的一种新方法[J].系统工程,1994,12(1):15-17.
[5]Sengupta A,Pal T K.On comparing interval numbers[J].European Journal of Operational Research,2000,127(1):28-43.
[6]Herrera F,Herrera-Viedma E,Martínez L.A fusion approach for managing multi-granularity linguistic term sets in decision making[J].Fuzzy Sets and Systems,2000,114(1):43-58.
[7]Peng Y,Kou G,Li J.A fuzzy PROMETHEE approach for mining customer reviews in Chinese[J].Arabian Journal for Science and Engineering,2014,39(6):5245-5252.
[8]Kang D,Park Y.Review-based measurement of customer satisfaction in mobile service:Sentiment analysis and VIKOR approach[J].Expert Systems with Applications,2014,41(4):1041-1050.
[9]Chen K,Kou G,Shang J,et al.Visualizing market structure through online product reviews:Integrate topic modeling,TOPSIS,and multi-dimensional scaling approaches[J].Electronic Commerce Research and Applications,2015,14(1):58-74.
[10]Zhang K,Narayanan R,Choudhary A.Mining online customer reviews for ranking products[R].Technical Report,EECS(Electrical Engineering and Computer Sciences)Department.Northwestern University,2009.
[11]Zhang K,Narayanan R,Choudhary A.Voice of the customers:Mining online customer reviews for product feature-based ranking[C]//Proceedings of the 3rd Conference on Online Social Networks.[s.l.]:[s.n.],2010:11-11.
[12]Zhang K,Cheng Y,Liao W K,et al.Mining millions of reviews:A technique to rank products based on importance of reviews[C]//Proceedings of the 13th International Conference on Electronic Commerce.[s.l.]:[s.n.],2011:12-12.
[13]Najmi E,Hashmi K,Malik Z,et al.CAPRA:A comprehensive approach to product ranking using customer reviews[J].Computing,2015,97(8):843-867.
[14]Wang W,Wang H,Song Y.Ranking product aspects through sentiment analysis of online reviews[J].Journal of Experimental&Theoretical Artificial Intelligence,2017,29(2):227-246.
[15]中国科学院.NLPIR汉语分词系统[EB/OL].[2016-11-15].http://ictclas.nlpir.org/.
[16]郑丽娟,王洪伟,郭恺强.基于情感词模糊统计的网络评论情感强度的研究[J].系统管理学报,2014,23(3):324-330.
[17]哈尔滨工业大学.《同义词词林》扩展版[EB/OL].[2013-10-16].http://www.ir-lab.org/.
[18]董振东.How Net[EB/OL].[2013-10-16].http://www.keenage.com.
[19]Wang J,Yang J B,Sen P.Safety analysis and synthesis using fuzzy sets and evidential reasoning[J].Reliability Engineering&System Safety,1995,47(2):103-118.
[20]Yang J B.Rule and utility based evidential reasoning approach for multiattribute decision analysis under uncertainties[J].European Journal of Operational Research,2001,131(1):31-61.
[21]Winston W L.Operations research applications and algorithms[M].California:Duxbury Press,1994.
[22]Keeney R L,Raiffa H.Decisions with multiple objectives:Preferences and value trade-offs[M].Cambridge:Cambridge University Press,1993.
Multi-Attribute Online Review Decision Making Method Based on Sentiment Analysis and Evidence Theory
YOU Tianhui,ZHANG Jin,FAN Zhiping
(School of Business Administration,Northeastern University,Shenyang 110167,China
【Abstract】In recent years,a large amount of online review information on products or services emerges on many websites.Therefore,it is worthwhile to make decision analysis based on online.A method for multi-attribute online review decision was proposed based on the sentiment analysis and evidence theory.First,online reviews with respect to each attribute of alternatives concerned by decision maker were collected.Then,the different emotional intensity level frequency of online reviews collected with respect to each attribute was obtained using the sentiment analysis.After that,according to the evidence theory,the different emotional intensity level frequency of online reviews was transformed into a degree of belief which was assigned to the different emotional intensity levels.According to the evidence synthesis rules,the comprehensive degree of belief was obtained by integrating the degree of belief with respect to each attribute of alternatives,based on which,the overall utility value of each alternative was calculated,and the ranking result of all alternatives were determined.Finally,a car purchase example based on the online review information from https://www.autohome.com.cn was used to illustrate the feasibility and validity of the proposed method.
Key words:multi-attribute online review decision making;sentiment analysis;evidence theory;alternative ranking
中图分类号:C 934
文献标志码:A
文章编号:1005-2542(2019)03-0536-09
收稿日期:2016-12-30
修订日期:2017-07-04
基金项目:国家自然科学基金资助项目 (71271049,71571039);中央高校基本科研业务经费资助项目 (N140607001
作者简介:尤天慧(1967-),女,教授,博士生导师。研究方向为管理决策分析。
通信作者:张 瑾(1989-),女,博士生。E-mail:zjin0709@163.com
标签:在线论文; 情感论文; 强度论文; 等级论文; 属性论文; 社会科学总论论文; 管理学论文; 决策学论文; 《系统管理学报》2019年第3期论文; 国家自然科学基金资助项目(71271049; 71571039)中央高校基本科研业务经费资助项目(N140607001)论文; 东北大学工商管理学院论文;