石川:基于用户心理的网络舆情指标体系构建研究论文

石川:基于用户心理的网络舆情指标体系构建研究论文

摘 要:从用户心理角度出发,结合情感、行为、认知三个方面研究网络舆情特点,基于不同粒度提出一套层次网络舆情指标体系。采用该指标体系对舆情事件态势进行分析,并对舆情事件热度进行预测,以期达到把握舆情走向,并对舆情事件进行预警的目的。以新浪微博事件为数据,进行指标体系实验分析。结果表明,提出的指标体系能够很好地刻画舆情事件态势,与舆情发展变化规律相吻合,同时可以达到很好的事件热度预测效果。

关键词:舆情指标体系;情感;行为;认知;网络舆情

一、引 言

信息时代的蓬勃发展,使得互联网成为社会舆论的放大器,越来越多的网民通过网络来表达自己的观点和态度。突发事件爆发后,网民和媒体的主动行为或随机行为会使网络上随之出现各种消息,从而引起公众的不断讨论,并逐渐产生具有影响力的公众情感倾向,进而形成网络舆情[1]。如果不能准确把握网络舆情传播规律,采取有效管理方法,将给社会舆论安全乃至国家稳定与和谐带来一系列消极影响[2]。因此,合理构建舆情指标体系,准确分析舆情发展趋势,及时对负面消息进行干预至关重要。

近些年来,国内外关于舆情指标体系的研究呈现逐年递增的态势,相关研究热点主要集中在舆情分析、舆情监测、舆情监控、舆情预警和舆情传播五个方面[3]。构建舆情指标体系是研究舆情的一个重要方法。在该领域中,很多学者从不同角度开展研究,以解决不同的实际问题。早期的研究多数只是提出指标体系的内容并解释含义,而没有在实例上验证其可靠性。随后,机器学习方法不断兴起,学者们开始着重对指标体系的量化进行研究,并结合机器学习方法给出具体的实验验证,使得指标体系的构建更加有理有据。但是,现有指标体系多数只是从舆情事件的角度提出,而没有考虑参与到舆情事件传播过程中的舆情发布者与受众。基于此,笔者从用户心理角度出发,提出一套指标体系,试图更全面捕捉用户与舆情事件在传播过程中的变化细节。该体系采用经典的态度三要素理论,即基于情感、行为、认知为一级指标,构建一套完备的层次指标体系。从这三个角度出发恰好吻合人的心理结构,三者相辅相成,可以更好地刻画用户对舆情事件的感知,具有较强的说服力。本文单独将指标体系的末级指标用于把握舆情事件的发展态势,即通过单个末级指标量化值的变化,达到有效监测舆情事件从发生到逐渐消退的过程的目的。另外,为了更好地应用指标体系进行舆情事件分析,准确地预测舆情热度及进行舆情干预等工作,将指标体系末级指标量化为模型特征,构建了基于逻辑回归的舆情热度分析模型。

二、研究现状

随着互联网技术的不断发展,我国的网络舆情研究取得显著进展。其中,构建网络舆情指标体系是研究舆情的一个重要方法,它是一种将抽象的舆情内容及其传播过程中的相关信息转为可以量化的指标的方法,从而为舆情研究提供便利。

关于舆情指标体系的构建,冯江平等[4]从政府、网媒、网民三个角度出发,构建了包括政府舆情应对能力、网媒舆情热度、网民心理特征在内的网络舆情评价指标体系。戴媛等[2]12深入挖掘互联网上所体现的舆情演变规律,构建了网络舆情信息在传播扩散、民众关注、内容敏感性、态度倾向性四个维度的安全评估指标体系。陈建敏等[5]提出具有5个一级指标的涉军网络舆情安全评估指标体系,包括发布者指标、受众指标、激体指标、本体指标和传播指标。Lin等[6]构建了舆情早期阶段预警的指标体系,并利用层次分析法计算不同指标的权重。瞿志凯等[7]在研究暴恐事件及网络舆情影响因素的基础上,构建了包含暴恐事件、信息特性、媒体报道、网民反应四个维度的暴恐事件网络舆情的风险预警指标体系,并对其进行权重计算。Zhao等[8]对微博用户行为、信息传播和趋势进行实时监测和特征分析,以达到全面深入评估的目的。早期关于指标体系的研究多数只是给出了指标体系的内容及相关含义,很少对指标体系内容进行量化分析或是对指标体系的合理性进行实验验证。

近年来,生态旅游业发展火爆,各地都在积极开发生态旅游事业,取得了一定的成效,生态旅游已经成为旅游业可持续发展的有效途径。在发展生态旅游业的过程中,也遇到了一些问题和阻碍,没有有效发挥生态旅游对环境保护的积极作用,对此,还需要进一步提升认识,积极组织开展生态旅游,推进生态旅游发展模式的不断优化,才能促进生态旅游和环境保护的协同发展。

本部分主要介绍数据获取、数据形式和实验结果,并通过具体事例详细展示指标体系对舆情事件发展变化规律的描述,以及热度预测分析的结果。

三、基于心理认知的网络舆情指标体系构建

(一)指标体系构建思路

互联网是一个为用户提供交流服务的平台,用户的心理活动与整个网络空间息息相关。因此,准确把握互联网背后用户的心理、掌握舆情发展动态至关重要。基于此,笔者从心理学角度出发,提出一套以情感、行为、认知为一级指标的层次网络舆情指标体系。相比于现有指标体系,本指标体系的提出角度覆盖面更广。有研究表明,人类心理结构最重要的三个系统分别是情感系统、行为系统和认知系统[14],且三者之间相互影响,相互作用。由此可见,从情感、行为、认知三个角度提出指标体系,可以全面覆盖并捕捉用户态度和舆情本体信息,进而更好地对舆情事件进行分析。此外,为了对舆情进行更细致的衡量,该指标体系还引入深度转发率、直接扩散率、互动率、发布形式等衡量指标。

在以往的研究中,吉卜林“长期以来被视为英国在印度的殖民统治的辩护人,背负着‘帝国主义作家’的恶名”。譬如,评论家艾德蒙·威尔逊就批评基姆“讲自己所爱的人送入英国侵略者之手”,“利用自己对当地的了解来防止和压制当地人对英国的反抗”而基姆——吉卜林的代言者——之所以为英国情报机构工作,完全可以是为了挽救已经满是伤痕的印度于另一场侵略战争之中。这也就是为什么,英国的情报机构有印度人的忠诚参与。我们不能因为吉卜林是英国人,就臆测他的一切行为都是以英国的殖民统治为出发点的(当然无法忽视的是他身上仍旧带有时代的局限性)。

(二)指标体系内容

本文以情感、行为、认知为一级指标,提出一套层次指标体系,具体内容如表1所示。情感是指人类对于客观事物所产生的态度,本文将其划分为舆论内容情感倾向和受众评论情感倾向。舆论内容情感倾向通过现有情感词典计算舆论内容本身的正负情感词频来获得,即对于中文文本,先通过分词技术对评论的文本进行分词处理,根据分词的结果与情感词典中提供的正负情感词进行匹配来获取相应的词频。受众的评论情感倾向通过正负评论在总评论中的占比来衡量。

钢筋质量控制之三就是“焊接”。主筋焊接接头采用单面焊接,在同一截面接头的个数不超过50%。焊接长度、高度,严格按照规范要求进行施工。

表1 基于心理认知的网络舆情指标体系

一级指标二级指标末级指标情感行为认知舆论内容情感倾向受众评论情感倾向受众参与行为博主发布行为受众与博主之间的互动行为博主认知受众认知正向情感词频负向情感词频正向评论占比负向评论占比受众基本信息转发量深度转发率直接扩散率点赞量评论量发布时间区间发布形式发布地域博主权威度总互动率正向互动数负向互动数舆情中体现的认知是否继续发表言论是否保持沉默是否删除言论评论中体现的认知是否参与讨论是否保持沉默是否删除言论

本文的数据爬取自新浪微博,主要来自央视新闻、新浪新闻、江苏网络电视台等博主。选取了2018年7月发生的26个舆情事件,包括“泰国游船倾覆”“袁隆平团队沙漠种水稻”等事件。对于每个事件,将爬取的数据分为四大部分,即博文本身数据、转发数据、评论数据和基本信息数据。对26个舆情事件进行专家人工标注,结果得到21个热点事件以及5个非热点事件。专家人工标注即选择该领域的三名研究者同时对同一舆情进行标注,只有当三者的结论一致时,才最终确定舆情的标签。另外,根据舆情的传播特点,实验中对舆情的分析时长为自舆情发生起的10日内。

认知是一个相对抽象的心理学概念,它是指人类在收到某种外界的输入后,经过大脑处理,从而在行为上进行体现的过程。本文将认知划分为博主认知与受众认知。博主认知分为舆情中体现的认知和后续行为中体现的认知,包括继续发表言论、保持沉默、删除言论等。受众认知分为评论中体现的认知和后续行为中体现的认知,包括与其他受众的讨论、保持沉默、删除言论等。认知这一新指标的提出,可以有效监测舆情参与者(包括舆情发布者和受众)的心理动态,实现全方位捕捉细节。

除反刍动物自身和饲料原料差异的影响外,如何使饲料利用达到最大效率对反刍动物至关重要。饲料加工的目的就是为了充分发挥饲料的营养价值潜力,从而提高饲料产品的质量和饲养效果。目前,对饲料的加工处理方法很多,主要包括物理加工、化学加工和生物学加工等方法。

(三)指标体系应用

指标体系具有广泛的应用,比如应用于舆情监控、舆情预警等方面,或者利用指标体系对舆情进行评分来及时干预具有负面影响的新闻。本文提出的指标体系旨在实现舆情分析和热度预测两方面的应用。

从某种意义上说,基于ICT的成人参与学习本质是有效使用ICT,是人们发展与ICT的关系以及能够获得有用的教育资源。在思考ICT对成人参与学习的价值时,既不能以“技术决定论”为导向过分夸大ICT技术在教育与社会发展中的角色,亦不可以“社会决定论”为导向仅赋予ICT为中性技术工具的内涵,而误解其所涵盖的社会文化特性[17]。因此,如何面对使用ICT过程中所产生的来自心理、教育、社会等复杂因素交织而成的障碍,学习个体、教育机构、决策组织乃至关联企业的应对之策,均至关重要。

1.舆情态势分析

该层次指标体系层层细化,层层深入。众所周知,大多数舆情的发展是一个先经历公众的高度关注,之后随着时间推移,热度逐渐退去的过程。本文利用提出的网络舆情指标体系的末级指标量化值随时间变化情况来分析舆情的发展趋势,以有效监控舆情走向。

2.舆情热度预测

本文将末级指标单独作为舆情事件的特征,用于构建基于逻辑回归的热度预测模型,进行舆情事件热度分析。热度预测模型的输出值为0到1之间的数值,表示该舆情为热点事件的概率。若输出值大于0.5,则判断此舆情为热点事件,标为hot;若输出值小于0.5,则判断此舆情为非热点事件,标为not hot。舆情为热点事件的概率

(1)

为研究对象并采用半结构式访谈的研究方式,总结和归纳出种导致二语学习负动机的因素:教师、学校教学资源匮乏;个人信心减退、教材、对目的语和目的语国家的负面态度、外界的强制、第三语言学习的负迁移、学习小组成员的态度,其中与教师存在直接或间接关系的因素占到55%。Dörnyei的研究为后来二语教育领域中负动机现象研究奠定了坚实的基础。

以翻转课堂为基础的英语专业翻译教学不仅能够在第一时间吸引学生的注意力,还能够更好的突破应试教育的桎梏,英语老师需要结合翻译教学的现实条件,积极地将翻转课堂与现有的英语教学活动相结合,不断营造良好的学习环境和学习氛围。

(2)

为了验证模型的可行性,对数据集进行随机划分,其中18个为训练集(包括热点事件15个,非热点事件3个),8个为测试集。

四、实验分析

随着机器学习的兴起,一些学者开始针对舆情指标体系的量化进行研究。张一文等[9]基于贝叶斯网络建模对网络舆情预警进行研究,通过将指标体系内容离散化来构建网络节点,并对参数学习,最终用得到的贝叶斯网络来预测舆情处于态势高、中、低的概率。李耘涛等[10]从网络警兆指标体系的灰色特性出发,提出网络舆情灰色预警评价的具体方法,计算了指标的评价系数,并进行实例验证。徐旖旎等[11]利用层次分析法构建指标体系,并用马尔科夫链模型建模,为舆情的研究提供新思路。邢云菲等[12]构建了基于信息熵的新媒体环境下负面网络舆情监测指标体系,并给出舆情的影响力级别,实现对舆情的监测。覃玉冰等[13]利用层次分析法构建网络舆情评估指标体系,然后通过聚类将网络舆情分为5种类型,最后使用决策树分类方法构建网络舆情类型识别模型,精确识别处于潜伏期的网络舆情的类别。

(一)数据集介绍

行为是指人类产生的举动,本文全面考虑舆情传播过程中的参与者,即博主与受众,将行为划分为受众参与行为、博主发布行为以及受众与博主之间的互动行为。受众参与行为主要包括受众基本信息、转发量、深度转发率、直接扩散率、点赞量和评论量。受众基本信息包括受众的年龄、性别、地域、微博等级等。其中,年龄、地域和微博等级采用区间进行表示,受众的群体不同,对于舆情传播的兴趣也是不同的。转发量、点赞量和评论量分别定义为舆情研究时间段内被转发、点赞、评论的数目。通常情况下,带有文字的转发会加入舆情受众的个人思想,对舆情的传播和搜索具有一定辅助作用。因此,将深度转发率定义为带有文字的转发数目占转发总数目的百分比。直接扩散率定义为在评论中@特定用户的评论数目占评论总数目的百分比。@某用户,说明阅读当前消息的受众希望被@的用户看到此消息,这种方式可以使舆情的传播精准到目标受众,将传播的过程变得更加高效。博主发布行为主要包括发布时间区间、发布形式、发布地域以及博主权威度。发布舆情的时间会在一定程度上影响舆情的传播。比如同样的一篇舆情,由于受众活跃时间的限制,通常情况下在黄金时间段发布会比在凌晨发布具有更快的响应。根据微博上的实际情况,可将发布形式分为三类,即纯文字、文字+图片和文字+视频。不同的形式对于舆情的传播具有不同的影响,相比于纯文字的博文,受众会更加关注带有图片或视频等视听信息的博文。发布地域同受众基本信息中的地域表示方法相同。本文通过发布微博的博主粉丝数、博主发布微博总数、是否有微博认证、微博等级以及博文质量[15]5项指标的加权求和来计算博主权威度。受众与博主之间的互动行为通过总互动率、正向互动数与负向互动数来衡量。互动是指博主与受众就舆情本身进行的讨论。互动率定义为评论中博主参与讨论的评论条数占总评论条数的百分比,可以在一定程度上体现博主的活跃程度;而正向互动数和负向互动数则体现博主与受众观点的异同。

式中,xi表示第i个样本的特征向量,h(xi)为模型输出的预测结果,yi表示舆情样本的真实标签(yi=0时表示非热点事件,yi=1时表示热点事件),L为交叉熵损失函数。

式中,x为抽取的舆情特征向量,w为特征的权重向量,b为偏置,参数通过最小化目标函数来学习获得。该热度预测模型目标函数

(二)实验结果分析

本部分基于所获取的舆情事件,利用指标体系,在舆情态势分析和舆情热度预测两个方面进行实验验证。实验结果表明,该指标体系在上述两方面均表现出很好的效果且具有一定的应用价值。

1.舆情态势分析

以“袁隆平团队沙漠种水稻”为热点事件,以“千万不要随便调戏Siri了”为非热点事件进行对比分析,研究末级指标在舆情态势分析方面的应用。首先,选择部分随时间变化的末级指标(如转发量、评论量和直接扩散率)进行分析(如图1(a)、图1(b)和图1(c)所示)。总体来看,三者的变化规律都与事件的发展变化规律相吻合,即经历了从事件发生到逐渐升温再到平稳的状态,且热点事件相比于非热点事件具有高转发、高评论和高扩散的特点。另外发现,热点事件自发生到稳定状态经历的时间要长于非热点事件,指标体系的变化更加平缓;而非热点事件在刚发生的第一天会升温,但事件发生的第二天之后,对于该事件的转发、评论、扩散等的值几乎为零。由此可见,根据末级指标的变化范围与变化趋势,可以初步判断出舆情的走势情况。其次,分别分析指标体系在情感、行为、认知三个方面热点事件和非热点事件的不同,具体情况如图1(d)、图1(e)和图1(f)所示。在情感方面,热点事件具有正负向评论占比高等特点。在行为方面,通过将指标体系转化为热度的形式,用雷达图表示它们之间的关系,从图中可以看出,热点事件具有高转发、高点赞、高评论等特点。此外,相比于评论和转发,点赞行为的产生方便且耗时少。因此,无论是热点事件还是非热点事件,点赞热度都高于评论和转发热度。在认知方面,将博主认知和受众认知转换为1~5之间的数值,并以散点的形式将热点事件和非热点事件展示在坐标轴上。从图中可以看出,热点事件具有高博主认知、高受众认知的特点。

图1指标体系分析

2.舆情热度预测

为从整体角度考察指标体系热度预测效果,将18个舆情事件作为训练集,其中15个为热点事件,3个为非热点事件。舆情事件的标签由人工进行标注。模型的输出结果是该舆情为热点事件的概率,范围为0~1,通过预测的概率可以判断预测的标签。这里选择8个舆情事件进行热度预测,其中3个事件来自央视新闻,两个事件来自新浪新闻,其余3个事件分别来自封面新闻、江苏网络电视台和新华视点。逻辑回归的实验结果如表2第一行所示。表格中的概率为模型输出值,即模型预测该事件为热点事件的概率,括号内的数字为事件的真实标签:1为热点事件,0为非热点事件。同时,将逻辑回归模型与朴素贝叶斯模型进行对比,朴素贝叶斯实验结果如表2第二行所示。表2中,LR预测为逻辑回归的输出值,NB预测为朴素贝叶斯的输出值。对于8个事件,逻辑回归均预测正确,而朴素贝叶斯在事件5和事件8的预测中出现了错误。由以上实验可见,逻辑回归模型具有较高的准确性,且模型性能稳定。通过特征数据,可以发现有些特征具有较大的区分度,即可以明显区分出舆情的类别,例如评论数目等。相反,还有一些特征对于舆情是否为热点事件这一分类问题具有相对较少的贡献度,如舆情本身的情感倾向等。这一发现将为后续研究带来帮助,也就是说,可以通过调整指标体系末级指标在模型中的权重来侧重舆情研究的不同方面。例如,研究负面舆情的传播及干预问题,就需要着重考虑舆情情感倾向指标,对其赋予更高的权重。

表2 逻辑回归与朴素贝叶斯对比实验结果

实验事件1事件2事件3事件4事件5事件6事件7事件8LR预测0.948(1)0.957(1)0.990(1)0.932(1)0.314(0)0.870(1)0.920(1)0.281(0)NB预测0.953(1)0.964(1)0.980(1)0.946(1)0.768(0)0.940(1)0.951(1)0.787(0)

五、总结与展望

舆情的发展变化规律可以通过一系列指标体系进行衡量,只要准确抓住舆情发展的特征,就可以实现对舆情的预测和干预。本文提出了一个全新的基于用户心理的指标体系,考虑情感、行为、认知三方面,从不同粒度出发,提出层次舆情指标体系,并将其应用于网络舆情态势分析和热度预测。研究发现,该层次指标体系末级指标可以很好地刻画舆情事件的特性,吻合舆情事件发展规律,并且能够实现对舆情事件的热度分析。

近些年来,舆情分析已经成为研究热点,本文从一个全新的角度提出一套指标体系,将其应用于舆情态势分析和热度预测,并进行实验验证。未来指标体系的构建可以针对不同任务进行,并结合多种舆情受众与舆情本身的互动要素。针对不易准确衡量的认知指标,可以采用通过神经网络学习隐变量的方式来获得相应的表示,从而使舆情研究更加具有个性化和针对性。

参考文献:

[1] 陈海汉,陈婷.突发事件网络舆情传播时段特征和政府预警模式研究[J].图书馆学研究,2015(1):24-30.

[2] 戴媛,郝晓伟,郭岩,等.我国网络舆情安全评估指标体系的构建研究[J].信息网络安全,2010(4):12-15.

[3] 张军玲.我国网络舆情信息挖掘研究综述[J].情报科学,2016,34(11):167-172.

[4] 冯江平,张月,赵舒贞,等.网络舆情评价指标体系的构建与应用[J].云南师范大学学报(哲学社会科学版),2014,46(2):75-84.

[5] 陈建敏,余遵成.涉军网络舆情安全评估指标体系研究[J].图书情报研究,2018,11(1):29-36.

[6] LIN P,LIU L,NIE P,et al.Research on network public opinion warning index system based on feature analysis of the public opinion[J].Information Technology Journal,2013,12(19):5326-5330.

[7] 瞿志凯,张秋波,兰月新,等.暴恐事件网络舆情风险预警研究[J].情报杂志,2016,35(6):40-46.

[8] ZHAO L,XU Z,MIN H,et al.Research on public opinion index system of Chinese microblog[C]//IEEE International Conference on Software Engineering &Service Science.Beijing:IEEE,2014.

[9] 张一文,齐佳音,方滨兴,等.基于贝叶斯网络建模的非常规危机事件网络舆情预警研究[J].图书情报工作,2012,56(2):76-81.

[10] 李耘涛,刘妍,刘毅.网络舆情灰色预警评价研究[J].情报杂志,2011,30(4):24-27+23.

[11] 徐旖旎.基于微博的媒体奇观网络舆情热度趋势分析[J].情报科学,2017,35(2):92-97+125.

[12] 邢云菲,王晰巍,王铎,等.基于信息熵的新媒体环境下负面网络舆情监测指标体系研究[J].现代情报,2018,38(9):41-47.

[13] 覃玉冰,邓春林,杨柳,等.基于决策树的网络舆情类型识别模型研究[J].智能计算机与应用,2018,8(6):27-32.

[14] 知行网.认知、行为、情感的关系概述[EB/OL].(2012-02-15)[2019-07-10].http://www.zhixing123.cn/lilun/22822.html.

[15] 王洪流.微博博主权威度及其评价方法研究[D].保定:河北大学,2014.

ReaserchontheConstructionofNetworkPublicOpinionIndicatorSystemBasedonUserPsychology

SHI Chuan,MA Ming-jun,HU Lin-mei

(School of Computer Science,Beijing University of Posts and Telecommunications,Beijing 100876,China)

Abstract:The characteristics of public opinion are studied from the aspects of emotion,behavior and cognition,and a new network public opinion indicator system based on different granularity is proposed.This system can help analyze the situation of public opinion,and hold its trend.Meanwhile,it can also be used to predict the intensity of events,aiming at giving an early warning of public opinion events.The events on Sina microblog are taken as the dataset to evaluate the performance of the indicator system.The experiment results show that the indicator system provides good description of the characteristics of the public opinion events and matches the rule of the development of the public opinion,and also the system has a good predictive effect.

Keywords:public opinion indicator system;emotion;behavior;cognition;network public opinion

中图分类号:C912.63;G353.1

文献标识码:A

文章编号:1008-7729(2019)05-0093-07

收稿日期:2019-07-21

基金项目:国家重点研究和发展项目(2017YFB0803304)

作者简介:石川(1978—),男,湖北洪湖人,博士,教授

DOI:10.19722/j.cnki.1008-7729.2019.0253

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

石川:基于用户心理的网络舆情指标体系构建研究论文
下载Doc文档

猜你喜欢