费定舟:社交媒体中的人格计算研究综述论文

费定舟:社交媒体中的人格计算研究综述论文

摘 要:人格是一种心理结构,旨在用少量稳定和可衡量的个体特征来解释人类的各种跨情境行为。以往测量人格主要依靠标准化心理测验,但因大规模实施标准化心理测量的难操作性,它的使用范围有所限制。随着科技的快速发展,社交媒体的普遍化,计算机领域有学者尝试结合计算算法和“大五”因素人格理论,借助个体在社交媒体上留下的线索推测个体人格特质,从而产生了人格计算领域。这一新兴领域主要利用个体在社交平台上留下的社交痕迹理解、预测、分析他们的行为,从而对用户人格类型做出具有一定准确性的判断。人格计算技术的应用对智能医疗、个性化服务定制等领域具有重要意义。通过总结人格计算领域近十年,在利用社交平台上的用户线索推断人格的最新进展,来阐明当前这一领域的研究现状、研究不足以及未来待研究方向。

关键词:人格;大五因素人格模型;人格计算;社交媒体

1 引言

希腊哲学家泰奥弗拉斯图斯(Theophrastus,公元前371—公元前287 年)首先提出对个体差异的困惑。他指出:“我好奇为什么所有的希腊人同处一片天空下,但角色差异如此大?[1]”。现代心理学家将这一角色差异归因于人格差异。Funder 提出,人格是跨时间、跨情境的关于想法、情绪、行为的稳定模式[2]。

心理学对个体差异的研究衍生了许多人格理论。这些理论中最能有效衡量个体差异的是特质理论模型,即大五因素人格模型。它包含开放性、责任感、外向性、宜人性和神经质五个方面(表1)。大五人格模型更强调是连续的人格维度[3]。这一模型被广泛接受为“心理学主要成就之一”[4]。

我国人民的生活水平提升后,老龄化问题成为了我们的关注焦点,目前我国的高血压患者数量不断增加,而且年龄越来越小。临床中高血压疾病是慢性疾病,根据研究显示,高血压会让其他心血管疾病的发生率增加,严重的有心肌梗死、脑卒中等等,患者会以左室肥厚伴左心力衰竭为主[4]。此次研究结果表明,心脏彩超检测心脏疾病具有很高的价值,效果突出。

表1 大五人格特质

特质因素 特征烦恼对平静神经质 不安全感对安全感自怜对自我满意好交际对不好交际外向性 爱娱乐对严肃感情丰富对含蓄热心对无情宜人性 信赖对怀疑乐于助人对不合作富于想象对务实开放性 寻求变化对遵守惯例自主对顺从有序对无序责任感 谨慎细心对粗心大意自律对意志薄弱

“大五”人格模型的产生不仅使传统心理学对个体差异的研究更精确化,也为人格与计算机领域的结合提供了理论基础。一方面,它反映了特质模型在人格心理学中的主宰地位,另一方面,特质模型用数值统计个性类型,这便于计算机基础的数据处理[5]。

记得《一生的资本》里有这样一段话:任何时候,一个人都不应该做自己情绪的奴隶,不应该使一切行动都受制于自己的情绪,而应该反过来控制情绪。无论境况多么糟糕,你应该努力去支配你的环境,把自己从黑暗中拯救出来。那些扰乱你的、让你崩溃的、害怕的、恐惧的事情,在你充实的生活和忙碌里,真的不值一提。一定要坚信熬过痛苦的黑夜,天亮后你就是英雄。

对应不同的人格理论,产生了不同测量人格的方法,包括自陈量表如卡特尔16种人格因素测验,艾森克人格问卷;投射测验如罗夏墨迹测验、主题统觉测验等。标准化的人格心理测验能够以一定准确性反映个体的人格类型特征,但测验实施要求较高,难以采集大样本,使用范围有限;随着社交媒体的普遍化,越来越多的计算机技术与人格研究方法结合,用于推测个体人格类型,这促使了人格计算领域的产生。人格计算主要利用用户的网络足迹,采用算法,判断目标用户的人格,并将判断结果与大五人格测量结果做比较,以说明算法判断的准确性。已有相关研究通过用户的人格特质和社交平台使用痕迹的联系来探究人格和计算间的交互关系[6-13]。

纵观前人对人格计算领域研究的总结文献,除了Vinciarelli[14]、Azucar[15]等人综合地、全面地对这一领域的研究方法、研究内容、研究趋势与研究不足进行阐释外,以及朱宇[16]从社交文本角度对人格计算领域进行综述外,就个人所知,国内对这一领域发展的综合描述较少。因此,本文通过梳理人格计算领域近十年来如何利用用户在社交媒体上留下的线索,包括图像、文本等方面来推断其人格,来阐明当前这一领域的研究现状、研究不足及未来待研究方向。

本文提出的多模型控制系统原理框图如图1所示,主要包括了三个部分,分别为控制器调度算法、模型集、控制器集。其思想在于,将整个对象的全部工作区间划分为若干子空间,每个子空间用一个较精确的固定模型来表示,最后由固定模型组成模型集。[1]多模型预测控制算法相较于单一模型预测算法,不仅提高了模型与控制器的个数,更主要是通过有效的调度算法合理的分配控制器集中各个控制器的输出。这是多模型控制区别于单一模型控制之处。

2 社交媒体和人格计算

社交媒体为探究、理解个体行为差异提供了独特的途径。用户在社交平台上不仅主动留下个人结构化信息,如年龄,性别,国籍等,个人简介、头像,发布的内容(包括文字、图像)还留下了与他人的互动线索,如点赞喜好的文章、图像等等,这些线索从不同角度展示了个体的人格特质。尽管无法直接从用户留下的间接线索中断定他们的人格特质,但是采用恰当的数据计算方法,能够以一定准确性从潜在线索中推断。

已有实验[3,47]显示某些具有人格特征的实体沟通机器人会影响人类观察者对这些相同特质的感知。文献[48]显示出机器人2种手势类型,4种手势表现水平,4种语调的多样组合会影响对被试对外倾性的感知。对这些特质的感知尤其受语调用语的影响。文献[49]遵循前一研究,组合了2种凝视模式,2种韵律风格,2种眉毛移动方式,24位评价者对这些组合进行评价,以决定哪种会影响外倾性。结果发现,所有的线索都会影响对外倾性的感知。

本文主要总结人格计算中自动人格识别、自动人格感知两个方向利用已有社交媒体的研究,以及概述自动人格综合方向在人机交互、人工智能方面取得的进展。

2.1 自动人格识别与社交媒体

根据布伦斯威克透镜模型,个体通过活动线索外化人格,比如任何能被他人观察到的行为,也就是说即使“人格”是个抽象的概念,但一些行为线索会使个体人格客观具体化,如网络足迹。自动人格识别关注外化过程,它的主要任务是从机器或计算机可分析的末端线索推断个体人格。之所以称为“识别”,是因为它目的在于从自我评估中推断人格特质[18]。

自动人格识别研究常从用户量大的媒介入手。Facebook 作为国外最受欢迎的社交媒体,用户量庞大,用户信息丰富,吸引了大量研究者的注意[19-21]。文献[19]分析167名用户的Facebook个人简介详细程度(如姓名、教育水平、婚姻状况),社交网络的密度(即与友人之间的连接紧度),形容最喜爱活动的用词数量,加入群组的数量,以及政治倾向,借以识别他们的人格特质,结果显示高斯算法和M5 算法预测用户的个性分数RMSE值低于0.13,可准确预测用户个性。文献[9]着重关注Facebook 用户的隐私态度。研究从myPersonality 数据库收集了1 323 名用户的人格特质,用来预测用户对隐私项目回应的分数,以推断他们的隐私态度。尽管统计结果不显著,这一研究仍表明人格特质部分的解释了自我展示的倾向。Erin E.Hollenbaugh等人进一步探究了人格特质对Facebook用户自我揭示倾向的具体影响;实验收集301名用户数据,采用回归算法发现,神经质、开放性、外倾性能部分解释用户自我展示倾向行为,解释比例分别为22%,20%,15%[22]。

目前,临床诊断越来越依赖先进的技术和实验室检查,而不是床边临床检查。这种理念导致了查房形式转变,从床边转换到会议室,以更方便地获得各种影像学和实验室的检测结果[4]。

国内也有学者利用用户在微博的个人简介(包括性别、用户名长度)和发布文本信息的原创程度推断他们的心理健康水平和幸福感。实验收集了444 名用户的信息数据,采用多任务回归方法分析。结果显示,用户性别、原创“微博”比例及昵称长度对心理健康的预测具有相对更高的贡献度。这三个变量预测出女性更易抑郁(r=-0.137)或焦虑(r=-0.148);原创“微博”比例越低越可能感到焦虑(r=-0.094);同时昵称越长,抑郁的可能性越高(r=0.166);而对用户幸福感的预测方面,预测结果与被试的幸福感问卷测量结果相关系数在0.27~0.60,其中与幸福感中的个人成长维度相关最高(r=0.60[)23]。

新技术的研发和应用为上述较为主观的体验性和参与度的效果评价提供了实现可能,如加拿大NuraLogix公司开发的透颜光学成像技术、美国Humanyze公司研发的情绪传感器徽章等。这些技术能真实、客观地呈现学员培训中过程性的各类指标,有效避免了传统问卷、访谈测评等评价方式因主观性强而影响评价有效性、真实性的问题,大大提高了培训评价结果。

国内有学者尝试利用微博这一媒介分析中国社交网络用户的人格特征。学者娜迪热、胡军等人利用搜索爬虫算法,从微博获取76名用户的数据,包含用户发出的文本信息,用户行为数据(如点赞、评论)及用户社交关系网络。采用支持向量机、线性回归、高斯回归等算法对用户的人格特质进行判断。结果显示,用户在微博上留下的文本信息与其人格特质呈中度相关,RMSE值在0.12~0.17。其中开放性对用户的社交关系网络有显著影响,RMSE值为0.1[26]。

周竹叶:向服务转型,最重要的还是转变经营理念,改变农化为营销服务的思想。首先是按照作物营养吸收机理,以测土配方为指导向生产专用肥、配方肥为主转变,由生产型企业向“生产+服务型”企业转变,重点发展适合测土配方施肥要求的肥料产品,以及适合农业节水需求的水溶肥、液体肥,满足农业绿色发展需求,维护环境安全。其次是创新农化服务模式,建立相互协作的、专业化的农化服务体系,提高服务科技含量,为农户提供从全产业链服务。

对社交媒体中的文本内容进行分析时,除了使用LIWC 软件,也有研究采用“主题模型”进行分析。“主题模型”(Topic Model)通常也被称为隐含的狄利克雷分布(Latent Dirichlet Allocation,LDA)或语义模型(Semantic Model)。它是一种统计模型,利用无监督机器学习算法,以概率抽样方式抽取系列文档,从中发现隐含的语义结构,并推断背后的主题。“主题模型”因其强大的文本计算能力,在心理学领域已有诸多的研究与应用[27]。如Schwartz 等人(2013)首次利用LDA 提取的主题特征构建主题使用与大五人格特征的函数。结果发现主题特征与人格特质有相关关系,例如开放性与派对主题相关,宜人性与体育、生活休闲主题相关[28]。Zheng Hu等人(2017)采用主题划分方法,将691名微博用户发布的280万条信息分为10大主题,判断每一主题对用户人格的区分贡献度,结果发现事实类主题区分度最低,为0.3,彩票类区分度最高,为0.98[29]。

4)省级基础测绘的DEM数据是正射影像纠正和多尺度数字高程模型数据生产的基础数据,主要用于遥感影像的正射纠正处理、精细化DEM生产。

除了增加样本数据,部分研究采用创新算法进行识别[31-32]。如文献[31]取152 名推特用户各100 条信息,采用IBMWatson算法,推断人格特质,之后再用H2O深度学习算法优化模型。结果显示使用H2O深度学习算法识别人格的RMSE 值比单纯采用IBM Watson 算法的要低,最好的实验结果在责任心和宜人性两个特质取得,RMSE 值分别下降了29.03%和28.62%。而Giulio Carducci等学者采用监督学习算法围绕公共事务主题,收集24 名推特用户发布的文本消息推断他们的人格。研究采用支持向量机与线性回归、套索回归算法,将被试的人格特质与计算结果进行比对。结果显示,监督学习算法可准确预测被试的人格特质,平均相关系数在0.355~0.735,其中外倾性相关最高为73.5%,开放性相关最低,为35.5%[33]。

除了文字,图像也受众多研究者重视。如通过分析不同Facebook 用户的头像来推断其人格。文献[19]基于大五因素人格理论和人际环境论,收集了100名用户的头像,采用Bag-of-Visual-Word(BoVW)方法抽取图像特征,使用朴素贝叶斯、支持向量机、决策树和线性回归四种算法进行分类,用f1 分数来代表分类结果的准确性。结果显示利用Facebook 头像能够较好地推断用户外倾人格,f1 分数为61.5%。文献[34]采用Facebook 用户的头像信息进一步回答:用户头像对准确推断人格的贡献率是多少?在识别人格方面,是人类判断还是机器判断更准确?结果显示:Facebook 头像能够一定程度上反映用户人格,如用户头像与神经质呈69%相关,同时,经过训练的机器算法能够比人类更准确地识别头像所属用户的人格。

自动人格综合是将机器拟人化,包括风格和行为。自动人格综合包括外在化和特质匹配。在外在化中,足迹线索由任何可以模拟人类行为的机器发出,而非人类自主产生。在特质匹配中,人类观察者无意识地将人格特质分配给机器。判断标准是比较观察者分配的特质与机器设计者设计的特质是否一致。

术前常规使用0.5%左氧氟沙星滴眼液每日4次,连用3 d,术后使用0.3%妥布霉素地塞米松滴眼液和0.1%玻璃酸钠滴眼液每日4次,1周后停用妥布霉素地塞米松滴眼液,0.1%玻璃酸钠滴眼液连续使用1个月。

高分作文更重要的得分点在表达上,安徽中考作文从2014年出现了更注重“表达”的改革,即由原来的“内容”30分、“表达”25分,改为“内容”25 分、“表达”30 分。可见“表达”是重头戏,同时,从“表达”上更能看出学生的写作水平,反馈出学生对语言的组织及驾驭能力。那么如何能在“表达”上出彩呢?根据笔者多年对学生作文辅导的经验总结以下几点。

有学者利用用户发送照片使用的滤镜类型这一非言语线索推断用户的人格特质。文献[36]选取113 名Instagram用户共22 398张照片,划分1 487种滤镜,除此之外,此研究考虑到滤镜使用与某些颜色特征相关[37-38]。因此实验还抽取了图片的颜色特征,包括:像素、饱和度、色值。统计部分,将不同滤镜使用比例、图像颜色特征比例分别与人格测验分数做回归分析。结果表明,人格特质与滤镜使用有一定的相关性;在颜色特征与人格关系方面,开放性与饱和度均值正相关;责任心与饱和度方差呈正相关;宜人性与亮度中位数呈正相关。

除了Facebook,Twitter也是研究者常用媒介之一[24-25]。文献[24]利用Twitter 平台预测人格对可观察的社交媒体行为的影响。研究采用LIWC软件分析142名用户单月发送的文本信息,再与他们的大五人格测试结果做比较。结果显示用户用词与大五人格特质呈中度相关。其中外倾性与积极情绪词和社会历程词呈中度相关,相关系数在0.25~0.28,开放性与第二人称代词(如你、你们)、赞成词和积极情绪词呈负相关,相关系数在0.22~0.27。研究结合推特用户的文本信息和用户简介共同对人格特质进行推断。采用LIWC分析和MRC分类方法,对279 名用户的2 000 条推特信息与个人简介标签(如关注他人和被关注数量)进行分析,判断他们的人格特质。结果显示,用户的真实人格与预测人格的误差值在0.11~0.18,取决于识别的特质。

以往研究已经证明了语言社交媒体中的使用在人格预测中是有效的。但是,除了单一语言材料外,一个较少研究的方向是如何利用社交媒体上的异构信息更好地了解用户的人格。而微软和清华大学的团队提出了一种称为HIE(Heterogeneous Information Ensemble)的异构信息集成框架[45],整个框架和计算流程如图1 所示。通过整合异构信息(包括自我语言使用、头像、表情符号和响应模式)来预测用户的人格特征,文章列出了不同社交痕迹特征的预测极性准确率(EAR),见图2。在这个框架中,通过改进人格预测的表现设计了不同的策略来提取语义表征以充分利用社交媒体上的异构信息。该研究招募了4 500 个被试,采用2 000 个中文、英语和其他语言符号(反映语言环境是非正式交流环境)作为词袋格式,用K-mean算法解决语义稀疏,采用改进的卷积神经网络text-CNN 进行极大池化操作,与基准水平Personality Insights和Mypersonality比较得到更精确的分类结果(图3)。

以往人格计算研究只从单一维度进行,如文字[40]、图像,有学者提出多维度分析结果是否更准确[41]。文献[41]结合图像和文字共同推断用户人格。实验利用Instagram和Twitter两个平台的共享功能抽取62名用户的信息研究。首先让被试填写大五因素人格问卷,之后再分别从图像、文字、用户元特征(如性别、年龄、国籍等)三个方面对用户信息进行分析,采用LIWC 文本分析软件和决策树进行分类。

2.2 自动人格感知与社交媒体

自动人格感知研究逻辑是他人观察特定个体行为线索,判断其人格特质,再将他人判断结果与计算判断结果做比较,看哪种方法更准确。自动人格识别与自动人格感知的差异在于结果比较对象不同,前者将计算结果与个体实际人格测量结果做比较,后者将他人判断结果与计算判断结果做比较。

已有学者综合过往研究,采用元分析方法比较人类和机器算法在判断目标个体人格特质时,哪个更准确。结果发现,机器算法比人类判断更准确,平均准确率高出14%[35,42]。

具体研究如下。Segalin 等人[35]选用60 000 张用户最喜爱图像,并邀请他人对300名用户的人格特质进行判断。尝试比较计算机判断人格特质与他人判断和被试自我判断哪个更准确。结果发现:(1)评估者对被试的评价具有内部一致性;(2)机器学习算法与他人判断特质呈中高度相关,R 为0.68;(3)利用图片识别,机器学习算法与被试真实人格特质中度相关,R在0.2~0.3,取决于被判断的特质;(4)机器判断比人为判断更准确。文献[42]在Segalin 等人研究的基础上选取相同的实验数据,使用深度学习算法从图像中推断人格;不同于Segalin等人选用CA抽取图像特征,该研究使用已有的卷积神经网络模型(CNN)识别图片,使用支持向量机对照片分类;同时让12 名独立被试在看完被抽取的用户的最喜爱照片后评估他们的人格;在结果统计方面,将机器识别结果与人格测验结果做线性回归分析。结果发现,使用深度学习算法的模型能够更准确地预测用户的人格特质。

国内学者肖攀通过两种人格感知算法,为用户推荐潜在好友。实验第一部分基于不同用户特征相似度,通过判别矩阵得到用户属性权重,计算用户相似度总分,结合人格感知匹配算法,为用户进行推荐感兴趣的潜在微博好友;第二部分基于微博文本语义和情感相似度的人格感知算法实验,提出PSER模型,依次计算文本语义相似度,筛选后匹配用户情感相似度,最后通过人格感知算法匹配用户人格维度。结果表明,基于用户基础特征为用户推荐潜在合适好友时,大五人格特质对推荐准确率有显著影响,以P@N 值为标准的准确率达6%;而基于微博文本语义和情感相似度的人格感知算法实验,为用户推荐5个以内的合适好友时,准确率达28%[43]。

除广发基金外,四季度以来,南方、博时、中银等多家基金公司也纷纷开始布局政策性金融债指数基金。数据统计,截至11月21日,市场上已经成立了14只政策性金融债指数基金,其中7只成立于2018年四季度(按不同份额分开计算)。此外,目前还有南方中债3-5年农发行债券、博时中债1-3年政策性金融债、招商中债1-5年进出口行等3只政策性金融债指数基金正在募集,银华安丰中短期政策性金融债刚刚于11月6日获得批复。

除了静态图像,动态图像也引起了研究者的关注。文献[44]为了准确预测用户人格特质,选取了442 名用户发布的50~70 s 的YouTube 视频,重点关注视频中的非言语线索,例如语音语调、眼神凝视、脸部位置等。实验同时加入5 个额外被试对被试人格特质进行评估。结果显示,算法判断的RMSE均值为0.07~0.1。

在此研究基础上,同一作者又进行另一深入研究[39],计算Instagram用户发的图片类型与人格测验分数的相关系数,推断用户的人格特质。实验选取了193名美国被试发布的54 962 张图片。首先让被试填写大五因素人格问卷,之后使用Google Vision API 和K 均值聚类方法对图片进行分类,再对人格测验分数与图片类型求相关。结果显示,图片类型与人格特质中度相关,乐器图片与开放性呈15.6%的正相关;服装、运动图片与责任心呈30.4%的正相关等。

在文本分析中,除了关注内容外,也有学者关注语言使用特征如何反映用户人格。有研究者尝试验证计算机推断人格的准确性。实验包含了三种基本人格特质类型:大五人格、基本需求、基本价值观[30]。实验选取采用IBM 自有深度学习算法,从被试的Tweets 选词特征推断其三种基本人格类型,最后将被试的人格测验分数与推断做相关分析,结果发现机器识别不同人格特质准确率高达80.8%。有类似研究,采用更大样本量,选取了345 名用户的327 672 条推特文本,从消息的语言特征角度入手,分析他们的人格特质、性别和精神病症状。研究使用LIWC 工具对81 种不同的文本特征进行分析,使用MRC 精神病数据库预测外倾性和精神病症状。结果显示,文本语言特征可准确推断被试人格特质,其中可推断责任心、宜人性、外倾性的准确率分别为94.78%,96.81%,61.74%,表面社交媒体上大多用户较为内向。

图1 HIE异构信息集成框架

图2 不同的社交痕迹特征的预测极性准确率(EAR)

图3 不同算法框架计算大五人格结果准确率比较

(Personality Insights跟Mypersonality为基准水平框架)

除此之外,有学者考虑到以往研究只是基于某一社交平台,因此其尝试结合Facebook、Twitter、YouTube 三大社交平台的用户信息来识别用户人格。文献[37]尝试回答三大研究问题:(1)人格应当作为总体还是独立模块被预测;(2)不同的社交媒体中,哪个特征更有效预测用户人格;(3)将在一个社交媒体环境中的计算模型转移到另一个社交媒体环境时,精确度是否发生变化?为了回答这一系列问题,研究者从Facebook、Twitter、YouTube三个平台分别导出了3 731名、102名、402名用户数据,使用回归模型进行分析。结果发现:(1)最佳能够预测用户人格的模型是使用决策树作为基础学习者的多目标堆叠校正模型(MTSC)和回归链校正模型(ERCC)的结合;(2)较难找到单一特征代表普遍特质,取决于选取的数据库;(3)用其他媒体平台的训练数据来扩大当前计算模型不能够提高准确率,说明不同社交平台的用户信息要采用不同的分析方法。这一研究为之后研究者们如何根据社交平台的数据类型选择正确的数据分析方法,以实现更高的人格识别率提供了巨大的帮助。表2是对近十年人格计算相关研究的总结。

2.3 自动人格综合

文献[35]收集了300 名Flickr 用户发出的最喜爱的照片,每名用户200张,共60 000张图片,首先用计算网络模型分类,之后采用回归算法判断用户的人格特质。结果显示,真实人格与计算机预测人格的RMSE 值在0.17~0.22,取决于被判断的特质,其中外倾性的RMSE值最低为0.17。

“你撞死了我哥哥,又让我的丈夫坐了牢,这还不够吗?”她已经认定夏冰是她的丈夫了,这比在一杭身上戳一刀更让他伤心。

根据布伦斯威克透镜模型,人格计算领域主要分为三个方向:自动人格识别(Automatic Personality Recognition)、自动人格感知(AutomaticPersonality Perception)、自动人格合成(Automatic Personality Synthesis)[17]。

文献[50]基于人格、情绪状态提出模型,改变机器人发音时的头部行为,基于不同人格特质确定头部回应强度。人格调节机器人回应的强度。结果表明,不同的行为展示不同的机器人人格。文献[51]重点关注头部定位对人格感知的影响。实验包括133 个被试评估54个相同机器人的固态头部姿势,结果显示,头部姿势影响了对外倾性,宜人性和神经质的感知。

“回来了?”吕凌子才发完短信,没睡着,将热乎乎的大腿压在丈夫腹部,耐着性子等了许久。欧阳锋理会妻子的意图,脑子里乱糟糟的哪还有这个兴致。他将妻子的大腿移开,侧转身,把自己弯成醉虾模样。吕凌子问他怎么了?欧阳锋说酒喝多了,难受。

自动人格综合研究当前主要集中在改良人机交互界面及人工智能领域。相关研究较少,未来有待进一步探讨。

3 研究不足

3.1 文化层次

综合以往研究,发现90%以上被试为欧美地区居民,研究语言90%以上为英语。研究理论主要是基于西方文化的大五人格特质理论。因此,文献[24]指出无法确定已有研究是否具有跨文化性和跨地域性。

表2 近十年基于社交媒体的人格计算研究

作者 研究人格特质 平台 数据获取方式 结果D.Quercia等人(2012)[9]开放性(隐私态度)FacebookmyPersonality数据库 人格特质部分解释自我展示倾向Johnson等人(2010)[13]大五人格特质FacebookFacebook上传 真实至与0.预18测间特,取质决中于的识R别M的S E特在质0.11 J.Golbeck等人(2011)[19]宜外开人向放性性性Facebook Facebook应用 机器识别不高同达人8 0格.8特%质准确率Segalin等人(2017)[21]大五人格特质Facebook Facebook应用 机器学习算法确预率测为人7 7格%特质平均准Gou等人(2014)[31]责宜任人心性TwitterTwitter应用 责任心和2宜9.人03性%和RM 28 S.E6 2值%分别下降F Se eBr gwiaee llr i等nd a等人等人(人(20(2210031)1 66[)4)4[]3[53]6]大五人格特质I Yn Fos ltuia cTg kur eabrme Psy I cYn h Fos o ltu ia F cTg l kiur ecab rkme应e视r应语用 频用料库 人格测试结相果关与度算0.6法8推断结果InstagramInstagram Tkalcic等人(2018)[39]开放性Facebook、Facebook图片类型与人格特质呈15%~30.4%Farnadi等人(2016)[37]责任心Twitter、Twitter正相关YouTubeYouTube Skowron等人(2016)[40]大五人格特质Instagram&TwitterInstagram和Twitter应用 结合两个准平确台,误预差测率人下格降特6质%,结果更Junior等人(2017)[46]大五人格特质TwitterTwitter应用 预测平均误差20.02%

已有无数研究探索文化对人格的影响[35]。一方面,已有研究表明基本人格特质在不同文化下具有差异性。目前,已有研究被试主要是英语国家的居民,深受西方文化影响,形成了具有西方文化特色的人格特质。但西方文化与东方文化存在较大差异,能否将西方文化影响下的被试人格预测结果推广到东方地域的被试,这点有待考虑;从另一个角度来看,大五因素人格理论并不一定具有文化普遍性[52];比如,不同地域文化下会产生“差异地域人格”,如中国文化中特有的“人情”、“面子”等[53]。

除了文化影响,还有问卷使用问题。当前判断人格计算准确性标准是将人格测验结果与计算结果求相关,但已有的大多数人格测验问卷都是将英语版本翻译后直接使用,翻译的准确性对问卷的效度有较大的影响。因此,文献[54]提出需要单独设计针对特定语言使用人群的人格模型,而不是将已有人格问卷模型简单地翻译成本地语言。同时,也应该在人格测验问卷中加入特定文化下形成的人格特质,如中国的“人情”、“面子”。

3.2 人格结构

不同学派对人格的研究衍生了不同的人格理论,以解释人格的不同层面。这些人格理论中“大五人格理论”影响最为广泛,因此也成为了人格计算领域广泛采用的基础理论。但大五人格理论忽略了每一人格特质实质上包含了不同的子层面,或者说更小的领域[55],比如说外倾性就包含了寻求激动体验、积极情绪等子层面。因此,若某一研究表明能够有效预测用户的外倾特质,实质上可能是预测外倾特质的某一个小的层面,并不足以概括整个特质。

另一方面,比起一些特质,某一些特质外化线索更明显,更容易被测量和评估,如外倾性。具有外倾特质的个体行为更外向,类似健谈、爱笑等,因此更易被他人、计算机识别。文献[19-20,25,32]最后结果均表明外倾性更容易被预测。但应当看到,健谈、爱笑等易观察的行为可能只是外倾特质的一个方面,外倾特质的其他维度,如合群、寻求激动体验等较难定量化衡量的维度可能较难被测出来。因此,有研究指出一个特质包含了很多方面,而人格计算任务往往可能只是包含其中一个方面,代表性不足[55]。

多重地震事件的连续参数估计问题可用公式表示为贝叶斯推理问题。令θ为表征事件的参数矢量,Θ为用θ参数化的一组事件,从而Θ= {φ, {θ1},… {θ1,θ2,…}}。设z1:t为所有台站直到当前时间t的整个观测历史,后验概率P(Θt|z1:t)则揭示在给定证据和先验信息的情况下在时间t当前发生事件的信息分布。

3.3 自我评价与他人评价的效度

人格计算的研究逻辑是让被试先接受人格测验,而后收集被试行为数据进行分析,得到计算结果,将人格测验结果与统计结果求相关,判断人格测验准确性。但计算模型是否可以以自我评价或他人评价作为准确性的比较标准还有待考量。

已有心理学研究表明个体接受人格自陈量表测验时,易受社会偏见影响,即个体因担心真实表达自身想法时,会遭受社会群体偏见,从而掩盖自己的真实想法[56]。因此采用人格测验分数作为衡量计算识别人格准确性的标准是否有效需要之后进一步研究。

但这不否定自我评估的有效性,有学者指出个体对自身特质的评估有助于:(1)预测他们的行为;(2)预测他人会如何评价他们[57]。同时,也能预测生活中许多结果[58]。但有研究发现,当预测重要的人生成就时(如学业成就、择业倾向等),有时他人对个体的人格特质预测比自身评估更有效[59]。这表明,对人格特质的评估,自我评价和他人评价都有一定的效度,因此研究者在判断自动识别人格的计算结果的准确性时,应当考虑要以他人评价还是自我评价为标准,或者是二者结合。

4 未来研究趋势与研究应用

人格计算领域未来研究趋势主要呈现在几方面,首先样本量不断增加,目前国外最多可达120万[46],国内最多280 万[43]。大样本量保证了结果的外部效度。接着,样本信息来源多元化,如Facebook 与Twitter 用户信息的组合,Instagram与Twitter用户信息的组合;由于不同的社交媒体具有本身的特点,用户在不同平台上留下的足迹可能也会反映其人格的不同方面,因此组合不同的信息来源,能够更全面地反映被试的真实人格[55]。

其次,分析维度更多元化,从单维度的文本、图像、语音,到多维度结合,多维度分析用户数据有利于提高研究结果的准确性。

再者,同一维度分析更细化,例如利用头像分析人格,有研究Facebook 用户简介的头像[19],也有研究使用同样的实验素材但使用了四种不同的视觉特征分类器来抽取图像特征,从而使结果更准确化。

最后,采取多种算法实现更准确结果。早期研究较多使用单一分类算法,如自然语言加工算法、回归分析等;而近几年的研究,结合不同算法对数据分类、计算,如结合深度学习算法和多种分类算法,以实现更高的识别准确率。应当相信,未来人格计算研究算法将会加入越来越多的数据特征,利用多种算法模型进行计算。

人格数据被视为是“互联网的新石油和数字世界新货币”[60],而人格计算便是通过挖掘人格数据,实现人格特质识别。这一领域的兴起为精准化市场营销创造了可能。通过计算方法预测个体的人格特质,进而推断个体的行为,利用这一点能够让商家实行精准化营销策略[61]或提供个性化服务。

在医疗方面,人格计算也呈现巨大的应用潜力。随着处理自闭症谱系障碍的技术进步和其他发展的问题[62],人格计算有可能在诊断出与人格相关的疾病,如偏执狂和精神分裂症上发挥重要作用[4,63]。在这点上,计算应用(如游戏)可能作为一种评估方法捕捉与人格相关的证据[59,64-65]。而且,人格计算有利于改进人机交互技术,使机器人或其他类型的人工伴侣更富人性,从而增加它们的可接受性[66-67]。

5 结论

本文通过梳理近十年来在Facebook、Twitter、Instagram、微博等大型社交媒体上进行的人格计算研究,以探索这一领域的研究现状、研究不足、未来研究趋势以及巨大的应用潜力。

如何从细小线索推断人格,进而预测个体行为将会一直是人格计算领域的重大难题。不能否认,目前的人格计算技术还有许多地方值得改进,如应当考虑文化影响下的人格特质差异等,但更应当看到人格计算巨大的前景。期待在不久的将来,人格计算领域能够更多地把研究结果变成实际成果,发挥其巨大的应用潜力。

参考文献:

[1]Hicks E L.On the characters of theophrastus[J].The Journal of Hellenic Studies,1882,3:128-143.

[2]Funder D C.On the accuracy of personality judgment:a realistic approach[J].Psychological Review,1995,102(4):652.

[3]Mcrorie M,Sneddon I,Mckeown G,et al.Evaluation of four designed virtual agent personalities[J].IEEE Transactions on Affective Computing,2012,3(3):311-322.

[4]Corr P J,Matthews G.The Cambridge handbook of personality psychology[M].Cambridge:Cambridge University Press,2009.

[5]Funder D C.Personality[J].Annual Review of Psychology,2001,52(1):197-221.

[6]Hinds J,Joinson A.Human and computer personality prediction from digital footprints[J].Current Directions in Psychological Science,2019.

[7]Guadagno R E,Okdie B M,Eno C A.Who blogs?Personality predictors of blogging[J].Computers in Human Behavior,2008,24(5):1993-2004.

[8]Qiu L,Lin H,Ramsay J,et al.You are what you tweet:personality expression and perception on Twitter[J].Journal of Research in Personality,2012,46(6):710-718.

[9]Quercia D,Lambiotte R,Stillwell D,et al.The personality of popular Facebook users[C]//ACM Conference on Computer Supported Cooperative Work,2012.

[10]Yeo T E D.Modeling personality influences on youtube usage[C]//Fourth International AAAI Conference on Weblogs and Social Media,2010.

[11]Love S,Kewley J.Does personality affect peoples’attitude towards mobile phone use in public places?[M]//Mobile communications.London:Springer,2005:273-284.

[12]Butt S,Phillips J G.Personality and self-reported mobile phone use[J].Computers in Human Behavior,2008,24(2):346-360.

[13]Johnson D,Gardner J.Personality,motivation and video games[C]//Proceedings of the 22nd Conference of the Computer-Human Interaction Special Interest Group of Australia on Computer-Human Interaction,2010:276-279.

[14]Vinciarelli A,Mohammadi G.A survey of personality computing[J].IEEE Transactions on Affective Computing,2014,5(3):273-291.

[15]Azucar D,Marengo D,Settanni M.Predicting the Big 5 personality traits from digital footprints on social media:a meta-analysis[J].Personality and Individual Differences,2018,124:150-159.

[16]朱宇.基于社交文本的人格研究综述[J].现代计算机,2017(9).

[17]Pianesi F.Searching for personality[social sciences][J].IEEE Signal Processing Magazine,2013,30(1):146-158.

[18] Rammstedt B,John O P.Measuring personality in one minute or less:a 10-item short version of the Big Five Inventory in English and German[J].Journal of Research in Personality,2007,41(1):203-212.

[19] Golbeck J,Robles C,Turner K.Predicting personality with social media[C]//CHI’11,2011.

[20] Tskhay K O,Rule N O.Perceptions of personality in text-based media and OSN:a meta-analysis[J].Journal of Research in Personality,2014,49:25-30.

[21] Segalin C,Celli F,Polonio L,et al.What your Facebook profile picture reveals about your personality[C]//Proceedings of the 25th ACM International Conference on Multimedia,2017:460-468.

[22]Hollenbaugh E E,Ferris A L.Facebook self-disclosure:examining the role of traits,social cohesion,and motives[J].Computers in Human Behavior,2014,30:50-58.

[23]李昂,郝碧波,白朔天,等.基于网络数据分析的心理计算:针对心理健康状态与主观幸福感[J].科学通报,2015(11):994-1001.

[24]Golbeck J,Robles C,Edmondson M,et al.Predicting personality from Twitter[C]//IEEE Third International Conference on Privacy,2012.

[25]Quercia D,Kosinski M,Stillwell D,et al.Our twitter profiles,our selves:predicting personality with twitter[C]//2011 IEEE Third International Conference on Privacy,Security,Risk and Trust and 2011 IEEE Third International Conference on Social Computing,2011:180-185.

[26]娜迪热,胡俊.基于用户社交网络数据的人格倾向性分析及预测模型的建立[J].电脑知识与技术,2018(7):3.

[27]曹奔,夏勉,任志洪,等.大数据时代心理学文本分析技术——“主题模型“的应用[J].心理科学进展,2018,26(5):770-780.

[28]Schwartz H A,Eichstaedt J C,Kern M L,et al.Personality,gender,and age in the language of social media:the open-vocabulary approach[J].PloS One,2013,8(9).

[29]Hu Z,Liu Y,Zhang C,et al.The analysis of topic’s personality traits using a new topic model[C]//2017 2nd International Conference on Image,Vision and Computing(ICIVC),2017:1079-1083.

[30]Walters M L.The influence of subjects’personality traits on personal spatial zones in a human-robot interaction experiment[C]//IEEE International Workshop on Robot and Human Interactive Communication,2005:347-352.

[31]Gou L,Zhou M X,Yang H.Know me and share me:understanding automatically discovered personality traits from social media and user sharing preferences[C]//ACM Conference on Human Factors in Computing Systems,2014.

[32] Zhu H,Li L,Jiang H.Inferring personality traits from user liked images via weakly supervised dual convolutional network[C]//Proceedings of the Joint Workshop of the 4th Workshop on Affective Social Multimedia Computing and First Multi-Modal Affective Computing of Large-Scale Multimedia Data,2018:63-69.

[33] Carducci G,Rizzo G,Monti D,et al.TwitPersonality:computing personality traits from tweets using word embeddings and supervised learning[J].Information,2018,9(5):127.

[34]Celli F,Bruni E,Lepri B.Automatic personality and interaction style recognition from facebook profile pictures[C]//Proceedings of the 22nd ACM International Conference on Multimedia,2014:1101-1104.

[35] Segalin C,Perina A,Cristani M,et al.The pictures we like are our image:continuous mapping of favorite pictures into self-assessed and attributed personality traits[J].IEEE Transactions on Affective Computing,2016,8(2):268-285.

[36]Ferwerda B,Schedl M,Tkalcic M.Using Instagram picture features to predict users’personality[C]//International Conference on Multimedia Modeling.Cham:Springer,2016:850-861.

[37]Farnadi G,Sitaraman G,Sushmita S,et al.Computational personality recognition in social media[J].User Modeling and User-Adapted Interaction,2016,26(2/3):109-142.

[38] Machajdik J,Hanbury A.Affective image classification using features inspired by psychology and art theory[C]//Proceedings of the 18th ACM International Conference on Multimedia,2010:83-92.

[39] Ferwerda B,Tkalcic M.You are what you post:what the content of instagram pictures tells about users’personality[C]//The 23rd International on Intelligent User Interfaces,Tokyo,Japan,2018.

[40]Skowron M,Tkalcic M,Ferwerda B,et al.Fusing social media cues:personality prediction from Twitter and Instagram[C]//International Conference Companion on World Wide Web,2016:107-108.

[41]Volkova S,Bachrach Y,Armstrong M,et al.Inferring latent user properties from texts published in social media[C]//Twenty-Ninth AAAI Conference on Artificial Intelligence,2015.

[42]Segalin C,Cheng D S,Cristani M.Social profiling through image understanding:personality inference using convolutional neural networks[J].Computer Vision & Image Understanding,2017,156:34-50.

[43]肖攀.基于人格感知模型的微博好友推荐方法研究[D].成都:西华大学,2018.

[44]Biel J I,Gatica-Perez D.The YouTube lens:crowdsourced personality impressions and audiovisual analysis of vlogs[J].IEEE Transactions on Multimedia,2013,15(1):41-55.

[45]Wei Honghao.Beyond the words:predicting user personality from heterogeneous information[C]//WSDM’17,2017,305-314.

[46]Junior R A P,Inkpen D.Using cognitive computing to get insights on personality traits from Twitter messages[C]//Canadian Conference on Artificial Intelligence.Cham:Springer,2017.

[47]De Sevin E,Hyniewska S,Pelachaud C.Influence of personality traits on backchannel selection[C]//Proceedings of Intelligent Virtual Agents,2010:187-193.

[48]Neff M,Wang Y,Abbott R,et al.Evaluating the effect of gesture and language on personality perception in conversational agents[C]//International Conference on Intelligent Virtual Agents,2010.

[49]Krahmer E,Van Buuren S,Wesselink W.Audio-visual personality cues for embodied agents:an experimental evaluation[C]//Proceedings of the Workshop on Embodied Conversational Characters as Individuals,2003.

[50]Egges A,Kshirsagar S,Magnenat-Thalmann N.Generic personality and emotion simulation for conversational agents[J].Computer Animation and Virtual Worlds,2004,15(1):1-13.

[51]Arellano D,Varona J,Perales F J,et al.Influence of head orientation in perception of personality traits in virtual agents[C]//International Conference on Autonomous Agents&Multiagent Systems,2011.

[52]Triandis H C,Suh E M.Cultural influences on personality[J].Annual Review of Psychology,2002,53(1):133.

[53] Mccrae R R,Jr C P.Personality trait structure as a human universal.[J].American Psychologist,1997,52(5):509.

[54]Bock P K.Culture and personality revisited.[J].American Behavioral Scientist,2000,44(1):32-40.

[55]Bond M H.Localizing the imperial outreach:the big five and more in Chinese culture[J].American Behavioral Scientist,2000,44(1):63-72.

[56] Raad B D,Perugini M,Hrebickova M,et al.Lingua franca of personality:taxonomies and structures based on the psycholexical approach[J].Journal of Cross-Cultural Psychology,1998,29(1):212-232.

[57] Wright A G C.Current directions in personality science and the potential for advances through computing[J].IEEE Transactions on Affective Computing,2014,5(3):292-296.

[58]King M F,Bruner G C.Social desirability bias:a neglected aspect of validity testing[J].Psychology and Marketing,2000,17(2):79-103.

[59]Wright A G C.Qualitative and quantitative distinctions in personality disorder[J].Journal of Personality Assessment,2011,93(4):370-379.

[60]Ozer D J,Benet-Martínez V.Personality and the prediction of consequential outcomes[J].Annual Review of Psychology,2006,57(1):401-421.

[61] Connelly B S,Ones D S.Another perspective on personality:meta-analytic integration of observers’accuracy and predictive validity.[J].Psychological Bulletin,2010,136(6).

[62]Kaplan A M,Haenlein M.Users of the world,unite!The challenges and opportunities of Social Media[J].Business Horizons,2010,53(1):59-68.

[63] Catherine S G,Ammar M,Mohamed C,et al.Do parents recognize autistic deviant behavior long before diagnosis? Taking into account interaction using computational methods[J].PLoS One,2011,6(7).

[64]Castronova E,Williams D,Shen C,et al.Introverted elves&conscientious gnomes:the expression of personality in world of warcraft[J].New Media Soc,2009,11(5):685.

[65]Yaakub C Y,Sulaiman N,Kim C W.A study on personality identification using game based theory[C]//2010 2nd International Conference on Computer Technology and Development,2010:732-734.

[66] Schwab K,Marcus A,Oyola J O,et al.Personal data:the emergence of a new asset class[C]//World Economic Forum,2011.

[67]张磊,陈贞翔,杨波.社交网络用户的人格分析与预测[J].计算机学报,2014,37(8):1877-1894.

Survey of Personality Computingon Social Media

FEI Dingzhou1,ZHAO Yating1,2
1.Department of Applied Psychology,Wuhan University,Wuhan 430000,China
2.Key Laboratory of Speech Analysis and Artificial Intelligence,Wuhan University,Wuhan 430000,China

Abstract:Personality,a psychological structure,aims to explain human behavior via different situations with fewer stable and measurable individual characteristics.In the past,the common way to measure personality is varied kind of standard psychological tests.But owing to the difficulty of large-scale measuring,the usable range of standard psychological tests is limited.Thanks to the rapidly development of technology,the flourishing of social media,a series of new computing methods are applied to deduce personality,which brings about a new area named personality computing.Targeting at effectively inducing individual personality,this area mainly utilizes cues left by social media users.Undoubtedly,the employment of personality computing has shed great influence on artificial medicine,characterized service and so on.Therefore,by analyzing the studies of personality computing published in this decade,this paper aims to clarify the current development situation,insufficient research and future research direction of personality computing.

Key words:personality;five-factor personality model;personality computing;social media

文献标志码:A

中图分类号:TP181

doi:10.3778/j.issn.1002-8331.1904-0084

费定舟,赵雅婷.社交媒体中的人格计算研究综述.计算机工程与应用,2019,55(20):34-42.

FEI Dingzhou,ZHAO Yating.Survey of personality computingon social media.Computer Engineering and Applications,2019,55(20):34-42.

作者简介:费定舟(1974—),男,博士,副教授,研究领域为语音情感识别,脑信号加工,文本挖掘;赵雅婷(1995—),女,硕士研究生,研究领域为语音识别,网络搜索与健康焦虑,E-mail:497594340@qq.com。

收稿日期:2019-04-08 修回日期:2019-08-14

文章编号:1002-8331(2019)20-0034-09

CNKI网络出版:2019-09-27,http://kns.cnki.net/kcms/detail/11.2127.tp.20190927.0816.002.html

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

费定舟:社交媒体中的人格计算研究综述论文
下载Doc文档

猜你喜欢