蔡伟鸿:基于网页浏览内容的心理健康预测模型的研究论文

蔡伟鸿:基于网页浏览内容的心理健康预测模型的研究论文

摘 要目前,世界各地的人们都饱受心理健康问题所带来的困扰,这为心理健康问题预防工作带来了新的挑战.如果心理健康状态可以利用网页浏览内容进行预测,就可以为心理健康问题预防工作开辟新的方向.本文探讨了利用用户的网页浏览内容预测其心理健康状态的可行性,并使用支持向量机建立了基于网页浏览内容的心理健康预测模型.为了验证该算法模型的有效性,我们与另外两种算法模型的预测结果进行了对比,结果表明,基于支持向量机的算法模型能够更加有效地预测用户的心理健康状态.

关键词网络行为;网页浏览内容;心理健康;支持向量机

0 引言

随着社会的发展和科技的进步,人们的生活水平得到了极大的提高,身体健康已不再是制约个人发展的主要因素,而和人们密切相关的另一个因素:心理健康[1],逐渐浮现出来,成为了社会关注和研究的新焦点.心理问题在严重的情况下会导致精神障碍,进而对个体健康和社会稳定产生消极影响[2].有研究表明,心理问题会对个体的主观幸福感造成不利影响[3],导致情感失衡和对生活的满意度下降.另外,心理健康与身体健康之间存在着千丝万缕的联系[4],与一般人群相比,存在心理问题的个体的身体健康更容易出现问题[5],患有精神障碍的人群的慢性病的发病率和死亡率均高于一般人群[6].同时,心理问题也是导致人群“失能”的主要原因[7],到2020年有很大可能会成为仅次于HIV 的社会疾病负担[7].据调查,心理问题在我国人群中的覆盖率已经达到了17.5%[8].在中国,心理治疗非常昂贵而且繁琐,大量的精神障碍患者因为得不到有效的治疗而不得不忍受病痛带来的折磨,所以,做好有效的心理健康问题预防工作是非常迫切和必要的.

1 背景知识及相关工作

1.1 背景知识

通常,需要先获取个体的心理状态才能对其提供合适的心理健康服务,获取心理状态的方法之一就是进行“心理状态评估”.但是,心理状态具有内隐性,不能被直接观察到,比如嫉妒心理产生时大都不为主体所察觉,具有明显的内隐性[9],因此必须先将心理状态外显化和形象化才能进行下一步的心理状态评估,简单来说,就是通过设定一些合适的外显指标来进行间接的测量,这种方法就是心理测量.目前主流的心理测量技术是心理测评量表(如图1),因其在问卷编制、施测操作和结果统计等方面所具有的客观性、高效性和量化性,已经获得了在心理测量领域的广泛临床应用.但是,心理测评量表的测量结果的准确性会受到个体主观意识的影响,因为个体在填写量表时,既是“被观察个体”,又是“观察主体”,其回答会不可避免地受到其认知能力和社会虚荣心理的影响.为了克服心理测评量表存在的缺陷,本文提出利用用户的网页浏览内容作为外显指标来预测其心理状态(如图2),从用户的网页浏览内容中提取出相关特征,进而训练出心理健康预测模型.

图1 传统心理健康测量方法

图2 本文提出的心理健康测量方法

1.2 相关工作

心理健康和身体健康缺一不可,都是主体健康的必要条件.随着互联网的发展与应用,网络行为逐渐成为主体行为的重要组成部分,能够作为主体心理状态的外显指标,反映出主体的一部分内心世界.所以,将网络行为用于心理状态预测,是非常具有前景的研究方向.目前,国内外已经有学者和机构开始着手于网络行为与心理状态之间关系的研究,并取得了一些成果.王丽等人将神经网络技术用于预测研究生这一群体的心理健康状况[10],取得了较好的预测效果,在一定程度上为我国高校心理教育工作提供了有价值的研究成果,为高校完善心理教育工作提供了帮助.张磊等人通过分析中国庞大的社交网络,利用个体样本的主体特征和动态词典特征提取方法实现了对社交网络用户的心理指标的预测,找出了社交网络特征与心理指标之间的关系[11],更新了国内心理指标预测的记录.田玮等人采用深度学习技术对微博用户作出自杀风险预测,实验结果表明,基于深度学习的算法模型可以有效地对微博用户的自杀风险进行预测,为自杀预防工作开辟了新的方向[12].朱廷劭等人通过对用户的网络行为进行时频分析来预测其抑郁状况[13],实验结果表明,用户的网络行为的时频特征能够有效地反映用户心理健康状况的变化,有助于公共心理健康服务的广泛提供.郝碧波等人使用半监督学习的方法来预测社交网络用户的人格[14],实验结果表明,使用未标记数据可以提高预测的准确性,促进心理学人格研究的发展.朱廷劭等人发现用户的智能手机使用行为与其主观幸福感之间存在一定的联系[15],基于这些研究结果,他们利用智能手机的使用行为训练了主观幸福感的预测模型,实验结果表明,利用采集到的用户智能手机的使用浏览记录可以较好地预测其主观幸福感.郝碧波等人提出利用用户新浪微博的使用行为来衡量其大五人格[16],通过使用多任务回归算法和增量回归算法来预测在线行为中的大五人格.实验结果表明,通过用户的新浪微博使用行为可以对其大五人格进行预测.朱廷劭等人通过建立决策树模型来找出网络用户的网络行为与其心理健康状态之间的关系[17],实验结果表明,预测模型的准确率和召回率表现良好.此外,朱廷劭等人将机器学习应用于认知行为治疗过程,开发了一套心理健康自助系统.通过对随机用户进行比对调查,实验结果表明,这套系统可以有效地缓解用户的抑郁症[18].再者,朱廷劭等人提出利用用户看过的文章内容来预测其情绪,开发了一个带有可选加权系数的情感字典,并且训练了支持向量机模型和朴素贝叶斯模型,实验结果表明,预测模型的准确率、召回率表现良好[19].

喝母乳的小宝宝没聚肚之前,大便次数多到7~8次1天,甚至更多,也都是正常的,属于生理性的。如果生下来一直这样不需担心,也不需就医,是不是腹泻主要和平时比。

通过对以上的工作进行详细调研,我们可以得到如下结论:

1.网络行为与心理状态显著性相关,网络行为能够用于预测心理状态;

在这一个阶段,本文结合现有网络行为指标体系[22]和网络行为研究成果[23],从标记样本产生的网页URL 对应的网页浏览内容当中提取出标记样本的网络行为特征,即需要从这些网页浏览内容当中抽象出具有一般性和代表性的网络行为特征,提取流程如图6 所示.

作为直分销拓市上量的基石,客户经理的队伍建设显得尤为重要。为充分激发客户经理的销售积极性,他们在业务部办公室的墙上张贴“比学赶帮超,大家齐努力”大红榜。先进做标杆,带动后进,精准帮扶后进,互帮互助,确保每月完成目标任务,大大增加了客户经理的成就感。

从节约养分的角度,疏花疏果应尽早进行,但贵州苹果产区霜冻频发,一般采用疏果代替疏花的做法,第一次选择适当多留果,一般多留10%~15%的果,定果时间也适当推迟,从而起到保证产量的作用。

网页浏览内容是网络行为的一种内容载体,能够用于心理状态的预测,而且比一般性的网络行为更加具体和可信.所以,利用用户的网络行为预测其心理状态是可行的.

2 心理健康预测模型

P0是《症状自评量表SCL-90》的测试结果,r是投影矩阵,本文的任务就是找到一个能够最小化f的r:

2.1 模型的原理

在Brunswik 提出的“透镜模型”理论中指出,个体的周边环境中会包含有一些能够预示该个体精神状态的信息线索[20],这些信息线索可以看作是不同场景下的“行为残余”[21].用户的网络访问历史会被记录在访问控制系统的日志中,这些日志数据是客观而且准确的,可以从中获取更加精准和客观的用户网络行为数据.通过这种方式,不仅可以充分利用互联网的普及性和便利性进行大范围的数据采集,而且能够解决心理测评量表的测量结果会受到个体主观意识影响的问题.

图3 心理健康预测模型构建流程

表1 所示的矩阵是一个二类分类模型的混淆矩阵(confusion matrix).混淆矩阵是数据科学、数据分析和机器学习中总结分类模型预测结果的情形分析表,以矩阵的形式将数据集中的记录按照真实的类别与分类模型作出的分类判断进行汇总,是对分类模型进行性能评价的重要工具.计算精确率和召回率需要用到4 个数值,它们分别是真阳值tp(true positive)、假阳值fp(false positive)、真阴值tn(true negative)和假阴值fn(false negative),这4 个数值的总和是样本集中样本的总数,即tp+fp+tn+fn=n,n 是样本的总数.

2.2 模型训练和评估

《症状自评量表SCL-90》是目前世界上最出名的心理健康测评量表之一,该量表共有90 个项目,包含有较为广泛的精神病症学内容,这90 个项目包含9 个因子,分别是躯体化(somatization)、强迫症状(obsessive-compulsive)、人际关系敏感(interpersonal sensitivity)、抑郁(depression)、焦虑(anxiety)、敌对(hostility)、恐怖(phobic anxiety)、偏执(paranoid ideation)及精神病性(psychoticism)。

本文利用机器学习中的监督学习方式,采用支持向量机建立了一个关于心理健康状态的分类模型.这种模型是一种典型的二类分类模型,它的定义域和函数的表示如下:

坚持高起点规划。围绕“四化联动”高起点完善规划,学习陕西等地先进经验,在全县规划建设50个农村新型社区,统筹规划全县重点镇、特色镇和农村新型社区建设,启动实施农村新型社区建设三年行动计划。

U是标记个体样本的网络行为特征矩阵,P 是标记个体样本的心理健康状态矩阵,R 是一个能够揭示标记个体的网络行为特征和心理健康状态之间潜在映射关系的投影矩阵.每个用户的网络行为特征是一个b 维的特征向量,定义为《症状自评量表SCL-90》某个因子下的项目个数.如果我们能够收集到标记个体样本的网络行为特征,就能建立起U;如果我们能够收集到标记样本的《症状自评量表SCL-90》的测评结果,就能建立起P.当U 和P 都建立好之后,就能建立起在心理健康预测模型中能够预测心理健康状态的关键的R.为了能够得到最优的R,我们定义了如下对象函数:

3.很多研究收集网络行为的形式都是问卷调查,无法获得更加详实的用户的网络访问记录,这更凸显出了本文的工作意义.

在本章节中,我们提出了自己的心理健康预测模型,介绍了它的原理和涉及到的算法应用.构建的模型流程可以分为数据收集、数据处理、模型训练、模型评估,具体流程如图3 所示.

根据上文中的内容,我们根据理论模型搭建起了一整套系统,并对模型进行了实验和评估.在这节中详细介绍了两部分内容:1.模型实现的步骤和遇到的问题;2.将不同的算法进行对比,对它们的预测效果进行评估.

表1 混淆矩阵

Confusion Matrix Predict positive negative Real positive tp fn negative fp tn

正是因为个体的网络行为是其在互联网上的行为残余,并且也属于人类行为总体的一部分,所以可以利用个体样本的网络行为作为外显指标来推测其心理状态.但是目前并没有一套公认的网络行为分类方法,由于本模型只需要能够显著反映心理健康状态的网络行为,为了使对心理健康的预测更加准确,所以用户的网页浏览内容这一网络行为在模型的原理中显的格外重要.

精确率衡量的是模型预测结果的精确度,对于一个二类分类模型,分为positive 类和negative 类,可以分别计算它们的精确率,计算公式如下:

召回率衡量的是样本集中样本被成功预测出的比率,positive 类和negative 类的召回率计算公式如下:

模型的准确率计算公式如下:

3 模型的实现

这种二类分类模型对应的评价指标被设定为精确率(precision)和召回率(recall).

具体来说,首先需要收集模型建立过程中所需要的原始数据并进行数据清洗以达到实验标准,这一过程会利用现有技术和设备实现.其次,结合网络行为指标体系[22]从处理好的数据中提取出网络行为特征.接着,采用机器学习中的监督学习方式并利用支持向量机建立起基于网页浏览内容的心理健康预测模型.最后,结合现有预测模型的评价指标对基于网页浏览内容的心理健康预测模型的性能进行评估.

3.1 数据收集

本次实验中的样本数据收集来自课题组的80 位成员,62 位作为训练样本,18 位作为测试样本,实验周期为一年,从2016年1月1日至2017年1月1日.在实验周期内,收集了样本个人的上网记录,并标记了每个人的上网行为,对所有的数据进行脱敏,通过替代法去除隐私信息.最后,在这些完成后对他们进行《症状自评量表SCL-90》测试.需要注意的是,在这个过程中,我们计算统计出该标记样本在每一个因子下的得分,如图4 所示.

接下来需要获取标记样本产生的URL.为了获取标记样本在网络访问过程中产生的URL,需要在访问控制系统中部署网络流量监测设备,能够收集所有流经网关的数据包.网关是标记样本与互联网之间连接的关口,标记样本产生的所有网络访问请求都必须经过网关才能访问互联网.课题组所在实验室的网关处部署了一套访问控制系统,其中的网络流量监测设备会记录下所有的网络访问行为.该网络流量监测设备记录的网络访问行为日志较为详细,有用户ID、组名、源IP、终端类型、位置、目标IP、网站分类、标题、访问域名、URL 地址、时间,收集到的数据即刻利用替代法进行脱敏.

采用嗅觉可视模拟量表 (visual analogue scale,VAS)评分。患者根据自我对嗅觉功能的评估,在一个长10cm的直线上画线(直线一端为0表示嗅觉正常,一端为10表示嗅觉完全丧失),用直尺测量出的数值作为嗅觉功能主观评价指标。

当网络流量监控设备截获到标记样本产生的数据包后,通过分析这些数据包的结构,解析出其中的URL,如图5 所示.

图4 获取标记个体的《症状自评量表SCL-90》的测量结果

图5 获取标记个体产生的URL

在获取到某个标记样本产生的URL 之后,需要对URL 进行过滤和清理.因为不是所有的URL 都指向包含内容的HTML 文件,而且也有可能存在URL 重复的情况,所以有必要进行数据清理.首先去除重复和冗余的URL,然后清理掉指向非HTML 文件的URL.这一过程可以通过爬虫框架Scrapy 完成,使用的过滤规则如表2 所示.

表2 URL地址清理类别

URL 类别 该类别涉及的情形附属请求 资源请求,比如css 文件、js 文件、多媒体资源(例如:视频、音乐、图片)、ajax 请求、内嵌页面请求、ping 请求广告 网站广告展示区、广告联盟等产生的请求错误页面 发生错误的请求,比如404 状态码页面、502 状态码页面ftp 为了保持传输不中断的请求地址基于iframe 架构的网页的多页面请求Instant 技术产生的搜索请求插件请求 object-subrequest,比如Flash应用程序接口请求 比如查询版本、身份校验、xmlhttprequest冗余请求其它重定向页面网页弹窗计费系统登录和退出的时候产生的请求

3.2 数据处理

2.国内外关于将网络行为用于心理健康预测的研究较少,并且截至目前还没有将网页浏览内容用于心理健康预测的相关研究;

其次,该研究验证了网络口碑与顾客价值共创意愿之间的关系。通过121位消费者的数据得出网络口碑对顾客价值共创意愿产生正向影响。这表明网络口碑是消费者表达自我与分析经验等内在需要的外在表达,网络品牌的数量越多、质量越高和正面口碑越多,对其他消费者参与分享、推荐他人和受他人影响的正向作用就越大。亦说明农业品牌企业可以通过制定有效的口碑营销策略来影响消费者对品牌价值共创意愿,并最终促进更多的消费者参与到农业品牌的价值共创过程,从而为品牌的长期发展提供动力。

Elasticsearch 是一个开源的全文搜索引擎框架,提供分布式多用户能力,可以快速地存储、搜索和分析海量数据.本文以标记个体访问的网页URL 作为源数据,使用Elasticsearch 即可得到属于该标记样本的搜索引擎实例,具体流程如图7 所示.

图6 网络行为特征提取流程

图7 标记样本的搜索引擎实例构建流程

《症状自评量表SCL-90》有9 个因子,每个因子下有一系列项目.标记样本的搜索引擎实例构建完成之后,在标记样本的搜索引擎实例中查询某个项目,得到与该项目相关的URL 个数,作为标记样本的网页浏览内容特征数据.具体流程如图8 所示.

图8 标记样本的网页浏览内容特征数据获取流程

例如,在“躯体化”因子下,有“头痛”、“头晕和昏倒”、“胸痛”、“腰痛”、“恶心或胃部不舒服”、“肌肉酸痛”、“呼吸有困难”、“一阵阵发冷或发热”、“身体发麻或刺痛”、“喉咙有梗塞感”、“感到身体的某一部分软弱无力”和“感到手脚发重”这12 个项目,以某个项目作为查询,在标记样本的搜索引擎实例中进行查找,得到与该项目相关的URL 个数,如图9 所示,实际结果如表3 所示.

将“射频识别原理与应用”课程分为3个层次。第一层为RFID技术与物联网的关系,主要介绍RFID技术在物联网工程应用的核心作用、“射频识别原理与应用”课程开设意义、课程总体安排、课程学习资源等。第二层为RFID技术基础知识,主要介绍RFID技术相关的基本概念和工作原理,包括RFID技术概述、RFID标准体系、RFID电子标签、RFID读写器、RFID系统编码与调制、RFID中间件、RFID防碰撞技术。第3层为RFID技术应用案例分析与实践,主要介绍一些典型的RFID应用实例的解决方案和实现方法,如图书管理系统、停车收费管理系统、商品溯源系统等。

图9 网络行为特征获取流程示例

表3 “躯体化”因子下所有标记个体的网络行为特征

体项目 头痛 头晕和昏倒 胸痛 腰痛标记个恶心或胃部不舒服肌肉酸痛呼吸有困难一阵阵发冷或发热身体发麻或刺痛喉咙有梗塞感感到身体的某一部分软弱无力感到手脚发重u1 26 45 4 3 0 14 0 6 36 19 9 10 u2 1 3 112 12 150 2 3 0 8 7 0 0.......................................u62 56 7 0 0 3 34 0 0 0 26 13 1

通过相同的方法,我们统计得出了“强迫症状”、“人际关系敏感”、“抑郁”、“焦虑”、“敌对”、“恐怖”、“偏执”及“精神病性”共8 种网络行为特征.

3.3 心理健康预测模型的建立

我们已经建立了数据基础,接下来是构建心理健康预测系统的详细步骤.相关原理已经在上文中有了充分的阐述.在接下来的系统建立中,主要工作是对标记样本的《症状自评量表SCL-90》的测评成绩进行处理.

进行这种处理的根据来源于心理学.研究表明心理状态是一个连续变化的过程,人群中的大部分个体的心理健康状态是稳定和积极的,相邻区间的差异较小.本文实验关注的目标是那些有可能存在心理健康问题的人群,为了尽可能地筛选出这部分人群,在心理测量学中,公认的测量方法是将所有被测试样本的心理测评量表的得分情况划分为高分组和低分组,即极端健康的样本组和极端不健康的样本组,希望能够通过这种划分找出显著的心理状态特征,高分组的样本有很大可能存在心理健康问题,低分组的样本存在心理健康问题的可能性较小.本文的实验即采取了这种划分方法.

首先,在每个因子下,根据标记样本的得分进行排序.然后,在每个因子下,根据排序结果,取前27%的标记样本作为低分组,用标签“-1”代表,取后27%的标记样本作为高分组,用标签“+1”代表.最后,利用之前收集好的每个因子下的标记样本的网络行为特征,再结合每个因子下的标记样本的分组结果,就得到了可用于模型训练的支撑数据,如表4 所示.

红色文化是革命先辈用鲜血乃至生命留下的文化瑰宝,是民族精神、集体主义、爱国主义的集中体现[3]。红色教育即红色文化教育,是将高尚的民族气节、舍生取义的奉献精神、无畏的奋斗精神和与时俱进的时代精神融入人们的思想与生活中。高校红色教育有助于大学生明确政治方向、坚定理想信念,提升思想认知水平,培养吃苦耐劳精神,是弘扬民族精神、激发爱国之情的有效途径。当前高校红色教育存在诸多局限,在教学实践中无法取得预想效果。

表4 “躯体化”因子下的训练数据

标签 标记感到手脚发重-1 u2 1 3 112 12 150 2 3 0 8 7 0 0-1 u13 0 12 6 3 142 23 0 0 1 56 0 1-1 u26 5 53 1 17 0 0 126 2 3 12 9 8..........................................+1 u11 89 2 0 1 23 115 20 1 1 0 45 16+1 u58 23 14 0 0 1 2 18 26 126 42 13 3个体 头痛 头晕和昏倒 胸痛 腰痛恶心或胃部不舒服肌肉酸痛呼吸有困难一阵阵发冷或发热身体发麻或刺痛喉咙有梗塞感感到身体的某一部分软弱无力

在得到每个因子下的训练数据之后,使用支持向量机为9 个因子分别建立了预测模型,这9 个预测模型相互独立.其中,模型训练所使用的程序来自LIBSVM,训练过程中使用的核函数是RBF(Radial Basis Function),并进行了相关参数调优,每个因子下的预测模型的参数如表5 所示.

表5 每个因子下的预测模型训练时所使用的参数

因子 cost gamma躯体化 19 0.021 43强迫症状 10 0.075人际关系敏感 7 0.028 43抑郁 11 0.021 43焦虑 25 0.006 53敌对 6 0.075恐怖 2 0.073 5偏执 328 0.016 53精神病性 2 0.075

通过以上这种形式,该实验建立了成型的系统,区分出了研究样本的具体参数的不同,并得到了每个对象心理健康的预测结果.

杭州市运河引配水系统以提高水质改善环境为主要目的,自然子系统效益最好,且保持稳定。运河引配水系统对经济和社会子系统的影响以长期影响为主,系统运行之初取得效益较缓,2005年后社会子系统和经济子系统的效益水平逐年提高,增长速率逐年加大。各子系统间相互影响相互制约,经济和社会发展对自然子系统造成压力,因此2003—2005年,经济和社会子系统收益较慢时,相应的自然子系统收益较快;2005年后,经济和社会子系统增长速率明显加大,但是自然子系统效益出现波动。在未来的发展中需要进一步协调自然、经济和社会子系统间的平衡,使得整个城市引配水系统健康、稳定、高效地发挥其在城市发展中的作用。

3.4 心理健康预测模型的评估

为了体现该模型的实用性和准确性,我们将本模型中使用的支持向量机与随机森林、朴素贝叶斯这两种传统机器学习算法进行了详细对比.它们都在9 个因子上进行了预测,并进行了5 折交叉验证,分别从模型准确率(如图10)与高分组召回率(如图11)进行了对照.

通过实验结果对比,可以得到使用支持向量机建立的预测模型的准确率平均值为89.39%,而使用随机森林和朴素贝叶斯建立的预测模型的准确率平均值分别为87.21%和82.28%.特别是支持向量机在“焦虑”因子下建立的预测模型的准确率最高,达到了95.01%,并且其高分组召回率也最高,达到了95.62%,反映出它可以很好地召回“焦虑”因子下的高分组人群.另一方面,使用支持向量机建立的预测模型的高分组召回率平均值为88.19%,而使用随机森林和朴素贝叶斯建立的预测模型的高分组召回率平均值分别为85.57%和81.13%.

综上可以得出,在本次实验的环境下,使用支持向量机建立的模型的预测效果整体上远优于使用随机森林和朴素贝叶斯建立的模型的预测效果.这种评估结果充分说明了本文中选择的机器学习算法的创新性和实用性.

准备一杯牛奶、一大勺酸奶(最好是最新出厂的冷藏酸奶,以确保足够的活菌数)还有白糖,三者混在一起使劲搅拌,然后倒入玻璃瓶里。头一天晚上盖好盖子放到暖气上,第二天早上就能收获一大杯酸奶。整个发酵过程需要8~9 h。

很多企业的内部审计人员背景出身杂乱,他们业务素质和职业道德素质差,缺少实际审计经验。这种状况在很大程度上制约了我国内部审计的独立和权威,使得内部审计的监督评价职能无法形成积极的效力。

4 结语

本文使用支持向量机分别为《症状自评量表SCL-90》的9 个因子建立了基于网页浏览内容的心理健康预测模型.在给出理论基础的前提下,设计出了区别于传统方式的心理健康模型.不仅如此,为了验证模型的可行性和准确性,本文展开了一系列具体的实验和结果评估,最终得到了良好的实验效果,充分说明本文提出的方法模型能够在一定程度上替代传统的心理测评量表,为心理卫生事业的发展提供帮助.

图10 模型准确率对比结果

图11 高分组召回率对比结果

虽然本文提出的模型取得了一些创造性的发现和效果,但仍然存在一些可以改进的地方,比如采取更加高效的机器学习算法来训练更加准确的心理健康预测模型;研究如何提取更加准确和有效的网络行为特征等.

参考文献

[1]PRINCE M,PATEL V,Saxena S,et al.No health without mental health[J].Mental Illness,2007,370(9590):859-877.

[2]THOBABEN M.Mental health:a report of the surgeon general[J].Home Care Provider,2000,38(2):6-7.

[3]JR C P,MCCRAE R R.Influence of extraversion and neuroticism on subjective well-being:happy and unhappy people.[J].Journal of Personality & Social Psychology,1980,38(4):668-78.

[4]HIERONYMUS A N.Mental and physical health[J].Phi Delta Kappan,1950,31(9):446-447.

[5]STANLEY S,LAUGHARNE J.The impact of lifestyle factors on the physical health of people with a mental illness:a brief review[J].International Journal of Behavioral Medicine,2014,21(2):275-281.

[6]ROBSON D,GRAY R.Serious mental illness and physical health problems:a discussion paper[J].International Journal of Nursing Studies,2007,44(3):457-466.

[7]LOPEZ A D,MATHERS C D,EZZATI M,et al.Measuring the global burden of disease and risk factors,1990-2001[J].Theory and Applications of Special Functions,2006:448-57.

[8]LEE S,KLEINMAN A.Mental illness and social change in China[J].Harvard Review of Psychiatry,1997,5(1):43-46.

[9]欧阳文珍.嫉妒心理及其内隐性研究[J].心理科学,2000,23(4):63-66+128.

[10]王丽.基于神经网络的研究生心理健康状况预测分析[D].西安:西安科技大学,2016.

[11]张磊.社交网络用户的心理预测与心理信息应用[D].济南:济南大学,2015.

[12]田玮,朱廷劭.基于深度学习的微博用户自杀风险预测[J].中国科学院大学学报,2018,35(1):131-136.

[13]ZHU C,LI B,LI A,et al.Predicting depression from internet behaviors by time-frequency features[C]//Ieee/wic/acm International Conference on Web Intelligence.IEEE,2017:383-390.

[14]NIE D,GUAN Z,HAO B,et al.Predicting personality on social media with semi-supervised learning[C]//Ieee/wic/acm International Joint Conferences on Web Intelligence.IEEE,2014:158-165.

[15]GAO Y,LI H,ZHU T.Predicting subjective well-being by smartphone usage behaviors[C]//International Conference on Health Informatics.2014:317-322.

[16]BAI S,HAO B,LI A,et al.Predicting big five personality traits of microblog users[C]//Ieee/wic/acm International Joint Conferences on Web Intelligence.IEEE,2013:501-508.

[17]ZHU T,NING Y,LI A,et al.Using decision tree to predict mental health status based on web behavior[C]//2011 3rd Sympoisum on web society,2011:27-31.

[18]XU X,ZHU T,ZHANG R,et al.Pervasive mental health self-help based on cognitive-behavior therapy and machine learning[C]//International Conference on Pervasive Computing and Applications.IEEE,2011:212-219.

[19]BAI S,NING Y,YUAN S,et al.Predicting reader’s emotion on chinese web news articles[C]//International Conference on Pervasive Computing and the Networked World.Springer-Verlag,2012:16-27.

[20]ORQUIN J L.A Brunswik lens model of consumer health judgments of packaged foods[J].Journal of Consumer Behaviour,2014,13(4):270-281.

[21]Ajzen I.Residual effects of past on later behavior:habituation and reasoned action perspectives[J].Personality & Social Psychology Review,2002,6(2):107-122.

[22]ZHANG Q,ZHU Z H,ZHU T S,et al.Constructing the internet behavior ontology:projection from psychological phenomena with qualitative and quantitative methods[C]//International Conference on Active Media Technology.Springer-Verlag,2011:123-128.

[23]ZHANG F,ZHU T,LI A,et al.A survey of web behavior and mental health[C]//International Conference on Pervasive Computing and Applications.IEEE,2011:189-195.

Research of Mental Health Prediction Model Based on Web Browsing Content

CAI Weihong1,HU Jiang1,LIU Jianquan2,DU Xin1
(1.Department of Computer,Shantou University,Shantou 515063,Guangdong,China;2.NEC Corporation,Totyo 211-8666,Japan)

Abstract At present,people around the world are suffering from mental health problems,which bring new challenges to the prevention of mental health problems.If mental health can be predicted using web browsing content, it can open up new directions for mental health prevention.In this paper,the feasibility of using the user's web browsing content to predict their mental health is discussed.A support vector machine is used to build a mental health prediction model based on web browsing content.In order to verify the effectiveness of the proposed algorithm, the results of comparison with the other two algorithms were compared.The results show that the algorithm model based on the support vector machine can more effectively predict the user's mental health status.

Keywords web behavior;web browsing content;mental health;support vector machine

中图分类号TP393,TP181

文献标识码A

文章编号:1001-4217(2019)02-0003-12

收稿日期:2018-06-07

作者简介:蔡伟鸿(1963—),男,广东潮州人,汕头大学工学院计算机系,教授.研究方向:信息安全、网络技术.E-mail:whcai@stu.edu.cn

基金项目:广东省科技计划项目(2016B010124012)

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

蔡伟鸿:基于网页浏览内容的心理健康预测模型的研究论文
下载Doc文档

猜你喜欢