论文摘要
目前,我国电网企业对于识别停电投诉风险,开展用户停电敏感程度分析的研究工作还处在起步阶段.为了有效地分析停电用户的敏感程度,提出了一种基于改进随机森林算法的停电敏感用户分类算法.首先,对原始数据进行清洗、特征选择等预处理;接着,采用SMOTE算法增加少数敏感用户样本数据量,解决数据分布不均匀问题;然后,以Fisher比作为特征的重要性度量,按比例随机采样选取具有代表性的特征构成子特征空间;最后,利用随机森林算法识别停电敏感用户.通过在真实停电数据上的实验,验证了提出的方法不仅具有较好的准确性和时间性能,而且可以有效处理高维、冗余特征的数据.
论文目录
文章来源
类型: 期刊论文
作者: 谢国荣,郑宏,林伟圻,徐鸣,郭昆,陈基杰
关键词: 停电敏感度分类,随机森林,不平衡数据,算法,准则
来源: 计算机系统应用 2019年03期
年度: 2019
分类: 信息科技,工程科技Ⅱ辑
专业: 电力工业,自动化技术
单位: 国网信通亿力科技有限责任公司,国网福建省电力有限公司电力科学研究院客户服务中心,福州大学数学与计算机科学学院,福建省网络计算与智能信息处理重点实验室
基金: 国家自然科学基金(61300104,61300103,61672158),福建省高校杰出青年科学基金(JA12016),福建省高等学校新世纪优秀人才支持计划(JA13021),福建省杰出青年科学基金(2014J06017,2015J06014),福建省科技创新平台计划(2009J1007,2014H2005),福建省自然科学基金(2013J01230,2014J01232),福建省高校产学合作项目(2014H6014,2017H6008),海西政务大数据应用协同创新中心~~
分类号: TM73;TP181
DOI: 10.15888/j.cnki.csa.006817
页码: 104-110
总页数: 7
文件大小: 1115K
下载量: 236