基于神经网络与代码相似性的静态漏洞检测

基于神经网络与代码相似性的静态漏洞检测

论文摘要

静态漏洞检测通常只针对文本进行检测,执行效率高但是易产生误报。针对该问题,结合神经网络技术,提出一种基于代码相似性的漏洞检测方法。通过对程序源代码进行敏感函数定位、程序切片和变量替换等数据预处理操作,获取训练所用数据。构建基于Bi-LSTM的相似性判别模型,设定漏洞模板数据库,将待测代码与漏洞模板作比对以判别其是否存在漏洞。实验结果表明,该方法的准确率可达88.1%,误报率低至4.7%。

论文目录

  • 0 概述
  • 1 背景知识
  •   1.1 漏洞的定义
  •   1.2 静态漏洞检测
  •   1.3 基于代码特征的漏洞检测
  • 2 静态漏洞检测系统
  •   2.1 系统模型
  •   2.2 代码切片
  •   2.3 数据清洗
  •   2.4 分词与词向量化
  •   2.5 数据标记
  •   2.6 Bi-LSTM相似性判别模型
  •   2.7 检测方案描述
  • 3 实验结果与分析
  •   3.1 实验数据
  •   3.2 评估指标
  •   3.3 结果分析
  •     3.3.1 神经网络选取
  •     3.3.2 漏洞模板数量
  •     3.3.3 代码相似性判别模型
  •     3.3.4 性能对比与分析
  • 4 结束语
  • 文章来源

    类型: 期刊论文

    作者: 夏之阳,易平,杨涛

    关键词: 软件安全,静态漏洞检测,深度学习,神经网络,代码相似性

    来源: 计算机工程 2019年12期

    年度: 2019

    分类: 信息科技

    专业: 计算机软件及计算机应用,自动化技术

    单位: 上海交通大学网络空间安全学院,信息网络安全公安部重点实验室

    基金: 国家自然科学基金(61571290,61831007,61431008),国家重点研发计划(2017YFB0802900),信息网络安全公安部重点实验室开放课题项目(C18611)

    分类号: TP309;TP183

    DOI: 10.19678/j.issn.1000-3428.0053136

    页码: 141-146

    总页数: 6

    文件大小: 844K

    下载量: 323

    相关论文文献

    标签:;  ;  ;  ;  ;  

    基于神经网络与代码相似性的静态漏洞检测
    下载Doc文档

    猜你喜欢