基于URL语言特征的钓鱼网站检测算法

基于URL语言特征的钓鱼网站检测算法

论文摘要

为了应对钓鱼网站的检测逃避策略,提出一种基于URL语言特征的钓鱼网站检测算法。通过分析钓鱼网站和合法网站的URL在不同检测域上的差异,定义基元和敏感度来描述其语言特征。先根据基元对主级域名进行相似性检测,当相似性低于预先设定的阈值时,选取有效的子域名特征,利用随机森林算法对子域名的语言特征进行学习和检测。实验结果表明,该算法的准确率达95.6%,系统运行时间相对较小,平均识别时间小于1s。

论文目录

  • 1 引言
  • 2 基于URL结构的语言特征分析
  •   2.1 URL检测域的选取
  •   2.2 检测域的语言特征分析
  •     2.2.1 主级域名的语言特征
  •     2.2.2 子域名的语言特征
  •   2.3 基元与敏感度
  •     2.3.1 基元
  •     2.3.2 敏感度
  • 3 基于URL语言特征的检测算法
  •   3.1 主级域名的语言特征检测
  •   3.2 子域名的语言特征检测
  •     3.2.1 子域名特征的定义
  •     3.2.2 子域名特征的选择
  •   3.3 检测算法
  •     3.3.1 算法描述
  •     3.3.2 算法分析
  • 4 实验分析
  •   4.1 数据集
  •   4.2 相似性系数
  •   4.3 子域名特征的分类效果
  •   4.4 算法评估
  • 5 结束语
  • 文章来源

    类型: 期刊论文

    作者: 王雨琪,刘博文,林果园

    关键词: 钓鱼网站,统一资源定位符,语言特征,基元,敏感度

    来源: 计算机工程与应用 2019年24期

    年度: 2019

    分类: 信息科技

    专业: 计算机软件及计算机应用,互联网技术

    单位: 中国矿业大学计算机科学与技术学院,矿山数字化教育部工程研究中心,南京大学计算机软件新技术国家重点实验室

    基金: 江苏省产学研前瞻性联合研究项目(No.BY2016026-04),软件新技术国家重点实验室开放基金(No.KFKT2018B27)

    分类号: TP393.092;TP391.1

    页码: 84-90

    总页数: 7

    文件大小: 1595K

    下载量: 266

    相关论文文献

    • [1].基于机器学习的恶意URL识别[J]. 通信技术 2020(02)
    • [2].基于有限状态机的URL解析[J]. 微处理机 2010(05)
    • [3].基于URL相似度的会话识别方法[J]. 计算机系统应用 2014(12)
    • [4].基于引用启发式和URL语义相结合的会话识别方法[J]. 计算机应用研究 2014(01)
    • [5].基于相似URL的深层网数据区域识别[J]. 计算机工程 2012(02)
    • [6].URL重写技术实现网站伪静态[J]. 沙洲职业工学院学报 2010(01)
    • [7].基于锐道开发框架的URL权限控制管理方案实践[J]. 金融科技时代 2017(01)
    • [8].基于云安全的恶意URL动态扫描系统的设计与测试探索[J]. 无线互联科技 2014(12)
    • [9].基于域名信息的钓鱼URL探测[J]. 计算机工程 2012(10)
    • [10].ESWL、URL、PCNL及后腹腔镜输尿管切开取石术治疗上段输尿管结石对比观察[J]. 山东医药 2009(10)
    • [11].一种基于URL路径的页面用户聚类方法[J]. 长春工程学院学报(自然科学版) 2009(02)
    • [12].ESWL与URL治疗输尿管结石临床效果评估研究[J]. 世界最新医学信息文摘 2017(19)
    • [13].URL与ESWL治疗老年输尿管结石的疗效分析[J]. 现代预防医学 2012(01)
    • [14].基于URL的中文多语义名词在线语义标注[J]. 计算机工程 2014(10)
    • [15].基于数字校园URL书签应用的设计与实现[J]. 计算机系统应用 2009(03)
    • [16].基于URL参数传递的数据库分页显示技术实现[J]. 长春工程学院学报(自然科学版) 2012(01)
    • [17].基于半监督学习的恶意URL检测方法[J]. 计算机系统应用 2020(11)
    • [18].基于威胁情报平台的恶意URL检测研究[J]. 计算机科学 2018(03)
    • [19].基于URL和PageRank的公安舆情关键人物评估[J]. 铁道警察学院学报 2019(05)
    • [20].基于长短期记忆网络的恶意URL的检测[J]. 北京建筑大学学报 2019(03)
    • [21].延续护理对输尿管结石URL术后放置支架管患者自我管理能力的影响[J]. 青岛医药卫生 2016(04)
    • [22].OT位ESWL与URL治疗输尿管下段结石比较[J]. 宁夏医学杂志 2014(06)
    • [23].面向移动终端的URL过滤方法[J]. 计算机工程与应用 2011(18)
    • [24].基于数据挖掘的钓鱼网站URL预测研究[J]. 电子制作 2019(08)
    • [25].基于URL单点漫游的统一身份认证系统设计[J]. 电子设计工程 2017(11)
    • [26].基于多层卷积模型的恶意URL特征自动提取[J]. 计算机工程与设计 2020(07)
    • [27].基于威胁情报和多分类器投票机制的恶意URL检测模型[J]. 计算机与数字工程 2020(08)
    • [28].我国高校图书馆网站URL共现网络结构研究[J]. 情报探索 2016(11)
    • [29].基于URL重写技术的4种数字资源授权访问系统比较[J]. 中华医学图书情报杂志 2017(09)
    • [30].一种应用于搜索引擎URL检索的hash算法设计与实现[J]. 现代计算机(专业版) 2009(04)

    标签:;  ;  ;  ;  ;  

    基于URL语言特征的钓鱼网站检测算法
    下载Doc文档

    猜你喜欢