基于schema的信息安全标准资源解析研究

基于schema的信息安全标准资源解析研究

论文摘要

精准医疗伦理的信息安全标准体系构建过程中,会使用大量的资源类型,其中最为重要的就是标准资源,标准资源具有"非结构化"、"缺少语义信息"的特点,这对资源中重要文本信息和结构信息的提取造成了困难。本文提出针对信息安全标准数据特点的资源解析方法,基于"非结构化数据-半结构化数据"的转换思想和XML Schema技术,设计并实现了针对非结构化PDF文件的资源自动解析工具,将源数据中的非结构化数据转化为半结构化的XML格式数据,并以"整体式存储"方式存入MongoDB数据库中,实现了在Solr服务器中的检索功能和完成信息安全标准体系构建过程中信息提取、资源解析的工作。通过对比实验证明了基于XML数据的资源解析工具比JSON数据作为数据中间件,对信息安全标准的解析效果更佳。

论文目录

  • 引言
  • 1 信息安全标准资源解析概述
  •   1.1 信息安全标准数据特点
  •   1.2 信息安全标准资源解析技术
  •     1.2.1 数据格式间接转换
  •     1.2.2 数据“中间件”技术
  •     1.2.3 XML Schema校验技术
  •     1.2.4 非结构化数据索引方法
  • 2 信息安全标准资源解析方法
  • 3 实验设计
  •   3.1 实验环境
  •   3.2 实验思路
  • 4 实验结果与分析
  •   4.1 信息安全标准解析完成度
  •   4.2 对比基于JSON的数据转换方法
  •   4.3 实验分析小结
  • 5 总结与展望
  • 文章来源

    类型: 期刊论文

    作者: 邢玉艳,刘耀,刘茹

    关键词: 非结构化数据,资源解析,数据存储,信息安全标准

    来源: 情报工程 2019年05期

    年度: 2019

    分类: 信息科技

    专业: 计算机软件及计算机应用

    单位: 中国科学技术信息研究所,北京大学

    基金: 国家重点研发项目“精准医疗伦理,政策法规框架研究”中课题1——“构建安全,可靠的面向生物医学大数据的,跨系统样本和数据共享的保障体系”(2017YFC0910101)

    分类号: TP309

    页码: 108-118

    总页数: 11

    文件大小: 1293K

    下载量: 26

    相关论文文献

    标签:;  ;  ;  ;  

    基于schema的信息安全标准资源解析研究
    下载Doc文档

    猜你喜欢