基于schema的信息安全标准资源解析研究

论文摘要

精准医疗伦理的信息安全标准体系构建过程中,会使用大量的资源类型,其中最为重要的就是标准资源,标准资源具有"非结构化"、"缺少语义信息"的特点,这对资源中重要文本信息和结构信息的提取造成了困难。本文提出针对信息安全标准数据特点的资源解析方法,基于"非结构化数据-半结构化数据"的转换思想和XML Schema技术,设计并实现了针对非结构化PDF文件的资源自动解析工具,将源数据中的非结构化数据转化为半结构化的XML格式数据,并以"整体式存储"方式存入MongoDB数据库中,实现了在Solr服务器中的检索功能和完成信息安全标准体系构建过程中信息提取、资源解析的工作。通过对比实验证明了基于XML数据的资源解析工具比JSON数据作为数据中间件,对信息安全标准的解析效果更佳。

论文目录

引言

1 信息安全标准资源解析概述

1.1 信息安全标准数据特点

1.2 信息安全标准资源解析技术

1.2.1 数据格式间接转换

1.2.2 数据“中间件”技术

1.2.3 XML Schema校验技术

1.2.4 非结构化数据索引方法

2 信息安全标准资源解析方法

3 实验设计

3.1 实验环境

3.2 实验思路

4 实验结果与分析

4.1 信息安全标准解析完成度

4.2 对比基于JSON的数据转换方法

4.3 实验分析小结

5 总结与展望

文章来源

类型: 期刊论文

作者: 邢玉艳,刘耀,刘茹

关键词: 非结构化数据,资源解析,数据存储,信息安全标准

来源: 情报工程 2019年05期

年度: 2019

分类: 信息科技

专业: 计算机软件及计算机应用

单位: 中国科学技术信息研究所,北京大学

基金: 国家重点研发项目“精准医疗伦理,政策法规框架研究”中课题1——“构建安全,可靠的面向生物医学大数据的,跨系统样本和数据共享的保障体系”(2017YFC0910101)

分类号: TP309

页码: 108-118

总页数: 11

文件大小: 1293K

下载量: 26

基于schema的信息安全标准资源解析研究

论文摘要

论文目录

文章来源

相关论文文献

猜你喜欢