论文摘要
精准医疗伦理的信息安全标准体系构建过程中,会使用大量的资源类型,其中最为重要的就是标准资源,标准资源具有"非结构化"、"缺少语义信息"的特点,这对资源中重要文本信息和结构信息的提取造成了困难。本文提出针对信息安全标准数据特点的资源解析方法,基于"非结构化数据-半结构化数据"的转换思想和XML Schema技术,设计并实现了针对非结构化PDF文件的资源自动解析工具,将源数据中的非结构化数据转化为半结构化的XML格式数据,并以"整体式存储"方式存入MongoDB数据库中,实现了在Solr服务器中的检索功能和完成信息安全标准体系构建过程中信息提取、资源解析的工作。通过对比实验证明了基于XML数据的资源解析工具比JSON数据作为数据中间件,对信息安全标准的解析效果更佳。
论文目录
文章来源
类型: 期刊论文
作者: 邢玉艳,刘耀,刘茹
关键词: 非结构化数据,资源解析,数据存储,信息安全标准
来源: 情报工程 2019年05期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用
单位: 中国科学技术信息研究所,北京大学
基金: 国家重点研发项目“精准医疗伦理,政策法规框架研究”中课题1——“构建安全,可靠的面向生物医学大数据的,跨系统样本和数据共享的保障体系”(2017YFC0910101)
分类号: TP309
页码: 108-118
总页数: 11
文件大小: 1293K
下载量: 26