基于隐私保护和完整性验证的基因组数据计数查询方案

基于隐私保护和完整性验证的基因组数据计数查询方案

论文摘要

人类基因组信息在指导医疗决策方面发挥着至关重要的作用。基因组学的研究可以用于识别疾病与基因之间的潜在关联,从而达到提高药物治疗的安全性与有效性的作用。生物医学研究依赖于大量的基因组和临床数据,如何保证共享数据中患者隐私基因信息和数据整体存储安全成为广大学者关注的热点。过去,在基因数据共享时首先删除可能识别个人身份的重要标识符,再对数据按序存储。但研究表明使用自动化的方法对数据存储保护可以很简单的被攻击者推算出主体身份。目前的研究中采用加密协议来实现对生物医学数据的共享、管理和分析的安全保护,通过将这些数据加密后外包给第三方云服务提供商,由第三方执行数据查询操作来保证数据的隐私性和完整性。通过查阅大量的文献和分析现有临床基因组数据安全查询协议,本文针对基因组数据安全查询所面临的问题,提出了一种基于不太诚实的云服务端数据查询和安全共享的方法。本文主要开展的研究工作如下:(1)原始基因组数据处理技术。本文提出的方法处理了包含基因型和表型症状的原始医学生物数据,确保了共享数据的隐私安全性和查询完整性。首先,简要介绍了原始基因序列的格式处理方法,分析了当前研究中关于基因数据安全共享的相关技术和方法。然后,提出对原始基因数据添加汉明码校验位的方法验证查询结果的完整性,并使用布隆过滤器处理患者基因组序列对应的临床诊断信息,减少了查询时间。(2)可搜索的索引数据存储方法。通过研究分析当前基因组数据安全查询协议,本文提出了一种使用哈希表创建索引查询的方法,在保证敏感数据安全性的同时提高了查询效率。本文通过对现有的单核苷酸多态性(SNP)的基因组序列执行安全计数查询分析,评估了我们提出的方案。实验验证表明,我们的方案在实际研究工作中相比其它计数查询方法更加灵活、易于实现且安全性高。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  •   1.1 课题的研究背景
  •   1.2 课题研究现状
  •     1.2.1 临床数据查询研究现状
  •     1.2.2 安全计数查询研究现状
  •   1.3 安全计数查询相关工作
  •   1.4 课题的研究内容与研究目标
  •     1.4.1 课题研究内容
  •     1.4.2 课题研究目标
  •   1.5 论文的组织结构
  • 第2章 临床基因数据查询系统
  •   2.1 数据安全存储概述
  •   2.2 系统设计实现
  •   2.3 威胁模型
  •   2.4 小结
  • 第3章 临床基因组数据安全查询
  •   3.1 遗传基因数据概述
  •   3.2 基因数据查询方法概述
  •     3.2.1 全基因组范围查询方案
  •     3.2.2 top-k近似基因查询方案
  •     3.2.3 安全计数查询方案
  •   3.3 安全计数查询过程
  •   3.4 小结
  • 第4章 临床基因组数据安全计数查询协议
  •   4.1 基因组数据的隐私保护技术
  •     4.1.1 乱码电路技术
  •     4.1.2 Paillier加密算法
  •   4.2 查询结果的完整性验证技术
  •     4.2.1 汉明码技术
  •     4.2.2 布卢姆滤波器
  •   4.3 计数查询模型与问题描述
  •     4.3.1 网络模型
  •     4.3.2 安全分析
  •   4.4 数据加密操作
  •     4.4.1 原始基因组数据处理
  •     4.4.2 哈希表存储方案
  •     4.4.3 Bloom滤波器加密表型
  •     4.4.4 Paillier加密系统
  •   4.5 查询请求操作
  •   4.6 数据完整性分析
  •   4.7 实验分析
  •     4.7.1 实验数据仿真
  •     4.7.2 实验误差分析
  •     4.7.3 实验结果验证
  •   4.8 小结
  • 第5章 总结与展望
  •   5.1 工作总结
  •   5.2 工作展望
  • 参考文献
  • 致谢
  • 附录 A 攻读学位期间所发表的学术论文
  • 附录 B 攻读学位期间所参加的科研项目
  • 文章来源

    类型: 硕士论文

    作者: 陈晶

    导师: 匡林爱

    关键词: 基因组学,数据共享,计数查询,隐私性,完整性

    来源: 湘潭大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,计算机软件及计算机应用

    单位: 湘潭大学

    分类号: TP309;Q811.4

    DOI: 10.27426/d.cnki.gxtdu.2019.000888

    总页数: 53

    文件大小: 1291K

    下载量: 22

    相关论文文献

    • [1].浅谈云计算在生命科学中基因组数据高效管理的应用[J]. 中国新通信 2020(08)
    • [2].美国国立卫生研究院发布基因组数据共享政策[J]. 科研信息化技术与应用 2014(06)
    • [3].云存储基因组数据的可行性研究[J]. 数码世界 2019(03)
    • [4].面向基因组数据分析的大数据编程框架[J]. 科技经济导刊 2018(25)
    • [5].全基因组数据分析方法[J]. 计算机产品与流通 2019(09)
    • [6].利用基因组数据挖掘对人类长非编码RNA进行功能注释(英文)[J]. Journal of Zhejiang University-Science B(Biomedicine & Biotechnology) 2019(06)
    • [7].基因组时代线粒体基因组拼装策略及软件应用现状[J]. 遗传 2019(11)
    • [8].脑筋反应快慢与基因有关[J]. 发明与创新(大科技) 2015(06)
    • [9].随机生存森林在高维基因组数据生存分析中的应用[J]. 中国卫生统计 2013(06)
    • [10].基于文本挖掘的高通量癌症基因组数据注释[J]. 中华医学图书情报杂志 2016(12)
    • [11].利用Hadoop/HBase的药物基因组数据云存储实践研究[J]. 现代图书情报技术 2015(05)
    • [12].狗可能有两个起源地[J]. 江西饲料 2016(04)
    • [13].科技短波[J]. 新农村 2019(04)
    • [14].科学家筛选出远古北京人基因组[J]. 科学大观园 2017(21)
    • [15].系统发育基因组学研究进展[J]. 遗传 2014(07)

    标签:;  ;  ;  ;  ;  

    基于隐私保护和完整性验证的基因组数据计数查询方案
    下载Doc文档

    猜你喜欢