乳腺癌生命周期与影响因素研究

乳腺癌生命周期与影响因素研究

论文摘要

乳腺癌是发生在乳腺上皮组织的,目前最常见的女性恶性肿瘤。全球乳腺癌发病率自20世纪70年代末开始一直呈上升趋势,欧美等发达国家一直是乳腺癌的高发地区[29],尤其是在经济发达的大城市,乳腺癌的发病率增加尤其明显。为了能探究乳腺癌的致病因素和治疗手段,本文分析了来自《Nature Communications》杂志中Pereira B[12]的乳腺癌数据,先进行了Kaplan-Meier估计[8],描绘了ER状态、HER2状态、化疗、激素疗法、手术类型和总体的生存曲线。首先本文通过建立Cox风险比例回归模型和加速失效模型,表明了诺丁汉预后指数、年龄、化疗、激素疗法和手术类型对乳腺癌患者的生存有着显著影响,诺丁汉预后指数和年龄越大,生存时间越短,进行化疗、激素治疗和保乳手术的患者生存机率更大;然后通过构建决策树模型和随机森林模型,预测患者的生存状态。比较Cox风险比例回归模型[36]和随机森林模型[53][54]后发现,Cox模型更适用于解释协变量对生存时长的影响,随机森林模型在预测生存周期方面效果更佳;最后建立分位数回归模型,分析当生存率不同时,协变量的影响作用。提出早发现、早治疗的理念,尽可能采取化疗、激素疗法和保乳手术的方案,增大我国乳腺癌生存概率,促进我国民众科学认知乳腺癌,帮助医疗人员制定最佳治疗方案。

论文目录

  • 中文摘要
  • Abstract
  • 绪论
  • 第一章 数据处理和生存分析
  •   1.1 数据说明
  •     1.1.1 数据来源
  •     1.1.2 数据预处理
  •   1.2 准备知识
  •   1.3 Kaplan-Meier分析特征
  • 第二章 乳腺癌生存时间及其影响因素研究
  •   2.1 准备知识
  •     2.1.1 Cox风险比例回归模型
  •     2.1.2 加速失效模型
  •   2.2 建模
  •     2.2.1 Cox风险比例回归模型
  •     2.2.2 加速失效模型
  •   2.3 模型比较
  • 第三章 基于数据挖掘的生命周期研究
  •   3.1 基本原理
  •     3.1.1 决策树模型的基本原理
  •     3.1.2 随机森林模型的基本原理
  •   3.2 建立模型
  •     3.2.1 数据处理
  •     3.2.2 决策树建模
  •     3.2.3 随机森林
  •   3.3 模型预测与比较
  •     3.3.1 模型预测
  •     3.3.2 模型比较
  • 第四章 删失数据的分位数回归
  •   4.1 准备知识
  •   4.2 分位数回归建模
  • 第五章 总结和展望
  •   5.1 结论和建议
  •     5.1.1 结论
  •     5.1.2 建议
  •   5.2 不足和展望
  •     5.2.1 研究的不足
  •     5.2.2 未来的研究方向
  • 附录1
  • 附录2
  • 附录3
  • 参考文献
  • 致谢
  • 个人简历
  • 文章来源

    类型: 硕士论文

    作者: 谢诗季

    导师: 陈晓平

    关键词: 乳腺癌,删失数据,估计,风险比例回归模型,加速失效模型,随机森林模型,分位数回归

    来源: 福建师范大学

    年度: 2019

    分类: 基础科学,医药卫生科技

    专业: 数学,肿瘤学

    单位: 福建师范大学

    分类号: O212;R737.9

    DOI: 10.27019/d.cnki.gfjsu.2019.000783

    总页数: 74

    文件大小: 2521k

    下载量: 8

    相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  

    乳腺癌生命周期与影响因素研究
    下载Doc文档

    猜你喜欢