背景序列集论文-杜胜军,甄一松,周春晓,惠汝太

背景序列集论文-杜胜军,甄一松,周春晓,惠汝太

导读:本文包含了背景序列集论文开题报告文献综述及选题提纲参考文献,主要关键词:顺式调控模块,背景序列集,GC含量,位置权重矩阵

背景序列集论文文献综述

杜胜军,甄一松,周春晓,惠汝太[1](2007)在《不同GC含量的背景序列集在顺式调控模块预测模型中的比较研究》一文中研究指出在人类基因组上正确识别转录调控信号仍然是分子生物学界面临的重要挑战,目前计算的手段仍然是寻找转录调控元件的主要方法。然而这些方法普遍存在假阳性率过高的问题,而降低假阳性率的方法之一就是参数的优化选择。这些预测算法都普遍需要一个背景序列集作为训练集合中的阴性集合,我们假设背景序列集合的选择对预测算法的预测能力会产生重要影响,然而目前很少有人研究背景序列的选择问题。本文就组织特异的转录调控元件预测模型的背景序列集的选择问题进行了探讨。我们的研究结果表明,根据该组织特异的转录因子结合位点序列的GC含量选择的背景序列集,可以改进预测模型的预测能力。(本文来源于《中国分子心脏病学杂志》期刊2007年03期)

杜胜军[2](2007)在《不同GC含量的背景序列集在顺式调控模块预测模型中的比较研究》一文中研究指出研究背景在人类基因组上正确识别转录调控信号仍然是分子生物学界面临的重要挑战,目前计算的手段仍然是寻找转录调控元件的主要方法。然而这些方法普遍存在假阳性率过高的问题,而降低假阳性率的方法之一就是参数的优化选择。这些预测算法都普遍需要一个背景序列集作为训练集合中的阴性集合,我们假设背景序列集合的选择对预测算法的预测能力会产生重要影响,然而目前很少有人研究背景序列的选择问题。研究目的(1)检验背景序列的选择是否会对转录调控元件的预测产生重大影响。(2)在目前常用的几种背景序列集中,找出最适合的背景序列集。(3)找到背景序列集合影响预测模型的原因。对象和方法本文采用位置权重矩阵(PWM)表示每个转录因子的结合模式,采用逻辑斯克模型(LRA)来模拟转录因子与DNA模板的结合。本文采用受试者工作特征曲线(ROC)来衡量各个模型的预测能力,并采用曲线下面积(AUC)来比较各个模型的预测能力。结果在肝脏组织中:(1)以随机从人类基因组上随机选取序列为背景序列集合的预测模型对应的曲线下面积小于以启动子区序列为背景序列集合的预测模型对应的曲线下面积。(2)在我们选择的肝脏特异的转录因子中,大部分转录因子与DNA模板的结合模式是AT-rich。(3)在利用位置权重矩阵计算的得分比较中,HGP集合得分高于启动子区序列集合得分,并且结果具有显着的统计学意义。在骨骼肌组织中:(4)在以HGP为背景序列集和以启动子区序列为背景序列集对应的曲线下面积之间没有显着的统计学差异。(5)在选择的骨骼肌特异的转录因子中,与DNA模板的结合模式属于AT-rich和GC-rich的转录因子的个数一样多。(6)在通过位置权重矩阵计算的得分比较中,HGP集合得分与启动子区序列得分之间没有显着的统计学差异。结论(1)背景序列集的选择确实会对转录调控元件的预测产生重大影响。(2)在目前盛行的几种背景序列集中,最适合的背景序列集是根据转录因子的结合位点的序列模式的GC含量来选择的背景序列集。(3)如果一个组织的转录因子多结合于GC-rich的DNA序列模体,则采用随机从基因组选择的序列做背景序列集,能够提高转录调控元件预测模型的敏感度和特异度;而如果一个组织的转录因子多结合AT-rich的DNA序列模体,则采用启动子区的序列做背景序列集,也能提高转录调控元件预测模型的敏感度和特异度。研究目的:探讨衡量青岛港职工多重心血管危险因素聚集的3种人体测量指标(腰围、体重指数和腰臀比)的差异。研究方法:利用2000年青岛港健康研究横断面调查的18~54岁11359名(男性8758,女性2601)职工完整资料进行分析,包括血压,身高,体质量,腰围,臀围,血糖,胆固醇,叁酰甘油,总胆固醇,高密度脂蛋白胆固醇水平。利用Logistic回归模型计算3种人体测量指标与心血管危险因素的关系,采用ROC曲线分析计算叁种人体测量指标的不同水平识别多重心血管危险因素聚集的敏感性和特异性,比较不同测量指标对应的曲线下面积,并确定腰围的最佳截断点。研究结果:①男性主要危险因素水平(身高、体质量、体重指数、腰围、臀围、腰臀比)均高于女性(P<0.05)。②肥胖、高血压、糖尿病和代谢综合征等心血管危险因素的患病率均高于女性,差异有显着性(P<0.05)。③随着体重指数、腰围和腰臀比的增加,男性患2型糖尿病、高血压、血脂异常和多重危险因素聚集的危险都是增加的。然而相对于体重指数和腰臀比,随着腰围的增加,心血管事件发生的危险的增加是更快的。在女性中有与男性相似的现象。④采用腰围预测高血压、糖尿病、血脂异常和危险因素聚集的曲线下面积都高于体重指数和腰臀比,差异有显着性(P<0.05)。预测糖尿病、高血压、血脂异常和危险因素聚集的最佳腰围截断点,女性分别为76cm,76cm,72cm,79cm;男性分别为85cm,85cm,83cm,85cm。研究结论:腰围较体重指数和腰臀比能更好的预测心血管危险因素。男性腰围最佳切点为85cm,女性为79cm。(本文来源于《中国协和医科大学》期刊2007-05-01)

背景序列集论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

研究背景在人类基因组上正确识别转录调控信号仍然是分子生物学界面临的重要挑战,目前计算的手段仍然是寻找转录调控元件的主要方法。然而这些方法普遍存在假阳性率过高的问题,而降低假阳性率的方法之一就是参数的优化选择。这些预测算法都普遍需要一个背景序列集作为训练集合中的阴性集合,我们假设背景序列集合的选择对预测算法的预测能力会产生重要影响,然而目前很少有人研究背景序列的选择问题。研究目的(1)检验背景序列的选择是否会对转录调控元件的预测产生重大影响。(2)在目前常用的几种背景序列集中,找出最适合的背景序列集。(3)找到背景序列集合影响预测模型的原因。对象和方法本文采用位置权重矩阵(PWM)表示每个转录因子的结合模式,采用逻辑斯克模型(LRA)来模拟转录因子与DNA模板的结合。本文采用受试者工作特征曲线(ROC)来衡量各个模型的预测能力,并采用曲线下面积(AUC)来比较各个模型的预测能力。结果在肝脏组织中:(1)以随机从人类基因组上随机选取序列为背景序列集合的预测模型对应的曲线下面积小于以启动子区序列为背景序列集合的预测模型对应的曲线下面积。(2)在我们选择的肝脏特异的转录因子中,大部分转录因子与DNA模板的结合模式是AT-rich。(3)在利用位置权重矩阵计算的得分比较中,HGP集合得分高于启动子区序列集合得分,并且结果具有显着的统计学意义。在骨骼肌组织中:(4)在以HGP为背景序列集和以启动子区序列为背景序列集对应的曲线下面积之间没有显着的统计学差异。(5)在选择的骨骼肌特异的转录因子中,与DNA模板的结合模式属于AT-rich和GC-rich的转录因子的个数一样多。(6)在通过位置权重矩阵计算的得分比较中,HGP集合得分与启动子区序列得分之间没有显着的统计学差异。结论(1)背景序列集的选择确实会对转录调控元件的预测产生重大影响。(2)在目前盛行的几种背景序列集中,最适合的背景序列集是根据转录因子的结合位点的序列模式的GC含量来选择的背景序列集。(3)如果一个组织的转录因子多结合于GC-rich的DNA序列模体,则采用随机从基因组选择的序列做背景序列集,能够提高转录调控元件预测模型的敏感度和特异度;而如果一个组织的转录因子多结合AT-rich的DNA序列模体,则采用启动子区的序列做背景序列集,也能提高转录调控元件预测模型的敏感度和特异度。研究目的:探讨衡量青岛港职工多重心血管危险因素聚集的3种人体测量指标(腰围、体重指数和腰臀比)的差异。研究方法:利用2000年青岛港健康研究横断面调查的18~54岁11359名(男性8758,女性2601)职工完整资料进行分析,包括血压,身高,体质量,腰围,臀围,血糖,胆固醇,叁酰甘油,总胆固醇,高密度脂蛋白胆固醇水平。利用Logistic回归模型计算3种人体测量指标与心血管危险因素的关系,采用ROC曲线分析计算叁种人体测量指标的不同水平识别多重心血管危险因素聚集的敏感性和特异性,比较不同测量指标对应的曲线下面积,并确定腰围的最佳截断点。研究结果:①男性主要危险因素水平(身高、体质量、体重指数、腰围、臀围、腰臀比)均高于女性(P<0.05)。②肥胖、高血压、糖尿病和代谢综合征等心血管危险因素的患病率均高于女性,差异有显着性(P<0.05)。③随着体重指数、腰围和腰臀比的增加,男性患2型糖尿病、高血压、血脂异常和多重危险因素聚集的危险都是增加的。然而相对于体重指数和腰臀比,随着腰围的增加,心血管事件发生的危险的增加是更快的。在女性中有与男性相似的现象。④采用腰围预测高血压、糖尿病、血脂异常和危险因素聚集的曲线下面积都高于体重指数和腰臀比,差异有显着性(P<0.05)。预测糖尿病、高血压、血脂异常和危险因素聚集的最佳腰围截断点,女性分别为76cm,76cm,72cm,79cm;男性分别为85cm,85cm,83cm,85cm。研究结论:腰围较体重指数和腰臀比能更好的预测心血管危险因素。男性腰围最佳切点为85cm,女性为79cm。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

背景序列集论文参考文献

[1].杜胜军,甄一松,周春晓,惠汝太.不同GC含量的背景序列集在顺式调控模块预测模型中的比较研究[J].中国分子心脏病学杂志.2007

[2].杜胜军.不同GC含量的背景序列集在顺式调控模块预测模型中的比较研究[D].中国协和医科大学.2007

标签:;  ;  ;  ;  

背景序列集论文-杜胜军,甄一松,周春晓,惠汝太
下载Doc文档

猜你喜欢