NSCL/P高危因素条件Logistic回归与数据挖掘相结合的临床研究

NSCL/P高危因素条件Logistic回归与数据挖掘相结合的临床研究

论文摘要

目的:探讨非综合征性唇腭裂(Nonsyndromic cleft lip and palate,NSCL/P)发病的主要危险因素;评估这些主要危险因素在NSCL/P发病中的相对重要性,筛选其可能存在的保护因素;最终确立NSCL/P发病概率的预测模型,为优生网络的构建奠定基础。方法:采用1:1配对病例对照研究,研究对象中病例组来源于潍坊医学院附属医院儿科,潍坊市口腔医院,潍坊市计划生育科研所,潍坊市人民医院、菏泽市立医院及烟台毓璜顶医院口腔科,2006年9月至2007年9月期间,就诊的年龄在0~12岁之间的NSCL/P患儿76例;对照组来源于同一机构门诊或病房或同一居住区符合配对条件的非唇腭裂患儿。根据危险因素编制调查表,统一培训调查员,对病例组与对照组患儿父母进行调查,数据经审核后录入Excel 2003建立数据库。首先,在对调查表进行信度和效度检验基础上将所有调查项目进行合理量化,然后,在分别诊断各变量与Logitp之间大致呈线性关系后,使用条件Logistic回归对资料进行单因素分析,再对单因素筛选的变量结合专业知识进行多因素逐步回归分析,筛选主要危险因素并建立“最优”模型,对各主要危险因素之间作变量相关性分析,将存在相关的变量以交互作用项的形式引入方程建立回归模型,对“最优”模型使用拟合优度检验,根据专业知识对最合理的模型予以解释,最后,根据危险因素分别建立分类树与LogitBoost的发病概率预测模型,采用ROC曲线对两模型进行评价,从而确立本研究中NSCL/P发病概率的预测模型。以上分析过程由统计软件SAS 8.0、SPSS13.0、新西兰大学开发的WEKA软件完成。结果:本次调查共收集到1:1病例对照组76组,以α=0.1为检验水准,对各影响因素进行单因素条件Logistic回归分析,共筛选出23个具有显著统计学意义的因素,然后经过数据的相关性分析、共线性诊断以及专业解释等筛选出14个变量,分别按sle=0.10,sis=0.15;sle=0.15,sls=0.15;sle=0.15,sis=0.20;sle=0.20,sls=0.20,进行多因素条件Logistic逐步回归分析,筛选出6个具有统计学意义的变量。为研究变量之间对NSCL/P发病可能存在的交互作用,将上述6个变量进行偏相关分析,将存在相关的变量以交互作用项的形式依次引入方程建立回归模型,结合专业知识,含交互作用项模型无统计学意义,经拟合优度检验,在sle=0.10,sls=0.15水平逐步回归筛选出的模型为最适模型。模型中有6个与NSCL/P发病有关的主要危险因素,其中,呈显著正相关作用的变量有5个,分别是X8(胎次,OR=4.136,P=0.004)、X11(家族遗传史,OR=7.348,P=0.009)、X12(母孕期饮食是否规律,OR=7.995,P=0.007)、X19(母亲孕期异常情绪史,OR=6.371,P=0.000)、X30(母亲孕期感染史,OR=8.061,P=0.010),呈显著负相关作用的变量有1个,为X4(父亲学历,OR=0.040,P=0.000)。经ROC曲线评价,确立分类树模型可用来预测NSCL/P的发病概率。结论:母亲孕期感染、家族遗传、母亲孕期饮食不规律、胎次、母亲孕期异常情绪是NSCL/P发病的促进因素,且其对NSCL/P发病的影响作用依次增强;父亲学历是该病的保护因素。提示应大力宣传优生优育知识;普及孕期卫生保健知识;对有家族史以及子代发病风险高的家庭,除积极做好一级预防外,还应实行追踪随访,早期干预,可降低NSCL/P的发病率。经ROC曲线评价,最终确立分类树模型为NSCL/P发病概率的预测模型。

论文目录

  • 一、中文摘要
  • 二、英文摘要
  • 三、符号说明
  • 四、正文
  • (一) 前言
  • (二) 研究设计
  • (三) 一般资料与方法
  • (四) 结果与分析
  • (五) 讨论
  • (六) 结论
  • (七) 附录
  • (八) 参考文献
  • 五、致谢
  • 六、攻读硕士期间发表论文
  • 相关论文文献

    标签:;  ;  ;  ;  

    NSCL/P高危因素条件Logistic回归与数据挖掘相结合的临床研究
    下载Doc文档

    猜你喜欢