POMDP近似解法研究及在中医诊疗方案优化中的应用

POMDP近似解法研究及在中医诊疗方案优化中的应用

论文摘要

序贯决策是人类在生产和生活中时刻都会遇到的问题,也是人工智能和控制领域的热点研究内容。部分可观察马尔可夫决策过程(Partially Observable Markov Decision Process, POMDP)是一种描述不确定环境下序贯决策问题的概率模型。POMDP的精确值迭代算法利用动态规划在整个信念状态空间上更新值函数,无法解决现实中大规模的POMDP问题。因此,对POMDP近似求解算法的研究具有重要的理论价值和现实意义。近几年来,基于点的值迭代算法成为POMDP模型主流的近似求解方法。基于点的算法只利用少量可以到达的信念状态更新值函数,其中如何选择用于更新值函数的信念状态和如何确定信念状态上值函数的更新顺序是基于点的值迭代算法的两个关键问题。然而现有算法在这两个方面仍然存在一定的不足,提出更好的信念状态选择算法是提高POMDP值函数收敛速度的重要因素,这正是本文的主要研究内容之一。另外,在医学领域中,动态治疗方案规划是一种不确定环境下的多阶段决策问题。动态序贯干预是中医临床过程中治疗慢性疾病的基本方法。以患者为轴心的治疗原则和医生的个体性特点,使得中医动态序贯干预过程中包含多样化的治疗方案。临床专家往往试图通过这种无外部对照的、大量的临床数据获得疗效较好的治疗方案,进而逐步形成固化、有效的经验知识。但是,利用传统经验整理方式形成有效治疗方案是一个较为漫长的过程。如何从大规模、复杂的多维临床数据中发现较优的动态序贯治疗方案,成为有效临床方案形成的重要课题,也是辨证论治临床评价研究的关键问题。针对这一问题,本文提出用POMDP模型对中医临床观察性数据建模的方法,并从来自临床实际的大规模数据中发现优化的动态治疗方案,为中医辨证论治过程中的动态治疗方案规划和疗效评价提供一种有力的工具。针对以上问题,本文的主要工作如下:1.系统地归纳和总结了近几年POMDP模型近似解法中基于点的值迭代算法的有关理论与方法,特别是对信念状态的选择和信念状态上值函数的更新顺序两个方面进行了深入的分析。这些内容将是本文工作的基础。2.提出了一种基于信念状态不确定性的信念状态选择算法UBBS。UBBS算法每次扩充信念状态集合时,首先选择不确定性较小并且到已选信念状态集合的1-范数距离大于一定阈值的信念状态。我们采用两种方法描述信念状态的不确定性:一种方法用信息论中的熵来衡量信念状态的不确定性,另一种方法利用信念状态本身最大概率元素与最小概率元素的间隔来计算信念状态的不确定性。实验结果表明,UBBS方法通过较少数量的信念状态就可以得到与其他算法相近的最优值函数。3.提出了一种基于最短哈密顿通路产生用于更新POMDP值函数的信念状态轨迹的算法SHP-VI。SHP-VI方法是一种基于试探的POMDP值迭代算法,用计算最短哈密顿通路的近似算法求解一个最优行动序列,并利用该序列模拟Agent与环境的交互来探索信念状态空间从而得到一条信念状态轨迹,然后沿着信念状态轨迹反向更新值函数。实验结果表明,SHP-VI算法明显地提高了基于试探的算法中用于更新值函数的信念状态轨迹的计算效率,并减少了求解POMDP问题最优值函数的迭代次数。4.如何从大规模的复杂多维临床数据里发现中医临床实际中较优的动态序贯诊疗方案,是辨证论治临床评价研究的关键问题。针对这一问题,提出了一种利用POMDP模型发现优化的动态治疗方案的方法。这是首次在中医领域里探讨用POMDP方法解决治疗方案规划问题,并且模型的所有参数均由实际临床数据计算得出。我们把中医临床专家可以直接观测到的症状体征作为观察变量,将健康状态数设置在一个适合的范围之内并通过K-均值聚类算法从临床数据中得到健康状态。利用大规模的临床数据来估计POMDP模型中的状态转移概率和观察函数,并用加权的症状改善作为治疗措施疗效的评价。实验中,对中医治疗2型糖尿病的临床数据建立了POMDP模型,并利用PBVI和UBBS算法求解并发现了临床数据中优化的处方治疗方案。实验表明,POMDP模型可以用于挖掘临床数据中较优的序贯治疗方案,能够为中医辨证论治有效动态干预方案的形成和临床验证提供参考知识。同时,实验也验证了我们提出的UBBS算法在解决实际问题时的有效性。

论文目录

  • 致谢
  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 引言
  • 1.2 不确定环境下的规划问题
  • 1.3 POMDP及其研究现状
  • 1.4 医学领域中的治疗决策问题
  • 1.5 研究意义
  • 1.6 论文的主要工作和创新点
  • 1.7 论文的组织结构
  • 第二章 POMDP模型与基础知识
  • 2.1 MDP模型
  • 2.1.1 MDP模型简介
  • 2.1.2 MDP最优策略
  • 2.1.3 MDP最优策略的求解算法
  • 2.2 POMDP模型
  • 2.3 一个例子
  • 2.4 有模型和无模型的POMDP问题
  • 2.5 信念状态和值函数
  • 2.5.1 信念状态
  • 2.5.2 值函数
  • 2.6 POMDP的解法
  • 2.6.1 精确算法
  • 2.6.2 近似算法
  • 2.7 小结
  • 第三章 一种基于不确定性的信念状态选择算法
  • 3.1 引言
  • 3.2 几种基于点的值迭代算法
  • 3.2.1 PBVI算法
  • 3.2.2 BFBS和DBBE算法
  • 3.2.3 Perseus算法
  • 3.2.4 FSVI算法中的信念状态选择
  • 3.3 基于不确定性的信念状态选择算法
  • 3.3.1 算法思想
  • 3.3.2 UBBS算法
  • 3.3.3 两种计算不确定性的方法
  • 3.4 实验
  • 3.4.1 实验设置
  • 3.4.2 实验结果与分析
  • 3.5 小结
  • 第四章 一种基于最短哈密顿通路的POMDP值迭代算法
  • 4.1 引言
  • 4.2 相关工作分析
  • 4.2.1 基于试探的方法
  • 4.2.2 FSVI和TOP算法
  • 4.2.3 HSVI算法
  • 4.3 最短哈密顿通路和GENI算法
  • 4.4 SHP-VI算法
  • 4.4.1 SHP-VI算法思想
  • 4.4.2 SHP-VI算法
  • 4.4.3 算法描述
  • 4.4.4 收敛性分析
  • 4.5 实验
  • 4.5.1 实验设置
  • 4.5.2 实验结果
  • 4.5.3 实验分析
  • 4.6 小结
  • 第五章 基于POMDP的中医处方治疗方案优化方法研究
  • 5.1 引言
  • 5.2 相关工作
  • 5.3 中医相关知识介绍
  • 5.3.1 中医"辨证论治"
  • 5.3.2 中医处方治疗方案
  • 5.3.3 中医临床数据的作用与中医数据挖掘
  • 5.3.4 2型糖尿病
  • 5.4 中医处方治疗方案优化的POMDP建模
  • 5.4.1 状态与观察
  • 5.4.2 行动
  • 5.4.3 转移概率和观察函数
  • 5.4.4 立即报酬
  • 5.4.5 初始信念状态
  • 5.4.6 模型的求解
  • 5.5 实验
  • 5.5.1 数据说明
  • 5.5.2 从数据到有模型的POMDP
  • 5.5.3 实验设置和结果
  • 5.5.4 实验分析
  • 5.6 小结
  • 第六章 结束语
  • 6.1 本文工作的总结
  • 6.2 进一步研究的展望
  • 参考文献
  • 攻读博士期间发表和已录用的学术论文
  • 学位论文数据集
  • 相关论文文献

    • [1].研究人员提出人工智能时代共享临床数据框架[J]. 数据分析与知识发现 2020(Z1)
    • [2].基于临床数据中心的医院知识服务系统构建[J]. 医学信息学杂志 2017(02)
    • [3].临床数据中心的构建与应用[J]. 中国数字医学 2016(08)
    • [4].基于电子病历的临床数据中心构建[J]. 医学信息学杂志 2016(10)
    • [5].医院临床数据中心构建探讨[J]. 中国数字医学 2015(02)
    • [6].临床数据资源整合与利用[J]. 中国数字医学 2010(11)
    • [7].临床数据造假入刑并非小题大做[J]. 江淮法治 2017(08)
    • [8].临床数据中心的构建与应用[J]. 中国卫生产业 2018(05)
    • [9].临床数据中心基础上的多学科会诊系统设计与应用[J]. 医学信息学杂志 2017(06)
    • [10].临床数据中心建设及其应用[J]. 医院管理论坛 2017(10)
    • [11].大型三甲医院临床数据中心系统的建设与应用[J]. 中国数字医学 2016(10)
    • [12].刘洪:释放临床数据价值[J]. 中国医院院长 2014(23)
    • [13].论基于信息标准的临床数据中心构建[J]. 中国数字医学 2012(11)
    • [14].临床数据中心建设方法探讨[J]. 中国数字医学 2012(11)
    • [15].临床数据质量评估指标研究[J]. 医学信息学杂志 2020(10)
    • [16].临床数据中心建设助力转化医学研究[J]. 转化医学杂志 2013(02)
    • [17].医院临床数据中心建设问题分析[J]. 解放军医药杂志 2012(12)
    • [18].基于电子病历的临床数据中心构建研究[J]. 中国数字医学 2017(03)
    • [19].临床数据中心数据处理过程的实现[J]. 中国医疗设备 2015(04)
    • [20].脑卒中临床数据管理与分析系统构建与实现[J]. 中国数字医学 2012(08)
    • [21].临床数据中心的设计与实现[J]. 中国数字医学 2010(09)
    • [22].临床数据中心:信息化新战役[J]. 中国医院院长 2014(14)
    • [23].中医临床数据信息化过程中的标准化问题[J]. 世界科学技术(中医药现代化) 2011(04)
    • [24].临床数据中心构建方法探讨[J]. 中国数字医学 2008(10)
    • [25].基于临床数据中心的医院信息集成平台建设[J]. 信息记录材料 2019(12)
    • [26].医院临床数据分析智能分类处理技术研究[J]. 计算机测量与控制 2018(02)
    • [27].医院临床数据中心构建的几点思路分析[J]. 科技视界 2018(12)
    • [28].监管失守:八成新药临床数据涉假[J]. 杂文选刊 2016(10)
    • [29].临床数据中心七大特征与构建三步曲[J]. 吉林医学信息 2014(03)
    • [30].临床数据中心的应用[J]. 中国医疗设备 2014(06)

    标签:;  ;  ;  ;  ;  

    POMDP近似解法研究及在中医诊疗方案优化中的应用
    下载Doc文档

    猜你喜欢