随机控制和对策理论中的一些倒向问题

论文摘要

倒向随机微分方程（BSDE）主要关心在有随机干扰的环境中如何使一个系统达到预期的目标．其理论自创立以来，在随机控制和对策，数理金融，偏微分方程，非线性数学期望等领域取得了广泛的应用．这篇论文旨在发展和完善BSDE理论，以更好的研究随机控制和对策中出现的倒向问题．在随机控制和对策问题中，无论是用BSDE来描述代价（或者效用）泛函，还是用BSDE来描述控制系统，这些问题的核心是BSDE理论．甚至BSDE本身也是一类随机控制问题．因此，BSDE理论的进步和完善无疑会促进一些控制和对策问题的进展．这篇论文的第二，三章致力于BSDE理论本身的研究．在第二章中，我们得到了BSDE理论的一个基础性的结果：解的唯一性和连续依赖性是等价的．在BSDE的系数g满足Lipschitz条件的前提下．BSDE的解对参数的连续依赖性由下面的不等式所表达：由此推演出丰富多彩的成果．我们的结论在某种程度上可以看作上面不等式在非Lip-schitz条件下的对应物，它为非Lipschitz条件下的BSDE的研究提供了一个有力的工具．不同于（正向的）随机微分方程，BSDE的解由两个部分（Y，Z）组成．虽然目前关于BSDE的结论大部分集中在解的第一部分Y上，但是了解Z同样是非常重要的．这篇论文的第三章研究了相当于控制策略的解的第二部分Z的一些基本性质，例如有界性，倒向生存性，比较性质等．Z在金融衍生产品定价理论中代表投资组合，我们的结论可以对投资组合中风险资产价值的正负，大小，区间有清晰的刻划．作为Z的有界性质的另一个应用，我们处理了一类由Bcnsoussan和Frehsc[6]提出的随机对策问题．在随机控制理论中，有一类指标泛函是用BSDE的解来描述的．例如：在效用理论中，经济学家使用BSDE的解来描述递归效用．为使效用最大化，产生了一类递归最优控制问题．彭实戈在[59；74]中系统而深入的研究了这类问题．然而，在实际问题中，有时人们会要求自己的效用高于某条“底线”，也就是说，BSDE的解要大于等于某个随机过程．这需要我们用反射BSDE的解来描述这种带障碍约束的递归效用，相应的产生一类带障碍约束的递归最优控制问题．在金融市场中，当贷款利率高于存款利率时．美式未定权益的定价问题是这类控制问题的一个具体的例子．在这篇论文的第四章，我们针对这类带障碍约束的递归最优控制问题进行了研究，得到了动态规划原理．并证明了值函数是相应的HJB方程唯一的粘性解．这一部分工作深受彭实戈[74]的工作的启发．由于BSDE是一类具有良好结构的动态系统，自然的，我们去研究以BSDE作为控制系统的随机控制问题和对策问题，我们称之为倒向随机控制问题和倒向随机对策问题．这类问题有实际的意义．在达到某个给定的随机目标的前提下，使自己的代价最小（或者效用最大），这可以看作倒向随机控制问题．例如追击问题等．多个人合作去达到一个共同的随机目标，而每个人又希望自己付出的代价最小（或者自己获得的效用最大），这类合作博弈可以看作倒向随机对策问题．目前，关于倒向随机控制问题的研究很少，而在本文之前，关于倒向随机对策问题的研究更是空白．在这篇论文的第五章，我们研究了倒向随机控制和对策（也研究推广的部分耦合的正倒向情形）的一类重要情形：线性二次问题．得到了唯一的最优控制（对于控制问题）和唯一的Nash均衡点（对于对策问题）的显式表达．本文共分为五章，以下是本文的结构和得到的主要结论．第一章：介绍从第二章到第五章我们讨论的问题，背景及想法．第二章：研究连续系数的BSDE解的唯一性和连续依赖性之间的等价关系．正如常微分方程的理论，这个性质是BSDE理论中的一个基本的结论．这部分的主要结果是下面的定理2．2．1（简单情况）和定理2．3．4（一般情况）．定理2．2．1．如果g满足假设（H2．1）-（H2．3），那么下面的两种陈述是等价的．（i）唯一性：方程（2．1）的解唯一．（ii）关于ζ的连续依赖性：任给{ζn}n=1∞，ζ∈L2（Ω，FT，P；R），当n→∞时，如果ζn→ζin L2（Ω，FT，P；R），那么其中（yζ（·），zζ（·））是BSDE（2．1）的任意的一个解，(yζn（·），zζn（·）)是BSDE（g，T，ζn）的任意一个解．定理2．3．4．如果gλ矿满足假设（H2．1’）-（H2．4’），那么下面的陈述是等价的：（iii）唯一性：当λ=λ0时，BSDE（2．8）的解唯一，即，BSDE(gλ0，T，ζλ0)的解是唯一的．（iv）关于9和ζ的连续依赖性：任给ζλ，ζλ0∈L2（Ω，FT，P；R），当λ→λ0时，如果ζλ→ζλ0 in L2（Ω，FT，P；R），（yλ（·），zλ（·））是BSDE（2．8）的任意的一个解．(yλ0（·），zλ0（·）)是BSDE（2．8）当λ=λ0时的任意一个解，那么第三章：使用Malliavin分析的工具，我们研究BSDE的解的第二部分Z的某些性质，例如有界性，倒向随机生存性（BSVP），比较性质．命题3．2．1．（有界性）令假设（A3．1）和（A3．2）成立．假设Dθζ和Dθg有界，那么我们有其中C是一个常数．特别地，Zθ=DθYθ有界．定理3．2．7．（BSVP）假设g满足（A3．1）-（A3．3）．如果（?）0≤θ≤t≤T，（?）z∈Rm×d×d，（?）y∈Rm×d，dK2（·）在y点是二次可微的，并且那么BSDE（3．1）的解Z在K中生存．定理3．2．12．（比较性质）假设g1和g2满足（A3．1）-（A3．3）．对于任意的0≤θ≤τ≤T，（?）ζ1，ζ2∈(D1，2)m∩L2（Ω，Fτ，P），我们有Dθζ1≥Dθζ2，（Yi，Zi）（i=1．2），是BSDE（3．19）在时间区间[0，τ]上的唯一解．任给t∈[0，τ]，y，y′∈Rm×d，z，z′∈Rm×d×d，如果下面的不等式成立，那么Zt1≥Zt2，t∈[0，τ]．然后，我们将这些理论结果应用到数理金融中．由于Z可以代表复制衍生产品价格的资产组合，利用我们得到的关于Z的性质，可以对风险资产价值的正负，大小，区间有清晰的刻划．在这一章的最后，我们处理了一类随机非零和微分对策问题．这个对策问题来源于Bcnsoussan和Frchsc[6]，但是他们利用偏微分方程的方法，只能够处理Markovian情形．我们利用Malliavin变分技术和Z的有界性质，在non-Markovian情形下得到了一个Nash均衡点的显式表达，有很好的实际应用意义．定理3．5．2．令假设（H3．2）-（H3．5）成立，u*=（u1*，…，ui*，…，uN*），其中ui*由（3．57）式定义，是随机非零和微分对策问题的一个Nash均衡点，Ji（x，u*）=Yi*（0）=Ji(x，ui，（u|-）i*．其中ui是任意的容许控制u的第i个分量（i=1，2，（?）N），（Yi*（·），Zi*（·））是BSDEs（3．56）的一个解．第四章：我们研究了一类带有障碍约束的递归最优控制问题，即，控制系统的效用泛函由一个反射BSDE（带一个下反射边界）所描述．具体来说，我们考虑下面的控制系统：相应的效用泛函为：其中(Yt，x；v（·），Zt，x；v（·），Kt，x，v（·）)是下面的反射BSDE的解我们要使效用泛函达到最大值．定义值函数为这类递归最优控制问题在金融市场中有应用．在借贷款利率不同的时候，美式衍生证券定价问题就可以转化为该类带有障碍约束的递归最优控制问题．一个直观的问题是：对于该类最优化问题，经典的动态规划原理是否成立?我们证明了一些反射BSDE的性质，使用彭实戈[74]的思想和框架，借助于这些性质和分析技巧，我们得到了值函数的确定性和连续性，证明了推广的动态规划原理（DPP）对该类问题依然成立．命题4．2．6．（确定性）令假设（H4．2．1）-（H4．2．4）成立，由（4．10）定义的值函数u（t，x）是一个确定的过程．引理4．2．8．（关于x的连续性）任给t∈[0，T]，x，x′∈Rn，我们有（ii）|u（t，x）|≤C（1+|x|）．定理4．2．11．（DPP）在假设（H4．2．1）-（H4．2．4）下，值函数u（t，x）服从下面的动态规划原理：对任意的0<δ≤T-t，命题4．2．12．（关于t的连续性）在假设（H4．2．1）-（H4．2．4）下，由（4．10）定义的值函数u（t，x）关于t连续．在这一章的最后，我们使用惩罚方法和一些粘性解的技巧，证明了值函数u（t，x）是下面的Hamilton-Jacobi-Bcllman（HJB）方程的唯一的粘性解：定理4．3．6．（存在性）假设b，σ，g，Φ，h满足假设（H4 2．1）-（H4 2．4），那么，由（4．10）定义的u是HJB方程（4．20）的一个粘性解．定理4．3．10．（唯一性）假设b，σ，g，Φ，h满足假设（H4．2．1）-（H4．2．4），那么，在多项式增长的连续函数类中，HJB方程（4．20）至多存在一个粘性解．第五章：首先，我们研究BSDE的线性二次（LQ）对策问题．这类问题是相应的倒向控制问题的推广（见Lim和周迅宇[47]），可以用来描述合作对策．为了记号上的便利，我们仅考虑两个对手，此时系统是相应的代价泛函为：我们的问题是去寻找称为对策的Nash均衡点的（u1（·），u2（·）），使得我们将这个对策问题和一个线性的初始端耦合的正倒向随机微分方程（FBSDE）联系起来．使用“连续化方法”，我们得到这类初始端耦合的FBSDE解的存在唯一性结果．定理5．1．3．令假设（H5．1．1），（H5．1．3）成立．FBSDE（5．1）存在唯一一个适应解（X，Y，Z）．应用这个结果和一个变换，我们研究这类倒向LQ对策问题．最终得到唯一的一个Nash均衡点的显式表达．定理5．1．6．函数（ut1，ut2）=(（N1）-1（B1）τxt1，（N2）-1（B2）τxt2)，t∈[0，T]，是上面对策问题的一个Nash均衡点，其中（xt1，xt2，yt，zt）是不同维FBSDE（5．7）的解，接下来，使用相同的思想方法，我们考虑推广的问题：部分耦合的FBSDE的LQ控制和对策问题．这里，问题更加复杂．由于状态轨线为正倒向随机系统的解，因此可以有更广泛的实际应用前景．为解决这类问题，我们需要考虑双倍维数的FBSDE的存在唯一性问题．相应的结果为定理5．2．2．假设（H5．2．1）和（H5．2．2）成立．那么双倍维数的FBSDE（DFBSDE）（5．10）存在唯一的适应解（X，Q，P，Y，K，Z）．定理5．2．4．映射ut=-Rt-1（Btτpt+Dtτkt-Htτqt），t∈[0，T]，是LQ控制问题（5．17）-（5．18）的唯一的最优控制，其中（xt，qt，pt，yt，kt，zt）是DFBSDE（5．19）的解．定理5．2．7．我们假设x的维数和y的维数相同：n=m．（a）如果系统（5．20）满足Dt1≡0，Dt2≡0，Ht1≡0，并且对于i=1，2，矩阵值过程Bti（Rti）-1（Bti）τ不依赖于t，并且那么，映射（ut1，ut2）=(-（Rt1）-1（Bt1）τpt1，-（Rt2）-1（Bt2）τPt2)，t∈[0，T]，是对策问题（5．20）-（5．21）的唯一的Nash均衡点，其中（xt，qt1，qt2，pt1，pt2，yt，kt1，kt2，zt）是TFB-SDE（5．23）的唯一的解．（b）如果系统（5．20）满足Bt1≡0，Bt2≡0，Ht1≡0，Ht2≡0，并且对于i=1，2，矩阵值过程Dti（Rti）-1（Dti）τ不依赖于t，并且那么，映射（ut1，ut2）=(-（Rt1）-1（Dt1）τkt1，-（Rt2）-1（Dt2）τkt2)，t∈[0，T]，是对策问题（5．20）-（5．21）的唯一的Nash均衡点，其中（xt，qt1，qt2，pt1，pt2，yt，kt1，kt2，zt）是TFB-SDE（5．23）的唯一的解．（C）如果系统（5．20）满足Bt1≡0，Bt2≡0，Dt1≡0，Dt2≡0，并且对于i=1，2，矩阵值过程Hti（Rti）-1（Hti）τ不依赖于t，并且那么，映射（ut1，ut2）=(（Rt1）-1（Ht1）τqt1，（Rt2）-1（Ht2）τqt2)，t∈[0，T]，是对策问题（5．20）-（5．21）的唯一的Nash均衡点，其中（xt，qt1，qt2，pt1，pt2，yt，kt1，kt2，zt）是TF-BSDE（5．23）的唯一的解．

论文目录

中文部分

中文摘要

英文摘要

第一章介绍

§1.1 连续系数的倒向随机微分方程解的唯一性和连续依赖性之间的等价关系

§1.2 倒向随机微分方程的解Z的有界和相关性质及其应用

§1.3 一类随机递归最优控制问题的动态规划原理和HJB方程

§1.4 线性二次最优控制,非零和微分对策和正倒向随机微分方程

§1.5 预备知识和论文中使用的记号

第二章连续系数的倒向随机微分方程解的唯一性和连续依赖性之间的等价关系

§2.1 预备知识

§2.2 主要结果

§2.3 一般情形

第三章倒向随机微分方程的解Z的有界和相关性质及其应用

§3.1 预备知识

§3.2 关于Z的有界性和生存性

§3.3 耦合SDE的BSDE

§3.4 在金融中的应用

§3.5 一类随机非零和对策问题的Nash均衡点

第四章一类随机递归最优控制问题的动态规划原理和HJB方程

§4.1 反射BSDE的预备结果

§4.2 模型的建立和动态规划原理

§4.3 HJB方程障碍问题的粘性解

第五章线性二次最优控制,非零和微分对策和正倒向随机微分方程

§5.1 倒向随机微分方程的线性二次非零和微分对策

§5.1.1 初始端耦合的FBSDE的预备结果

§5.1.2 倒向LQ非零和随机微分对策

§5.2 正倒向随机系统的线性二次最优控制和非零和微分对策

§5.2.1 双倍维数的FBSDE的预备结果

§5.2.2 线性二次随机最优控制问题

§5.2.3 线性二次非零和随机对策问题

Bibliography

作者简介

致谢

学位论文评阅及答辩情况表

英文部分

摘要

Abstract

1 Introduction

§1.1 The Equivalence between Uniqueness and Continuous Dependence of Solution for BSDEs with Continuous Coefficient

§1.2 Boundncss and Related Properties on Z for BSDEs with applications

§1.3 Dynamic Programming Principle for One Kind of Stochastic Recursive Optimal Control Problem and HJB Equation

§1.4 Linear-Quadratic Optimal control, Nonzero-Sum Differential Game and FBSDE

§1.5 Preliminary and Notations Used in This Thesis

2 The Equivalence between Uniqueness and Continuous Dependence of Solution for BSDEs with Continuous Coefficient

§2.1 Preliminaries

§2.2 Main Results

§2.3 The General Case

3 Boundness and Related Properties on Z for BSDEs with applications

§3.1 Preliminaries

§3.2 Bounded and viability properties with respect to Z

§3.3 BSDEs coupled with SDEs

§3.4 Application in finance

§3.5 Nash equilibrium point for one kind of stochastic nonzero-sum game problem

4 Dynamic Programming Principle for One Kind of Stochastic Recur（?） sive Optimal Control Problem and HJB Equation

§4.1 Preliminary Results of the Reflected BSDE

§4.2 Formulation of the Problem and the Dynamic Programming Principle

§4.3 Viscosity Solution of an Obstacle Problem for HJB Equation

5 Linear-Quadratic Optimal control, Nonzero-Sum Differential Game and FBSDE

§5.1 Linear-Quadratic Nonzero-Sum Differential Game of Backward Stochastic Differential Equations

§5.1.1 Preliminary Results of Initial Coupled FBSDEs

§5.1.2 Backward LQ Nonzero-Sum Stochastic Differential Games

§5.2 Linear-Quadratic Optimal Control and Nonzero-Sum Differential Game of Forward-Backward Stochastic System

§5.2.1 Preliminary Results of FBSDE with Double Dimensions

§5.2.2 Linear-Quadratic Stochastic Optimal Control Problem

§5.2.3 Linear-Quadratic Nonzero-Sum Stochastic Differential Game

Bibliography

CURRICULUM VITAE

致谢

学位论文评阅及答辩情况表

随机控制和对策理论中的一些倒向问题

论文摘要

论文目录

相关论文文献

猜你喜欢