多阶段不确定系统的BangBang最优控制

南京理工大学

硕士学位论文

多阶段不确定系统的Bang--Bang最优控制

姓名:康玉洁

申请学位级别:硕士

专业:计算数学

指导教师:朱元国

20120309

硕士论文多阶段不确定最优控制

摘要

在理论和实际应用中,最优控制都起到了非常重要的作用。在多阶段系统中,当系统状态从前一个阶段转移到后一个阶段时,如果受到一个不确定变量的干扰,就是本文所讨论的多阶段不确定系统最优控制问题。本文所考虑的多阶段不确定系统的最优控制问题是使得不确定目标函数的期望值达到最优。在动态规划中BeUman最优性原理的基础上,本文得到关于这类问题的一组递推公式。运用递推公式,对于目标函数是线性,状态转移方程分别是线性和二次的多阶段不确定最优系统,得到该系统的Ban乎Bang最优控制和相应的最优目标值。

关键词:多阶段不确定最优控制,Ban乎Bang最优控制,Benman最优性原理,递推公式I

Abstract硕士论文

Abstract

Optimalcontroli8aveuiIIlportantfieldofstudynotonlyintheo巧but8L1soin印plications.Inamulti-sta舻昭stem,whenthestateatastageofthesyst锄isderived行omthestateofthef0珊erstage,anddijsturbedbyanuncertaillVariable,amulti-stageuncertainoptimalcontrolproblemi8proposed.Anoptim2L1controlproblemforamUdti-stageunCer七越nsystemisc0IlsideredtooptiⅡdzethee)(pected、,alueofanuncertainobjectivefunction.Based0nBenman’sPrincipleofOptimaHtyilldy-n锄缸cprogramHling,recurrenceequatio璐fortheproblemarepresented.Byllsingtherecurrenceequations,theexauctBan分Bangoptim越ControlsaIldthecorrespondingoptimaLlobjectivev址ue8fortheoptimalcontrolproblem耐thalinearobjectivefIlnctionsubjectt0an眦certainlinearandquadraticsystemare0btained,respectively.KeywDrds:Multi-sta嚣uncertaLinoptim以C0ntrol,Ba略Bangoptinl址control,Benmadl’sPrincipleofOptimality'工kctlrrenceequationII

硕士论文多阶段不确定最优控制1引言

1.1最优控制的发展简介

上个世纪50年代,在现代控制理论中,最优控制是其主要内容之一。最优控制问题主要是解决如何在众多决策中找到一个最优策略,使得目标函数达到最优,工程上的最速控制问题11J就是一个最优控制问题。在最优控制理论中,许多数学家致力于研究最优控制问题,随着越来越多的数学和科学计算的方法和结论应用于最优控制问题中,最优控制理论得到了很大的发展。并且随着理论和应用的逐步深入,最优控制理论也逐渐应用于许多其他的领域,比如:工艺设计、程序设计、经济和管理领域。

从古到今,最优化问题一直是人们讨论的重点问题,如中国古代的”田忌赛马"中选择一等马、二等马、三等马的比赛次序问题;赌博中如何获得最大利益的下注问题;现代投资组合中如何投资资金,从而获得最大收益的问题等。到20世纪60年代开始,随着实际中越来越多的最优化问题的提出,解决最优化问题的最优化方法也越来越多。在前人众多理论的基础上,最优化理论开始迅速发展,真正意义上形成一个学科。随后,最优化理论又出现了众多分支,如:线性规划、非线性规划、动态规划等。20世纪70年代,随着计算的精度和复杂性理论的提出,许多学者发现:对实际中一些复杂的组合优化问题,单纯地用当前人们所掌握的方法是很难解决的。20世纪80年代以来,人们发现自然界有许多现象可以进行模拟,从而得到一系列智能算法,如蚁群算法、遗传算法、模拟退火算法、人工神经网络优化等,这些算法极大地促进了最优化问题的发展。

对于随机最优控制的研究起始于20世纪60年代,在70年代广泛应用于金融学上,如Merton【2l等。随后,Fle血ngand磁shel【31,H甜rison【41和K缸atz嬲M,JeIlsen【61等广大学者研究了布朗运动和随机微分方程在金融中的应用。研究最优控制的一个主要方法就是动态规划,特别是DiXit和Pindyck【7】对Ito过程中动态规划在优化】

l引言硕士论文中的应用的研究,更是体现了这一点。解决随机最优控制问题所采用的随机优化方法与一般的优化问题所采用的方法有相同的要求,即:当满足给定的约束条件时,在所有方案中,找一个最优控制方案(即最优解),使得目标函数取得最优值(最大值或最小值)。但是,在我们所考虑的随机最优控制系统中,状态转移方程往往会受到随机因素的干扰,这是随机最优控制问题和一般的最优控制问题的区别。一般的最优化问题可以归结为求解一个正常的数学规划问题(线性或非线性),而随机规划问题则可归结为求解一个随机数学规划问题。近年来,国内广大学者,如李训经【8J【口J,雍炯敏【10J【11J,周风岐【12J,赵纯均,詹一辉[Ⅷ,郭尚来(14J,蔡尚峰【15J,钟秋海【16l等也致力于研究最优控制理论、随机控制问题和干扰解耦等内容,他们的研究成果进一步发展了最优控制问题。

在工业上,自动化管理技术日趋成熟,使得最优控制在理论上不断进步、实践上不断发展。在理论上,最优控制现阶段主要研究最优化问题中的Ban分B锄g控制问题。在应用上,最优控制已经在金融、工艺设计等领域起到了关键性的作用。工程上一个常见的最优控制问题是对速度的控制,早在20世纪50年代初,就有学者发表了有关这些问题的论文。在航空航天控制问题中,工程上常提出以节省昂贵的燃料为目的的燃料最优控制问题,以节约时间为目的的时间最优控制问题,兼顾响应时间及燃料的时间.燃料最优控制问题。当所研究的问题是一个正常的最优控制问题时,所得的最优控制是继电型控制,也即所得的最优控制在两个边界值之间来回转换,称其为B嘴Bang控制。

对于Ban分Bang控制的研究起始于20世纪60年代,例如主要用于研究最大时间问题的庞特里亚金极大值原理【17J和Dorato【t8J提出的关于线性随机系统的最优控制问题。当考虑关于布朗运动或随机微分方程上的时间最优问题或燃料最优问题时,我们可以研究它们的Ban乎Bang最优控制。其中,Bal出ishnan【圳,va曲rameevM,W如h【2l|,JohnNobleaJldHeinzSchaettler【22J,吴臻,王向荣f23J,高志强M,彭中兴,杨莹,黄琳【25J等国内外众多学者就致力于研究此类问题。2

硕士论文多阶段不确定最优控制

近几年,为了研究线性系统最优控制问题的解,人们进行了许多讨论和实验。在这些理论的基础上,我们的文章解决一类特殊的问题,即:这类问题的最优控制已知是Ban分Bang类型的。所谓最优控制是Ban分Bang类型的充分条件是:对每一个控制变量(a)有上界和下界;(b)状态转移方程是线性的;(c)性能指标是线性或非线性的。这些条件在实际中非常普遍,例如在航空与航天技术研究领域中。

由于现实世界的复杂性,我们面临着各种各样的不确定事件。其中随机f26】1271和模糊【28】㈨是两个经典的不确定性,它们是现代社会中研究最广泛、起重要作用的两类不确定性。然而,越来越多的调查表明一些不确定量,如“大约100千米"、“大约39。C’’、“接近80千克"、“低速"等,既不是随机的,也不是模糊的,这种情况促使我们去引入一种新的工具一不确定性理论来解决上述问题。不确定性理论是2007年由Liu酬创建,并于2010年进一步发展[31卜蚓。同时,Liu㈨提出了包含典范过程、不确定积分和链式法则的不确定微分,并运用不确定微分来解决动态不确定现象。从此,不确定性测度开始在理论研究和实际应用中被正式采用。现在,满足正规性、自反性、次可数可加性和乘积测度公理的不确定性理论已经成了数学的一个重要分支。

在生产实践中,计算机日益广泛地应用于各个领域中,这也就使得对于离散系统最优化问题的研究显得越来越重要。一方面实际中有些问题本身就是离散的,例如,经济与资源系统的最优化、数字滤波等问题;另一方面,即使实际问题是连续的,但是为了使连续过程能在计算机上进行控制,也要把时间离散化,从而得到一个离散系统,这样看来离散系统最优化问题就成了最优控制理论中一个越来越重要的方面。对于模糊离散最优系统,Lin和Ying㈨设计了一个最优且有实际意义的控制。当他们对于模糊离散最优系统进行研究时,主要考虑两个最优性问题:一个是对于给定的成本,使得收益最大;另一个是对于给定的收益,使得成本最小。在他们的文章中,考虑用加权和来代表所要优化的收益或成本。系统中的加权和实际上是一个模糊变量的期望值。由此,我们得到了在研究模糊最优控制中,用期望值来3

l引言硕士论文计算不确定变量大小的思路。

在自然界和人类现实世界中,我们会遇到许多主观和客观的不确定的问题,能够有效地预测和控制这些不确定性因素,使它们能更好地为人类做贡献,是人们所追求的最终目标。在管理学、信息科学、运筹学、计算机科学等许多学科领域中,我们所遇到的不确定的问题主要有随机问题和模糊问题。根据随机过程和Brownian运动,Liu㈨分别相对应地提出了模糊过程和典范过程。在典范过程的基础上,当系统受到模糊变量的干扰时,Liu㈨又提出了模糊微分方程。

随着研究的不断深入,多阶段模糊最优控制问题开始引起人们的注意,2011年,ZhuM首先提出运用动态规划来研究这类问题,并基于动态规划中Bellman的最优性原理,给出了一组应用于所有阶段的递推公式,成功得到了多阶段模糊系统的Ballg-Bang最优控制。在Zhul371【39】一“1】所考虑的问题中,对于一个多阶段模糊系统,其状态转移方程受到一个模糊变量的干扰,可以得到系统的模糊最优控制。引入不确定性理论后,如果状态转移方程受到不确定变量的干扰时,我们同样可以考虑一个多阶段不确定系统。多阶段不确定系统的最优控制问题同样是为了使目标函数达到最优(最大或最小),当受到一定的约束条件的限制时,在众多决策选择一个最优的决策,这类问题在实际中有着非常重要的应用。本文考虑的就是多阶段不确定系统,首先,仿照Zhu【37l中的方法,给出递推公式,考虑系统的性能指标都是线性的,状态转移方程分别是线性的和二次的多阶段不确定系统,并且分别得到上述两种系统的Ban乎Bang最优控制和相应的最优值。最后,本文运用所得到的结论,求解了一个数值例子,说明系统所得的最优控制的确是BaIlg-Bang最优控制。1.2本文的主要内容

2011年,在模糊理论的基础上,多阶段模糊系统的最优控制问题最早由Zhuf37】提出,他运用BeUman最优性原理,研究并给出了递推公式和相应的模糊最优控制。当多阶段系统的状态转移方程受到不确定变量的干扰时,可以相应地得到一个4

硕士论文多阶段不确定最优控制多阶段不确定系统。对于这类问题,受Zhu【37】文章的启发,本文考虑运用同样的方法,求解多阶段不确定系统的最优控制。

本文的其他章节安排如下:

第二章为多阶段不确定最优控制问题的理论基础,首先回顾了不确定性理论的相关内容,包括不确定测度、不确定性空间、不确定性分布函数、不确定变量的期望的定义及其相关性质定理。

第三章给出多阶段不确定系统的一般模型;并且仿照Zhu【矧,应用BeUman的最优性原理,得到一组递推公式。

第四章首先提出线性多阶段不确定系统最优控制问题的模型,应用递推公式,得到系统的Ban分B姐g最优控制和相应的最优值;随后考虑当目标函数是线性,状态转移方程是二次的时,得到其Ban争Bang最优控制和相应的最优值。

第五章的内容主要是给出一个数值例子,说明前述结论的应用。

本文主要内容已被接收将发表在国际SCI源期刊Information:An

Interdisciphna眄Journal上。InternationaLl

2预备知识硕士论文2预备知识

本文是在不确定性理论的基础之上对多阶段系统进行的研究,所以我们首先回顾不确定性理论的相关内容,不确定性理论是建立在不确定测度的基础之上的,下面我们引入Liu脚l中一些有用的定义。

2.1不确定测度和不确定变量

定义2.1.1.仁f0叫皿r是一个非空集合,£是r上的一个盯一代数.每一个A∈£称为事件.

定义2.1.2.仁i0硐j定义在£上的盯一代数的集合函数M称为不确定测度,如果M满足下列公理:

公理1.(正规性)对全集r,M{r)=1;

公理2.(自对偶性)对任意的事件A,M(A卜卜M|【Ac)=1;

f∞l∞

公理3・(次可数可加性)对每一个可数的事件序列_[凡),有Mt些人t,≤,三M{人t)・注2.1.1.根据上述三个公理,可以证明不确定测度M有单调性:

M{A)≤M{B’,

其中AcB.

定理2.1.1.仁i0嗣J如果M是一个不确定测度,则空集0的不确定测度为o,即:

M.[0)=O.(2.1)

定理2.1.2.陋i0嗣胆设M是一个不确定测度,对于任意的事件人,我们可得:

o≤M<A)≤l(2.2)

硕士论文多阶段不确定最优控制定理2.1.3.仁剐蚓胆设M是一个不确定测度,对于任意的事件Al和A1,我们可得:

M.[A1}VM{人2)≤3vt(Alu人2)≤M.[人1)+M.【A2).(2.3)

定理2.1.4.仁i0叫胆设3yc是一个不确定测度,对于任意的事件A1和A1,我们可得:

M{Al】.+M{人2)一1≤M{A1nA2)≤3vt.[A1)人M.【A2).(2.4)

注2.1.2.不确定变量是为了模拟不确定现象(如未知常量),其中这些不确定现象可以是不变量,但其真实值不能准确得到.例如:油田的储油量、距离、强度、敌军部队的规模均是不确定变量的例子.

定义2.1.3.陋i0叫肚r是一个非空集合,£是r上的一个伊代数,并且M是一个不确定测度,则称三元组(r,C,M)是一个不确定性空间.

定义2.1.4.仁i0叫,三元组(r,£,3vc)称为是不确定性空间.一个从不确定性空间(r,£,M)到实数集的可测函数f称为不确定变量.即:对于实数的任意Borel集B,集合

.【∈∈B}={一y∈rl∈(一y)∈B’

是一个事件.(2.5)

注2.1.3.很明显地,不确定变量与随机变量和模糊变量是有非常大的区别的.一般来说,随机变量是定义在概率空间上,函数值在实数集上的函数;模糊变量是定义在可能性空问上,函数值在实数集上的函数;而不确定变量是一个从不确定性空间到实数集的可测函数.

定义2.1.5.仁i0删肛f和,7是两个不确定变量,如果对于实数的任意Borel集B,均有

M代∈B>=M{,7∈B)

就称不确定变量∈和叼是相同的分布.(2.6)

2预备知识硕士论文2.2不确定性分布

本小节引入不确定性分布的定义来描述不确定变量,不确定性分布就是不确定变量的不完全信息的一个承载。然而,在很多情况下,我们多考虑不确定性分布,而不考虑不确定变量本身。

定义2.2.1.陋“叫,不确定变量荨的不确定性分布函数圣:睨_【o,1】定义如下:对任意实数z,

圣(z)=M{∈≤z).

例2.1.如果不确定变量∈有‘‘之字形”不确定性分布函数

0,如果z≤口

如果。≤z≤6(z一。)/2(6一口)’

西(z)=(2.7)

(z+c一26)/2(c一6),如果6Sz茎c

l,如果z≥c

记作z(n,6,c)其中o,6,c是实数,并满足a<6<c.我们就称∈为“之字形”不确定变量.

定理2.2.1.仁t∥司)如果两个不确定变量是相同的分布,则它们有公共的不确定性分布,但反过来结论不成立.

定理2.2.2.亿iuMJ一个函数西:跪_[0,1】是一个不确定性分布当且仅当它是一个单调递增的函数,除了西@)三。和西(z)兰1.

注2.2.1.独立性有许多种不同的表达形式,但必须满足的必不可少的特点是这些不确定变量不仅要独立地定义在不同的不确定性空间,而且同时还要定义在它们的乘积不确定性空间上.为了确保我们能够做到这一点,我们运用如下的数学形式来定义不确定变量的独立性.8

硕士论文多阶段不确定最优控制定义2.2.2.仁i0“1尉任意实Borel集B1,岛,…,Bm,有

M{自婚∈最,>=,蛩甄M

则称不确定变量∈1,已,…,岛是独立的。

立的当且仅当t6∈鼠,,c2㈣定理2.2.3.仁抛㈨,对任意实Borel集B1,B2,…,Bm,不确定变量∈1,已,…,‰是独

M胁吲).滕M豫吲

的函数,则^(荨1),五(已),…,厶(靠)是独立的不确定变量.

不确定变量的期望和方差2.3江9,定理2.2.4.仁“。胡胜不确定变量荨1,已,…,缸是独立的,并且^,,2,…,厶是可测

,+∞

‘,0,0r)dr,E略】=/3yc{f≥r)dr一/了vc.[∈sJ一∞(2.10)

,+∞,.0

E医】=/.,0垂(z)血.(1一西(z))血一/.,一∞(2.11)

剐=Z1一(Q)dQ。(2.12)

’西cz,={cz{,/2,三三三薹;1二≤lQ.13,

2预备知识硕士论文由(2.11)式可得∈的期望值为

E圈=小1一孚肛£孚扣。.仁㈣

定理2.3.3.仁{以司皿∈和,7是两个有有限期望值的独立的不确定变量,则对任意的实数口和6,有

E【《+6,7】=口E睡】+6E[纠.

注2.3.1.值得注意的是,期望值算子E对不独立的不确定变量一般没有线性性.

定义2.3.2.仁t∥司肚专是一个不确定变量,其有界的期望值为e,则不确定变量∈的方差定义为

y圈=E【@一e)2】.

定理2.3.4.仁i∥司,不确定变量专有有界的期望值e,口和6是实数,则

yK+6】=口2y圈.10

硕士论文多阶段不确定最优控制3多阶段不确定系统

3.1多阶段不确定系统模型

多阶段不确定系统的最优控制问题就是为了使目标函数达到最优(最大或最小),当受到一定的约束条件的限制时,在众多决策选择一个最优的决策。本文中,我们将讨论下列以不确定期望值最优作为目标函数,得到多阶段不确定系统最优控制问题,其一般模型如下:

堆o,o,=躐E酚㈣蝴∽]

z0+1):妒@0),t正G),J)+口@U),让G),J)c≥+1,

其中歹=0,l,2,…,Ⅳ一1,

z(o)=zo.

其中,是目标函数,矽和盯是两个函数,zO)是系统第J个阶段的状态,uO)系统第j『个阶段的控制变量,%满足约束条件的控制变量u0),其中J=o,1,2,…,Ⅳ的全(3・1)体,zo是系统的初始状态。另外,G,岛,…,o是一些独立的不确定变量。

令对任意的o≤后≤Ⅳ,J@七,七)是瞻,Ⅳ】上所得的期望值的最优返回值,其中在第尼阶段有状态z(忍)=z七。则可得下列模型:

m舶,=拦E隆魄蚓∽]以%砷2拦EI.薹“比),比)'力J

zU+1)=妒0D),让0),歹)+仃0G),乱U),歹)G+・,

其中j『=七,后+1,…,Ⅳ一l,

z(七)=z七.

11(3.2)

3多阶段不确定系统硕士论文注3.1.1.在上述模型的基础上,我们也可以考虑其他形式的多阶段不确定系统的最优控制问题的模型。如:上述模型中的最优值取的是目标函数的期望值的最大值,当我们考虑取目标函数的乐观值的最大值时,就可以建立相应的不确定乐观值最优控制问题模型。由于比较两个不同的不确定变量时采用了不同的比较准则,使得各类问题在引入形式和应用方面各不相同。

3.2递推公式

应用BeUman最优性原理,类似于Zhu【371中递推公式的证明,我们可以得到下列递推公式。由这个递推公式,问题(3.1)就能进行求解了。

定理3.2.1.对于问题(3.1),我们可以得到下列递推公式:

J@Ⅳ,Ⅳ)=u(瑚蹴,(zⅣ,让(Ⅳ),Ⅳ),

(3.3)

J(z七,后卜u鼢引m七,u(啪)+删%+1),七+1)】,

其中忌=Ⅳ一1,Ⅳ一2,…,l,0.

证明:由所给条件,很明显可以得到J0Ⅳ,Ⅳ)=札(m瓿,(zⅣ,乱(Ⅳ),Ⅳ)。对任意的忌=Ⅳ一1,Ⅳ一2,…,l,0,有

rⅣ1

以%动2燧E【三八加)'的)'力J

=燧E卜n㈤㈤+E幽蚓州幻,]]^S‘SⅣLU=七+lJJ

rrⅣ11

≤“鼢E陋蛾蚶舭)+。熬EL萎。m㈨u刚JJ

=缸蹴E[他(忌),u(尼),七)+,(z(后+1),%+1)】.12(3・4)

硕士论文多阶段不确定最优控制另外,对任意的u(t),七≤z≤Ⅳ,可得

,(钆,七)≥E心Z∽L∽

ҬJ

=EⅣ∑似他㈣h似U、门砷+E白枷∽J,]]I∑mo),u◇),j『)lIb=七+1JJ

因为对于七+l≤tSⅣ,则

m舶脚卜n㈤㈤+愚E隆枷∽J,]]

=Ef,(z(%),t上(七),膏)+J@(惫+1),七+1)】.

对上述不等式两边同时关于u(七)取最大值,可得

J(z%,七)>u蹴E阶(忌),u(啪)+州克+1),七十1)】.(3.5)

联合(3.4)和(3.5),即可得递推公式(3.3)。

根据前面所考虑的模型,递推公式(3.3)还可以表示为

J@Ⅳ,Ⅳ)=u(器‰,扛Ⅳ,札(Ⅳ),Ⅳ),

J(瓢,七)_u鼢E阶七,u(啪)+J(砂(z七,u(七),尼)(3.6)

+仃(z七,tl(七),忌)Ck+1,七+1)】,

其中%=Ⅳ一1,Ⅳ一2,…,1,0。

注3.2.1.从定理3.2.1,我们可以看出求解问题(3.1)可以转化为:按照逆序的方法,从最后一个阶段开始,一步一步,直到初始阶段为止,求解较为简单的问题(3.3)。

13

4多阶段不确定最优控制问题硕士论文4多阶段不确定最优控制问题

多阶段不确定最优控制问题是对于一个离散系统,当状态转移方程受到不确定变量的干扰时,求该多阶段不确定系统的最优控制,及其相应的最优目标值。4.1线性多阶段不确定最优控制问题

考虑如下线性多阶段不确定最优控制问题,由递推公式(3.3),我们可以得到其精确解,及其相应的最优值。系统模型如下:

mo,o,=蹬E阢。)]oStSⅣLJ=0J

s.t.

zG+1):%zU)+6JuU)+乃+1c;+l,

其中J=0,l,2,…,Ⅳ一1,

z(0)=zo,(4・1)

其中z0)是第J个阶段现存的燃料量,缸O)是第歹个阶段通过消耗或添加的燃料来影

州垆∞’=

JbN,N、=PNzN-}QN,

NN

,@%,后)=Rz七+∑Qi+乏二只crtet,‘=七i=七+1

14

硕士论文多阶段不确定最优控制其中

PⅣ=AⅣ,R=4七+最+1钆;

QⅣ=O,Q七=最+1‰I,

对任意的七=Ⅳ一1,Ⅳ一2,…,1,0.

证明:上述问题的最优控制分别标记为矿(0),u‘(1),…,u。(Ⅳ),运用递推公式(3.3),可得

J(zⅣ,Ⅳ)2l滁1(山zⅣ)=AⅣzⅣ,

其中lu’(Ⅳ)l≤10令PⅣ=AⅣ,QⅣ=o,则

JbN,N、=PNzN+QN.

当忌=Ⅳ一1时,运用递推公式(3.3),可得

J(zⅣ一1,Ⅳ一1)

2I乜(黝s1剐Ⅳ-1zⅣ-1+,(z(Ⅳ),Ⅳ)】

Iu(躐sl‰一lzⅣ_1+PⅣE陋(Ⅳ)】+QⅣ)

I“(躐s1{AⅣ.1zⅣ-1+PⅣE【口Ⅳ一lzⅣ-l+

6Ⅳ一1t正(Ⅳ一1)+盯Ⅳ瓯】+QⅣ)22

2Iu(麟≤1.[(AⅣ_l+R口Ⅳ.1)zⅣ-l+

PⅣ6Ⅳ一1u(Ⅳ一1)+PⅣ咐eⅣ+QⅣ).(4.2)因此

PⅣh一1矿(Ⅳ一1)2Iu(麟≤1既6Ⅳ-1u(Ⅳ一1)・

15

4多阶段不确定最优控制问题硕士论文所以可得

u』cⅣ一1,={兰:定,三蓁兰三i三三i

si弘.[6Ⅳ一1),如果6Ⅳ一1≠o;

不确定,其他情况.

因此。可得

J(zⅣ一l,Ⅳ一1)

=(AⅣ一1+尸Ⅳ口Ⅳ一1)zⅣ一1+PⅣ6N一1u‘(Ⅳ一1)+PⅣ盯ⅣeⅣ+QⅣ.

当6Ⅳ一1=0时,有

J(zⅣ一l,Ⅳ一1)

=(AⅣ一1+尸Ⅳojv—1)zⅣ一1+PⅣu’(Ⅳ一1)×o+PⅣ盯ⅣeⅣ+QⅣ=(4Ⅳ一l+PⅣoⅣ一1)zⅣ一1+PⅣ口ⅣeⅣ+QⅣ.

。PⅣ一1=AⅣ一1+j,ⅣoⅣ一1,QⅣ一1=0.

J@Ⅳ一1,Ⅳ一1)=PⅣ一1zⅣ一1+QⅣ一1+QⅣ+PⅣ叫eⅣ.

当6Ⅳ一1>o时,有u‘(Ⅳ一1)=1,并且

,@Ⅳ一1,Ⅳ一1)

=(AⅣ一1+户IⅣ口Ⅳ一1)zⅣ一1+PⅣ6Ⅳ一1×1+尸lⅣ盯NeⅣ+(?N

=(AⅣ一l+R口Ⅳ一1)zⅣ一1+PⅣ6Ⅳ一1+QⅣ+PⅣ仃ⅣeⅣ.

16(4.3)(4.4)(4.5)(4.6)

j)Ⅳ一1=AⅣ一l+尸Ⅳ口Ⅳ一l,QⅣ一l=PⅣ6Ⅳ一1.

‘,0N—l,Ⅳ一1)=PⅣ一lzN—l+QⅣ一l+QⅣ+PⅣ盯ⅣeⅣ.

当6Ⅳ一1<0时,有u‘(Ⅳ一1)=一1,并且

‘,(zⅣ一1,Ⅳ一1)

=(AⅣ一1+R口Ⅳ一1)zⅣ一l+尸^,6Ⅳ一l×(一1)+既盯ⅣeⅣ+QⅣ=(AⅣ一1+PⅣaⅣ一1)zⅣ一1一R6Ⅳ一l+QⅣ+PⅣ盯ⅣeⅣ.

蜀v—l=AⅣ一1+蜀v口Ⅳ一l,

则(4.7)QⅣ一1=一毋曲Ⅳ一1.

J(zⅣ一1,Ⅳ一1)=户k—lzⅣ一l+QⅣ一1+QⅣ+R盯ⅣeⅣ.

当忌=Ⅳ一2时,运用递推公式(3.3),可得

,0Ⅳ-2'Ⅳ一2)

2阻(是萄≤iE陋Ⅳ一2zⅣ一2+J@(』、r一1),Ⅳ一1)】

2lu(蹴sl{AⅣ_2zⅣ-2+PⅣ一1E陋(Ⅳ一1)】+QⅣ-1+QⅣ+PⅣ仃ⅣeⅣ)Iu(麟≤l{AⅣ一2zⅣ一2+鼢一1E【。Ⅳ一2zⅣ一2+6Ⅳ一2“(Ⅳ一2)+%一1%一1】+QN^+QN+PNoNeN、2

2l“(黝s1{(AⅣ-2+PⅣ一1QⅣ_2)zⅣ_2+R一16Ⅳ一2t正(Ⅳ一2)+QⅣ-l+弧

+pIⅣ一1盯Ⅳ一1eⅣ一1+尸Ⅳ盯ⅣeⅣ).(4.8)17

4多阶段不确定最优控制问题硕士论文因此

PⅣ一16Ⅳ-2u’(Ⅳ一2)2

所以可得Iu(躐≤1PⅣ一16心“(Ⅳ一2)・

如果6Ⅳ一2>O;

如果6Ⅳ一2<0;1,u‘(Ⅳ一1,

不确定,如果6Ⅳ一2=0,

si髓_[6Ⅳ一2),如果6Ⅳ一2≠o;(4.9)

不确定。

因此,可得其他情况.

J(zⅣ一2,Ⅳ一2)

=(AⅣ一2+PⅣ一loⅣ一2)zⅣ一2+尸Ⅳ一16Ⅳ一2缸‘(Ⅳ一2)+QⅣ一1+Q.Ⅳ

+尸Ⅳ一1盯Ⅳ一leⅣ一1+尸lⅣ盯ⅣeⅣ.(4.10)

当6Ⅳ一2=O时,有

J(zⅣ一2,Ⅳ一2)

=(AⅣ一2+PⅣ一1口Ⅳ一2)zⅣ一2+PⅣ一1u+(Ⅳ一2)×0+QⅣ一l+QⅣ

—}PN一・一N一、eN—l+PNoNeN

=∽Ⅳ一2+PⅣ一lnⅣ_2)zⅣ一2+QⅣ一l+QⅣ+既一1卿一1e^r—l

-}PNoNeN.(4.11)

毋、r一2=AⅣ一2+上)Ⅳ一l口Ⅳ一2,

18Q^r一2=0.

‘,@Ⅳ一2,Ⅳ一2)=j)Ⅳ一2zIⅣ一2+QⅣ一2+QⅣ一1+Q|Ⅳ+蜀、r—la.Ⅳ一leⅣ一1+局、ra.ⅣeⅣ.当6Ⅳ一2>o时,有矿(Ⅳ一2)=1,并且

,(zⅣ一2,Ⅳ一2)

=(AⅣ一2+尸Ⅳ一1口Ⅳ一2)zⅣ一2+尸Ⅳ一16Ⅳ一2×1+QⅣ一1+QⅣ

七PN一谭N一谭N—l+PNoNeN

=(AⅣ一2+PⅣ一laⅣ一2)zⅣ一2+PⅣ一16Ⅳ一2+QⅣ一1+QⅣ

七PN一ⅣN一水N—l+PNoNeN.(4.12)

—PlⅣ一2=AⅣ一2+.尸IⅣ一1nⅣ一2,

则QⅣ一2=.尸IⅣ一16Ⅳ一2

J@Ⅳ一2,Ⅳ一2)=PⅣ一2zⅣ一2+QⅣ一2+QⅣ一1+Q.Ⅳ+尸Ⅳ一l知一1eⅣ一1+户Ⅳ叫eⅣ.当6Ⅳ一2<o时,有u’(Ⅳ一2)=一l,并且

J(zⅣ一2,Ⅳ一2)

=(4Ⅳ一2+PⅣ一lnⅣ一2)zⅣ一2+PⅣ一16Ⅳ一2×(一1)+Q.Ⅳ一l+QⅣ

+PN一1仃N—leN一1+PNaNeN

=(AⅣ一2+PⅣ一1口Ⅳ一2)zⅣ一2一R—16Ⅳ一2+Q^r一1+QⅣ

+PN一炉N—leN一1+PNoNeN.(4.13)令

j)Ⅳ一2=AⅣ一2+j,Ⅳ一1口Ⅳ一2,QⅣ一2=一j,Ⅳ一16Ⅳ一2.

19

4多阶段不确定最优控制问题硕士论文则

J0Ⅳ一2,Ⅳ一2)=霸一2zⅣ一2+QⅣ一2+QⅣ一1+QⅣ+PⅣ一1啊一leⅣ一1+PⅣ¨eⅣ.由数学归纳法,可以得到相应的定理结论,定理即证。

注4.1.1.由定理4.1.1中最优控制的表达式,我们可以看出:问题(4.1)是Ban争Ba皿g控制问题。

4.2非线性多阶段不确定最优控制问题

问题(4.1)中,我们考虑的是目标函数和状态转移方程都是线性的,由定理4.1.1中的结论得到线性多阶段不确定最优控制问题的最优控制和最优值,但当所考虑的系统中目标函数是线性的,状态转移方程是二次的时,就是我们下面所要考虑的二次多阶段不确定最优控制问题。

4.2.1非线性多阶段不确定最优控制问题数学模型

由定理4.1.1,对于在每一个阶段上,目标函数和状态转移方程都是线性的不确定最优控制系统,我们可以得到该系统的Ban乎B锄g最优控制和相应的最优目标值的精确表达形式。如果当系统中目标函数是线性的,状态转移方程是二次的,我们考虑下列问题:

mo,o,=瞄E[争。)]

zU+1):吩z0)+%u◇)+吗t‘2G)+乃+lc≥+1,(4・14)

其中歹=0,1,2,…,Ⅳ一1,

z(0)=zo,

其中如<o对于任意的o≤J≤Ⅳ,其余的参数与(4.1)中意义相同・20

硕士论文多阶段不确定最优控制定理4.2.1.问题(4.14)的最优控制u‘(忌)为

I矿∽)I

t正’(克)=一兹,6岛如果2以≤6七≤一2以

一、●,【“弘{赶)’,

相应的最优值为其他情况

JbN,N、=PNzN七QN,

NN

,(%七)=船七十∑Q+∑

‘=七{=如}1只吼et,

其中

R=AⅣ,R=A七十最+10七;

+ld七+

d七如果如果

如果1QⅣ=0,QJc=篡酱尸一+1一b一4+一£1瓦2盘,

其中尼=Ⅳ一1,Ⅳ一2,…,l,O.

证明:上述问题的最优控制分别标记为u+(0),u‘(1),…,让‘(Ⅳ),运用递推公式(3.3),可得

‘,(zⅣ,Ⅳ)=l梳。{“zⅣ}=鼬z.Ⅳ,

其中Iu‘(Ⅳ)I≤l。令R=AⅣ,QⅣ=o,则

3bN,N、=PNzN+QN.

21

当七=Ⅳ一l时,由递推公式(3.3),可得

‘厂(zN一1,Ⅳ一1)

=.,翠蜷..E阻Ⅳ一lzⅣ一1+J0(Ⅳ),Ⅳ)1。‘

阻(Ⅳ一1)151一

=.,粤a签,.{AⅣ一1zⅣ一1+PⅣEk(Ⅳ)】+QⅣ)。。‘‘

Iu(Ⅳ一1)ISl‘

=.,91a蕞,..【AJ、r一1zⅣ一1+j,ⅣE陋Ⅳ一1zⅣ一l’

I缸(Ⅳ一1)lSl、

+6Ⅳ一1t上(Ⅳ一1)+dⅣ一1t上2(Ⅳ一1)+口Ⅳ∞】+QⅣ>

=(AⅣ一1+霸oⅣ一1)zⅣ一1+PⅣ口ⅣeⅣ+QⅣ

+lu(躐s1{Rh一1tl(Ⅳ一1)+PⅣdⅣ一1t正2(Ⅳ一1))・(4・15)

日(u(Ⅳ一1))=PⅣ6Ⅳ一l牡(Ⅳ一1)+PⅣ如一l“2(Ⅳ一1).

求n‘(Ⅳ一1)使得(4.15)成立,就相当于求函数日∞(Ⅳ一1))在l乱(Ⅳ一1)I≤1上的最大值点,即

.,粤嚼,.日(u(Ⅳ一1))’’~

l乜(Ⅳ一1)I≤l

日(让‘(Ⅳ一1))

=PⅣ6Ⅳ一1t正+(Ⅳ一1)+R如一1(t‘’(Ⅳ一1))2.(4.16)

由群=PⅣ6Ⅳ.1+2PⅣ札札(Ⅳ-1)=。

可得

u(Ⅳ_1)=一器.

情况1:如果l—h—l/(2如一1)l≤1,即2dⅣ一1≤6Ⅳ一1≤一2dⅣ一l,则日(t上(Ⅳ一1))的轨迹如图4.1中的日l,此时u‘(Ⅳ一1)=一6Ⅳ一1/(2dⅣ一1)是日(u(Ⅳ一1))的最大值点,

硕士论文多阶段不确定最优控制因为

d2日(u(Ⅳ一1))

毗(Ⅳ一1)2=2尸:ⅣdⅣ一1<0.

也就是说,如果2dⅣ一1≤6Ⅳ一1≤一2dⅣ一l,则第Ⅳ一1个阶段的最优控制是

u。(Ⅳ一1)=一6Ⅳ一l/(2dⅣ一1).

此时,把缸+(Ⅳ一1)=-6Ⅳ一1/(2dⅣ一1)代入(4.16)式,可得

.,乎蜷,.日(u(Ⅳ一1))’、~

Iu(Ⅳ一1)I≤1

=PⅣ6Ⅳ一1u‘(Ⅳ一1)+PⅣdⅣ一l(t正+(Ⅳ一1))2

=蹦M(一嘉)+氏札(一是)2

==一一PⅣ6知一1

2dⅣ一1+甓

PⅣ6南一1

钇Ⅳ一1‘(4.17)

把日(u‘(Ⅳ一1))代入(4.15)可得第Ⅳ一1个阶段的最优目标值J@Ⅳ一1,Ⅳ一1)为

J(zⅣ一1,Ⅳ一1)

=(AⅣ一l+PⅣ口Ⅳ一1)zⅣ一l+氏盯ⅣeⅣ+QⅣ+日(t正’(Ⅳ一1))

=(札。+PⅣ口M)吼。一案+QⅣ+PⅣ州Ⅳ.(4.18)

毋、r—l=AⅣ一1+尸Ⅳ口Ⅳ一1,QⅣ一l=一PⅣ6jI一1

4dⅣ一l‘

J@Ⅳ一l,Ⅳ一1)=PⅣ一1zⅣ一1+QⅣ一l+QⅣ+PⅣ%eⅣ.

情况2:如果一6Ⅳ一l/(2dⅣ一1)>1,即6Ⅳ一l>一2dⅣ一1,则日(让(Ⅳ一1))的轨迹如图4.1中的日2,此时日(u(Ⅳ一1))是u(Ⅳ一1)∈【一1,l】上的递增函数。也就是说,如

果6Ⅳ一1>一2dⅣ一1,则第Ⅳ一1个阶段的最优控制是

t‘’(Ⅳ一1)=1-

此时,把u。(Ⅳ一1)=1代入(4.16)式,可得

~.,乎嚼,.H(u(Ⅳ一1))、’

Iu(Ⅳ一1)ISl

=PⅣ6N一1“’(Ⅳ一1)+既dⅣ一1m。(Ⅳ一1))2

=尸lⅣ6^r—l×1+户IⅣdⅣ一l×12

=民(dⅣ一l+6Ⅳ一1).

把日(u+(Ⅳ一1))代入(4.15)可得第Ⅳ一1阶段最优目标值J@Ⅳ一l,Ⅳ一1)为(4.19)

J(zⅣ一l,Ⅳ一1)

=(AⅣ一l+尸lⅣ口N一1)zⅣ一1+尸Ⅳ盯ⅣeⅣ+QⅣ+日(u’(Ⅳ一1))

=(AⅣ一1+PⅣ口Ⅳ一1)zⅣ一1+R(dⅣ一1+6Ⅳ一1)+QⅣ+PⅣ叫eⅣ.

局、r一1=AⅣ一1+局、rnⅣ一1,(4.20)QⅣ一l=—P知(dⅣ一l+6Ⅳ一1).

J(zⅣ一1,Ⅳ一1)=尸IⅣ一1zⅣ一l+QⅣ一1+QⅣ+尸lⅣ9ⅣeⅣ.

情况3:如果一6Ⅳ一1/(2dⅣ一1)<一1,即6Ⅳ一l<2dⅣ一l,则H(u(Ⅳ一1))的轨迹如图4.1中的日3,此时H(u(Ⅳ一1))是u(Ⅳ一1)∈【一1,1】上的递减函数。也就是说,如果6Ⅳ一1<2dⅣ一l,则第Ⅳ一1个阶段的最优控制是t‘+(Ⅳ一1)=一1.

此时,把矿(Ⅳ一1)=一1代入(4.16)式,可得

“.,粤嚼,,日(“(Ⅳ一1))K(Ⅳ一1)lSl’、

=PⅣ6.Ⅳ一1t正’(Ⅳ一1)+RdⅣ一1(u+(Ⅳ一1))2

PⅣ6Ⅳ一1×(一1)+PⅣdⅣ一l×(一1)2

=PⅣ(dⅣ一l—h一1).(4.21)

把日(u‘(Ⅳ一1))代入(4.15)可得第Ⅳ一1个阶段的最优目标值J@Ⅳ一l,Ⅳ一1)为

‘,0Ⅳ一l,Ⅳ一1)

=(AⅣ一1+氏DⅣ一1)zⅣ一l+R叫eⅣ+QⅣ+日(乱+(Ⅳ一1))

=(AⅣ一1+PⅣ口Ⅳ一1)zⅣ一l+PⅣ(dⅣ一l一6Ⅳ一1)+QN+PⅣ仃NeⅣ.

尸Ⅳ一l=AⅣ一l+PⅣoⅣ一l,

则(4.22)QⅣ一1=只v(dⅣ一l一6Ⅳ一1).

J@Ⅳ一l,Ⅳ一1)=尸Ⅳ一lzⅣ一1+QⅣ一1+QⅣ+尸Ⅳ仃Ⅳej、r.

当忌=Ⅳ一2时,由递推公式(3.3),可得

J(zⅣ一2,Ⅳ一2)

2I。(黝≤lE陋Ⅳ-2zⅣ-2+‘,(z(Ⅳ一1),Ⅳ一1)】

k(嚣蜀≤1<AⅣ一2zⅣ一2+日一lEk(Ⅳ一1)】+QⅣ一1+QⅣ+尸Ⅳ卿eⅣ】.2

2I。(鼢s1{如一2zⅣ_2+PⅣ一1E【口Ⅳ一2z眦+6Ⅳ_2u(Ⅳ一2)

+dⅣ一2让2(Ⅳ一2)+盯Ⅳ一1瓯一l】+QⅣ一l+QⅣ十尸Ⅳ啊eⅣ}

=(AⅣ一2+PⅣ一loⅣ一2)zⅣ一2+既一l口Ⅳ一1eⅣ一1+QⅣ一l+QⅣ+尸Ⅳ啊eⅣ

+max(4.23)

It‘(Ⅳ一2)I≤1、{PⅣ一16Ⅳ一2u(Ⅳ一2)+PⅣ一1dⅣ一2乱2(Ⅳ一2)).

日(u(Ⅳ一2))=PⅣ一16Ⅳ一2u(Ⅳ一2)+PⅣ一ldN一2乱2(Ⅳ一2).

笔等簪三产=PⅣ一・h一2+2PⅣ一・dⅣ一2u(Ⅳ一2)=。

可得

u(Ⅳ-2)一是.

类似于%=Ⅳ一1的情况,可得:

如果I一6Ⅳ一2/(2dⅣ一2)l≤l,即2ak一2≤6Ⅳ一2≤一2dⅣ一2,则u’(Ⅳ一2)=一6Ⅳ一2/(2dⅣ一2)是日(u(Ⅳ一2))的最大值点,其中日(u(Ⅳ一2))的轨迹如图4.1中的日1・因为啤卿:2PⅣ-1dⅣ-2<o.du(Ⅳ一2)2~”~一”~‘。

也就是说,如果2如一2≤6Ⅳ一2≤一2d^r一2,则第Ⅳ一2个阶段的最优控制是

u+(Ⅳ一2)=一6Ⅳ一2/(2dⅣ一2).

否则,因为如果一6Ⅳ一2/(2dⅣ一2)>l,即6Ⅳ一2>一2dⅣ一2,则日(tl(Ⅳ一2))的轨迹如图4.1中的日2。日∞(Ⅳ一2))是u(Ⅳ一2)∈【一1,1】上的递增函数,则第Ⅳ一2阶段的最优控制是

t‘’(Ⅳ一2)=1.

如果一6Ⅳ一2/(2dN一2)<一1,即6Ⅳ一2<2dⅣ一2,则日(乱(Ⅳ一2))的轨迹如图4.1中的日3。日(让(Ⅳ一2))是u(Ⅳ一2)∈【一l,1】上的递减函数,则第Ⅳ一2阶段的最优控制是

牡‘(Ⅳ一2)=一1.

26

硕士论文多阶段不确定最优控制凼此f一骧,I一—趸面i二;一’

日(让)如果2如一2≤6Ⅳ_2≤一2dⅣ一2划术zⅡⅣ一2∑口Ⅳ一2∑一么口Ⅳ一2.M紧蜀≤1日(u(Ⅳ一2))2.{PⅣ一1(dⅣ一2+6N一2),如果6N一2>一2dⅣ一2【PⅣ“如一2—6Ⅳ-2),如果6Ⅳ-2<2dⅣ-2.把最优控制代入(4.23)可得第Ⅳ一2个阶段的最优目标值J@Ⅳ一2,Ⅳ一2)。由数学归纳法。可以得到相应的定理结论。定理即证。

/一/一1/、、

、、日1/{罗\/—\\1H2\’\.一

图4.1:函数日(t‘)的三种轨迹

注4.2.1.由定理4.2.1中最优控制的表达式,我们可以看出:问题(4.14)是Ban争BaJlg控制问题。

4.2.2算法分析

在定理4.2.1中,我们研究的是目标函数是线性,状态转移方程是二次的多阶段最优控制问题。对于该问题,我们得到其每一个阶段的最优控制和最优目标值的精确表达形式。对于所有的%=0,1,…,Ⅳ一1,根据定理4.2.1,由第忌个阶段和第七+1个阶段之间的关系,可得下列两个算法,来计算不确定最优控制问题的最优控制和最优目标值。

算法J:(计算每个阶段的系数)27

4多阶段不确定最优控制问题

硕士论文

步骤l:令u’(Ⅳ)=o,计算J@Ⅳ,Ⅳ)=PⅣzⅣ+QⅣ=PⅣzⅣ;步骤2:对于七=Ⅳ一l,…,0,执行以下两个步骤;

步骤3:比较k和2如,

如果6七>一2以,则u。(忌)=1;如果6七<2d%,贝0u’(詹)=一1;

如果2d七≤6七S一2d七,则u‘(七)=一靠/(2d七);步骤4:计算R=屯+口七R+1,

如果让。(后)=1,贝4Q七=最+1(d七+6七);如果u’(后)=一1,则Q惫=:R+1(以一6知);

如果u’(忌)=-6南/(2比),则Q七=一(磋R+1)/(4以)。

由算法1,在每一个阶段忌(七=0,1,…,Ⅳ一1),我们可以得到u+(七),R和Q知的表达式。设不确定变量fl,岛,…,知分别有期望值e1,e2,…,eⅣ。现在,给定初值z(o),

我们可以根据算法1的结果,在计算机上用下列算法2得到系统的状态变量、最优控制和最优目标值。

算法2(对任意给定的初值,计算最优控制)

步骤1:执行算法l,对于给定的初值zo,计算

J00,o)=晶跏+∑Q{+∑只吼e{;

‘=0

‘=l

步骤2:对于忌=1,…,Ⅳ,执行下列两个步骤;

步骤3:用轮盘赌的方式随机产生r∈【0,l】,由于不确定变量仉满足

不确定性分布西仕),使得西(c(忌))=,.,计算实数c(七)。计算z(后)=吼一1z(七一1)+6七一lt‘‘(七一1)+如一1(t上。(七一1))2+吼c(七);

步骤4:计算

t,p七,七)=最z七+∑Q‘+∑只以艮.

1=詹

t=七+l

硕士论文多阶段不确定最优控制

注4.2.2.由算法1,我们可按照逆序从最后一个阶段开始到初始阶段,计算每个阶段的系数。由算法2,当给定初始状态zo时,从初始阶段开始到最后一个阶段,计算所有阶段的最优控制和相应的最优目标值。

5数值实例硕士论文

5数值实例

在前面章节里,我们考虑了当目标函数是线性的,状态转移方程分别是线性和二次的多阶段不确定系统最优控制问题,并且分别经证明得到了上述两类问题的每一个阶段的最优控制和相应最优目标值的精确表达式。由定理4.1.1和定理4.2.1中最优控制的表达式可知:上述两种问题均为Ban分Bang控制问题。作为应用,我们考虑当目标函数和状态转移方程都是线性时,把定理3.2.1的结论应用于下列具体实

例。

例5.1.

厂10

以‰0)2麟E【.善扣∽J

o≤t≤10

LJ=0J

zG+1)=%z0)+%uU)+吩+1C:f+1,

其中歹=0,1,2,…,9,z(o)=zo.

(5.1)

其中相应的系数罗列于表5.1中,对于每一个o≤歹≤10,有一1≤uU)≤1。另外,a,Q,…,qo是独立的‘‘之字型’’不确定变量z(一1,o,1),根据(2.14)式,对于每一个ji=l,2,…,10,则有驯0】=o.

表5.1:实例中的系数

080.011.2.0.2

113O.021.50

2100.011.2.0.3

3110.0l

41l0.011.2.O.3

5160.021.3.0.2

680.011.40.2

7110.0110.2

8120.011.2.O.2

9100.021.10.3

10150.011.3.0.4

as

口J

6J

0.1

由定理4.1.1,可得最优控制和相应的最优目标值,罗列于表5.2。表5.2的第

四列数据表示的是相应的状态,这些状态是由初始状态z(O)=1,经状态转移方

30

硕士论文

多阶段不确定最优控制

程z@+1)=口蠡石(七)+6_|cu(尼)+仃七+1呶+l迭代得到的,其中c¨1是不确定变量伉+1的实现。对每一个阶段任意产生的一个实数r¨1∈[o,l】(尼=o,l,2,…,9),通过式

子c¨1=2r七+1—1,可以得到相应的戗+1。

表5.2:最优解

StageO

nb

Ck

z(尼)

t正’(七)

.1

J(z七,后)

636.625632.18

611.897

0.7613450.0534074O.8318120.3154390.560045O.7841730.6046020.06488240.21952

0.748283

O.522691.0.893185O.663625.0.3691210.120090.5683460.209204—0.870235.0.560961

0.496567

1.41045

2.10675

It‘‘(Ⅳ)I≤l

.1l

23456

2.834732.931043.819655.171237..441827.633129.3485210.5883

591.98560.198528.26467.627426.372344.131252.236158.825

.1

.111—1l

89

10

l让。(Ⅳ)l≤1

当我们所考虑的目标函数是线性的,而状态转移方程都是二次的时,结合算法1和算法2,运用定理4.2.1的结论考虑下列具体实例。

例5.2.

10

J,I、珈O、l,=

m毯毫菩牌oI

J=o

∑如zo)IJ

(5・2)

z0+1):唧zU)+6Ju0)+如t正20)+乃+1c;+l,

其中歹=O,1,2,…,9,

z(o)=zo.

其中相应的系数罗列于表5.3中,如<0,其余各系数和例5.1的意义相同.

31

5数值实例硕士论文

表5.3:实例中的系数

080.011.2.0.2.O.05

1130.021.50.5.0.04

2100.011.2.0.3.0.03

3110.01l0.1.O.02

4110.011.2.0.3.0.09

5160.021.3.0.2.0.06

680.011.40.2.0.05

1l

12

9100.021.10.3—0.05

10150.011.3一O.4.0.03

8’

0.01l0.2.0.06

0.0l1.2.O.2.0.07

西

运用递推公式,根据算法l'我们可以得到上述问题在每个阶段上的系数R和Q知:

P10=410=15,最=A七+R+1口七;

R+1(也+%),一如果u+(庇)=1;

Q10=o,

Q知=1最+l(d七一b七),如果u’(庇)=一l;

【一警,如果u地)=一瓣.

对于后=Ⅳ一1,Ⅳ一2,…,0,其中A七,n七,k和毗罗列于表5.3中。

根据算法1,我们得到的系数最和Q矗。当给定初始状态zo=1时,运用算法2,我们可以得到每一个阶段的最优控制和相应的最优目标值,相应结果罗列于表5。4。

表5.4中的第二列是随机产生的实数强∈[0,1】;第三列是当后=1,2,…,Ⅳ时,根据(1+c七)/2=以,得到的相应实数%∈卜1,1】;第四列是每个阶段的状态,它们满足z(七十1)=饥z(后)+k乱(七)+吼+l仅+l;第五列是当给定初始状态为zo=1时,

得到的每个阶段的最优控制;最后一列是相应的每个阶段的最优目标值。

32

硕士论文多阶段不确定最优控制

表5.4:最优解

Stager七

C量

z(七)

t‘’(七)

,@k,七)

0.1.1687.06310.91998O.8399611.36681684.7752O.5308080.06161692.51081.1667.1413

0.8080080.6160163.289141643.1014

0.857814O.7156293.37629.1608.08250.932768O.8655354.27886.1573.12760.9287390.8574795.71111

505.39170.0963469.0.8073068.13746l

459.2680.173254—0.6534938.27093.1

369.46290.5640740.12814710.05771

270.27810

0.944456

O.888913

11.3223

fu‘(Ⅳ)I≤1

169.835

总结

硕士论文

总结

在实际中,由于模糊和随机的局限性,2007年清华大学刘宝碇教授创建了不确定性理论,并于2010年进一步发展。现在,满足正规性、自反性、次可数可加性和乘积测度公理的不确定性理论已经成了数学的一个重要分支。本文是在不确定性理论的基础上,讨论对于一个多阶段系统,该系统的每一个阶段都受到一个不确定变量的干扰,并且使得目标函数的期望值达到最优的问题。为了解决这个多阶段不确定系统的最优控制问题,在动态规划中Benman最优性原理的基础上,提出递推公式,当不确定系统的目标函数是线性的,状态转移方程分别是线性和二次的时,分别得到了相应的最优控制的表达式,由解的表达式知道上述两类问题都是Ban乎Bang控制问题。作为应用,对于多阶段不确定系统的最优控制问题的一个具体实例,运用已经证明的定理,求解得到其Ban分Bang最优控制和相应的最优目标值。

上述两类问题所研究的目标函数都是线性的,证明得到最优控制问题是Ban乎Bang最优控制问题。然而,当目标函数是非线性的(如二次的)时,最优控制问题是否仍然是Ban分Badlg最优控制问题就有待进一步研究。

硕士论文

多阶段不确定最优控制

致谢

两年半的研究生学习生涯即将结束,在此论文完成之际,我首先要向我的导师朱元国教授表示衷心的感谢。感谢朱老师在我写论文期间遇到困难时,耐心地指导,给我提供文献资料,以及关于文献检索方面的技巧,帮我突破瓶颈。朱老师精益求精的学习态度、严谨的科学态度、务实的工作作风深深激励着我,促使我不断地进步。并且朱老师平易近人,关心学生,在生活上给予我无微不至的关怀。

其次,感谢学校图书馆提供的电子资源信息和书籍,如中国期刊网、超星数据库、国外高校的硕博论文数据库、Springer、IEEE、南京理工大学书刊资料借阅室等,使我在书写本论文时能能较全面地查阅相关资料。

再次,感谢我的同学和朋友,尤其是许新新、张锦和我的舍友,感谢他们在我学习遇到困难时无私的帮助,感谢他们在我情绪低落时的开导和安慰,感谢他们让我看到了自己的不足,感谢他们在我的学习生涯中给予我的帮助和关心。

最后,感谢我的父母,感谢他们的包容和牵挂,无论走多远,父母永远是孩子的避风的港湾,他们用无私的爱给予我默默的关心和支持,使我能够安安心心地顺利完成学习和研究。

参考文献

硕士论文

【1】L蠲aue

JP.Functional

考文

Anab玛is缸ld

Tinleoptimalcontr01.NewY.0rk:A∞demic

胁,1969.

【2】MertonRC.Opt洫al

CoIls砌ption

andPortf01ioRm镪in

ContimlousTime

Model.知um以盯互泐佗D仇tc

2现eDr奶197l,3:373-413

【3】F1e血ngwH,R曲elRw.Dete咖inisticY0rk:跏n叼er.讫“蛳1986[4】HarrisonJM.Br∞mian.Motion

andstochasticOptinl越Contr01.NeW

andstochasticF10W

syste脚.NewYork:乃概

肌切彩舶邶,1985

[5】Karatz锯I.OptiⅡlizationProblems

。,0ur扎口2on

inthe

Theo巧0fConti肌ous

namng.黝M

I:b佗t”Df口礼d《9p托m£加托D住,1989,27(6):1221一1259

optimalStoppingProblem

[6】JeIlsenu.An

口nd

in瞰skTheoUJ『如um竹ce:Ma忱em口挽cs

EcDnDm记s,1998,22(2):177-178

RS.Investmentunder

[7】DbdtAK,Pindyck

Uncertainty.Princeton:R呓佗ce£DnUm‘

口erst匆肌ss,1994

[8】李训经.控制理论基础.北京:高等教育出版社,2002

[9】李训经,雍炯敏,周渊.控制理论基础.第二版.北京:高等教育出版社,2010

【10】雍炯敏.动态规划方法与H撇ilton-Jac如ic-Belhan方程.第三版.上海:上海科

学技术出版社,1992

【111雍炯敏,楼卫红.最优控制理论简明教程.第四版.北京:高等教育出版社,2006【12】周凤岐.现代控制理论及应用.第三版.成都:电子科技大学出版社,1994

36

硕士论文

多阶段不确定最优控制

【13】赵纯均,詹一辉.控制理论基础.第三版.北京:清华大学出版社,1991【14】郭尚来.随机控制.北京:清华大学出版社,1999[15】蔡尚峰.随机控制理论.上海:上海交通大学出版社,1987【16】钟秋海.现代控制理论.北京:高等教育出版社,2004【17】解学书.最优控制理论与应用.北京:清华大学出版社,1986[18】Dorat0P’Hsieh

Stochastic£Dm口统c

cM,R0blnsonPN.OptimalBaJl分BangcontrolofLinear

SysteD=ls而th

SmauNoise

Paurameter.Z肼汜乃也船口c统D船D佗A缸.

C『D他troj,1967,AGl2(6):68二690

AV.onstochastic

(19】Bal妇ishnanBan分Bang.contr01.A卯阮d讹统e仇口£zcs口磁

印协n钯口zzD他,1980,6:91—96

[20】vaLl出r锄eev

SA.ABa肛乎BangTheorem

with

Fi诚e

NuHlberofS丽tche8

for

NordjnearControl

2016

Syste麟.知缸m口Z盯讹冼e仇。统训&ie礼伽,1997,85(3):2002.

【21】、vabhGR.ANumericalExampleof0ptimaLlBang-Ban:g

Contr01s.‘,aum以盯

蜀叼讯ee厄佗9讹统emnttcs,1972,6(2):165-174

【22】John

NobIe,Heinzschaettler.OntheOptimautyof

Par锄etrizedFamiHt涵of

B埘BangTrajectories.Ⅳa佗如ne口r以钆口枷括,2001,47:351.362

f23】吴臻,王向荣.带有随机跳跃干扰的线性二次随机最优控制问题.自动化学报,

2003,29(6):821—826【24】Ga0

z.OnDiscreteTimeOptimalControl:

Closed-Fb珊S01ution.M静

sachlsetts:Ame九∞佗(勋n£mj∞啊托他他ce

BDs£D鸭2004

37

参考文献硕士论文

【25】Pengz,YangY,HuangL.ControlEli蚵nationofTimeOptim2LlBa跨Bang

ContD0l祈thaCl鹪sofInputConstraints.Z砸汜饥亡emo洳礼口Z国可.e他礼ceD仃C『DntmZnndAt‘亡Dm口托D%2010,8:171m1715

【26】StengelRF.StochalsticOptimalControl:Theow锄dApphcation.NewY.ork.

乃梳耽fe!,拶舶瑚,1986

【27】Ka0EPC.AnIntroductiont0stochasticProcess铅.肌幽伽D砌凡6如^咖∞m・

册叼,1997,1:37垂420

【28】Liux.Entropy’DistanceMeasureandsimil缸i蚵MeasureofF吆珂setsandTheir

Relations.呦&幻口nd跏沈ms,1992,52:305-318

【29】Liux.Measllringthesatisf如tionofcollstraintsinFuzzyLine龇Programming.

j咖jge绐n死di受/ste仃ls,2001,122(2):263.275

[30】LiuB.UncertaintyTheo融2nded.Berlin:却n哪er.阮订略2007

【31】Ga0J,Ga0x.ANewModelforCredibiliticOptionPricing.乃t‘m口:盯咖cen口饥

跏£e"坫,2008,2(4):24孓247

【32】LiuY,HaM.E砷eCtedV甜ueofFunction0funcert出nV打iables.Kunrnjng:m-

ceI碱唧s可现e肋^饥觑temo悦D礼口fC,D他厂e他佗ceD佗砌加rmn扼D佗口以Man叼eme耐&钯他ces,2009,17:779_781

【33】LiuB.uneertai奶rTheo可:ABranchofMathematicsforModeungHumanun-

certainty.Berhn:印n叼er-讫rf蛳2010

【34】Liuw,XuJ.s锄ePropert涵onExpectedV洳eOperatorforuncert咖妇i-

abl筒.砌加r仇口tiDn:An砌tem口托D礼以仇te廊c印溉口阿乃让m口j'2010,13(5):169孓1699

硕士论文多阶段不确定最优控制

【35】Yux.EXpectedPayoffofnadingstrate舀esforuncert越nFinanc瑚M盯kets.

功加mlo统D礼?An觑亡em口渤佗DZ觑亡e71d诂c咖f讯。阿jIDt正m口f,2011,14(10):3175.3186

【36】LinF,YingH.ModelingandControl0fFuzzyDiscreteEventSysteI璐.陋E目

乃.口邶口c托D瑚D佗勖ste仇s,^她%口砌回6eme托cs—P口nE2002,32(4):40&415[37】zhuY.FuzzyoptinlaLlControlforM诚i.stageE.IuzzysysteⅡ塔.舾EEn氇船口c抚D船

Dn勋s抛ms,讹礼彩回6eme既cs?凡nE2011,41(4):964975

[38】LiuB.nzzyProce豁,HybridProce豁anduncertainProcess.乃um口2盯踟cen口饥

跏£e竹话,2008,2(1):195.215

[39】zhuY.OnP盯a.NormedSpace而thnzzy、协iablesBasedonEXpectedV甜ued

Operator.饥tem口£i帆以乃牡m02巧踟.傀行oi礼地凡蟛规礼e始n几dj流D叫fe匆e-60s缸跏£ems,2008,16(1):95-106

【40】zhuY,Jix.ExpectedVal懈ofF、11nction8ofFluzzyV打iables.如um赦盯h亡e胁

夕e耐呦勋ste脚2006,17(5):471-478

[41】zhuY.uncertaillOptimalControlⅥ,ithApplicationtoaPortfolioselection

Model.劬6eme扰cs口们勖s£e脚,2010,41(7):535-547

【42】LiuB.someR艘earchProbkmsinuncertailltyThe0够乃umn2盯溉ce订口饥

跏te竹硌,2009,3(1):冬10

【43】LiuB.ASurV呵ofEntropyofF’uzzyV打iables.如um口2o,阮cen口讥S如钯册,

2007,1(1):缸13

【44】LiuB.’nle0叮and

讫rf凹,2002PracticeofUncertainProgramming.Heidelberg:Ph妒i∞.

在学期间发表的论文硕士论文

在学期间发表的论文

【1】Yujie

tainKangandYu锄guozhu,Ban乎BangOptimalControlforMulti-stageuncer-SysteHls,功如mo优D礼:A佗托temn托Dn耐h把纪话c咖胁口硝JlDt‘m讲(SCI源期刊),accepted。

南京理工大学

硕士学位论文

多阶段不确定系统的Bang--Bang最优控制

姓名:康玉洁

申请学位级别:硕士

专业:计算数学

指导教师:朱元国

20120309

硕士论文多阶段不确定最优控制

摘要

在理论和实际应用中,最优控制都起到了非常重要的作用。在多阶段系统中,当系统状态从前一个阶段转移到后一个阶段时,如果受到一个不确定变量的干扰,就是本文所讨论的多阶段不确定系统最优控制问题。本文所考虑的多阶段不确定系统的最优控制问题是使得不确定目标函数的期望值达到最优。在动态规划中BeUman最优性原理的基础上,本文得到关于这类问题的一组递推公式。运用递推公式,对于目标函数是线性,状态转移方程分别是线性和二次的多阶段不确定最优系统,得到该系统的Ban乎Bang最优控制和相应的最优目标值。

关键词:多阶段不确定最优控制,Ban乎Bang最优控制,Benman最优性原理,递推公式I

Abstract硕士论文

Abstract

Optimalcontroli8aveuiIIlportantfieldofstudynotonlyintheo巧but8L1soin印plications.Inamulti-sta舻昭stem,whenthestateatastageofthesyst锄isderived行omthestateofthef0珊erstage,anddijsturbedbyanuncertaillVariable,amulti-stageuncertainoptimalcontrolproblemi8proposed.Anoptim2L1controlproblemforamUdti-stageunCer七越nsystemisc0IlsideredtooptiⅡdzethee)(pected、,alueofanuncertainobjectivefunction.Based0nBenman’sPrincipleofOptimaHtyilldy-n锄缸cprogramHling,recurrenceequatio璐fortheproblemarepresented.Byllsingtherecurrenceequations,theexauctBan分Bangoptim越ControlsaIldthecorrespondingoptimaLlobjectivev址ue8fortheoptimalcontrolproblem耐thalinearobjectivefIlnctionsubjectt0an眦certainlinearandquadraticsystemare0btained,respectively.KeywDrds:Multi-sta嚣uncertaLinoptim以C0ntrol,Ba略Bangoptinl址control,Benmadl’sPrincipleofOptimality'工kctlrrenceequationII

硕士论文多阶段不确定最优控制1引言

1.1最优控制的发展简介

上个世纪50年代,在现代控制理论中,最优控制是其主要内容之一。最优控制问题主要是解决如何在众多决策中找到一个最优策略,使得目标函数达到最优,工程上的最速控制问题11J就是一个最优控制问题。在最优控制理论中,许多数学家致力于研究最优控制问题,随着越来越多的数学和科学计算的方法和结论应用于最优控制问题中,最优控制理论得到了很大的发展。并且随着理论和应用的逐步深入,最优控制理论也逐渐应用于许多其他的领域,比如:工艺设计、程序设计、经济和管理领域。

从古到今,最优化问题一直是人们讨论的重点问题,如中国古代的”田忌赛马"中选择一等马、二等马、三等马的比赛次序问题;赌博中如何获得最大利益的下注问题;现代投资组合中如何投资资金,从而获得最大收益的问题等。到20世纪60年代开始,随着实际中越来越多的最优化问题的提出,解决最优化问题的最优化方法也越来越多。在前人众多理论的基础上,最优化理论开始迅速发展,真正意义上形成一个学科。随后,最优化理论又出现了众多分支,如:线性规划、非线性规划、动态规划等。20世纪70年代,随着计算的精度和复杂性理论的提出,许多学者发现:对实际中一些复杂的组合优化问题,单纯地用当前人们所掌握的方法是很难解决的。20世纪80年代以来,人们发现自然界有许多现象可以进行模拟,从而得到一系列智能算法,如蚁群算法、遗传算法、模拟退火算法、人工神经网络优化等,这些算法极大地促进了最优化问题的发展。

对于随机最优控制的研究起始于20世纪60年代,在70年代广泛应用于金融学上,如Merton【2l等。随后,Fle血ngand磁shel【31,H甜rison【41和K缸atz嬲M,JeIlsen【61等广大学者研究了布朗运动和随机微分方程在金融中的应用。研究最优控制的一个主要方法就是动态规划,特别是DiXit和Pindyck【7】对Ito过程中动态规划在优化】

l引言硕士论文中的应用的研究,更是体现了这一点。解决随机最优控制问题所采用的随机优化方法与一般的优化问题所采用的方法有相同的要求,即:当满足给定的约束条件时,在所有方案中,找一个最优控制方案(即最优解),使得目标函数取得最优值(最大值或最小值)。但是,在我们所考虑的随机最优控制系统中,状态转移方程往往会受到随机因素的干扰,这是随机最优控制问题和一般的最优控制问题的区别。一般的最优化问题可以归结为求解一个正常的数学规划问题(线性或非线性),而随机规划问题则可归结为求解一个随机数学规划问题。近年来,国内广大学者,如李训经【8J【口J,雍炯敏【10J【11J,周风岐【12J,赵纯均,詹一辉[Ⅷ,郭尚来(14J,蔡尚峰【15J,钟秋海【16l等也致力于研究最优控制理论、随机控制问题和干扰解耦等内容,他们的研究成果进一步发展了最优控制问题。

在工业上,自动化管理技术日趋成熟,使得最优控制在理论上不断进步、实践上不断发展。在理论上,最优控制现阶段主要研究最优化问题中的Ban分B锄g控制问题。在应用上,最优控制已经在金融、工艺设计等领域起到了关键性的作用。工程上一个常见的最优控制问题是对速度的控制,早在20世纪50年代初,就有学者发表了有关这些问题的论文。在航空航天控制问题中,工程上常提出以节省昂贵的燃料为目的的燃料最优控制问题,以节约时间为目的的时间最优控制问题,兼顾响应时间及燃料的时间.燃料最优控制问题。当所研究的问题是一个正常的最优控制问题时,所得的最优控制是继电型控制,也即所得的最优控制在两个边界值之间来回转换,称其为B嘴Bang控制。

对于Ban分Bang控制的研究起始于20世纪60年代,例如主要用于研究最大时间问题的庞特里亚金极大值原理【17J和Dorato【t8J提出的关于线性随机系统的最优控制问题。当考虑关于布朗运动或随机微分方程上的时间最优问题或燃料最优问题时,我们可以研究它们的Ban乎Bang最优控制。其中,Bal出ishnan【圳,va曲rameevM,W如h【2l|,JohnNobleaJldHeinzSchaettler【22J,吴臻,王向荣f23J,高志强M,彭中兴,杨莹,黄琳【25J等国内外众多学者就致力于研究此类问题。2

硕士论文多阶段不确定最优控制

近几年,为了研究线性系统最优控制问题的解,人们进行了许多讨论和实验。在这些理论的基础上,我们的文章解决一类特殊的问题,即:这类问题的最优控制已知是Ban分Bang类型的。所谓最优控制是Ban分Bang类型的充分条件是:对每一个控制变量(a)有上界和下界;(b)状态转移方程是线性的;(c)性能指标是线性或非线性的。这些条件在实际中非常普遍,例如在航空与航天技术研究领域中。

由于现实世界的复杂性,我们面临着各种各样的不确定事件。其中随机f26】1271和模糊【28】㈨是两个经典的不确定性,它们是现代社会中研究最广泛、起重要作用的两类不确定性。然而,越来越多的调查表明一些不确定量,如“大约100千米"、“大约39。C’’、“接近80千克"、“低速"等,既不是随机的,也不是模糊的,这种情况促使我们去引入一种新的工具一不确定性理论来解决上述问题。不确定性理论是2007年由Liu酬创建,并于2010年进一步发展[31卜蚓。同时,Liu㈨提出了包含典范过程、不确定积分和链式法则的不确定微分,并运用不确定微分来解决动态不确定现象。从此,不确定性测度开始在理论研究和实际应用中被正式采用。现在,满足正规性、自反性、次可数可加性和乘积测度公理的不确定性理论已经成了数学的一个重要分支。

在生产实践中,计算机日益广泛地应用于各个领域中,这也就使得对于离散系统最优化问题的研究显得越来越重要。一方面实际中有些问题本身就是离散的,例如,经济与资源系统的最优化、数字滤波等问题;另一方面,即使实际问题是连续的,但是为了使连续过程能在计算机上进行控制,也要把时间离散化,从而得到一个离散系统,这样看来离散系统最优化问题就成了最优控制理论中一个越来越重要的方面。对于模糊离散最优系统,Lin和Ying㈨设计了一个最优且有实际意义的控制。当他们对于模糊离散最优系统进行研究时,主要考虑两个最优性问题:一个是对于给定的成本,使得收益最大;另一个是对于给定的收益,使得成本最小。在他们的文章中,考虑用加权和来代表所要优化的收益或成本。系统中的加权和实际上是一个模糊变量的期望值。由此,我们得到了在研究模糊最优控制中,用期望值来3

l引言硕士论文计算不确定变量大小的思路。

在自然界和人类现实世界中,我们会遇到许多主观和客观的不确定的问题,能够有效地预测和控制这些不确定性因素,使它们能更好地为人类做贡献,是人们所追求的最终目标。在管理学、信息科学、运筹学、计算机科学等许多学科领域中,我们所遇到的不确定的问题主要有随机问题和模糊问题。根据随机过程和Brownian运动,Liu㈨分别相对应地提出了模糊过程和典范过程。在典范过程的基础上,当系统受到模糊变量的干扰时,Liu㈨又提出了模糊微分方程。

随着研究的不断深入,多阶段模糊最优控制问题开始引起人们的注意,2011年,ZhuM首先提出运用动态规划来研究这类问题,并基于动态规划中Bellman的最优性原理,给出了一组应用于所有阶段的递推公式,成功得到了多阶段模糊系统的Ballg-Bang最优控制。在Zhul371【39】一“1】所考虑的问题中,对于一个多阶段模糊系统,其状态转移方程受到一个模糊变量的干扰,可以得到系统的模糊最优控制。引入不确定性理论后,如果状态转移方程受到不确定变量的干扰时,我们同样可以考虑一个多阶段不确定系统。多阶段不确定系统的最优控制问题同样是为了使目标函数达到最优(最大或最小),当受到一定的约束条件的限制时,在众多决策选择一个最优的决策,这类问题在实际中有着非常重要的应用。本文考虑的就是多阶段不确定系统,首先,仿照Zhu【37l中的方法,给出递推公式,考虑系统的性能指标都是线性的,状态转移方程分别是线性的和二次的多阶段不确定系统,并且分别得到上述两种系统的Ban乎Bang最优控制和相应的最优值。最后,本文运用所得到的结论,求解了一个数值例子,说明系统所得的最优控制的确是BaIlg-Bang最优控制。1.2本文的主要内容

2011年,在模糊理论的基础上,多阶段模糊系统的最优控制问题最早由Zhuf37】提出,他运用BeUman最优性原理,研究并给出了递推公式和相应的模糊最优控制。当多阶段系统的状态转移方程受到不确定变量的干扰时,可以相应地得到一个4

硕士论文多阶段不确定最优控制多阶段不确定系统。对于这类问题,受Zhu【37】文章的启发,本文考虑运用同样的方法,求解多阶段不确定系统的最优控制。

本文的其他章节安排如下:

第二章为多阶段不确定最优控制问题的理论基础,首先回顾了不确定性理论的相关内容,包括不确定测度、不确定性空间、不确定性分布函数、不确定变量的期望的定义及其相关性质定理。

第三章给出多阶段不确定系统的一般模型;并且仿照Zhu【矧,应用BeUman的最优性原理,得到一组递推公式。

第四章首先提出线性多阶段不确定系统最优控制问题的模型,应用递推公式,得到系统的Ban分B姐g最优控制和相应的最优值;随后考虑当目标函数是线性,状态转移方程是二次的时,得到其Ban争Bang最优控制和相应的最优值。

第五章的内容主要是给出一个数值例子,说明前述结论的应用。

本文主要内容已被接收将发表在国际SCI源期刊Information:An

Interdisciphna眄Journal上。InternationaLl

2预备知识硕士论文2预备知识

本文是在不确定性理论的基础之上对多阶段系统进行的研究,所以我们首先回顾不确定性理论的相关内容,不确定性理论是建立在不确定测度的基础之上的,下面我们引入Liu脚l中一些有用的定义。

2.1不确定测度和不确定变量

定义2.1.1.仁f0叫皿r是一个非空集合,£是r上的一个盯一代数.每一个A∈£称为事件.

定义2.1.2.仁i0硐j定义在£上的盯一代数的集合函数M称为不确定测度,如果M满足下列公理:

公理1.(正规性)对全集r,M{r)=1;

公理2.(自对偶性)对任意的事件A,M(A卜卜M|【Ac)=1;

f∞l∞

公理3・(次可数可加性)对每一个可数的事件序列_[凡),有Mt些人t,≤,三M{人t)・注2.1.1.根据上述三个公理,可以证明不确定测度M有单调性:

M{A)≤M{B’,

其中AcB.

定理2.1.1.仁i0嗣J如果M是一个不确定测度,则空集0的不确定测度为o,即:

M.[0)=O.(2.1)

定理2.1.2.陋i0嗣胆设M是一个不确定测度,对于任意的事件人,我们可得:

o≤M<A)≤l(2.2)

硕士论文多阶段不确定最优控制定理2.1.3.仁剐蚓胆设M是一个不确定测度,对于任意的事件Al和A1,我们可得:

M.[A1}VM{人2)≤3vt(Alu人2)≤M.[人1)+M.【A2).(2.3)

定理2.1.4.仁i0叫胆设3yc是一个不确定测度,对于任意的事件A1和A1,我们可得:

M{Al】.+M{人2)一1≤M{A1nA2)≤3vt.[A1)人M.【A2).(2.4)

注2.1.2.不确定变量是为了模拟不确定现象(如未知常量),其中这些不确定现象可以是不变量,但其真实值不能准确得到.例如:油田的储油量、距离、强度、敌军部队的规模均是不确定变量的例子.

定义2.1.3.陋i0叫肚r是一个非空集合,£是r上的一个伊代数,并且M是一个不确定测度,则称三元组(r,C,M)是一个不确定性空间.

定义2.1.4.仁i0叫,三元组(r,£,3vc)称为是不确定性空间.一个从不确定性空间(r,£,M)到实数集的可测函数f称为不确定变量.即:对于实数的任意Borel集B,集合

.【∈∈B}={一y∈rl∈(一y)∈B’

是一个事件.(2.5)

注2.1.3.很明显地,不确定变量与随机变量和模糊变量是有非常大的区别的.一般来说,随机变量是定义在概率空间上,函数值在实数集上的函数;模糊变量是定义在可能性空问上,函数值在实数集上的函数;而不确定变量是一个从不确定性空间到实数集的可测函数.

定义2.1.5.仁i0删肛f和,7是两个不确定变量,如果对于实数的任意Borel集B,均有

M代∈B>=M{,7∈B)

就称不确定变量∈和叼是相同的分布.(2.6)

2预备知识硕士论文2.2不确定性分布

本小节引入不确定性分布的定义来描述不确定变量,不确定性分布就是不确定变量的不完全信息的一个承载。然而,在很多情况下,我们多考虑不确定性分布,而不考虑不确定变量本身。

定义2.2.1.陋“叫,不确定变量荨的不确定性分布函数圣:睨_【o,1】定义如下:对任意实数z,

圣(z)=M{∈≤z).

例2.1.如果不确定变量∈有‘‘之字形”不确定性分布函数

0,如果z≤口

如果。≤z≤6(z一。)/2(6一口)’

西(z)=(2.7)

(z+c一26)/2(c一6),如果6Sz茎c

l,如果z≥c

记作z(n,6,c)其中o,6,c是实数,并满足a<6<c.我们就称∈为“之字形”不确定变量.

定理2.2.1.仁t∥司)如果两个不确定变量是相同的分布,则它们有公共的不确定性分布,但反过来结论不成立.

定理2.2.2.亿iuMJ一个函数西:跪_[0,1】是一个不确定性分布当且仅当它是一个单调递增的函数,除了西@)三。和西(z)兰1.

注2.2.1.独立性有许多种不同的表达形式,但必须满足的必不可少的特点是这些不确定变量不仅要独立地定义在不同的不确定性空间,而且同时还要定义在它们的乘积不确定性空间上.为了确保我们能够做到这一点,我们运用如下的数学形式来定义不确定变量的独立性.8

硕士论文多阶段不确定最优控制定义2.2.2.仁i0“1尉任意实Borel集B1,岛,…,Bm,有

M{自婚∈最,>=,蛩甄M

则称不确定变量∈1,已,…,岛是独立的。

立的当且仅当t6∈鼠,,c2㈣定理2.2.3.仁抛㈨,对任意实Borel集B1,B2,…,Bm,不确定变量∈1,已,…,‰是独

M胁吲).滕M豫吲

的函数,则^(荨1),五(已),…,厶(靠)是独立的不确定变量.

不确定变量的期望和方差2.3江9,定理2.2.4.仁“。胡胜不确定变量荨1,已,…,缸是独立的,并且^,,2,…,厶是可测

,+∞

‘,0,0r)dr,E略】=/3yc{f≥r)dr一/了vc.[∈sJ一∞(2.10)

,+∞,.0

E医】=/.,0垂(z)血.(1一西(z))血一/.,一∞(2.11)

剐=Z1一(Q)dQ。(2.12)

’西cz,={cz{,/2,三三三薹;1二≤lQ.13,

2预备知识硕士论文由(2.11)式可得∈的期望值为

E圈=小1一孚肛£孚扣。.仁㈣

定理2.3.3.仁{以司皿∈和,7是两个有有限期望值的独立的不确定变量,则对任意的实数口和6,有

E【《+6,7】=口E睡】+6E[纠.

注2.3.1.值得注意的是,期望值算子E对不独立的不确定变量一般没有线性性.

定义2.3.2.仁t∥司肚专是一个不确定变量,其有界的期望值为e,则不确定变量∈的方差定义为

y圈=E【@一e)2】.

定理2.3.4.仁i∥司,不确定变量专有有界的期望值e,口和6是实数,则

yK+6】=口2y圈.10

硕士论文多阶段不确定最优控制3多阶段不确定系统

3.1多阶段不确定系统模型

多阶段不确定系统的最优控制问题就是为了使目标函数达到最优(最大或最小),当受到一定的约束条件的限制时,在众多决策选择一个最优的决策。本文中,我们将讨论下列以不确定期望值最优作为目标函数,得到多阶段不确定系统最优控制问题,其一般模型如下:

堆o,o,=躐E酚㈣蝴∽]

z0+1):妒@0),t正G),J)+口@U),让G),J)c≥+1,

其中歹=0,l,2,…,Ⅳ一1,

z(o)=zo.

其中,是目标函数,矽和盯是两个函数,zO)是系统第J个阶段的状态,uO)系统第j『个阶段的控制变量,%满足约束条件的控制变量u0),其中J=o,1,2,…,Ⅳ的全(3・1)体,zo是系统的初始状态。另外,G,岛,…,o是一些独立的不确定变量。

令对任意的o≤后≤Ⅳ,J@七,七)是瞻,Ⅳ】上所得的期望值的最优返回值,其中在第尼阶段有状态z(忍)=z七。则可得下列模型:

m舶,=拦E隆魄蚓∽]以%砷2拦EI.薹“比),比)'力J

zU+1)=妒0D),让0),歹)+仃0G),乱U),歹)G+・,

其中j『=七,后+1,…,Ⅳ一l,

z(七)=z七.

11(3.2)

3多阶段不确定系统硕士论文注3.1.1.在上述模型的基础上,我们也可以考虑其他形式的多阶段不确定系统的最优控制问题的模型。如:上述模型中的最优值取的是目标函数的期望值的最大值,当我们考虑取目标函数的乐观值的最大值时,就可以建立相应的不确定乐观值最优控制问题模型。由于比较两个不同的不确定变量时采用了不同的比较准则,使得各类问题在引入形式和应用方面各不相同。

3.2递推公式

应用BeUman最优性原理,类似于Zhu【371中递推公式的证明,我们可以得到下列递推公式。由这个递推公式,问题(3.1)就能进行求解了。

定理3.2.1.对于问题(3.1),我们可以得到下列递推公式:

J@Ⅳ,Ⅳ)=u(瑚蹴,(zⅣ,让(Ⅳ),Ⅳ),

(3.3)

J(z七,后卜u鼢引m七,u(啪)+删%+1),七+1)】,

其中忌=Ⅳ一1,Ⅳ一2,…,l,0.

证明:由所给条件,很明显可以得到J0Ⅳ,Ⅳ)=札(m瓿,(zⅣ,乱(Ⅳ),Ⅳ)。对任意的忌=Ⅳ一1,Ⅳ一2,…,l,0,有

rⅣ1

以%动2燧E【三八加)'的)'力J

=燧E卜n㈤㈤+E幽蚓州幻,]]^S‘SⅣLU=七+lJJ

rrⅣ11

≤“鼢E陋蛾蚶舭)+。熬EL萎。m㈨u刚JJ

=缸蹴E[他(忌),u(尼),七)+,(z(后+1),%+1)】.12(3・4)

硕士论文多阶段不确定最优控制另外,对任意的u(t),七≤z≤Ⅳ,可得

,(钆,七)≥E心Z∽L∽

ҬJ

=EⅣ∑似他㈣h似U、门砷+E白枷∽J,]]I∑mo),u◇),j『)lIb=七+1JJ

因为对于七+l≤tSⅣ,则

m舶脚卜n㈤㈤+愚E隆枷∽J,]]

=Ef,(z(%),t上(七),膏)+J@(惫+1),七+1)】.

对上述不等式两边同时关于u(七)取最大值,可得

J(z%,七)>u蹴E阶(忌),u(啪)+州克+1),七十1)】.(3.5)

联合(3.4)和(3.5),即可得递推公式(3.3)。

根据前面所考虑的模型,递推公式(3.3)还可以表示为

J@Ⅳ,Ⅳ)=u(器‰,扛Ⅳ,札(Ⅳ),Ⅳ),

J(瓢,七)_u鼢E阶七,u(啪)+J(砂(z七,u(七),尼)(3.6)

+仃(z七,tl(七),忌)Ck+1,七+1)】,

其中%=Ⅳ一1,Ⅳ一2,…,1,0。

注3.2.1.从定理3.2.1,我们可以看出求解问题(3.1)可以转化为:按照逆序的方法,从最后一个阶段开始,一步一步,直到初始阶段为止,求解较为简单的问题(3.3)。

13

4多阶段不确定最优控制问题硕士论文4多阶段不确定最优控制问题

多阶段不确定最优控制问题是对于一个离散系统,当状态转移方程受到不确定变量的干扰时,求该多阶段不确定系统的最优控制,及其相应的最优目标值。4.1线性多阶段不确定最优控制问题

考虑如下线性多阶段不确定最优控制问题,由递推公式(3.3),我们可以得到其精确解,及其相应的最优值。系统模型如下:

mo,o,=蹬E阢。)]oStSⅣLJ=0J

s.t.

zG+1):%zU)+6JuU)+乃+1c;+l,

其中J=0,l,2,…,Ⅳ一1,

z(0)=zo,(4・1)

其中z0)是第J个阶段现存的燃料量,缸O)是第歹个阶段通过消耗或添加的燃料来影

州垆∞’=

JbN,N、=PNzN-}QN,

NN

,@%,后)=Rz七+∑Qi+乏二只crtet,‘=七i=七+1

14

硕士论文多阶段不确定最优控制其中

PⅣ=AⅣ,R=4七+最+1钆;

QⅣ=O,Q七=最+1‰I,

对任意的七=Ⅳ一1,Ⅳ一2,…,1,0.

证明:上述问题的最优控制分别标记为矿(0),u‘(1),…,u。(Ⅳ),运用递推公式(3.3),可得

J(zⅣ,Ⅳ)2l滁1(山zⅣ)=AⅣzⅣ,

其中lu’(Ⅳ)l≤10令PⅣ=AⅣ,QⅣ=o,则

JbN,N、=PNzN+QN.

当忌=Ⅳ一1时,运用递推公式(3.3),可得

J(zⅣ一1,Ⅳ一1)

2I乜(黝s1剐Ⅳ-1zⅣ-1+,(z(Ⅳ),Ⅳ)】

Iu(躐sl‰一lzⅣ_1+PⅣE陋(Ⅳ)】+QⅣ)

I“(躐s1{AⅣ.1zⅣ-1+PⅣE【口Ⅳ一lzⅣ-l+

6Ⅳ一1t正(Ⅳ一1)+盯Ⅳ瓯】+QⅣ)22

2Iu(麟≤1.[(AⅣ_l+R口Ⅳ.1)zⅣ-l+

PⅣ6Ⅳ一1u(Ⅳ一1)+PⅣ咐eⅣ+QⅣ).(4.2)因此

PⅣh一1矿(Ⅳ一1)2Iu(麟≤1既6Ⅳ-1u(Ⅳ一1)・

15

4多阶段不确定最优控制问题硕士论文所以可得

u』cⅣ一1,={兰:定,三蓁兰三i三三i

si弘.[6Ⅳ一1),如果6Ⅳ一1≠o;

不确定,其他情况.

因此。可得

J(zⅣ一l,Ⅳ一1)

=(AⅣ一1+尸Ⅳ口Ⅳ一1)zⅣ一1+PⅣ6N一1u‘(Ⅳ一1)+PⅣ盯ⅣeⅣ+QⅣ.

当6Ⅳ一1=0时,有

J(zⅣ一l,Ⅳ一1)

=(AⅣ一1+尸Ⅳojv—1)zⅣ一1+PⅣu’(Ⅳ一1)×o+PⅣ盯ⅣeⅣ+QⅣ=(4Ⅳ一l+PⅣoⅣ一1)zⅣ一1+PⅣ口ⅣeⅣ+QⅣ.

。PⅣ一1=AⅣ一1+j,ⅣoⅣ一1,QⅣ一1=0.

J@Ⅳ一1,Ⅳ一1)=PⅣ一1zⅣ一1+QⅣ一1+QⅣ+PⅣ叫eⅣ.

当6Ⅳ一1>o时,有u‘(Ⅳ一1)=1,并且

,@Ⅳ一1,Ⅳ一1)

=(AⅣ一1+户IⅣ口Ⅳ一1)zⅣ一1+PⅣ6Ⅳ一1×1+尸lⅣ盯NeⅣ+(?N

=(AⅣ一l+R口Ⅳ一1)zⅣ一1+PⅣ6Ⅳ一1+QⅣ+PⅣ仃ⅣeⅣ.

16(4.3)(4.4)(4.5)(4.6)

j)Ⅳ一1=AⅣ一l+尸Ⅳ口Ⅳ一l,QⅣ一l=PⅣ6Ⅳ一1.

‘,0N—l,Ⅳ一1)=PⅣ一lzN—l+QⅣ一l+QⅣ+PⅣ盯ⅣeⅣ.

当6Ⅳ一1<0时,有u‘(Ⅳ一1)=一1,并且

‘,(zⅣ一1,Ⅳ一1)

=(AⅣ一1+R口Ⅳ一1)zⅣ一l+尸^,6Ⅳ一l×(一1)+既盯ⅣeⅣ+QⅣ=(AⅣ一1+PⅣaⅣ一1)zⅣ一1一R6Ⅳ一l+QⅣ+PⅣ盯ⅣeⅣ.

蜀v—l=AⅣ一1+蜀v口Ⅳ一l,

则(4.7)QⅣ一1=一毋曲Ⅳ一1.

J(zⅣ一1,Ⅳ一1)=户k—lzⅣ一l+QⅣ一1+QⅣ+R盯ⅣeⅣ.

当忌=Ⅳ一2时,运用递推公式(3.3),可得

,0Ⅳ-2'Ⅳ一2)

2阻(是萄≤iE陋Ⅳ一2zⅣ一2+J@(』、r一1),Ⅳ一1)】

2lu(蹴sl{AⅣ_2zⅣ-2+PⅣ一1E陋(Ⅳ一1)】+QⅣ-1+QⅣ+PⅣ仃ⅣeⅣ)Iu(麟≤l{AⅣ一2zⅣ一2+鼢一1E【。Ⅳ一2zⅣ一2+6Ⅳ一2“(Ⅳ一2)+%一1%一1】+QN^+QN+PNoNeN、2

2l“(黝s1{(AⅣ-2+PⅣ一1QⅣ_2)zⅣ_2+R一16Ⅳ一2t正(Ⅳ一2)+QⅣ-l+弧

+pIⅣ一1盯Ⅳ一1eⅣ一1+尸Ⅳ盯ⅣeⅣ).(4.8)17

4多阶段不确定最优控制问题硕士论文因此

PⅣ一16Ⅳ-2u’(Ⅳ一2)2

所以可得Iu(躐≤1PⅣ一16心“(Ⅳ一2)・

如果6Ⅳ一2>O;

如果6Ⅳ一2<0;1,u‘(Ⅳ一1,

不确定,如果6Ⅳ一2=0,

si髓_[6Ⅳ一2),如果6Ⅳ一2≠o;(4.9)

不确定。

因此,可得其他情况.

J(zⅣ一2,Ⅳ一2)

=(AⅣ一2+PⅣ一loⅣ一2)zⅣ一2+尸Ⅳ一16Ⅳ一2缸‘(Ⅳ一2)+QⅣ一1+Q.Ⅳ

+尸Ⅳ一1盯Ⅳ一leⅣ一1+尸lⅣ盯ⅣeⅣ.(4.10)

当6Ⅳ一2=O时,有

J(zⅣ一2,Ⅳ一2)

=(AⅣ一2+PⅣ一1口Ⅳ一2)zⅣ一2+PⅣ一1u+(Ⅳ一2)×0+QⅣ一l+QⅣ

—}PN一・一N一、eN—l+PNoNeN

=∽Ⅳ一2+PⅣ一lnⅣ_2)zⅣ一2+QⅣ一l+QⅣ+既一1卿一1e^r—l

-}PNoNeN.(4.11)

毋、r一2=AⅣ一2+上)Ⅳ一l口Ⅳ一2,

18Q^r一2=0.

‘,@Ⅳ一2,Ⅳ一2)=j)Ⅳ一2zIⅣ一2+QⅣ一2+QⅣ一1+Q|Ⅳ+蜀、r—la.Ⅳ一leⅣ一1+局、ra.ⅣeⅣ.当6Ⅳ一2>o时,有矿(Ⅳ一2)=1,并且

,(zⅣ一2,Ⅳ一2)

=(AⅣ一2+尸Ⅳ一1口Ⅳ一2)zⅣ一2+尸Ⅳ一16Ⅳ一2×1+QⅣ一1+QⅣ

七PN一谭N一谭N—l+PNoNeN

=(AⅣ一2+PⅣ一laⅣ一2)zⅣ一2+PⅣ一16Ⅳ一2+QⅣ一1+QⅣ

七PN一ⅣN一水N—l+PNoNeN.(4.12)

—PlⅣ一2=AⅣ一2+.尸IⅣ一1nⅣ一2,

则QⅣ一2=.尸IⅣ一16Ⅳ一2

J@Ⅳ一2,Ⅳ一2)=PⅣ一2zⅣ一2+QⅣ一2+QⅣ一1+Q.Ⅳ+尸Ⅳ一l知一1eⅣ一1+户Ⅳ叫eⅣ.当6Ⅳ一2<o时,有u’(Ⅳ一2)=一l,并且

J(zⅣ一2,Ⅳ一2)

=(4Ⅳ一2+PⅣ一lnⅣ一2)zⅣ一2+PⅣ一16Ⅳ一2×(一1)+Q.Ⅳ一l+QⅣ

+PN一1仃N—leN一1+PNaNeN

=(AⅣ一2+PⅣ一1口Ⅳ一2)zⅣ一2一R—16Ⅳ一2+Q^r一1+QⅣ

+PN一炉N—leN一1+PNoNeN.(4.13)令

j)Ⅳ一2=AⅣ一2+j,Ⅳ一1口Ⅳ一2,QⅣ一2=一j,Ⅳ一16Ⅳ一2.

19

4多阶段不确定最优控制问题硕士论文则

J0Ⅳ一2,Ⅳ一2)=霸一2zⅣ一2+QⅣ一2+QⅣ一1+QⅣ+PⅣ一1啊一leⅣ一1+PⅣ¨eⅣ.由数学归纳法,可以得到相应的定理结论,定理即证。

注4.1.1.由定理4.1.1中最优控制的表达式,我们可以看出:问题(4.1)是Ban争Ba皿g控制问题。

4.2非线性多阶段不确定最优控制问题

问题(4.1)中,我们考虑的是目标函数和状态转移方程都是线性的,由定理4.1.1中的结论得到线性多阶段不确定最优控制问题的最优控制和最优值,但当所考虑的系统中目标函数是线性的,状态转移方程是二次的时,就是我们下面所要考虑的二次多阶段不确定最优控制问题。

4.2.1非线性多阶段不确定最优控制问题数学模型

由定理4.1.1,对于在每一个阶段上,目标函数和状态转移方程都是线性的不确定最优控制系统,我们可以得到该系统的Ban乎B锄g最优控制和相应的最优目标值的精确表达形式。如果当系统中目标函数是线性的,状态转移方程是二次的,我们考虑下列问题:

mo,o,=瞄E[争。)]

zU+1):吩z0)+%u◇)+吗t‘2G)+乃+lc≥+1,(4・14)

其中歹=0,1,2,…,Ⅳ一1,

z(0)=zo,

其中如<o对于任意的o≤J≤Ⅳ,其余的参数与(4.1)中意义相同・20

硕士论文多阶段不确定最优控制定理4.2.1.问题(4.14)的最优控制u‘(忌)为

I矿∽)I

t正’(克)=一兹,6岛如果2以≤6七≤一2以

一、●,【“弘{赶)’,

相应的最优值为其他情况

JbN,N、=PNzN七QN,

NN

,(%七)=船七十∑Q+∑

‘=七{=如}1只吼et,

其中

R=AⅣ,R=A七十最+10七;

+ld七+

d七如果如果

如果1QⅣ=0,QJc=篡酱尸一+1一b一4+一£1瓦2盘,

其中尼=Ⅳ一1,Ⅳ一2,…,l,O.

证明:上述问题的最优控制分别标记为u+(0),u‘(1),…,让‘(Ⅳ),运用递推公式(3.3),可得

‘,(zⅣ,Ⅳ)=l梳。{“zⅣ}=鼬z.Ⅳ,

其中Iu‘(Ⅳ)I≤l。令R=AⅣ,QⅣ=o,则

3bN,N、=PNzN+QN.

21

当七=Ⅳ一l时,由递推公式(3.3),可得

‘厂(zN一1,Ⅳ一1)

=.,翠蜷..E阻Ⅳ一lzⅣ一1+J0(Ⅳ),Ⅳ)1。‘

阻(Ⅳ一1)151一

=.,粤a签,.{AⅣ一1zⅣ一1+PⅣEk(Ⅳ)】+QⅣ)。。‘‘

Iu(Ⅳ一1)ISl‘

=.,91a蕞,..【AJ、r一1zⅣ一1+j,ⅣE陋Ⅳ一1zⅣ一l’

I缸(Ⅳ一1)lSl、

+6Ⅳ一1t上(Ⅳ一1)+dⅣ一1t上2(Ⅳ一1)+口Ⅳ∞】+QⅣ>

=(AⅣ一1+霸oⅣ一1)zⅣ一1+PⅣ口ⅣeⅣ+QⅣ

+lu(躐s1{Rh一1tl(Ⅳ一1)+PⅣdⅣ一1t正2(Ⅳ一1))・(4・15)

日(u(Ⅳ一1))=PⅣ6Ⅳ一l牡(Ⅳ一1)+PⅣ如一l“2(Ⅳ一1).

求n‘(Ⅳ一1)使得(4.15)成立,就相当于求函数日∞(Ⅳ一1))在l乱(Ⅳ一1)I≤1上的最大值点,即

.,粤嚼,.日(u(Ⅳ一1))’’~

l乜(Ⅳ一1)I≤l

日(让‘(Ⅳ一1))

=PⅣ6Ⅳ一1t正+(Ⅳ一1)+R如一1(t‘’(Ⅳ一1))2.(4.16)

由群=PⅣ6Ⅳ.1+2PⅣ札札(Ⅳ-1)=。

可得

u(Ⅳ_1)=一器.

情况1:如果l—h—l/(2如一1)l≤1,即2dⅣ一1≤6Ⅳ一1≤一2dⅣ一l,则日(t上(Ⅳ一1))的轨迹如图4.1中的日l,此时u‘(Ⅳ一1)=一6Ⅳ一1/(2dⅣ一1)是日(u(Ⅳ一1))的最大值点,

硕士论文多阶段不确定最优控制因为

d2日(u(Ⅳ一1))

毗(Ⅳ一1)2=2尸:ⅣdⅣ一1<0.

也就是说,如果2dⅣ一1≤6Ⅳ一1≤一2dⅣ一l,则第Ⅳ一1个阶段的最优控制是

u。(Ⅳ一1)=一6Ⅳ一l/(2dⅣ一1).

此时,把缸+(Ⅳ一1)=-6Ⅳ一1/(2dⅣ一1)代入(4.16)式,可得

.,乎蜷,.日(u(Ⅳ一1))’、~

Iu(Ⅳ一1)I≤1

=PⅣ6Ⅳ一1u‘(Ⅳ一1)+PⅣdⅣ一l(t正+(Ⅳ一1))2

=蹦M(一嘉)+氏札(一是)2

==一一PⅣ6知一1

2dⅣ一1+甓

PⅣ6南一1

钇Ⅳ一1‘(4.17)

把日(u‘(Ⅳ一1))代入(4.15)可得第Ⅳ一1个阶段的最优目标值J@Ⅳ一1,Ⅳ一1)为

J(zⅣ一1,Ⅳ一1)

=(AⅣ一l+PⅣ口Ⅳ一1)zⅣ一l+氏盯ⅣeⅣ+QⅣ+日(t正’(Ⅳ一1))

=(札。+PⅣ口M)吼。一案+QⅣ+PⅣ州Ⅳ.(4.18)

毋、r—l=AⅣ一1+尸Ⅳ口Ⅳ一1,QⅣ一l=一PⅣ6jI一1

4dⅣ一l‘

J@Ⅳ一l,Ⅳ一1)=PⅣ一1zⅣ一1+QⅣ一l+QⅣ+PⅣ%eⅣ.

情况2:如果一6Ⅳ一l/(2dⅣ一1)>1,即6Ⅳ一l>一2dⅣ一1,则日(让(Ⅳ一1))的轨迹如图4.1中的日2,此时日(u(Ⅳ一1))是u(Ⅳ一1)∈【一1,l】上的递增函数。也就是说,如

果6Ⅳ一1>一2dⅣ一1,则第Ⅳ一1个阶段的最优控制是

t‘’(Ⅳ一1)=1-

此时,把u。(Ⅳ一1)=1代入(4.16)式,可得

~.,乎嚼,.H(u(Ⅳ一1))、’

Iu(Ⅳ一1)ISl

=PⅣ6N一1“’(Ⅳ一1)+既dⅣ一1m。(Ⅳ一1))2

=尸lⅣ6^r—l×1+户IⅣdⅣ一l×12

=民(dⅣ一l+6Ⅳ一1).

把日(u+(Ⅳ一1))代入(4.15)可得第Ⅳ一1阶段最优目标值J@Ⅳ一l,Ⅳ一1)为(4.19)

J(zⅣ一l,Ⅳ一1)

=(AⅣ一l+尸lⅣ口N一1)zⅣ一1+尸Ⅳ盯ⅣeⅣ+QⅣ+日(u’(Ⅳ一1))

=(AⅣ一1+PⅣ口Ⅳ一1)zⅣ一1+R(dⅣ一1+6Ⅳ一1)+QⅣ+PⅣ叫eⅣ.

局、r一1=AⅣ一1+局、rnⅣ一1,(4.20)QⅣ一l=—P知(dⅣ一l+6Ⅳ一1).

J(zⅣ一1,Ⅳ一1)=尸IⅣ一1zⅣ一l+QⅣ一1+QⅣ+尸lⅣ9ⅣeⅣ.

情况3:如果一6Ⅳ一1/(2dⅣ一1)<一1,即6Ⅳ一l<2dⅣ一l,则H(u(Ⅳ一1))的轨迹如图4.1中的日3,此时H(u(Ⅳ一1))是u(Ⅳ一1)∈【一1,1】上的递减函数。也就是说,如果6Ⅳ一1<2dⅣ一l,则第Ⅳ一1个阶段的最优控制是t‘+(Ⅳ一1)=一1.

此时,把矿(Ⅳ一1)=一1代入(4.16)式,可得

“.,粤嚼,,日(“(Ⅳ一1))K(Ⅳ一1)lSl’、

=PⅣ6.Ⅳ一1t正’(Ⅳ一1)+RdⅣ一1(u+(Ⅳ一1))2

PⅣ6Ⅳ一1×(一1)+PⅣdⅣ一l×(一1)2

=PⅣ(dⅣ一l—h一1).(4.21)

把日(u‘(Ⅳ一1))代入(4.15)可得第Ⅳ一1个阶段的最优目标值J@Ⅳ一l,Ⅳ一1)为

‘,0Ⅳ一l,Ⅳ一1)

=(AⅣ一1+氏DⅣ一1)zⅣ一l+R叫eⅣ+QⅣ+日(乱+(Ⅳ一1))

=(AⅣ一1+PⅣ口Ⅳ一1)zⅣ一l+PⅣ(dⅣ一l一6Ⅳ一1)+QN+PⅣ仃NeⅣ.

尸Ⅳ一l=AⅣ一l+PⅣoⅣ一l,

则(4.22)QⅣ一1=只v(dⅣ一l一6Ⅳ一1).

J@Ⅳ一l,Ⅳ一1)=尸Ⅳ一lzⅣ一1+QⅣ一1+QⅣ+尸Ⅳ仃Ⅳej、r.

当忌=Ⅳ一2时,由递推公式(3.3),可得

J(zⅣ一2,Ⅳ一2)

2I。(黝≤lE陋Ⅳ-2zⅣ-2+‘,(z(Ⅳ一1),Ⅳ一1)】

k(嚣蜀≤1<AⅣ一2zⅣ一2+日一lEk(Ⅳ一1)】+QⅣ一1+QⅣ+尸Ⅳ卿eⅣ】.2

2I。(鼢s1{如一2zⅣ_2+PⅣ一1E【口Ⅳ一2z眦+6Ⅳ_2u(Ⅳ一2)

+dⅣ一2让2(Ⅳ一2)+盯Ⅳ一1瓯一l】+QⅣ一l+QⅣ十尸Ⅳ啊eⅣ}

=(AⅣ一2+PⅣ一loⅣ一2)zⅣ一2+既一l口Ⅳ一1eⅣ一1+QⅣ一l+QⅣ+尸Ⅳ啊eⅣ

+max(4.23)

It‘(Ⅳ一2)I≤1、{PⅣ一16Ⅳ一2u(Ⅳ一2)+PⅣ一1dⅣ一2乱2(Ⅳ一2)).

日(u(Ⅳ一2))=PⅣ一16Ⅳ一2u(Ⅳ一2)+PⅣ一ldN一2乱2(Ⅳ一2).

笔等簪三产=PⅣ一・h一2+2PⅣ一・dⅣ一2u(Ⅳ一2)=。

可得

u(Ⅳ-2)一是.

类似于%=Ⅳ一1的情况,可得:

如果I一6Ⅳ一2/(2dⅣ一2)l≤l,即2ak一2≤6Ⅳ一2≤一2dⅣ一2,则u’(Ⅳ一2)=一6Ⅳ一2/(2dⅣ一2)是日(u(Ⅳ一2))的最大值点,其中日(u(Ⅳ一2))的轨迹如图4.1中的日1・因为啤卿:2PⅣ-1dⅣ-2<o.du(Ⅳ一2)2~”~一”~‘。

也就是说,如果2如一2≤6Ⅳ一2≤一2d^r一2,则第Ⅳ一2个阶段的最优控制是

u+(Ⅳ一2)=一6Ⅳ一2/(2dⅣ一2).

否则,因为如果一6Ⅳ一2/(2dⅣ一2)>l,即6Ⅳ一2>一2dⅣ一2,则日(tl(Ⅳ一2))的轨迹如图4.1中的日2。日∞(Ⅳ一2))是u(Ⅳ一2)∈【一1,1】上的递增函数,则第Ⅳ一2阶段的最优控制是

t‘’(Ⅳ一2)=1.

如果一6Ⅳ一2/(2dN一2)<一1,即6Ⅳ一2<2dⅣ一2,则日(乱(Ⅳ一2))的轨迹如图4.1中的日3。日(让(Ⅳ一2))是u(Ⅳ一2)∈【一l,1】上的递减函数,则第Ⅳ一2阶段的最优控制是

牡‘(Ⅳ一2)=一1.

26

硕士论文多阶段不确定最优控制凼此f一骧,I一—趸面i二;一’

日(让)如果2如一2≤6Ⅳ_2≤一2dⅣ一2划术zⅡⅣ一2∑口Ⅳ一2∑一么口Ⅳ一2.M紧蜀≤1日(u(Ⅳ一2))2.{PⅣ一1(dⅣ一2+6N一2),如果6N一2>一2dⅣ一2【PⅣ“如一2—6Ⅳ-2),如果6Ⅳ-2<2dⅣ-2.把最优控制代入(4.23)可得第Ⅳ一2个阶段的最优目标值J@Ⅳ一2,Ⅳ一2)。由数学归纳法。可以得到相应的定理结论。定理即证。

/一/一1/、、

、、日1/{罗\/—\\1H2\’\.一

图4.1:函数日(t‘)的三种轨迹

注4.2.1.由定理4.2.1中最优控制的表达式,我们可以看出:问题(4.14)是Ban争BaJlg控制问题。

4.2.2算法分析

在定理4.2.1中,我们研究的是目标函数是线性,状态转移方程是二次的多阶段最优控制问题。对于该问题,我们得到其每一个阶段的最优控制和最优目标值的精确表达形式。对于所有的%=0,1,…,Ⅳ一1,根据定理4.2.1,由第忌个阶段和第七+1个阶段之间的关系,可得下列两个算法,来计算不确定最优控制问题的最优控制和最优目标值。

算法J:(计算每个阶段的系数)27

4多阶段不确定最优控制问题

硕士论文

步骤l:令u’(Ⅳ)=o,计算J@Ⅳ,Ⅳ)=PⅣzⅣ+QⅣ=PⅣzⅣ;步骤2:对于七=Ⅳ一l,…,0,执行以下两个步骤;

步骤3:比较k和2如,

如果6七>一2以,则u。(忌)=1;如果6七<2d%,贝0u’(詹)=一1;

如果2d七≤6七S一2d七,则u‘(七)=一靠/(2d七);步骤4:计算R=屯+口七R+1,

如果让。(后)=1,贝4Q七=最+1(d七+6七);如果u’(后)=一1,则Q惫=:R+1(以一6知);

如果u’(忌)=-6南/(2比),则Q七=一(磋R+1)/(4以)。

由算法1,在每一个阶段忌(七=0,1,…,Ⅳ一1),我们可以得到u+(七),R和Q知的表达式。设不确定变量fl,岛,…,知分别有期望值e1,e2,…,eⅣ。现在,给定初值z(o),

我们可以根据算法1的结果,在计算机上用下列算法2得到系统的状态变量、最优控制和最优目标值。

算法2(对任意给定的初值,计算最优控制)

步骤1:执行算法l,对于给定的初值zo,计算

J00,o)=晶跏+∑Q{+∑只吼e{;

‘=0

‘=l

步骤2:对于忌=1,…,Ⅳ,执行下列两个步骤;

步骤3:用轮盘赌的方式随机产生r∈【0,l】,由于不确定变量仉满足

不确定性分布西仕),使得西(c(忌))=,.,计算实数c(七)。计算z(后)=吼一1z(七一1)+6七一lt‘‘(七一1)+如一1(t上。(七一1))2+吼c(七);

步骤4:计算

t,p七,七)=最z七+∑Q‘+∑只以艮.

1=詹

t=七+l

硕士论文多阶段不确定最优控制

注4.2.2.由算法1,我们可按照逆序从最后一个阶段开始到初始阶段,计算每个阶段的系数。由算法2,当给定初始状态zo时,从初始阶段开始到最后一个阶段,计算所有阶段的最优控制和相应的最优目标值。

5数值实例硕士论文

5数值实例

在前面章节里,我们考虑了当目标函数是线性的,状态转移方程分别是线性和二次的多阶段不确定系统最优控制问题,并且分别经证明得到了上述两类问题的每一个阶段的最优控制和相应最优目标值的精确表达式。由定理4.1.1和定理4.2.1中最优控制的表达式可知:上述两种问题均为Ban分Bang控制问题。作为应用,我们考虑当目标函数和状态转移方程都是线性时,把定理3.2.1的结论应用于下列具体实

例。

例5.1.

厂10

以‰0)2麟E【.善扣∽J

o≤t≤10

LJ=0J

zG+1)=%z0)+%uU)+吩+1C:f+1,

其中歹=0,1,2,…,9,z(o)=zo.

(5.1)

其中相应的系数罗列于表5.1中,对于每一个o≤歹≤10,有一1≤uU)≤1。另外,a,Q,…,qo是独立的‘‘之字型’’不确定变量z(一1,o,1),根据(2.14)式,对于每一个ji=l,2,…,10,则有驯0】=o.

表5.1:实例中的系数

080.011.2.0.2

113O.021.50

2100.011.2.0.3

3110.0l

41l0.011.2.O.3

5160.021.3.0.2

680.011.40.2

7110.0110.2

8120.011.2.O.2

9100.021.10.3

10150.011.3.0.4

as

口J

6J

0.1

由定理4.1.1,可得最优控制和相应的最优目标值,罗列于表5.2。表5.2的第

四列数据表示的是相应的状态,这些状态是由初始状态z(O)=1,经状态转移方

30

硕士论文

多阶段不确定最优控制

程z@+1)=口蠡石(七)+6_|cu(尼)+仃七+1呶+l迭代得到的,其中c¨1是不确定变量伉+1的实现。对每一个阶段任意产生的一个实数r¨1∈[o,l】(尼=o,l,2,…,9),通过式

子c¨1=2r七+1—1,可以得到相应的戗+1。

表5.2:最优解

StageO

nb

Ck

z(尼)

t正’(七)

.1

J(z七,后)

636.625632.18

611.897

0.7613450.0534074O.8318120.3154390.560045O.7841730.6046020.06488240.21952

0.748283

O.522691.0.893185O.663625.0.3691210.120090.5683460.209204—0.870235.0.560961

0.496567

1.41045

2.10675

It‘‘(Ⅳ)I≤l

.1l

23456

2.834732.931043.819655.171237..441827.633129.3485210.5883

591.98560.198528.26467.627426.372344.131252.236158.825

.1

.111—1l

89

10

l让。(Ⅳ)l≤1

当我们所考虑的目标函数是线性的,而状态转移方程都是二次的时,结合算法1和算法2,运用定理4.2.1的结论考虑下列具体实例。

例5.2.

10

J,I、珈O、l,=

m毯毫菩牌oI

J=o

∑如zo)IJ

(5・2)

z0+1):唧zU)+6Ju0)+如t正20)+乃+1c;+l,

其中歹=O,1,2,…,9,

z(o)=zo.

其中相应的系数罗列于表5.3中,如<0,其余各系数和例5.1的意义相同.

31

5数值实例硕士论文

表5.3:实例中的系数

080.011.2.0.2.O.05

1130.021.50.5.0.04

2100.011.2.0.3.0.03

3110.01l0.1.O.02

4110.011.2.0.3.0.09

5160.021.3.0.2.0.06

680.011.40.2.0.05

1l

12

9100.021.10.3—0.05

10150.011.3一O.4.0.03

8’

0.01l0.2.0.06

0.0l1.2.O.2.0.07

西

运用递推公式,根据算法l'我们可以得到上述问题在每个阶段上的系数R和Q知:

P10=410=15,最=A七+R+1口七;

R+1(也+%),一如果u+(庇)=1;

Q10=o,

Q知=1最+l(d七一b七),如果u’(庇)=一l;

【一警,如果u地)=一瓣.

对于后=Ⅳ一1,Ⅳ一2,…,0,其中A七,n七,k和毗罗列于表5.3中。

根据算法1,我们得到的系数最和Q矗。当给定初始状态zo=1时,运用算法2,我们可以得到每一个阶段的最优控制和相应的最优目标值,相应结果罗列于表5。4。

表5.4中的第二列是随机产生的实数强∈[0,1】;第三列是当后=1,2,…,Ⅳ时,根据(1+c七)/2=以,得到的相应实数%∈卜1,1】;第四列是每个阶段的状态,它们满足z(七十1)=饥z(后)+k乱(七)+吼+l仅+l;第五列是当给定初始状态为zo=1时,

得到的每个阶段的最优控制;最后一列是相应的每个阶段的最优目标值。

32

硕士论文多阶段不确定最优控制

表5.4:最优解

Stager七

C量

z(七)

t‘’(七)

,@k,七)

0.1.1687.06310.91998O.8399611.36681684.7752O.5308080.06161692.51081.1667.1413

0.8080080.6160163.289141643.1014

0.857814O.7156293.37629.1608.08250.932768O.8655354.27886.1573.12760.9287390.8574795.71111

505.39170.0963469.0.8073068.13746l

459.2680.173254—0.6534938.27093.1

369.46290.5640740.12814710.05771

270.27810

0.944456

O.888913

11.3223

fu‘(Ⅳ)I≤1

169.835

总结

硕士论文

总结

在实际中,由于模糊和随机的局限性,2007年清华大学刘宝碇教授创建了不确定性理论,并于2010年进一步发展。现在,满足正规性、自反性、次可数可加性和乘积测度公理的不确定性理论已经成了数学的一个重要分支。本文是在不确定性理论的基础上,讨论对于一个多阶段系统,该系统的每一个阶段都受到一个不确定变量的干扰,并且使得目标函数的期望值达到最优的问题。为了解决这个多阶段不确定系统的最优控制问题,在动态规划中Benman最优性原理的基础上,提出递推公式,当不确定系统的目标函数是线性的,状态转移方程分别是线性和二次的时,分别得到了相应的最优控制的表达式,由解的表达式知道上述两类问题都是Ban乎Bang控制问题。作为应用,对于多阶段不确定系统的最优控制问题的一个具体实例,运用已经证明的定理,求解得到其Ban分Bang最优控制和相应的最优目标值。

上述两类问题所研究的目标函数都是线性的,证明得到最优控制问题是Ban乎Bang最优控制问题。然而,当目标函数是非线性的(如二次的)时,最优控制问题是否仍然是Ban分Badlg最优控制问题就有待进一步研究。

硕士论文

多阶段不确定最优控制

致谢

两年半的研究生学习生涯即将结束,在此论文完成之际,我首先要向我的导师朱元国教授表示衷心的感谢。感谢朱老师在我写论文期间遇到困难时,耐心地指导,给我提供文献资料,以及关于文献检索方面的技巧,帮我突破瓶颈。朱老师精益求精的学习态度、严谨的科学态度、务实的工作作风深深激励着我,促使我不断地进步。并且朱老师平易近人,关心学生,在生活上给予我无微不至的关怀。

其次,感谢学校图书馆提供的电子资源信息和书籍,如中国期刊网、超星数据库、国外高校的硕博论文数据库、Springer、IEEE、南京理工大学书刊资料借阅室等,使我在书写本论文时能能较全面地查阅相关资料。

再次,感谢我的同学和朋友,尤其是许新新、张锦和我的舍友,感谢他们在我学习遇到困难时无私的帮助,感谢他们在我情绪低落时的开导和安慰,感谢他们让我看到了自己的不足,感谢他们在我的学习生涯中给予我的帮助和关心。

最后,感谢我的父母,感谢他们的包容和牵挂,无论走多远,父母永远是孩子的避风的港湾,他们用无私的爱给予我默默的关心和支持,使我能够安安心心地顺利完成学习和研究。

参考文献

硕士论文

【1】L蠲aue

JP.Functional

考文

Anab玛is缸ld

Tinleoptimalcontr01.NewY.0rk:A∞demic

胁,1969.

【2】MertonRC.Opt洫al

CoIls砌ption

andPortf01ioRm镪in

ContimlousTime

Model.知um以盯互泐佗D仇tc

2现eDr奶197l,3:373-413

【3】F1e血ngwH,R曲elRw.Dete咖inisticY0rk:跏n叼er.讫“蛳1986[4】HarrisonJM.Br∞mian.Motion

andstochasticOptinl越Contr01.NeW

andstochasticF10W

syste脚.NewYork:乃概

肌切彩舶邶,1985

[5】Karatz锯I.OptiⅡlizationProblems

。,0ur扎口2on

inthe

Theo巧0fConti肌ous

namng.黝M

I:b佗t”Df口礼d《9p托m£加托D住,1989,27(6):1221一1259

optimalStoppingProblem

[6】JeIlsenu.An

口nd

in瞰skTheoUJ『如um竹ce:Ma忱em口挽cs

EcDnDm记s,1998,22(2):177-178

RS.Investmentunder

[7】DbdtAK,Pindyck

Uncertainty.Princeton:R呓佗ce£DnUm‘

口erst匆肌ss,1994

[8】李训经.控制理论基础.北京:高等教育出版社,2002

[9】李训经,雍炯敏,周渊.控制理论基础.第二版.北京:高等教育出版社,2010

【10】雍炯敏.动态规划方法与H撇ilton-Jac如ic-Belhan方程.第三版.上海:上海科

学技术出版社,1992

【111雍炯敏,楼卫红.最优控制理论简明教程.第四版.北京:高等教育出版社,2006【12】周凤岐.现代控制理论及应用.第三版.成都:电子科技大学出版社,1994

36

硕士论文

多阶段不确定最优控制

【13】赵纯均,詹一辉.控制理论基础.第三版.北京:清华大学出版社,1991【14】郭尚来.随机控制.北京:清华大学出版社,1999[15】蔡尚峰.随机控制理论.上海:上海交通大学出版社,1987【16】钟秋海.现代控制理论.北京:高等教育出版社,2004【17】解学书.最优控制理论与应用.北京:清华大学出版社,1986[18】Dorat0P’Hsieh

Stochastic£Dm口统c

cM,R0blnsonPN.OptimalBaJl分BangcontrolofLinear

SysteD=ls而th

SmauNoise

Paurameter.Z肼汜乃也船口c统D船D佗A缸.

C『D他troj,1967,AGl2(6):68二690

AV.onstochastic

(19】Bal妇ishnanBan分Bang.contr01.A卯阮d讹统e仇口£zcs口磁

印协n钯口zzD他,1980,6:91—96

[20】vaLl出r锄eev

SA.ABa肛乎BangTheorem

with

Fi诚e

NuHlberofS丽tche8

for

NordjnearControl

2016

Syste麟.知缸m口Z盯讹冼e仇。统训&ie礼伽,1997,85(3):2002.

【21】、vabhGR.ANumericalExampleof0ptimaLlBang-Ban:g

Contr01s.‘,aum以盯

蜀叼讯ee厄佗9讹统emnttcs,1972,6(2):165-174

【22】John

NobIe,Heinzschaettler.OntheOptimautyof

Par锄etrizedFamiHt涵of

B埘BangTrajectories.Ⅳa佗如ne口r以钆口枷括,2001,47:351.362

f23】吴臻,王向荣.带有随机跳跃干扰的线性二次随机最优控制问题.自动化学报,

2003,29(6):821—826【24】Ga0

z.OnDiscreteTimeOptimalControl:

Closed-Fb珊S01ution.M静

sachlsetts:Ame九∞佗(勋n£mj∞啊托他他ce

BDs£D鸭2004

37

参考文献硕士论文

【25】Pengz,YangY,HuangL.ControlEli蚵nationofTimeOptim2LlBa跨Bang

ContD0l祈thaCl鹪sofInputConstraints.Z砸汜饥亡emo洳礼口Z国可.e他礼ceD仃C『DntmZnndAt‘亡Dm口托D%2010,8:171m1715

【26】StengelRF.StochalsticOptimalControl:Theow锄dApphcation.NewY.ork.

乃梳耽fe!,拶舶瑚,1986

【27】Ka0EPC.AnIntroductiont0stochasticProcess铅.肌幽伽D砌凡6如^咖∞m・

册叼,1997,1:37垂420

【28】Liux.Entropy’DistanceMeasureandsimil缸i蚵MeasureofF吆珂setsandTheir

Relations.呦&幻口nd跏沈ms,1992,52:305-318

【29】Liux.Measllringthesatisf如tionofcollstraintsinFuzzyLine龇Programming.

j咖jge绐n死di受/ste仃ls,2001,122(2):263.275

[30】LiuB.UncertaintyTheo融2nded.Berlin:却n哪er.阮订略2007

【31】Ga0J,Ga0x.ANewModelforCredibiliticOptionPricing.乃t‘m口:盯咖cen口饥

跏£e"坫,2008,2(4):24孓247

【32】LiuY,HaM.E砷eCtedV甜ueofFunction0funcert出nV打iables.Kunrnjng:m-

ceI碱唧s可现e肋^饥觑temo悦D礼口fC,D他厂e他佗ceD佗砌加rmn扼D佗口以Man叼eme耐&钯他ces,2009,17:779_781

【33】LiuB.uneertai奶rTheo可:ABranchofMathematicsforModeungHumanun-

certainty.Berhn:印n叼er-讫rf蛳2010

【34】Liuw,XuJ.s锄ePropert涵onExpectedV洳eOperatorforuncert咖妇i-

abl筒.砌加r仇口tiDn:An砌tem口托D礼以仇te廊c印溉口阿乃让m口j'2010,13(5):169孓1699

硕士论文多阶段不确定最优控制

【35】Yux.EXpectedPayoffofnadingstrate舀esforuncert越nFinanc瑚M盯kets.

功加mlo统D礼?An觑亡em口渤佗DZ觑亡e71d诂c咖f讯。阿jIDt正m口f,2011,14(10):3175.3186

【36】LinF,YingH.ModelingandControl0fFuzzyDiscreteEventSysteI璐.陋E目

乃.口邶口c托D瑚D佗勖ste仇s,^她%口砌回6eme托cs—P口nE2002,32(4):40&415[37】zhuY.FuzzyoptinlaLlControlforM诚i.stageE.IuzzysysteⅡ塔.舾EEn氇船口c抚D船

Dn勋s抛ms,讹礼彩回6eme既cs?凡nE2011,41(4):964975

[38】LiuB.nzzyProce豁,HybridProce豁anduncertainProcess.乃um口2盯踟cen口饥

跏£e竹话,2008,2(1):195.215

[39】zhuY.OnP盯a.NormedSpace而thnzzy、协iablesBasedonEXpectedV甜ued

Operator.饥tem口£i帆以乃牡m02巧踟.傀行oi礼地凡蟛规礼e始n几dj流D叫fe匆e-60s缸跏£ems,2008,16(1):95-106

【40】zhuY,Jix.ExpectedVal懈ofF、11nction8ofFluzzyV打iables.如um赦盯h亡e胁

夕e耐呦勋ste脚2006,17(5):471-478

[41】zhuY.uncertaillOptimalControlⅥ,ithApplicationtoaPortfolioselection

Model.劬6eme扰cs口们勖s£e脚,2010,41(7):535-547

【42】LiuB.someR艘earchProbkmsinuncertailltyThe0够乃umn2盯溉ce订口饥

跏te竹硌,2009,3(1):冬10

【43】LiuB.ASurV呵ofEntropyofF’uzzyV打iables.如um口2o,阮cen口讥S如钯册,

2007,1(1):缸13

【44】LiuB.’nle0叮and

讫rf凹,2002PracticeofUncertainProgramming.Heidelberg:Ph妒i∞.

在学期间发表的论文硕士论文

在学期间发表的论文

【1】Yujie

tainKangandYu锄guozhu,Ban乎BangOptimalControlforMulti-stageuncer-SysteHls,功如mo优D礼:A佗托temn托Dn耐h把纪话c咖胁口硝JlDt‘m讲(SCI源期刊),accepted。


相关文章

  • 汉语歇后语的概念整合机理分析
  • 语文学刊2009年第11期 汉语歇后语的概念整合机理分析 0张玲 (河北师范大学外国语学院,河北 [摘 要] 石家庄050016) 歇后语作为一种语言现象.一直是众多学者们研究的焦点之一.由于歇后语的分类不同.它的 心理认知过程也不同.根据 ...查看


  • 六一儿童节英语祝语
  • [导语]祝福语是指日常生活全部的常用祝福语,比如好友之间祝福语.事业祝福语.家人祝福语.朋友祝福语等.以下是本站为您整理的六一儿童节英语祝语,希望大家能够喜欢. [篇一] 1.Children's happiness, the innoce ...查看


  • 儿童节英语祝福语祝词
  • 1. children's happiness, the innocence you forever! aunt is ready for you to eat the teeth do not hurt the sugar, to tas ...查看


  • 英文儿童节祝福语
  • Children's happiness, the innocence you forever! Aunt is ready for you to eat the teeth do not hurt the sugar, to taste, ...查看


  • 全设计流程
  • -初步调查阶段( 时间:双方协商) 成立专项设计组,踏堪现场,与业主进行工作会议,讨论 项目分期 建筑物构件间界限 视野 建筑场地入口 道路及路面 建筑场地环境 (时间:双方协商) 专项设计组依据业主<设计任务书>内容进行工作, ...查看


  • 英文六一儿童节祝福语
  • Children's happiness, the innocence you forever! Aunt is ready for you to eat the teeth do not hurt the sugar, to taste, ...查看


  • 基于全生命周期的酒店建设项目成本控制
  • 作者:周欣 财会通讯 2016年02期 进入21世纪以来,随着我国经济的快速发展,旅游消费逐步成为我国的一大消费热点,作为旅游业三大支柱之一的酒店业尤其是高星级酒店对国民经济的贡献度不断提高.根据相关数据显示,自2000-2008年间,全国 ...查看


  • 信息系统审计操作流程
  • 信息系统审计操作流程 1.审计计划阶段 计划阶段是整个审计过程的起点.其主要工作包括: (1)了解被审系统基本情况 了解被审系统基本情况是实施任何信息系统审计的必经程序,对基本情况的了解有助于审计组织对系统的组成.环境.运行年限.控制等有初 ...查看


  • 需求管理规范 (2)
  • 需求管理体系改进方法研究 需求管理过程 当软件开发完成需求开发工作之后,不可避免地会遇到软件需求的变更.有效的需求管理需要对变更带来的潜在影响及可能的成本费用进行评估.变更控制委员会与关键的项目风险承担者要进行协商,以确定哪些需求可以变更. ...查看


热门内容