第7章 线性定常离散时间状态空间设计法
7.1 7.2 7.3 7.4 7.5 7.6
引言
状态反馈配置极点 状态估值和状态观测器
利用状态估值构成状态反馈以配置极点 扰动调节 无差调节
7.1
引言
一个被控对象:
⎧x (k +1) =Fx (k ) +Gu (k ) ⎨
⎩y (k ) =Cx (k )
x (k ) :n ⨯1, u (k ) :m ⨯1, F :n ⨯n , G :n ⨯m , C :r ⨯n
当设计控制器对其控制时,需要考虑如下各因素: ● 扰动,比如负载扰动 ● 测量噪声
● 给定输入的指令信号 ● 输出 如图7.1所示。
d L (k ) 扰动
7.1
给
图7.1 控制系统示意图
根据工程背景的不同,控制问题可分为调节问题和跟踪问题,跟踪问题也称为伺服问题。 调节问题的设计目标是使输出迅速而平稳地运行于某一平衡状态。包括指令变化时的动态过程,和负载扰动下的动态过程。但是这二者往往是矛盾的,需要折衷考虑。
伺服问题的设计目标是对指令信号的快速动态跟踪。 本章研究基于离散时间状态空间模型的设计方法。
7.2研究通过状态变量的反馈对闭环系统的全部特征值任意配置——稳定性与快速线。 7.3考虑当被控对象模型的状态无法直接测量时,如何使用状态观测器对状态进行重构。 7.4讨论使用重构状态进行状态反馈时闭环系统的特征值。 7.5简单地讨论扰动调节问题。 7.6状态空间设计时的无差调节问题。
7.2 状态反馈配置极点
工程被控对象如式7.1,考虑状态反馈
u (k ) =v (k ) +Lx (k )
7.2
如图7.2所示。式7.2带入式7.1,得
⎧x (k +1) =Fx (k ) +Gu (k ) ⎪
⎨y (k ) =Cx (k )
⎪u (k ) =v (k ) +Lx (k ) ⎩
整理得
7.3
⎧x (k +1) =(F +GL )x (k ) +Gv (k )
⎨
y (k ) =Cx (k ) ⎩
7.4
v
(k )
(k )
图7.2 状态反馈任意配置闭环系统的极点
闭环系统的特征方程为
det [zI -(F +GL ) ]=0
7.5
问题是在什么情况下式7.5的特征根是可以任意配置的?即任给工程上期望的n 个特征根λ1, λ2, ..., λn ,有
det [zI -(F +GL ) ]=∏(z -λi ) =0
i =1n
7.6
定理:状态反馈配置极点
若被控对象式7.1是状态完全能达的,即(F , G)是一个能达对(能达性矩阵
,则一定存在一个r 行n 列的状态反馈矩阵L ,使得在状态反W c =[F N -1G ... FG G ]满秩)
馈u (k ) =v (k ) +Kx (k ) 下,闭环系统式7.4具有任意给定的n 个期望的特征根λ1, λ2, ..., λn 。
证明:略
在实际工程应用中,动态系统式7.1的阶数n 不会太高。在式7.6中L 是一个r 行n 列的矩阵,有nr 个待定参数,分别令式中等号左右的n 阶首一多项式的n 个系数对应相等,可得n 个线性方程。
当单输入单输出情况时,l 是一个n 元行向量,此时l 是唯一确定的。 当多输入多输出情况时,L 是一个r 行n 列的矩阵,此时L 不是唯一的。
有限拍闭环控制器
当选择闭环系统的n 个特征根均为零,即λi =0,i =1,2,…,n ,则式7.6成为
det [zI -(F +GL ) ]=z n =0
根据矩阵代数中的Cayley-Hamilton 定理,此时有
7.7
F n =0
7.8
上式表明,由任何扰动引起的状态偏差,系统都会在最多n 拍以内使之衰减为零。 关于有限拍控制器,有两点需要注意: ①
n 拍意味着过度过程不大于nT ,T 为采样周期。这一点似乎意味减小采样周期就可
以提高系统的动态速度。但是,减小采样周期同时意味着控制信号的幅值急剧增大。如果控制信号的幅值超出了系统允许的范围,实际上达不到预期的控制效果。因此,谨慎地选取采样周期非常重要。
②
就动态性能而言,离散时间系统中的零特征值(同时采样T 周期趋于零)等价于连
续时间系统中的特征值为 “-∞”,二者都是无法实现的。
7.3 状态估值和状态观测器
用一组代数运算器(无动态运算)通过状态反馈实现被控对象的动态特性任意配置,似
乎是一种很完美的控制方法。但是尚有几个非理想的因素需要解决。比如,
● 状态是否可以直接测得? ● 是否可以实现无差调节? ● 对扰动的调节能力如何?
工程控制中,状态反馈的实现需要被控对象的n 个状态可以实时测得。这一点对于一般的系统大多是不现实的。而在经典控制理论的输出反馈中,系统的输出总是可以检测的。
因此,能否实现通过状态反馈实现任意配置极点,首先需要设法实时获得n 个状态的值 7.3.1
全维观测器
假设被控对象式7.1的状态x 无法直接测得,一个合理的办法是人为地对x 进行重构,如
ˆ,输出图7.3所示。重构系统具有和式7.1完全相同的结构、参数、和输入量,其状态记为x
ˆ。 记为y
ˆ的初始状态也理论上讲,由于重构的系统和原系统结构和参数均完全相同,如果x 和x ˆ取代x 进行状态反馈即可。实际上却存在三个问题: ˆ(k ) =x (k ) ;由x 相同,则有x
● 一是对象中的扰动会改变其状态;
● 二是原系统可能存在稳定性问题,因而重构系统也会不稳定; ● 三是原系统参数可能并不太准确。
ˆ(k ) 动态跟踪x (k ) ,引入输出误差y (k ) -y ˆ(k ) 的反馈 为了保证x
ˆ(k +1) =Fx ˆ(k ) +Gu (k ) +K (y (k ) -y ˆ(k ) )⎧⎪x
⎨
ˆˆy (k ) =Cx (k ) ⎪⎩
7.9
图7.3 全维观测器结构
化简后后得到
ˆ(k +1) =(F -KC )x ˆ(k ) +Gu (k ) +Ky (k ) ⎧⎪x
⎨
ˆˆy (k ) =Cx (k ) ⎪⎩
7.10
现在考虑(定义)估值误差
ˆˆ(k ) =x (k ) -x ˆ(k ) x
将式7.1和式7.10带入上式,得
ˆˆˆ(k +1) =(F -KC )x ˆ(k ) x
7.11
7.12
ˆˆ(k ) 就会足显然,如果可以选择矩阵K 使得矩阵(F-KC )具有稳定且足够小的特征值,x
ˆ(k ) 会足够快地趋于x (k ) 。 够快地趋于零;就是说,x
这就是渐进状态观测器,简称观测器。 定理:观测器的动态特性
若被控对象式7.1是状态完全能观的,即(F , C )是一个能观对(能观性矩阵
T
W O =⎡⎣C
F T C T ...
-1N T
(F T ) C ⎤,则一定存在一个n 行m 列的输出反馈矩阵K ,使得状⎦满秩)
T
态观测器式7.10或式7.12具有任意给定的n 个期望的特征根γ, γ2, ..., γn 。
即有
det [zI -(F -KC ) ]=∏(z -γi ) =0
i =1n
7.13
就是说,总可以通过选取适当的矩阵K 使得观测器具有期望的稳定性 无论原来的系统式7.1是否稳定!
在上式中K 是一个n 行m 列的矩阵,有nm 个待定参数,分别令式中等号左右的n 阶首一多项式的n 个系数对应相等,可得n 个线性方程。
当单输入单输出情况时,K 是一个n 元行向量,此时K 是唯一确定的。 当多输入多输出情况时,K 是一个n 行m 列的矩阵,此时K 不是唯一的。 式7.9的观测器与原系统式7.1具有相同的维数,因而称为全维观测器。 7.3.2
降维观测器(Luenberger 观测器)
观测器实际上是控制器的一部分。降低观测器的维数可以简化控制器的设计和实现。 降维观测器的思路是,式7.1中的输出y (k ) 中已经“直接”包含了部分状态x (k ) 的信息,这些对应的状态就可直接测得,只需对剩余无法测得的状态进行观测,观测器的维数就可降低,称为降维观测器。
假设输出矩阵C 是满秩的,则一定存在一个相似变换
⎡x 1(k ) ⎤
x (k ) =⎢⎥=(k ) x (k ) ⎣2⎦
其中,x 1(k ) 和x 2(k ) 分别为n-m 维和m 维。
7.14
于是,式7.1成为
⎧⎪⎡⎪⎣⎢1(k +1) ⎤⎡1112⎤⎡1(k ) ⎤⎡1⎤⎨
2(k +1) ⎥⎦=⎢⎣⎥⎢⎥⎦+⎢⎣⎥u (k ) 2112⎦⎣2(k ) 2⎦
⎪
⎪
y (k ) =[0I ]⎡⎢1(k ) ⎤(k ) ⎥=2(k ) ⎩
⎣2⎦展开得
⎧⎪
1(k +1) =111(k ) +122(k ) +1u (k )
⎨⎪2(k +1) =211(k ) +122(k ) +2u (k ) ⎩y (k ) =2
(k ) 对应有
⎧⎪=P -1FP =⎡1112⎤
⎪
⎢
⎥⎪
⎣2112⎦
⎨=CP =[0I ]⎪
⎪=P -1G =⎡1⎤
⎪⎩
⎢⎣⎥2⎦注意到y (k ) =2(k ) ,已经直接得到了2(k ) 的估值,即
2(k ) =y (k ) 为了对1(k ) 设计观测器,令1(k ) 子系统的输出为
1(k ) =211(k )
=2(k +1) -(222(k ) +2u (k ) ) =y (k +1) -(22y (k ) +2u (k ) )
则待观测的1(k ) 子系统成为
⎧⎪1(k +1) =111(k ) +122(k ) +1u (k )
⎨
⎪⎩1
(k ) = 211(k ) =y (k +1) -(22y (k ) +2u (k ) )仿照式7.10对上式中的1(k ) 设计n-m 维降维观测器,得
⎧⎪1(k +1) =111(k ) +122(k ) +1u (k ) +K 1(1(k ) -1(k ) )
⎪⎨1(k ) =211(k ) ⎪⎪⎩
2(k ) =y (k ) 将式7.20带入上式,得
7.15
7.16
7.17
7.18
7.19
7.20
7.21
1(k +1) =(11-K 121)1(k ) +(1-K 12)u (k ) ⎧⎪⎪
+(12-K 122)y (k ) +K 1y (k +1) ⎨
⎪⎪⎩2(k ) =y (k )
7.22
将上式用结构图表示如下图7.4。图中有一个增序算子z ,将该支路移到减序支路之后(必
1(k ) ;再考虑线性变换式须在反馈分支之前,为什么?)二者相互抵消;相应的状态改记为ˆ(k ) ;如图7.5所示。
7.14,最后得到x (k ) 的状态估值x
)
图7.4 降维观测器式7.23的结构
u
图7.5 降维观测器式7.23的等效简化
再对上图进行简化,将K 1输入支路移到反馈分支之后,最后得降维状态观测器动态方程如下式,亦如下图7.6所示。
1(k +1) =(11-K 121)1(k ) +(1-K 12)u (k ) ⎧⎪⎪+⎡12-K 122+(11-K 121)K 1⎤y (k ) ⎣⎦⎪
⎨1(k ) =1(k ) +K 1y (k )
⎪
1(k ) ⎤⎡⎪
ˆ⎥⎪x (k ) =P ⎢
y (k ) ⎣⎦⎩
7.23
ˆ(k ) 后,得到x (k ) 的状态估值x 即可实现7.2节中由式7.2定义的状态反馈以实现极点配置,
示于图7.8。
图7.6 降维观测器
关于降维观测器有如下定理: 定理:降维观测器的动态特性
若被控对象式7.1是状态完全能观的,即(F , C )是一个能观对,并且C 是满秩的,则一定存在一个相似变换阵P ,经式7.14变换得到式7.15或7.16。对此一定可以构成如式7.23所示的n-m 维降维观测器,其n-m 个观测器特征值可以通过选择(n-m ) m 维矩阵L 1进行任意配置,即任给n-m 个特征值ε1, ε2, ..., εn-m , 一定存在L 1使得
det ⎡⎣zI -(11-L 121) ⎤⎦=∏(z -εi ) =0
i =1n -m
7.24
证明:略
当C 非满秩时,设其秩为m 1
在式7.24中L 1是一个(n-m ) m 的矩阵,有(n-m ) m 个待定参数,一般其解不是唯一的。 构成降维观测器的方法很多,并不限于上述方法。 有限拍观测器
无论对式7.11的全维观测器或式7.23的降维观测器,当选择其特征根均为零时,即得其有限拍观测器。
7.4 利用状态估值构成状态反馈以配置极点
通过全维或降维观测器得到状态估值后,就可以利用状态估值构成状态反馈以配置极点。
如图7.7和7.8所示。
v (
图7.7 利用全维观测器构成状态反馈
图7.8 利用降维观测器构成状态反馈
现在的问题是,利用状态估值构成的状态反馈系统的动态特性如何?下面以全维观测器为例进行分析。
与图7.7对应的系统方程由式7.1,7.2和7.10共同组成,是一个2n 维系统。如下式
⎧x (k +1) =Fx (k ) +Gu (k )
⎪y (k ) =Cx (k ) ⎪⎪
ˆ(k +1) =Fx ˆ(k ) +Gu (k ) +K (y (k ) -y ˆ(k ) ) ⎨x ⎪y ˆ(k ) =Cx ˆ(k ) ⎪
ˆ(k ) ⎪⎩u (k ) =v (k ) +Lx
7.25
改写为
GL ⎧⎡x (k +1) ⎤⎡F ⎤⎡x (k ) ⎤⎡G ⎤
⎪⎢ˆ⎥=⎢KC F -KC +GL ⎥⎢x ⎥+⎢G ⎥v (k ) ˆx (k +1) (k ) ⎪⎣⎦⎣⎦⎣⎦⎣⎦
⎨
x (k ) ⎤⎪y (k ) =[C 0]⎡⎢x ⎥⎪ˆ(k ) ⎣⎦⎩
7.26
对上式进行相似变换,并不影响系统的特征值
⎡x (k ) ⎤⎡I
⎢x ⎥=⎢I ˆ(k ) ⎣⎦⎣
0⎤⎡x (k ) ⎤⎡I
⎢x (k ) -x ⎥=⎢I ˆ-I ⎥(k ) ⎦⎣⎦⎣
0⎤⎡x (k ) ⎤
⎢ˆ⎥ -I ⎥ˆ(k ) ⎥⎦⎢⎣x ⎦
7.27
得到
⎧⎡x (k +1) ⎤⎡F +GL -GL ⎤⎡x (k ) ⎤⎡G ⎤⎪⎢ˆ⎥=⎢⎥⎢ˆ⎥+⎢0⎥v (k ) 0F -KC ˆ(k +1) ⎥ˆ(k ) ⎥⎦⎢⎪⎢⎣x ⎦⎣⎣x ⎦⎣⎦
⎨
x (k ) ⎡⎤⎪
y (k ) =[C 0]⎢ˆ⎥⎪ˆ(k ) ⎦⎢x ⎥⎣⎩
7.28
考虑到式7.6和式7.13,上式的特征方程为
-GL ⎤⎫⎛⎡F +GL det zI -⎢⎥⎪=det (zI -(F +GL ) )det (zI -(F -KC ) )0F -KC ⎣⎦⎭⎝
=∏(z -λi )
i =1n
∏(z -γ) =0
i
i =1
n
7.29
其中,λi 和γi ,i=1,2,…,n ,分别为由状态反馈阵L 和状态估值反馈矩阵K 决定的闭环系统极点和观测器极点。
求式7.28从输入v (k ) 到输出y (k ) 的传递函数,有
-GL ⎤⎤⎡G ⎤⎡⎡F +GL H (z ) =[C 0]⎢zI -⎢⎥⎥⎢0⎥0F -KC ⎣⎦⎦⎣⎦⎣
GL ⎡zI -(F +GL ) ⎤⎡G ⎤
=[C 0]⎢⎢⎥0zI -(F -KC ) ⎥⎣⎦⎣0⎦=C [zI -(F +GL )]-1G
-1
-1
7.30
可见其从输入到输出的传递函数完全由状态反馈的几点决定,无观测器的极点。 无关因此有如下定理: 定理:分离特性
当由全维(降维)状态观测器得到的状态估值实现状态反馈配置极点时,2n 维(2n -m 维)系统有2n 个(2n -m 个)极点;由状态反馈阵L 确定的n 个闭环极点和由状态估值反馈矩阵K (K 1)决定的n 个(n -m 个)观测器极点,相互独立,互不影响。由状态反馈阵L 任意配置的n 个闭环极点决定系统从输入到输出的传递函数;由状态估值反馈矩阵K (K 1)决定的n 个(n -m 个)观测器极点决定着状态估值趋于系统真实状态的速度。
观测器极点对对闭环系统特性的影响
由式7.13可知,观测器的估值误差由观测器的极点决定。可以想象,如果观测器的响应速度很慢,则由此得到的估值将会较大的偏离实际系统的状态。必然会影响闭环系统的动态特性。一般来说,有以下设计原则:
● 观测器的响应速度应该明显快于闭环系统(传递函数)的响应速度。
● 观测器的响应速度(频带)也不能太宽,应保证噪声频带在观测器的频带之外。 观测器等效为动态校正环节
以图7.7的全维观测器为例,其可以看成是以被控对象的输入u (k ) 和输出y (k ) 为其输入,
ˆ(k ) 为其输出。于是,观测器可以等效为两个传递函数H u (z ) 和H y (z ) ,如图7.9所示。
以x
v (
图7.9 状态观测器构等效为动态校正
其中,
H u (z ) =L (zI -F ) -1(zI -KC (zI -F ) -1)G
-1
H y (z ) =L (zI -F )
-1
(zI -(zI -F )
-1
KC )K
7.31
可有如下一般性的结论:
① 利用状态观测器实现状态反馈控制规律时,观测器与经典控制理论中的动态校正环节等效,二者本质上是一致的。
② 为了达到同样的校正目的,一般来说用观测器会比使用经典校正法更为简单些,例如阶数可以更低些。
③ 上述所谓的等效仅仅是输入输出意义下的,其内部模态不一定等效。
④ 利用状态观测器实现状态反馈控制规律时,使用了系统内部的更多信息,一般来说对系统设计的任意性更大些。
⑤ 经典的校正方法是以开环特性间接把握闭环特性,而利用状态观测器实现的反馈控制规律是直接把握闭环极点。
但是,基于观测器的闭环设计方法也还有很多局限性,比如,如何实现无差调节,如何对扰动调节特性进行设计,等。
下面讨论这些问题。
以下两节内容仅供同学们参考,尚有相关问题需要进一步研究。
7.5 扰动调节
再来回顾图7.1,图中的扰动可能是负载扰动、环境扰动、甚或是参数扰动,或其它扰动。
扰动的加入点可能在输入端、输出端或模型内部。扰动可能引起输出的动态偏差和稳态偏差。在经典控制理论中可以对扰动进行反馈控制或前馈控制,可以通过积分调节消除扰动的稳态误差。
本节讨论在状态空间模型下通过观测器对扰动进行估值和前馈控制,下一节讨论扰动的误差调节。
假设输入端有r 维扰动d (k ) ,包含扰动的被控对象如下图7.10所示。
)
图7.10 扰动前馈控制与状态反馈配置极点示意图
当输出端或模型内部存在扰动时,不失一般性,一般总可以等效向前移动,并入d (k ) 中。 在式7.1中考虑扰动d (k ) ,有
⎧x (k +1) =Fx (k ) +Gu (k ) +Gd (k )
⎨
y (k ) =Cx (k ) ⎩
一般来说,做如下假设是合理的:
7.32
扰动的频带远小于闭环系统的频带。就是说闭环系统的动态调节速度要比扰动的变化速度快得多。在这一假设下,有理由做式7.33的假设。该假设的工程意义是,由于扰动变化缓慢,使得任意相邻两个采样点上的扰动值近似不变。既有
d (k +1) =d (k )
7.33
式7.32和7.33联立,得到一个状态扩充的系统方程
⎧⎪(k +1) =(k ) +(k )
⎨
y (k ) =(k ) ⎪⎩
7.34
其中,
⎧⎡G ⎤
⎡F G ⎤⎡x (k ) ⎤⎪⎢0⎥(k ) =, =, =⎢⎥⎢⎥⎪⎢⎥
⎣d (k ) ⎦n 2⎣0I r ⎦n 22 ⎨⎢0⎥⎣⎦(n 2) r
⎪
⎪=[C 0], n 2=n +r m (n 2) ⎩
7.35
ˆ(k ) ,首先研究式7.35的可观性。其可观性矩阵为 为了得到d (k ) 状态估值d
0⎡⎤⎡C ⎤
⎢⎥⎢⎥CF CI G n ⎥=⎢⎥O =⎢ ⎢... ⎥⎢... ⎥... ⎢n 2-1⎥⎢n 2-1⎥n 2-2
CF C [F +... +F +I ]G n ⎦(mn 2)(n 2) ⎣⎦⎣
7.36
如果上式是满秩的,则可以构成一个全维或降维的渐近观测器,得到(k ) 的状态估值
ˆ(k ) ,仍如图7.10所示。 (k ) 。其中包括d ˆ(k ) ,采用前馈补偿控制。取前馈补偿控制系数为“-I r ”对于扰动d ,则理论上可以实现扰动全补偿。即由于有
ˆ(k ) =d (k ) d
7.37
ˆ(k ) 支路和d (k ) 支路的影响相互抵消,不对输出产生影响。这就是基于扰动观测器因此d
的扰动前馈补偿控制。
ˆ(k ) 总会比事实上,观测器是一个渐近观测器。即考虑观测器的动态速度不会无限快,d d (k ) 略微滞后,全补偿只是近似的。
ˆ(k ) ,即可以实现状态反馈配置极点。亦示于图7.10中。 利用对状态的估值x
7.6 无差调节
由上节可知,通过扰动前馈补偿,可以消除负载等扰动对系统输出的影响。但是前馈补
偿属于开环控制,由于参数的变化或不准确,都会影响补偿控制的效果。
为了得到稳态无差调节的特性,现在只考虑标量系统,即单输入单输出系统,亦即,m =r =1。当考虑多输入多输出系统时,涉及到解耦问题,要复杂一些,这里不再讨论。
考虑如下标量纯积分系统
s (k +1) =s (k ) +e (k ) 7.38
当达到“稳态”时,一定有下式成立。
s (k +1) =s (k ), e (k ) =0
再令
e (k ) =v (k ) -y (k )
7.39
7.40
将式7.1、式7.38及7.40联立,得到
⎧x (k +1) =Fx (k ) +gu (k ) ⎪s (k +1) =s (k ) +e (k ) ⎪
⎨
⎪e (k ) =v (k ) -y (k ) ⎪⎩y (k ) =cx (k )
整理后得下式。其中,u (k ) 是反馈控制向量,v (k ) 是给定控制指令向量。
⎧⎡x (k +1) ⎤⎡F 0⎤⎡x (k ) ⎤⎡g ⎤⎡0⎤⎪⎢⎥=⎢-c 1⎥⎢s (k ) ⎥+⎢0⎥u (k ) +⎢1⎥v (k ) s (k +1) ⎪⎣⎦⎣⎦⎣⎦⎣⎦⎣⎦
⎨
⎪y (k ) =[c 0]⎡x (k ) ⎤
⎢s (k ) ⎥⎪⎣⎦⎩
7.41
7.42
在上式中,如果如下可控性判别矩阵满秩,
⎡G Fg
W c =⎢
⎣
0-cg
F 2g -c (F +I n ) g
⎤F n g
⎥
-c (F n -1+... +F +I n ) g ⎦(n +1)(n +1)
7.37
则根据状态反馈配置极点的定理,一定存在一个1行n +1列的反馈矩阵l ,使得上述n +1维系统的全部极点可以任意配置。
再同时考虑状态和扰动观测器,以及扰动前馈控制,其系统结构图一并示于图7.11中。
v
图7.11 无差控制系统示意图
第7章 线性定常离散时间状态空间设计法
7.1 7.2 7.3 7.4 7.5 7.6
引言
状态反馈配置极点 状态估值和状态观测器
利用状态估值构成状态反馈以配置极点 扰动调节 无差调节
7.1
引言
一个被控对象:
⎧x (k +1) =Fx (k ) +Gu (k ) ⎨
⎩y (k ) =Cx (k )
x (k ) :n ⨯1, u (k ) :m ⨯1, F :n ⨯n , G :n ⨯m , C :r ⨯n
当设计控制器对其控制时,需要考虑如下各因素: ● 扰动,比如负载扰动 ● 测量噪声
● 给定输入的指令信号 ● 输出 如图7.1所示。
d L (k ) 扰动
7.1
给
图7.1 控制系统示意图
根据工程背景的不同,控制问题可分为调节问题和跟踪问题,跟踪问题也称为伺服问题。 调节问题的设计目标是使输出迅速而平稳地运行于某一平衡状态。包括指令变化时的动态过程,和负载扰动下的动态过程。但是这二者往往是矛盾的,需要折衷考虑。
伺服问题的设计目标是对指令信号的快速动态跟踪。 本章研究基于离散时间状态空间模型的设计方法。
7.2研究通过状态变量的反馈对闭环系统的全部特征值任意配置——稳定性与快速线。 7.3考虑当被控对象模型的状态无法直接测量时,如何使用状态观测器对状态进行重构。 7.4讨论使用重构状态进行状态反馈时闭环系统的特征值。 7.5简单地讨论扰动调节问题。 7.6状态空间设计时的无差调节问题。
7.2 状态反馈配置极点
工程被控对象如式7.1,考虑状态反馈
u (k ) =v (k ) +Lx (k )
7.2
如图7.2所示。式7.2带入式7.1,得
⎧x (k +1) =Fx (k ) +Gu (k ) ⎪
⎨y (k ) =Cx (k )
⎪u (k ) =v (k ) +Lx (k ) ⎩
整理得
7.3
⎧x (k +1) =(F +GL )x (k ) +Gv (k )
⎨
y (k ) =Cx (k ) ⎩
7.4
v
(k )
(k )
图7.2 状态反馈任意配置闭环系统的极点
闭环系统的特征方程为
det [zI -(F +GL ) ]=0
7.5
问题是在什么情况下式7.5的特征根是可以任意配置的?即任给工程上期望的n 个特征根λ1, λ2, ..., λn ,有
det [zI -(F +GL ) ]=∏(z -λi ) =0
i =1n
7.6
定理:状态反馈配置极点
若被控对象式7.1是状态完全能达的,即(F , G)是一个能达对(能达性矩阵
,则一定存在一个r 行n 列的状态反馈矩阵L ,使得在状态反W c =[F N -1G ... FG G ]满秩)
馈u (k ) =v (k ) +Kx (k ) 下,闭环系统式7.4具有任意给定的n 个期望的特征根λ1, λ2, ..., λn 。
证明:略
在实际工程应用中,动态系统式7.1的阶数n 不会太高。在式7.6中L 是一个r 行n 列的矩阵,有nr 个待定参数,分别令式中等号左右的n 阶首一多项式的n 个系数对应相等,可得n 个线性方程。
当单输入单输出情况时,l 是一个n 元行向量,此时l 是唯一确定的。 当多输入多输出情况时,L 是一个r 行n 列的矩阵,此时L 不是唯一的。
有限拍闭环控制器
当选择闭环系统的n 个特征根均为零,即λi =0,i =1,2,…,n ,则式7.6成为
det [zI -(F +GL ) ]=z n =0
根据矩阵代数中的Cayley-Hamilton 定理,此时有
7.7
F n =0
7.8
上式表明,由任何扰动引起的状态偏差,系统都会在最多n 拍以内使之衰减为零。 关于有限拍控制器,有两点需要注意: ①
n 拍意味着过度过程不大于nT ,T 为采样周期。这一点似乎意味减小采样周期就可
以提高系统的动态速度。但是,减小采样周期同时意味着控制信号的幅值急剧增大。如果控制信号的幅值超出了系统允许的范围,实际上达不到预期的控制效果。因此,谨慎地选取采样周期非常重要。
②
就动态性能而言,离散时间系统中的零特征值(同时采样T 周期趋于零)等价于连
续时间系统中的特征值为 “-∞”,二者都是无法实现的。
7.3 状态估值和状态观测器
用一组代数运算器(无动态运算)通过状态反馈实现被控对象的动态特性任意配置,似
乎是一种很完美的控制方法。但是尚有几个非理想的因素需要解决。比如,
● 状态是否可以直接测得? ● 是否可以实现无差调节? ● 对扰动的调节能力如何?
工程控制中,状态反馈的实现需要被控对象的n 个状态可以实时测得。这一点对于一般的系统大多是不现实的。而在经典控制理论的输出反馈中,系统的输出总是可以检测的。
因此,能否实现通过状态反馈实现任意配置极点,首先需要设法实时获得n 个状态的值 7.3.1
全维观测器
假设被控对象式7.1的状态x 无法直接测得,一个合理的办法是人为地对x 进行重构,如
ˆ,输出图7.3所示。重构系统具有和式7.1完全相同的结构、参数、和输入量,其状态记为x
ˆ。 记为y
ˆ的初始状态也理论上讲,由于重构的系统和原系统结构和参数均完全相同,如果x 和x ˆ取代x 进行状态反馈即可。实际上却存在三个问题: ˆ(k ) =x (k ) ;由x 相同,则有x
● 一是对象中的扰动会改变其状态;
● 二是原系统可能存在稳定性问题,因而重构系统也会不稳定; ● 三是原系统参数可能并不太准确。
ˆ(k ) 动态跟踪x (k ) ,引入输出误差y (k ) -y ˆ(k ) 的反馈 为了保证x
ˆ(k +1) =Fx ˆ(k ) +Gu (k ) +K (y (k ) -y ˆ(k ) )⎧⎪x
⎨
ˆˆy (k ) =Cx (k ) ⎪⎩
7.9
图7.3 全维观测器结构
化简后后得到
ˆ(k +1) =(F -KC )x ˆ(k ) +Gu (k ) +Ky (k ) ⎧⎪x
⎨
ˆˆy (k ) =Cx (k ) ⎪⎩
7.10
现在考虑(定义)估值误差
ˆˆ(k ) =x (k ) -x ˆ(k ) x
将式7.1和式7.10带入上式,得
ˆˆˆ(k +1) =(F -KC )x ˆ(k ) x
7.11
7.12
ˆˆ(k ) 就会足显然,如果可以选择矩阵K 使得矩阵(F-KC )具有稳定且足够小的特征值,x
ˆ(k ) 会足够快地趋于x (k ) 。 够快地趋于零;就是说,x
这就是渐进状态观测器,简称观测器。 定理:观测器的动态特性
若被控对象式7.1是状态完全能观的,即(F , C )是一个能观对(能观性矩阵
T
W O =⎡⎣C
F T C T ...
-1N T
(F T ) C ⎤,则一定存在一个n 行m 列的输出反馈矩阵K ,使得状⎦满秩)
T
态观测器式7.10或式7.12具有任意给定的n 个期望的特征根γ, γ2, ..., γn 。
即有
det [zI -(F -KC ) ]=∏(z -γi ) =0
i =1n
7.13
就是说,总可以通过选取适当的矩阵K 使得观测器具有期望的稳定性 无论原来的系统式7.1是否稳定!
在上式中K 是一个n 行m 列的矩阵,有nm 个待定参数,分别令式中等号左右的n 阶首一多项式的n 个系数对应相等,可得n 个线性方程。
当单输入单输出情况时,K 是一个n 元行向量,此时K 是唯一确定的。 当多输入多输出情况时,K 是一个n 行m 列的矩阵,此时K 不是唯一的。 式7.9的观测器与原系统式7.1具有相同的维数,因而称为全维观测器。 7.3.2
降维观测器(Luenberger 观测器)
观测器实际上是控制器的一部分。降低观测器的维数可以简化控制器的设计和实现。 降维观测器的思路是,式7.1中的输出y (k ) 中已经“直接”包含了部分状态x (k ) 的信息,这些对应的状态就可直接测得,只需对剩余无法测得的状态进行观测,观测器的维数就可降低,称为降维观测器。
假设输出矩阵C 是满秩的,则一定存在一个相似变换
⎡x 1(k ) ⎤
x (k ) =⎢⎥=(k ) x (k ) ⎣2⎦
其中,x 1(k ) 和x 2(k ) 分别为n-m 维和m 维。
7.14
于是,式7.1成为
⎧⎪⎡⎪⎣⎢1(k +1) ⎤⎡1112⎤⎡1(k ) ⎤⎡1⎤⎨
2(k +1) ⎥⎦=⎢⎣⎥⎢⎥⎦+⎢⎣⎥u (k ) 2112⎦⎣2(k ) 2⎦
⎪
⎪
y (k ) =[0I ]⎡⎢1(k ) ⎤(k ) ⎥=2(k ) ⎩
⎣2⎦展开得
⎧⎪
1(k +1) =111(k ) +122(k ) +1u (k )
⎨⎪2(k +1) =211(k ) +122(k ) +2u (k ) ⎩y (k ) =2
(k ) 对应有
⎧⎪=P -1FP =⎡1112⎤
⎪
⎢
⎥⎪
⎣2112⎦
⎨=CP =[0I ]⎪
⎪=P -1G =⎡1⎤
⎪⎩
⎢⎣⎥2⎦注意到y (k ) =2(k ) ,已经直接得到了2(k ) 的估值,即
2(k ) =y (k ) 为了对1(k ) 设计观测器,令1(k ) 子系统的输出为
1(k ) =211(k )
=2(k +1) -(222(k ) +2u (k ) ) =y (k +1) -(22y (k ) +2u (k ) )
则待观测的1(k ) 子系统成为
⎧⎪1(k +1) =111(k ) +122(k ) +1u (k )
⎨
⎪⎩1
(k ) = 211(k ) =y (k +1) -(22y (k ) +2u (k ) )仿照式7.10对上式中的1(k ) 设计n-m 维降维观测器,得
⎧⎪1(k +1) =111(k ) +122(k ) +1u (k ) +K 1(1(k ) -1(k ) )
⎪⎨1(k ) =211(k ) ⎪⎪⎩
2(k ) =y (k ) 将式7.20带入上式,得
7.15
7.16
7.17
7.18
7.19
7.20
7.21
1(k +1) =(11-K 121)1(k ) +(1-K 12)u (k ) ⎧⎪⎪
+(12-K 122)y (k ) +K 1y (k +1) ⎨
⎪⎪⎩2(k ) =y (k )
7.22
将上式用结构图表示如下图7.4。图中有一个增序算子z ,将该支路移到减序支路之后(必
1(k ) ;再考虑线性变换式须在反馈分支之前,为什么?)二者相互抵消;相应的状态改记为ˆ(k ) ;如图7.5所示。
7.14,最后得到x (k ) 的状态估值x
)
图7.4 降维观测器式7.23的结构
u
图7.5 降维观测器式7.23的等效简化
再对上图进行简化,将K 1输入支路移到反馈分支之后,最后得降维状态观测器动态方程如下式,亦如下图7.6所示。
1(k +1) =(11-K 121)1(k ) +(1-K 12)u (k ) ⎧⎪⎪+⎡12-K 122+(11-K 121)K 1⎤y (k ) ⎣⎦⎪
⎨1(k ) =1(k ) +K 1y (k )
⎪
1(k ) ⎤⎡⎪
ˆ⎥⎪x (k ) =P ⎢
y (k ) ⎣⎦⎩
7.23
ˆ(k ) 后,得到x (k ) 的状态估值x 即可实现7.2节中由式7.2定义的状态反馈以实现极点配置,
示于图7.8。
图7.6 降维观测器
关于降维观测器有如下定理: 定理:降维观测器的动态特性
若被控对象式7.1是状态完全能观的,即(F , C )是一个能观对,并且C 是满秩的,则一定存在一个相似变换阵P ,经式7.14变换得到式7.15或7.16。对此一定可以构成如式7.23所示的n-m 维降维观测器,其n-m 个观测器特征值可以通过选择(n-m ) m 维矩阵L 1进行任意配置,即任给n-m 个特征值ε1, ε2, ..., εn-m , 一定存在L 1使得
det ⎡⎣zI -(11-L 121) ⎤⎦=∏(z -εi ) =0
i =1n -m
7.24
证明:略
当C 非满秩时,设其秩为m 1
在式7.24中L 1是一个(n-m ) m 的矩阵,有(n-m ) m 个待定参数,一般其解不是唯一的。 构成降维观测器的方法很多,并不限于上述方法。 有限拍观测器
无论对式7.11的全维观测器或式7.23的降维观测器,当选择其特征根均为零时,即得其有限拍观测器。
7.4 利用状态估值构成状态反馈以配置极点
通过全维或降维观测器得到状态估值后,就可以利用状态估值构成状态反馈以配置极点。
如图7.7和7.8所示。
v (
图7.7 利用全维观测器构成状态反馈
图7.8 利用降维观测器构成状态反馈
现在的问题是,利用状态估值构成的状态反馈系统的动态特性如何?下面以全维观测器为例进行分析。
与图7.7对应的系统方程由式7.1,7.2和7.10共同组成,是一个2n 维系统。如下式
⎧x (k +1) =Fx (k ) +Gu (k )
⎪y (k ) =Cx (k ) ⎪⎪
ˆ(k +1) =Fx ˆ(k ) +Gu (k ) +K (y (k ) -y ˆ(k ) ) ⎨x ⎪y ˆ(k ) =Cx ˆ(k ) ⎪
ˆ(k ) ⎪⎩u (k ) =v (k ) +Lx
7.25
改写为
GL ⎧⎡x (k +1) ⎤⎡F ⎤⎡x (k ) ⎤⎡G ⎤
⎪⎢ˆ⎥=⎢KC F -KC +GL ⎥⎢x ⎥+⎢G ⎥v (k ) ˆx (k +1) (k ) ⎪⎣⎦⎣⎦⎣⎦⎣⎦
⎨
x (k ) ⎤⎪y (k ) =[C 0]⎡⎢x ⎥⎪ˆ(k ) ⎣⎦⎩
7.26
对上式进行相似变换,并不影响系统的特征值
⎡x (k ) ⎤⎡I
⎢x ⎥=⎢I ˆ(k ) ⎣⎦⎣
0⎤⎡x (k ) ⎤⎡I
⎢x (k ) -x ⎥=⎢I ˆ-I ⎥(k ) ⎦⎣⎦⎣
0⎤⎡x (k ) ⎤
⎢ˆ⎥ -I ⎥ˆ(k ) ⎥⎦⎢⎣x ⎦
7.27
得到
⎧⎡x (k +1) ⎤⎡F +GL -GL ⎤⎡x (k ) ⎤⎡G ⎤⎪⎢ˆ⎥=⎢⎥⎢ˆ⎥+⎢0⎥v (k ) 0F -KC ˆ(k +1) ⎥ˆ(k ) ⎥⎦⎢⎪⎢⎣x ⎦⎣⎣x ⎦⎣⎦
⎨
x (k ) ⎡⎤⎪
y (k ) =[C 0]⎢ˆ⎥⎪ˆ(k ) ⎦⎢x ⎥⎣⎩
7.28
考虑到式7.6和式7.13,上式的特征方程为
-GL ⎤⎫⎛⎡F +GL det zI -⎢⎥⎪=det (zI -(F +GL ) )det (zI -(F -KC ) )0F -KC ⎣⎦⎭⎝
=∏(z -λi )
i =1n
∏(z -γ) =0
i
i =1
n
7.29
其中,λi 和γi ,i=1,2,…,n ,分别为由状态反馈阵L 和状态估值反馈矩阵K 决定的闭环系统极点和观测器极点。
求式7.28从输入v (k ) 到输出y (k ) 的传递函数,有
-GL ⎤⎤⎡G ⎤⎡⎡F +GL H (z ) =[C 0]⎢zI -⎢⎥⎥⎢0⎥0F -KC ⎣⎦⎦⎣⎦⎣
GL ⎡zI -(F +GL ) ⎤⎡G ⎤
=[C 0]⎢⎢⎥0zI -(F -KC ) ⎥⎣⎦⎣0⎦=C [zI -(F +GL )]-1G
-1
-1
7.30
可见其从输入到输出的传递函数完全由状态反馈的几点决定,无观测器的极点。 无关因此有如下定理: 定理:分离特性
当由全维(降维)状态观测器得到的状态估值实现状态反馈配置极点时,2n 维(2n -m 维)系统有2n 个(2n -m 个)极点;由状态反馈阵L 确定的n 个闭环极点和由状态估值反馈矩阵K (K 1)决定的n 个(n -m 个)观测器极点,相互独立,互不影响。由状态反馈阵L 任意配置的n 个闭环极点决定系统从输入到输出的传递函数;由状态估值反馈矩阵K (K 1)决定的n 个(n -m 个)观测器极点决定着状态估值趋于系统真实状态的速度。
观测器极点对对闭环系统特性的影响
由式7.13可知,观测器的估值误差由观测器的极点决定。可以想象,如果观测器的响应速度很慢,则由此得到的估值将会较大的偏离实际系统的状态。必然会影响闭环系统的动态特性。一般来说,有以下设计原则:
● 观测器的响应速度应该明显快于闭环系统(传递函数)的响应速度。
● 观测器的响应速度(频带)也不能太宽,应保证噪声频带在观测器的频带之外。 观测器等效为动态校正环节
以图7.7的全维观测器为例,其可以看成是以被控对象的输入u (k ) 和输出y (k ) 为其输入,
ˆ(k ) 为其输出。于是,观测器可以等效为两个传递函数H u (z ) 和H y (z ) ,如图7.9所示。
以x
v (
图7.9 状态观测器构等效为动态校正
其中,
H u (z ) =L (zI -F ) -1(zI -KC (zI -F ) -1)G
-1
H y (z ) =L (zI -F )
-1
(zI -(zI -F )
-1
KC )K
7.31
可有如下一般性的结论:
① 利用状态观测器实现状态反馈控制规律时,观测器与经典控制理论中的动态校正环节等效,二者本质上是一致的。
② 为了达到同样的校正目的,一般来说用观测器会比使用经典校正法更为简单些,例如阶数可以更低些。
③ 上述所谓的等效仅仅是输入输出意义下的,其内部模态不一定等效。
④ 利用状态观测器实现状态反馈控制规律时,使用了系统内部的更多信息,一般来说对系统设计的任意性更大些。
⑤ 经典的校正方法是以开环特性间接把握闭环特性,而利用状态观测器实现的反馈控制规律是直接把握闭环极点。
但是,基于观测器的闭环设计方法也还有很多局限性,比如,如何实现无差调节,如何对扰动调节特性进行设计,等。
下面讨论这些问题。
以下两节内容仅供同学们参考,尚有相关问题需要进一步研究。
7.5 扰动调节
再来回顾图7.1,图中的扰动可能是负载扰动、环境扰动、甚或是参数扰动,或其它扰动。
扰动的加入点可能在输入端、输出端或模型内部。扰动可能引起输出的动态偏差和稳态偏差。在经典控制理论中可以对扰动进行反馈控制或前馈控制,可以通过积分调节消除扰动的稳态误差。
本节讨论在状态空间模型下通过观测器对扰动进行估值和前馈控制,下一节讨论扰动的误差调节。
假设输入端有r 维扰动d (k ) ,包含扰动的被控对象如下图7.10所示。
)
图7.10 扰动前馈控制与状态反馈配置极点示意图
当输出端或模型内部存在扰动时,不失一般性,一般总可以等效向前移动,并入d (k ) 中。 在式7.1中考虑扰动d (k ) ,有
⎧x (k +1) =Fx (k ) +Gu (k ) +Gd (k )
⎨
y (k ) =Cx (k ) ⎩
一般来说,做如下假设是合理的:
7.32
扰动的频带远小于闭环系统的频带。就是说闭环系统的动态调节速度要比扰动的变化速度快得多。在这一假设下,有理由做式7.33的假设。该假设的工程意义是,由于扰动变化缓慢,使得任意相邻两个采样点上的扰动值近似不变。既有
d (k +1) =d (k )
7.33
式7.32和7.33联立,得到一个状态扩充的系统方程
⎧⎪(k +1) =(k ) +(k )
⎨
y (k ) =(k ) ⎪⎩
7.34
其中,
⎧⎡G ⎤
⎡F G ⎤⎡x (k ) ⎤⎪⎢0⎥(k ) =, =, =⎢⎥⎢⎥⎪⎢⎥
⎣d (k ) ⎦n 2⎣0I r ⎦n 22 ⎨⎢0⎥⎣⎦(n 2) r
⎪
⎪=[C 0], n 2=n +r m (n 2) ⎩
7.35
ˆ(k ) ,首先研究式7.35的可观性。其可观性矩阵为 为了得到d (k ) 状态估值d
0⎡⎤⎡C ⎤
⎢⎥⎢⎥CF CI G n ⎥=⎢⎥O =⎢ ⎢... ⎥⎢... ⎥... ⎢n 2-1⎥⎢n 2-1⎥n 2-2
CF C [F +... +F +I ]G n ⎦(mn 2)(n 2) ⎣⎦⎣
7.36
如果上式是满秩的,则可以构成一个全维或降维的渐近观测器,得到(k ) 的状态估值
ˆ(k ) ,仍如图7.10所示。 (k ) 。其中包括d ˆ(k ) ,采用前馈补偿控制。取前馈补偿控制系数为“-I r ”对于扰动d ,则理论上可以实现扰动全补偿。即由于有
ˆ(k ) =d (k ) d
7.37
ˆ(k ) 支路和d (k ) 支路的影响相互抵消,不对输出产生影响。这就是基于扰动观测器因此d
的扰动前馈补偿控制。
ˆ(k ) 总会比事实上,观测器是一个渐近观测器。即考虑观测器的动态速度不会无限快,d d (k ) 略微滞后,全补偿只是近似的。
ˆ(k ) ,即可以实现状态反馈配置极点。亦示于图7.10中。 利用对状态的估值x
7.6 无差调节
由上节可知,通过扰动前馈补偿,可以消除负载等扰动对系统输出的影响。但是前馈补
偿属于开环控制,由于参数的变化或不准确,都会影响补偿控制的效果。
为了得到稳态无差调节的特性,现在只考虑标量系统,即单输入单输出系统,亦即,m =r =1。当考虑多输入多输出系统时,涉及到解耦问题,要复杂一些,这里不再讨论。
考虑如下标量纯积分系统
s (k +1) =s (k ) +e (k ) 7.38
当达到“稳态”时,一定有下式成立。
s (k +1) =s (k ), e (k ) =0
再令
e (k ) =v (k ) -y (k )
7.39
7.40
将式7.1、式7.38及7.40联立,得到
⎧x (k +1) =Fx (k ) +gu (k ) ⎪s (k +1) =s (k ) +e (k ) ⎪
⎨
⎪e (k ) =v (k ) -y (k ) ⎪⎩y (k ) =cx (k )
整理后得下式。其中,u (k ) 是反馈控制向量,v (k ) 是给定控制指令向量。
⎧⎡x (k +1) ⎤⎡F 0⎤⎡x (k ) ⎤⎡g ⎤⎡0⎤⎪⎢⎥=⎢-c 1⎥⎢s (k ) ⎥+⎢0⎥u (k ) +⎢1⎥v (k ) s (k +1) ⎪⎣⎦⎣⎦⎣⎦⎣⎦⎣⎦
⎨
⎪y (k ) =[c 0]⎡x (k ) ⎤
⎢s (k ) ⎥⎪⎣⎦⎩
7.41
7.42
在上式中,如果如下可控性判别矩阵满秩,
⎡G Fg
W c =⎢
⎣
0-cg
F 2g -c (F +I n ) g
⎤F n g
⎥
-c (F n -1+... +F +I n ) g ⎦(n +1)(n +1)
7.37
则根据状态反馈配置极点的定理,一定存在一个1行n +1列的反馈矩阵l ,使得上述n +1维系统的全部极点可以任意配置。
再同时考虑状态和扰动观测器,以及扰动前馈控制,其系统结构图一并示于图7.11中。
v
图7.11 无差控制系统示意图