next up previous
Next: 追値制御系の最適制御 Up: 最適制御法則 Previous: ハミルトン・ヤコビの方法 (Hamilton-Jacobi)


リカッチの方法 (Riccati equation)

リカッチ形微分方程式の誘導

(2.298)式の代わりにシステム方程式を

\begin{displaymath}
\dot{\mbox{\boldmath$x$}}=\mbox{\boldmath$A$}\mbox{\boldmath$x$}+\mbox{\boldmath$B$}\mbox{\boldmath$u$}
\end{displaymath} (2.326)

とし、(2.299)式の代わりに評価関数を次の2次形式
\begin{displaymath}
J=\int_{0}^{t_f}(\mbox{\boldmath$x$}^{T}\mbox{\boldmath$Q$}\...
...box{\boldmath$u$}^{T}\mbox{\boldmath$R$}\mbox{\boldmath$u$})dt
\end{displaymath} (2.327)

とする。ここで $\mbox{\boldmath$Q$},\mbox{\boldmath$R$}$は重み係数といい対称マトリックスで $\mbox{\boldmath$Q$}$は準正定、 $\mbox{\boldmath$R$}$は正定、 $\mbox{\boldmath$u$}$は拘束がないものとする。(2.316)式より
\begin{displaymath}
H(\mbox{\boldmath$x$},\mbox{\boldmath$u$},\nabla \mbox{\bol...
...+\mbox{\boldmath$u$}^{T}\mbox{\boldmath$R$}\mbox{\boldmath$u$}
\end{displaymath} (2.328)

になり、(2.321)式に適用して
\begin{displaymath}
\frac{\partial H}{\partial \mbox{\boldmath$u$}}=\mbox{\bold...
...\mbox{\boldmath$v$}+2\mbox{\boldmath$R$}\mbox{\boldmath$u$}=0
\end{displaymath} (2.329)


\begin{displaymath}
\mbox{\boldmath$u$}_{0}=-\frac{1}{2}\mbox{\boldmath$R$}^{-1}\mbox{\boldmath$B$}^{T}\nabla\mbox{\boldmath$v$}
\end{displaymath} (2.330)

を得る。(2.335)式を(2.333)式に代入すると
\begin{displaymath}
H_{0}(\mbox{\boldmath$x$},\nabla \mbox{\boldmath$v$},t)=\nab...
... \mbox{\boldmath$x$}^{T}\mbox{\boldmath$Q$}\mbox{\boldmath$x$}
\end{displaymath} (2.331)

になる。したがってハミルトンヤコビの式は
\begin{displaymath}
\nabla \mbox{\boldmath$v$}^{T}\mbox{\boldmath$A$}\mbox{\bold...
...oldmath$Q$}\mbox{\boldmath$x$}+\frac{\partial V}{\partial t}=0
\end{displaymath} (2.332)

となる。この偏微分方程式を解くのに、次のようにおく。
\begin{displaymath}
V(\mbox{\boldmath$x$},t)=\mbox{\boldmath$x$}^{T}\mbox{\boldm...
...{\boldmath$u$}^{T}\mbox{\boldmath$R$}\mbox{\boldmath$u$})d\tau
\end{displaymath} (2.333)

ここに $ \mbox{\boldmath$P$}(t)$ は正定対称行列で$ t=t_{f} $ の時、 $ \mbox{\boldmath$P$}(t_{f})=0 $ 。 上式より
\begin{displaymath}
\nabla \mbox{\boldmath$v$}=\frac{\partial V}{\partial  V{x}}=2\mbox{\boldmath$P$}(t)\mbox{\boldmath$x$}
\end{displaymath} (2.334)

また
\begin{displaymath}
\frac{\partial V}{\partial t} = \mbox{\boldmath$x$}^{T} \dot{\mbox{\boldmath$P$}}(t) \mbox{\boldmath$x$}
\end{displaymath} (2.335)

(2.339)式(2.340)式を(2.337)式に代入すると
\begin{displaymath}
\mbox{\boldmath$x$}^{T}[2\mbox{\boldmath$P$}(t)\mbox{\boldma...
...oldmath$Q$}+\dot{\mbox{\boldmath$P$}}(t)]\mbox{\boldmath$x$}=0
\end{displaymath} (2.336)

になる。また
$\displaystyle \mbox{\boldmath$x$}^{T}2\mbox{\boldmath$P$}(t)\mbox{\boldmath$A$}\mbox{\boldmath$x$}$ $\textstyle =$ $\displaystyle \mbox{\boldmath$x$}^{T}\mbox{\boldmath$P$}(t)\mbox{\boldmath$A$}\...
...x{\boldmath$x$}^{T}\mbox{\boldmath$P$}(t)\mbox{\boldmath$A$}\mbox{\boldmath$x$}$  
  $\textstyle =$ $\displaystyle \mbox{\boldmath$x$}^{T}\mbox{\boldmath$P$}(t)\mbox{\boldmath$A$}\...
...ldmath$x$}^{T}\mbox{\boldmath$P$}(t)\mbox{\boldmath$A$}\mbox{\boldmath$x$}]^{T}$  
  $\textstyle =$ $\displaystyle \mbox{\boldmath$x$}^{T}\mbox{\boldmath$P$}(t)\mbox{\boldmath$A$}\...
...oldmath$x$}^{T}\mbox{\boldmath$A$}^{T}\mbox{\boldmath$P$}(t)\mbox{\boldmath$x$}$ (2.337)

ゆえ(2.341)式は
\begin{displaymath}
\mbox{\boldmath$x$}^{T}[\mbox{\boldmath$P$}(t)\mbox{\boldma...
...oldmath$Q$}+\dot{\mbox{\boldmath$P$}}(t)]\mbox{\boldmath$x$}=0
\end{displaymath} (2.338)

となる。任意の $\mbox{\boldmath$x$}$に対し上式が成立するには
\begin{displaymath}
\mbox{\boldmath$P$}(t)\mbox{\boldmath$A$}+\mbox{\boldmath$A$...
...ath$P$}(t)
+\mbox{\boldmath$Q$}+\dot{\mbox{\boldmath$P$}}(t)=0
\end{displaymath} (2.339)

でなければならない。これはリカッチ形の微分方程式である。これを $ \mbox{\boldmath$P$}(t_{f})=0 $の条件のもとで得られた解 $\mbox{\boldmath$P$}(t),0\leq t \leq t_f $と (2.339)式を(2.335)式に適用すると
\begin{displaymath}
\mbox{\boldmath$u$}_0 = -\mbox{\boldmath$R$}^{-1}\mbox{\boldmath$B$}^{T}\mbox{\boldmath$P$}(t)\mbox{\boldmath$x$}
\end{displaymath} (2.340)

になり
\begin{displaymath}
\mbox{\boldmath$K$}(t)=\mbox{\boldmath$R$}^{-1}\mbox{\boldmath$B$}^{T}\mbox{\boldmath$P$}(t)
\end{displaymath} (2.341)

とおくと
\begin{displaymath}
\mbox{\boldmath$u$}_0(\mbox{\boldmath$x$},t)=-\mbox{\boldmath$K$}(t)\mbox{\boldmath$x$}
\end{displaymath} (2.342)

となる。これをブロック図に書くと 図2.19 のごとくなる。 すなわち $\mbox{\boldmath$K$}(t)$が最適フィードバックゲインを与えることになる。

図 2.19: ブロック図
\begin{figure}\begin{center}
\psbox[scale=0.60]{eps/2-8-1.eps} \end{center} \end{figure}

図 2.20: 変化特性
\begin{figure}\begin{center}
\psbox[scale=0.60]{eps/2-8-2.eps} \end{center} \end{figure}

$ \mbox{\boldmath$P$}(t)$は通常 図2.20 のごとく、初期時刻の間は大体一定値を保ち、 最終時刻に近づいてから変化するという特性を持っている。したがって制御時間が 充分長いときは、 $ \mbox{\boldmath$P$}(t)$が一定値を保っている間に制御が完了する。したがって $t_f=\infty$のときは $\dot{\mbox{\boldmath$P$}}(t)=0$として扱うことができる。

すなわち評価関数が

\begin{displaymath}
J=\int_{0}^{\infty}(\mbox{\boldmath$x$}^{T}\mbox{\boldmath$...
...ox{\boldmath$u$}^{T}\mbox{\boldmath$R$}\mbox{\boldmath$u$})dt
\end{displaymath} (2.343)

のときは(2.344)式は
\begin{displaymath}
\mbox{\boldmath$P$}\mbox{\boldmath$A$}+\mbox{\boldmath$A$}^{...
...box{\boldmath$B$}^{T}\mbox{\boldmath$P$}+\mbox{\boldmath$Q$}=0
\end{displaymath} (2.344)

となり、これをリカッチ形代数方程式という。この場合 $\mbox{\boldmath$P$}$を正定の定数として求め
\begin{displaymath}
\mbox{\boldmath$u$}_0 = -\mbox{\boldmath$R$}^{-1}\mbox{\boldmath$B$}^{T}\mbox{\boldmath$P$}\mbox{\boldmath$x$}
\end{displaymath} (2.345)


\begin{displaymath}
\mbox{\boldmath$K$}=\mbox{\boldmath$R$}^{-1}\mbox{\boldmath$B$}^{T}\mbox{\boldmath$P$}
\end{displaymath} (2.346)

となって、最適フィードバックゲインは定数となる。

パラメータ最適化による誘導

いま最適制御法則が得られたとして

\begin{displaymath}
\mbox{\boldmath$u$}_0=-\mbox{\boldmath$K$}\mbox{\boldmath$x$}
\end{displaymath} (2.347)

とする。これを評価関数に代入すると
\begin{displaymath}
V(\mbox{\boldmath$x$},t)=\int_{t}^{\infty}\mbox{\boldmath$x$...
...T}\mbox{\boldmath$R$}\mbox{\boldmath$K$})\mbox{\boldmath$x$}dt
\end{displaymath} (2.348)

となり、時間で微分すると
\begin{displaymath}
\dot{V}(\mbox{\boldmath$x$},t)=-\mbox{\boldmath$x$}^{T}(\mbo...
...^{T}\mbox{\boldmath$R$}\mbox{\boldmath$K$})\mbox{\boldmath$x$}
\end{displaymath} (2.349)

となる。系が安定であるためには、$V$をリアプノフ関数として考えるとき、 $V$が正定であり、$\dot{V}<0$であればよい。そこで
\begin{displaymath}
V=\mbox{\boldmath$x$}^{T}\mbox{\boldmath$P$}\mbox{\boldmath$x$}
\end{displaymath} (2.350)

とおく。そのとき
$\displaystyle \dot{V}$ $\textstyle =$ $\displaystyle \dot{\mbox{\boldmath$x$}}^{T}\mbox{\boldmath$P$}\mbox{\boldmath$x$}+\mbox{\boldmath$x$}^{T}\mbox{\boldmath$P$}\dot{\mbox{\boldmath$x$}}$  
  $\textstyle =$ $\displaystyle \mbox{\boldmath$x$}^{T}[(\mbox{\boldmath$A$}-\mbox{\boldmath$B$}\...
...\mbox{\boldmath$A$}-\mbox{\boldmath$B$}\mbox{\boldmath$K$})]\mbox{\boldmath$x$}$ (2.351)

となる。(2.354)式と(2.356)式を等値とすると
\begin{displaymath}
(\mbox{\boldmath$A$}-\mbox{\boldmath$B$}\mbox{\boldmath$K$})...
...-\mbox{\boldmath$K$}^{T}\mbox{\boldmath$R$}\mbox{\boldmath$K$}
\end{displaymath} (2.352)

となる。ここで $\mbox{\boldmath$K$}$の変化に対して $\mbox{\boldmath$P$}$を最小にする。そのため上式を $\mbox{\boldmath$K$}$ で偏微分して
\begin{displaymath}
\frac{\partial \mbox{\boldmath$P$}}{\partial \mbox{\boldmath...
...{\partial \mbox{\boldmath$K$}}{\partial \mbox{\boldmath$K$}}=I
\end{displaymath} (2.353)

とおくと
\begin{displaymath}
-\mbox{\boldmath$B$}^T\mbox{\boldmath$P$}-\mbox{\boldmath$P$...
...$}\mbox{\boldmath$K$}-\mbox{\boldmath$K$}^T\mbox{\boldmath$R$}
\end{displaymath} (2.354)


\begin{displaymath}
\mbox{\boldmath$P$}\mbox{\boldmath$B$}=\mbox{\boldmath$K$}^T\mbox{\boldmath$R$}
\end{displaymath} (2.355)

が得られる。これを(2.357)式に代入すると
\begin{displaymath}
\mbox{\boldmath$A$}^{T}\mbox{\boldmath$P$}+\mbox{\boldmath$P...
...box{\boldmath$B$}^{T}\mbox{\boldmath$P$}+\mbox{\boldmath$Q$}=0
\end{displaymath} (2.356)

となり、(2.349)式で得られたリカッチ形代数方程式と同じ結果が得られる。 したがって最適フィードバックゲインは(2.351)式より求められる。

$[$$]$

システム方程式

\begin{displaymath}
\dot{\mbox{\boldmath$x$}}=\left[
\begin{array}{cc}
0&1\\
...
...th$x$}+\left[
\begin{array}{c}
0\\
1
\end{array} \right]u
\end{displaymath} (2.357)

評価関数
\begin{displaymath}
J=\int_{0}^{\infty}(4x_{1}^{2}+u^{2})dt
\end{displaymath} (2.358)

の場合の最適制御方則を求める。

$t_f\rightarrow\infty$であるから

\begin{displaymath}
\mbox{\boldmath$P$}=
\left[
\begin{array}{cc}
P_{11}&P_{12}\\
P_{12}&P_{22}
\end{array} \right]
\end{displaymath} (2.359)

とし、(2.362),(2.363),(2.364)式を(2.349)式に代入すると
    $\displaystyle \left[
\begin{array}{cc}
P_{11}&P_{12}\\
P_{12}&P_{22}
\end{arra...
...ght]
\left[
\begin{array}{cc}
P_{11}&P_{12}\\
P_{12}&P_{22}
\end{array}\right]$  
    $\displaystyle -\left[
\begin{array}{cc}
P_{11}&P_{12}\\
P_{12}&P_{22}
\end{arr...
...ght]
\left[
\begin{array}{cc}
P_{11}&P_{12}\\
P_{12}&P_{22}
\end{array}\right]$  
    $\displaystyle +\left[
\begin{array}{cc}
4&0\\
0&0
\end{array}\right]=0$ (2.360)


$\displaystyle \left[
\begin{array}{cc}
-P_{12}^{2}+4&P_{11}-P_{12}P_{22}\\
P_{11}-P_{12}P_{22}&2P_{12}-P_{22}^{2}
\end{array}\right]=0$     (2.361)

となり、これより
$\displaystyle \left\{
\begin{array}{l}
-P_{12}^{2}+4=0\\
P_{11}-P_{12}P_{22}=0\\
2P_{12}-P_{22}^{2}=0
\end{array}\right.$     (2.362)


$\displaystyle P_{12}=2\quad ,\quad P_{22}=2\quad ,\quad P_{11}=4$     (2.363)

が得られる。したがって
$\displaystyle \mbox{\boldmath$P$}=
\left[
\begin{array}{cc}
4&2\\
2&2
\end{array}\right]$     (2.364)


$\displaystyle \mbox{\boldmath$U$}_{0}=-2(x_{1}+x_{2})$     (2.365)

になる。これをブロック線図にすると 図2.21 となる。

図 2.21: ブロック線図
\begin{figure}\begin{center}
\psbox[scale=0.60]{eps/2-8-3.eps} \end{center} \end{figure}

リカッチ形微分方程式の解法

(2.344)式よりベクトル・リカッチ形微分方程式は

$\displaystyle -\dot{\mbox{\boldmath$P$}}(t)=\mbox{\boldmath$P$}(t)\mbox{\boldma...
...dmath$R$}^{-1}\mbox{\boldmath$B$}^{T}\mbox{\boldmath$P$}(t)+\mbox{\boldmath$Q$}$      
$\displaystyle 境界条件\mbox{\boldmath$P$}(t_f)=\mbox{\boldmath$P$}_0$     (2.366)

である。

いま $\mbox{\boldmath$F$},\mbox{\boldmath$G$}$なる正方行列を次のようにおく。

\begin{displaymath}
\left[
\begin{array}{c}
\dot{\mbox{\boldmath$F$}}(t)\\
\dot...
...{\boldmath$F$}(t)\\
\mbox{\boldmath$G$}(t)
\end{array}\right]
\end{displaymath} (2.367)

ただし境界条件 $\left[
\begin{array}{c}
\mbox{\boldmath$F$}(t_f)\\
\mbox{\boldmath$G$}(t_f)
\e...
...\right]
=
\left[
\begin{array}{c}
I\\
\mbox{\boldmath$P$}_0
\end{array}\right]$とする。

もし

\begin{displaymath}
\mbox{\boldmath$P$}(t)\mbox{\boldmath$F$}(t)=\mbox{\boldmath$G$}(t)
\end{displaymath} (2.368)

なら、これを偏微分すると
\begin{displaymath}
\dot{\mbox{\boldmath$P$}}(t)\mbox{\boldmath$F$}(t)+\mbox{\bo...
...$}(t)\dot{\mbox{\boldmath$F$}}(t)=\dot{\mbox{\boldmath$G$}}(t)
\end{displaymath} (2.369)

となり、これに(2.372)式の関係を代入すると
    $\displaystyle \dot{\mbox{\boldmath$P$}}(t)\mbox{\boldmath$F$}(t)+\mbox{\boldmat...
...math$B$}\mbox{\boldmath$R$}^{-1}\mbox{\boldmath$B$}^{T}\mbox{\boldmath$G$}(t)\}$  
  $\textstyle =$ $\displaystyle -\mbox{\boldmath$Q$}\mbox{\boldmath$F$}(t)-\mbox{\boldmath$A$}^T\mbox{\boldmath$G$}(t)$  
  $\textstyle =$ $\displaystyle -\mbox{\boldmath$Q$}\mbox{\boldmath$F$}(t)-\mbox{\boldmath$A$}^T\mbox{\boldmath$P$}(t)\mbox{\boldmath$F$}(t)$  

となり、元のリカッチ方程式となる。

したがって(2.373)式より

\begin{displaymath}
\mbox{\boldmath$P$}(t)=\mbox{\boldmath$G$}(t)\mbox{\boldmath$F$}^{-1}(t)
\end{displaymath} (2.370)

がリカッチ方程式の解である。

そこで(2.372)式の同次方程式の遷移マトリックスを


\begin{displaymath}
\Phi(t)=
\left[
\begin{array}{cc}
\Phi_{11}(t)&\Phi_{12}(t)\\
\Phi_{21}(t)&\Phi_{22}(t)
\end{array}\right]
\end{displaymath} (2.371)

とすれば、解は境界条件を考慮して
$\displaystyle \left[
\begin{array}{c}
\mbox{\boldmath$F$}(t)\\
\mbox{\boldmath$G$}(t)
\end{array}\right]$ $\textstyle =$ $\displaystyle \left[
\begin{array}{cc}
\Phi_{11}(t,t_f)&\Phi_{12}(t,t_f)\\
\Ph...
...ray}{c}
\mbox{\boldmath$F$}(t_f)\\
\mbox{\boldmath$G$}(t_f)
\end{array}\right]$  
  $\textstyle =$ $\displaystyle \left[
\begin{array}{c}
\Phi_{11}(t,t_f)+\Phi_{12}(t,t_f)\cdot\mb...
...
\Phi_{21}(t,t_f)+\Phi_{22}(t,t_f)\cdot\mbox{\boldmath$P$}_0
\end{array}\right]$ (2.372)

になる。この時、$t$$t-t_f$に置き換える。したがって(2.376)式より
\begin{displaymath}
\mbox{\boldmath$P$}(t)=[\Phi_{21}(t,t_f)+\Phi_{22}(t,t_f)\mb...
...
[\Phi_{11}(t,t_f)+\Phi_{12}(t,t_f)\mbox{\boldmath$P$}_0]^{-1}
\end{displaymath} (2.373)

となる。もし $\mbox{\boldmath$P$}_0=0$のときは
\begin{displaymath}
\mbox{\boldmath$P$}(t)=\Phi_{21}(t,t_f)\cdot \Phi_{11}^{-1}(t,t_f)
\end{displaymath} (2.374)

になる。(2.379)又は(2.380)式より解が求められる。

$[$$]$

システム方程式

\begin{displaymath}
\dot{x} = - x + u
\end{displaymath} (2.375)

評価関数

\begin{displaymath}
J=\int_{0}^{t_f}(x^{2}+u^{2})dt
\end{displaymath} (2.376)

とした場合の最適制御法則を求める。 上式より

\begin{displaymath}\mbox{\boldmath$A$}=-1,\mbox{\boldmath$B$}=1,\mbox{\boldmath$Q$}=1,\mbox{\boldmath$R$}=1,\mbox{\boldmath$P$}(t)=P(t)\end{displaymath}

となるので、リカッチ微分方程式は
\begin{displaymath}
-\dot{P}(t)=-2P(t)-P^2(t)+1
\end{displaymath} (2.377)

になる。(2.372)式より
\begin{displaymath}
\left[
\begin{array}{c}
\dot{F}(t)\\
\dot{G}(t)
\end{array}...
...right]
\left[
\begin{array}{c}
F(t)\\
G(t)
\end{array}\right]
\end{displaymath} (2.378)

となるので、この式の遷移マトリックス$\Phi(t)$
$\displaystyle \Phi(t)$ $\textstyle =$ $\displaystyle {\cal L}^{-1}\left\{\left(sI-\left[
\begin{array}{cc}
-1 & -1\\
-1 & 1
\end{array}\right]\right)^{-1}\right\}$  
  $\textstyle =$ $\displaystyle {\cal L}^{-1}\left(\left[
\begin{array}{cc}
s+1 & 1\\
1 & s+1
\e...
... & \frac{-1}{s^2-2} \\
\frac{-1}{s^2-2} & \frac{s+1}{s^2-2}
\end{array}\right]$  
  $\textstyle =$ $\displaystyle \frac{1}{2\sqrt{2}}\left[
\begin{array}{c}
(-1+\sqrt{2})e^{\sqrt{...
...+(1+\sqrt{2})e^{-\sqrt{2}t} \\
e^{-\sqrt{2}t}-e^{\sqrt{2}t}
\end{array}\right.$  
    $\displaystyle \hspace{1.5cm}\left.
\begin{array}{c}
e^{-\sqrt{2}t}-e^{\sqrt{2}t} \\
(1+\sqrt{2})e^{\sqrt{2}t}-(1-\sqrt{2})e^{-\sqrt{2}t}
\end{array}\right]$ (2.379)

になる。

境界条件$t=t_f$ $\mbox{\boldmath$P$}(t_f)=\mbox{\boldmath$P$}_0=0$とした場合上式の$t$$(t-t_f)$ に置き換えて、(2.380)式より

$\displaystyle P(t)$ $\textstyle =$ $\displaystyle \Phi_{21}(t,t_f)\cdot \Phi_{11}^{-1}(t,t_f)$  
  $\textstyle =$ $\displaystyle \left\{ \frac{1}{2\sqrt{2}}(e^{-\sqrt{2}(t-t_f)}-e^{\sqrt{2}(t-t_f)})\right\}$  
    $\displaystyle \left\{ \frac{1}{2\sqrt{2}}\left( (\sqrt{2}-1)e^{\sqrt{2}(t-t_f)}+(\sqrt{2}+1)e^{-\sqrt{2}(t-t_f)}\right)\right\}^{-1}$  
  $\textstyle =$ $\displaystyle \frac{e^{-\sqrt{2}(t-t_f)}-e^{\sqrt{2}(t-t_f)}}
{(\sqrt{2}-1)e^{\sqrt{2}(t-t_f)}+(\sqrt{2}+1)e^{-\sqrt{2}(t-t_f)}}$ (2.380)

となる。

ゆえに(2.345)式より

\begin{displaymath}
u_0(x,t)=-\frac{e^{-\sqrt{2}(t-t_f)}-e^{\sqrt{2}(t-t_f)}}
{(\sqrt{2}-1)e^{\sqrt{2}(t-t_f)}+(\sqrt{2}+1)e^{-\sqrt{2}(t-t_f)}}x
\end{displaymath} (2.381)

となる。$t_f\to \infty$ とした場合
\begin{displaymath}
P=\sqrt{2}-1\equiv P_c
\end{displaymath} (2.382)

という定数になる。したがって
\begin{displaymath}
u_0(x)=-(\sqrt{2}-1)x
\end{displaymath} (2.383)

となる。これをブロック線図にしたのが 図2.22 である。

図 2.22: ブロック線図
\begin{figure}\begin{center}
\psbox[scale=0.60]{eps/2-8-4.eps} \end{center} \end{figure}

プロパーな系の最適制御

システム方程式が次のようにプロパー(厳密プロパーでなく)な場合を考える。

$\displaystyle \dot{\mbox{\boldmath$x$}}=\mbox{\boldmath$A$}\mbox{\boldmath$x$}+\mbox{\boldmath$B$}\mbox{\boldmath$u$}$     (2.384)
$\displaystyle \mbox{\boldmath$y$}=\mbox{\boldmath$C$}\mbox{\boldmath$x$}+\mbox{\boldmath$D$}\mbox{\boldmath$u$}$     (2.385)

評価関数を
\begin{displaymath}
J=\int_0^{t_f}(\mbox{\boldmath$y$}^T \mbox{\boldmath$Q$}\mbo...
...mbox{\boldmath$u$}^T \mbox{\boldmath$R$}\mbox{\boldmath$u$})dt
\end{displaymath} (2.386)

とする。 $\mbox{\boldmath$Q$}$は準正定対称、 $\mbox{\boldmath$R$}$は正定対称行列とする。上式に(2.391) 式を適用すると
\begin{displaymath}
J=\int_0^{t_f}[\mbox{\boldmath$x$}^T\mbox{\boldmath$C$}^T \m...
...^T\mbox{\boldmath$Q$}\mbox{\boldmath$C$}\mbox{\boldmath$x$}]dt
\end{displaymath} (2.387)

となる。ここで
$\displaystyle \bar{\mbox{\boldmath$Q$}}\equiv\mbox{\boldmath$C$}^T\mbox{\boldmath$Q$}\mbox{\boldmath$C$}$     (2.388)
$\displaystyle \bar{\mbox{\boldmath$R$}}\equiv\mbox{\boldmath$R$}+\mbox{\boldmath$D$}^T\mbox{\boldmath$Q$}\mbox{\boldmath$D$}$     (2.389)
$\displaystyle \bar{\mbox{\boldmath$S$}}\equiv\mbox{\boldmath$C$}^T\mbox{\boldmath$Q$}\mbox{\boldmath$D$}$     (2.390)

とおくと、(2.393)式は
\begin{displaymath}
J=\int_0^{t_f}[\mbox{\boldmath$x$}^T\bar{\mbox{\boldmath$Q$}...
...oldmath$u$}^T\bar{\mbox{\boldmath$S$}}^T\mbox{\boldmath$x$}]dt
\end{displaymath} (2.391)

になる。(2.326)式より
\begin{displaymath}
H(\mbox{\boldmath$x$},\mbox{\boldmath$u$},\nabla\mbox{\boldm...
...{\boldmath$u$}^T\bar{\mbox{\boldmath$S$}}^T\mbox{\boldmath$x$}
\end{displaymath} (2.392)

となり、(2.311)式に適用して、
\begin{displaymath}
\frac{\partial H}{\partial \mbox{\boldmath$u$}}=\mbox{\boldm...
...oldmath$u$}+
2\bar{\mbox{\boldmath$S$}}^T\mbox{\boldmath$x$}=0
\end{displaymath} (2.393)

より
\begin{displaymath}
\mbox{\boldmath$u$}_0=-\frac{1}{2}\bar{\mbox{\boldmath$R$}}^...
...\boldmath$v$}+2\bar{\mbox{\boldmath$S$}}^T\mbox{\boldmath$x$}]
\end{displaymath} (2.394)

を得る。(2.400)式を(2.398)式に代入すると、
$\displaystyle H(\mbox{\boldmath$x$},\nabla\mbox{\boldmath$v$},t)$ $\textstyle =$ $\displaystyle \nabla\mbox{\boldmath$v$}^T\mbox{\boldmath$A$}\mbox{\boldmath$x$}...
...\boldmath$v$}+\mbox{\boldmath$x$}^T\bar{\mbox{\boldmath$Q$}}\mbox{\boldmath$x$}$  
    $\displaystyle -\mbox{\boldmath$x$}^T \bar{\mbox{\boldmath$S$}}\bar{\mbox{\boldm...
...B$}\bar{\mbox{\boldmath$R$}}^{-1}\bar{\mbox{\boldmath$S$}}^T\mbox{\boldmath$x$}$ (2.395)

となる。$t_f=\infty$の場合ハミルトン・ヤコビの式は
\begin{displaymath}
\nabla\mbox{\boldmath$v$}^T(\mbox{\boldmath$A$}-\mbox{\boldm...
...ath$R$}}^{-1}\bar{\mbox{\boldmath$S$}}^T)\mbox{\boldmath$x$}=0
\end{displaymath} (2.396)

になる。ここで(2.389)式と同様
\begin{displaymath}
\nabla\mbox{\boldmath$v$}=\frac{\partial V}{\partial \mbox{\boldmath$x$}}=2\mbox{\boldmath$P$}\mbox{\boldmath$x$}
\end{displaymath} (2.397)

とおくと、
\begin{displaymath}
2\mbox{\boldmath$x$}^T\mbox{\boldmath$P$}(\mbox{\boldmath$A$...
...ath$R$}}^{-1}\bar{\mbox{\boldmath$S$}}^T)\mbox{\boldmath$x$}=0
\end{displaymath} (2.398)

となり、左辺の第1項を(2.342)式と同様の方法で分けると
    $\displaystyle \mbox{\boldmath$x$}^T[\mbox{\boldmath$P$}(\mbox{\boldmath$A$}-\mb...
...dmath$B$}\bar{\mbox{\boldmath$R$}}^{-1}\mbox{\boldmath$B$}^T\mbox{\boldmath$P$}$  
    $\displaystyle \hspace{2cm} {}+(\bar{\mbox{\boldmath$Q$}}-\bar{\mbox{\boldmath$S...
...ar{\mbox{\boldmath$R$}}^{-1}\bar{\mbox{\boldmath$S$}}^T)]\mbox{\boldmath$x$}
=0$ (2.399)

になり、任意の $\mbox{\boldmath$x$}$ に対し上式が成立するには
    $\displaystyle \mbox{\boldmath$P$}(\mbox{\boldmath$A$}-\mbox{\boldmath$B$}\bar{\...
...dmath$B$}\bar{\mbox{\boldmath$R$}}^{-1}\mbox{\boldmath$B$}^T\mbox{\boldmath$P$}$  
    $\displaystyle \hspace{2cm} {}+(\bar{\mbox{\boldmath$Q$}}-\bar{\mbox{\boldmath$S$}}\bar{\mbox{\boldmath$R$}}^{-1}\bar{\mbox{\boldmath$S$}}^T)=0$ (2.400)

が満たされればよい。これがリッカチ型の代数方程式である。 この式の解 $\mbox{\boldmath$P$}$ を用い、(2.400)式より
\begin{displaymath}
\mbox{\boldmath$u$}_0=-\frac{1}{2}\bar{\mbox{\boldmath$R$}}^...
...{\boldmath$P$}+\bar{\mbox{\boldmath$S$}}^T]\mbox{\boldmath$x$}
\end{displaymath} (2.401)

が得られ最適フィード・バックゲインは
\begin{displaymath}
\mbox{\boldmath$K$}=\bar{\mbox{\boldmath$R$}}^{-1}[\mbox{\boldmath$B$}^T\mbox{\boldmath$P$}+\bar{\mbox{\boldmath$S$}}^T]
\end{displaymath} (2.402)

となる。

このことは

\begin{displaymath}\mbox{\boldmath$A$}\to (\mbox{\boldmath$A$}-\mbox{\boldmath$B$}\bar{\mbox{\boldmath$R$}}^{-1}\bar{\mbox{\boldmath$S$}}^T)\end{displaymath}

とし、評価関数を
\begin{displaymath}
\int_0^{\infty}[\mbox{\boldmath$x$}(t)^T(\bar{\mbox{\boldmat...
...}(t)^T\bar{\mbox{\boldmath$R$}}\bar{\mbox{\boldmath$u$}}(t)]dt
\end{displaymath} (2.403)

とした場合のレギュレータ問題と等しい。ただし
$\bar{\mbox{\boldmath$u$}}(t)=\mbox{\boldmath$u$}(t)+\bar{\mbox{\boldmath$R$}}(t)^{-1}\bar{\mbox{\boldmath$S$}}^T\mbox{\boldmath$x$}(t)$ である。なお(2.409)式は次のように表示することもできる。
\begin{displaymath}
\mbox{\boldmath$P$}\mbox{\boldmath$A$}+\mbox{\boldmath$A$}^T...
...h$P$}+\bar{\mbox{\boldmath$S$}}^T)+\bar{\mbox{\boldmath$Q$}}=0
\end{displaymath} (2.404)

$[$$]$
\begin{displaymath}
\dot{\mbox{\boldmath$x$}}=\left[
\begin{array}{cc}
0&0\\
1&...
...\begin{array}{c}
1\\
1
\end{array}\right] \mbox{\boldmath$u$}
\end{displaymath} (2.405)


\begin{displaymath}
\mbox{\boldmath$y$}=\left[
\begin{array}{cc}
1&0\\
0&1
\end...
...
\begin{array}{c}
1\\
0
\end{array}\right]\mbox{\boldmath$u$}
\end{displaymath} (2.406)

かつ

\begin{displaymath}
\mbox{\boldmath$Q$}=\left[\begin{array}{cc}
1&0\\
0&1
\end{array} \right] \quad , \quad
\mbox{\boldmath$R$}=1
\end{displaymath}

の場合、(2.394)$\sim$(2.396)式より

\begin{displaymath}\bar{\mbox{\boldmath$Q$}}=
\left[
\begin{array}{cc}
1&0\\
0&...
...ldmath$S$}}=
\left[
\begin{array}{c}
1\\
0
\end{array}\right]
\end{displaymath}

を得る。したがって

\begin{displaymath}
\mbox{\boldmath$A$}-\mbox{\boldmath$B$}\bar{\mbox{\boldmath$...
...^T=
\left[
\begin{array}{cc}
-0.5&0\\
0.5&0
\end{array}\right]\end{displaymath}


\begin{displaymath}
\bar{\mbox{\boldmath$Q$}}-\bar{\mbox{\boldmath$S$}}\bar{\mbo...
...$}}^T=
\left[
\begin{array}{cc}
0.5&0\\
0&1
\end{array}\right]\end{displaymath}

となり、これらを(2.406)式に代入すると
$\displaystyle \left[
\begin{array}{cc}
-0.5p_{11}+0.5p_{12}&0\\
-0.5p_{12}+0.5p_{22}&0
\end{array}\right]$      
$\displaystyle +
\left[
\begin{array}{cc}
-0.5p_{11}+0.5p_{12}&-0.5p_{12}+0.5p_{22}\\
0&0
\end{array}\right]$      
$\displaystyle -\left[
\begin{array}{cc}
\frac{1}{2}(p_{11}+p_{12})^2&
\frac{1}{...
...(p_{11}+p_{12})(p_{12}+p_{22})&
\frac{1}{2}(p_{12}+p_{22})^2
\end{array}\right]$      
$\displaystyle +
\left[
\begin{array}{cc}
0.5&0\\
0&1
\end{array}\right]
=0$      

になる。ゆえに
$\displaystyle (-p_{11}+p_{12})-\frac{1}{2}(p_{11}+p_{12})^2+0.5=0$     (2.407)
$\displaystyle (-p_{12}+p_{22})-(p_{11}+p_{12})(p_{12}+p_{22})=0$     (2.408)
$\displaystyle \frac{1}{2}(p_{12}+p_{22})^2=1$     (2.409)

の関係を得る。

(2.416)式より

\begin{displaymath}
p_{12}+p_{22}=\sqrt{2}
\end{displaymath} (2.410)

これを(2.415)式に代入すると
\begin{displaymath}
(\sqrt{2}-2p_{12})-(p_{11}+p_{12})\sqrt{2}=0
\end{displaymath} (2.411)

(2.417),(2.418)式を用いて、$p_{22}$及び$p_{11}$$p_{12}$ で表し、これを(2.414)式に代入し、整理すると
\begin{displaymath}
p_{12}^2-2(1+\sqrt{2})p_{12}+1=0
\end{displaymath} (2.412)

になり、これを解いて$p_{12}$を求め、(2.417),(2.418)式より $p_{11},p_{22}$を求め、 $\mbox{\boldmath$P$}$が正定であるようにすると
\begin{displaymath}
\mbox{\boldmath$P$}=
\left[
\begin{array}{cc}
0.472&0.222\\
0.22&1.194
\end{array}\right]
\end{displaymath} (2.413)

を得る。したがって(2.408)式より
$\displaystyle \mbox{\boldmath$K$}$ $\textstyle =$ $\displaystyle \frac{1}{2}\left[
[\begin{array}{cc}
1&1
\end{array}]
\left[\begi...
...2\\
0.22&1.194
\end{array}\right]
+[\begin{array}{cc}
1&0
\end{array}]
\right]$  
  $\textstyle =$ $\displaystyle \frac{1}{2}
[\begin{array}{cc}
1.692&1.414
\end{array}]
=[\begin{array}{cc}
0.846&0.707
\end{array}]$ (2.414)

がフィードバックゲインとなる。


next up previous
Next: 追値制御系の最適制御 Up: 最適制御法則 Previous: ハミルトン・ヤコビの方法 (Hamilton-Jacobi)
Yasunari SHIDAMA
平成15年5月12日