next up previous
Next: モデル追随問題 Up: 追値制御系の最適制御 Previous: 評価関数

サーボ問題

目標値 $\tilde{\mbox{\boldmath$y$}}$が次の状態方程式で表されるものとする。 ただし初期値は $\mbox{\boldmath$z$}(0)$である。

$\displaystyle \left\{
\begin{array}{l}
\dot{\mbox{\boldmath$z$}}=\mbox{\boldmat...
...\mbox{\boldmath$y$}}=\mbox{\boldmath$H$}\mbox{\boldmath$z$}
\end{array}\right .$     (2.439)

またシステム方程式は(2.422)式、評価関数は(2.445)式であるとする。

いま状態 $\mbox{\boldmath$z$}$はすべて可観測であるとし、システムの状態変数 $\mbox{\boldmath$x$}$と 目標値の状態変数 $\mbox{\boldmath$z$}$を含めた新しい状態変数を $\hat{\mbox{\boldmath$x$}}$とする。 そのとき

\begin{displaymath}
\hat{\mbox{\boldmath$x$}}=\left[
\begin{array}{c}
\mbox{\boldmath$x$}\\
\mbox{\boldmath$z$}
\end{array}
\right]
\end{displaymath} (2.440)

で表され、新しいマトリックスとして
$\displaystyle \left.\begin{array}{c}
\hat{\mbox{\boldmath$A$}}=
\left[
\begin{a...
...{\boldmath$C$}^T)^{-1}\mbox{\boldmath$H$}
\end{array}\right]
\end{array}\right.$      

を用いる。このようにした場合新しい状態方程式は
$\displaystyle \dot{\hat{\mbox{\boldmath$x$}}}$ $\textstyle =$ $\displaystyle \left[
\begin{array}{c}
\dot{\mbox{\boldmath$x$}}\\
\dot{\mbox{\...
...in{array}{c}
\mbox{\boldmath$B$}  \
0
\end{array}\right]
\mbox{\boldmath$u$}$  
  $\textstyle =$ $\displaystyle \hat{\mbox{\boldmath$A$}}\hat{\mbox{\boldmath$x$}}+\hat{\mbox{\boldmath$B$}}\mbox{\boldmath$u$}$ (2.441)

となり評価関数は
$\displaystyle \hat{\mbox{\boldmath$x$}}^{T}\hat{\mbox{\boldmath$Q$}}\hat{\mbox{\boldmath$x$}}$      
  $\textstyle =$ $\displaystyle \left[ \begin{array}{cc}
\mbox{\boldmath$x$}^T&\mbox{\boldmath$z$...
...{\boldmath$C$}^T)^{-1}\mbox{\boldmath$C$}\mbox{\boldmath$Q$}
\end{array}\right.$  
    $\displaystyle \hspace{2cm}\left.\begin{array}{c}
-\mbox{\boldmath$Q$}\mbox{\bol...
...[\begin{array}{c}
\mbox{\boldmath$x$}\\
\mbox{\boldmath$z$}
\end{array}\right]$  
  $\textstyle =$ $\displaystyle [\begin{array}{cc}
\mbox{\boldmath$x$}^T&\mbox{\boldmath$z$}^T
\end{array}] \cdot$  
    $\displaystyle \left[\begin{array}{c}
\mbox{\boldmath$Q$}\mbox{\boldmath$x$}-\mb...
...\boldmath$C$}\mbox{\boldmath$Q$}\tilde{\mbox{\boldmath$x$}}
\end{array} \right]$  
  $\textstyle =$ $\displaystyle \mbox{\boldmath$x$}^T\mbox{\boldmath$Q$}(\mbox{\boldmath$x$}-\til...
...math$x$}}^T\mbox{\boldmath$Q$}(\mbox{\boldmath$x$}-\tilde{\mbox{\boldmath$x$}})$  
  $\textstyle =$ $\displaystyle (\mbox{\boldmath$x$}-\tilde{\mbox{\boldmath$x$}})^T \mbox{\boldmath$Q$}(\mbox{\boldmath$x$}-\tilde{\mbox{\boldmath$x$}})$ (2.442)

を(2.445)式に代入して
\begin{displaymath}
J=\int_{0}^{t_f}\{\mbox{\boldmath$u$}^T\mbox{\boldmath$R$}\m...
...x$}}^{T}\hat{\mbox{\boldmath$Q$}}\hat{\mbox{\boldmath$x$}}\}dt
\end{displaymath} (2.443)

を得る。(2.449)式のシステム方程式、(2.451)式の評価関数は レギュレータ問題と同じ形であり
\begin{displaymath}
\mbox{\boldmath$u$}_0=-\mbox{\boldmath$R$}^{-1}\hat{\mbox{\b...
...$B$}}^{T}\hat{\mbox{\boldmath$P$}}(t)\hat{\mbox{\boldmath$x$}}
\end{displaymath} (2.444)

と置けば $\hat{\mbox{\boldmath$P$}}(t)$は次のリカッチ方程式の解として求められる。
\begin{displaymath}
-\dot{\hat{\mbox{\boldmath$P$}}}=\hat{\mbox{\boldmath$P$}}(t...
...$}}^{T}\hat{\mbox{\boldmath$P$}}(t)+
\hat{\mbox{\boldmath$Q$}}
\end{displaymath} (2.445)

ただし $\hat{\mbox{\boldmath$P$}}(t_f)=0$
ここで
\begin{displaymath}
\hat{P}(t)=
\left[
\begin{array}{cc}
\mbox{\boldmath$P$}&\mb...
...oldmath$P$}_{21}&\mbox{\boldmath$P$}_{22}
\end{array}
\right]
\end{displaymath} (2.446)

と置けば(2.453)式は分解して
\begin{displaymath}
\left\{
\begin{array}{l}
-\dot{\mbox{\boldmath$P$}}=\mbox{\b...
...ox{\boldmath$C$}^T)^{-1}\mbox{\boldmath$H$}
\end{array}\right.
\end{displaymath} (2.447)

となり、各式を解いて $\mbox{\boldmath$P$},\mbox{\boldmath$P$}_{21},\mbox{\boldmath$P$}_{22}$を求めることができる。 (2.452)式に(2.464)式を代入すれば
$\displaystyle \mbox{\boldmath$u$}_0$ $\textstyle =$ $\displaystyle -\mbox{\boldmath$R$}^{-1}\mbox{\boldmath$B$}^{T}\mbox{\boldmath$P...
...$R$}^{-1}\mbox{\boldmath$B$}^{T}\mbox{\boldmath$P$}_{21}^{T}\mbox{\boldmath$z$}$  
  $\textstyle \equiv$ $\displaystyle -\mbox{\boldmath$K$}\mbox{\boldmath$x$}+\mbox{\boldmath$K$}_{1}\mbox{\boldmath$z$}$ (2.448)

が得られ、 $\mbox{\boldmath$K$}$がフィードバックゲイン、 $\mbox{\boldmath$K$}_{1}$が フィードフォワードゲインとなる。

このことは図2.23(a)で示すシステムを(b)で示すように目標値発生系を 等価システムの中に含めたものとして、レギュレータ問題として取り扱ったことを 意味している。

図 2.23:
\begin{figure}\begin{center}
\psbox[scale=0.60]{eps/2-9-1.eps} \end{center} \end{figure}

$t_f=\infty$のときは(2.453)式の左辺を$0$として $\hat{\mbox{\boldmath$P$}}$を求める。 このときは $\hat{\mbox{\boldmath$P$}}$は定数となる。
$[$$]$

システム方程式

\begin{displaymath}
\left\{
\begin{array}{l}
\dot{\mbox{\boldmath$x$}}=
\left[
\...
...
\end{array}
\right]
\mbox{\boldmath$x$}
\end{array}\right .
\end{displaymath} (2.449)

目標発生源方程式
\begin{displaymath}
\left\{
\begin{array}{cc}
\dot{\mbox{\boldmath$z$}}=
\left[
...
...
\end{array}
\right]
\mbox{\boldmath$z$}
\end{array}\right .
\end{displaymath} (2.450)

評価関数
\begin{displaymath}
J==\int_{0}^{\infty}[4(y-\tilde{y})^2+\mbox{\boldmath$u$}^{2}]dt
\end{displaymath} (2.451)

の場合の最適追値制御系を求める。

この場合

\begin{displaymath}
\begin{array}{ccc}
\mbox{\boldmath$A$}=
\left[
\begin{array}...
...c}
1&0
\end{array}
\right]
&
\mbox{\boldmath$R$}=1
\end{array}\end{displaymath}

であり、 $\mbox{\boldmath$Q$}_2=4$であるから

\begin{displaymath}\mbox{\boldmath$Q$}=\mbox{\boldmath$C$}^T\mbox{\boldmath$Q$}_...
...$C$}=
\left[
\begin{array}{cc}
4&0\\
0&0
\end{array}
\right]
\end{displaymath}

になる。
\begin{displaymath}
\mbox{\boldmath$P$}\mbox{\boldmath$A$}+\mbox{\boldmath$A$}^T...
...box{\boldmath$B$}^{T}\mbox{\boldmath$P$}+\mbox{\boldmath$Q$}=0
\end{displaymath} (2.452)

の解は(2.369)式より

\begin{displaymath}\mbox{\boldmath$P$}=
\left[
\begin{array}{cc}
4&2\\
2&2
\end{array}
\right]
\end{displaymath}

である。いま

\begin{displaymath}\mbox{\boldmath$P$}_{21}=
\left[
\begin{array}{cc}
\bar{p}_{11}&\bar{p}_{12}\\
\bar{p}_{21}&\bar{p}_{22}
\end{array}
\right]
\end{displaymath}

とすると
$\displaystyle {\mbox{\boldmath$P$}_{21}\mbox{\boldmath$A$}+\mbox{\boldmath$G$}^...
...\boldmath$C$}\mbox{\boldmath$C$}^T)^{-1}\mbox{\boldmath$C$}\mbox{\boldmath$Q$}}$
    $\displaystyle =
\left[
\begin{array}{cc}
0&\bar{p}_{11}\\
0&\bar{p}_{21}
\end{...
...\
(\bar{p}_{11}-2\bar{p}_{21})&(\bar{p}_{12}-2\bar{p}_{22})
\end{array}\right]$  
    $\displaystyle -
\left[
\begin{array}{cc}
2\bar{p}_{12}&2\bar{p}_{12}\\
2\bar{p...
...22}
\end{array}\right]
-
\left[
\begin{array}{cc}
4&0\\
0&0
\end{array}\right]$  
    $\displaystyle =0$ (2.453)

となるので
\begin{displaymath}
\left\{
\begin{array}{l}
-2\bar{p}_{12}-4=0\\
\bar{p}_{11}-...
...+\bar{p}_{12}-2\bar{p}_{22}-2\bar{p}_{22}=0
\end{array}\right.
\end{displaymath} (2.454)

より
\begin{displaymath}
\mbox{\boldmath$P$}_{21}=
\left[
\begin{array}{cc}
-4&-2\\
-1.2&-0.8
\end{array}
\right]
\end{displaymath} (2.455)

が得られる。ゆえに(2.456)式より
\begin{displaymath}
\left.\begin{array}{c}
\mbox{\boldmath$K$}=\mbox{\boldmath$R...
...egin{array}{cc}
2&0.8
\end{array}
\right]
\end{array}\right\}
\end{displaymath} (2.456)

となる。
2.24はこのようにして構成した制御系の目標値に対する追随状況を示している。
図 2.24:
\begin{figure}\begin{center}
\psbox[scale=0.90]{eps/2-9-2.eps} \end{center} \end{figure}


next up previous
Next: モデル追随問題 Up: 追値制御系の最適制御 Previous: 評価関数
Yasunari SHIDAMA
平成15年5月12日