next up previous
Next: 最適制御法則 Up: 最適制御理論 Previous: 最終状態指定の場合

一般的な最適制御

前項の方法を、より一般的にした場合であって、最終条件を指定せず評価の対象として 評価関数の中に含めるような形(Bolza形)にした場合である。

すなわち、$S[x(t_f),t_f]$を最終条件の関数とし、評価関数を

\begin{displaymath}
J = \int^{t_f}_{t_i} L(\mbox{\boldmath$x$},\mbox{\boldmath$u$},t) d t + S[\mbox{\boldmath$x$}(t_f),t_f]
\end{displaymath} (2.230)

とする。初期値 $\mbox{\boldmath$x$}(t_i),t_i$ は指定されているので、上式第2項を 積分の中にいれ、それに全微分を適用すると、
$\displaystyle J$ $\textstyle =$ $\displaystyle \int^{t_f}_{t_i} \left[ L(\mbox{\boldmath$x$},\mbox{\boldmath$u$},t)
+ \frac{d S(\mbox{\boldmath$x$},t)}{d t}
\right] d t$  
  $\textstyle =$ $\displaystyle \int^{t_f}_{t_i} \left[ L(\mbox{\boldmath$x$},\mbox{\boldmath$u$}...
...h$x$}}
+ \frac{\partial S(\mbox{\boldmath$x$},t)}{\partial t}
\right] d t\qquad$ (2.231)

になる。この場合は、前項の(2.176)式の代りに、補助関数は
$\displaystyle V$ $\textstyle =$ $\displaystyle \int^{t_f}_{t_i} \left[ L(\mbox{\boldmath$x$},\mbox{\boldmath$u$}...
...)}
{\partial \mbox{\boldmath$x$}} \right \}^T \dot{\mbox{\boldmath$x$}}
\right.$  
    $\displaystyle \left. + \frac{\partial S(\mbox{\boldmath$x$},t)}{\partial t}
+ \...
...math$u$},t)
- \mbox{\boldmath$\lambda$}^T \dot{\mbox{\boldmath$x$}}
\right] d t$  
  $\textstyle \equiv$ $\displaystyle \int^{t_f}_{t_i} L'(\mbox{\boldmath$x$},\dot{\mbox{\boldmath$x$}},t)d t$ (2.232)

となる。

図 2.18:
\begin{figure}\begin{center}
\psbox[scale=0.80]{eps/2-7-4.eps} \end{center} \end{figure}

2.18に示す如く、 $\mbox{\boldmath$x$},\dot{\mbox{\boldmath$x$}},t_1$ という軌道を通った場合と、 $\mbox{\boldmath$x$} + \varepsilon(\delta \mbox{\boldmath$x$}),
\dot{\mbox{\bold...
...\varepsilon(\delta \dot{\mbox{\boldmath$x$}})
,t_1 + \varepsilon \cdot \delta t$ という軌道を通った場合の補助関数の差を $\Delta V$ としたとき、これが0となる場合が極値となる。

すなわち

$\displaystyle \Delta V$ $\textstyle =$ $\displaystyle \int^{t_1 + \varepsilon \cdot \delta t}_{t_i}
L' [ (\mbox{\boldma...
...x{\boldmath$x$}} + \varepsilon \cdot \delta \dot{\mbox{\boldmath$x$}})
,t ] d t$  
    $\displaystyle - \int^{t_1}_{t_i} L' [ \mbox{\boldmath$x$},\dot{\mbox{\boldmath$x$}},t] d t$  
  $\textstyle =$ $\displaystyle \int^{t_1}_{t_i}
[ L' \{ (\mbox{\boldmath$x$} + \varepsilon \cdot...
...oldmath$x$}})
,t \}
- L'(\mbox{\boldmath$x$},\dot{\mbox{\boldmath$x$}},t) ] d t$  
    $\displaystyle + \int^{t_1 + \varepsilon \cdot \delta t}_{t_i}
L' [ (\mbox{\bold...
...x{\boldmath$x$}} + \varepsilon \cdot \delta \dot{\mbox{\boldmath$x$}})
,t ] d t$  

となる。上式にTaylor展開を適用すると
$\displaystyle \Delta V(\varepsilon)$ $\textstyle =$ $\displaystyle \int^{t_1}_{t_i}
[ \varepsilon \frac{\partial L'}
{\partial \mbox...
...lta \dot{\mbox{\boldmath$x$}}
+ (\varepsilon^2,\varepsilon^3,\cdots,の項)
] d t$  
    $\displaystyle + \int^{t_1 + \varepsilon \cdot \delta t}_{t_i}
[ L'(\mbox{\boldm...
...rtial L'}
{\partial \dot{\mbox{\boldmath$x$}}}
\delta \dot{\mbox{\boldmath$x$}}$  
    $\displaystyle \hspace{4.0cm} + (\varepsilon^2,\varepsilon^3,\cdots,の項)
] d t$  

のようになり、極値となる条件は
$\displaystyle \left. \frac{\partial(\Delta V)}
{\partial \varepsilon} \right\vert _{\varepsilon=0}$ $\textstyle =$ $\displaystyle \int^{t_1}_{t_i} \left[ \frac{\partial L'}
{\partial \mbox{\boldm...
...partial \dot{\mbox{\boldmath$x$}}} \delta \dot{\mbox{\boldmath$x$}}
\right] d t$  
    $\displaystyle + \frac{\partial}{\partial \varepsilon} [
\varepsilon \cdot \delt...
...ldmath$x$},\dot{\mbox{\boldmath$x$}},t)
]_{\stackrel{\varepsilon = 0}{t = t_1}}$  
    $\displaystyle + \left[ \int^{t_1+\varepsilon \delta t}_{t_i} \left( \frac{\part...
...th$x$}}}
\delta \dot{\mbox{\boldmath$x$}} \right) d t
\right]_{\varepsilon = 0}$  
  $\textstyle =$ $\displaystyle \int^{t_1}_{t_i} \left[ \frac{\partial L'}
{\partial \mbox{\boldm...
...partial \dot{\mbox{\boldmath$x$}}} \delta \dot{\mbox{\boldmath$x$}}
\right] d t$  
    $\displaystyle + [ L'(\mbox{\boldmath$x$},\dot{\mbox{\boldmath$x$}},t) \cdot \delta t ]_{t = t_1} = 0$  

である。

上式の被積分関数の第2項に(2.182)式の部分積分を適用すると、

  $\textstyle \int^{t_1}_{t_i} \left[ \frac{\partial L'}{\partial \mbox{\boldmath$...
... L'(\mbox{\boldmath$x$},\dot{\mbox{\boldmath$x$}},t) \cdot \delta t ]_{t = t_1}$    
  $\textstyle = 0$   (2.233)

となる。

2ー18図より

\begin{displaymath}
\varepsilon \cdot \delta \mbox{\boldmath$x$}(t_1 + \varepsil...
...1)
+ \dot{\mbox{\boldmath$x$}}(t_1) \cdot \varepsilon \delta t
\end{displaymath} (2.234)

の関係があり、かつ $\delta \mbox{\boldmath$x$}(t_i) = 0$ ゆえ(2.236)式は
$\displaystyle { \int^{t_1}_{t_i} \left[ \frac{\partial L'}{\partial \mbox{\bold...
...ot{\mbox{\boldmath$x$}}} \right) \right]
\delta \mbox{\boldmath$x$} \cdot d t }$
    $\displaystyle + \frac{\partial L'}
{\partial \dot{\mbox{\boldmath$x$}}}
( \delt...
...) \delta t )
+ [ L'(\mbox{\boldmath$x$},\dot{\mbox{\boldmath$x$}},t) \delta t ]$  
  $\textstyle =$ $\displaystyle \int^{t_1}_{t_i} \left[ \frac{\partial L'}{\partial \mbox{\boldma...
...t{\mbox{\boldmath$x$}}}
\delta \mbox{\boldmath$x$} (t_1 + \varepsilon \delta t)$  
    $\displaystyle + \left[ \{ L'(\mbox{\boldmath$x$},\dot{\mbox{\boldmath$x$}},t)
-...
...{\boldmath$x$}}}
\dot{\mbox{\boldmath$x$}}(t) \} \delta t
\right]_{t = t_1} = 0$ (2.235)

になる。
\begin{displaymath}
\frac{\partial L'}{\partial \dot{\mbox{\boldmath$x$}}}
= \le...
... \mbox{\boldmath$x$}} \right\}^T - \mbox{\boldmath$\lambda$}^T
\end{displaymath} (2.236)

ゆえ(2.238)式は
    $\displaystyle \int^{t_1}_{t_i} \left[ \frac{\partial L'}{\partial \mbox{\boldma...
...rtial \dot{\mbox{\boldmath$x$}}} \right) \right]
\delta \mbox{\boldmath$x$} d t$  
    $\displaystyle + \left[ \left\{ \frac{\partial S(\mbox{\boldmath$x$},t)}
{\parti...
...\}^T
- \lambda^T \right]
\delta \mbox{\boldmath$x$}(t_1 + \varepsilon \delta t)$  
    $\displaystyle + \left[ \left\{L(\mbox{\boldmath$x$},\mbox{\boldmath$u$},t)
+ \l...
...l S(\mbox{\boldmath$x$},t)}
{\partial t}\right\} \delta t
\right]_{t = t_1} = 0$  

となる。 $\varepsilon \rightarrow 0$ ゆえ、 $t_1 = t_1 + \varepsilon \delta t
\equiv t_f$ とし、かつ上式が任意の $\delta \mbox{\boldmath$x$}(t_f),\delta t_f$ のとき 成立するには
    $\displaystyle \frac{\partial L'}{\partial \mbox{\boldmath$x$}}
- \frac{d}{dt} \left ( \frac{\partial L'}
{\partial \dot{\mbox{\boldmath$x$}}}
\right ) = 0$ (2.237)
    $\displaystyle \left[ \left \{ \frac{\partial S(\mbox{\boldmath$x$},t)}
{\partia...
...x{\boldmath$x$}} - \lambda
\right \}^T \delta \mbox{\boldmath$x$}
\right]_{t_f}$  
    $\displaystyle + \left[ \left \{ H(\mbox{\boldmath$x$},\mbox{\boldmath$\lambda$}...
...ial S(\mbox{\boldmath$x$},t)}
{\partial t}
\right \} \delta t \right]_{t_f} = 0$ (2.238)

でなければならない。前者はオイラー方程式であり、後者は横断性
(Transervality Condition)の条件という。

$\mbox{\boldmath$u$}$ に関するオイラー方程式も前項と同様に成立するので

\begin{displaymath}
\left \{ \begin{array}{l}
\dot{\mbox{\boldmath$\lambda$}} =...
...t)}
{\partial \mbox{\boldmath$\lambda$}}
\end{array} \right.
\end{displaymath} (2.239)

の各式が成立する。

以上より、最適制御を求める手順としては、
(第1段階)

\begin{displaymath}
H(\mbox{\boldmath$x$},\mbox{\boldmath$u$},\mbox{\boldmath$\l...
...\mbox{\boldmath$f$}(\mbox{\boldmath$x$},\mbox{\boldmath$u$},t)
\end{displaymath} (2.240)

を作る。
(第2段階)
$H(\mbox{\boldmath$x$},\mbox{\boldmath$u$},\mbox{\boldmath$\lambda$},t)$ を最小にする $\mbox{\boldmath$u$}$ を求め、
\begin{displaymath}
\mbox{\boldmath$u$}_0 = \mbox{\boldmath$u$}_0(\mbox{\boldmath$x$},\mbox{\boldmath$\lambda$},t)
\end{displaymath} (2.241)

とする。
(第3段階)
最適 $H$ 関数
\begin{displaymath}
H_0(\mbox{\boldmath$x$},\mbox{\boldmath$\lambda$},t) = H(\mb...
...\boldmath$x$},\mbox{\boldmath$u$},\mbox{\boldmath$\lambda$},t)
\end{displaymath} (2.242)

を求める。
(第4段階)
    $\displaystyle \dot{\mbox{\boldmath$x$}} = \frac{\partial H_0(\mbox{\boldmath$x$},\mbox{\boldmath$\lambda$},t)}
{\partial \mbox{\boldmath$\lambda$}}$ (2.243)
    $\displaystyle \dot{\mbox{\boldmath$\lambda$}} = - \frac{\partial H_0(\mbox{\boldmath$x$},\mbox{\boldmath$\lambda$},t)}
{\partial \mbox{\boldmath$x$}}$ (2.244)

を初期条件及び最終条件、又は次の横断性の条件によって解く。
\begin{displaymath}
\left[ \left\{ \frac{\partial S(\mbox{\boldmath$x$},t)}
{\p...
...math$x$},t)}
{\partial t}
\right\}\delta t \right]_{t_f} = 0
\end{displaymath} (2.245)

この場合、最終条件 $\mbox{\boldmath$x$}(t_f),t_f$ が指定されている場合は $\delta \mbox{\boldmath$x$}(t_f) = 0, \\
\delta_{t_f} = 0$ であり、また指定されていないときは
    $\displaystyle \left[ \frac{\partial S(\mbox{\boldmath$x$},t)}{\partial \mbox{\boldmath$x$}} - \mbox{\boldmath$\lambda$}
\right]_{t_f} = 0$ (2.246)
    $\displaystyle \left[ H_0(\mbox{\boldmath$x$},\mbox{\boldmath$\lambda$},t) + \fr...
...tial S(\mbox{\boldmath$x$},t)}
{\partial \mbox{\boldmath$x$}}
\right]_{t_f} = 0$ (2.247)

である。
(第5段階)

以上の結果を $\mbox{\boldmath$u$}_0$の式に代入して最適制御を得る。
[例1]

システム方程式

\begin{displaymath}
\dot{x} = -2 \sqrt{2} x + u
\end{displaymath} (2.248)

評価関数
\begin{displaymath}
J = \int^{1}_{0} (x^2 + u^2) d t
\end{displaymath} (2.249)

$t = 0$ の時 $x(0) = 2$ 、最終時間 $t = 1$ でその時の状態は自由とする。
(第1段階)
\begin{displaymath}
H = \lambda(-2 \sqrt{2} x + u) + (x^2 + u^2)
\end{displaymath} (2.250)

(第2段階)
    $\displaystyle \frac{\partial H}{\partial u} = \lambda + 2 u =0$ (2.251)
    $\displaystyle u_{0} = - \frac{\lambda}{2}$ (2.252)

(第3段階)
\begin{displaymath}
H_0 = -2 \sqrt{2} \lambda x - \frac{\lambda^2}{4} + x^2
\end{displaymath} (2.253)

(第4段階)
    $\displaystyle \dot{x} = -2 \sqrt{2} x - \frac{\lambda^2}{2}$ (2.254)
    $\displaystyle \dot{\lambda} = 2 \sqrt{2} \lambda - 2 x$ (2.255)

両式より
\begin{displaymath}
- \frac{\ddot{\lambda}}{2} + \frac{9}{2} \lambda = 0
\end{displaymath} (2.256)

解は
    $\displaystyle \lambda = K_1 e^{3t} + K_2 e^{-3t}$ (2.257)
    $\displaystyle x = K_1(\sqrt{2} - \frac{3}{2}) e^{3t}
+ K_2(\sqrt{2} + \frac{3}{2}) e^{-3t}$ (2.258)

$t = 0$$x = 2$ とすると
\begin{displaymath}
(\sqrt{2} - \frac{3}{2}) K_1 + (\sqrt{2} + \frac{3}{2}) K_2 = 2
\end{displaymath} (2.259)

$S(\mbox{\boldmath$x$},t) = 0$ ゆえ(2.249)式より
\begin{displaymath}
- \lambda \delta x \vert _{t_f} + H_0 \delta t \vert _{t_f} = 0
\end{displaymath} (2.260)

最終時間が与えられているので $\delta t = 0$
\begin{displaymath}
- \lambda(t_f) \delta x = 0
\end{displaymath} (2.261)

$t_f = 1,\delta x \neq 0$ ゆえ
\begin{displaymath}
\lambda(1) = 0
\end{displaymath} (2.262)

(2.261)式に代入すると
\begin{displaymath}
K_1 = - K_2 e^{-6}
\end{displaymath} (2.263)

(2.263)式に代入して
    $\displaystyle K_2 = 0.687$ (2.264)
    $\displaystyle \lambda = -0.687 e^{-6} e^{3t} + 0.687 e^{-3t}$ (2.265)

(第5段階)
$\displaystyle u_0$ $\textstyle =$ $\displaystyle -0.343(e^{-3t} - e^{-6} \cdot e^{3t})$ (2.266)
$\displaystyle x$ $\textstyle =$ $\displaystyle -0.687(\sqrt{2} - \frac{3}{2}) e^{-6} \cdot e^{3t}
+ 0.687(\sqrt{2} + \frac{3}{2}) e^{-3t}$  
  $\textstyle \simeq$ $\displaystyle 2 e^{-3t}$ (2.267)

このとき
$\displaystyle H_0$ $\textstyle =$ $\displaystyle 4 \sqrt{2} u_0 x - u^{2}_{0} + x^2$  
  $\textstyle =$ $\displaystyle -3.88 e^{-6t} - 0.117 e^{-6t} + 4 e^{-6t}
\simeq 0$ (2.268)

である。
[例2]

状態変数を $x_1,x_2,x_3,x_4$ とし、評価関数が次のMeyer形とする。

\begin{displaymath}
J = - x_3(t_f)
\end{displaymath} (2.269)

この場合、最終時間 $t_f$ が規定されているとすると $\delta t = 0$ であり、かつ
\begin{displaymath}
S(\mbox{\boldmath$x$},t) = -x_3
\end{displaymath} (2.270)

ゆえ、横断性の条件は
$\displaystyle { \left[ \left( \frac{\partial S}{\partial x_1} -\lambda_1 \right...
...+ \left( \frac{\partial S}{\partial x_2} -\lambda_2 \right)
\delta x_2 \right.}$
    $\displaystyle + \left. \left. \left( \frac{\partial S}{\partial x_3} -\lambda_3...
...l S}{\partial x_4} -\lambda_4 \right)
\delta x_4 \right] \right\vert _{t_f} = 0$ (2.271)

すなわち
\begin{displaymath}
\left. [ - \lambda_1 \delta x_1 - \lambda_2 \delta x_2
-(1 ...
...da_3)\delta x_3 -\lambda_4 \delta x_4 ] \right\vert _{t_f} = 0
\end{displaymath} (2.272)

となる。 $\delta x_1,\delta x_2,\delta x_3,\delta x_4$ が任意のとき、
\begin{displaymath}
\left. \begin{array}{l}
\lambda_1(t_f) = \lambda_2(t_f) = \lambda_4(t_f) = 0 \\
\lambda_3(t_f) = -1
\end{array} \right \}
\end{displaymath} (2.273)

であり、もし $x_1(t_f)$ が指定されていると
\begin{displaymath}
\left. \begin{array}{l}
\lambda_2(t_f) = \lambda_4(t_f) = 0 \\
\lambda_3(t_f) = -1
\end{array} \right \}
\end{displaymath} (2.274)

さらに $x_4(t_f)$ が指定されていると
\begin{displaymath}
\left. \begin{array}{l}
\lambda_2(t_f) = 0 \\
\lambda_3(t_f) = -1
\end{array} \right \}
\end{displaymath} (2.275)

が境界条件となる。
[例3]

システム方程式

\begin{displaymath}
\dot{x} = - x + u
\end{displaymath} (2.276)

評価関数
\begin{displaymath}
J = \frac{1}{2} \int^{1}_{0} u^2 d t - A x(1)
\end{displaymath} (2.277)

$t = 0$ の時 $x(0) = 0$ 、最終時間 $t = 1$ でその時の状態は自由とする。
(第1段階)
\begin{displaymath}
H = \frac{1}{2} u^2 - \lambda x + \lambda u
\end{displaymath} (2.278)

(第2段階)
    $\displaystyle \frac{\partial H}{\partial u} = u + \lambda = 0$ (2.279)
    $\displaystyle u_{0} = - \lambda$ (2.280)

(第3段階)
\begin{displaymath}
H_0 = - \frac{\lambda^2}{2} - \lambda x
\end{displaymath} (2.281)

(第4段階)
\begin{displaymath}
\left \{ \begin{array}{l}
\dot{x} = \frac{\partial H_0}{\pa...
...\frac{\partial H_0}{\partial x} = \lambda
\end{array} \right.
\end{displaymath} (2.282)

両式より
\begin{displaymath}
\ddot{x} - x = 0
\end{displaymath} (2.283)

解は
\begin{displaymath}
x = K_1 e^{-t} + K_2 e^{t}
\end{displaymath} (2.284)

$t = 0$$x = 0$ より
\begin{displaymath}
x = K_1(e^{-t} - e^{t})
\end{displaymath} (2.285)

$t_f= 1$ と指定されているから、$\delta t = 0$ となり
    $\displaystyle \left. \frac{\partial S(\mbox{\boldmath$x$},t)}
{\partial \mbox{\boldmath$x$}} - \lambda \right \vert _{t_f} = 0$ (2.286)
    $\displaystyle \left. \frac{\partial [ - A x ]}
{\partial \mbox{\boldmath$x$}} - \lambda \right \vert _{t_f}
= - A - \lambda \vert _{t_f} = 0$ (2.287)
    $\displaystyle \lambda\vert _{t_f} = - A$ (2.288)
    $\displaystyle \lambda = - \dot{x} - x = 2 K_1 e^t$ (2.289)
    $\displaystyle \lambda\vert _{t_f} = \lambda\vert _{t = 1} = 2 K_1 e = - A$ (2.290)
    $\displaystyle K_1 = - \frac{A}{2} e^{-1}$ (2.291)
    $\displaystyle \lambda = - A e^{t - 1}$ (2.292)

(第5段階)
\begin{displaymath}
u_0 = - \lambda = A e^{t - 1}
\end{displaymath} (2.293)

が得られる。
next up previous
Next: 最適制御法則 Up: 最適制御理論 Previous: 最終状態指定の場合
Yasunari SHIDAMA
平成15年5月12日