Target-point interpolation of a program control in the approach problem

A. V. Alekseev; Алексеев А. В.; A. A. Ershov; Ершов А. А.

doi:10.31857/S0044466924030142

Target-point interpolation of a program control in the approach problem

Authors: Alekseev A.V.¹, Ershov A.A.²^,3
Affiliations:
1. Experimental Machine-Design Bureau “Novator”
2. Krasovskii Institute of Mathematics and Mechanics, Ural Branch, Russian Academy of Sciences
3. Ural Federal University
Issue: Vol 64, No 3 (2024)
Pages: 547-562
Section: Computer science
URL: https://bakhtiniada.ru/0044-4669/article/view/268073
DOI: https://doi.org/10.31857/S0044466924030142
EDN: https://elibrary.ru/XFJZMV
ID: 268073

Cite item

Full Text

Abstract
Full Text
About the authors
References
Supplementary files
Statistics

Abstract

For a no Krasovskii Institute of Mathematics and Mechanics, Ural Branch, Russian Academy of Sciences, 620108, Yekaterinburg, Russianlinear controlled system, a fixed-time approach problem is considered in which the target point location becomes known only at the start of motion. According to the proposed solution method, node resolving program controls corresponding to a finite collection of target points from the set of their admissible locations are computed in advance and a refined control for the target point given at the start of motion is determined via linear interpolation of the node controls. The procedure for designing such a resolving control is formulated in the form of two algorithms, one of which is run before the start of the motion, and the other is executed in real time while the system is moving. The error in the transfer of the system’s state to the target point by applying these algorithms is estimated. As an example, we consider the approach problem for a modified Dubins car model and a target point about which only a compact set of its admissible locations is known before the start of motion.

Keywords

controlled system, approach problem, linear interpolation, program control, uncertain target point

Full Text

ВВЕДЕНИЕ

Одной из особенностей теории управления (см. [1]) является то, что вычисление разрешающего программного управления в задачах о сближении или позиционной стратегии в дифференциальных играх (см. [2], [3]) зачастую представляет собой длительный вычислительный процесс, в ходе которого вычисляются так называемые множества достижимости и интегральные воронки. Это обстоятельство представляет собой известную проблему, особенно в случае, когда условия задачи содержат некоторые неопределенности, которые невозможно выяснить до начального момента времени (см. [4]–[7]). Например, согласно работе [8], решение задачи управления с неполностью известным начальным условием состоит из трех подзадач:

сбор информации о динамической системе,
применение полученных сведений для устранения неопределенности,
переход к этапу активного управления.

В этой схеме первый и второй этапы могут быть выполнены, в том числе, с помощью применения кратковременного пробного управления (см. [6], [7]). Однако, стоит обратить внимание па переход к третьему этапу, так как после устранения неопределенности осуществить мгновенное построение разрешающего управления при уже начавшемся движении некоторой динамической системы будет практически невозможно.

Также можно рассмотреть вполне естественную задачу, когда требуется быстрое реагирование динамической системы на обнаружение целевого множества в наблюдаемой области фазового пространства. Вторая ситуация, приводящая к схожим условиям задачи, это обработка сигналов коррекции относительно целевого множества, поступающих непосредственно во время движения управляемой системы.

В настоящей статье в качестве решения предлагается заранее построить разрешающие управления, соответствующие нескольким возможным положениям целевой точки, а для промежуточных положений целевой точки воспользоваться формулами линейной интерполяции. Отметим, что в общем случае линейная комбинация управлений, соответствующих разным “поводырям” (по терминологии метода экстремального прицеливания Н.Н. Красовского из [9], [10]) , может привести к слишком большой погрешности. Из-за этого в настоящей работе применяется схема, которая минимизирует диаметр интегральных воронок, содержащих ячейки сетки, наложенной на множество возможных положений целевой точки.

Ранее в работе [11] была рассмотрена задача линейной интерполяции программного управления по скалярному параметру, а в [12] $-$ по векторному параметру. В [13] была, в частности, рассмотрена интерполяция оптимального управления по пространственной переменной для систем с обратной связью. Кроме того, запатентован метод интерполяции в автоматическом программировании (см. [14]). К данной тематике также примыкают работы по интерполяции структуры нелинейных управляемых систем с помощью линейных (см. [15], |16|) и билинейных (см. [17], [18]) систем.

2. ПОСТАНОВКА ЗАДАЧИ

Пусть на конечном промежутке времени [t₀,ϑ] задана управляемая система

$\frac{d x (t)}{d t} = f (t, x (t), u (t)), t \in (t_{0}, ϑ), x (t_{0}) = x^{(0)},$ (1)

где $t$ $-$ время, $x^{(0)} \in ℝ^{n}$ $-$ начальное состояние системы, $x (t) \in ℝ^{n}$ $-$ фазовый вектор системы, $f : [t_{0}, ϑ] \times ℝ^{n} \times P \mapsto ℝ^{n}$ $-$ вектор-функция динамики системы, $u (t): [t_{0}, ϑ] \mapsto P$ $-$ измеримая вектор-функция управления, значения которой принадлежат компакту $P \subset ℝ^{p}$ , $n$ и $p$ $-$ натуральные числа.

Будем предполагать, что правая часть $f (\cdot, \cdot, \cdot)$ системы (1) удовлетворяет следующим условиям.

Условие C1. Вектор-функция $f (t, x, u)$ определена и непрерывна на области $[t_{0}, ϑ] \times ℝ^{n} \times P$ .

Условие C2. На любом компакте $D \subset [t_{0}, ϑ] \times ℝ^{n}$ функция $f (t, x, u)$ удовлетворяет условию Липшица по x с некоторой конечной и положительной постоянной Липшица $L = L (D)$ , т.е.

$\begin{matrix} ‖f (t, x_{*}, u) - f (t, x^{*}, u)‖ ⩽ L ‖x_{*} - x^{*}‖, \\ (t, x_{*}) \in D, (t, x^{*}) \in D, u \in P, \end{matrix}$

где $∥ \cdot ∥$ $-$ евклидова норма вектора в $ℝ^{n}$ .

Условие C3. Выполняется условие подлинейного роста по фазовой переменной с некоторой конечной и положительной постоянной $γ$ , т.е.

$‖f (t, x, u)‖ \leq γ \cdot (1 + ‖x‖), (t, x, u) \in [t_{0}, ϑ] \times ℝ^{n} \times P .$

Замечание 2.1. Под допустимым управлением $u (t)$ , $t \in [t_{0}, ϑ]$ , мы понимаем измеримую по Лебегу на $[t_{0}, ϑ]$ вектор-функцию со значениями из $P$ . Условий C1, C2 и C3 достаточно, чтобы каждому допустимому управлению $u (t)$ соответствовало движение $x (t)$ , являющееся решением системы (1) в классе абсолютно непрерывных функций (см. [19, §2.1]). При этом производная $\dot{х} (t)$ понимается в обобщенном смысле, и для нее выполняется формула Ньютона $-$ Лейбница (см., например, [20, гл. 2, §4]).

Замечание 2.2. В силу условия C3 существует некоторый достаточно большой компакт $D \subset [t_{0}, ϑ] \times ℝ^{n}$ , в котором заведомо содержатся всевозможные движения системы (1) вместе со всеми вспомогательными конструкциями для построения разрешающих управлений. В дальнейшем будем всюду использовать постоянную Липшица $L = L (D)$ и другие конструкции именно для этой области $D$ .

Замечание 2.3. Учитывая условие C1, получаем, что модуль непрерывности

$ω (δ) = \max \{‖f (t, x, u_{*}) - f (t, x, u^{*})‖ : (t, x, u_{*}), (t, x, u^{*}) \in D \times P, ‖u_{*} - u^{*}‖ \leq δ\}, δ \in (0, \infty),$

удовлетворяет предельному соотношению $ω (δ) ↓ 0$ при $δ ↓ 0$ .

Условие C4. Для любых точек $(t, x) \in D$ и векторов $u \in P$ функция $f (t, x, u)$ является дважды непрерывно дифференцируемой по совокупности компонент векторных переменных $x$ и $u$ с ограниченными вторыми частными производными, т.е.

$‖\frac{\partial^{2} f (t, x, u)}{\partial x_{i} \partial x_{j}}‖ \leq M_{2}, i, j = \bar{1, n},$ $‖\frac{\partial^{2} f (t, x, u)}{\partial u_{i} \partial u_{j}}‖ \leq M_{2}, i, j = \bar{1, p},$

$‖\frac{\partial^{2} f (t, x, u)}{\partial u_{i} \partial x_{j}}‖ \leq M_{2}, i = \bar{1, p}, j = \bar{1, n},$

где $x =(x_{1}, \dots, x_{n})$ , $u =(u_{1}, \dots, u_{p})$ , постоянная $M_{2} ⩾ 0$ определяется видом функции $f (\cdot, \cdot, \cdot)$ , областями $D$ и $P$ .

Оговорим информационные условия, в рамках которых осуществляется управление системой (1).

Условие I1. Заблаговременно до момента начала движения $t_{0}$ управляющему лицу известно только ограниченное множество возможных целевых точек $M \subset ℝ^{n}$ и приближенное значение $x^{*} (t_{0})$ начального состояния системы $x (t_{0})= x^{(0)}$ с погрешностью $δ_{x}$ , т.е. выполнено неравенство

$‖x^{*} (t_{0}) - x (t_{0})‖ \leq δ_{x} .$

Условие I2. Целевая точка $x^{(f)} \in M$ сообщается управляющему лицу только в момент $t_{0}$ начала движения системы (1).

Условие I3. Лицо, управляющее системой, не в состоянии производить большой объем вычислений в реальном времени (а именно, не может мгновенно вычислять множества достижимости пиксельным методом). Также объем заранее вычисленной информации для быстрого построения разрешающих управлений не должен быть слишком большим.

Сформулируем для системы (1) задачу о сближении с заранее неизвестной целевой точкой.

Задача 1. Пусть система (1) удовлетворяет условиям C1–C4, а ее управление производится в рамках информационных условий I1–I3. Требуется определить существование разрешающего программного управления $u (t)$ , переводящего движение системы (1) в момент $ϑ$ в малую окрестность точки $x^{(f)}$ (заданной в момент $t_{0}$ ), и, в случае его существования, сконструировать его.

3. АЛГОРИТМ РЕШЕНИЯ ЗАДАЧИ О СБЛИЖЕНИИ

Прежде чем сформулировать алгоритм решения задачи, состоящий из двух частей, введем некоторые вспомогательные обозначения.

Под диаметром $diam (M)$ произвольного множества $M$ (находящегося, как минимум, в метрическом пространстве) мы будем понимать точную верхнюю грань расстояний между любыми двумя точками из $M$ .

Обозначим через $Ω^{(δ)} (\cdot)$ отображение, “прореживающее” множество, т.е. любому ограниченному множеству $A \subset ℝ^{k}$ , $k \in ℕ$ , оно сопоставляет конечное множество $\tilde{A} = Ω^{(δ)} (A)$ , состоящее, по возможности, из меньшего количества его точек и обладающее свойством

$d (A, \tilde{A}) \leq δ,$

где $d (A, \tilde{A})$ есть хаусдорфово расстояние между множествами $A$ и $\tilde{A}$ . Способы построения такого “прореженного” множества $\tilde{A}$ приведены в [21, c. 549].

Обозначим $\tilde{P} = Ω^{(Δ_{u})} (P)$ , где $Δ_{u} >0$ $-$ достаточно малая постоянная, выбранная из соображений оптимального соотношения между точностью и производительностью вычислений.

Пусть $P$ $-$ множество всех равномерных разбиений всех отрезков. Определим отображение $F : P \times ℝ^{n} \times P \mapsto ℝ^{n}$ , действующее по правилу

$F (\bar{Γ}, x_{*}, u) = x^{(N)},$

где $N \in ℕ$ $-$ натуральное число, $\bar{Γ} ={τ_{0} = t_{*}, τ_{1}, \dots, τ_{N} = t^{*}}$ $-$ равномерное разбиение некоторого отрезка $[t_{*}, t_{*}]$ , точка $x^{(N)}$ вычисляется с помощью рекуррентных соотношений

$x^{(0)} = x_{*},$

$\begin{matrix} x^{(k + 1)} = x^{(k)} + (τ_{k + 1} - τ_{k}) f (\frac{τ_{k} + τ_{k + 1}}{2}, x^{(k)} + \frac{τ_{k + 1} - τ_{k}}{2} \cdot f (τ_{k}, x^{(k)}, u)), \\ k = \bar{0, N - 1}, \end{matrix}$

представляющих собой явный метод Рунге $-$ Кутты второго порядка (см. [22], [23]).

Определим еще одно отображение $\tilde{X} : ℝ \times ℝ \times 2^{ℝ^{n}} \times P \mapsto 2^{ℝ^{n}}$ следующим образом:

$\tilde{X} (t^{*}, t_{*}, X_{*}, \bar{Γ}) := \underset{x \in X_{*}}{\cup} \underset{u \in P}{\cup} F (Γ [t_{*}, t^{*}], x, u),$

где $\bar{Γ}$ $-$ равномерное разбиение отрезка $[t_{*}, t^{*}]$ , концы которого определены первыми двумя аргументами отображения.

Завершив введение необходимых обозначений, сформулируем вычислительный метод решения задачи 1 в виде двух алгоритмов. Первый алгоритм содержит громоздкие вычисления, которые выполняются заблаговременно до начала движения системы (1), второй алгоритм применяется непосредственно в процессе движения системы (1) в режиме реального времени.

Алгоритм 1

1. Выберем достаточно большое натуральное число $N$ и введем равномерное разбиение $Γ = \{t_{0}, t_{1}, \dots, t_{i}, \dots, t_{N} = ϑ\}$ временного промежутка $[t_{0}, ϑ]$ с диаметром $Δ_{t} = t_{i + 1} - t_{i} = N^{- 1} \cdot (ϑ - t_{0}), i = \bar{0, N - 1}$ . Кроме того, выберем натуральное число $N_{1}$ , и на каждом отрезке разбиения $[t_{i}, t_{i + 1}]$ введем свое подразбиение:

$Γ_{i + 1} = \{t_{i,0} = t_{i}, t_{i,1} = t_{i} + \frac{Δ_{t}}{N_{1}}, \dots, t_{i, k} = t_{i} + k \cdot \frac{Δ_{t}}{N_{1}}, \dots, t_{i, N_{1}} = t_{i + 1}\}, i = \bar{0, N - 1} .$

2. Выберем достаточно малую постоянную $Δ_{x} >0$ и вычислим аппроксимации множеств достижимости по следующей итерационной процедуре:

${\tilde{X}}_{0} = \{x^{*} (t_{0})\}, {\tilde{X}}_{k + 1} = Ω^{(Δ_{x})} (\tilde{X} (t_{k + 1}, t_{k}, {\tilde{X}}_{k}, Γ_{k})), k = \bar{0, N - 1} .$

При построении конечных множеств ${\tilde{X}}_{k}, k = \bar{1, N}$ , для каждой точки ${\bar{x}}^{(k)} \in {\tilde{X}}_{k}$ мы будем запоминать “родительскую” точку ${\bar{x}}^{(k - 1)} \in {\tilde{X}}_{k - 1}$ и управляющий вектор ${\bar{u}}^{(k)} \in \tilde{P}$ , для которых выполнено соотношение ${\bar{x}}^{(k)} = F (Γ_{k}, {\bar{x}}^{(k - 1)}, {\bar{u}}^{(k)})$ , где обозначено ${\bar{x}}^{(0)} = x^{*} (t_{0})$ .

3. Если евклидово расстояние $ρ (M, {\tilde{X}}_{N})= min_{x \in M} min_{y \in {\tilde{X}}_{N}} ∥ x - y ∥ > Δ_{x}$ , то заключаем, что разрешающее программное управление, переводящее движение системы (1) на любую точку из $M$ в момент $ϑ$ с приемлемой точностью нашим методом построить не представляется возможным, и завершаем решение задачи о сближении.

Если хаусдорфово отклонение $h (M, {\tilde{X}}_{N})= max_{x \in M} min_{y \in {\tilde{X}}_{N}} ∥ x - y ∥ ⩽ Δ_{x}$ , то заключаем, что задача 1 разрешима для любой точки $x^{(f)} \in M$ , которая будет сообщена в момент $t_{0}$ .

В остальных случаях мы не сможем гарантировать решение задачи 1 с приемлемой точностью для того $x^{(f)}$ , которое будет сообщено управляющему лицу в момент $t_{0}$ .

4. Обозначим через $Δ_{f} >0$ достаточно малую постоянную. В качестве конечного множества $\tilde{M}$ выберем такое множество точек ${\{x^{(f, j)}\}}_{j =1}^{N_{f}}$ , чтобы любая возможная целевая точка $x^{(f)} \in M$ была внутри “своего” $n$ -мерного куба $K_{j}$ с вершинами

$x^{(f, j \underset{n}{\underset{⎵}{, \pm, \pm, \dots, \pm}})} = (x_{1}^{(f, j)} \pm \frac{Δ_{f}}{2}, x_{2}^{(f, j)} \pm \frac{Δ_{f}}{2}, \dots, x_{n}^{(f, j)} \pm \frac{Δ_{f}}{2}),$

которые должны быть либо из ${\tilde{X}}_{n}$ , либо хотя бы удовлетворять соотношению

$h (x^{(f, j, \pm, \pm, \dots, \pm)}, {\tilde{X}}_{n}) \leq Δ_{x} .$ (2)

Замечание 3.1. Если выделение конечного множества $\tilde{M}$ указанным способом невозможно по причине “неудобной” геометрии $M$ и ${\tilde{X}}_{N}$ , то можно модифицировать наши алгоритмы, соотнеся “неудобные” точки к ближайшим кубам и выразив их в дальнейшем через невыпуклые линейные комбинации вершин (см. [12]), перейдя, таким образом, от интерполяции к экстраполяции. При этом оценка погрешности перевода состояния системы в целевую точку несколько ухудшится.

5. Для каждого куба $K_{j}$ с центром $x^{(f, j)}$ , $j = \bar{1, N_{f}}$ , выбираем соответствующее сужение значений управляющего вектора ${\overset{⌣}{P}}_{j} (t) \subset P$ так, чтобы $K_{j} \subset {\overset{⌣}{X}}_{j} (ϑ, t_{0}, x^{(0)})$ , где ${\overset{⌣}{X}}_{j} (ϑ, t_{0}, x^{(0)})$ $-$ множество достижимости системы (1) в момент $ϑ$ из начальной позиции $(t_{0}, x^{(0)})$ , порожденное всевозможными кусочно-постоянными управлениями со значениями из сужения ${\overset{⌣}{P}}_{j} (t)$ при $t \in [t_{0}, ϑ]$ . При этом выбор таких сужений мы производим таким образом, чтобы максимальный диаметр временных сечений сужений $Δ_{u} = \max_{j = \bar{1, N_{f}}} \max_{t \in [t_{0}, ϑ]} diam (P_{j} (t))$ был, по возможности, минимальным.

6. Для каждого $j = \bar{1, N_{f}}$ и для каждой вершины $x^{(f, j, \pm, \pm, \dots, \pm)}$ выбираем из ${\tilde{X}}_{N}$ по одной точке ${\bar{x}}^{(N, j, \pm, \pm, \dots, \pm)}$ , ближайшей к $x^{(f, j, \pm, \pm, \dots, \pm)}$ и порожденной сеточным алгоритмом, аппроксимирующего воздействие некоторого кусочно-постоянного управления, которое обозначим через ${\bar{u}}^{(j, \pm, \pm, \dots, \pm)} (t) \in {\overset{⌣}{P}}_{j} (t)$ , $t \in [t_{0}, ϑ]$ .

Алгоритм 2

1. Определяем куб $K_{j}$ , содержащий заданную целевую точку $x^{(f)}$ .

2. Представляем радиус-вектор $x^{(f)}$ в виде линейной комбинации

$x^{(f)} = λ_{1} λ_{2} \dots λ_{n} x^{(f, j, -, -, \dots, -)} + (1 - λ_{1}) λ_{2} \dots λ_{n} x^{(f, j, +, -, \dots, -)} + \dots$

$\dots + (1 - λ_{1})(1 - λ_{2}) \dots (1 - λ_{n}) x^{(f, j, +, +, \dots, +)},$

где коэффициенты $0 ⩽ λ_{k} ⩽ 1$ при $k = \bar{1, n}$ .

3. В качестве искомого разрешающего программного управления используем функцию

$\begin{matrix} \hat{u} (t)= λ_{1} λ_{2} \dots λ_{n} {\bar{u}}^{(j, -, -, \dots, -)} (t) + \\ + (1 - λ_{1}) λ_{2} \dots λ_{n} {\bar{u}}^{(j, +, -, \dots, -)} (t) + \dots + \\ + (1 - λ_{1})(1 - λ_{2}) \dots (1 - λ_{n}) {\bar{u}}^{(j, +, +, \dots, +)} (t). \end{matrix}$

4. ОЦЕНКА ПОГРЕШНОСТИ

Лемма 4.1. Пусть $m$ и $n$ $-$ натуральные числа, постоянные $0 ⩽ λ_{k} ⩽ 1$ при $k = \bar{1, n}$ , векторы $x =(x_{1}, x_{2}, \dots, x_{n})$ и $y =(y_{1}, y_{2}, \dots, y_{n})$ из $ℝ^{n}$ , функция $f : ℝ^{n} \mapsto ℝ^{m}$ , $f \in C^{2} (ℝ^{n})$ и все ее вторые частные производные ограничены некоторой постоянной $m_{2} >0$ , т.е.

$‖\frac{\partial^{2} f (x_{1}, x_{2}, \dots, x_{n})}{\partial x_{i} \partial x_{j}}‖ \leq m_{2}, i, j = \bar{1, n} .$

Тогда

$\begin{matrix} ‖f (λ_{1} x_{1} + (1 - λ_{1}) y_{1}, λ_{2} x_{2} + (1 - λ_{2}) y_{2}, \dots, λ_{n} x_{n} + (1 - λ_{n}) y_{n}) - \\ - \sum_{(b_{1}, b_{2}, \dots, b_{n}) \in B_{2}^{n}} \prod_{k =1}^{n} (b_{k} λ_{k} + (1 - b_{k}) 1 - λ_{k}) \times \\ \times f (b_{1} x_{1} + (1 - b_{1}) y_{1}, b_{2} x_{2} + (1 - b_{2}) y_{2}, \dots, b_{n} x_{n} + (1 - b_{n}) y_{n})‖ \leq \\ \leq \frac{3}{8} m_{2} {‖x - y‖}^{2}, \end{matrix}$ (3)

где через $B_{2}^{n}$ обозначено множество всех векторов $b =(b_{1}, b_{2}, \dots, b_{n})$ длины $n$ , координаты ${\{b_{k}\}}_{k =1}^{n}$ которых принимают значения только $0$ или $1$ .

Доказательство. Воспользуемся методом математической индукции по размерности $n$ . Для доказательства базы индукции рассмотрим случай $n =1$ , а именно, докажем, что

$‖f (λ_{1} x_{1} + (1 - λ_{1}) y_{1}) - λ_{1} f (x_{1}) - (1 - λ_{1}) f (y_{1})‖ \leq \frac{3}{8} m_{2} {|x_{1} - y_{1}|}^{2} .$

Действительно, разложив вектор-функцию $f (ξ)$ в точках $x_{1}$ и $y_{1}$ в ряды Тейлора с остаточным членом в интегральной форме и подставив в эти разложения $ξ = λ_{1} x_{1} + (1 - λ_{1}) y_{1}$ , получаем, что

$f (ξ) = f (x_{1}) + f^{'} (x_{1}) (ξ - x_{1}) + \int_{x_{1}}^{ξ} (ξ - t) f^{″} (t) d t,$

$f (ξ) = f (y_{1}) + f'^{'} (y_{1}) (ξ - y_{1}) + \int_{y_{1}}^{ξ} (ξ - t) f^{″} (t) d t,$

$\begin{matrix} f (λ_{1} x_{1} + (1 - λ_{1}) y_{1}) = f (x_{1}) + f^{'} (x_{1}) (1 - λ_{1}) (y_{1} - x_{1}) + \\ + \int_{x_{1}}^{λ_{1} x_{1} + (1 - λ_{1}) y_{1}} (λ_{1} x_{1} + (1 - λ_{1}) y_{1} - t) f^{″} (t) d t, \end{matrix}$ (4)

$\begin{matrix} f (λ_{1} x_{1} + (1 - λ_{1}) y_{1}) = f (y_{1}) + f^{'} (y_{1}) λ_{1} (x_{1} - y_{1}) + \\ + \int_{y_{1}}^{λ_{1} x_{1} + (1 - λ_{1}) y_{1}} (λ_{1} x_{1} + (1 - λ_{1}) y_{1} - t) f^{″} (t) d t . \end{matrix}$ (5)

Теперь домножим (4) на $λ_{1}$ , (5) на $1 - λ_{1}$ и сложим их между собой:

$\begin{matrix} f (λ_{1} x_{1} + (1 - λ_{1}) y_{1}) = λ_{1} f (x_{1}) + (1 - λ_{1}) f (y_{1}) + \\ + λ_{1} (1 - λ_{1}) (y_{1} - x_{1}) (f^{'} (x_{1}) - f^{'} (y_{1})) + \\ + λ_{1} \int_{x_{1}}^{λ_{1} x_{1} + (1 - λ_{1}) y_{1}} (λ_{1} x_{1} + (1 - λ_{1}) y_{1} - t) f^{″} (t) d t + \\ + (1 - λ_{1}) \int_{y_{1}}^{λ_{1} x_{1} + (1 - λ_{1}) y_{1}} (λ_{1} x_{1} + (1 - λ_{1}) y_{1} - t) f^{″} (t) d t = \\ = λ_{1} f (x_{1}) + (1 - λ_{1}) f (y_{1}) + λ_{1} (1 - λ_{1}) (y_{1} - x_{1}) \int_{y_{1}}^{x_{1}} f^{″} (t) d t + \\ + λ_{1} \int_{x_{1}}^{λ_{1} x_{1} + (1 - λ_{1}) y_{1}} (λ_{1} x_{1} + (1 - λ_{1}) y_{1} - t) f^{″} (t) d t + \\ + (1 - λ_{1}) \int_{y_{1}}^{λ_{1} x_{1} + (1 - λ_{1}) y_{1}} (λ_{1} x_{1} + (1 - λ_{1}) y_{1} - t) f^{″} (t) d t . \end{matrix}$

Отсюда получаем, что

$\begin{matrix} ‖f (λ_{1} x_{1} + (1 - λ_{1}) y_{1}) - λ_{1} f (x_{1}) - (1 - λ_{1}) f (y_{1})‖ \leq \\ \leq λ_{1} (1 - λ_{1}) (y_{1} - x_{1}) |\int_{y_{1}}^{λ_{1} x_{1} + (1 - λ_{1}) y_{1}} ‖f^{″} (t)‖ d t| + \\ + λ_{1} |\int_{x_{1}}^{λ_{1} x_{1} + (1 - λ_{1}) y_{1}} (λ_{1} x_{1} + (1 - λ_{1}) y_{1} - t) ‖f^{″} (t)‖ d t| + \\ + (1 - λ_{1}) |\int_{y_{1}}^{λ_{1} x_{1} + (1 - λ_{1}) y_{1}} (λ_{1} x_{1} + (1 - λ_{1}) y_{1} - t) ‖f^{″} (t)‖ d t| \leq \\ \leq λ_{1}^{2} (1 - λ_{1}) m_{2} {(y_{1} - x_{1})}^{2} + λ_{1} m_{2} \frac{{(1 - λ_{1})}^{2} {(x_{1} - y_{1})}^{2}}{2} + \\ + (1 - λ_{1}) m_{2} \frac{λ_{1}^{2} {(y_{1} - x_{1})}^{2}}{2} = \\ = \frac{3}{2} λ_{1} (1 - λ_{1}) m_{2} {(y_{1} - x_{1})}^{2} \leq \frac{3}{8} m_{2} {(y_{1} - x_{1})}^{2} . \end{matrix}$

Тем самым база индукции (лемма 4.1.) доказана.

Предположим, что неравенство (3) выполняется для некоторого $n$ . Докажем его для $n + 1$ . Опираясь на базу и предположение индукции, с помощью неравенства треугольника несложно доказать его для размерности n + 1. Тем самым, мы осуществили индукционный переход, и, значит, лемма доказана.

Замечание 4.1. Для скалярной функции одной переменной $f :[x_{0}, x_{1}] \to ℝ$ с ограниченной второй производной (т.е. $|{f^{'}}^{'} (x)| \leq m_{2}$ , где постоянная $m_{2} \geq 0$ ) из оценки погрешности формулы интерполяции Лагранжа (см. [24, гл. XIV, §14, (6)])

$|f (x) - \frac{x - x_{1}}{x_{0} - x_{1}} f (x_{0}) - \frac{x - x_{0}}{x_{1} - x_{0}} f (x_{1})| \leq \frac{\max_{x_{0} \leq x \leq x_{1}} |{f^{'}}^{'} (x)|}{2} |(x - x_{0}) (x - x_{1})|$

и неравенства

$(x - x_{0}) (x_{1} - x) \leq \frac{{(x_{1} - x_{0})}^{2}}{4}, x_{0} \leq x \leq x_{1},$

непосредственно следует оценка

$|f (λ x + (1 - λ) y) - λ f (x) - (1 - λ) f ((y)| \leq \frac{m_{2}}{8} {(y - x)}^{2}, x, y \in ℝ, 0 \leq λ \leq 1.$ (6)

Однако для нашего многомерного случая приведенное в [24, гл. XIV, §14] доказательство оценки (6) не будет корректным из-за использования теоремы Лагранжа о конечных приращениях, которая, как известно, не применима для векторозначных функций.

Лемма 4.2. Пусть $\overset{⌣}{P} (t) \subset P$ , $t \in [t_{0}, ϑ]$ , – некоторое сужение значений управления. И пусть измеримые по Лебегу вектор-функции $u (t)$ и $v (t)$ действуют из $[t_{0}, ϑ]$ в $\overset{⌣}{P} (t) \subset ℝ^{p}$ и порождают некоторые абсолютно непрерывные движения $x (t)$ и $y (t)$ при подстановке их в систему (1) в качестве программных управлений. При этом считаем, что система (1) удовлетворяет условиям C1– C4 на правую часть (информационные условия I1– I3 не имеют значения).

Тогда выполняется оценка

$‖x (t) - y (t)‖ \leq \frac{ω (Δ_{u})}{L} (e^{L (t - t_{0})} - 1), t \in [t_{0}, ϑ].$

Доказательство. Поскольку $x (t)$ и $y (t)$ есть движения системы (1), соответствующие программным управлениям $u (t)$ и $v (t)$ , то они удовлетворяют начальным условиям $x (t_{0})= y (t_{0})= x^{(0)}$ и дифференциальным уравнениям

$x (t) = f (t, x (t), u (t)), y (t) = f (t, y (t), v (t)),$

которые в интегральной форме можно записать следующим образом:

$x (t) = x^{(0)} + \int_{t_{0}}^{t} f (τ, x (τ), u (τ)) d τ, y (t) = x^{(0)} + \int_{t_{0}}^{t} f (τ, y (τ), v (τ)) d τ .$

Учитывая условие C2 и замечание 2.3, можно оценить

$\begin{matrix} ‖x (t) - y (t)‖ \leq \int_{t_{0}}^{t} ‖f (τ, x (τ), u (τ)) - f (τ, y (τ), v (τ))‖ d τ \leq \\ \leq \int_{t_{0}}^{t} (‖f (τ, x (τ), u (τ)) - f (τ, y (τ), u (τ))‖ + ‖f (τ, y (τ), u (τ)) - f (τ, y (τ), v (τ))‖) d τ \leq \\ \leq \int_{t_{0}}^{t} L ‖x (τ) - y (τ)‖ d τ + \int_{t_{0}}^{t} ω (‖u (τ) - v (τ)‖) d τ \leq \\ L \int_{t_{0}}^{t} ‖x (τ) - y (τ)‖ d τ + (t - t_{0}) ω (Δ_{u}) . \end{matrix}$

Отсюда в силу усиленной леммы Гронуолла (см. [25, гл.1, §2, c. 26]) вытекает утверждение леммы.

Пусть $\bar{u} (t)$ $-$ фиксированная кусочно постоянная вектор-функция со значениями из $P$ с разрывами на концах отрезков разбиения $Γ$ , $x (t)$ $-$ решение задачи Коши

$\begin{matrix} x (t) = f (t, x (t), \bar{u} (t)), t \in (t_{0}, ϑ), \\ x (t_{0}) = x^{(0)}, \end{matrix}$ (7)

$\bar{x} (t)$ $-$ простейшая линейная аппроксимация сеточной функция, являющейся численным решением задачи (6) явным методом Рунге-Кутты второго порядка с шагом $Δ_{t} / N_{k}$ на участках $[t_{k - 1}, t_{k}]$ при $k = \bar{1, N}$ , а именно, по рекуррентным формулам

$\bar{x} (t_{0}) = x^{*} (t_{0}), \bar{x} (t_{k + 1}) = F (Γ_{k + 1}, \bar{x} (t_{k}), \bar{u} (t_{k} + Δ_{t} /2)), k = \bar{0, N - 1},$

где подразбиения $Γ_{1}, \dots, Γ_{N}$ определены согласно первому шагу алгоритма 1 с некоторыми числами $N_{1}$ , $N_{2}, \dots, N_{N}$ .

Посредством функции $δ (t)$ обозначим оценку

$‖\bar{x} (t) - x (t)‖ \leq δ (t),$ (8)

вид которой, согласно [23, п. 4.3.1, п. 4.3.2], есть

$‖δ (t)‖ = {\tilde{Δ}}_{t}^{2} \frac{C}{Λ} (e^{(t - t_{0}) Λ} - 1) + δ_{x} e^{L (t - t_{0})},$

где

$Λ = L + \frac{L {\tilde{Δ}}_{t}}{2} + {(\frac{L {\tilde{Δ}}_{t}}{2})}^{2}$ , ${\tilde{Δ}}_{t} = \max {\frac{Δ_{t}}{N_{1}}, \dots, \frac{Δ_{t}}{N_{N}}}$ ,

постоянная $C$ выражается некоторым образом через максимум функции $f (t, x, u)$ , ее первых и вторых частных производных по всем $(t, x) \in Ω$ и $u \in P$ .

Замечание 4.2. Заметим, что в местах линейной аппроксимации $\bar{x} (t)$ сеточной функции погрешность может оказаться несколько больше, чем в узловых точках метода Рунге $-$ Кутты, что может привести к некоторому увеличению постоянной $C$ . В дальнейшем такую линейную аппроксимацию сеточной функции будем называть ломаной Эйлера.

Теорема 4.1 Пусть система (1) удовлетворяет условиям C1–C4, а управление ей производится в информационных условиях I1–I3, и пусть при решении задачи $1$ на шаге $5$ алгоритма $1$ было установлено существование допустимого разрешающего управления, а затем с помощью алгоритма $2$ было построено программное управление $\hat{u} (t)$ , порождающее движение $\hat{x} (t)$ . Тогда

$\begin{matrix} ρ (\hat{x} (ϑ), x^{(f)}) \leq Δ_{x} + δ (ϑ) + \frac{3 M_{2}}{8 L} \times (Δ_{u}^{2} + \frac{ω^{2} (Δ_{u})}{L^{2}} {(e^{L (ϑ - t_{0})} - 1)}^{2}) (e^{L (ϑ - t_{0})} - 1) . \end{matrix}$ (9)

Доказательство. В соответствии с шагом 3 алгоритма 1 целевая точка $x^{(f)}$ находится внутри некоторого $n$ -мерного куба $K_{j}$ с вершинами $x^{(f, j, \pm, \pm, \dots, \pm)}$ . Тогда $x^{(f)}$ можно выразить в виде некоторой выпуклой линейной комбинации вершин куба $K_{j}$ , т.е.

$\begin{matrix} x^{(f)} = λ_{1} λ_{2} \dots λ_{n} x^{(f, j, -, -, \dots, -)} + (1 - λ_{1}) λ_{2} \dots λ_{n} x^{(f, j, +, -, \dots, -)} + \dots \\ \dots + (1 - λ_{1}) (1 - λ_{2}) \dots (1 - λ_{n}) x^{(f, j, +, +, \dots, +)}, 0 ⩽ λ_{k} ⩽ 1, k = \bar{1, n} . \end{matrix}$

Через $\hat{x} (t)$ в формулировке теоремы обозначено движение системы (1), порожденное управлением

$\begin{array}{l} \hat{u} (t) = λ_{1} λ_{2} \dots λ_{n} {\bar{u}}^{(j, -, -, \dots, -)} (t) + (1 - λ_{1}) λ_{2} \dots λ_{n} {\bar{u}}^{(j, +, -, \dots, -)} (t) + \dots \\ \dots + (1 - λ_{1}) (1 - λ_{2}) \dots (1 - λ_{n}) {\bar{u}}^{(j, +, +, \dots, +)} (t) . \end{array}$

Отметим, что в наших обозначениях $\hat{x} (t_{0})= x (t_{0})$ есть точное начальное состояние системы. По построению (см. (2)) для всех $x^{(f, j, \pm, \pm, \dots, \pm)}$ найдется такое ${\bar{x}}^{(N, j, \pm, \pm, \dots, \pm)} \in {\tilde{X}}_{N}$ , что

$‖{\bar{x}}^{(N, j, \pm, \pm, \dots, \pm)} - x^{(f, j, \pm, \pm, \dots, \pm)}‖ \leq Δ_{x} .$ (10)

Обозначим через

${\bar{x}}^{(k, j)} = λ_{1} \dots λ_{n} {\bar{x}}^{(k, j, -, -, \dots, -)} + \dots + (1 - λ_{1}) \dots (1 - λ_{n}) {\bar{x}}^{(k, j, +, +, \dots, +)}, k = \bar{0, N} .$ (11)

Из (9) и (10) следует соотношение

$‖{\bar{x}}^{(N, j)} - x^{(f)}‖ \leq Δ_{x} .$ (12)

Далее оценим $‖\hat{x} (ϑ) - {\bar{x}}^{(N, j)}‖ .$

Через ${\bar{x}}^{(j, \pm, \pm, \dots, \pm)} (t)$ обозначим ломаные Эйлера, проходящие через точки

$x^{(0)}, {\bar{x}}^{(1, j, \pm, \pm, \dots, \pm)} = F (Γ_{1}, x^{(0)}, {\bar{u}}^{(1, j, \pm, \pm, \dots, \pm)}), \dots,$

${\bar{x}}^{(k, j, \pm, \pm, \dots, \pm)} = F (Γ_{k}, x^{(k - 1, j, \pm, \pm, \dots, \pm)}, {\bar{u}}^{(k, j, \pm, \pm, \dots, \pm)}), \dots,$

${\bar{x}}^{(N, j, \pm, \pm, \dots, \pm)} = F (Γ_{N}, x^{(N - 1, j, \pm, \pm, \dots, \pm)}, {\bar{u}}^{(N, j, \pm, \pm, \dots, \pm)}),$

соответственно, через ${\bar{x}}^{(j)} (t)$ обозначим линейную комбинацию ломанных Эйлера

${\bar{x}}^{(j)} (t) = λ_{1} \dots λ_{n} {\bar{x}}^{(k, j, -, -, \dots, -)} (t) + \dots + (1 - λ_{1}) \dots (1 - λ_{n}) {\bar{x}}^{(k, j, +, +, \dots, +)} (t),$

проходящую через точки ${\bar{x}}^{(k, j)}$ , $k = \bar{0, N}$ .

Через $x^{(j, \pm, \pm, \dots, \pm)} (t)$ обозначим решения задач Коши:

$\begin{matrix} \frac{d x^{(j, \pm, \pm, \dots, \pm)} (t)}{d t} = f (t, x^{(j, \pm, \pm, \dots, \pm)} (t), {\bar{u}}^{(j, \pm, \pm, \dots, \pm)} (t)), t \in (t_{0}, ϑ), \\ x^{(j, \pm, \pm, \dots, \pm)} (t_{0}) = \hat{x} (t_{0}), \end{matrix}$

их линейную комбинацию обозначим через

$x^{(j)} (t) = λ_{1} \dots λ_{n} x^{(j, +, +, \dots, +)} (t) + \dots + (1 - λ_{1}) \dots (1 - λ_{n}) x^{(j, -, -, \dots, -)} (t) .$ (13)

В силу обозначения (8) выполнены оценки

$‖{\bar{x}}^{(j, \pm, \pm, \dots, \pm)} (t) - x^{(j, \pm, \pm, \dots, \pm)} (t)‖ \leq δ (t), t \in [t_{0}, ϑ].$ (14)

Применяя неравенство треугольника и учитывая обозначение ${\bar{x}}^{(N, j)} = {\bar{x}}^{(j)} (ϑ)$ , получаем, что

$\begin{matrix} ‖\hat{x} (ϑ) - {\bar{x}}^{(N, j)}‖ \leq ‖\hat{x} (ϑ) - x^{(j)} (ϑ)‖ + ‖x^{(j)} (ϑ) - {\bar{x}}^{(j)} (ϑ)‖ \leq ‖\hat{x} (ϑ) - x^{(j)} (ϑ)‖ + δ (ϑ), \end{matrix}$ (15)

где второе слагаемое оценено через $δ (ϑ)$ в силу (14).

Чтобы оценить первое слагаемое, рассмотрим следующую задачу Коши:

$\begin{matrix} \frac{d \hat{x} (t)}{d t} = f (t, \hat{x} (t), \hat{u} (t)), t \in (t_{0}, ϑ), \\ \hat{x} (t_{0}) = x (t_{0}) . \end{matrix}$

Заметим, что в силу леммы 4.1

$\begin{matrix} f (t, x^{(j)} (t), λ_{1} \dots λ_{n} {\bar{u}}^{(j, -, \dots, -)} (t) + \dots + (1 - λ_{1}) \dots (1 - λ_{n}) {\bar{u}}^{(j, +, \dots, +)} (t)) = \\ = λ_{1} \dots λ_{n} f (t, x^{(j, -, \dots, -)(t)}, {\bar{u}}^{(j, -, \dots, -)} (t)) + \dots \\ \dots + (1 - λ_{1}) \dots (1 - λ_{n}) f (t, x^{(j, +, \dots, +)(t)}, u^{(j, +, \dots, +)} (t)) + r (t), \end{matrix}$ (16)

где $x^{(j)} (t)$ определено в (13), $‖r (t)‖ ⩽ \frac{3}{8} M_{2} {\tilde{Δ}}_{u}^{2}$ , ${\tilde{Δ}}_{u} = \sqrt{Δ_{u}^{2} + d_{x}^{2}}$ , $d_{x}$ $-$ максимальный диаметр сечений интегральных воронок, соответствующих сужениям ${\overset{⌣}{P}}_{j}$ .

Учитывая лемму 4.2, можно оценить

$d_{x} ⩽ \frac{ω (Δ_{u})}{L} (e^{L (ϑ - t_{0})} - 1).$

Соответственно, в таком случае мы получим оценку

$‖r (t)‖ \leq \frac{3}{8} M_{2} (Δ_{u}^{2} + \frac{ω^{2} (Δ_{u})}{L^{2}} {(e^{L (ϑ - t_{0})} - 1)}^{2}) .$ (17)

Из сложения соответствующих уравнений выполняется следующее равенство:

$\begin{matrix} \frac{d x^{(j)}}{d t} = λ_{1} \dots λ_{n} f (t, x^{(j, -, \dots, -)}, u^{(1; j, -, \dots, -)}) + \dots \\ \dots + (1 - λ_{1}) \dots (1 - λ_{n}) f (t, x^{(j, +, \dots, +)}, u^{(1; j, +, \dots, +)}) . \end{matrix}$ (18)

Из (16)–(18) и условия C2 следует, что

$\begin{matrix} ‖\hat{x} (t) - x^{(j)} (t)‖ = ‖\int_{t_{0}}^{t} (f (τ, \hat{x} (τ), \hat{u} (τ)) - λ_{1} \dots λ_{n} f (τ, x^{(j, -, \dots, -)} (τ), u^{(j, -, \dots, -)} (τ)) - \dots \\ \begin{matrix} \end{matrix} \dots - (1 - λ_{1}) \dots (1 - λ_{n}) f (τ, x^{(j, +, \dots, +)} (τ), u^{(j, +, \dots, +)} (τ))) d τ‖ \leq \\ \leq \int_{t_{0}}^{t} ‖f (τ, \hat{x} (τ), \hat{u} (τ)) - f (τ, x^{(j)} (t), \hat{x} (τ)) + r (τ)‖ d τ \leq \\ \leq L \int_{t_{0}}^{t} ‖\hat{x} (τ) - x^{(j)} (τ)‖ d τ + \frac{3}{8} M_{2} (Δ_{u}^{2} + \frac{ω^{2} (Δ_{u})}{L^{2}} {(e^{L (ϑ - t_{0})} - 1)}^{2}) (t - t_{0}) . \end{matrix}$

Отсюда, в силу усиленной леммы Гронуолла (см. [25, гл. §1, §2, c. 26]) следует, что

$‖\hat{x} (t) - y (t)‖ \leq \frac{3 M_{2}}{8 L} (Δ_{u}^{2} + \frac{ω^{2} (Δ_{u})}{L^{2}} {(e^{L (ϑ - t_{0})} - 1)}^{2}) (e^{L (t - t_{0})} - 1) .$

В частности,

$‖\hat{x} (ϑ) - y (ϑ)‖ \leq \frac{3 M_{2}}{8 L} (Δ_{u}^{2} + \frac{ω^{2} (Δ_{u})}{L^{2}} {(e^{L (ϑ - t_{0})} - 1)}^{2}) (e^{L (ϑ - t_{0})} - 1) .$

Отсюда и из (15) получаем, что

$‖\hat{x} (ϑ) - {\bar{x}}^{(N, j)}‖ \leq \frac{3 M_{2}}{8 L} (Δ_{u}^{2} + \frac{ω^{2} (Δ_{u})}{L^{2}} {(e^{L (ϑ - t_{0})} - 1)}^{2}) \times (e^{L (ϑ - t_{0})} - 1) + δ (ϑ) .$

С учетом (12) получаем утверждение теоремы.

Замечание 4.3. Если учесть, что $Δ_{u}^{(j)}$ $-$ это минимальная величина, при которой интегральная воронка, соответствующая сужению управления ${\overset{⌣}{P}}_{j}$ , накрывает своим последним временны`м сечением куб $K_{j}$ , то можно предполагать, что для многих систем (или при некоторых дополнительных условиях) $d_{x}$ будет величиной сопоставимой с диагональю наибольшего куба $K_{j}$ , т.е. $O (Δ_{f})$ .

5. ПРИМЕР

В качестве примера управляемой системы рассмотрим модифицированную математическую модель машины Дубинса. Пусть на промежутке времени $[t_{0}, ϑ]=[0, 1]$ задана управляемая система

$\begin{matrix} \dot{x} (t) = u_{2} (t) \cos φ (t), \dot{y} (t) = u_{2} (t) \sin φ (t), \\ \dot{φ} (t) = u_{1} (t), x (0) = x^{(0)} = (0,0,0), \end{matrix}$ (19)

где $t$ $-$ время, $x =(x (t), y (t), φ (t)) \in ℝ^{3}$ $-$ вектор фазового состояния управляемой системы, $x (0)= x^{(0)}$ $-$ начальное состояние системы, $u (t)=(u_{1} (t), u_{2} (t))$ $-$ измеримая по Лебегу вектор-функция управления со значениями из $P ={(u_{1}, u_{2}) : - 1 ⩽ u_{1} ⩽ 1,0 ⩽ u_{2} ⩽ 2}$ .

Задача состоит в быстром предъявлении разрешающего программного управления $u (\cdot)= \{u (t): t_{0} ⩽ t ⩽ ϑ\}$ , которое бы переводило движение $x (t)$ управляемой системы (19) из начальной точки $x^{(0)}$ в малую окрестность точки $x^{(f)}$ , координаты которой будут сообщены в начальный момент $t_{0} =0$ . Вместе с тем, заранее известно, что целевая точка $x^{(f)}$ будет принадлежать множеству $M =[0.7, 0.9] \times [0.1, 0.3] \times [0.4, 0.6] \subset ℝ^{3}$ . Кроме того, предположим, что начальное состояние $x^{(0)}$ системы (19) известно без погрешности, т.е. $δ_{x} =0$ .

Итак, выполним алгоритм 1.

1. Выберем $N =2$ , тогда имеем разбиение $Γ = \{t_{0} =0, t_{1} =0.5, t_{2} =1\}$ c диаметром $Δ_{t} =0.5$ . Также выберем $N_{1} = N_{2} =100$ , на отрезке $[t_{0}, t_{1}]$ введем подразбиение

$Γ_{1} = \{t_{0,0} = t_{0} =0, t_{0,1} = t_{0} + \frac{Δ_{t}}{100} =0.005, \dots, t_{0, k} = t_{0} + \frac{k Δ_{t}}{100}, \dots, t_{0, N_{1}} = t_{1} =0.5\},$

на отрезке $[t_{1}, t_{2}]$ введем подразбиение

$Γ_{2} = \{t_{1,0} = t_{1} =0.5, t_{1,1} = t_{1} + \frac{Δ_{t}}{100} =0.505, \dots, t_{1, k} = t_{1} + \frac{k Δ_{t}}{100}, \dots, t_{1, N_{1}} = t_{2} =1\} .$

2. Выберем $Δ_{x} = \sqrt{3} /50$ и вычислим множества достижимости ${\tilde{X}}_{1}$ и ${\tilde{X}}_{2}$ , соответствующие моментам времени $t_{1} =0.5$ и $t_{2} =1$ (сечение ${\tilde{X}}_{2}$ плоскостью $x =0.8$ изображено на фиг. 1).

3. Поскольку хаусдорфово отклонение $h (M, {\tilde{X}}_{2}) = max_{x \in M} min_{y \in {\tilde{X}}_{2}} ∥ x - y ∥ ⩽ Δ_{x}$ (см. фиг. 1), то мы заключаем, что задача 1 разрешима для любой точки $x^{(f)}$ , которая будет сообщена в момент времени $t_{0}$ .

4. Выберем $Δ_{f} =0.1$ , $\tilde{M} ={x^{(f,1)}}$ , $x^{(f,1)} =(0.8,0.2,0.5)$ , т.е. $N_{f} =1$ , $K_{1} = M =[0.7, 0.9] \times [0.1, 0.3] \times [0.4, 0.6]$ (см. фиг. 1).

5. Поскольку чистым перебором найти минимально возможное значение $Δ_{u}$ затруднительно, то мы найдем квазиоптимальное решение следующим образом. Сперва заметим, что управление $v (t)=(v_{1} (t), v_{2} (t))=(0.5,0.831)$ при $t \in [0,1]$ приводит состояние системы $x (t)$ в точку $x^{(1)} =(0.797,0.203,0.5)$ , т.е. практически в центр куба $K_{1}$ . В связи с этим искомые кусочно постоянные управления, выводящие движение системы на вершины куба $K_{1}$ , будем искать в виде суммы управлений ${\bar{u}}^{(1, \pm, \pm, \pm)} (t)= v (t) + w^{(\pm, \pm, \pm)} (t)$ и для каждой вершины $x^{(f,1, \pm, \pm, \pm)}$ будем минимизировать $\max_{t \in [t_{0}, ϑ]} ∥ w^{(\pm, \pm, \pm)} (t) ∥$ . Последняя задача минимизации нормы имеет уже приемлемую размерность и вполне может быть решена, например, методом циклического покоординатного спуска (см. [26, гл. 7, §3]).

Фиг. 1. Сечения множеств $M$ , $\tilde{M}$ и $\tilde{X} (ϑ, t_{0}, x^{(0)})$ плоскостью $x =0.8$ .

В результате было найдено сужение управления

$\overset{⌣}{P} (t)= \{\begin{array}{l} [0.114,0.866] \times [0.331,1.331], t \in [0,0.5), \\ [0,1) \times [0.417,1.202], t \in [0.5,1], \end{array}$

с диаметром $Δ_{u} = \max_{t \in [t_{0}, ϑ]} diam (\overset{⌣}{P} (t))= \max_{t \in [t_{0}, ϑ]} \max_{u, v \in \overset{⌣}{P} (t)} || u - v ||=1.271$ .

6. Были выбраны ${\bar{x}}^{(N,1, \pm, \pm, \pm)}$ , ближайшие к $x^{(N,1, \pm, \pm, \pm)}$ , и соответствующие им кусочно постоянные управления ${\bar{u}}^{(1, \pm, \pm, \pm)} (t)$ со значениями из $\overset{⌣}{P}$ . Для дальнейшего выполнения алгоритма 2 достаточно запомнить только следующие кусочно-постоянные «узловые» управления:

${\bar{u}}^{(1, -, -, -)} (t) = \{\begin{array}{l} (0.156,0.684), t \in [0,0.5), \\ (0.644,0.741), t \in [0.5,1], \end{array} {\bar{u}}^{(1, -, -, +)} (t) = \{\begin{array}{l} (0.226,1.015), t \in [0,0.5), \\ (0.974,0.417), t \in [0.5,1], \end{array}$

${\bar{u}}^{(1, -, +, -)} (t) = \{\begin{array}{l} (0.844,0.331), t \in [0,0,5), \\ (0,1.202), t \in [0.5,1], \end{array} {\bar{u}}^{(1, -, +, +)} (t) = \{\begin{array}{l} (0.866,0.586), t \in [0,0.5), \\ (0.335,0.959), t \in [0.5,1], \end{array}$

${\bar{u}}^{(1, +, -, -)} (t) = \{\begin{array}{l} (0.114,1.082), t \in [0,0.5), \\ (0.68,0.742), t \in [0.5,1], \end{array} {\bar{u}}^{(1, +, -, +)} (t) = \{\begin{array}{l} (0.185,1.331), t \in [0,0.5), \\ (1,0.495), t \in [0.5,1], \end{array}$

${\bar{u}}^{(1, +, +, -)} (t) = \{\begin{array}{l} (0.802,0.766), t \in [0,0.5), \\ (0,1.146), t \in [0.5,1], \end{array} {\bar{u}}^{(1, +, +, +)} (t) = \{\begin{array}{l} (0.743,1.055), t \in [0,0.5), \\ (0.457,0.872), t \in [0.5,1] . \end{array}$

Таким образом, мы заготовили “узловые” управления, выполнив алгоритм 1.

Далее, пусть в некоторый момент $t_{0}$ были сообщены следующие координаты целевой точки $x^{(f)} =(0.8,0.2,0.5)$ . Для немедленного перевода состояния системы (1) в $x^{(f)}$ выполним алгоритм 2.

1. Очевидно, целевую точку $x^{(f)} =(0.8,0.2,0.5)$ содержит единственный имеющийся куб $K_{1} =[0.7, 0.9] \times [0.1, 0.3] \times [0.4, 0.6]$ .

2. Представляем $x^{(f)}$ в виде линейной комбинации

$\begin{matrix} x^{(f)} = \frac{1}{8} (x^{(f,1, -, -, -)} + x^{(f,1, -, -, +)} + x^{(f,1, -, +, -)} + x^{(f,1, -, +, +)} + \\ + x^{(f,1, +, -, -)} + x^{(f,1, +, -, +)} + x^{(f,1, +, +, -)} + x^{(f,1, +, +, +)}) . \end{matrix}$

3. В качестве искомого разрешающего программного управления получаем

$\begin{matrix} \hat{u} (t) = \frac{1}{8} ({\bar{u}}^{(1, -, -, -)} (t) + {\bar{u}}^{(1, -, -, +)} (t) + {\bar{u}}^{(1, -, +, -)} (t) + {\bar{u}}^{(1, -, +, +)} (t) + \\ + {\bar{u}}^{(1, +, -, -)} (t) + {\bar{u}}^{(1, +, -, +)} (t) + {\bar{u}}^{(1, +, +, -)} (t) + {\bar{u}}^{(1, +, +, +)} (t)) = \\ = \{\begin{array}{l} (0.492,0.856), t \in [0,0.5), \\ (0.511,0.822), t \in [0.5,1]. \end{array} \end{matrix}$

Моделирование движения системы (1) под действием полученного управления $\hat{u} (t)$ с помощью метода Рунге $-$ Кутты с шагом по времени $Δ_{t} =0.001$ показало, что состояние системы в момент времени $ϑ =1$ перешло в точку $\hat{x} (ϑ)= (0.804869,0,2016473,0.5014999)$ . Величина промаха (в евклидовой метрике) составила $|| \hat{x} (ϑ) - x^{(f,1)} ||=0.005355$ , что составляет 2.68 % от длины ребра куба $K_{1}$ , являющимся ячейкой разбиения множества возможных целевых точек.

ЗАКЛЮЧЕНИЕ

Отметим, что исследуемая в настоящей работе задача была рассмотрена ранее в [12, п. 5]. В той работе было предложено путем замены фазовой переменной переводить неопределенность в целевой точке в неопределенность по параметру. Однако в общем случае ранее предложенный в [12, п. 5] алгоритм не годится, так как для выполнения введенного в [12, п. 2] условия E фактически необходимо совпадение размерностей управляющего вектора и фазового пространства. В настоящей работе построено “прямое” решение поставленной задачи без введения вспомогательного параметра, рассмотрен пример, в котором размерность управляющего вектора меньше размерности фазового пространства. Кроме того, способы проверки выполнения введенного в [12, п. 2] условия E пока еще не найдены. В настоящей же работе все условия на управляемую систему легко проверяемы, теоретическая оценка погрешности может быть явно вычислена.

Направлениями дальнейших исследований могут быть использование нелинейной интерполяции (см. [27], [28]) программного управления для еще большей точности, исследование возможности применения интерполяции программного управления и оценке его погрешности в задачах управления системами, описываемыми дифференциальными уравнениями дробного порядка (см. [29], [30]).

About the authors

A. V. Alekseev

Experimental Machine-Design Bureau “Novator”

Author for correspondence.
Email: sztern987@gmail.com
Russian Federation, Kosmonavtov Ave. 18, Yekaterinburg, 620091

A. A. Ershov

Krasovskii Institute of Mathematics and Mechanics, Ural Branch, Russian Academy of Sciences; Ural Federal University

Email: ale10919@yandex.ru
Russian Federation, ul. Sofia Kovalevskaya, 16, Yekaterinburg, 620108; ul. Mira, 19, Yekaterinburg, 620002

References

Ли Э.Б., Маркус Л. Основы теории оптимального управления. М.: Наука, 1972. [E.B. Lee , L. Markus Foundations of Optimal Control Theory. New York: Wiley, 1967.]
Красовский Н.Н. Игровые задачи о встрече движений. М.: Наука, 1970.
Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
Veliov V.M. Parametric and functional uncertainties in dynamic systems local and global relationship. In book: Computer Arithmetic and Enclosure Methods. Amsterdam: North–Holland, 1992.
Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.
Ершов А.А., Ушаков В.Н. О сближении управляемой системы, содержащей неопределенный параметр // Матем. сб. 2017. Т. 208. № 9. С. 56. [ A.A. Ershov , V.N. Ushakov An approach problem for a control system with an unknown parameter // Sb. Math. 2017. V. 208, 9. P. 1312–1352.]
Ushakov V.N., Ershov A.A., Ushakov A.V. An approach problem with an unknown parameter and inaccurately measured motion of the system // IFAC-PapersOnLine. 2018. V. 51. № 32. С. 234.
Никольский М.С. Об одной задаче управления с неполностью известным начальным условием // Прикл. матем. и информ. 2015. Т. 51, С. 16–23. [M.S. Nikol’skii, “A Control Problem with a Partially Known Initial Condition”, Comput. Math. Model. 2017. V. 28. P. 12–17.]
Лемак С.С. К вопросу о формировании позиционных стратегий дифференциальной игры в методе экстремального прицеливания Н.Н. Красовского // Вестн. Моск. ун-та. Сер. 1. Матем., мех. 2015. Т. 6. С. 61. [S.S. Lemak, “Formation of positional strategies for a differential game in Krasovskii’s method of extremal aiming”, Moscow Univ. Mech. Bull. 2015. V. 70. No. 6. P. 157–160.]
Ушаков В.Н., Матвийчук А.Р., Паршиков Г.В. Метод построения разрешающего управления задачи о сближении, основанный на притягивании к множеству разрешимости // Тр. ИММ УрО РАН. 2013. Т. 19. № 2. С. 275. [V.N. Ushakov, A.R. Matviychuk, G.V. Parshikov, “A method for constructing a resolving control in an approach problem based on attraction to the solvability set”, Proc. Steklov Inst. Math. (Suppl.), V. 284, suppl. 1. 2014. P. 135–144.]
Ершов А.А. Интерполяция программного управления по параметру в задаче о сближении // Пробл. матем. анализа. 2022. Т. 113. С. 17. [A.A. Ershov, “Linear parameter interpolation of a program control in the approach problem”, J. Math. Sci. 2022. V. 260. No 6. P. 725–737.]
Ершов А.А. Билинейная интерполяция программного управления в задаче о сближении // Уфимск. матем. журн. 2023. Т. 15. № 3. С. 42.
Nader M., Ali J. Approximation methods and spatial interpolation in distributed control systems // ACC’09: Proceed. of the 2009 Conf. on American Control Conf. 2009. P. 860. https://folk.ntnu.no/skoge/prost/proceedings/acc09/data/papers/1097.pdf
https://patents.google.com/patent/US5197014A/en
Kowalski K., Steeb W.-H. Nonlinear dynamical systems and Carleman linearization. Singapore: World Scientific, 1991. https://doi.org/10.1142/1347
Antoulas A.C., Beattie C.A., Gugercin S. Interpolatory methods for model reduction. Philadelphia: PA, 2020. https://doi.org/10.1137/1.9781611976083
Condon M., Ivanov R. Krylov subspaces from bilinear representations of nonlinear systems // Compel-Int. J. Comp. Math. Electr. Electron. Eng. 2007. V. 26. № 2. P. 399–406. https://doi.org/10.1108/03321640710727755
Benner P., Gugercin S., Werner S.W.R. Structure-preserving interpolation of bilinear control systems // Adv. Comput. Math. 2021. V. 47. № 43. https://doi.org/10.1007/s10444-021-09863-w
Брессан А., Пикколи Б. Введение в математическую теорию управления. М.-Ижевск: Ин-т компьют. исслед., 2015. [A. Bressan, B. Piccoli Introduction to the mathematical theory of control. New York: American Instit of Math. Sci., 2007.]
Михлин С.Г. Курс математической физики. М.: Наука. 1968.
Ушаков В.Н., Ершов А.А. K решению задач управления с фиксированным моментом окончания // Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки. 2016. Т. 26. № 4. С. 543. [V.N. Ushakov, A.A. Ershov, “On the solution of control problems with fixed terminal time” [in Russian], Vestn. Udmurt. Univ. Math. Mekh. Komp'yut. Nauki. 2016. V. 26. № 4. P. 543–564.]
Новикова А.О. Построение множеств достижимости двумерных нелинейных управляемых систем пиксельным методом // Тр. “Прикладная математика и информатика”. 2015. Т. 50. С. 62.
Авдюшев В.А. Численное моделирование орбит небесных тел. Томск: Изд-кий Дом Томского гос. ун-та, 2015.
Демидович Б.П., Марон И.А. Основы вычислительной математики. М.: Наука, 1966. [B.P. Demidovich, I.A. Maron, Fundamentals of computational mathematics. Nauka, Moscow (1966)]
Лизоркин П.И. Курс дифференциальных и интегральных уравнений с дополнительными главами анализа. М.: Наука. 1981.
Бахвалов Н.С., Жидков Н.П., Кобельков Г.М. Численные методы. М.: Лаборатория Базовых Знаний, 2001.
Липцер Р.Ш., Ширяев А.Н. Нелинейная интерполяция компонент диффузионных марковских процессов (прямые уравнения, эффективные формулы) // Теория вероятн. и ее примен. 1968. Т. 13. Вып. 4. С. 602. [R. Sh. Liptser and A. N. Shiryaev, Non-Linear Interpolation of Components of Markov Diffusion Processes (Direct Equations, Effective Formulas) // Theory of Probability and its Appl. 1968. V. 13. Iss. 4. P. 564–583. https://doi.org/10.1137/1113074]
Tsuda T. Nonlinear interpolation of functions of very many variables // Numer. Math. 1975. V. 24. P. 395. https://doi.org/10.1007/BF01437408
Гомоюнов М.И., Лукоянов Н.Ю. Построение решений задач управления линейными системами дробного порядка на основе аппроксимационных моделей // Тр. ИММ УрО РАН. 2020. Т. 26. № 1. С. 39. [M.I. Gomoyunov, N.Y. Lukoyanov, Construction of Solutions to Control Problems for Fractional-Order Linear Systems Based on Approximation Models. Proc. Steklov Inst. Math. 2021. V. 313 (Suppl 1). S73–S82. https://doi.org/10.1134/S0081543821030093]
Плеханова М.В. Задачи стартового управления для эволюционных уравнений дробного порядка // Челяб. физ.-матем. журн. 2016. Т. 1. № 3. C. 15. [M. V. Plekhanova, “Start control problems for fractional order evolution equations”, Chelyab. Fiz.-Mat. Zh. 2016. V. 1. P. 15–36. https://www.mathnet.ru/eng/chfmj27]

Supplementary files

Supplementary Files

Action

1. JATS XML

Download

2. Fig. 1. Sections of sets , and by plane .

Download (106KB)

Indexing metadata

Username
Password
Remember me

Forgot password?	Register

Username
Password
Remember me

Forgot password?	Register

Vol 65, No 12 (2025)

Vol 65, No 12 (2025)

Target-point interpolation of a program control in the approach problem

Full Text

Abstract

Keywords

Full Text

ВВЕДЕНИЕ

2. ПОСТАНОВКА ЗАДАЧИ

3. АЛГОРИТМ РЕШЕНИЯ ЗАДАЧИ О СБЛИЖЕНИИ

Алгоритм 1

Алгоритм 2

4. ОЦЕНКА ПОГРЕШНОСТИ

5. ПРИМЕР

ЗАКЛЮЧЕНИЕ

About the authors

A. V. Alekseev

A. A. Ershov

References

Supplementary files