The problem of trajectories avoiding from rarefied terminal sets
- 作者: Yugay L.P.1
-
隶属关系:
- Uzbek State University of Physical Culture and Sport
- 期: 卷 88, 编号 1 (2024)
- 页面: 67-78
- 栏目: Articles
- URL: https://bakhtiniada.ru/0032-8235/article/view/260204
- DOI: https://doi.org/10.31857/S0032823524010058
- EDN: https://elibrary.ru/YUOZHZ
- ID: 260204
如何引用文章
全文:
详细
The problem of trajectories avoiding in nonlinear conflict-controlled processes (differential games) in L.S. Pontrjagin and E.F. Mishchenko statement is considered. Terminal sets have a particular rarefied structure. Unlike other works, they consist of countable points and may have a limit points. New sufficient conditions and evasion methods are obtained, which make it possible to solve a number of avoiding trajectory problems of oscillatory systems, including the swinging problem of the generalized mathematical pendulum.
全文:
- Введение. Постановка глобальной задачи уклонения траекторий. Пусть конфликтно управляемый процесс описывается уравнением
(1.1)
где точка над означает производную по времени, , и — компакты с началами своих несущих пространств . Функция непрерывна по и удовлетворяет условиям:
1) Для каждого компакта найдется константа Липшица , такая, что при всех выполняется условие Липшица:
(1.2)
2) Для любых компактов найдутся такие константы Липшица и , что (монотонность по включению).
3) Для всех выполняется неравенство (оценка) Филиппова:
(1.3)
Терминальное множество имеет вид:
(1.4)
Параметры и в (1.1) выбираются двумя сторонами (игроками) в виде измеримых функций , ; , при этом каждый игрок решает свою задачу. Игрок, выбирающий (уклоняющийся игрок), стремится при любом допустимом уклонить соответствующую выбранным управлениям траекторию уравнения (1.1), от терминального множества при всех . Такую задачу называют глобальной задачей уклонения (убегания) от . Задача второго игрока (преследующего) заключается в приведении траектории в некоторый конечный момент времени на терминальное множество при любом допустимом поведении уклоняющейся стороны. Впервые глобальная задача уклонения (убегания) была изложена в работе Л.С. Понтрягиным и Е.Ф. Мищенко [1, стр. 335–338], при этом постановка задачи существенно отличалась от постановок дифференциальных игр в [2, 3].
Множества вида (1.4) имеют разреженную структуру. Задачи управления и конфликтного управления траекториями (1.1) относительно таких терминальных множеств возникают при исследовании различных колебательных процессов [3–13]. Действительно, при исследовании конфликтно управляемых колебательных систем важным является приведение траектории системы в одно из ее положений равновесия (задача преследования) или уклонение траектории от всех положений равновесия исследуемой системы (задача уклонения). В совокупности указанные положения равновесия образуют терминальное множество, которое для многих колебательных систем является дискретным (разреженным), и имеют вид (1.4), соответствующий пример приведен и исследован ниже.
В данной работе исследуется глобальная задача уклонения траекторий (1.1) от разреженного терминального множества (1.4). Предполагается, что уклоняющийся игрок при формировании управления уклонения знает начальную позицию, терминальное множество, параметры (1.1) и значение управления в тот же момент времени, но не знает значения при . Заметим, что выбранное управление преследователя и конструируемое управление уклоняющегося игрока в паре должны порождать единственную траекторию системы (1.1), удовлетворяющую заданным начальным условиям. Такие пары управлений называются совместными. Все типы совместных пар управлений (стратегий) для позиционных дифференциальных игр рассмотрены в [17].
В настоящей статье решена глобальная задача уклонения, указано правило построения стратегии уклонения на основе локальных управлений маневров обхода точек терминального множества (Теорема 4.1) и приведен пример.
- Основные определения и леммы
2.1. Свойства решений на компактах. Пусть и соответственно, замкнутый шар и сфера радиусов c центрами в точке , — начало , — выпуклая оболочка множества , null — знак скалярного произведения, — внутренность множества относительно , null, . Всюду ниже константами будут называться положительные числа, зависящие от исходных параметров процесса (1.1) , но не зависящие от управлений и хода процесса уклонения.
Лемма 2.1. (о выборе компакта). Пусть в задаче уклонения (1.1) — (1.4) точка , — некоторое допустимое решение (1.1), . Тогда для всех выполняется:
1) (2.1)
где
2) Решение и будет единственным на отрезке .
Доказательство. Пусть — любое допустимое решение (1.1), определенное при , . Тогда из (1.1) и (1.3) получаем:
Интегрирование последнего неравенства приводит к оценкам:
из которых следует неравенство для в (2.1):
(2.2)
Второе неравенство из (2.1) для оценки легко следует из (2.2):
(2.3)
Из (2.2) следует, что траектория за конечное время не сможет “уйти в бесконечность”, поэтому она продолжаема вправо при всех , тем самым будет существовать и при всех .
Оставшееся неравенство из (2.1) доказывается аналогично.
Выберем в (1.2) компакт , и пусть — соответствующая константа Липшица. Тогда (1.2) и (2.2) обеспечивают существование и единственность решения , и условие при всех . Лемма доказана.
Лемма 2.2. Если в Лемме 2.1 дополнительно положить, что где константа , то найдутся константы и , для которых при всех справедливо неравенство
(2.4)
Доказательство. Пусть — решение (1.1), удовлетворяющее начальным условиям и определенное при . По лемме 2.1 , . Пусть далее , — константа Липшица для . Тогда из интегрального представления решения (1.1) равенства
и условия Липшица (1.2) имеем неравенство
(2.5)
где . Применение к (2.5) известного неравенства Гронуолла–Беллмана [13] приводит к неравенству
,
отсюда можно видеть, что
(2.6)
Положим и . Поскольку то поэтому по условию монотонности констант Липшица будет где является, очевидно, константой. С учетом этих замечаний, заменяя в (2.6) на получим (2.4), в котором за константы можно принять , . Лемма доказана.
Замечание 2.1. Неравенства (2.3) и (2.4) дают различные верхние оценки для , что необходимо для использования в следующих целях: (2.3) позволяет траектории находиться внутри определенного компакта, а “более тонкое” неравенство (2.4) понадобится ниже при доказательстве локального маневра уклонения (обхода) траектории от точки внутри того же компакта. Кроме того, оценка (2.3) зависит от и , не являющихся, вообще говоря, константами (они зависят от ), в то время как в (2.4) входят только константы.
2.2. Свойства наборов Каратеодори. Пусть . Введем обозначения:
(2.7)
(2.8)
Определение 2.1. [14, стр.6]. Набор векторов называется аффинно независимым, если линейно независимы векторы
Определение 2.2. Множество векторов называется набором Каратеодори (или -набором), если эти векторы аффинно независимые и их выпуклая комбинация равна . Множество всех наборов Каратеодори, составленных из векторов множеств ((2.7) — (2.8)) обозначим через , , .
Определение 2.3. Пусть
,
где , .
Ясно, что если , то числа . Условия, при которых числа и положительны, даются в нижеследующей лемме.
Лемма 2.3. Пусть . Тогда , , .
Доказательство. Непрерывная функция null после операций минимума и максимума на компакте будет непрерывной по , поэтому для каждого найдется число , такое, что при каждом строгое неравенство в определении будет сохраняться, тем самым будет выполняться включение
(2.9)
является окрестностью радиуса точки на сфере , тогда представляет собой -мерный “шаровой сегмент”, поэтому из (2.9) будет следовать включение
, (2.10)
отсюда в силу (размерность “шарового сегмента”) и (2.10) следует, что . Здесь под размерностью множества понимается размерность его несущего пространства.
Теперь легко показать, что . Действительно, в силу , в можно выбрать систему из линейно независимых векторов. Добавление к этой системе любого вектора из , не равного выбранным векторам, приведет к системе из векторов, которая, очевидно, образует — набор из .
Докажем, что . Пусть при выбранных будет . Тогда по теореме Каратеодори [14, 15] для некоторых
(2.11)
будет справедливо представление
(2.12)
Далее, для каждого найдется такое число что в силу (2.9)
(2.13)
Очевидно, что в каждый “шаровой сегмент” можно вписать шар радиуса , с центром, расположенным на векторе . Пусть . Из простых геометрических соображений следует, что
(2.14)
Из (2.13) и (2.14) имеем включения
(2.15)
Далее, из (2.11)–(2.15) получаются соотношения
которые показывают, что . Лемма доказана.
- Теорема о локальном уклонении
Предположение 3.1 (о разреженности ). Существует число такое, что множество при , а при каждом состоит из конечного числа точек терминального множества .
Предположение 3.2. и , где является пересечением всех множеств .
Теорема 3.1 (о локальном уклонении). Пусть для конфликтно управляемого процесса (1.1)–(1.4) выполняются Предположения 3.1, 3.2 и — фиксированная точка. Тогда существуют такие константы , что для любой начальной позиции с условием и любого допустимого управления существует специально конструируемое измеримое управление , такое, что траектория уравнения (1.1), , соответствующая управлениям и , удовлетворяет при всех неравенствам:
- , (3.1)
- (3.2)
- (3.3)
Далее, неравенства (3.1)–(3.3) обеспечивают уклонение траектории от терминального множества на “малом” отрезке времени .
Доказательство. Пусть и — константа Липшица для . В силу выбора и Леммы 2.1, точки и находятся внутри шара . Будем считать, что в Предположении 3.2 (случай рассматривается аналогично). Тогда по Лемме 2.3 и , поэтому найдется набор , для которого
(3.4)
Для выбранной точки зафиксируем -набор и выберем в этом наборе вектор , для которого при всех имеет место неравенство:
(3.5)
Такой вектор существует, потому что является набором Каратеодори и (Предположение 3.2). Далее, для вектора и управления , согласно Лемме Филиппова об измеримом выборе для дифференциальных игр [15], найдется такая измеримая функция , что справедливо неравенство
(3.6)
Управление называется специальным управлением уклонения от точки при , а процесс применения — локальным маневром уклонения (обхода) [1]. Рассмотрим решение , , соответствующее выбранному преследователем допустимому управлению и специальному управлению уклонения . По лемме 2.1 для построенных и траектория будет находиться в шаре при всех .
Из интегрального представления решения уравнения (1.1), равенства
условия Липшица (1.2) и неравенств (3.4)–(3.6) вытекает, что
(3.7)
Для интеграла в (3.7), согласно неравенству (2.4) Леммы 2.2, имеем оценку:
(3.8)
Введем следующие константы:
, , (3.9)
, (3.10)
В (3.9) константы существуют в силу Предположения 1 о разреженности , константа введена в Лемме 2.2 (формула (2.4)).
Далее, непосредственное применение к неравенствам (3.7) и (3.8) результатов Леммы 2.2 с выбранными константами (3.9)–(3.10) приводит к выполнению при всех следующих неравенств:
(3.11)
; (3.12)
Объединяя (3.11) и (3.12), получаем доказательство аналогов неравенств (3.2) и (3.3):
; (3.13)
(3.14)
Неравенства (3.13) и (3.14) показывают, что при траектория не будет совпадать с точкой , оставаясь в -окрестности точки , а в момент траектория покидает -окрестность точки , но остается по-прежнему в ее — окрестности, значит, не будет находиться в -окрестностях остальных точек и не попадает на все , тем самым уклоняясь от него при всех . Таким образом, специальное управление уклонения обеспечивает локальное уклонение траектории (1.1) от “на малом” положительном отрезке времени при этом, за время локального уклонения от точки траектория не покидает шар .Теорема доказана.
Замечание 3.1. Специальное управление уклонения формируется на основе (3.4)–(3.6) в виде измеримой функции , , которая в каждый момент времени зависит еще от начальной позиции точки и значения управления .
Замечание 3.2. В дальнейшем при уклоняющемуся игроку предлагается полагать до тех пор, пока при некотором , в некоторый первый момент будет выполняться неравенство
Тогда значения и выбираются за новые начальные данные, и уклоняющийся игрок совершает при маневр уклонения от точки , при этом локальное управление обхода точки строится в соответствии с (3.4)–(3.6). Здесь возможен случай, когда , что соответствует повторному маневру обхода точки .
- Глобальное уклонение (основной результат)
Теорема 4.1 (о глобальном уклонении). Пусть для конфликтно управляемого процесса (1.1) с разреженным терминальным множеством (1.4) выполняются Предположения 3.1 и 3.2. Тогда из любой начальной позиции , при всех возможно уклонение от траектории , уравнения (1.1). Доказательство будет следовать идеям [1, 4, 12] и заключаться в применении Теоремы 3.1 о локальном уклонении к возможности глобального уклонения траектории при всех .
Выберем константу такой, что (Предположение 3.1) и пусть
(4.1)
Дополнительно выберем так, чтобы для точек и выполнялись условия Леммы 2.1 о выборе компакта, для этого достаточно взять
(4.2)
В силу (4.2) и Леммы 2.1 все точки и находятся в шаре . Для каждой точки можно определить в соответствии с Теоремой 3.1 набор констант , которые обеспечивают локальный маневр уклонения от каждой точки ; .
Введем для каждого следующие множества:
, , (4.3)
где — символ границы множества. Заметим, что в силу выбора констант (3.9)–(3.10) множества попарно не пересекаются при . Из открытых множеств выделим те, для которых
(4.4)
Пусть это будут множества при , при этом, увеличивая, если нужно , можно добиться выполнения включений
при (4.5)
Введем следующие множества: — объединение при ; есть объединение при . В силу открытости множеств будет компактным и содержать точки из (остальные точки исключены из по построению). По существу представляет собой шар с удаленными из него открытыми шарами радиусов с центрами в точках , , имеющими непустые пересечения с границей множества .
Организуем первый цикл процесса уклонения, которое будет происходить в множестве . Пусть — некоторая допустимая траектория конфликтно управляемой системы (1.1) с начальным условием .
Для поведения в возможны следующие два случая:
Траектория начинается и находится внутри , не выходя на границу при всех . При этом во время пребывания в и формирования уклоняющийся игрок может совершить конечное или бесконечное число маневров обхода точек из . Напомним, что в периоды между маневрами уклоняющийся игрок может применять любое допустимое управление, например, равное нулевому вектору;
Траектория начинается внутри , и в некоторый первый конечный момент времени выходит на границу . При этом до выхода на границу уклоняющийся игрок может совершить конечное число маневров обхода точек из .
Рассмотрим случай . Здесь каждый маневр обхода (если он имеет место) уклоняет траекторию от некоторой точки из , значит, и от всего (Теорема 3.1). Конечное число маневров не приводит траекторию на М , а пребывание в множестве при всех указывает на то, что при всех , то есть из точки возможно уклонение. Если же уклоняющийся игрок, находясь в , совершает бесконечное число маневров обхода от точек конечного множества , то найдется точка , относительно которой происходит бесконечное число маневров обхода с фиксированным временем обхода. Тогда общее время обхода будет бесконечным, значит, в рассматриваемом случае из начальной точки возможно уклонение от при всех .
Рассмотрим случай Прежде всего заметим, что уклоняющийся игрок в этом случае может совершить лишь конечное число маневров обхода, поскольку бесконечное число маневров обхода потребует бесконечного времени (см. ), и тогда конечного времени выхода на границу не будет. Таким образом, уклоняющийся игрок после конечного числа маневров обхода выходит на границу в некоторый момент времени , т.е. .
На этом первый цикл уклонения во множестве завершается и начинается организация второго цикла уклонения. В этом случае принимаем за новые начальные данные , . Заметим, что новое начальное значение , поскольку граница по построению множества не содержит точек из . Далее, все построения производятся аналогично первому циклу. Сначала определяется шар , такой, что и
для этого можно положить .
Для повторяем все рассуждения, аналогичные (4.1)–(4.5), и строим множество (аналог ), для которого рассматривают два случая типа и . Очевидно, что по построению . Продолжая индуктивно этот процесс, получаем для случаев типа (случаи типа легко анализируются) последовательность вложенных множеств
(4.6)
с радиусами . Процесс уклонения траектории , на -м цикле состоит в уклонении внутри множества и выходом ее в случае на границу в первый момент времени , который принимается за начало следующего цикла. Заметим, что в (4.6) цепочка включений может оказаться конечной, т.е. на некотором конечном цикле выхода на границу множества не происходит, и процесс бесконечного уклонения разрешается случаем . Покажем, что в случае бесконечной цепочки включений (4.6), когда каждый цикл завершается выходом траектории на границу множества (случай ), траектория , не попадет на при всех . Время перехода из на границу за циклов уклонения будет равно , где все слагаемые положительны. Ясно, что по построению траектория при всех .
Покажем, что при . Допустим противное: . Тогда траектория не выйдет из шара , где , что противоречит тому, что радиусы шаров неограниченно возрастают. Поскольку , при , то убегание из точки возможно при всех . Теорема доказана.
- Пример. Задача о раскачке обобщенного математического маятника. Уравнения движения конфликтно управляемой системы (обобщенного математического маятника) имеют вид (ср. [3, 4]):
(5.1)
где ; , , ; , , .
Терминальное множество есть объединение положений равновесия (5.1), имеющих вид , где — неотрицательные корни уравнения ; . Нетрудно показать, что для корней этого уравнения справедлива оценка
(5.2)
из которой легко следует, что имеет предельную точку на бесконечности.
Рассмотрим для (5.1) задачу уклонения (раскачки маятника) от [3, 4]. Проверим выполнимость Предположений 3.1 и 3.2 теоремы 4.1 об уклонении. Предположение 3.1 (о дискретности) выполнено в силу (5.2). Далее, для (5.1) в условиях (1.2) и (1.3) можно положить (ср. [3, 4]) , , отсюда видна их выполнимость. Предположение 3.2 выполнено, если . Поэтому по Теореме 4.1 задача о раскачке обобщенного математического маятника (5.1) разрешима.
Замечание 5.1. Для (5.1) при не выполняются условия разрешимости задачи о раскачке маятника из работ [3, 4], в которых требуется строгая дискретность терминального множества (отсутствие предельных точек). При условия разрешимости данной работы и [3, 4] совпадают.
Замечание 5.2. Выбор аргумента синуса в (5.1) связан с возможными неточностями при его измерении либо с неопределенностью в точном определении самих значений синуса (см. например [16]).
Заключение. Для глобальной задачи уклонения траекторий от разреженных множеств получены эффективные достаточные условия уклонения, указаны способы построения управления уклонения и приведен пример (обобщенный математический маятник). Основные результаты статьи изложены в [12].
Автор выражает глубокую благодарность Академику РАН Ф.Л. Черноусько за поддержку и советы, способствовавшие улучшению полученных результатов.
作者简介
L. Yugay
Uzbek State University of Physical Culture and Sport
编辑信件的主要联系方式.
Email: yugailp@mail.ru
乌兹别克斯坦, Chirchik
参考
- Pontrjagin L.S. Selected Proceedings. Moscow: MAKS Press, 2004. 552 p. (in Russian)
- Isaacs R. Differential Games. N.Y.: Wiley, 1965.
- Krasovskii N.N., Subbotin A.I. Positional Differential Games. Moscow: Nauka, 1974. 496 p.
- Mishchenko E.F., Nikolskii M.S., Satimov N. The problem of avoiding encounter in several person differential games// Proc. Steklov Inst. of Math., 1977, iss. 143, pp. 105–128. (in Russian)
- Mishchenko E.F., Satimov N. The problem of avoiding encounter in differential games with nonlinear controls // Diff. Eqns., 1973, vol. 9, no. 10, pp. 1792–1797. (in Russian)
- Chernousko F.L., Akulenko L.D., Sokolov B.N. Control of Oscillations. Moscow: Nauka, 1980. 484 p. (in Russian)
- Reshmin S.A., Chernousko F.L. Properties of the time-optimal feedback control for a pendulum-like system // JOTA, 2014, vol.163, no. 1, pp. 230–252.
- Pilipenko Yu.V., Chikrii A.A. The oscillatory conflict controlled processes // JAMM, 1993, vol. 57, iss. 3, pp. 3–14. (in Russian)
- Bolotnik N.N., Nunuparov A.M., Chashchukhin V.G. Capsule-type vibration-driven robot an electromagnetic actuator and an opposing spring: dynamics and control of motion // J. Comput.&Syst. Sci. Int., 2016, vol. 55, no. 6, pp. 986–1000.
- Gusyatnikov P.B., Yugay L.P. On an evasion problem in nonlinear differential games with terminal set of compound structure// Izv. AN SSSR Techn. Kibern., 1977, no. 2, pp. 8–13. (in Russian)
- Mamadaliev N. On an one pursuit problem with integral restrictions on control of players // Sib. Math. J., 2015, vol. 56, no. 1, pp. 129–148. (in Russian)
- Yugay L.P. The problem of trajectories avoiding from rarefied terminal set // Dokl. Math., Inform., Control Proc., 2020, vol. 495,pp. 80–84. doi: 10.31857/S268695432006020X
- Yugay L.P. Nonlinear integral inequalities and differential games of avoiding encounter // in: Recent Developments in Automatic Control Systems. Alsbergvej: River Pub., 2022, pp. 97–111.
- Leihtweis K. Convex Sets. Moscow: Nauka, 1985. 336 p. (in Russian)
- Polovinkin E.S. Multi-Valued Analysis and Differential Inclusions. Moscow: Fizmatlit, 2014. 524 p. (in Russian)
- Kurzhanskii A.B. Control and Observation under Uncertainty. Moscow: Nauka, 1977. 392 p. (in Russian)
- Subbotin A.I., Chentsov A.G. Optimization of Guarantee in Control Problems. Moscow: Nauka, 1981. 288 p. (in Russian)
补充文件
