Higher-Order Iterative Learning Control Algorithms for Linear Systems

P. V. Pakshin; Пакшин П. В.; Yu. P. Emelianova; Емельянова Ю. П.; M. A. Emelyanov; Емельянов М. А.

doi:10.31857/S0044466924040056

Алгоритмы управления с итеративным обучением высшего порядка для линейных систем

Авторы: Пакшин П.В.¹, Емельянова Ю.П.¹, Емельянов М.А.¹
Учреждения:
1. АПИ НГТУ им. Р.Е. Алексеева
Выпуск: Том 64, № 4 (2024)
Страницы: 644-657
Раздел: ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ
URL: https://bakhtiniada.ru/0044-4669/article/view/269969
DOI: https://doi.org/10.31857/S0044466924040056
EDN: https://elibrary.ru/ZKANBV
ID: 269969

Цитировать

Полный текст

Аннотация
Полный текст
Об авторах
Список литературы
Дополнительные файлы
Статистика

Аннотация

Алгоритмы управления с итеративным обучением появились в связи с задачами повышения точности выполнения повторяющихся операций роботами. Они используют информацию из прошлых повторений для корректировки управляющего сигнала на текущем повторении. Чаще всего используется только информация из предыдущего повторения. Алгоритмы управления с итеративным обучением, которые используют информацию из нескольких предыдущих повторений, называются алгоритмами высшего порядка. В последнее время в литературе повысился интерес к этим алгоритмам в связи с задачами роботизированных аддитивных производств. Однако помимо того, что эти алгоритмы мало изучены, относительно их свойств имеются противоречивые оценки. В настоящей статье предлагаются новые алгоритмы управления с итеративным обучением высшего порядка для линейных дискретных и дифференциальных систем, идея построения которых основана на аналогии с многошаговыми методами в теории оптимизации, в частности, с методом тяжелого шарика. Приведен пример, подтверждающий возможность увеличения скорости сходимости ошибки обучения при использовании таких алгоритмов.

Ключевые слова

управление с итеративным обучением, линейные системы, алгоритмы высшего порядка, повторяющиеся процессы, сходимость, устойчивость, векторная функция Ляпунова, линейные матричные неравенства

Полный текст

ВВЕДЕНИЕ

Методы и алгоритмы управления с итеративным обучением появились как инструмент повышения точности выполнения повторяющихся операций роботами (см. [1]). После появления пионерской работы [1], в силу относительной простоты и естественной структуры конечных алгоритмов, управление с итеративным обучением (УИО) быстро приобрело широкую популярность, как среди теоретиков, так и среди практиков. Для первоначального знакомства с этим активно развивающимся направлением можно рекомендовать обзоры [2], [3], а также недавнюю монографию [4]. В настоящее время алгоритмы УИО находят эффективное применение в аддитивных производствах, в частности, в установках высокоточного многослойного лазерного напыления (см. [5], [6]) в медицинских роботах для реабилитации больных, перенесших инсульт (см. [7], [8]), в устройствах поддержки желудочка сердца (см. [9]) и в других многочисленных приложениях.

Одной из важнейших задач является повышение скорости сходимости алгоритмов УИО. Для решения этой задачи используются различные подходы. В настоящей работе предлагается подход, мотивированный идеей многошаговых методов в теории оптимизации (см. [10]). Хорошо известно, что такие двуxшаговые методы как метод тяжелого шарика и метод сопряженных градиентов позволяют существенно ускорить сходимость градиентного метода (см. [10]–[12]). Алгоритмы УИО, аналогично алгоритму градиентного метода, для формирования управления на текущем шаге используют информацию с текущего и предыдущего шагов и, как в многошаговых методах оптимизации, можно ожидать, что учет в этих алгоритмах более глубокой “предыстории” позволит ускорить сходимость. Далее алгоритмы УИО, использующие информацию с текущего и предыдущего шагов будем называть алгоритмами первого порядка, а при использовании информации с большего числа предыдущих шагов — алгоритмами высшего порядка.

Предлагаемый подход не является абсолютно новым и в различных версиях изучался в литературе (см. [13]–[21]). Однако во всех этих работах на текущем шаге используется лишь неполная информация об управлении на прошлых шагах, что представляется нелогичным в рамках указанных аналогий с многошаговыми методами оптимизации, где роль “управления” выполняет аргумент оптимизируемой функции. Тем не менее, в работах [14], [15] показано что даже такие “неполные” структуры УИО высшего порядка обеспечивают более высокую скорость сходимости, чем структуры УИО первого порядка. Такие же результаты были получены в [16]–[19], причем в [16]–[18] утверждаeтся, что эффект ускорения в алгоритмах высшего порядка достигается за счет эффектов обучения в течение нескольких предыдущих итераций. В [20] относительно УИО высшего и первого порядков представлены весьма неопределенные выводы. Авторы этой работы считают, что трудно обосновать достоинства той или иной стратегии УИО, хотя идея УИО высшего порядка кажется естественной. В работе [21] предложен алгоритм УИО на основе метода Нестерова (см. [22]), но скорость сходимости алгоритма по доказанному авторами составляет O (1 / k), в то время, как хорошо известно, она составляет O (1 / k²) (см. [22], [23]). Кроме того, предложенный алгоритм относится к типу причинных алгоритмов УИО и обладает известными недостатками (см. [2]), существенно ограничивающими их применение. Важно отметить, что выводы перечисленных работ сделаны на рассмотрении частных случаев и примеров, и ни в одной из них не приведен строгий сравнительный анализ в общей постановке даже для линейных систем.

В литературе изучались также другие свойства УИО высшего порядка (см. [24], [25]). В [24] утверждается, что реальной мотивацией использования УИО высшего порядка является уменьшение влияния помех и шума. В [25] рассматривается оптимальность УИО в смысле минимизации следа ковариационной матрицы ошибок управления в классе некоррелированных случайных возмущений. Показано, что УИО высшего порядка не уменьшает минимальное значение этого следа по сравнению с УИО первого порядка. Таким образом, выводы [24] и [25] противоречат друг другу. Окончательный вывод требует дополнительного исследования, поскольку в [24] не представлено достаточно полных доказательств, а в [25] в алгоритме УИО используется дискретный аналог производной необработанного случайного сигнала, и такое решение нельзя считать допустимым, поскольку уже само вычисление такой величины приводит к возрастанию дисперсии. Вопросы скорости сходимости ошибки обучения в [24] и [25] не изучались.

Наконец, отметим, что совсем недавно появился активный интерес к разработке и применению алгоритмов УИО высшего порядка в задачах аддитивных производств (см. [26]), мотивированный особенностями новых прикладных задач.

В настоящей работе, в отличие от упомянутых работ, строятся непричинные алгоритмы УИО, при этом по аналогии с многошаговыми методами на текущем повторении используется полная предыстория, т. е. полностью учитываются управляющие воздействия на определенном числе предыдущих повторений. Для построения алгоритмов используется разработанная авторами теория устойчивости повторяющихся процессов (см. [27]), в рамках которой условия сходимости ошибки обучения выражаются через свойства дивергенции векторной функции Ляпунова. В рассматриваемом линейном случае эта теория позволяет использовать эффективную технику линейных матричных неравенств. Общих результатов, доказывающих преимущество алгоритмов УИО высшего порядка в смысле увеличения скорости сходимости ошибки обучения, пока получить не удалось, но приведенный пример, использующий характеристики реального портального робота, убедительно подтверждает это преимущество и служит серьезной мотивацией для дальнейшего развития общей теории.

ДИСКРЕТНЫЕ СИСТЕМЫ

2.1. Постановка задачи

Рассмотрим дискретную систему в повторяющемся режиме, описываемую линейной моделью в пространстве состояний

$x_{k} (p + 1) = A x_{k} (p) + b u_{k} (p), y_{k} (p) = c^{T} x_{k} (p), 0 \leq p \leq N - 1, k \geq 0,$ , (1)

где k — номер повторения, $x_{k} (p) \in ℝ^{n_{x}}$ — вектор состояния, $u_{k} (p) \in ℝ$ — скалярная входная переменная, имеющая смысл управления, действующего на систему, $y_{k} (p) \in ℝ$ — выходная переменная, которая в рассматриваемом классе задач часто называется профилем повторения, N — продолжительность повторения, A, b и c — постоянная матрица и векторы соответствующих размеров.

Закон управления формируется в соответствии с алгоритмом

$u_{k} (p) = \sum_{i = 0}^{d} τ_{i} v_{k - i} (p)$ , (2)

$v_{k + 1} (p) = v_{k} (p) + Δ v_{k + 1} (p), k = 0, 1, \dots$ , (3)

где v_k = 0, если k ∈[–d, 0], d — число предыдущих повторений, информация с которых используется на текущем повторении, Δv_k+₁ — обновляющая поправка на повторении k + 1, τ_i, i ∈[0, d] — весовые коэффициенты.

Обозначим через $y_{r e f} (p) \in ℝ$ , 0 ≤ p ≤ N – 1, желаемую (эталонную) траекторию, которая должна воспроизводиться на выходе системы, тогда

$e_{k} (p) = y_{r e f} (p) - y_{k} (p)$ (4)

представляет собой ошибку обучения на повторении k. Поставим задачу найти такую последовательность управлений {u_k}, что выполняются условия

$|e_{k} (p)| \leq κ ϱ^{k}, κ > 0, 0 < ϱ < 1$ , (5)

$\lim_{k \to \infty} |u_{k} (p) |=| u_{\infty} (p)| < \infty, p \in [0, N - 1]$ . (6)

Эти условия обеспечивают сходимость ошибки обучения к нулю при k → ∞ при сохранении ограниченности последовательности входных переменных. Далее эти условия будем называть условиями сходимости.

Из условий (2) и (3) следует, что эта задача сводится к нахождению обновляющей поправки и весовых коэффициентов, при которых гарантируется выполнение условий (5) и (6). В соответствии с концепцией, предложенной Я. З. Цыпкиным (см. [28]), эта задача относится к задачам обучения. При d = 0 и τ_i = 1, когда на текущем повторении используется только информация с предыдущего повторения, эта задача известна как задача построения алгоритма управления с итеративным обучением первого порядка, которая наиболее полно изучена в литературе. При d > 0 имеем задачу построения алгоритма управления с итеративным обучением высшего порядка, которая изучена значительно меньше.

Заметим, что рассмотрение систем со скалярными входными и выходными переменными связано лишь с возможностью более компактного изложения результатов, и в случае систем с векторными входными и выходными переменными принципиальных затруднений не возникает.

2.2. Построение модели относительно приращений переменных в форме повторяющегося процесса

Введем скалярные переменные ${\overset{ˇ}{x}}_{k, 1} (p) = v_{k} (p), {\overset{ˇ}{x}}_{k, 2} (p) = v_{k - 1} (p), . . ., {\overset{ˇ}{x}}_{k, d} (p) = v_{k - d + 1} (p), {\overset{ˇ}{x}}_{k - d + 1} (p) = v_{k - d} (p)$ и вектор ${\overset{ˇ}{x}}_{k} = {[{\overset{ˇ}{x}}_{k, 1} . . . {\overset{ˇ}{x}}_{k, d + 1}]}^{T}$ . Тогда по построению

${\overset{ˇ}{x}}_{k} (p) = A_{d} {\overset{ˇ}{x}}_{k - 1} (p) + b_{d} v_{k} (p)$ , (7)

где

$A_{d} = [\begin{array}{l} 0 & 0 & \dots & 0 & 0 \\ 1 & 0 & \dots & 0 & 0 \\ 0 & 1 & \dots & 0 & 0 \\ ⋮ & ⋮ & ⋱ & ⋮ & ⋮ \\ 0 & 0 & \dots & 1 & 0 \end{array}], b_{d} = {[1 0 \dots 0]}^{T}$ . (8)

С использованием (7) первое уравнение в (1) можно записать как

$x_{k} (p + 1) = A x_{k} (p) + b θ^{T} {\overset{ˇ}{x}}_{k} (p)$ , (9)

где

$θ = {[τ_{0} τ_{1} \dots τ_{d}]}^{T}$ .

Введем вспомогательные векторы

$η_{k} (p) = x_{k} (p) - x_{k - 1} (p), {\overset{ˇ}{η}}_{k} (p) = {\overset{ˇ}{x}}_{k} (p) - {\overset{ˇ}{x}}_{k - 1} (p)$ . (10)

Тогда из (7) и (10) следует

${\overset{ˇ}{η}}_{k} (p) = A_{d} {\overset{ˇ}{η}}_{k - 1} (p) + b_{d} ∆ v_{k} (p)$ , (11)

где $Δ v_{k} (p) = v_{k} (p) - v_{k - 1} (p)$ . Учитывая (10), запишем уравнение в приращениях вдоль траектории повторения в виде

$η_{k} (p + 1) = A η_{k} (p) + b θ^{T} A_{d} {\overset{ˇ}{η}}_{k - 1} (p) + b θ^{T} b_{d} ∆ v_{k} (p)$ . (12)

Учитывая, что согласно (4) $e_{k} (p) = y_{r e f} (p) - c^{T} x_{k} (p)$ , и, используя (12), получим следующую систему уравнений в приращениях переменных:

$η_{k} (p + 1) = A η_{k} (p) + b θ^{T} A_{d} {\overset{ˇ}{η}}_{k - 1} (p) + b θ^{T} b_{d} ∆ v_{k} (p), {\overset{ˇ}{η}}_{k} (p) = A_{d} {\overset{ˇ}{η}}_{k - 1} (p) + b_{d} ∆ v_{k} (p), {\overset{ˇ}{e}}_{k} (p) = - c^{T} A {\overset{ˇ}{η}}_{k} (p) - c^{T} b θ^{T} A_{d} {\overset{ˇ}{η}}_{k - 1} (p) + {\overset{ˇ}{e}}_{k - 1} (p) - c^{T} b θ^{T} b_{d} ∆ v_{k} (p),$ (13)

где ${\overset{ˇ}{e}}_{k} (p) = e_{k} (p + 1)$ .

Зададим корректирующую поправку в виде

$Δ v_{k} (p) = k_{1}^{T} η_{k} (p) + k_{2} e_{k - 1} (p + 1)$ , (14)

где вектор k₁ и скаляр k₂ подлежат определению из условий сходимости (5), (6). Подставляя (14) в (13), запишем модель в приращениях переменных в окончательном виде:

$η_{k} (p + 1) = (A + b θ^{T} b_{d} k_{1}^{T}) η_{k} (p) + b θ^{T} A_{d} {\overset{ˇ}{η}}_{k - 1} (p) + b θ^{T} b_{d} k_{2} {\overset{ˇ}{e}}_{k - 1} (p), {\overset{ˇ}{η}}_{k} (p) = b_{d} k_{1}^{T} η_{k} (p) + A_{d} {\overset{ˇ}{η}}_{k - 1} (p) + b_{d} k_{2} {\overset{ˇ}{e}}_{k - 1} (p), {\overset{ˇ}{e}}_{k} (p) = - c^{T} (A + b θ^{T} b_{d} k_{1}^{T}) η_{k} (p) - c^{T} b θ^{T} A_{d} {\overset{ˇ}{η}}_{k - 1} (p) + (1 - c^{T} b θ^{T} b_{d} k_{2}) {\overset{ˇ}{e}}_{k - 1} (p) .$ (15)

Модель (15) записана в форме дискретного повторяющегося процесса, относящегося к классу так называемых 2D cистем (см. [29]). Один из возможных подходов к получению условий сходимости ошибки обучения может быть основан на теории устойчивости повторяющихся процессов с использованием векторных функций Ляпунова (см. [27]). Эта теория далее используется в настоящей статье для построения алгоритмов управления с итеративным обучением.

2.3. Общие условия сходимости ошибки обучения

Введем в рассмотрение вектор ${\bar{e}}_{k} (p) = {[{\overset{ˇ}{η}}_{k - 1}^{T} (p) {\overset{ˇ}{e}}_{k - 1} (p)]}^{T}$ и определим на траекториях системы (15) векторную функцию Ляпунова

$V (η_{k} (p), {\bar{e}}_{k} (p)) = [\begin{array}{l} V_{1} (η_{k} (p)) \\ V_{2} ({\bar{e}}_{k} (p)) \end{array}]$ , (16)

где $V_{1} (η_{k} (p)) > 0, η_{k} (p)) \neq 0, V_{2} ({\bar{e}}_{k} (p)) > 0, {\bar{e}}_{k} (p) \neq 0, V_{1} (0) = 0, V_{2 i} (0) = 0$ . Определим на траекториях системы (15) дискретный аналог оператора дивергенции

$D V (η_{k} (p), {\bar{e}}_{k} (p)) = V_{1} (η_{k} (p + 1)) - V_{1} (η_{k} (p)) + V_{2} ({\bar{e}}_{k + 1} (p)) - V_{2} ({\bar{e}}_{k} (p))$ . (17)

Для краткости далее будем называть этот оператор просто дивергенцией. Дальнейший анализ основан на следующей теореме, которая является следствием теоремы 1 из [27].

Теорема 1. Предположим, что существует векторная функция Ляпунова (16) и положительные скаляры c₁, c₂ и c₃ такие, что на траекториях системы (15) выполняются неравенства

$c_{1} {||η_{k} (p)||}^{2} \leq V_{1} (η_{k} (p)) \leq c_{2} {||η_{k} (p)||}^{2}$ , (18)

$c_{1} ||{\bar{e}}_{k} (p)|| \leq V_{2} ({\bar{e}}_{k} (p)) \leq c_{2} {||{\bar{e}}_{k} (p)||}^{2}$ , (19)

$D V (η_{k + 1} (p), {\bar{e}}_{k} (p)) \leq - c_{3} ({||η_{k + 1} (p)||}^{2} + {||{\bar{e}}_{k} (p)||}^{2})$ . (20)

Тогда алгоритм управления с итеративным обучением (2), (3) с обновляющей поправкой (14) гарантирует выполнение условий сходимости ошибки обучения (5), (6).

Доказательство. В соответствии с теоремой 1 из [27] при условиях (18)–(20) существуют α > 0 и 0 < λ < 1 такие, что

${||η_{k} (p)||}^{2} + {||{\bar{e}}_{k} (p)||}^{2} \leq α λ^{k + p} \leq α λ^{k}$ . (21)

Следовательно, $|η_{k} (p)| \leq κ ϱ^{k}$ , где $κ = \sqrt{α}, ϱ = \sqrt{λ}$ , и, принимая во внимания определение $\bar{e}$ , $|e_{k} (p)| \leq κ ϱ^{k}$ . Таким образом, справедливо (5). Далее, поскольку ∆v_k(p) определено соотношением (14), из (3) c учетом (21) получим

$|v_{k + 1} (p)| \leq |v_{k} (p)| + α_{0} λ^{(k + p + 1) / 2}$ , (22)

где $α_{0} = \sqrt{2 α \max \{||k_{1}||, |k_{2}|\}}$ . Из (22) следует, что

$|v_{k} (p) |\leq| v_{0} (p)| + α_{0} λ^{(p + 1) / 2} \sum_{n = 0}^{k - 1} λ^{n / 2}$ .

B правой части последнего неравенства стоит сходящаяся при k → ∞ геометрическая прогрессия, следовательно, предел в левой части |v_∞(p)| при k → ∞ существует, и при этом справедлива оценка

$|v_{\infty} (p) |\leq| v_{0} (p)| + \frac{α_{0} λ^{(p + 1) / 2}}{1 - λ^{1 / 2}}$ ,

откуда в соответствии с (2) следует, что справедливо условие (6).

2.4. Построение алгоритма

Обозначим $ξ_{k} (p) = {[{\overset{ˇ}{η}}_{k}^{T} (p) {\overset{ˇ}{η}}_{k - 1}^{T} (p) {\overset{ˇ}{e}}_{k - 1} (p)]}^{T}$ и введем в рассмотрение матрицы согласованных размеров

$\bar{A} = [\begin{array}{l} A & b θ^{T} A_{d} & 0 \\ 0 & A_{d} & 0 \\ - c^{T} A & - c^{T} b θ^{T} A_{d} & 1 \end{array}], \bar{b} = [\begin{array}{l} b θ^{T} b_{d} \\ b_{d} \\ - c^{T} b θ^{T} b_{d} \end{array}], Г = [\begin{array}{l} I & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 1 \end{array}]$ .

Рассмотрим дискретное неравенство Риккати

${\bar{A}}^{T} \bar{P} \bar{A} - (1 - σ) \bar{P} - {\bar{A}}^{T} \bar{P} \bar{b} {[{\bar{b}}^{T} \bar{P} \bar{b} + R]}^{- 1} {\bar{b}}^{T} \bar{P} \bar{A} + Q \underline{≺} 0$ (23)

относительно матрицы $\bar{P} = d i a g [P_{1} P_{2}] ≻ 0$ , где $P_{1} \in ℝ^{n_{x} \times n_{x}}, P_{2} \in ℝ^{d + 2 \times d + 2}$ , 0 < σ < 1, $Q ≻ 0$ и R > 0 — соответственно весовая матрица и весовой коэффициент. Применяя лемму о дополнении Шура, получим, что если линейные матричные неравенства

$[\begin{array}{l} (1 - σ) \bar{X} & X {\bar{A}}^{T} & \bar{X} \\ \bar{A} \bar{X} & \bar{X} + \bar{b} R^{- 1} {\bar{b}}^{T} & 0 \\ \bar{X} & 0 & Q^{- 1} \end{array}] \underline{≻} 0, X ≻ 0$ , (24)

разрешимы относительно $X = d i a g [X_{1} X_{2}] ≻ 0$ , где X₁ и X₂ имеют те же размерности, что и P₁, и P₂, то P = X^–1.

Определим

$f^{T} = {[\underset{n_{x}}{\underset{⏟}{f_{1}^{T}}} \underset{d + 1}{\underset{⏟}{0}} \underset{1}{\underset{⏟}{f_{3}}}]= -[{\bar{b}}^{T} \bar{P} \bar{b} + R]}^{- 1} {\bar{b}}^{T} \bar{P} \bar{A} Г$ (25)

и предположим, что выполняется следующее матричное неравенство:

$[\begin{array}{l} M - M Г - Г M - Q & Г \sqrt{M} \\ \sqrt{M} Г & - I \end{array}] \underline{≺} 0$ , (26)

где $M = {\bar{A}}^{T} \bar{P} \bar{b} {[{\bar{b}}^{T} \bar{P} \bar{b} + R]}^{- 1} {\bar{b}}^{T} \bar{P} \bar{A}$ . Выбирая компоненты векторной функции Ляпунова (16) в виде квадратичных форм

$V_{1} (η_{k} (p)) = η_{k}^{T} (p) P_{1} η_{k} (p), V_{2} ({\bar{e}}_{k} (p)) = {\bar{e}}_{k}^{T} (p) P_{2} {\bar{e}}_{k} (p)$

и вычисляя дивергенцию функции (16) вдоль траекторий системы (15) с учетом (23) и (26), получим

$\begin{matrix} D V (η_{k + 1} (p), {\bar{e}}_{k} (p)) = ξ_{k}^{T} (p) [{\bar{A}}^{T} \bar{P} \bar{A} - Г M - M Г + Г M Г - \bar{P}] ξ_{k} (p) = \\ = ξ_{k}^{T} (p) [{\bar{A}}^{T} \bar{P} \bar{A} - (1 - σ) \bar{P} - {\bar{A}}^{T} \bar{P} \bar{b}[{\bar{b}}^{T} \bar{P} \bar{b} + R]^{- 1} {\bar{b}}^{T} \bar{P} \bar{A} + Q + \\ + (Г M Г - Г M - M Г - Q) - σ \bar{P}] ξ_{k} (p) \leq - ξ_{k}^{T} (p) σ \bar{P} ξ_{k} (p) . \end{matrix}$ (27)

Поскольку $\bar{P} = d i a g [P_{1} P_{2}] ≻ 0$ , из (27) следует, что выполнены все условия теоремы 1. Таким образом, доказан следующий результат.

Теорема 2. Предположим, что для некоторого выбора весовой матрицы $Q ≻ 0$ , вектора θ и скаляров R > 0 и 0 < σ < 1 линейное матричное неравенство (24) имеет решение $X ≻ 0$ , матрица P = X^–1 удовлетворяет неравенству (26), k₁ = f₁, k₂ = f₃, где f₁ и f₃ — компоненты вектора f из (25). Тогда алгоритм управления с итеративным обучением (2), (3) с обновляющей поправкой (14) обеспечивает выполнение условий сходимости ошибки обучения (5), (6).

Заметим, что параметр характеризует запас устойчивости системы (15). С его увеличением, при выполнении условий теоремы 2, спектр матрицы $(A + b θ^{T} b_{d} k_{1}^{T})$ и число $(1 - c^{T} b θ^{T} b_{d} k_{2})$ , оставаясь внутри единичного круга, удаляются от его границы.

ДИФФЕРЕНЦИАЛЬНЫЕ СИСТЕМЫ

3.1. Постановка задачи

Рассмотрим дифференциальную систему в повторяющемся режиме, описываемую линейной моделью в пространстве состояний

${\dot{x}}_{k} (t) = A x_{k} (t) + b u_{k} (t), y_{k} (t) = c^{T} x_{k} (t), 0 \leq t \leq T, k \geq 0$ , (28)

где все обозначения имеют тот же смысл, что и в (1).

Алгоритм управления формируется следующим образом:

$u_{k} (t) = \sum_{k = 0}^{d} τ_{i} v_{k - i} (t)$ , (29)

$v_{k + 1} (t) = v_{k} (t) + Δ v_{k + 1} (t), k = 0, 1, \dots$ , (30)

где v_k = 0, если k ∈[–d, 0], d — число предыдущих повторений, информация с которых используется на текущем повторении, Δv_k+₁ — обновляющая поправка, τ_i, i ∈[0, d] — весовые коэффициенты.

Обозначим через $y_{r e f} (t) \in ℝ$ , 0 ≤ t ≤ T, желаемую (эталонную) траекторию, тогда

$e_{k} (t) = y_{r e f} (t) - y_{k} (t)$ (31)

будет представлять собой ошибку обучения на повторении k. Для сходимости ошибки обучения последовательность входных переменных {u_k(t)} должна обеспечивать выполнение условий

$|e_{k} (t)| \leq κ ϱ^{k}, κ > 0, 0 < ϱ < 1$ , (32)

$\lim_{k \to \infty} |u_{k} (t) |=| u_{\infty} (t)| < \infty, t \in [0, T]$ . (33)

Из (29) и (30) следует, что, как и в случае дискретной системы, задача сводится к нахождению обновляющей поправки, и при которой выполняются условия (32) и (33).

3.2. Вывод модели в приращениях и условия сходимости

Вводя переменную

$η_{k} (t) = \int_{0}^{t} [x_{k} (τ) - x_{k - 1} (τ)] d τ$ ,

перепишем (28) в виде

${\dot{η}}_{k} (t) = A η_{k} (t) + B \int_{0}^{t} ∆ u_{k} (τ) d τ$ .

Тогда с учетом (29) имеем

${\dot{η}}_{k} (t) = A η_{k} (t) + b \sum_{i = 0}^{d} τ_{i} \int_{0}^{t} ∆ ν_{k - i} (τ) d τ$ ,

и окончательно, вводя переменные $δ v_{k - i} (t) = \int_{0}^{t} ∆ v_{k - i} (τ) d τ, i = 0, 1, . . ., d$ , имеем

${\dot{η}}_{k} (t) = A η_{k} (t) + b \sum_{i = 0}^{d} τ_{i} δ v_{k - i}$ . (34)

Введем вспомогательные переменные

${\overset{ˇ}{η}}_{k 1} (t) = δ v_{k} (t), {\overset{ˇ}{η}}_{k 2} (t) = δ v_{k - 1} (t), {\overset{ˇ}{η}}_{k 3} (t) = δ v_{k - 2} (t), . . ., {\overset{ˇ}{η}}_{k d + 1} (t) = δ v_{k - d} (t)$

и запишем уравнения динамики относительно повторений:

${\overset{ˇ}{η}}_{k} (t) = A_{d} {\overset{ˇ}{η}}_{k - 1} (t) + b_{d} δ ν_{k} (t)$ , (35)

где ${\overset{ˇ}{η}}_{k} (t) = [{\overset{ˇ}{η}}_{k 1} (t), {\overset{ˇ}{η}}_{k 2} (t) . . . {\overset{ˇ}{η}}_{k d + 1} (t)]$ , A_d и b_d определены в (8). Уравнение (34) с учетом (35) можно переписать в виде

${\overset{ˇ}{η}}_{k} (t) = b θ^{T} A_{d} {\overset{ˇ}{η}}_{k - 1} (t) + b θ^{T} b_{d} δ ν_{k} (t)$ , (36)

Из (36) и (31) следует

$e_{k} (t) = - c^{T} A_{d} {\overset{ˇ}{η}}_{k - 1} (t) - c^{T} b θ^{T} A_{d} {\overset{ˇ}{η}}_{k - 1} (t) + e_{k - 1} (t) - c^{T} b θ^{T} b_{d} δ ν_{k} (t)$ . (37)

Уравнения (35) и (37) задают полное описание динамики относительно повторений. Зададим обновляющую поправку в виде

$δ ν_{k} (t) = k_{1}^{T} η_{k} (t) + k_{2} e_{k - 1} (t)$ (38)

и запишем полную модель в приращениях:

${\dot{η}}_{k} (t) = (A + b θ^{T} b_{d} k_{1}^{T}) η_{k} (t) + b θ^{T} A_{d} {\overset{ˇ}{η}}_{k - 1} (t) + b θ^{T} b_{d} k_{2} {\overset{ˇ}{e}}_{k - 1} (t), {\overset{ˇ}{η}}_{k} (t) = A_{d} {\overset{ˇ}{η}}_{k - 1} (t) + b_{d} k_{1} η_{k} (t) + b_{d} k_{2} {\overset{ˇ}{e}}_{k - 1} (t), {\overset{ˇ}{e}}_{k} (t) = - c^{T} (A + b θ^{T} b_{d} k_{1}^{T}) η_{k} (t) - c^{T} b θ^{T} A_{d} {\overset{ˇ}{η}}_{k - 1} (t) + (1 - c^{T} b θ^{T} b_{d} k_{2}) e_{k - 1} (t) .$ (39)

Модель (39) записана в форме дифференциального повторяющегося процесса, относящегося к классу 2D систем. Как и в предыдущем разделе дальнейший анализ сходимости ошибки обучения будет основан на теории устойчивости повторяющихся процессов с использованием векторных функций Ляпунова из [27].

Введем в рассмотрение вектор и векторную функцию Ляпунова

$V (η_{k} (t), {\bar{e}}_{k} (t)) = [\begin{array}{l} V_{1} (η_{k} (t)) \\ V_{2} ({\bar{e}}_{k} (t)) \end{array}]$ , (40)

где $V_{1} (η) > 0, η \neq 0, V_{2} (\bar{e}) > 0, \bar{e} \neq 0, V_{1} (0) = 0, V_{2} (0) = 0$ .

Аналог оператора дивергенции этой функции вдоль траекторий системы (39) имеет вид

$D V (η_{k} (t), {\bar{e}}_{k} (t)) = \frac{d V_{1} (η_{k} (t))}{d t} + Δ_{k} V_{2} ({\bar{e}}_{k} (t))$ , (41)

где $Δ_{k} V_{2} ({\bar{e}}_{k} (t)) = V_{2} ({\bar{e}}_{k + 1} (t)) - V_{2} ({\bar{e}}_{k} (t))$ .

Теорема 3. Предположим, что существует векторная функция Ляпунова (40) и положительные скаляры c₁ — c₄ такие, что на траекториях системы (39) выполняются неравенства

$c_{1} {||η_{k} (t)||}^{2} \leq V_{1} (η_{k} (t)) \leq c_{2} {||η_{k} (t)||}^{2}, c_{1} {||{\bar{e}}_{k} (t)||}^{2} \leq V_{2} (e_{k} (t)) \leq c_{2} {||{\bar{e}}_{k} (t)||}^{2}, D V (η_{k} (t), {\bar{e}}_{k} (t)) \leq - c_{3} ({||η_{k} (t)||}^{2} + {||{\bar{e}}_{k} (t)||}^{2}), \frac{\partial V_{1} (η)}{\partial η} \leq - c_{4} ||η|| .$ (42)

Тогда алгоритм управления с итеративным обучением (29), (30) с обновляющей поправкой (38) гарантирует выполнение условий сходимости ошибки обучения (32), (33).

Доказательство. В соответствии с теоремой 2 из [27] при условиях (42) существуют α > 0, λ > 0 и 0 < ζ < 1 такие, что

${||η_{k} (t)||}^{2} + {||{\bar{e}}_{k} (t)||}^{2} \leq α \exp (- λ t) ζ^{k} \leq α ζ^{k}$ . (43)

Следовательно, $|η_{k} (p)| \leq κ ϱ^{k}$ где $κ = \sqrt{α}, ϱ = \sqrt{ζ}$ и, принимая во внимание определение $\bar{e}$ , $|e_{k} (p)| \leq κ ϱ^{k}$ . Таким образом, справедливо (32). Далее, поскольку δv_k(p) определено соотношением (38), то, учитывая (43), по аналогии с доказательством теоремы 1 нетрудно получить оценку

$|δ v_{k + 1} (t)| \leq α_{0} \exp (- \frac{1}{2} λ t) ζ^{k / 2}$ . (44)

Из (43) следует

$|η_{k} (t)| \leq α \exp (- \frac{1}{2} λ t) ζ^{k / 2}, |{\overset{ˇ}{η}}_{k} (t)| \leq α \exp (- \frac{1}{2} λ t) ζ^{k / 2}, |e_{k} (t)| \leq α \exp (- \frac{1}{2} λ t) ζ^{k / 2}$ . (45)

Из (36) c учетом (44) и (45) получим

$||{\dot{η}}_{k} (t)|| \leq α_{1} \exp (- \frac{1}{2} λ t) ζ^{(k - 1) / 2}$ ,

где $α_{1} = α \max \{||A||, ||b θ^{T} A_{d}||, ||b θ^{T} b_{d}||\}$ , и

$|{\dot{e}}_{k} (t) |=| c^{T} {\dot{η}}_{k} (t)| \leq α_{2} \exp (- \frac{1}{2} λ t) ζ^{(k - 1) / 2}$ ,

где $α_{2} = α_{1} ||c^{T}||$ . С учетом двух последних неравенств

$|Δ v_{k + 1} (t)| = |\frac{d}{d t} δ v_{k + 1} (t)| = |k_{1} {\dot{η}}_{k} (t) + k_{2} {\dot{e}}_{k} (t)| \leq α_{3} \exp (- \frac{1}{2} λ t) ζ^{(k - 1) / 2}$ ,

где $α_{3} = α_{0} \max \{α_{1}, α_{2}\}$ . Из (30) с учетом последнего неравенства следует

$|v_{k + 1} (t) |\leq| v_{k} (t)| + α_{3} \exp (- \frac{1}{2} λ t) ζ^{(k - 1) / 2}$ .

Условие (33) теперь следует из повторения, применительно к последнему неравенству, выводов, аналогичных сделанных в доказательстве теоремы 1 после неравенства (22) с учетом (29).

3.3. Построение алгоритма с использованием техники линейных матричных неравенств

Введем расширенный вектор $ξ_{k} (t) = {[η_{k} {(t)}^{T} {\bar{e}}_{k} {(t)}^{T}]}^{T}$ , аналогичный введенному в предыдущем разделе для дискретных систем. Выбирая компоненты векторной функции Ляпунова (40) в виде квадратичных форм

$V_{1} (η_{k} (t)) = η_{k}^{T} (t) P_{1} η_{k} (t), V_{2} ({\bar{e}}_{k} (t)) = {\bar{e}}_{k}^{T} (t) P_{2} {\bar{e}}_{k} (t)$

и вычисляя дивергенцию этой функции вдоль траекторий системы (39), получим

$D V (η_{k} (t), {\bar{e}}_{k} (t)) = ξ_{k}^{T} (t) [{\bar{A}}_{c}^{T} I^{(1,0)} \bar{P} + \bar{P} I^{(1,0)} {\bar{A}}_{c} + {\bar{A}}_{c}^{T} I^{(0,1)} \bar{P} {\bar{A}}_{c} - I^{(0,1)} \bar{P}] ξ_{k} (t)$ , (46)

где

$\begin{matrix} P_{1} = P_{1}^{Τ} ≻ 0, P_{2} = P_{2}^{Τ} ≻ 0, {\bar{A}}_{c} = (\bar{A} + \bar{b} k^{T} \bar{H}), \bar{P} = d i a g [P_{1} P_{2}], \\ P_{2} = d i a g [P_{21} P_{22}], k^{T} = [k_{1}^{T} k_{2}], \bar{H} = [\begin{array}{l} I & 0 & 0 \\ 0 & 0 & 1 \end{array}], I^{(1,0)} = [\begin{array}{l} I & 0 \\ 0 & 0 \end{array}], I^{(0,1)} = [\begin{array}{l} 0 & 0 \\ 0 & I \end{array}] \end{matrix}$

и размеры блоков матриц $\bar{P}, \bar{H}, I^{(1,0)}, I^{(0,1)}$ согласованы с размерностями переменных $η, \overset{ˇ}{η}, \bar{e}$ . Проводя аналогию с теорией линейно-квадратичного регулятора (ЛКР), потребуем, чтобы выполнялось неравенство

$D V (η_{k} (t), {\bar{e}}_{k} (t)) + ξ_{k}^{T} (t) [\bar{Q} + (k^{T} \bar{H})^{T} R k^{T} \bar{H}] ξ_{k} (t) \leq 0$ , (47)

где $\bar{Q} = d i a g [Q_{1} Q_{2}] ≻ 0, R ≻ 0$ — весовые матрицы, тогда нетрудно видеть, что все условия теоремы 3 будут выполнены. Неравенство (47) эквивалентно матричному неравенству

${\bar{A}}_{c}^{T} I^{(1,0)} \bar{P} + \bar{P} I^{(1,0)} {\bar{A}}_{c} + {\bar{A}}_{c}^{T} I^{(0,1)} \bar{P} {\bar{A}}_{c} - I^{(0,1)} \bar{P} + \bar{Q} + {(k^{T} \bar{H})}^{T} R k^{T} \bar{H} \underline{≺} 0$ . (48)

Введем переменные $\bar{X} = {\bar{P}}^{- 1}$ и Z как решение уравнения

$\bar{H} X = Z \bar{H}$ . (49)

Тогда, применяя к (48) лемму о дополнении Шура, получим

$[\begin{matrix} M_{11} & M_{12} & \bar{X} & {(Y^{T} \bar{H})}^{T} \\ M_{12}^{T} & - \bar{X} & 0 & 0 \\ - \bar{X} & 0 & - Q^{- 1} & 0 \\ Y^{T} \bar{H} & 0 & 0 & - R^{- 1} \end{matrix}] ≺ 0$ ,

где

$M_{11} = {(\bar{A} \bar{X} + \bar{b} Y^{T} \bar{H})}^{T} I^{(1,0)} + I^{(1,0)} (\bar{A} \bar{X} + \bar{b} Y^{T} \bar{H}) - I^{(0,1)} \bar{X}, M_{12} = (\bar{A} \bar{X} + \bar{b} Y^{T} \bar{H}) I^{(0,1)}$ .

Если система матричных уравнений и неравенств (49), (50) разрешима относительно $X ≻ 0, Y$ и Z, то

$k^{T} = Y^{T} Z^{- 1}$ . (50)

Сделанные выводы можно объединить в виде следующей теоремы.

Теорема 4. Предположим, что для некоторого выбора весовой матрицы $Q ≻ 0$ , вектора θ и скаляра R > 0 система линейных матричных уравнений и неравенств (49), (50) разрешима относительно $X ≻ 0, Y$ и Z, а вектор k определяется по формуле (50). Тогда алгоритм управления с итеративным обучением (29), (30) с обновляющей поправкой (38) обеспечивает выполнение условий сходимости ошибки обучения (32), (33).

ПРИМЕР

Рассмотрим управляемое движение манипулятора по горизонтальной оси, перпендикулярной направлению движения ленты конвейера многоосевого портального робота. Модель динамики, полученная экспериментально на основе частотного анализа [31], задается передаточной функцией

$G (s) = \frac{23.736 (s + 661.2)}{s (s^{2} + 426.7 s + 1.744 \times 10^{5})}$ . (51)

Желаемая (эталонная) траектория движения продолжительностью 2 с представлена на фиг. 1. Для построения дискретной модели в пространстве состояний используем стандартные функции MATLAB, принимая период дискретности равным 0.01 с.

Фиг. 1. Желаемая траектория движения

Рассмотрим сначала случай d = 1, при этом согласно (2), (3), (14), как в методе тяжелого шарика, на текущем шаге используется информация с двух предыдущих шагов. Введем в рассмотрение среднеквадратическую ошибку (СКО) обучения

$E (k) = \sqrt{\frac{1}{N} \sum_{p = 0}^{N} {|e_{k} (p)|}^{2}}$ , (52)

и сравнение скорости сходимости алгоритмов будем проводить по числу шагов, при котором E(k) уменьшится в 10 раз относительно начального значения. Матрицa Q и положительные скаляры R, σ были выбраны, исходя из принципов теории ЛКР:

$Q = d i a g [1 1 1 10 10 5 \times 10^{5}], R = 10^{- 3}, σ = 0.0125$ .

Отметим, что выбор этих параметров представляет отдельную нетривиальную задачу, для более детального ознакомления с которой заинтересованный читатель может обратиться к [32]–[35]. В данном случае были использованы асимптотические свойства ЛКР (см. [35]), в соответствии с которыми малый вес R не ограничивает энергию управления, а большой вес при ошибке обучения в матрице Q придает доминирующий характер этой переменной при формировании управления.

При τ₀ = 1 и τ₁ = 0 получаем стандартный алгоритм первого порядка, для которого

$k_{1}^{T} = [- 15.5 - 12.7 - 5180.4], k_{2} = 194.6$ .

Для алгоритмов второго порядка при τ₀ = 1 естественно задавать τ₁, не превышающим 1, иначе обновленная информация будет подавляться устаревшей. При 0 < τ₁ < 1 получаем ускорение сходимости относительно алгоритма первого порядка. При τ₁ > 1 в силу преобладания устаревшей информации происходит нарушение монотонности изменения E(k) и замедление скорости сходимости относительно алгоритма первого порядка. На фиг. 2 представлено сравнение алгоритма первого порядка и алгоритма второго порядка при τ₁ = 0.8, при этом

$k_{1}^{T} = [- 7.2 - 5.6. - 2296.3], k_{2} = 190.2$ .

Фиг. 2. Изменение СКО обучения в случаях алгоритма первого порядка (штриховая линия) и второго порядка (сплошная линия) при τ₁ = 0.8

На фиг. 3 представлено то же сравнение при τ₁ = 1.2, в этом случае

$k_{1}^{T} = [- 2.27 - 1.74 - 714.95], k_{2} = 75.72$ .

Фиг. 3. Изменение СКО обучения в случаях алгоритма первого порядка (штриховая линия) и второго порядка (сплошная линия) при τ₁ = 1.2

Рассмотрим случай d = 2. При этом согласно (2), (3), (14) на текущем шаге учитывается информация с трех предыдущих шагов. Сохраним все параметры теми же, что и при d = 1. Единственное отличие будет в естественном увеличении размера среднего блока матрицы Q, в результате она примет вид

$Q = d i a g [1 1 1 10 10 10 5 \times 10^{5}]$ .

Расчеты и моделирование показали, что при τ₀ = 1 обнуление одного из коэффициентов τ₁ или τ₂ при изменении второго в интервале (0, 1) дает практически то же самое ускорение сходимости ошибки обучения, что и при (фиг. 4 и фиг. 5).

Фиг. 4. Изменение СКО обучения в случаях алгоритма первого порядка (штриховая линия) и третьего порядка (сплошная линия) при τ₁ = 0.8, τ₂ = 0

Фиг. 5. Изменение СКО обучения в случаях алгоритма первого порядка (штриховая линия) и третьего порядка (сплошная линия) при τ₁ = 0, τ₂ = 0.8

Близкая картина наблюдается, если оба коэффициента не равны нулю и τ₂ < τ₁ (фиг. 6), но при этом, начиная с некоторого значения τ₁ ошибка обучения начинает расходиться.

Фиг. 6. Изменение СКО обучения в случаях алгоритма первого порядка (штриховая линия) и третьего порядка (сплошная линия) при τ₁ = 0.8, τ₂ = 0.4

При τ₂ > τ₁ ошибка всегда расходится (фиг. 7), что объясняется противоречивым характером информации, поступающей в алгоритм.

Фиг. 7. Изменение СКО обучения в случаях алгоритма первого порядка (штриховая линия) и третьего порядка (сплошная линия) при τ₁ = 0.6, τ₂ = 0.7

ЗАКЛЮЧЕНИЕ

В статье предложены новые алгоритмы управления с итеративным обучением высшего порядка, отличающиеся от немногих известных тем, что они учитывают полную информацию о предыдущих шагах и по структуре аналогичны алгоритмам многошаговых методов в теории оптимизации. Примеры подтверждают ускорение сходимости ошибки обучения относительно алгоритмов первого порядка. В дальнейших исследованиях предполагается оценить робастность и эффективность предложенных алгоритмов в условиях неопределенности модели и с учетом внешних случайных возмущений и шумов измерений. Остается также открытым вопрос конструктивного выбора глубины памяти (параметр d) и весовых коэффициентов (τ₁, ..., τ_d). Отдельным направлением является распространение полученных результатов на нелинейные системы.

Наконец, наиболее трудным является строгое общее теоретическое обоснование возможных преимуществ алгоритмов УИО высшего порядка в смысле скорости сходимости ошибки обучения. Хотя примеры вселяют определенную надежду, в общем случае эта задача пока остается открытой даже для линейных систем.

Идея этой работы появилась под влиянием докладов на традиционной молодежной летней школе им. Б. Т. Поляка (Нижний Новгород, 10—15 июля 2023 г.). Авторы выражают благодарность А. В. Гасникову за конструктивную дискуссию и указание на интересную работу [12].

Об авторах

П. В. Пакшин

АПИ НГТУ им. Р.Е. Алексеева

Автор, ответственный за переписку.
Email: pakshinpv@gmail.com
Россия, Арзамас

Ю. П. Емельянова

АПИ НГТУ им. Р.Е. Алексеева

Email: emelianovajulia@gmail.com
Россия, Арзамас

М. А. Емельянов

АПИ НГТУ им. Р.Е. Алексеева

Email: mikhailemelianovarzamas@gmail.com
Россия, Арзамас

Список литературы

Arimoto S., Kawamura S., Miyazaki F. Bettering operation of robots by learning // J. Robot. Syst. 1984. V. 1. P. 123—140.
Bristow D. A., Tharayil M., Alleyne A. G. A survey of iterative learning control: A learning-based method for high-performance tracking control // IEEE Control Syst. Magaz. 2006. V. 26. № 3. P. 96—114.
Ahn H-S., Chen Y. Q., Moore K. L. Iterative learning control: Survey and categorization // IEEE Trans. Syst. Man Cybern. Part C: Appl. Rev. 2007. V. 37. № 6. P. 1099—1121.
Rogers E., Chu B., Freeman C., Lewin P. Iterative learning control algorithms and experimental benchmarking Chichester: John Wiley & Sons, 2023.
Lim I., Hoelzle D. J., Barton K. L. A multi-objective iterative learning control approach for additive manufacturing applications // Control Engineer. Practice. 2017. V. 64. P. 74—87.
Sammons P. M., Gegel M. L., Bristow D. A., Landers R. G. Repetitive process control of additive manufacturing with application to laser metal deposition // IEEE Transact. Control Syst. Technol. 2019. V. 27. № 2. P. 566—575.
Freeman C. T., Rogers E., Hughes A.-M., Burridge J. H., Meadmore K. L. Iterative learning control in health care: electrical stimulation and robotic-assisted upper-limb stroke rehabilitation // IEEE Control Syst. Magaz. 2012. V. 47. P. 70—80.
Meadmore K. L., Exell T. A., Hallewell E., Hughes A.-M., Freeman C. T., Kutlu M., Benson V., Rogers E., Burridge J. H. The application of precisely controlled functional electrical stimulation to the shoulder, elbow and wrist for upper limb stroke rehabilitation: a feasibility study // J. of NeuroEngineer. and Rehabilitation. 2014. P. 11—105.
Ketelhut M., Stemmler S., Gesenhues J., Hein M., Abel D. Iterative learning control of ventricular assist devices with variable cycle durations // Control Engineer. Practice. 2019. V. 83. P. 33—44.
Поляк Б. Т. О некоторых способах ускорения сходимости итерационных методов // Ж. вычисл. матем. и матем. физ. 1964. Т. 4. № 5. С. 791—803.
Поляк Б. Т. Введение в оптимизацию. М.: Наука, 1983.
d’Aspremont A., Scieur D., Taylor A. Acceleration Methods // arXiv:2101.09545v3. 2021.
Ahn H.-S., Moore K. L., Cheh Y. Iterative Learning Control: Robustness and Monotonic Convergence for Interval Systems. London: Springer-Verlag, 2007.
Bien Z., Huh K. M. Higher-order iterative learning control algorithm // IEE Proc. D-Control Theory Appl. 1989. V. 136. P. 105—112.
Chen Y., Gong Z., Wen C. Analysis of a high-order iterative learning control algorithm for uncertain nonlinear systems with state delays // Automatica. 1998. V. 34. P. 345—353.
Norrlof M., Gunnarsson S. A frequency domain analysis of a second order iterative learning control algorithm // Proc. 38th IEEE Conf. Decis. Control. 1999. V. 2. P. 1587—1592.
Bu X., Yu F., Fu Z., Wang F. Stability analysis of high-order iterative learning control for a class of nonlinear switched systems // Abstract Appl. Anal. 2013. V. 2013. P. 1—13.
Wei Y.-S., Li X.-D. Robust higher-order ILC for non-linear discrete-time systems with varying trail lengths and random initial state shifts // IET Control Theory Appl. 2017. V. 11. P. 2440—2447.
Wang X., Chu B., Rogers E. Higher-order Iterative Learning Control Law Design using Linear Repetitive Process Theory: Convergence and Robustness // IFAC PapersOnLine. 2017. V. 50—1. P. 3123—3128.
Phan M. Q., Longman R. W. Higher-order iterative learning control by pole placement and noise filtering // IFAC Proc. Volumes. 2002. V. 35. P. 25—30.
Gu P., Tian S., Chen Y. Iterative learning control based on Nesterov accelerated gradient method // IEEE Access. 2019. V. 7. P. 115 836—115 842.
Нестеров Ю. Е. Метод рeшения задачи выпуклого программирования со скоростью сходимости // Докл. АН СССР. 1983. Т. 269. № 3. С. 543—547.
Kim D., Fessler J. A. Generalizing the optimized gradient method for smooth convex minimization // arXiv:1607.06764. 2018. P. 1—26.
Moore K. L. An iterative learning control algorithm for systems with measurement noise // Proc. 38th IEEE Conf. Decis. Control. 1999. V. 1. P. 270—275.
Saab S. S. Optimality of first-order ILC among higher order ILC // IEEE Transact. on Automatic Control. 2006. V. 51. P. 1332—1336.
Afkhami Z., Hoelzle D. J., Barton K. Robust higher-order spatial iterative learning control for additive manufacturing systems // IEEE Transact. on Control Systems Technology. 2023. V. 31. P. 1692—1707.
Pakshin P., Emelianova J., Emelianov M., Gałkowski K., Rogers E. Dissipativity and stabilization of nonlinear repetitive processes // Systems & Control Lett. 2016. V. 91 P. 14—20.
Цыпкин Я. З. Адаптация и обучение в автоматических системах. М.: Наука, 1968.
Rogers E., Gałkowski K., Owens D. H. Control systems theory and applications for linear repetitive processes. Berlin: Springer-Verlag, 2007.
Hładowski Ł., Gałkowski K., Cai Z., Rogers E., Freeman C., Lewin P. Experimentally supported 2D systems based iterative learning control law design for error convergence and performance // Control Engineer. Practice. 2010. V. 18. P. 339—348.
Hładowski Ł., Gałkowski K., Cai Z., Rogers E., Freeman C., Lewin P. Experimentally supported 2D systems based iterative learning control law design for error convergence and performance // Control Engineer. Practice. 2010. V. 18. P. 339—348.
Solheim O. A. Design of optimal control systems with prescribed eigenvalues // Int. J. Control. 1972. V. 15. № 1. P. 143—160.
Кухаренко Н. В. Определение коэффициентов квадратичных функционалов в задачах аналитического конструирования // Технич. кибернетика. 1977. № 4. С. 197—201.
Богачев А. В., Григорьев В. В., Дроздов В. Н., Коровьяков А. Н. Аналитическое регуляторов по корневым показателям // Автоматика и телемехан. 1979. № 8. С. 21—28.
Квакернаак Х., Сиван Р. Линейные оптимальные системы управления. М.: Мир, 1977.

Дополнительные файлы

Доп. файлы

Действие

1. JATS XML

Скачать

2. Фиг. 1. Желаемая траектория движения

Скачать (128KB)

Метаданные

3. Фиг. 2. Изменение СКО обучения в случаях алгоритма первого порядка (штриховая линия) и второго порядка (сплошная линия) при τ1 = 0.8

Скачать (122KB)

Метаданные

4. Фиг. 3. Изменение СКО обучения в случаях алгоритма первого порядка (штриховая линия) и второго порядка (сплошная линия) при τ1 = 1.2

Скачать (126KB)

Метаданные

5. Фиг. 4. Изменение СКО обучения в случаях алгоритма первого порядка (штриховая линия) и третьего порядка (сплошная линия) при τ1 = 0.8, τ2 = 0

Скачать (123KB)

Метаданные

6. Фиг. 5. Изменение СКО обучения в случаях алгоритма первого порядка (штриховая линия) и третьего порядка (сплошная линия) при τ1 = 0, τ2 = 0.8

Скачать (125KB)

Метаданные

7. Фиг. 6. Изменение СКО обучения в случаях алгоритма первого порядка (штриховая линия) и третьего порядка (сплошная линия) при τ1 = 0.8, τ2 = 0.4

Скачать (124KB)

Метаданные

8. Фиг. 7. Изменение СКО обучения в случаях алгоритма первого порядка (штриховая линия) и третьего порядка (сплошная линия) при τ1 = 0.6, τ2 = 0.7

Скачать (112KB)

Метаданные

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация

Том 65, № 10 (2025)

Том 65, № 10 (2025)

Алгоритмы управления с итеративным обучением высшего порядка для линейных систем

Полный текст

Аннотация

Ключевые слова

Полный текст

ВВЕДЕНИЕ

ДИСКРЕТНЫЕ СИСТЕМЫ

2.1. Постановка задачи

2.3. Общие условия сходимости ошибки обучения

2.4. Построение алгоритма

ДИФФЕРЕНЦИАЛЬНЫЕ СИСТЕМЫ

3.1. Постановка задачи

3.3. Построение алгоритма с использованием техники линейных матричных неравенств

ПРИМЕР

ЗАКЛЮЧЕНИЕ

Об авторах

П. В. Пакшин

Ю. П. Емельянова

М. А. Емельянов

Список литературы

Дополнительные файлы