A fast normal splitting preconditioner for attractive coupled nonlinear Schroedinger equations with fractional Laplacian
- 作者: Cheng Y.1, Yang X.1, Matveev I.А.2
-
隶属关系:
- College of Mathematics, Nanjing University of Aeronautics and Astronautics
- Federal Research Center “Computer Science and Control” of the Russian Academy of Sciences
- 期: 编号 4 (2024)
- 页面: 3-32
- 栏目: COMPUTER METHODS
- URL: https://bakhtiniada.ru/0002-3388/article/view/274199
- DOI: https://doi.org/10.31857/S0002338824040014
- EDN: https://elibrary.ru/UERATM
- ID: 274199
如何引用文章
全文:
详细
A linearly implicit conservative difference scheme is applied to discretize the attractive coupled nonlinear Schroedinger equations with fractional Laplacian. In this case complex symmetric linear systems appear, with indefinite and Toeplitz-plus-diagonal system matrices. Standard fast methods of direct solution or iteration using a preconditioner are not applicable for such systems. A novel iterative method is proposed, based on the normal splitting of the equivalent real block form of linear systems. Unconditional convergence is proved and the quasi-optimal iteration parameter is deducted. The preconditioner for this method is obtained naturally; it is constructed and efficiently implemented using the fast Fourier transform. Theoretical analysis shows that the eigenvalues of the preconditioned system matrix are closely clustered. Numerical experiments demonstrate new preconditioner significantly speeds up the convergence rate of iterative Krylov subspace methods. In particular, the convergence behavior of the corresponding preconditioned generalized minimum residual method is independent of the mesh size and almost insensitive to the fractional order. Moreover, the linearly implicit conservative difference scheme in this case preserves mass and energy with a given accuracy.
全文:
Введение. Одним из самых популярных методов расчета в квантовой механике [1, 2] является интеграл Фейнмана по броуновским путям, который приводит к стандартным уравнениям Шредингера. Если вместо броуновского движения рассматривать полет Леви, то возникает система дробных уравнений Шредингера (fractional Schroedinger equations, FSE) [3]. Вместо лапласиана в стандартных уравнениях Шредингера [4] FSE включает дробную производную порядка α (1 < α < 2). При α = 2 FSE сводится к стандартному случаю. Кроме того, FSE имеет важные приложения в квантовой механике, полупроводниках и других областях [5]. Из-за нелокальной природы оператора дробного дифференциала точное решение FSE получить трудно. Для изучения природы FSE было разработано большое количество численных методов, таких, как методы конечных элементов [6, 7], спектральные методы [8, 9], методы коллокации [10, 11], методы конечных разностей [12–16] и пр.
В статье рассматриваются следующие одномерные (1D) пространственные дробно-связанные нелинейные уравнения Шредингера (coupled nonlinear Schroedinger, CNLS):
(0.1)
с начальными условиями
(0.2)
где 1 = , параметры γ > 0, β ≥ 0, ρ – вещественные константы, дробный лапласиан
(0.3)
определяется дробной производной одномерного пространства Рисса [17, 18] при 1 < α < 2. При параметре β = 0 можно получить несвязанные нелинейные уравнения Шредингера (decoupled nonlinear Schroedinger, DNLS) [19]. Что касается параметра ρ, то он определяет три различных варианта нелинейного члена FSE. При ρ = 0 нелинейные члены исчезают и система (0.1) описывает свободные частицы [17, 20]. При ρ < 0 нелинейные члены в системе (0.1) представляют собой отталкивающее взаимодействие частиц [21–23]. При ρ > 0 нелинейные члены в системе (0.1) представляют собой притягивающее взаимодействие частиц [21, 24, 25]. В данной статье рассматривается только ρ > 0, в этом случае матрица коэффициентов дискретизированной линейной системы является комплексной симметричной неопределенной. Случай ρ < 0, приводящий к сложным симметричным отрицательно определенным линейным системам, обсуждается в [26–30].
Теоретически решение FSE сохраняет массу и энергию, например система (0.1). В частности, решения u(x,t),v(x,t) задачи (0.1) удовлетворяют сохранению массы [13]:
(0.4)
и сохранению энергии:
, (0.5)
где функционал энергии удовлетворяет E(t) = E(0). Вышеуказанные законы сохранения остаются в силе и при дискретизации системы (0.1).
В этой статье вместо всей вещественной оси ℝ рассмотрение ведется на ограниченном интервале a ≤ x ≤ b и приняты граничные условия Дирихле:
Для дискретизации дробных пространственных уравнений CNLS (0.1) используется схема линейно-неявной консервативной разности (linearly implicit conservative difference, LICD), предложенная в [13]. На каждом временном уровне необходимо решать сложные симметричные линейные системы с теплиц-плюс-диагональной структурой (D − T + гI) u = b, где D – диагональная, а T – теплицева симметричная положительно определенная матрица. При ρ > 0 матрица D положительно полуопределена, а D − T неопределена. Тогда D − T + гI является комплексно-симметричной неопределенной.
Существует множество численных методов для работы со сложными симметричными линейными системами. Первый класс методов – это методы неявной итерации с чередующимся направлением [31–35]. В [31, 32] были предложены итерационные методы эрмитова и косоэрмитова разложения (skew-hermitian splitting, HSS) для работы с общими неэрмитовыми положительно определенными линейными системами. Кроме того в этих публикациях были разработаны модифицированные итерационные методы HSS (modified HSS, MHSS) [33] и предварительно обусловленные итерационные методы MHSS (preconditioned MHSS, PMHSS) [34, 35] с учетом симметричной структуры матрицы системы. Второй класс методов – итерационные C-to-R [36], которые требуют высококачественных предобусловливателей для дополнения Шура для обеспечения устойчивости. Построение дополнения Шура затруднено, поскольку матрица дополнения Шура плотна и имеет вид S +, где S, ∈ ℝM×M – плотные матрицы с теплиц-плюс-диагональной структурой. К сожалению, методы типа HSS и итерации C-to-R не могут быть применены для прямой обработки комплексной симметричной неопределенной матрицы D − T + гI, поскольку они предназначены для неэрмитовой положительно определенной матрицы.
Для линейных систем с теплиц-плюс-диагональной структурой быстрые прямые решатели не разработаны. Следовательно, лучшим вариантом является использование предварительно обусловленных методов итерации подпространства Крылова [37, 38]. Реализация умножения матрицы на вектор и решение линейной системы с обобщенной невязкой (generalized residual, GR) всегда необходимы на каждой итерации предобусловливаемых методов итерации подпространства Крылова. Если существуют быстрые реализации умножения матрицы на вектор и можно эффективно сконструировать и реализовать высококачественные предобусловливатели, итерации подпространства Крылова будут работать очень хорошо. Многие эффективные предобусловливатели работают с эрмитовыми положительно определенными теплиц-плюс-диагональными системами. Это, например, класс полосовых (banded) предобусловливателей для эрмитовых систем «теплиц-плюс-полоса» [39]; класс приближенных предобусловливателей обратного циркулянта-плюс-диагонали (approximate inverse circulant-plus-diagonal, AICD) [40]; предобусловливатели диагонального и теплицевого разложения (diagonal and toeplitz splitting, DTS), а также предобусловливатели диагонального и циркулянтного разложения (diagonal and circulant splitting, DCS), предложенные в [41] (1D-случай) и [42] (многомерный случай). Тем не менее, никакие предобусловливатели, описанные выше, не могут быть напрямую применены для решения сложных линейных систем (D − T + гI) u = b, поскольку они предназначены для эрмитовых положительно определенных систем, но не для неопределенных симметричных теплиц-плюс-диагональных.
Для разработки эффективных итерационных методов рассматривается вещественная блочная (два на два) форма линейной системы (D − T + гI) u = b. Матрица блочной системы раскладывается на нормальную блочную матрицу и антисимметричную блочную матрицу и строится класс итерационных методов нормального и антисимметричного разложения (normal and anti-symmetric splitting, NASS), основанный на подходе неявных итерационных методов чередующегося направления (alternating direction implicit, ADI) [43, 44]. На каждом шаге итерационного метода NASS используются две линейные подсистемы с матрицами коэффициентов:
(0.6)
которые необходимо решить. Первое можно решить итеративно с помощью метода предобусловленного обобщенного метода минимальной невязки (generalized minimal residual method, GMRES) с блочным предобусловливателем:
(0.7)
с циркулянтной аппроксимацией C. Каждая итерация предобусловленного GMRES может быть выполнена за 𝒪(M log M) операций с плавающей точкой (флоп, flops), если применяется быстрый алгоритм, например быстрое преобразование Фурье (БПФ) [37]. Второе можно решить непосредственно с помощью разреженного исключения Гаусса (Gaussian elimination, GE) за 𝒪(M) флоп. Теоретически итерационный метод NASS безусловно сходится к единственному решению. Получена верхняя оценка коэффициента сжатия итерационного метода NASS, зависящая только от спектров симметричной положительно определенной матрицы Теплица T ∈ ℝM×M. Оптимальное значение параметра итерации, минимизирующее верхнюю границу коэффициента сжатия итерационного метода NASS, определяется нижней и верхней границами собственных значений T.
Класс предобусловливателей разложения матрицы, называемый предобусловливателями NASS, может быть получен естественным путем из итерационного метода NASS. Чтобы уменьшить вычислительную сложность предобусловливателей NASS, для замены блоков Теплица используются циркулянтные аппроксимации, что приводит к созданию класса более экономичных циркулянтных улучшенных нормальных и антисимметричных предобусловливателей (circulant improved normal and anti-symmetric, CNAS). Реализация предобусловливателя CNAS требует разрешения двух линейных подсистем. Матрицы подсистем имеют вид
(0.8)
Первое можно решить за 𝒪(M log M) флоп на основе БПФ, а второе можно решить непосредственно с помощью разреженного GE за 𝒪(M) флоп. Теоретический анализ показывает, что собственные значения матрицы предварительно обусловленной системы NASS группируются около 1. Кроме того, можно доказать, что предварительное обусловливание системы CNAS представляет собой небольшое возмущение нормы и коррекцию низкого ранга матрицы предварительно обусловленной системы NASS. Это значит, что большинство собственных значений матрицы предобусловленной системы CNAS сгруппированы вокруг аналогов для NASS, т.е. могут быть расположены около 1. Численные эксперименты показывают, что предобусловливатель CNAS значительно повышает вычислительную эффективность методов итерации подпространства Крылова (таких, как GMRES), а соответствующий предобусловленный метод (PGMRES) ведет себя независимо от размера пространственной сетки и нечувствителен к дробному порядку. Кроме того, замечено, что дискретная масса и энергия сохраняются по схеме LICD в сочетании с предварительно обусловленным методом CNAS GMRES с точки зрения заданной точности.
Изложение построено следующим образом. В разд. 1 схема LICD применяется для дискретизации дробно-пространственных уравнений CNLS, что приводит к неопределенной комплексной симметричной линейной системе (D − T + гI) u = b. В разд. 2 представлен итерационный метод NASS и установлена соответствующая асимптотическая теория сходимости. В разд. 3 создаются и анализируются новые предобусловливатели. В разд. 4 рассматриваются и обсуждаются реализации и вычислительные сложности новых предобусловливателей. В разд. 5 приведены числовые результаты и даются заключительные замечания.
1. Дискретизация и линейная система. Дробные по пространству уравнения CNLS (0.1) дискретизируются по схеме LICD [13]. Пусть N и M – целые положительные числа, через τ = T∕N и h = (b − a)∕(M + 1) заданы размеры временных шагов и пространственных сеток соответственно. Тогда tn = nτ для n = 0,N и xj = a + jh для j = 0,M + 1 представляют временные уровни и узлы пространственных ячеек.
Пусть ujn ≈ u(xj,tn) и vjn ≈ v(xj,tn) – аппроксимации сеточной функции. Одномерный дробный лапласиан (−Δ)можно дискретизировать дробной центрированной разностью [45, 46] в ограниченном пространственном интервале [a, b] как
Здесь
(1.1)
с коэффициентами
где Γ(⋅) – гамма-функция. Кроме того, коэффициенты ck удовлетворяют следующим свойствам [45]:
Схема LICD [13] для системы (0.1) выглядит следующим образом:
(1.2)
где ûjn = (ujn+1 + ujn−1)∕2, ûjn = (vjn+1 + vjn−1)∕2, для j = 1, 2,…,M,n = 1, 2,…,N − 1. Начальные и граничные условия: uj0 = u0(xj), vj0 = v0(xj), u0n = uM+1n = 0, v0n = vM+1n = 0. Эквивалентно первая строка (1.2) приводит к сложной линейной системе:
(1.3)
где An+1 = Dn+1 − T + гI ∈ ℂM×M, Dn+1 = diag{d1n+1,d2n+1,…,dMn+1} ∈ ℝM×M диагонально с djn+1= = ρτ(|ujn|2 + β|vjn|2), I ∈ ℝM×M – единичная матрица, а T ∈ ℝM×M является теплицевой:
(1.4)
с μ = γτ∕hα. Очевидно, что вторая строка (1.2) также допускает связанную линейную систему, такую же, как (1.3).
Ввиду того, что ρ > 0, γ > 0, β ≥ 0 и свойств коэффициентов ck, Dn+1 – неотрицательная диагональная матрица, а T строго диагонально доминантна и симметрична. Следовательно, Dn+1 − T симметричная неопределенная, а An+1 комплексно симметричная и неопределенная.
В [13] доказано, что дискретизированные связанные линейные системы (1.2) сохраняют дискретную массу и энергию, т.е.
(1.5)
где Q1n = (∥un+1∥2 + ∥un∥2)∕2 и Q2n = (∥vn+1∥2 + ∥vn∥2)∕2 с ∥u∥2 = ⟨u,u⟩ и
(1.6)
2. Итеративный метод NASS. Рассматривается построение итерационного метода для сложных линейных систем вида (1.3). Если игнорировать верхние индексы, он записывается как
(2.1)
где A = D − T + гI ∈ ℂM×M комплексно-симметричная и неопределенная, причем D ∈ ℝM×M – положительная полуопределенная диагональная матрица и T ∈ ℝM×M – симметричная положительно определенная теплицевая матрица. Комплексный неизвестный вектор имеет вид u = y + гz ∈ ℂM, а комплексный вектор b = p + гq ∈ ℂM – правая часть, где y, z, p, q ∈ ℝM – вещественные векторы. Затем сложную линейную систему (2.1) можно преобразовать в следующую вещественную блочную линейную систему:
(2.2)
где ∈ ℝ2M×2M несимметрично и неопределенно.
Определим перестановки блоков
(2.3)
и пусть
Тогда вещественная блочная линейная система (2.2) эквивалентна вещественной несимметричной положительно определенной блочной линейной системе следующим образом:
(2.4)
Матрица ℛ ∈ ℝ2M×2M допускает следующее нормальное и антисимметричное (NAS) разложение:
(2.5)
(2.6)
Основываясь на разложении NAS (2.5) и духе неявной итерации с чередующимся направлением (ADI) [43, 44], можно построить метод итерации NASS следующим образом.
Итерационный метод NASS. Пусть x(0) ∈ ℝ2M – произвольное начальное предположение. Для k = 0, 1, 2,…, пока последовательность итераций {x(k)} k≥0 не сойдется, вычислить следующую итерацию x(k+1), согласно следующей процедуре:
(2.7)
где ω > 0 – произвольный параметр итерации.
Итерационная схема (2.7) может быть переформулирована для итерации с фиксированной точкой как x(k+1) = ℒωx(k) + ℱω−1f, где матрица итераций это
(2.8)
Здесь
(2.9)
и
Действительно, матрицы ℱω и образуют разложение ℛ, т.е.
(2.10)
В следующей теореме обеспечивается свойство сходимости итерационного метода NASS.
Теорема 1. Пусть ℛ ∈ ℝ2M×2M – матрица системы (2.4), 𝒯 ∈ ℝ2M×2M и 𝒟∈ ℝ2M×2M – блочные матрицы, образующие разбиение ℛ в (2.5). Если ω – положительная константа, то итерационный метод NASS (2.7) корректно определен, а матрица итераций ℒω задается (2.8). Спектральный радиус ρ(ℒω) ограничен:
(2.11)
где λ(T) – спектр T. Таким образом, можно записать
(2.12)
т. е. итерация NASS сходится к единственному решению блочной линейной системы (2.4).
Доказательство. Поскольку 𝒯 положительно определен, 𝒟 антисимметричен и ω > 0, то ωI + 𝒯 и ωI + 𝒟 обратимы и положительно определены. Таким образом, итерация NASS (2.7) четко определена. Заметим, что итерационная матрица ℒω удовлетворяет условию ℒω = = (ωI + 𝒟)−1𝒰ω𝒱ω(ωI + 𝒟), где 𝒰ω = (ωI + 𝒯 )−1(ωI −𝒯) и 𝒱omega = (ωI −𝒟)(ωI + 𝒟)−1, можно установить следующее соотношение:
(2.13)
Теперь сосредоточимся на оценке ∥𝒰ω∥2 и ∥𝒱ω∥2. Во-первых, легко проверить, что 𝒯⊤𝒯 = 𝒯𝒯⊤, тогда имеем
(2.14)
Ввиду того, что T симметрична положительно определена, справедливо равенство
(2.15)
Во-вторых, рассмотрим оценку ∥𝒱ω∥2. Поскольку 𝒟⊤𝒟 = 𝒟𝒟⊤, то следует, что
Тогда
(2.16)
На основании (2.13)−(2.16) можно получить оценку (2.12).
Замечание 1. Для дальнейшего понимания теоретического результата, изложенного в приведенной выше теореме, сделаем следующие замечания.
- Скорость сходимости итерации NASS ограничена величиной σ(ω) и зависит только от спектра теплицевой матрицы T.
- Если ввести взвешенную векторную норму ∥x∥𝒟 = ∥(ωI + 𝒟)x∥2 для x ∈ ℝ2M и соответствующую норму индуцированной взвешенной матрицы ∥𝒳∥𝒟 = ∥(ωI + 𝒟)𝒳(ωI + 𝒟)−1∥2 для 𝒳 ∈ ℝ2M×2M имеет место равенство
Более того, на основе формы итерации с фиксированной точкой итерации NASS можно проверить, что последовательность итераций {x(k)} k ≥ 0 удовлетворяет условию
Следовательно, σ(ω) также служит верхней границей коэффициента сжатия итерации NASS в смысле ∥⋅∥𝒟-нормы. Замечено, что при TD = DT выполняется 𝒰ω𝒱ω = 𝒱ω𝒰ω, что приводит к факту ρ(ℒω) = ∥ℒω∥𝒟 = σ(ω). Тогда эти величины можно минимизировать при том же оптимальном значении ω.
- Верхняя граница σ(ω) может быть дополнительно ограничена величиной (ω), т.е.
где λmin > 0 и λmax > 0 – минимальное и максимальное собственные значения T. Поскольку функция g(ω; λ) = монотонно возрастает при λ > 0, она имеет вид
Пусть
(2.17)
тогда минимизируется в ω⋆ = . Если применяется параметр ω = ω⋆, скорость сходимости итерации NASS для решения блочной линейной системы (2.4) ограничивается следующим образом:
3. Предварительное обусловливание. Итерационный метод NASS естественным образом вызывает матрицу предварительной обработки ℱω, определенную в (2.9) для матрицы ℛ в (2.4). Соответствующая предобусловленная линейная система имеет вид
(3.1)
предобусловливатель ℱω называется предобусловливателем NASS. Очевидно, ℱω есть произведение блочных нормальных матриц ωI + 𝒯, ωI + 𝒟 и скалярного коэффициента 1∕(2ω).
В реализации основной задачей предварительной подготовки NASS является решение последовательности линейной системы с обобщенной невязкой:
, (3.2)
где r(k) – текущий вектор невязки, а z(k) – вектор обобщенной невязки. Разрешение (3.2) состоит из решения линейных подсистем с матрицами коэффициентов ωI + 𝒯 и ωI + 𝒟. Чтобы снизить стоимость процесса предварительной обработки, рассматриваются циркулянтные аппроксимации для замены матрицы Теплица T в ℱω [47–49]. Теоретическое рассматрение дается только для циркулянта Стрэнга C для T [47]. Для простоты анализа пусть M четное, в дальнейшем будем записывать как C = μ[ςij] ∈ ℝM×M с ςij = ςi−j, ςk = ς−k для 0 ≤ k < M, ς= 0 и
т.е.
(3.3)
которая является вещественной симметричной. Затем строится улучшенный эффективный предобусловливатель на основе циркулянта :
Очевидно, 𝒞 нормален, а 𝒟 антисимметричен. Таким образом, предобусловливатель называется циркулянтным улучшенным нормальным и антисимметричным предобусловливателем (CNAS).
Теперь изучим свойство кластеризации собственных значений предварительно обусловленной матрицы системы −1ℛ. Благодаря тому факту, что
(3.4)
это рассмотрение сводится к анализу свойств ℱω−1ℛ и ℱω соответственно.
3.1. Cвойство кластеризации ℱω−1ℛ. Рассмотрим свойство кластеризации ℱω−1ℛ.
Теорема 2. Пусть ℛ ∈ ℝ2M×2M – матрица системы в (2.4), 𝒯 ∈ ℝ22M×2M и 𝒟 ∈ ℝ22M×2M – блочные матрицы, образующие разбиение ℛ в (2.5), ω – положительная константа и σ(ω) определяется (2.11).
Когда предобусловливатель NASS ℱω применяется к блочной линейной системе (2.4), собственные значения предобусловленной матрицы ℱω−1ℛ в (3.1) расположены в круге радиуса σ(ω) < 1 с центром в точке 1.
Доказательство. Согласно (2.8) и (2.10), оно записывается как ℒω = I −ℱω−1ℛ. Таким образом, пусть η – собственное значение ℱω−1ℛ, тогда 1 − η – собственное значение ℒω. Кроме того, теорема 1 показывает, что ρ(ℒω) ≤ σ(ω), т. е. |1 −η| ≤ σ(ω) для всех η ∈ λ(ℱω−1ℛ), что и является результатом этой теоремы.
Теорема 3. Пусть ℛ ∈ ℝ22M×2M – матрица системы в (2.4), 𝒯 ∈ ℝ22M×2M и 𝒟∈ ℝ22M×2M – блочные матрицы, образующие разбиение ℛ в (2.5), ω – положительная константа. Тогда собственные значения предвобусловленной матрицы ℱω−1ℛ группируются в точке 0+ на правой полукомплексной плоскости, если ω стремится к положительной бесконечности.
Доказательство. Пусть λ – собственное значение ℒω, а x – соответствующий собственный единичный вектор, тогда оно записывается как ℒωx = λx, т.е. .
Обозначим
(3.5)
Если верно, что 𝒯 = I + , то имеем
Умножая x∗ слева на обе части приведенного выше уравнения, получим, что
Поскольку x∗x и x∗𝒟 x являются чисто мнимыми числами в силу того, что и 𝒟 вещественны и антисимметричны, запишем x∗x = γTı и x∗𝒟x = γDı с γT,γD ∈ ℝ. Кроме того, обозначим x∗𝒟x = γTD(R) + ıγTD(I) с γTD(R),γTD(I)∈ ℝ. Из чего следует
Поскольку ℱω−1ℛ = I −ℒω, то 1-λ является собственным значением ℱω−1ℛ и получается
Очевидно, что вещественная часть 1-λ стремится к 0+, а мнимая часть 1-λ – к 0, когда параметр ω стремится к положительной бесконечности.
3.2. Свойство ω−1ℱω. Теперь обсудим свойство ω−1ℱω. Для удобства определим следующие константы:
(3.6)
Далее вводятся две леммы следующего содержания.
Лемма 1. Эта и следующая леммы приведены в [30]. Пусть cj = (−1)jΓ(α + 1)∕[Γ(α∕2 − j + 1)Γ(α∕2 + j + 1)], k0 ≥ 3, и 1 < α < 2, тогда
. (3.7)
На основе леммы 1 оценки собственных значений матрицы Теплица T и ее циркулянтной аппроксимации C представлены в следующей лемме.
Лемма 2. Пусть T – матрица Теплица в (1.4), C – циркулянт Стрэнга в (3.3) и M четно, тогда справедливо равенство
(3.8)
и
(3.9)
где λT и λC – собственные значения T и C.
На основе лемм 1 и 2 свойство ω−1ℱω равно суммированы в следующей теореме.
Теорема 4. Пусть 1 < α < 2 и M ≥ 8 четно, 𝜖 > 0 – небольшая константа и
(3.10)
где ⌈.⌉ представляет собой округление вещественного числа до положительной бесконечности. Тогда существуют две матрицы ∈ ℝ2M×2M и ∈ ℝ2M×2M, удовлетворяющее rank = 4k0:
(3.11)
(3.12)
где ν = maxμi∈λ(D)|μi|, такой, что
(3.13)
Доказательство. Поскольку M четно, оно записывается как
где 12 ∈ ℝ×(−k0) и 13 ∈ ℝ×k0 имеют вид
Следовательно, выполняется
(3.14)
где
Очевидно, оно записывается как rank = 2k0. Более того, ввиду лемм 1 и 2, а также структуры и можно получить следующие оценки:
(3.15)
(3.16)
Можно проверить, что ω−1ℱω − I и (ωI + 𝒞)−1(𝒯 −𝒞) подобны, т.е.
причем
(3.17)
Учитывая (3.14) запишем
где
Таким образом, выполняется
где
(3.18)
и
(3.19)
Дополнительно имеем
Первое “=” связано с тем, что собственные значения
(3.20)
равны ω ± μiı с μi ∈ λ(D) и г = , а собственные значения
(3.21)
представляют собой ω + 1 ± λi(c)ı с λi(c) ∈ λ(C). Второй знак “≤” обусловлен связью между ∥⋅∥2 и ∥⋅∥∞, а последнее строгое неравенство возникает вследствие леммы 2, оценки ∞ и учета того, что ω > 0 и 0 ≤ μi ≤ ν. Аналогично имеем
Замечание 2. Рассмотрим следующее соотношение, сформулированное в теореме 4:
С одной стороны, матрица I + является малым возмущением единичной матрицы I. В частности, поскольку ∥∥2 ≤ 𝜖, теорема Бауэра-Фике [50] приводит к тому, что
т.е. собственные значения I + сгруппированы в небольшом диске с центром в точке 1 и радиусом 𝜖. С другой стороны, поскольку матрица имеет ограниченную ℓ2-норму и низкий ранг, матрицу ω−1ℱω можно рассматривать как низкоранговую модификацию I + . Тогда ожидаем, что собственные значения ω−1ℱω также расположены в том же диске с центром в точке 1 и радиусом 𝜖, за исключением небольшого количества выбросов.
Наконец, следующая теорема устанавливает связь между ω−1ℛ и ℱω−1ℛ.
Теорема 5. Пусть 1 < α < 2, M ≥ 8 четно, 𝜖 – небольшая положительная константа, такая, что
(3.22)
Тогда существуют две матрицы 𝒫ω ∈ ℝ2M×2M и 𝒬ω ∈ ℝ2M×2M, удовлетворяющие
(3.23)
(3.24)
(3.25)
при этом
(3.26)
Доказательство. Отметим, что
где 𝒰ω и 𝒱ω определены в доказательстве теоремы 1. Согласно (2.15) и (2.16), известно, что 2 < 1, и в этом случае 2 ≤ ∥I∥2 + 2 < 2.
Далее, согласно доказательству теоремы 4, имеем
Таким образом 2 < 2∕ω.
Ввиду (3.4) и (3.13) выполняется
(3.27)
где 𝒫ω = ℱω−1ℛ и 𝒬ω = ℱω−1ℛ. Из теоремы 4 следует rank = 4k0,
Замечание 3. Теорема 5 показывает, что 𝒬ω – матрица малой нормы, поэтому собственные значения ℱω−1ℛ + 𝒬ω можно рассматривать как малые возмущения собственных значений ℱω−1ℛ. Кроме того, 𝒫ω имеет ограниченную ℓ2-норму и низкий ранг, поэтому можно ожидать, что большинство собственных значений ω−1ℛ распределены вблизи собственных значений ℱω−1ℛ + 𝒬 ω. Таким образом, собственные значения ω−1ℛ группируются вокруг собственных значений ℱω−1ℛ, за исключением нескольких выбросов.
4. Реализация и сложность. В предыдущих разделах были предложены и проанализированы новые предобусловливатели для блочной линейной системы (2.4), а именно NASS ℱω и CNAS ω, реализация которых подробно обсуждается в этом разделе. Фактически можно игнорировать скалярный множитель 1∕(2ω) для ℱω и ω по той причине, что он не влияет на свойства предобусловленных матриц системы. Тогда упрощенные предобусловливатели записываются как
где ω > 0 служит параметром ℱNASS и ℱCNAS, ℱ ∈ ℂM×M – дискретное преобразование Фурье (ДПФ), Λ = diag(Fc) ∈ ℂM×M, где c ∈ ℂM является первым столбцом C, = ω + 1, 21 = −T∕, = I + T2∕, L21 = D∕omega, U22 = ωI + D2∕ω, 21 = −Λ ∕, 22 = I + Λ2∕. Диагональные матрицы L21,U22,21,22 можно вычислить заранее.
В методах предварительно обусловленных подпространств Крылова вектор обобщенной невязки вычисляется путем решения соответствующего уравнения, связанного с новыми предобусловливателями, на каждой итерации. Пусть x = (x1⊤,x2⊤)⊤ ∈ ℝ2M с x1, x2 ∈ ℝM и r = (r1⊤,r2⊤)⊤ ∈ ℝ2M с r1, r2 ∈ ℝM. Подробности для реализация предварительной подготовки NASS и CNAS приведены в описании алгоритмов 1 и 2.
Стоимость алгоритма 2 складывается из операций быстрого преобразования Фурье (БПФ) и его обратного (ОБПФ) размерности M и векторных операций размерности M (включая сложение векторов, диагональное умножение матрицы на вектор и решение диагональной линейной системы). Согласно [51], БПФ/ОБПФ могут быть выполнены за 𝒪(MlogM) флоп. Все операции с векторами размерности M могут быть произведены за 𝒪(M) флоп. Таким образом, в вычислениях метода ℱCNAS преобладают операции БПФ/ОБПФ. Это означает, что вектор обобщенной невязки может быть вычислен за 𝒪(MlogM) флоп на каждой итерации предобусловленных методов подпространств Крылова.
Стоимость алгоритма 1 складывается из векторных операций размерности M (около 𝒪(M) флоп), умножений теплицевой матрицы M × M на вектор (около 𝒪(MlogM) флопс, поскольку его можно реализовать на основе БПФ/ОБПФ) и однократного решения плотной линейной системы размерности M × M с матрицей коэффициентов (ω + 1)I + T2∕(ω + 1). Решение линейной системы может быть реализовано на основе прямого метода (около 𝒪(M3)) или метода предварительно обусловленного сопряженного градиента (PCG) с предобусловливателем (ω + 1)I + C2∕(ω + 1) (около 𝒪(kMlogM) флоп, где k – количество итераций PCG). Очевидно, что вычислительная нагрузка по реализации ℱNASS во многом зависит от стоимости решения плотной линейной системы, что намного дороже, чем реализация ℱCNAS. Поэтому настоятельно рекомендуется использовать новый предобусловливатель ℱCNAS.
Алгоритм 1. Решение уравнения с обобщенной невязкой ℱNASS x = r.
1: x1 = r1, x2 = r2 −21r1;
2: 22x2 = x2 и x1 = (r1 − Tx2) ∕;
3: x2 = x2 − L21x1;
4: U22x2 = x2 и x1 = (x1 + Dx2)∕ω.
На первом шаге этого алгоритма используется одно умножение теплицевой матрицы M ×M на вектор и две векторные операциии размерности M; на втором – одно решение плотной линейной системы M ×M , одно умножение теплицевой матрицы на вектор и две векторные операции; на третьем – две векторные операции; на четвертом – четыре векторные операции.
Алгоритм 2. Решение уравнение обобщенной невязки ℱCNAS x = r.
1: xj = БПФ(rj), j = 1, 2;
2: x2 = x2 −21x1;
3: 22x2 = x2 и x1 = (x1 − Λx2)∕;
4: xj = ОБПФ(xj), j = 1, 2;
5: x2 = x2 − L21x1;
6: U22x2 = x2 и x1 = (x1 + Dx2) ∕ω.
На первом шаге этого алгоритма осуществляются два БПФ размерности M; на втором и пятом шагах – по две векторные операции; на третьем и шестом шагах – по четыре векторные операции; на четвертом – два ОБПФ. размерности M.
5. Численные эксперименты. В этом разделе представлены доказательства свойств новых предобусловливателей ℱNASS и ℱCNAS. Метод GMRES применяется с предобусловливателем CNAS ℱCNAS для решения дробных уравнений CNLS в дискретизированном пространстве в случае притягивающего взаимодействия частиц. Дробные дискретизированные уравнения CNLS получены на основе схемы LICD. Для запуска схемы LICD требуется начальное значение на начальном временном уровне и приблизительное значение второго или более высокого порядка на первом временном уровне. Например, приближенное значение второго порядка можно получить с помощью неявной консервативной схемы второго порядка [12].
Во всех численных экспериментах блочная линейная система (2.4) на втором временном уровне дискретизированных дробных уравнений CNLS выбирается в качестве тестируемой линейной системы, а начальное предположение предварительно обусловленного метода GMRES устанавливается равным нулевому вектору. Кроме того, метод GMRES (предварительно обусловленный) выполняется без перезапуска и завершает либо относительную невязку ℓ2-нормы тестируемой линейной системы, упавшую ниже 10−6, либо количество итераций, превышающее 3000.
5.1. Случай DNLS. Пусть β = 0, тогда система (0.1) расцеплена. Рассмотрим следующую усеченную систему:
(5.1)
при соблюдении начальных и граничных условий
(5.2)
Здесь взяты параметры γ = 1, ρ = 2, 1 < α ≤ 2. Дискретизированные дробные уравнения DNLS получаются путем применения схемы LICD к (5.1) и (5.2). Требуется решить сложную симметричную линейную систему вида (2.1) на каждом временном уровне tn для 1 < n ≤ N, что эквивалентно решению блочной линейной системы (2.4). В частности, блочная линейная система (2.4) решается методом предварительно обусловленной GMRES CNAS (CNAS-GMRES). В этом подразделе «IT» представляет количество итераций тестируемого метода.
На рис. 1 показаны кривые IT в зависимости от параметра ω ∈ (0, 8] CNAS-GMRES при α = 1.1 : 0.2 : 1.9, M = 6400, N = 200. Видно, что IT быстро увеличивается, когда ω стремится к нулю. Однако когда ω растет, IT быстро достигает минимума, а затем растет очень медленно, а оптимальное значение ω составляет примерно [2.2, 2.8] для всех случаев α. Таким образом, сходимость CNAS-GMRES менее чувствительна к параметру ω, пока ω не слишком близок к нулю, что делает предобусловливатель CNAS ℱCNAS прост в использовании. Кроме того, больший α приводит к большему IT, а это означает, что с увеличением α систему становится сложнее решить.
Рис. 1. Кривые IT от параметра ω ∈ (0, 8] CNAS-GMRES при α = 1.1 : 0.2 : 1.9, M = 6400, N = 200
На рис. 2 показаны кривые IT CNAS-GMRES в зависимости от размера пространственной сетки M схемы LICD, примененной к дробным пространственным уравнениям DNLS, когда α = 1.1 : 0.2 : 1.9, N = 200. Выбрано эмпирическое оптимальное значение ω. Показано, что IT CNAS-GMRES остается практически неизменным с увеличением количества пространственных дискретных точек, что указывает на независимость свойства сходимости CNAS-GMRES от размера пространственной сетки. Кроме того, больший дробный порядок α приводит к более высокому положению кривой на графике.
Рис. 2. Кривые IT CNAS-GMRES от размера пространственной сетки M при α = 1.1 : 0.2 : 1.9, N = 200
В табл. 1 перечислены IT CNAS-GMRES в сочетании с различными циркулянтными матрицами, а также эмпирическое оптимальное значение параметра ω CNAS-GMRES при α = 1.9, M = 6400, N = 200. Интервал поиска параметра ω равен (0, 4]. Перечислены только результаты нескольких репрезентативных циркулянтных матриц [51], включая циркулянтную матрицу Т.Чана, циркулянтную матрицу Стрэнга, циркулянтную матрицу Р.Чана, циркулянтные матрицы, построенные на основе некоторых известных ядер (например, модифицированного ядра Дирихле, ядра фон Ханна, ядра Хэмминга), и супероптимальная циркулянтная матрица. За исключением супероптимальной циркулянтной матрицы, IT CNAS-GMRES со всеми остальными циркулянтными матрицами меньше 10, а оптимальное эмпирическое значение ω практически одинаково, т.е. [0.21, 1.01] ([0.41, 0.81] для циркулянтной матрицы Т.Чана). Эти эксперименты показывают, что большинство циркулянтных матриц в литературе эффективны, когда они применяются к CNAS-GMRES, что позволяет легко выбрать циркулянтное приближение в CNAS-GMRES. Супероптимальная циркулянтная матрица плохо работает в наших экспериментах, и возможная причина заключается в том, что оптимальное значение ω CNAS-GMRES в этом случае остается за пределами интервала поиска (0, 4].
Таблица 1. IT CNAS-GMRES с различными циркулянтными матрицами и эмпирическое оптимальное значение параметра ω CNAS-GMRES при α = 1.9, M = 6400,N = 200
Circulant Matrix | IT | ω |
T. Chan | 7 | [0.41,0.81] |
Strang | 8 | [0.21,1.01] |
R. Chan | 8 | [0.21,1.01] |
Modified Dirichlet kernel | 8 | [0.21,1.01] |
Hann kernel | 8 | [0.21,1.01] |
Hamming kernel | 8 | [0.21,1.01] |
Superoptimal | 220 | [0.52,0.55] |
На рис. 3−5 показано распределение собственных значений матрицы ℛ, предобусловленной матрицы NASS ℱNASS−1ℛ и предобусловленной матрицы CNAS ℱCNAS−1ℛ, когда α = 1.1 : 0.4 : 1.9, M = 1600, 3200. Левые графики относятся к случаю M = 1600, а правые – к случаю M = 3200. На рис. 3 вещественные части собственных значений ℛ равны 1, а мнимые части распределены от −1.3 до 1.3 при M = 1600 и от −2.7 до 2.7 при M = 3200. На рис. 4 вещественные части собственных значений ℛ равны 1, а мнимые части распределены от −8 до 8 при M = 1600 и от −20 до 20 при M = 3200. На рис. 5 вещественные части собственных начений ℛ равны 1, а мнимые части распределены от −42 до 42 при M = 1600 и от −150 до 150 при M = 3200. При этом вещественные части собственных значений ℱNASS−1ℛ и ℱCNAS−1ℛ распределены от 1.3 до 2, а мнимые – от −0.5 до 0.5 на всех графиках. Очевидно, собственные значения ℱNASS−1ℛ и ℱCNAS−1ℛ более кластеризованы, чем ℛ (особенно для больших α). Кроме того, большинство собственных значений ℱCNAS−1ℛ группируются вокруг значений ℱNASS−1ℛи только несколько собственных значений ℱCNAS−1ℛ отклоняются сильнее, что соответствует предсказанию замечаний 2, 3. Распределение собственных значений предварительно обусловленных случаев остается почти таким же, когда M увеличивается с 1600 до 3200, что указывает на свойство сходимости NASS-GMRES и CNAS-GMRES, не зависящее от размера пространственной сетки.
Рис. 3. Распределение собственных значений ℛ, ℱNASS−1ℛ и ℱCNAS−1ℛ, при α = 1.1, M = 1600, N = 200 (слева) и M = 3200, N = 200 (справа)
Рис. 4. Распределение собственных значений ℛ, ℱNASS−1ℛ и ℱCNAS−1ℛ, при α = 1.5, M = 1600,N = 200 (слева) и M = 3200, N = 200 (справа)
Рис. 5. Распределение собственных значений ℛ, ℱNASS−1ℛ и ℱCNAS−1ℛ, при α = 1.9, M = 1600, N = 200 (слева) и M = 3200, N = 200 (справа)
На рис. 6−9 слева показано численное решение uCNAS, полученное с помощью CNAS-GMRES, а справа – его ошибка erru = |uCNAS − uGE|, т.е. отклонение от решения, полученного в схеме LICD с использованием решения плотной линейной системы методом Гаусса, для дробно-пространственных уравнений DNLS (5.1) при M = 800, N = 200, α = 1.1 : 0.4 : 1.9 и α = 2. Замечено, что дробный порядок α будет влиять на форму волнового фронта как по высоте, так и по ширине. Чем меньше α, тем быстрее будет меняться форма волнового фронта. При стремлении α к 2 волновой фронт пространственного дробного уравнения DNLS сходится к волновому фронту недробного уравнения, и высота волнового фронта стабильна. Кроме того, ошибка между численным решением и точным решением схемы LICD остается всего лишь около 10−4 во всей задействованной пространственно-временной области, следовательно, численное решение, полученное с помощью CNAS-GMRES, является надежным.
Рис. 6. Численное решение (слева) и его ошибка (справа) дробного пространственного уравнения DNLS (5.1) при α = 1.1, M = 800, N = 200
Рис. 7. Численное решение (слева) и его ошибка (справа) дробного пространственного уравнения DNLS (5.1) при α = 1.5, M = 800, N = 200
Рис. 8. Численное решение (слева) и его ошибка (справа) дробного пространственного уравнения DNLS (5.1) при α = 1.9, M = 800, N = 200
Рис. 9. Численное решение (слева) и его ошибка (справа) дробного пространственного уравнения DNLS (5.1) при α = 2, M = 800, N = 200
В табл. 2 и на рис. 10 показаны относительные погрешности дискретной массы и энергии для различных значений α соответственно. Размер пространственной сетки и размер временного шага составляют h = 0.2 и τ = 0.05 для табл. 2 и h = 0.2 и τ = 0.001 для рис. 10. На каждом временном уровне блочная линейная система решается с помощью CNAS-GMRES и завершается, когда относительная невязка по норме ℓ2 блочной линейной системы снижается ниже 10−15. Указанные ошибки остаются очень небольшими, а это означает, что линейный решатель CNAS-GMRES сохраняет устойчивость схемы LICD.
Рис. 10. Относительные погрешности дискретной энергии, т.е. |(En −E0)∕E0|, при h = 0.2, τ = 0.001
Таблица 2. Относительные ошибки дискретной массы, т. е. |(Qn − Q0)∕Q0| при h = 0.2, τ = 0.05
α | t = 1 | t = 2 | t = 3 | t = 4 |
1.4 | 4.8850E-015 | 7.5495E-015 | 6.4393E-015 | 9.1038E-015 |
1.7 | 5.9952E-015 | 4.2188E-015 | 3.3307E-015 | 3.7748E-015 |
1.9 | 1.1102E-015 | 2.2209E-015 | 3.1086E-015 | 1.5543E-015 |
2 | 6.6613E-016 | 5.7732E-015 | 5.3291E-015 | 6.6615E-015 |
5.2. Случай CNLS. Эксперименты здесь проводятся в связанном случае, т. е. усеченной системе уравнений CNLS:
(5.3)
при соблюдении начальных и граничных условий:
(5.4)
где γ = 1, ρ = 1, β = 1, 1 < α ≤ 2. Схема LICD, примененная к (5.3) и (5.4), приводит к дробным уравнениям CNLS в дискретизированном пространстве. Требуется последовательно решить две сложные симметричные линейные системы вида (2.1) на каждом временном уровне tn для 1 < n ≤ N, что эквивалентно решению двух блочных линейных систем вида (2.4). В дальнейшем «CPU» и «IT» – это общее время вычислений в секундах и общее количество итераций для решения двух связанных линейных систем в точке tn.
На рис. 11 показаны кривые IT CNAS-GMRES в зависимости от размера пространственной сетки M схемы LICD, применяемой к дробным пространственным уравнениям CNLS, когда α = 1.1 : 0.2 : 1.9, M = 800, 1600, 3200, 6400, 12800, 25600 и N = 200. Выбрано эмпирическое оптимальное значение ω. Результат аналогичен случаю дробных уравнений DNLS с дискретизированным пространством, что подтверждает, что CNAS-GMRES также не зависит от размера пространственной сетки в связанном случае.
Рис. 11. Кривые IT CNAS-GMRES от размера пространственной сетки M при α = 1.1 : 0.2 : 1.9, N = 200
На рис. 12 показано влияние силы нелинейного члена (управляемого параметром ρ) на количество итераций GMRES, NASS-GMRES и CNAS-GMRES при α = 1.1 : 0.4 : 1.9, M = 1600. Параметр ρ увеличивается с 1 до 64. На этих графиках IT схем NASS-GMRES и CNAS-GMRES очень мало и медленно увеличивается по мере роста ρ. При этом IT схемы GMRES очень велико и быстро растет. Видно, что чем сильнее нелинейный член, тем труднее решать связанные линейные системы. Новые предобусловленные методы GMRES могут эффективно справляться с сильно нелинейным случаем.
Рис. 12. Кривые IT NASS-GMRES, CNAS-GMRES и GMRES от нелинейного термопараметра ρ при α = 1.1 : 0.4 : 1.9, M = 1600, N = 200
В табл. 3–7 указаны CPU и IT GMRES, CNAS-GMRES и GE при α = 1.1 : 0.2 : 1.9, M = 3200, 6400, 12800, 25600, N = 200. В этих таблицах ‘–’ означает, что GMRES не сходится за заданное количество итераций, N/A означает, что данные IT для GE недоступны. Эмпирические оптимальные параметры CNAS-GMRES, соответствующие результатам табл. 3–7, приведены в табл. 8. В частности, ωu и ωv обозначаются эмпирическими оптимальными параметрами CNAS-GMRES для блочных линейных систем (2.4), связанных с u и v соответственно. Согласно таб. 3–7, GE требует самого большого CPU во всех тестах, а CPU CNAS-GMRES всегда меньше CPU GMRES. Кроме того, IT GMRES быстро увеличивается с увеличением дробного порядка α и размера пространственной сетки M, что указывает на то, что систему (5.3) становится сложнее решить по мере роста α. Между тем IT CNAS-GMRES меньше, чем IT GMRES, особенно для больших α и M. Таким образом, CNAS-GMRES значительно повышает эффективность вычислений, ведет себя независимо от размера пространственной сетки M и почти нечувствителен к дробному порядку α.
Таблица 3. CPU и IT GMRES для CNAS-GMRES и GE при α = 1.1, N = 200
M | 3200 | 6400 | 12800 | 25600 | ||||
CPU | IT | CPU | IT | CPU | IT | CPU | IT | |
GMRES | 8.33E-02 | 22 | 5.69E-01 | 50 | 2.67E-00 | 110 | 1.10E+01 | 236 |
CNAS-GMRES | 6.10E-02 | 10 | 2.61E-01 | 12 | 6.98E-01 | 14 | 1.21E-00 | 14 |
GE | 2.10E+01 | N/A | 1.67E+02 | N/A | 1.36E+03 | N/A | 1.88E+04 N/A |
Таблица 4. CPU и IT для GMRES, CNAS-GMRES и GE при α = 1.3, N = 200
M | 3200 | 6400 | 12800 | 25600 | ||||
CPU | IT | CPU | IT | CPU | IT | CPU | IT | |
GMRES | 3.84E-01 | 66 | 2.82E-00 | 182 | 2.47E+01 | 514 | 1.61E+02 1087 | |
CNAS-GMRES | 6.52E-02 | 14 | 2.53E-01 | 14 | 7.12E-01 | 14 | 1.23E-00 | 14 |
GE | 2.10E+01 | N/A | 1.64E+02 | N/A | 1.36E+03 | N/A | 1.94E+04 N/A |
Таблица 5. CPU и IT для GMRES, CNAS-GMRES и GE при α = 1.5, N = 200
M | 3200 | 6400 | 12800 | 25600 | ||||
CPU | IT | CPU | IT | CPU | IT | CPU | IT | |
GMRES | 1.86E-00 | 256 | 2.89E+01 | 832 | 3.26E+02 | 2700 | – | – |
CNAS-GMRES | 7.24E-02 | 16 | 2.60E-01 | 16 | 7.56E-01 | 16 | 1.26E-00 | 16 |
GE | 2.10E+01 | N/A | 1.66E+02 | N/A | 1.34e+03 | N/A | 1.92E+04 N/A |
Таблица 6. CPU и IT для GMRES, CNAS-GMRES и GE при α = 1.7, N = 200
M | 3200 | 6400 | 12800 | 25600 | ||||
CPU | IT | CPU | IT | CPU | IT | CPU | IT | |
GMRES | 1.31E+01 | 1086 | 4.46E+02 | 4056 | – | – | – | – |
CNAS-GMRES | 9.40E-02 | 16 | 2.95E-01 | 16 | 8.09E-01 | 16 | 1.53E-00 | 16 |
GE | 2.11E+01 | N/A | 1.68E+02 | N/A | 1.39E+03 | N/A | 1.96E+04 N/A |
Таблица 7. CPU и IT для GMRES, CNAS-GMRES и GE при α = 1.9, N = 200
M | 3200 | 6400 | 12800 | 25600 |
CPU IT | CPU IT | CPU IT | CPU IT | |
GMRES | 2.51E+02 4696 | – – | – – | – – |
CNAS-GMRES | 1.27E-01 16 | 2.66E-01 16 | 7.88E-01 16 | 1.45E-00 18 |
GE | 2.12E+01 N/A | 1.70E+02 N/A | 1.47E+03 N/A | 1.98E+04 N/A |
Таблица 8. Эмпирические оптимальные параметры CNAS-GMRES при α = 1.1 : 0.2 : 1.9, N = 200
α | M | 3200 | 6400 | 12800 | 25600 |
1.1 | ωu ωv | [0.16,0.24] [0.18,0.25] | [0.16,0.24] [0.18,0.25] | [0.15,0.24] [0.16,0.22] | [0.17,0.24] [0.20,0.25] |
1.3 | ωu ωv | [0.19,0.24] [0.20,0.24] | [0.19,0.24] [0.20,0.25] | [0.18,0.24] [0.21,0.23] | [0.17,0.24] [0.19,0.23] |
1.5 | ωu ωv | [0.09,0.24] [0.10,0.25] | [0.20,0.24] [0.18,0.25] | [0.17,0.24] [0.17,0.24] | [0.17,0.24] [0.18,0.24] |
1.7 | ωu ωv | [0.26,0.34] [0.30,0.43] | [0.26,0.34] [0.28,0.34] | [0.18,0.24] [0.20,0.25] | [0.14,0.24] [0.16,0.25] |
1.9 | ωu ωv | [0.09,0.34] [0.10,0.35] | [0.08,0.34] [0.09,0.34] | [0.06,0.24] [0.09,0.25] | [0.21,0.24] [0.22,0.25] |
Таблицы 9, 10 и рисунок 13 сообщают об относительных ошибках дискретной массы и энергии. Соответствующий размер пространственной сетки и размер временного шага составляют h = 0.1, τ = 0.01. На каждом временном уровне блочные линейные системы, связанные с u и v, решаются с помощью CNAS-GMRES и прекращаются, когда относительные невязки блочных линейных систем по ℓ2-норме уменьшаются ниже 10−15. Небольшие ошибки, показанные в табл. 9, 10 и на рис. 13, показывают, что как дискретная масса, так и энергия схемы LICD сохраняются линейным решателем CNAS-GMRES при < α = 2, β = 1 >, < α = 1.6, β = 1 > и < α = 1.5, β = 2 >.
Рис. 13. Относительные погрешности дискретной энергии, т.е. |(En −E0)∕E0|, при h = 0.1, τ = 0.01
Таблица 9. Относительные ошибки дискретной массы в u, т. е. |(Q1n − Q10)∕Q 10|, при h = 0.1, τ = 0.01
α | β | t = 2 | t = 4 | t = 6 | t = 8 | t = 10 |
2 | 1 | 4.4409E-015 | 3.8857E-015 | 6.2172E-015 | 7.9936E-015 | 1.0749E-014 |
1.6 | 1 | 8.8818E-016 | 3.5527E-015 | 3.7748E-015 | 4.2188E-015 | 3.7748E-015 |
1.5 | 2 | 1.1102E-015 | 6.6613E-016 | 2.8866E-015 | 5.5511E-015 | 5.3291E-015 |
Таблица 10. Относительные ошибки дискретной массы в v, т.е. |(Q2n− Q20)∕Q20|, при h = 0.1, τ = 0.01
α | β | t = 2 | t = 4 | t = 6 | t = 8 | t = 10 |
2 | 1 | 9.9920E-016 | 4.4409E-016 | 2.6645E-015 | 3.9968E-015 | 9.6589E-015 |
1.6 | 1 | 1.5543E-015 | 4.4409E-016 | 3.2204E-015 | 1.3323E-015 | 1.3323E-015 |
1.5 | 2 | 4.4409E-016 | 2.2204E-016 | 1.1102E-015 | 4.2188E-015 | 3.5527E-015 |
На рис. 14–17 слева изображены численные решения uCNAS и vCNAS, полученные с помощью CNAS-GMRES, а справа – соответствующие ошибки erru = |uCNAS − uGE| и errv = |vCNAS − vGE| относительно точных решений, полученных схемой LICD с решением линейной системы методом Гаусса, для дробно-пространственных уравнений CNLS (5.3) при α = 1.1 : 0.4 : 1.9 и α = 2, M = 800, N = 600. Форма волновых фронтов меняется в зависимости от дробного порядка α и сходится к волновым фронтам стандартных уравнений CNLS при приближении α к 2. Дробный порядок α влияет на время столкновения волновых фронтов. Чем больше значение α, тем быстрее движутся волновые фронты и тем раньше происходит столкновение. Из рис. 16–17 видно, что отражения происходят после того, как волновые фронты достигают границы пространственно-временной области. Очевидно, что никакого отражения волнового фронта не произойдет, если пространственный интервал не усечен. Кроме того, ошибки численного решения остаются очень небольшими, что означает надежность линейного решателя CNAS-GMRES.
Рис. 14. Численные решения (слева) и их ошибки (справа) дробно-пространственных уравнений CNLS (5.3) при α = 1.1, M = 800, N = 600
Рис. 15. Численные решения (слева) и их ошибки (справа) дробно-пространственных уравнений CNLS (5.3) при α = 1.5, M = 800, N = 600
Рис. 16. Численные решения (слева) и их ошибки (справа) дробно-пространственных уравнений CNLS (5.3) при α = 1.9, M = 800, N = 600
Рис. 17. Численные решения (слева) и их ошибки (справа) дробно-пространственных уравнений CNLS (5.3) при α = 2, M = 800, N = 600
Заключение. Проведенная работа сосредоточена на создании эффективных линейных решателей для сложных симметричных и неопределенных линейных систем вида (D − T + гI) u = b, которые имеют теплиц-плюс-диагональ и комплексную симметричную структуры. Эти линейные системы возникают из одномерных пространственных дробных уравнений Шредингера с притягивающим взаимодействием частиц, дискретизированных по схеме LICD. В частности, предлагаются итерационный метод NASS и, естественно, порождаемый предобусловливатель NASS. Простой в реализации и чрезвычайно эффективный предобусловливатель создается путем точной аппроксимации теплицевых блоков циркулянтными матрицами, которая называется предобусловливателем CNAS. Теоретически исследованы получаемые итерационный метод и предобусловливатели. Метод GMRES с предварительной обработкой CNAS подтвержден как эффективный и действенный линейный решатель для (D − T + ıI)u = b посредством численных экспериментов, основанных на одномерных дробных уравнениях CNLS. Однако эти результаты получены при условии постоянных коэффициентов одномерной задачи и для равномерных сеток. В будущем можно расширить итерационный метод NASS и связанный с ним предобусловливатель для задач более высокой размерности. Также, когда в задаче появляются переменные коэффициенты, в полученных линейных системах не может быть найдена явная структура теплиц-плюс-диагональ, поэтому нахождение возможной неявной структуры и расширение описанных методов для построения эффективных решателей может стать большой проблемой. Наконец, когда задача дискретизируется на неравномерных сетках, теплиц-плюс-диагональная структура полученной линейной системы может быть полностью утрачена. Тогда возможным способом построения быстрых решателей является объединение иерархически-матричного подхода [52, 53] и структуры, предложенной в этой статье.
作者简介
Y. Cheng
College of Mathematics, Nanjing University of Aeronautics and Astronautics
编辑信件的主要联系方式.
Email: lyandcxh@nuaa.edu.cn
中国, Nanjing
X. Yang
College of Mathematics, Nanjing University of Aeronautics and Astronautics
Email: lyandcxh@nuaa.edu.cn
中国, Nanjing
I. Matveev
Federal Research Center “Computer Science and Control” of the Russian Academy of Sciences
Email: matveev@frccsc.ru
俄罗斯联邦, Moscow
参考
- Feynman R.P. Statistical Mechanics: A Set of Lectures. 1st edn. CRC Press, 1998.
- Feynman R.P., Hibbs A.R., Styer D.F. Quantum Mechanics and Path Integrals. Dover Publications, 2010.
- Laskin N. Fractional Quantum Mechanics and Levy Path Integrals // Phys. Lett. A. 2000. V. 268. P. 298–305.
- Laskin N. Fractional Quantum Mechanics // Phys. Rev. E. 2000. V. 62. P. 3135–3145.
- Guo X.Y., Xu M.Y. Some Physical Applications of Fractional Schroedinger Equation // J. Math. Phys. 2006. V. 47. P. 082104.
- Li M., Gu X.M., Huang C.M. et al. A Fast Linearized Conservative Finite Element Method for the Strongly Coupled Nonlinear Fractional Schroedinger Equations // J. Comput. Phys. 2018. V. 358. P. 256–282.
- Li M., Huang C.M., Wang P.D. Galerkin Finite Element Method for Nonlinear Fractional Schroedinger Equations // Numer. Algorithms. 2017. V. 74. P. 499–525.
- Duo S.W., Zhang Y.Z. Mass-conservative Fourier Spectral Methods for Solving the Fractional Nonlinear Schroedinger Equation // Comput. Math. Appl. 2016. V. 71. P. 2257–2271.
- Wang Y., Mei L.Q., Li Q. et al. Split-step Spectral Galerkin Method for the Two-dimensional Nonlinear Space-fractional Schroedinger Equation // Appl. Numer. Math. 2019. V. 136. P. 257–278.
- Amore P., Fernandez F.M., Hofmann C.P. et al. Collocation Method for Fractional Quantum Mechanics // J. Math. Phys. 2010. V. 51. P. 122101.
- Bhrawy A.H., Zaky M.A. An Improved Collocation Method for Multi-dimensional Space-time Variable-order Fractional Schroedinger Equations // Appl. Numer. Math. 2017. V. 111. P. 197–218.
- Wang D.L., Xiao A.G., Yang W. Crank-Nicolson Difference Scheme for the Coupled Nonlinear Schroedinger Equations with the Riesz Space Fractional Derivative // J. Comput. Phys. 2013. V. 242. P. 670–681.
- Wang D.L., Xiao A.G., Yang W. A Linearly Implicit Conservative Difference Scheme for the Space Fractional Coupled Nonlinear Schroedinger Equations // J. Comput. Phys. 2014. V. 272. P. 644–655.
- Wang P.D., Huang C.M. An Energy Conservative Difference Scheme for the Nonlinear Fractional Schroedinger Equations // J. Comput. Phys. 2015. V. 293. P. 238–251.
- Zhang R.P., Zhang Y.T., Wang Z. et al. A Conservative Numerical Method for the Fractional Nonlinear Schroedinger Equation in Two Dimensions // Sci. China Math. 2019. V. 62. P. 1997–2014.
- Zhao X., Sun Z.Z., Hao Z.P. A Fourth-order Compact ADI Scheme for Two-dimensional Nonlinear Space Fractional Schroedinger Equation // SIAM J. Sci. Comput. 2014. V. 36. P. A2865–A2886.
- Laskin N. Fractional Schroedinger Equation // Phys. Rev. E. 2002. V. 66. P. 056108.
- Riesz M. Lintegrale de Riemann-Liouville et le Probleme de Cauchy // Acta Math. 1949. V. 81. P. 1–222.
- Guo B.L., Han Y.Q., Xin J. Existence of the Global Smooth Solution to the Period Boundary Value Problem of Fractional Nonlinear Schroedinger Equation // Appl. Math. Comput. 2008. V. 204. P. 468–477.
- Luchko Y. Fractional Schroedinger Equation for a Particle Moving in a Potential Well // J. Math. Phys. 2013. V. 54. P. 012111.
- Bao W.Z., Cai Y.Y. Mathematical Theory and Numerical Methods for Bose-Einstein Condensation // arXiv preprint. 2012. arXiv:1212.5341
- Carr L.D., Clark C.W., Reinhardt W.P. Stationary Solutions of the One Dimensional Nonlinear Schroedinger Equation I. Case of Repulsive Nonlinearity // Phys. Rev. A. 2000. V. 62. P. 063610.
- Jin S., Levermore C.D., McLaughlin D.W. The Semiclassical Limit of the Defocusing NLS Hierarchy // Comm. Pure Appl. Math. 1999. V. 52. P. 613–654.
- Bao W.Z., Jaksch D. An Explicit Unconditionally Stable Numerical Method for Solving Damped Nonlinear Schroedinger Equations with a Focusing Nonlinearity // SIAM J. Numer. Anal. 2003. V. 41. P. 1406–1426.
- Saito H., Ueda M. Intermittent Implosion and Pattern Formation of Trapped Bose-Einstein Condensates with an Attractive Interaction // Phys. Rev. Lett. 2001. V. 86. P. 1406–1409.
- Ran Y.H., Wang J.G., Wang D.L. On HSS-like Iteration Method for the Space Fractional Coupled Nonlinear Schroedinger Equations // Appl. Math. Comput. 2015. V. 271. P. 482–488.
- Ran Y.H., Wang J.G., Wang D.L. On Partially Inexact HSS Iteration Methods for the Complex Symmetric Linear Systems in Space Fractional CNLS Equations // J. Comput. Appl. Math. 2017. V. 317. P. 128–136.
- Ran Y.H., Wang J.G., Wang D.L. On Preconditioners Based on HSS for the Space Fractional CNLS Equations // East Asian J. Appl. Math. 2017. V. 7. P. 70–81.
- Wang Z.Q., Yin J.F., Dou Q.Y. Preconditioned Modified Hermitian and Skew-Hermitian Splitting Iteration Methods for Fractional Nonlinear Schroedinger Equations // J. Comput. Appl. Math. 2020. V. 367. P. 112420.
- Zhang F.Y., Yang X. Diagonal and Normal with Toeplitz-block Splitting Iteration Method for Space Fractional Coupled Nonlinear Schroedinger Equations with Repulsive Nonlinearities // arXiv preprint. 2023. arXiv: 2039.11106
- Bai Z.Z., Golub G.H., Ng M.K. Hermitian and Skew-Hermitian Splitting Methods for Non-Hermitian Positive Definite Linear Systems // SIAM J. Matrix Anal. Appl. 2003. V. 24. P. 603–626.
- Bai Z.Z., Golub G.H., Pan J.Y. Preconditioned Hermitian and Skew-Hermitian Splitting Methods for Non-Hermitian Positive Semidefinite Linear Systems // Numer. Math. 2004. V. 98. P. 1–32.
- Bai Z.Z., Benzi M., Chen F. Modified HSS Iteration Methods for a Class of Complex Symmetric Linear Systems // Computing. 2010. V. 87. P. 93–111.
- Bai Z.Z., Benzi M., Chen F. On Preconditioned MHSS Iteration Methods for Complex Symmetric Linear Systems // Numer. Algorithms. 2011. V. 56. P. 297–317.
- Bai Z.Z., Benzi M., Chen F. et al. Preconditioned MHSS Iteration Methods for a Class of Block Two-by-two Linear Systems with Applications to Distributed Control Problems // IMA J. Numer. Anal. 2013. V. 33. P. 343–369.
- Axelsson O., Kucherov A. Real Valued Iterative Methods for Solving Complex Symmetric Linear Systems // Numer. Linear Algebra Appl. 2000. V. 7. P. 197–218.
- Golub G.H., van Loan C.F. Matrix Computations // 4th Edn. Baltimore: Johns Hopkins University Press, 2013.
- Saad Y. Iterative Methods for Sparse Linear Systems // 2nd Edn. Philadelphia: Society for Industrial and Applied Mathematics, 2003.
- Chan R.H., Ng K.P. Fast Iterative Solvers for Toeplitz-plus-band Systems // SIAM J. Sci. Comput. 1993. V. 14. P. 1013–1019.
- Ng M.K., Pan J.Y. Approximate Inverse Circulant-plus-diagonal Preconditioners for Toeplitz-plus-diagonal Matrices // SIAM J. Sci. Comput. 2010. V. 32. P. 1442–1464.
- Bai Z.Z., Lu K.L., Pan J.Y. Diagonal and Toeplitz Splitting Iteration Methods for Diagonal-plus-Toeplitz Linear Systems from Spatial Fractional Diffusion Equations // Numer. Linear Algebra Appl. 2017. V. 24. P. e2093.
- Bai Z.Z., Lu K.Y. Fast Matrix Splitting Preconditioners for Higher Dimensional Spatial Fractional Diffusion Equations // J. Comput. Phys. 2020. V. 404. P. 109117.
- Peaceman D.W., Rachford H.H., Jr. The Numerical Solution of Parabolic and Elliptic Differential Equations // J. Soc. Ind Appl. Math. 1955. V. 3. P. 28–41.
- Douglas J. Alternating Direction Methods for Three Space Variables // Numer. Math. 1962. V. 4. P. 41–63.
- Celik C., Duman M. Crank-Nicolson Method for the Fractional Diffusion Equation with the Riesz Fractional Derivative // J. Comput. Phys. 2012. V. 231. P. 1743–1750.
- Ortigueira M.D. Riesz Potential Operators and Inverses via Fractional Centred Derivatives // Int. J. Math. Math. Sci. 2006. P. 1–12. (Aticle ID 48391).
- Chan R.H., Strang G. Toeplitz Equations by Conjugate Gradients with Circulant Preconditioner // SIAM J. Sci. Stat. Comput. 1989. V. 10. P. 104–119.
- Chan T. An Optimal Circulant Preconditioner for Toeplitz Systems // SIAM J. Sci. Stat. Comput. 1988. V. 9. P. 766–771.
- Chan R.H., Ng M.K. Conjugate Gradient Methods for Toeplitz Systems // SIAM Rev. 1996. V. 38. P. 427–482.
- Bauer F.L., Fike C.T. Norms and Exclusion Theorems // Numer. Math. 1960. V. 2. P. 137–141.
- Chan R.H., Jin X.Q. An Introduction to Iterative Toeplitz Solvers. Philadelphia: Society for Industrial and Applied Mathematics, 2007.
- Bebendorf M. Hierarchical Matrices. Heidelberg: Springer-Verlag, 2008.
- Ho K.L., Ying L. Hierarchical Interpolative Factorization for Elliptic Operators: Differential Equations // Commun. Pur. Appl. Math. 2016. V. 69. P. 1415–1451.
补充文件
