Discrete optimization algorithm based on probability distribution with transformation of target values

K. S. Sarin; Сарин К. С.

doi:10.31857/S0132347424060049

Discrete optimization algorithm based on probability distribution with transformation of target values

Authors: Sarin K.S.¹
Affiliations:
1. Tomsk State University of Control Systems and Radioelectronics
Issue: No 6 (2024)
Pages: 35-47
Section: DATA ANALYSIS
URL: https://bakhtiniada.ru/0132-3474/article/view/283185
DOI: https://doi.org/10.31857/S0132347424060049
EDN: https://elibrary.ru/dyrzoo
ID: 283185

Cite item

Full Text

Abstract
Full Text
About the authors
References
Supplementary files
Statistics

Abstract

Optimization problems of searching in discrete space and, in particular, binary space, where a variable can take only two values, are of great practical importance. This paper proposes a new population discrete optimization algorithm based on probability distributions of variables. Distributions determine the probability of accepting one or another discrete value and are formed by transforming the target values of decisions into their weighting coefficients. The performance of the algorithm was assessed using unimodal and multimodal test functions with binary variables. The experimental results showed the high efficiency of the proposed algorithm in terms of convergence and stability estimates.

Keywords

optimization methods, discrete optimization, binary optimization, metaheuristics, stochastic algorithms, probability distribution

Full Text

1. ВВЕДЕНИЕ

Решение задач оптимизации является необходимостью практически во всех сферах жизнедеятельности человека. Настоящая работа сосредоточена на комбинаторной оптимизации, которая занимается проблемами нахождения оптимума с дискретными значениями возможных решений. Одним из частных случаев этой проблемы является бинарная оптимизация, в которой элементы вектора решения могут принимать только два значения. Практическое применение таких задач весьма обширно. В области медицины бинарная оптимизация применялась для диагностики опухолей головного мозга [1], нахождения подмножеств согласованных признаков при прогнозировании эффективности реабилитации пациентов после коронавирусной инфекции [2], классификации сложных заболеваний [3], классификации аритмии по электрокардиограмме [4]. В экономической сфере для выбора издателей журналов при размещении рекламы [5], планировании рабочего процесса [6], планировании выпуска новой версии программного обеспечения [7], проектировании производственных ячеек [8]. В науке и технике бинарная оптимизация использовалась для нахождения подмножества информативных признаков при построении прогностических систем [9–11], восстановлении нагрузки в первичных распределительных сетях [12], диагностики неисправности энергосистем [13], решении проблемы позиционирования антенны [14], проектировании сварных балок [15], разделение аппаратного и программного обеспечения во встроенных системах [16]. Так же в [17] отмечается, что помимо чисто комбинаторных задач, задачи с вещественными числами могут быть представлены в двоичном виде и решены в дискретном числовом пространстве.

Для решения задач бинарной оптимизации применяют два типа методов. Первый тип – это традиционные детерминированные методы оптимизации, а второй тип основан на стохастических, недетерминированных алгоритмах. Традиционными являются методы релаксации, Лагранжа, ветвей и границ, целочисленное программирование [18, 19]. Эти методы являются трудозатратными и предназначены для решения задач небольших размерностей, что на практике встречается очень редко. Кроме того, большинство традиционных методов требуют аналитическое задание целевой функции, а также ее дифференцируемость и непрерывность. Задачи большой размерности с множеством локальных оптимумов значительно ухудшают поиск традиционных методов.

Недетерминированные методы, представляемые метаэвристическими алгоритмами [20–23], устраняют вышеперечисленные проблемы. В отличие от традиционных методов данные алгоритмы не подвергнуты “застреванию” в локальных оптимумах, в меньшей степени зависят от исходных отправных точек, не ограничены видом целевой функции и способны решать оптимизационную проблему “черного ящика” [24].

В [25] доказано, что не существует эвристического алгоритма, который мог бы работать достаточно эффективно для решения всех задач оптимизации. Разработанные в настоящее время алгоритмы дают удовлетворительные результаты при решении некоторых задач, но не всех. Поэтому в этой области ведутся активные исследования, в результате чего предлагаются новые эвристические алгоритмы.

Цель настоящей работы заключается в разработке эффективного алгоритма дискретной оптимизации, конкурирующего с популярными алгоритмами в бинарном пространстве поиска.

Основной научный вклад работы представлен следующими пунктами.

Разработан новый популяционный метаэвристический алгоритм оптимизации для поиска в дискретном пространстве. Алгоритм использует распределения вероятностей для выбора значений переменных. Распределения формируются с помощью трансформации целевых значений решений в весовые коэффициенты.
Эмпирически доказана эффективность предложенного алгоритма для поиска в бинарном пространстве с помощью критериев сходимости и стабильности. Статистический тест Уилкоксона показал значимое преимущество предлагаемого алгоритма по сравнению с генетическим алгоритмом и алгоритмом роящихся частиц для оптимизации унимодальных и мультимодальных тестовых функций.

Остальная часть статьи организована следующим образом. В п. 2 рассмотрены подходы и методы решения задач бинарной оптимизации с помощью метаэвристических алгоритмов; в п. 3 представлен новый алгоритм и детали его работы; в п. 4 описана экспериментальная часть исследования; в п. 5 обсуждены полученные результаты; в заключении сделаны выводы о проделанной работе.

2. БЛИЗКИЕ РАБОТЫ ПО ТЕМЕ ИССЛЕДОВАНИЯ

Наиболее популярные алгоритмы бинарной оптимизации относятся к алгоритмам роевого интеллекта. Подобно эволюционным они основаны на механизмах природы и представляют собой модель скоординированного поведения объектов, которые могут быть представителями флоры, фауны или физическими объектами. Эволюционные вычисления основаны на конкуренции и естественном отборе, тогда как роевой интеллект опирается главным образом на сотрудничество агентов [26].

Большинство алгоритмов роевого интеллекта разработаны для непрерывной оптимизации и для того чтобы осуществлять поиск в бинарном пространстве применяются механизмы адаптации, называемые бинаризацией [27]. Самым популярным методом бинаризации является использование трансформационных функций, которые переводят непрерывные значения элементов векторов решений в значения из диапазона [0, 1]. Затем применяется правило бинаризации, при котором решение преобразуется в бинарное значение из множества {0, 1}. С помощью функций трансформации были адаптированы алгоритмы роящихся частиц [17, 28], искусственных водорослей [29], шимпанзе [30], роя сальпов [31], стаи китов [32]. В [28] были исследованы различные варианты функций трансформации для алгоритма роящихся частиц. Лучшая сходимость была достигнута алгоритмом с V-образной функцией трансформации.

Метод бинаризации на основе модификации алгебраических операций преобразует вещественные операторы, используемых в формулах перемещения частиц, в их логические аналоги, что позволяет оперировать бинарными решениями. Например, вместо сложения используется операция дизъюнкции, а вместо умножения – конъюнкция. С помощью данного метода были адаптированы алгоритмы роящихся частиц [33], мозгового штурма [13], роста деревьев [34], летучих мышей [33], непрерывной муравьиной колонии [5], кукушкин поиск [35], черной дыры [36].

Квантовый метод бинаризации тоже преобразует операторы непрерывного алгоритма. В этом методе каждое допустимое решение имеет позицию и вектор квантования, который содержит вероятности принять значение 1 для соответствующего элемента решения. Вектор квантования обновляются с учетом положений глобальных и локальных лидеров. Используя данный метод, были адаптированы алгоритмы роящихся частиц [37], искусственных водорослей [7], гравитационный поиск [38], муравьиной колонии [39].

Среди алгоритмов эволюционного интеллекта для бинарной оптимизации широко применялся генетический алгоритм [40–42]. Также были предложены его модификации, так, например, в работе [43] представлен гибрид на основе генетического алгоритма и алгоритма роящихся частиц. Сначала оба алгоритма находят решения независимо друг от друга, а затем результаты объединяются с помощью метода средневзвешенной комбинации. После этого применяется локальный поиск для нахождения окончательного решения.

Оценка эффективности алгоритмов в большинстве исследований проводилась при решении определенных прикладных задач. Для объективной оценки работы алгоритмов применяют тестовые функции, которые позволяют определить эффективность при нахождении оптимума различных целевых функций, например, унимодальных, мультимодальных, овражных, разрывных, выпуклых, вогнутых. При бинарной оптимизации применяют тестовые функции для поиска в непрерывном пространстве. Бинарное пространство поиска образуют путем дискретизации непрерывного и последующим бинарным кодировании дискретных значений [28, 44–46].

3. НОВЫЙ ДИСКРЕТНЫЙ АЛГОРИТМ ОПТИМИЗАЦИИ

В настоящей работе рассматривается проблема оптимизации, в которой минимизируется критерий эффективности. В данном разделе представлен оригинальный дискретный метаэвристический алгоритм оптимизации на основе распределения вероятностей с трансформацией целевых значений (Probability Distributions with Transformation of target values, PDT). Алгоритм является итерационным, где на каждой итерации формируется вероятностная модель. Модель определяет вероятность появления конкретного дискретного значения переменной. Вероятности формируются на основе частоты появления дискретного значения каждой переменной среди решений популяции, причем меньшее значение целевой функции должно увеличивать вклад решения в повышение вероятности. Для этого вводятся трансформационные функции, которые переводят значение целевой функции решения популяции в весовой коэффициент. На рис. 1 представлена блок-схема алгоритма.

Рис. 1. Блок-схема алгоритма.

На этапе инициализации определяется начальная популяция решений Pop случайным или иным образом. Далее рассчитываются весовые коэффициенты решений популяции w. Весовой коэффициент принимает значение из диапазона [0, 1], чем меньше целевое значение решения, тем больше значение w. Для того чтобы сформировать весовые коэффициенты из целевых значений предлагается использовать функции трансформации. В качестве таких функций, например, могут быть использованы следующие: T_L – линейная функция, T_S – сигмоида, T_Q – квадратичная функция, T_Th – гиперболический тангенс. Графики функций представлены на рис. 2. Область определения функций ограничена отрезком [f_min, f_max], где f_minи f_max – минимальное и максимальное значение целевой функции в популяции соответственно, а f – текущее значение. Аналитические выражения функций трансформации показаны ниже:

$T_{L} (f) = \frac{f_{\max} - f}{f_{\max} - f_{\min}}$ ,

$T_{s} (f) = \frac{1}{1 + e^{(10 (f - f_{\min}) / (f_{\max} - f_{\min}) - 5)}}$ ,

$T_{Q} (f) = {(\frac{f - f_{\min}}{f_{\max} - f_{\min}})}^{2}$ ,

$T_{T h} (f) = |t h (4 (\frac{f - f_{\min}}{f_{\max} - f_{\min}} - 1))|$ .

Рис. 2. Графики функций трансформаций для перевода целевых значений в веса решений.

После получения весовых коэффициентов решений рассчитываются распределения вероятностей. Каждое распределение состоит из вероятностей получить переменной определенное дискретное значение. Вероятности рассчитываются на основе значений переменных и весовых коэффициентов решений.

С помощью полученных распределений генерируется новая популяция и подвергается мутации, чтобы предотвратить преждевременную сходимость. Далее популяция обновляется лучшими решениями текущей и новой популяции. После этого снова рассчитываются весовые коэффициенты решений, и продолжается новый цикл. По завершении заданного количества итераций из популяции выбирается лучшее решение.

Ниже представлено пошаговое описание алгоритма.

Вход: Установить размер популяции N, число итераций MaxIter, вероятность мутации p_aи функцию трансформации T. Обозначим l_jk k-е дискретное значение j-й переменной.

Выход: R – найденное решение.

Начало

Шаг 1. Инициализация.

Случайным или иным образом сгенерировать популяцию решений Pop = [Pop₁, Pop₂, …, Pop_N] и вычислить соответствующее целевое значение f = [f₁, f₂, …, f_N].

Шаг 2. Инициализировать счетчик итераций t = 1. Начало итерационного процесса.

Шаг 3. Вычислить весовые коэффициенты решений популяции Pop с помощью функции трансформации T :

$w_{i} = T (f_{i}),$

где i = 1, ..., N.

Шаг 4. Вычислить распределения вероятностей.

Для каждого дискретного значения k переменной j определить сумму весовых коэффициентов решений Pop, которые принимают данное дискретное значение k. Обозначим такую сумму S_jk, где j = 1, …, n, k = 1, …, m:

$S_{j k} = \sum_{i = 1}^{N} w_{i} \cdot \{\begin{cases} 1, е с л и P o p_{i j} = l_{j k} \\ 0, и н а ч е \end{cases}$ .

Вычислить эмпирическую вероятность появления k-го значения переменной j:

$P_{j k} = \frac{S_{j k}}{\sum_{k = 1}^{m} S_{j k}}$ .

Шаг 5. Сгенерировать новые решения.

Формируется популяция новых решений Pop^new на основе вероятностей P каждой переменной:

$P o p_{i j}^{new} = l_{j k}$ ,

где k удовлетворяет условию p_k_–1 < rand (0,1) ≤ p_k,

$p = [0, P_{j 1}, P_{j 1} + P_{j 2}, \dots, \sum_{k = 1}^{m} P_{j m}]$ ,

j = 1, …, n, k = 1, …, m.

Шаг 6. Изменить новые решения (Мутация).

Изменить значения элементов векторов решений Pop^new с вероятностью p_a. Новые значения выбираются случайным образом из области значений элемента вектора решений.

Шаг 7. Вычислить значение целевых функций f_i^new, где i = 1, …, N, для каждого решения Pop^new.

Шаг 8. Обновить популяцию Pop путем выбора N лучших решений из множества решений Pop ∪ Pop^new. Обновить значения целевых функций f_i согласно решениям Pop.

Шаг 9. Проверка остановки алгоритма.

Если t < MaxIter, то t = t + 1 и перейти на Шаг 3, иначе перейти на Шаг 10.

Шаг 10. Извлечь в R лучшее решение из популяции Pop.

Конец

4. ЭКСПЕРИМЕНТ

В настоящем разделе представлены эксперименты c разработанным дискретным алгоритмом оптимизации на основе распределения вероятностей с трансформацией целевых значений. Алгоритм тестировался для бинарной проблемы оптимизации, т. е. когда переменные принимают только два значения. В экспериментальном исследовании использовались восемнадцать различных унимодальных и мультимодальных эталонных функции, широко применяемых для тестирования алгоритмов оптимизации [28, 44–46]. В табл. 1 представлены их характеристики, а на рис. 3 графики в двумерном пространстве поиска. Функции f₁–f₁₁ являются унимодальными, т. е. содержат только один глобальный оптимум. Функции f₁₂–f₁₈ являются мультимодальными и содержат один глобальный и множество локальных оптимумов, число которых экспоненциально растет с увеличением размерности задачи. Эксперимент проводился согласно методике работы [44].

Рис. 3. Графики тестовых функций в двумерном пространстве поиска.

Таблица 1. Тестовые функции эксперимента

№	Целевая функция	Диапазон поиска	Значение оптимума функции
№	Целевая функция	Диапазон поиска	Значение оптимума функции
1		[–100; 100]	0
2		[–2.56; 2.56]	0
3		[–10; 10]	0
4		[–2.56; 2.56]	0
5		[–100; 100]	0
6		[–100; 100]	0
7		[–2; 2]	0
8		[–10; 10]	0
9		[–10; 10]	0
10		[–1; 1]	0
11		[–6; 6]	0
12		[–10; 10]	–30 (при n = 5)
13		[–25; 25]	0
14		[–5; 5]	0
15		[–2; 2]	0
16		[–10; 10]	0
17		[–3; 3]	0
18		[–15; 15]	–50.0929 (при n = 5)

Реализация алгоритма осуществлялась на языке MATLAB в среде программирования MATLAB R2022b. Программа доступна по ссылке https://cloud.tusur.ru/index.php/s/395znYyx87rRoDP. Эксперимент проводился на персональном компьютере под управлением операционной системы Windows 10 с 8 Гб оперативной памяти и процессором Intel Core i7-12700.

4.1. Дискретизация непрерывных значений

Поскольку алгоритм является дискретным и оперирует в эксперименте бинарными векторами решений, элементы которых принимают значение 0 или 1, проводится кодировка вещественных значений бинарным вектором. Процедура перевода бинарного вектора решения в значения вещественных переменных представлена на рис. 4. Данная процедура выполняется всякий раз, когда алгоритму необходимо рассчитать значение целевой функции. Количество переменных в эксперименте 5, количество битов для кодирования значения каждой переменной – 15. Таким образом, величина бинарного вектора решений составляет n = 5 × 15 = 75 элементов. Количество дискретных значений, которое может иметь каждая переменная, соответствует 2¹⁵. Эти значения определяются с помощью равномерного квантования на диапазоне поиска переменной. Шаг дискретизации определяется следующим образом:

$Δ h = \frac{R_{\max} - R_{\min}}{2^{15} - 1}$ ,

где R_min и R_max – нижняя и верхняя граница диапазона значений переменной соответственно. Фактически, бинарное значение переменной – это бинарное представление порядкового номера дискретного значения на диапазоне [R_min, R_max] с шагом дискретизации Δh.

Рис. 4. Перевод бинарного вектора решения в непрерывный вектор для вычисления значения целевой функции.

Если переменная x кодируется бинарным вектором [b₁, …, b₁₅], то вещественное значение этой переменной определяется следующим образом:

$x = R_{\min} + Δ h \sum_{i = 1}^{15} b_{i} \cdot 2^{i - 1}$ .

4.2. Критерии эффективности

Для оценки эффективности работы алгоритма применялись два критерия [47]. Первый оценивает сходимость алгоритма и определяется средним отклонением найденного целевого значения от фактического:

$E = \frac{1}{n_{r u n}} \sum_{i = 1}^{n_{r u n}} |f_{i} - f^{'}|$ ,

где n_run – количество запусков алгоритма; f_i – найденное алгоритмом значение целевой функции в i-м запуске; fʹ – фактическое значения оптимума целевой функции. Второй критерий оценивает стабильность работы недетерминированного алгоритма и определяется среднеквадратичным отклонением найденного оптимума целевой функции:

$S T D = \sqrt{\frac{1}{n_{r u n}} \sum_{i = 1}^{n_{r u n}} {(f_{i} - M)}^{2}}$ ,

где M – среднее значение целевой функции;

$M = \frac{\sum_{i = 1}^{n_{r u n}} f_{i}}{n_{r u n}}$ .

Меньшее значение обоих критериев соответствует лучшему значению эффективности.

Кроме вышеприведенных критериев в работе представлены графики сходимости алгоритмов, позволяющие оценить скорость сходимости стохастических алгоритмов и показывающие зависимость критерия Е от итерации [28, 44, 45]. Значение E, приводимое на графиках, является средним значением по запускам алгоритма.

4.3. Выбор функции трансформации целевых значений

Для выбора функции трансформации целевых значений в весовые коэффициенты решений были использованы следующее функции: T_L – линейная функция, T_S – сигмоида, T_Q – квадратичная функция, T_S – гиперболический тангенс.

Алгоритм PDT с разными функциями трансформации был использован для поиска оптимума тестовых функций. Было осуществлено 30 запусков на каждой тестовой функции. Полученные значения критериев эффективности приведены в табл. 2.

Таблица 2. Оценка эффективности алгоритма PDT с различными функциями трансформации

f	*T_L*		*T_S*		*T_Q*		*T_Th*
f	E	*STD*	E	*STD*	E	*STD*	E	*STD*
f₁	0.000047	0.000000	0.000049	0.000014	0.000047	0.000000	0.000059	0.000034
f₂	0.000000	0.000000	0.000000	0.000000	0.000000	0.000000	0.000000	0.000000
f₃	0.402924	0.231313	0.454002	0.280296	0.478528	0.240684	0.498614	0.281871
f₄	0.005653	0.004306	0.006070	0.004650	0.005624	0.003659	0.005170	0.003590
f₅	0.041098	0.096504	0.030112	0.026176	0.042929	0.140588	0.037639	0.042328
f₆	0.015259	0.000000	0.015259	0.000000	0.015666	0.002229	0.015463	0.001114
f₇	2.629031	1.500038	2.511857	1.363161	3.214144	1.576402	3.036793	1.573228
f₈	0.000001	0.000000	0.000001	0.000000	0.000001	0.000000	0.000003	0.000003
f₉	0.885491	0.863594	0.850277	0.472212	0.803704	0.485206	0.835841	0.739384
f₁₀	0.000000	0.000000	0.000000	0.000000	0.000000	0.000000	0.000000	0.000000
f₁₁	0.000001	0.000000	0.000001	0.000000	0.000001	0.000000	0.000001	0.000002
f₁₂	0.239046	0.613565	0.870265	1.432694	0.885326	2.910895	0.362761	0.898002
f₁₃	0.119874	0.040684	0.149874	0.062972	0.163207	0.071839	0.123821	0.056141
f₁₄	0.057948	0.077372	0.058916	0.059387	0.053028	0.053763	0.033397	0.046236
f₁₅	0.331668	0.603435	0.199166	0.404835	0.398790	0.618058	0.099557	0.303747
f₁₆	0.036349	0.016301	0.028747	0.014743	0.029202	0.015521	0.034756	0.019396
f₁₇	0.000374	0.000041	0.000374	0.000041	0.000367	0.000000	0.000389	0.000069
f₁₈	0.407336	1.540216	0.405125	1.540966	0.610862	1.858916	0.000837	0.003885

Для улучшения оценки эффективности эволюционных алгоритмов в [47] отмечается, что необходимо проводить статистические тесты. Недостаточно сравнивать алгоритмы по значениям E и STD [48], необходимо провести статистический тест, чтобы доказать, что предлагаемый новый алгоритм представляет собой значительное улучшение по сравнению с другими существующими методами.

Чтобы судить о том отличаются ли статистически значимо результаты работы алгоритма с различными функциями трансформации друг от друга, был проведен непараметрический статистический тест Фридмана на уровне значимости α = 0.05. Значения асимптотической значимости p-value, которые меньше 0.05, можно рассматривать как убедительное свидетельство против нулевой гипотезы H₀ [47].

Тест Фридмана множественных сравнений не выявил отклонение гипотезы H₀ для обоих критериев. Гипотеза H₀ здесь утверждение об отсутствии значимых различий между вариантами алгоритма с различными функциями трансформации. Асимптотическая значимость для критерия Е соответствует значению p-value = 0.757, а для критерия STD значению p-value = 0.590. Таким образом, выбор рассмотренных функций трансформации существенно не повлияет на эффективность работы алгоритма. В дальнейшем будет использоваться линейная функция.

4.4. Параметры эксперимента

Эффективность предлагаемого алгоритма PDT оценивалась в сравнении с такими популярными алгоритмами оптимизации как генетический алгоритм (GA) и бинарный алгоритм роящихся частиц (BPSO). Алгоритмы выполнялись в одинаковых условиях. Общие настройки имели следующие значения. Размер популяции – 30, количество итераций – 100, количество переменных – 5, число бит на одну переменную – 15, количество запусков алгоритма на каждую тестовую функцию – 30. Специфичные параметры алгоритмов GA и BPSO были установлены в значения, рекомендованные в [28, 45]. Значения специфичных параметров приведены в табл. 3.

Таблица 3. Значения параметров алгоритмов

Алгоритм	Параметр	Значение
PDT	Функция трансформации T	Линейная T_L
PDT	Вероятность мутации p_a	0.05
GA	Вид селекции	Рулеточная
	Вид скрещивания (вероятность)	Одноточечный (0.9)
	Вид мутации (вероятность)	Равномерный (0.005)
BPSO	Коэффициенты C₁, С₂	2, 2
	Вес инерции W	Линейно уменьшается с 0.9 до 0.4
	Максимальная скорость	6
	Функция трансформации	V-образная

4.5. Результаты эксперимента

В результате выполнения эксперимента были получены значения критериев эффективности каждого алгоритма. Данные значения приведены в табл. 4. Последняя строка таблицы содержит средние значения показателей. На рис. 5 показаны графики сходимости алгоритмов, позволяющие оценить скорость сходимости. Графики представлены в логарифмической шкале по оси критерия сходимости, что позволяет более четко отследить скорость сходимости алгоритмов на протяжении всей их работы.

Таблица 4. Оценки эффективности алгоритмов

f	GA		*BPSO*		*PDT*
f	E	*STD*	E	*STD*	E	*STD*
f	GA		*BPSO*		*PDT*
f	E	*STD*	E	*STD*	E	*STD*
f₁	0.005349	0.028272	27.845964	37.522025	0.000047	0.000000
f₂	0.000000	0.000000	0.008293	0.018114	0.000000	0.000000
f₃	0.440548	0.254233	0.799580	0.513039	0.402924	0.231313
f₄	0.021143	0.046160	0.067826	0.054019	0.005653	0.004306
f₅	0.649841	1.354239	5.634938	3.111477	0.041098	0.096504
f₆	0.016683	0.004988	4.112874	3.333243	0.015259	0.000000
f₇	3.113280	2.491653	4.288055	2.188550	2.629031	1.500038
f₈	0.000009	0.000025	0.804053	0.875332	0.000001	0.000000
f₉	10.522179	24.073438	1.827357	1.320775	0.885491	0.863594
f₁₀	0.000000	0.000000	0.000166	0.000383	0.000000	0.000000
f₁₁	0.000004	0.000008	0.303480	0.574945	0.000001	0.000000
f₁₂	0.760543	1.068967	0.571626	0.780258	0.239046	0.613565
f₁₃	0.457784	0.259707	0.418610	0.159854	0.119874	0.040684
f₁₄	0.072918	0.062301	0.054331	0.053543	0.057948	0.077372
f₁₅	1.227600	1.001766	1.408564	0.734589	0.331668	0.603435
f₁₆	0.042970	0.016959	0.061572	0.021475	0.036349	0.016301
f₁₇	0.000583	0.000525	0.357644	0.145604	0.000374	0.000041
f₁₈	4.935197	6.147513	3.989981	3.238601	0.407336	1.540216
	1.24	2.05	2.92	3.04	0.29	0.31

5. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Чтобы определить, значительно ли отличаются результаты эффективности предлагаемого алгоритма от аналогов, воспользуемся парным статистическим тестом Уилкоксона [47]. Нулевая гипотеза Н₀ теста утверждает отсутствие значимых различий в оценках эффективности сравниваемых алгоритмов. В табл. 5 представлены результаты сравнения. Асимптотическая значимость для критериев Е и STD при сравнении с генетическим алгоритмом и алгоритмом роящихся частиц соответствует значению p-value < 0.01. Сумма отрицательных рангов теста превалирует над положительными. Это говорит о том, что значения критериев алгоритма PDT статистически значимо меньше алгоритмов GA и BPSO на уровне значимости α = 0.01.

Таблица 5. Статистическое сравнение алгоритмов

	*PDT-*GA		*PDT-BPSO***
	E	*STD*	E	*STD*
p-value	<0.01	<0.01	<0.01	<0.01
Гипотеза H₀	Отвергается	Отвергается	Отвергается	Отвергается

Анализ рис. 5 показывает, что на начальных итерациях скорость алгоритма роящихся частиц для тестов f₆, f₇, f₉, f₁₅ и f₁₆ оказывается выше остальных алгоритмов, но начиная, примерно, с пятнадцатой итерации она спадает. В целом же алгоритм на основе распределения вероятностей с трансформацией целевых значений опережает по скорости своих конкурентов.

Рис. 5. Графики сходимости алгоритмов.

6. ЗАКЛЮЧЕНИЕ

Предложенный дискретный алгоритм на основе распределения вероятностей с трансформацией целевых значений показал статистически значимое улучшение показателей сходимости и стабильности, таких как отклонение от оптимума и среднеквадратичное отклонение целевых значений. Сравнения проводились с генетическим алгоритмом и бинарным алгоритмом роящихся частиц. Для эксперимента использовались восемнадцать тестовых унимодальных и мультимодальных функций. В среднем отклонение от оптимума уменьшилось в 4.3 раза по сравнению с генетическим алгоритмом и в 10.1 раза по сравнению с бинарным алгоритмом роящихся частиц. Полученные результаты говорят об эффективности предложенного алгоритма для оптимизации в бинарном пространстве.

7. БЛАГОДАРНОСТИ

Автор выражает глубокую признательность Илье Александровичу Ходашинскому, профессору Томского государственного университета систем управления и радиоэлектроники, за обсуждение настоящего исследования и ряда ценных советов и замечаний.

ИСТОЧНИК ФИНАНСИРОВАНИЯ

Исследование выполнено за счет гранта Российского научного фонда № 24-21-00168, https://rscf.ru/project/24-21-00168/.

About the authors

K. S. Sarin

Tomsk State University of Control Systems and Radioelectronics

Author for correspondence.
Email: sarin.konstantin@mail.ru
Russian Federation, Prospect Lenina 40, Tomsk, 634050

References

Aly R.H.M., Rahouma K.H., Hamed H.F. Brain Tumors Diagnosis and Prediction Based on Applying the Learning Metaheuristic Optimization Techniques of Particle Swarm, Ant Colony and Bee Colony. Procedia Computer Science. 2019. V. 163. P. 165–179.
Ходашинский И.А., Смирнова И.Н., Бардамова М.Б., Сарин К.С., Светлаков М.О., Зайцев А.А., Тицкая Е.В., Тонкошкурова А.В., Антипова И.И., Ходашинская А.И., Зарипова Т.Н. Метод нахождения подмножеств согласованных признаков при прогнозировании эффективности реабилитации пациентов после перенесенной коронавирусной инфекции // Сибирский журнал клинической и экспериментальной медицины. T. 38. № 4. С. 270–279.
Phogat M. Kumar D. Classification of complex diseases using an improved binary cuckoo search and conditional mutual information maximization. Computacion y Sistemas. 2020. V. 24. P. 1121–1129.
Houssein E.H., Ibrahim I.E., Neggaz N., Hassaballah M., Wazery Y.M. An efficient ECG arrhythmia classification method based on Manta ray foraging optimization. Expert Systems with Applications. 2021. V. 181. P. 115131.
Aytimur A., Babayigit B. Binary Artificial Bee Colony Algorithms for {0–1} Advertisement Problem. Proceedings of the 2019 6th International Conference on Electrical and Electronics Engineering (ICEEE), Istanbul, Turkey, 16–17 April 2019. P. 91–95.
Mohammadzadeh A., Masdari M., Gharehchopogh F.S., Jafarian A. Improved chaotic binary grey wolf optimization algorithm for workflow scheduling in green cloud computing. Evolutionary Intelligence. 2021. V. 14. P. 1997–2025.
Pirozmand P., Ebrahimnejad A., Alrezaamiri H., Motameni H. A novel approach for the next software release using a binary artificial algae algorithm. Journal of Intelligent and Fuzzy Systems. 2021. V. 40. P. 5027–5041.
Almonacid B., Aspee F., Soto, R., Crawford B., Lama J. Solving the manufacturing cell design problem using the modified binary firefly algorithm and the egyptian vulture optimisation algorithm. IET Software. 2017. V. 11. P. 105–115.
Ходашинский И.А., Сарин К.С. Отбор классифицирующих признаков с помощью популяционного случайного поиска с памятью. Автоматика и телемеханика. 2019. № 2. С. 161–172.
Ходашинский И.А., Сарин К.С. Отбор классифицирующих признаков: сравнительный анализ бинарных метаэвристик и популяционного алгоритма с адаптивной памятью // Программирование. 2019. № 5. С. 3–9.
Sarin K., Hodashinsky I., Slezkin A. Feature selection and identification of fuzzy classifiers based on the cuckoo search algorithm. Communications in Computer and Information Science. 2018. V. 934. P. 22–34.
El-Dakroury H.E.D.M., Gad A., Abdelaziz A.Y. Load Restoration in Primary Distribution Networks Using the Binary Particle Swarm Optimization. Proceedings of the 2019 IEEE Electrical Power and Energy Conference (EPEC), Ottawa, ON, Canada, 12–14 October 2016. P. 1–6.
Xiong G., Shi D., Zhang J., Zhang Y. A binary coded brain storm optimization for fault section diagnosis of power systems. Electric Power Systems Research. 2018. V. 163. P. 441–451.
Dahi Z.A.E.M., Mezioud C., Draa A. A 0–1 bat algorithm for cellular network optimisation: A systematic study on mapping techniques. International Journal of Reasoning-based Intelligent Systems. 2017. V. 9. P. 22–42.
Hussien A.G., Hassanien A.E., Houssein E.H., Amin M., Azar A.T. New binary whale optimization algorithm for discrete optimization problems. Engineering Optimization. 2020. V. 52. P. 945–959.
Mourad K., Boudour R. A modified binary firefly algorithm to solve hardware/software partitioning problem. Informatica. 2021. V. 45. P. 1–12.
Kennedy J., Eberhart R.C. A discrete binary version of the particle swarm algorithm. Proceedings of the 1997 IEEE International Conference on Systems, Man, and Cybernetics, Computational Cybernetics and Simulation, Orlando, FL, USA, 12–15 October 1997. 1997. V. 5. P. 4104–4108.
Serigne G., Philippe M. A linearization framework for unconstrained quadratic (0–1) problems. Discrete Applied Mathematics. 2009. V. 157. P. 1255–1266.
Sherali H.D., Driscoll P.J. Evolution, and state-of-the-art in integer programming. Journal of Computational and Applied Mathematics. 2000. V. 124. P. 319–340.
Ходашинский И.А. Методы повышения эффективности роевых алгоритмов оптимизации // Автоматика и телемеханика. 2021. № 6. С. 3–45.
Gendreau M., Potvin J.-Yv. (Eds.) Handbook of methaheuristics. Springer, 2019, 604 p.
Карпенко А.П. Методы повышения эффективности метаэвристических алгоритмов глобальной оптимизации // Математические методы в технике и технологиях – ММТТ. 2017. Т. 1. С. 77–83.
Курейчик В.В., Родзин С.И. Биоэвристики, инспирированные фауной (обзор) // Информационные технологии. 2023. Т. 29. № 11. С. 559–573.
Pardalos P.M., Rasskazova V., Vrahatis M.N. (Eds.) Black box optimization, machine learning, and no-free lunch theorems. Springer, 2021. 388 p.
Wolpert D.H., Macready W.G. No free lunch theorems for optimization. IEEE. Transactions on Evolutionary Computation. 1997. V. 1. P. 67–82.
Becerra-Rozas M., Lemus-Romani J., Cisternas-Caneo F., Crawford B., Soto R., Astorga G., Castro C., Garcia J. Continuous Metaheuristics for Binary Optimization Problems: An Updated Systematic Literature Review. Mathematics. 2022. V. 11. № 1. P. 129.
Бардамова М.Б., Буймов А.Г., Тарасенко В.Ф. Способы адаптации алгоритма прыгающих лягушек к бинарному пространству поиска при решении задачи отбора признаков // Доклады Томского государственного университета систем управления и радиоэлектроники. 2020. Т. 23. № 4. С. 57–62.
Mirjalili S., Lewis A. S-shaped versus V-shaped transfer functions for binary Particle Swarm Optimization. Swarm and Evolutionary Computation. 2013. V. 9. P. 1–14.
Turkoglu B., Uymaz S.A., Kaya E. Binary Artificial Algae Algorithm for feature selection. Applied Soft Computing. 2022. V. 120. P. 108630.
Pashaei E., Pashaei E. An efficient binary chimp optimization algorithm for feature selection in biomedical data. Neural Computing and Applications. 2022. V. 34. P. 6427–6451.
Jain S., Dharavath R. Memetic salp swarm optimization algorithm based feature selection approach for crop disease detection. Journal of Ambient Intelligence and Humanized Computing. 2023. V. 14. – P. 1817–1835.
Mohd Yusof N., Muda A.K., Pratama S.F., Abraham A. A novel nonlinear time-varying sigmoid transfer function in binary whale optimization algorithm for descriptors selection in drug classification. Molecular Diversity. 2023. V. 27. № 1. P. 71–80.
Merikhi B., Soleymani M. Automatic data clustering framework using nature-inspired binary optimization algorithms. IEEE Access. 2021. V. 9. P. 93703–93722.
Zhong C., Chen Y., Peng J. Feature selection based on a novel improved tree growth algorithm. International Journal of Computational Intelligence Systems. 2020. V. 13. P. 247–258.
Pandey A.C., Rajpoot D.S., Saraswat M. Feature selection method based on hybrid data transformation and binary binomial cuckoo search. Journal of Ambient Intelligence and Humanized Computing. 2020. V. 11. P. 719–738.
Yepes V., Marti J.V., Garcia J. Black hole algorithm for sustainable design of counterfort retaining walls. Sustainability. 2020. V. 12. P. 2767.
Lai X., Hao J.K., Fu Z.H., Yue D. Diversity-preserving quantum particle swarm optimization for the multidimensional knapsack problem. Expert Systems with Applications. 2020. V. 149. P. 113310.
Barani F., Mirhosseini M., Nezamabadi-Pour H. Application of binary quantum-inspired gravitational search algorithm in feature subset selection. Applied Intelligence. 2017. V. 47. P. 304–318.
Ross O.H.M. A review of quantum-inspired metaheuristics: Going from classical computers to real quantum computers. IEEE Access. 2019. V. 8. P. 814–838.
Shreem S.S., Turabieh H., Al Azwari S., Baothman F. Enhanced binary genetic algorithm as a feature selection to predict student performance. Soft Computing. 2022. V. 26. P. 1811–1823.
Nicolau M. Application of a simple binary genetic algorithm to a noiseless testbed benchmark. Proceedings of the 11th Annual Conference Companion on Genetic and Evolutionary Computation Conference: Late Breaking Papers. 2009. P. 2473–2478.
Haupt R.L., Haupt S.E. Practical genetic algorithms. John Wiley & Sons, Inc., Hoboken, New Jersey, 2004. 253 p.
Ghosh M., Guha R., Alam I., Lohariwal P., Jalan D., Sarkar R. Binary Genetic Swarm Optimization: A Combination of GA and PSO for Feature Selection. Journal of Intelligent Systems. 2019. V. 29. P. 1598–1610.
Bas E., Ulker E. A binary social spider algorithm for continuous optimization task. Soft Computing. 2020. V. 24. P. 12953–12979.
Mirjalili S., Mirjalili S.M., Yang X.-S. Binary bat algorithm. Neural Computing and Applications. 2014. V. 25. P. 663–681.
Pan J.-S., Hu P., Chu S.-C. Binary fish migration optimization for solving unit commitment. Energy. 2021. V. 226. P. 120329.
Derrac J., Garcia S., Molina D., Herrera F. A practical tutorial on the use of nonparametric statistical tests as a methodology for comparing evolutionary and swarm intelligence algorithms. Swarm and Evolutionary Computation. 2011. V. 1. P. 3–18.
Garcia S., Molina D., Lozano M., Herrera F. A study on the use of non-parametric tests for analyzing the evolutionary algorithms’ behaviour: a case study on the CEC’2005 Special Session on Real Parameter Optimization. Journal of Heuristics. 2009. V. 15. № 6. P. 617–644.

Supplementary files

Supplementary Files

Action

1. JATS XML

Download

2. Fig. 1. Block diagram of the algorithm.

Download (53KB)

Indexing metadata

3. Fig. 2. Graphs of transformation functions for converting target values into decision weights.

Download (16KB)

Indexing metadata

4. Fig. 3. Graphs of test functions in a two-dimensional search space.

Download (86KB)

Indexing metadata

5. Fig. 4. Transformation of a binary solution vector into a continuous vector for calculating the value of the objective function.

Download (26KB)

Indexing metadata

6. Fig. 5. Graphs of convergence of algorithms.

Download (78KB)

Indexing metadata

Username
Password
Remember me

Forgot password?	Register

Username
Password
Remember me

Forgot password?	Register

No 4 (2025)

No 4 (2025)

Discrete optimization algorithm based on probability distribution with transformation of target values

Full Text

Abstract

Keywords

Full Text

1. ВВЕДЕНИЕ

2. БЛИЗКИЕ РАБОТЫ ПО ТЕМЕ ИССЛЕДОВАНИЯ

3. НОВЫЙ ДИСКРЕТНЫЙ АЛГОРИТМ ОПТИМИЗАЦИИ

4. ЭКСПЕРИМЕНТ

4.1. Дискретизация непрерывных значений

4.2. Критерии эффективности

4.3. Выбор функции трансформации целевых значений

4.4. Параметры эксперимента

4.5. Результаты эксперимента

5. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

6. ЗАКЛЮЧЕНИЕ

7. БЛАГОДАРНОСТИ

ИСТОЧНИК ФИНАНСИРОВАНИЯ

About the authors

K. S. Sarin

References

Supplementary files