Logical classification based on finding regular representative elementary classifiers

N. Dragunov; Драгунов Н. А.; E. Djukova; Дюкова Е. В.; A. Djukova; Дюкова А. П.

doi:10.31857/S0002338824040027

Logical classification based on finding regular representative elementary classifiers

Authors: Dragunov N.¹, Djukova E.¹, Djukova A.¹
Affiliations:
1. Federal Research Center «Computer Science and Control» of the Russian Academy of Sciences
Issue: No 4 (2024)
Pages: 33-39
Section: COMPUTER METHODS
URL: https://bakhtiniada.ru/0002-3388/article/view/274203
DOI: https://doi.org/10.31857/S0002338824040027
EDN: https://elibrary.ru/UENRUE
ID: 274203

Cite item

Full Text

Abstract
Full Text
About the authors
References
Supplementary files
Statistics

Abstract

An approach to the supervised classification problem based on the apparatus of discrete mathematics (logical methods of data analysis) is considered. The possibility of time costs reducing at the stage of correct logical classifier training is investigated. New models of classifiers are proposed. These models are based on finding frequently occurring fragments of a special type in the descriptions of precedents — regular elementary classifiers. Descriptions of classifier models are given using the concepts of logical functions theory. To construct sought fragments, the authors have developed and implemented an original algorithm. The effectiveness of proposed classifier models has been experimentally substantiated and confirmed by theoretical estimates of their training complexity. An upper asymptotic estimate of the typical number of regular elementary classifiers is obtained.

Keywords

supervised classification problem, correct classification, representative elementary classifier, regular elementary classifier, irredundant covering of an integer matrix

Full Text

Введение. Задача классификации по прецедентам является одной из основных задач интеллектуального анализа данных и формулируется следующим образом. Исследуется некоторое множество объектов М, описываемых в системе числовых признаков $x_{1}, \dots, x_{n}$ . Известно, что М редставимо в виде объединения $l$ подмножеств $K_{1}, \dots, K_{l}$ , называемых классами. Дан набор объектов из М, о которых известно, каким классам они принадлежат. Это прецеденты или обучающие объекты. Требуется на базе анализа множества прецедентов построить алгоритм, определяющий класс любого объекта из М.

Дискретный или логический подход к задаче классификации предполагает, что каждый признак имеет ограниченное число допустимых значений, каждое из которых кодируется целым числом. Рассматриваемый подход имеет целью построение корректных моделей классификаторов, обеспечивающих безошибочное распознавание прецедентов.

Одними из известных направлений логической классификации являются LAD (logical analysis of data) и CVP (correct voting procedures). Каждое из направлений базируется на поиске таких фрагментов описаний прецедентов, которые позволяют отличать прецеденты из разных классов. В LAD искомые фрагменты называют логическими закономерностями, а в CVP — представительными элементарными классификаторами. Различным образом определяется понятие информативности фрагмента. В первом случае ищутся «максимальные» логические закономерности и решается сложная в вычислительном плане оптимизационная задача линейного программирования. Во втором случае ищутся «тупиковые» (в некотором смысле минимальные) представительные элементарные классификаторы, при этом возникают труднорешаемые дискретные перечислительные задачи. Направление LAD предложено в [1] и в основном развивается за рубежом. В России это направление представлено работами [2, 3]. Для направления CVP основополагающими являются публикации отечественных ученых [4-10].

Логические классификаторы наиболее эффективны в случае целочисленной информации низкой значности. Их описание может быть дано с использованием аппарата функций $k$ - значной логики ( $k \geq 2$ ). Тогда представительный элементарный классификатор (логическая закономерность) класса K является элементарной конъюнкцией над переменными $x_{1}, \dots, x_{n}$ , принимающей значение 1 на описании хотя бы одного прецедента из класса K и значения 0 на описаниях всех прецедентов из других классов [6].

Поиск тупиковых представительных элементарных классификаторов класса K основан, как правило, на первоначальном анализе множества прецедентов из других классов и сводится к решению сложной перечислительной задачи, называемой монотонной дуализацией, или к обобщениям этой задачи [6, 8]. Фактически сначала строятся элементарные конъюнкции над переменными $x_{1}, \dots, x_{n}$ , принимающие значение 0 на описаниях тех прецедентов, которые не принадлежат классу K, и теряющие это свойство при удалении хотя бы одного сомножителя. Затем из найденных конъюнкций отбираются те, которые не менее $p$ ( $p$ $k \geq 2$ 1) раз принимают значение 1 на описаниях прецедентов класса K, т. е. отбираются тупиковые $p$ -представительные элементарные классификаторы класса K (здесь $p$ -настраиваемый параметр). В данной модели классификатора, обозначаемой далее $A_{0}$ , вычисление оценки принадлежности распознаваемого объекта классу K существляется на основе проведения классической процедуры «голосования» [2], в которой участвуют все отобранные элементарные классификаторы.

В настоящей работе предлагаются и исследуются модели $A_{1}$ , $A_{2}$ , $A_{3}$ корректных логических классификаторов, обучение которых осуществляется путем поиска для каждого класса K так называемых правильных $p$ -представительных элементарных классификаторов, т. е. таких представительных элементарных классификаторов этого класса, которые имеют ранг $p$ ( $p$ $k \geq 2$ 1) и не менее p раз принимают значение 1 на описаниях прецедентов класса K. При этом классификатор A₁действует по схеме классификатора A₀, но в голосовании участвуют только те тупиковые p -представительные элементарные классификаторы класса K, которые имеют ранг p. Классификаторы A₂ и A₃действуют по иной схеме. Первоначально анализируются описания прецедентов класса K и строятся элементарные конъюнкции, которые не менее p раз принимают значение 1 на описаниях прецедентов этого класса и имеют ранг p. Такие конъюнкции называются правильными элементарными классификаторами. Затем просматриваются прецеденты из других классов и в A₂из найденных конъюнкций отбираются представительные элементарные классификаторы класса K, а в A₃отбираются тупиковые представительные элементарные классификаторы класса K. Процедура вычисления оценки принадлежности распознаваемого объекта классу K такая же, как и в алгоритме A₀.Таким образом, на этапе обучения модель A₁ решает задачу монотонной дуализации, а модели A₂ и A₃ осуществляют поиск правильных элементарных классификаторов, базирующийся на предложенном в работе оригинальном алгоритме. Идея применения методов поиска часто встречающихся фрагментов в данных на этапе обучения логического классификатора была анонсирована авторами в [11].

Экспериментальное сравнение рассматриваемых алгоритмов на реальных и случайных модельных данных свидетельствует о целесообразности (в плане сокращения временных затрат) предлагаемого подхода к построению логических классификаторов. Получены теоретические результаты, характеризующие сложность обучения классификаторов A₂ и A₃ для случая, когда число прецедентов класса K существенно больше числа признаков n. В экспериментах значение параметра p выбиралось согласно оценке типичного ранга правильного элементарного классификатора.

1. Основные понятия. Описание классификаторов A₁, A₂ и A₃. Пусть $E_{k}^{n}, k \geq 2$ - множество наборов вида $(α_{1}, \dots, α_{n})$ , где $α_{i} \in \{0, 1, \dots, k - 1\}$ .

Элементарной конъюнкцией над переменными $x_{1}, ..., x_{n}$ называется функция вида $x_{j_{1}}^{σ_{1}} & \dots & x_{j_{r}}^{σ_{r}}$ , где $σ_{i} \in \{0, 1, \dots k - 1\}$ , $x_{j_{i}} \in \{x_{1}, \dots, x_{n}\}$ при $i = \bar{1, r}$ , и при $r \geq 2$ выполнено $x_{j_{q}} \neq x_{j_{t}}$ , $t = \bar{1, r}$ , $q = \bar{1, r}$ , $t \neq q$ . Для краткости знак $&$ опускается. Конъюнкция $B = x_{j_{1}}^{σ_{1}} \dots x_{j_{r}}^{σ_{r}}$ обращается в 1 на тех наборах $(α_{1}, \dots, α_{n})$ из $E_{k}^{n}$ , в которых $α_{j_{i}} = σ_{i}$ , $i = \bar{1, r}$ . Множество наборов из $E_{k}^{n}$ , на которых $B$ принимает значение 1, обозначается через $N_{B}$ , а через $B (n, k)$ - множество всех элементарных конъюнкций рассматриваемого вида. Не ограничивая общности, можно считать, что объекты из исследуемого множества М описаны признаками, каждый из которых принимает значения из множества $\{0, 1, \dots, k - 1\}$ .

Пусть $K \in {K_{1}, \dots K_{l}}$ . Зададим на множестве прецедентов двузначную частичную (не всюду определенную) функцию $f_{K} (x_{1}, \dots, x_{n})$ , которая принимает значение 1 на наборах, являющихся описаниями прецедентов класса К, и значение 0 на наборах, описывающих остальные обучающие объекты. Функция $f_{K} (x_{1}, \dots, x_{n})$ называется характеристической функцией класса К. Решение задачи классификации заключается в доопределении $f_{K}$ на наборах, не входящих в обучающую выборку.

Далее $U_{K}$ и $Z_{K}$ обозначают соответственно множества прецедентов, на которых функция $f_{K}$ равна 1 и 0. Положим $|U_{K}| = m_{1}$ , $|Z_{K}| = m_{2}$ , $1 \leq p \leq m_{1}$ (здесь и далее $|W|$ - мощность множества $W$ ).

Элементарным классификатором (ЭК) ранга r называется элементарная конъюнкция из $B (n, k)$ , зависящая от r переменных. ЭК $B$ называется покрытием для $Z_{K}$ , если $N_{B} \cap Z_{K} = \emptyset$ . ЭК $B$ , являющийся покрытием для $Z_{K}$ , называется тупиковым покрытием для $Z_{K}$ , если не существует покрытия $B^{'}$ для $Z_{K}$ , такого, что $N_{B} \subset N_{B^{'}}$ .

Пусть $p \in \{1, 2. \dots, m_{1}\}$ . ЭК $B$ называется $p$ -частым в $U_{K}$ , если $|N_{B} \cap U_{K}| \geq p$ . ЭК $B$ называется $p$ -представительным для класса K, если B - p-частый в U_K и B - покрытие для Z_K. ЭК B называется тупиковым p-представительным для класса K, если B - p-частый в U_K и B - тупиковое покрытие для Z_K.

ЭК B ранга p называется правильным для U_K, если B - p-частый в U_K. ЭК B ранга p называется правильным p -представительным для класса K, если B - p-частый в U_K и B - покрытие для Z_K.

Приведем подробное описание моделей корректных классификаторов A₁, A₂ и A₃, о которых говорилось во Введении. Пусть T₁(p, K) - множество всех тупиковых правильных p-представительных ЭК для класса K; T₂(p, K) - множество всех правильных p-представительных ЭК для класса K; T₃(p, K) = T₁(p, K); $P_{B}^{i}$ , $B \in Τ_{i} (p, K)$ , $i \in \{1, 2, 3\}$ , - число объектов S в U_K, таких, что $S \in N_{B}$ .

На стадии обучения классификатор $A_{i}$ , $i \in \{1, 2, 3\}$ , строит некоторое множество ЭК из $Τ_{i} (p, K)$ . На следующей стадии (стадии распознавания) каждый найденный ЭК $B$ участвует в процедуре голосования, заключающейся в вычислении величин $P_{B}^{i}$ и Ω $Ω (B, S)$ , где S - распознаваемый объект и Ω(В, S) = 1, если $S \in N_{B}$ , иначе Ω(В, S) = 0. В результате получается оценка $Γ_{i} (S, K)$ принадлежности объекта S классу K, имеющая вид

$Г_{i} (S, K) = \frac{1}{|T_{i} (p, K)|} \sum_{B \in T_{i} (p, K)} P_{B}^{i} Ω (B, S)$ .

Объект S относится к классу с наибольшей оценкой. Если таких классов несколько, то объект относится к классу с наибольшим числом прецедентов.

В модели A₁ множество T $Τ_{1} (p, K)$ строится в два этапа. Сначала анализируется множество $Z_{K}$ и строятся тупиковые покрытия для $Z_{K}$ ранга $p$ . При этом решается задача монотонной дуализациии, которая относится к труднорешаемым дискретным перечислительным задачам. Затем из найденных ЭК отбираются те, которые являются p-частыми в U_K. Основная вычислительная сложность в этой модели заключается в необходимости решать задачу монотонной дуализации. Эффективность перечислительных задач принято оценивать сложностью нахождения нового решения (сложностью одного шага). В настоящее время для монотонной дуализации не построен алгоритм с полиномиальным шагом (алгоритм с полиномиальной задержкой [12]). Наиболее эффективными в практическом отношении для этой задачи являются асимптотически оптимальные алгоритмы [10].

В моделях A₂ и A₃множества $Τ_{2} (p, K)$ и $Τ_{3} (p, K)$ строятся также в два этапа. Однако, в отличие от модели A₁, сначала вместо анализа множества $Z_{K}$ проводится анализ множества $U_{K}$ , которое обычно меньше по мощности, чем $Z_{K}$ , в случае, если число классов больше двух. В результате такого анализа строится множество правильных ЭК для $U_{K}$ ранга $p$ . На втором этапе в моделях A₂ и A₃из найденных ЭК отбираются соответственно покрытия для $Z_{K}$ и тупиковые покрытия для $Z_{K}$ .

В настоящей работе при реализации классификаторов A₁, A₂ и A₃ к исходным данным применялась известная процедура one-hot кодирования [9]. В результате классификаторы работали с бинарными описаниями объектов. Для поиска правильных ЭК в бинарных данных разработан алгоритм ADR, описание которого приведено в разд. 2.

2. Алгоритм ADR поиска правильных ЭК. Типичное число правильных ЭК. Обозначим через L матрицу, строками которой являются бинарные описания объектов класса K, полученные с помощью one-hot кодирования.

Пусть Q - набор различных столбцов матрицы L, L^Q - подматрица матрицы L образованная набором Q. Набор столбцов Q называется p-частым, если L^Qсодержит не менее p строк, все элементы которых равны 1. Набор столбцов Q называется p-правильным, если он p-частый и его мощность равна p. Несложно видеть, что поиск всех правильных ЭК ранга p эквивалентен поиску всех p-правильных наборов столбцов матрицы L.

Обозначим через $R (L, p)$ множество всех столбцов матрицы L, имеющих не менее p элементов, равных 1. Пронумеруем столбцы матрицы L слева направо, начиная с 1. Пусть $e_{1} (R)$ и $e_{2} (R)$ - столбцы соответственно с наименьшим номером и наибольшим номером из $R$ , $R \subseteq R (L, p)$ . Через $U_{p} (L)$ обозначим множество всех p-частых наборов столбцов матрицы L, мощность которых не превосходит p. Алгоритм ADR строит множество всех p-правильных наборов столбцов матрицы L, перечисляя с полиномиальной задержкой наборы из $U_{p} (L)$ .

Определим порядок, в котором происходит перечисление наборов из $U_{p} (L)$ . На первом шаге рассматривается набор $Q = {e_{1} (R (L, p))}$ .

Пусть на шаге $i (i \geq 1)$ построен набор $Q \in U_{p} (L)$ , состоящий из столбцов с номерами $j_{1}, \dots, j_{r}$ , $j_{1} < \dots < j_{r}$ , $r \leq p$ . Если $Q = {e_{2} (R (L, p))}$ , то алгоритм заканчивает работу. Если же $Q \neq {e_{2} (R (L, p))}$ , то на шаге $i + 1$ алгоритм ADR строит новый набор ΔQ из $U_{p} (L)$ . При этом возможны два случая: $r < p$ и $r = p$ . В первом случае алгоритм строит ΔQ согласно приведенным ниже правилам 1 - 4 . Во втором случае алгоритм строит ΔQ по правилам 2 - 4.

Для описания правил построения ΔQ введем обозначения: $Q_{t}$ , $t = \bar{1, r}$ , - набор столбцов матрицы $L$ с номерами $j_{1}, \dots, j_{t}$ ; $R_{t}$ , $t = \bar{1, r}$ , - множество столбцов в $R (L, p)$ , номера которых больше $j_{t}$ ; $G_{t}$ , $t = \bar{1, r}$ , $r < p$ , - множество столбцов из $R_{t}$ , каждый из которых в объединении со столбцами из $Q_{t}$ образует набор из $U_{p} (L)$ . Положим $G_{r} = \emptyset$ в случае $r = p$ .

Заметим, что в случае $r < p$ для построения $G_{t}$ в $L$ нужно оставить только те столбцы, номера которых больше $j_{t}$ и которые имеют не менее $p$ элементов, равных 1 в подматрице, полученной после удаления из $L$ строк, дающих 0 в пересечении со столбцами с номерами $j_{1}, \dots, j_{t}$ .

Положим $Q_{0} = \emptyset$ и $G_{0}$ = $\emptyset$ . Перечислим возможные случаи и в каждом из них укажем правила построения ΔQ:

Заметим, что $R_{r} \neq \emptyset$ при $r = 1$ , так как $Q \neq {e_{2} (R (L, p))}$ , и $G_{r - 2} \cap R_{r - 1} \neq \emptyset$ при $Τ_{2} (p, K)$ , так как столбец с номером $j_{r}$ принадлежит этому множеству.

Из описания работы алгоритма ADR видно, что в его основе лежит процесс ветвления, который удобно представить в виде обхода дерева решений в глубину. Вершинами этого дерева являются наборы из $U_{p} (L)$ , причем $p$ -правильные наборы столбцов находятся среди висячих вершин. Через $L_{K}$ обозначим матрицу, строками которой являются описания прецедентов класса $K$ . Правильные ЭК порождаются квадратными подматрицами матрицы $L_{K}$ , состоящими из одинаковых строк. Такие подматрицы назовем правильными.

Ниже приведены асимптотические оценки типичных значений числа правильных подматриц целочисленной матрицы $L_{K}$ и порядка такой подматрицы в случае большого числа строк матрицы $L_{K}$ . Пусть $M_{m n}^{k}$ - множество всех целочисленных матриц размера $m \times n$ с элементами из $\{0, 1, \dots, k - 1\}$ ; $S (L)$ , $L \in M_{m n}^{k}$ , - множество правильных подматриц в матрице $L$ ; $ϕ_{k} (m, n)$ - интервал (0 , $r (k, m, n))$ , где $r (k, m, n) =$ 0.5log_kmn - 0.5log_klog_kmn + log_klog_klog_kn; $b_{n} ~ c_{n}$ , $n \to \infty$ означает, что $l i m_{n \to \infty} b_{n} / c_{n} = 1$ .

Теорема. Если $n^{α} \leq m \leq k^{n}$ , $α > 1$ , то при $n \to \infty$ для почти всех матриц $L$ из $M_{m n}^{k}$ справедливо

$|S (L)| ~ \sum_{r \in ϕ_{k} (m, n)} C_{n}^{r} C_{m}^{r} k^{r - r^{2}}$ .

и порядки почти всех подматриц из $S (L)$ принадлежат интервалу $ϕ_{k} (m, n)$ .

Доказательство теоремы аналогично доказательству теоремы 3 из [13], в которой при тех же ограничениях на $m$ и $n$ получена асимптотическая оценка типичного числа так называемых $σ$ -подматриц матрицы $L$ , служащая верхней оценкой числа тупиковых покрытий для $Z_{K}$ при условии, что $|Z_{K}| = m$ .

Приведенная в теореме оценка типичного порядка подматрицы из $S (L)$ косвенно свидетельствуют о том, что в случае, когда число прецедентов $m_{1}$ класса $K$ существенно больше числа признаков $n$ , типичный ранг правильного ЭК в $U_{K}$ не превосходит $r (k, m_{1}, n)$ .

Замечание 1. В работе [14] получены асимптотические оценки типичного числа правильных ЭК в $U_{K}$ для двух случаев: 1) $m_{1}^{a} \leq n \leq k^{m_{1}}^{β}$ , $a > 1$ , $β < 1$ ; 2) $n \leq m_{1} \leq k^{n^{β}}$ , $β < 1 / 2$ . Авторами показано, что типичный ранг правильного ЭК в $U_{K}$ в случаях 1) и 2) соответственно принадлежит интервалу $ϕ_{k} (m_{1}, n)$ и не превосходит ${log}_{k} m_{1} + {log}_{k} {log}_{k} m_{1}$ .

3. Результаты экспериментов. Результаты счета на реальных целочисленных задачах приведены в таблице. Задачи взяты из репозитория UCI [archive.ics.uci.edu] и репозитория ВЦ ФИЦ ИУ РАН. Описанные выше алгоритмы А₁, А₂, А₃ оценивались по качеству классификации и по времени обучения. Алгоритмы реализованы на языке программирования C++. В тестировании на качество классификации также участвовали такие известные алгоритмы, как случайный лес (RF) и логистическая регрессия (LR). Дополнительная настройка алгоритмов RF и LR не производилась.

Таблица 1.

m, n1, l (p1, ... , p1)	Время, мс			Качество
m, n1, l (p1, ... , p1)	A1	A2	A3	A1, A3	A2	RF	LR
144, 379, 2 (3, 3)	512.1	47.0	48.6	0.691	0.735	0.742	0.774
267, 566, 2 (3, 4)	289.2	18.3	18.4	0.560	0.570	0.545	0.578
957, 27, 2 (3, 3)	71.7	1.0	1.0	0.976	0.976	0.939	0.639
79, 160, 2 (2, 3)	238.4	140.0	150.0	0.614	0.623	0.542	0.553
3195, 73, 2 (4, 4)	5294.0	903.7	1061.9	0.903	0.974	0.988	0.956
1532, 284, 2 (5, 5)	2763106	59265	69387	0.960	0.971	0.960	0.922
2056, 83, 3 (4, 4, 4)	35471	8.3	9.4	0.641	0.770	0.905	0.790
3190, 287, 3 (5, 5, 5)	10487213	235045	315275	0.793	0.794	0.946	0.831

Результаты счета усреднялись по 10 случайным независимым разбиениям прецедентов, 80% которых использовалось для обучения моделей, а 20% — для оценки качества классификации. В каждом из разбиений распределение прецедентов по классам сохранялось неизменным.

В таблице последовательно указаны результаты счета для следующих задач: Манелис, Остеосаркома, Крестики-нолики (UCI), Инсульт, Шахматы (UCI), Молекулярная Биология 1 (UCI), Задача 5, Молекулярная Биология 2 (UCI). Для каждой задачи указаны число прецедентов m, число признаков n₁ полученное после one-hot перекодировки, число классов l и ранг $p_{i}$ , $i \in \{1, 2, \dots, l\}$ , голосующих ЭК класса $K_{i}$ . Время работы алгоритмов указано в миллисекундах. Функционалом качества выбрана сбалансированная точность классификации, вычисляемая по формуле

$ψ = \sum_{i = 1}^{l} q_{i} / l,$

где $q_{i}$ — доля верно классифицированных объектов класса $K_{i}$ . Данный функционал хорошо себя зарекомендовал при несбалансированных классах. В случае равномощных классов сбалансированная точность совпадает с долей верно классифицированных объектов.

Как видно из таблицы, модель $A_{2}$ превосходит по качеству и времени работы модели $A_{1}$ и $A_{3}$ на всех рассмотренных данных, кроме задачи Крестики-нолики, и в среднем не уступает по качеству ни случайному лесу, ни логистической регрессии. На трех задачах (Крестики-нолики, Инсульт, Молекулярная Биология 1) модель $A_{2}$ превосходит все модели.

Модель $A_{1}$ работает существенно медленнее модели $A_{3}$ при том, что оба алгоритма строят множество всех тупиковых $p$ -представительных ЭК ранга $p$ . Однако модель $A_{1}$ на первом этапе обучения ищет тупиковые покрытия для $Z_{K}$ ранга $p$ , а модель $A_{3}$ перечисляет правильные ЭК ранга $p$ для $U_{K}$ . Стоит отметить, что на шести задачах (Манелис, Остеосаркома, Крестики-нолики, Инсульт, Шахматы, Задача 5) модели $A_{2}$ и $A_{3}$ обучались менее чем за 1 с, что свидетельствует об их высокой вычислительной эффективности.

Замечание 2. В экспериментах ранг $p_{i}$ , $i \in \{1, 2, \dots, l\}$ , голосующих ЭК класса $K_{i}$ брался равным числу $0.5 \log_{2} m_{i} n_{1} - 0.5 \log_{2} \log_{2} m_{i} n_{1} - \log_{2} \log_{2} \log_{2} n_{1}$ , где $m_{i}$ - число прецедентов класса $K_{i}$ . Обучение с таким рангом в среднем показывало лучшее качество по сравнению с обучением с другими значениями ранга $p_{i}$ , также принадлежащими интервалу $ϕ_{2} (m_{i}, n_{1})$ .

На рис. 1, 2 приведено время обучения моделей $A_{1}$ и $A_{2}$ на случайных модельных данных из равномерного распределения при $l = 2$ , $k = 2$ , $m_{1}$ - число прецедентов в каждом классе, $n_{1}$ - число признаков. Результаты счета усреднены по 20 независимым запускам. Время работы алгоритмов указано в секундах. Время счета модели $A_{3}$ не приводится на графиках, так как в рассматриваемых примерах оно практически совпадает с временем работы $A_{2}$ .

Рис. 1. Зависимость времени обучения моделей $A_{1}$ и $A_{2}$ от числа признаков при $m_{1} = 250$

Рис. 2. Зависимость времени обучения моделей $A_{1}$ и $A_{2}$ от числа прецедентов при $n_{1} = 100$

На рис. 1 показан экспоненциальный рост временных затрат на этапе обучения классификаторов $A_{1}$ и $A_{2}$ при $m_{1} = 250$ в зависимости от числа признаков $n_{1}$ . Видно, что при относительно небольшом $n_{1}$ разрыв во времени счета для А₁и А₂ незначителен. При $n_{1} \geq 150$ алгоритм А₁работает значительно медленнее алгоритма А₂. Например, А₁обучается примерно в 1.3 раза медленнее А₂при $n_{1} = 150$ , а при $n_{1} = 250$ - в 1.7 раз медленнее.

На рис. 2 продемонстрирован линейный рост временных затрат на этапе обучения классификаторов А₁и А₂при $n_{1} = 100$ в зависимости от числа прецедентов $m_{1}$ . Видно, что время работы А₁ растет быстрее по сравнению с временем работы А₂. Например, А₁обучается примерно в 1.2 раза медленнее А₂при $m_{1} = 100$ и почти в 2 раз медленнее при $m_{1} = 700$ .

Заключение. Исследованы актуальные вопросы снижения временных затрат, возникающие при логическом анализе данных в задачах классификации на основе прецедентов. Предложены новые модели корректного голосования, базирующиеся на поиске в описаниях прецедентов каждого класса правильных ЭК ранга $p$ ( $p$ - настраиваемый параметр модели). Разработан эффективный алгоритм для перечисления искомых правильных ЭК. Получена верхняя асимптотическая оценка типичного числа правильных ЭК для случая, когда число прецедентов существенно больше числа признаков. При этом указан типичный ранг правильного ЭК, который использован в экспериментах для выбора параметра $p$ . Теоретические выводы подтверждены результатами экспериментального исследования на реальных и случайных модельных данных. А именно показано, что время обучения модели $A_{1}$ , базирующейся на решении задачи монотонной дуализации, растет быстрее времени обучения модели $A_{2}$ , основанной поиске правильных ЭК.

References

Crama Y., Hammer P.L., Ibaraki T. Cause-effect Relationships and Partially Defined Boolean Functions // Ann. Oper. Res. 1988. V. 16. Iss. 1. P. 299–325.
Журавлёв Ю.И., Рязанов В.В., Сенько О.В. Распознавание. Математические методы. Программная система. Практические применения. М.: ФАЗИС, 2006. 159 с.
Масич И.С. Метод оптимальных логических решающих правил для задач распознавания и прогнозирования // Системы управления и информационные технологии. 2019. Т. 75. № 1. С. 31–37.
Бонгард М.М., Вайнцвайг М.Н., Губерман Ш.А., Извекова М.Л., Смирнов М.С. Использование обучающейся программы для выявления нефтеносных пластов // Геология и геофизика. 1966. № 6.
Баскакова Л.В., Журавлёв Ю.И. Модель распознающих алгоритмов с представительными наборами и системами опорных множеств // ЖВМ и МФ. 1981. Т. 21. № 5. С. 1264–1275.
Дюкова Е.В., Журавлёв Ю.И. Дискретный анализ признаковых описаний в задачах распознавания большой размерности // ЖВМ и МФ. 2000. Т. 40. №8. С. 1264–1278.
Яблонский С.В., Чегис И.А. О тестах для электрических схем // УМН. 1955. Т. 10. Вып. 4(66). С. 182–184.
Дюкова Е.В., Журавлёв Ю.И. Задача монотонной дуализации и ее обобщения: асимптотические оценки числа решений // ЖВМ и МФ. 2018. Т. 58. № 12. С. 2153–2168.
Дюкова Е.В., Инякин С.А. Об асимптотически оптимальном построении тупиковых покрытий целочисленной матрицы // Математические вопросы кибернетики. 2008. № 17. С. 247–262.
Дюкова Е.В., Прокофьев П.А. Об асимптотически оптимальных алгоритмах дуализации // ЖВМ и МФ. 2015. Т. 55. № 5. С. 895–910.
Dragunov N., Djukova E., Djukova. А. Supervised Classification and Finding Frequent Elements in Data // 8th Intern. Conf. on Information Technology and Nanotechnology Proceedings. N.J.: IEEE, 2022. P. 5.
Johnson D.S., Yannakakis M., Papadimitriou C.H. On Generating All Maximal Independent Sets // Information Processing Letters. 1988. V. 27. Iss. 3.
Дюкова Е.В., Песков Н.В. Поиск информативных фрагментов описаний объектов в дискретных процедурах распознавания // ЖВМ и МФ. 2002. Т. 42. № 5. С. 741–753.
Дюкова Е. В., Дюкова А. П. О числе решений некоторых специальных задач логического анализа целочисленных данных // Изв. РАН. ТиСУ. 2023. № 5. С. 57–66.

Supplementary files

Supplementary Files

Action

1. JATS XML

Download

2. Formula

Download (56KB)

Indexing metadata

3. Fig. 1. Dependence of the training time of models on the number of features when

Download (145KB)

Indexing metadata

4. Fig. 2. Dependence of the training time of models on the number of precedents at

Download (115KB)

Indexing metadata

Username
Password
Remember me

Forgot password?	Register

Username
Password
Remember me

Forgot password?	Register

No 5 (2025)

No 5 (2025)

Logical classification based on finding regular representative elementary classifiers

Full Text

Abstract

Keywords

Full Text

About the authors

N. Dragunov

E. Djukova

A. Djukova

References

Supplementary files