ARTIFICIAL INTELLIGENCE AND DECISION MAKING

Искусственный интеллект и принятие решений

2071-8594

269741

10.14357/20718594230403

NELPQW

Computational Intelligence

Вычислительный интеллект

Research Article

On Computational Efficiency of Knowledge Extraction by Probabilistic Algorithms

О вычислительной эффективности извлечения знаний вероятностными алгоритмами

Vinogradov

Dmitry V.

Виноградов

Дмитрий Вячеславович

Russian Federation

Doctor of Physical and Mathematical Sciences, Leading Researcher

доктор физико-математических наук, ведущий научный сотрудник

KRRGuest@yandex.ru

Computer Science and Control Federal Research Center of the Russian Academy of SciencesФедеральный исследовательский центр «Информатика и управление» РАН

15122023

29371211202412112024

2023

ФИЦ ИУ РАН

https://journals.rcsi.science/2071-8594/article/view/269741

The paper demonstrates computational efficiency of probabilistic approach to knowledge extraction through binary similarity operation. In addition to previously proved by the author the result on sufficiency of a polynomial number of hypotheses on causes of investigated target property, the paper contains a polynomial upper bound on mean working time of the algorithm to generate a single candidate for hypothesis. The proven result concerns a family of algorithms based on coupled Markov chains. To obtain a good estimate for the length of the trajectory (before entering the ergodic state) of such a chain, we needed to enrich the training sample by adding negative columns for existing binary features.

В статье доказана вычислительная эффективность вероятностного подхода к извлечению знаний с помощью бинарной операции сходства. В дополнении к ранее доказанному автором результату о достаточности полиномиального числа гипотез о причинах исследуемого целевого свойства, в настоящей работе дана полиномиальная верхняя оценка на среднее время работы алгоритма порождения одного кандидата в гипотезы. Доказанный результат касается семейства алгоритмов, основанных на спаривающих цепях Маркова. Чтобы получить хорошую оценку на длину траектории (до попадания в эргодическое состояние) такой цепи потребовалось обогатить обучающую выборку добавлением столбцов-отрицаний для существующих бинарных признаков.

similaritycandidatecoupled Markov chainaverage length of trajectory

сходствокандидатспаривающая цепь Марковасредняя длина траектории

Finn V.K., Anshakov O.M. DSM-metod avtomaticheskogo porozhdeniya gipotez: Logicheskie i epistemologicheskie osnovaniya [JSM Method for Automatic Hypotheses Generation: Logical and Epistemological Foundations]. Moscow: Editorial URSS, 2009.

ДСМ-метод автоматического порождения гипотез: Логические и эпистемологические основания //Ред.: Финн В.К., Аншаков О.М.). М.: URSS. 2009. 432 c.

Mill J.S. A System of Logic. Honolulu: University Press of the Pacific, 2002.

Милль Дж.Ст. Система логики силлогистической и индуктивной: Изложение принципов доказательства в связи с методами научного исследования. Пер. с англ. Изд. 5. М.: URSS. 2011. 832 c.

Gusakova S.M., Finn V.K. Shodstva i pravdopodobnyj vyvod [Similarities and Plausible Inference]. Izvestia AN SSSR, Ser. «Technical cybernetics». 1987. No 5. P. 42–63.

Гусакова С.М., Финн В.К. Сходства и правдоподобный вывод // Известия АН СССР. Сер. «Техническая кибернетика». 1987. № 5. C. 42–63.

Ganter B., Wille R. Formal Concept Analysis: Mathematical Foundations. Berlin: Springer, 1999.

Ganter, Bernhard and Wille, Rudolf. Formal Concept Analysis: Mathematical Foundations. Berlin: Springer–Verlag. 1999. 284 p.

Vinogradov D.V. Random generation of hypotheses in the JSM method using simple Markov chains. Automatic Documentation and Mathematical Linguistics. 2012. No 46(5). P. 221–228.

Виноградов Д.В. Вероятностное порождения гипотез в ДСМ-методе с помощью простейших цепей Маркова // Научная и техническая информация. Сер. 2. 2012. № 9. C. 20–27.

Kuznetsov S.O. A Fast Algorithm for Computing All Intersections of Objects in a Finite Semi-Lattice, Automatic Documentation and Mathematical Linguistics. 1993. No 27(5). P. 11-21.

Кузнецов С.О. Быстрый алгоритм построения всех пересечений объектов из нижней полурешетки // Научная и техническая информация. Сер. 2. 1993. № 1. C. 17–20.

Vinogradov D.V. Algebraic Machine Learning: Emphasis on Efficiency. Automation and Remote Control. 2022. No 83(6). P. 831–846.

Виноградов Д.В. Алгебраическое машинное обучение: упор на эффективность // Автоматика и телемеханика. 2022. № 6. С. 5–23.

Kemeny J.G., Snell J.L. Finite Markov chains. New York: Springer, 1976.

Кемени Дж., Снелл Дж. Конечные цепи Маркова. Пер. с англ. М.: Наука. 1970. 272 c.

Vinogradov D.V. The VKF Method for Data Mining: a Survey of the State of the Art and Open Problems. Scientific and Technical Information Processing. 2018. No 45(6). P. 411–416.

Виноградов Д.В. ВКФ-метод интеллектуального анализа данных: обзор результатов и открытых проблем // Искусственный интеллект и принятие решений. 2017. № 2. C. 9–16.

10.

Vinogradov D.V. Markov Chains, Law of Total Probability, and Recurrence Relations. Automatic Documentation and Mathematical Linguistics. 2023. No 57(1). P. 68–72.

Виноградов Д.В. Цепи Маркова, формула полной вероятности и рекуррентные соотношения // Научная и техническая информация. Сер. 2. 2023. № 2. С. 35–39.