<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE root>
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ali="http://www.niso.org/schemas/ali/1.0/" article-type="research-article" dtd-version="1.2" xml:lang="en"><front><journal-meta><journal-id journal-id-type="publisher-id">ARTIFICIAL INTELLIGENCE AND DECISION MAKING</journal-id><journal-title-group><journal-title xml:lang="en">ARTIFICIAL INTELLIGENCE AND DECISION MAKING</journal-title><trans-title-group xml:lang="ru"><trans-title>Искусственный интеллект и принятие решений</trans-title></trans-title-group></journal-title-group><issn publication-format="print">2071-8594</issn></journal-meta><article-meta><article-id pub-id-type="publisher-id">269743</article-id><article-id pub-id-type="doi">10.14357/20718594230405</article-id><article-id pub-id-type="edn">QHNFRU</article-id><article-categories><subj-group subj-group-type="toc-heading" xml:lang="en"><subject>Computational Intelligence</subject></subj-group><subj-group subj-group-type="toc-heading" xml:lang="ru"><subject>Вычислительный интеллект</subject></subj-group><subj-group subj-group-type="article-type"><subject>Research Article</subject></subj-group></article-categories><title-group><article-title xml:lang="en">Modified Nonparametric Algorithm for Automatic Classification of Large-Volume Statistical Data and its Application</article-title><trans-title-group xml:lang="ru"><trans-title>Модифицированный непараметрический алгоритм автоматической классификации статистических данных большого объема и его применение</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author"><name-alternatives><name xml:lang="en"><surname>Tuboltsev</surname><given-names>Vitaly P.</given-names></name><name xml:lang="ru"><surname>Тубольцев</surname><given-names>Виталий Павлович</given-names></name></name-alternatives><address><country country="RU">Russian Federation</country></address><bio xml:lang="en"><p>Graduate Student</p></bio><bio xml:lang="ru"><p>аспирант</p></bio><email>vitalya.98@mail.ru</email><xref ref-type="aff" rid="aff1"/></contrib><contrib contrib-type="author"><name-alternatives><name xml:lang="en"><surname>Lapko</surname><given-names>Alexander V.</given-names></name><name xml:lang="ru"><surname>Лапко</surname><given-names>Александр Васильевич</given-names></name></name-alternatives><address><country country="RU">Russian Federation</country></address><bio xml:lang="en"><p>Doctor of Technical Sciences, Professor, Chief Researcher</p></bio><bio xml:lang="ru"><p>доктор технических наук, профессор, главный научный сотрудник</p></bio><email>lapko@icm.krasn.ru</email><xref ref-type="aff" rid="aff1"/><xref ref-type="aff" rid="aff2"/></contrib><contrib contrib-type="author"><name-alternatives><name xml:lang="en"><surname>Lapko</surname><given-names>Vasily A.</given-names></name><name xml:lang="ru"><surname>Лапко</surname><given-names>Василий Александрович</given-names></name></name-alternatives><address><country country="RU">Russian Federation</country></address><bio xml:lang="en"><p>Doctor of Technical Sciences, Professor, Leading Researcher</p></bio><bio xml:lang="ru"><p>доктор технических наук, профессор, ведущий научный сотрудник</p></bio><email>valapko@yandex.ru</email><xref ref-type="aff" rid="aff1"/><xref ref-type="aff" rid="aff2"/></contrib></contrib-group><aff-alternatives id="aff1"><aff><institution xml:lang="en">Reshetnev Siberian State University of Science and Technology</institution></aff><aff><institution xml:lang="ru">Сибирский государственный университет науки и технологий им. акад. М. Ф. Решетнева</institution></aff></aff-alternatives><aff-alternatives id="aff2"><aff><institution xml:lang="en">Institute of Computational Modelling of the Siberian Branch of the Russian Academy of Sciences</institution></aff><aff><institution xml:lang="ru">Институт вычислительного моделирования СО РАН</institution></aff></aff-alternatives><pub-date date-type="pub" iso-8601-date="2023-12-15" publication-format="electronic"><day>15</day><month>12</month><year>2023</year></pub-date><issue>4</issue><issue-title xml:lang="en"/><issue-title xml:lang="ru"/><fpage>49</fpage><lpage>57</lpage><history><date date-type="received" iso-8601-date="2024-11-12"><day>12</day><month>11</month><year>2024</year></date><date date-type="accepted" iso-8601-date="2024-11-12"><day>12</day><month>11</month><year>2024</year></date></history><permissions><copyright-statement xml:lang="en">Copyright ©; 2023, ФИЦ ИУ РАН</copyright-statement><copyright-statement xml:lang="ru">Copyright ©; 2023,</copyright-statement><copyright-year>2023</copyright-year><copyright-holder xml:lang="en">ФИЦ ИУ РАН</copyright-holder></permissions><self-uri xlink:href="https://journals.rcsi.science/2071-8594/article/view/269743">https://journals.rcsi.science/2071-8594/article/view/269743</self-uri><abstract xml:lang="en"><p>A modified nonparametric algorithm for automatic classification of large-volume statistical data is proposed. Its application makes it possible to detect classes corresponding to unimodal fragments of the probability density of a multidimensional random variable. The compression of the initial information is carried out on the basis of the decomposition of the multidimensional space of features into a data array composed of the centers of the sampling intervals and the corresponding frequencies of belonging to the values of the random variable. Based on these data, a regression estimate of the probability density is synthesized. The information obtained is the basis for the algorithmization of the automatic classification procedure. A class is a compact group of observations of a random variable corresponding to a single-modal fragment of probability density. The computational efficiency of the modified nonparametric algorithm for automatic classification of large-volume statistical data is provided by the compression procedure of the source data, improvement and algorithmization of the traditional nonparametric method of class detection. The computational efficiency of the modified non-parametric algorithm for automatic classification of large volume statistical data is provided by the initial data compression procedure, improvement and algorithmization of the traditional nonparametric method for detecting compact groups of observations of a random variable. The effectiveness of the developed method of automatic classification is confirmed by the results of its application in the analysis of remote sensing data of forests damaged by the Siberian silkworm.</p></abstract><trans-abstract xml:lang="ru"><p>Предлагается модифицированный непараметрический алгоритм автоматической классификации статистических данных большого объема. По этим данным осуществляется синтез регрессионной оценки плотности вероятности. Полученная информация является основой алгоритмизации процедуры автоматической классификации. Вычислительная эффективность модифицированного непараметрического алгоритма автоматической классификации статистических данных большого объема обеспечивается процедурой сжатия исходных данных, совершенствованием и алгоритмизацией традиционной непараметрической методики обнаружения классов. Эффективность разработанной методики автоматической классификации подтверждается результатами ее применения при анализе данных дистанционного зондирования лесных массивов, поврежденных сибирским шелкопрядом.</p></trans-abstract><kwd-group xml:lang="en"><kwd>nonparametric algorithm for automatic classification</kwd><kwd>regression estimation of probability density</kwd><kwd>discretization of the range of random variables</kwd><kwd>woodlands</kwd><kwd>remote sensing data</kwd></kwd-group><kwd-group xml:lang="ru"><kwd>непараметрический алгоритм автоматической классификации</kwd><kwd>регрессионная оценка плотности вероятности</kwd><kwd>дискретизация области значений случайных величин</kwd><kwd>лесные массивы</kwd><kwd>данные дистанционного зондирования</kwd></kwd-group><funding-group/></article-meta></front><body></body><back><ref-list><ref id="B1"><label>1.</label><citation-alternatives><mixed-citation xml:lang="en">Dorofeyuk А.А. Algoritmy avtomaticheskoy klassifikatsii (obzor) [Algorithms of automatic classification (review)] // Avtomatika i telemekhanika [Automation and Remote Control]. 1971. No 12. P. 78-113.</mixed-citation><mixed-citation xml:lang="ru">Дорофеюк А.А. Алгоритмы автоматической классификации (обзор) // Автоматика и телемеханика. 1971. №</mixed-citation></citation-alternatives></ref><ref id="B2"><label>2.</label><citation-alternatives><mixed-citation xml:lang="en">Dorofeyuk А.А. Metodologiya ekspertno-klassifikatsionnogo analiza v zadachakh upravleniya i obrabotki slozhnoorganizovannykh dannykh (istoriya i perspektivy razvitiya) [Methodology of expert classification analysis in the management and processing of complex data (history and prospects of development)] // Problemy upravleniya [Control sciences]. 2009. No 3.1. P. 19-28.</mixed-citation><mixed-citation xml:lang="ru">12. С. 78-113.</mixed-citation></citation-alternatives></ref><ref id="B3"><label>3.</label><citation-alternatives><mixed-citation xml:lang="en">TSypkin Ya.Z. Osnovy teorii obuchayushchikhsya sistem [Fundamentals of the theory of learning systems]. Moscow: Nauka, 1970.</mixed-citation><mixed-citation xml:lang="ru">Дорофеюк А.А. Методология экспертно-классификационного анализа в задачах управления и обработки сложноорганизованных данных (история и перспективы развития) // Проблемы управления. 2009. № 3.1. С. 19-28.</mixed-citation></citation-alternatives></ref><ref id="B4"><label>4.</label><citation-alternatives><mixed-citation xml:lang="en">Vasil'ev V.I., EHsh S.N. Osobennosti algoritmov samoobucheniya i klasterizatsii [Features of self-learning algorithms and clustering] // Upravlyayushchiye sistemy i mashiny [Control systems and machines]. 2011. No 3. P. 3-9.</mixed-citation><mixed-citation xml:lang="ru">Цыпкин Я.З. Основы теории обучающихся систем. М.: Наука, 1970.</mixed-citation></citation-alternatives></ref><ref id="B5"><label>5.</label><citation-alternatives><mixed-citation xml:lang="en">Parzen E. On estimation of a probability density function and mode // Annals of Mathematical Statistics. 1962. V. 33. No 3. P. 1065-1076.</mixed-citation><mixed-citation xml:lang="ru">Васильев В.И., Эш С.Н. Особенности алгоритмов самообучения и кластеризации // Управляющие системы и машины. 2011. № 3. С. 3-9.</mixed-citation></citation-alternatives></ref><ref id="B6"><label>6.</label><citation-alternatives><mixed-citation xml:lang="en">Epanechnikov V.A. Neparametricheskaya ocenka mnogomernoj plotnosti veroyatnosti [Non-parametric estimation of a multivariate probability density]. // Teoriya veroyatnosti i ee primeneniya [Theory of Probability &amp; Its Applications]. 1969. V. 14. No 1. P. 156-161.</mixed-citation><mixed-citation xml:lang="ru">Parzen E. On estimation of a probability density function and mode // Annals of Mathematical Statistics. 1962. V. 33. No 3. P. 1065-1076.</mixed-citation></citation-alternatives></ref><ref id="B7"><label>7.</label><citation-alternatives><mixed-citation xml:lang="en">Lapko A.V., Lapko V.A. Neparametricheskiy algoritm avtomaticheskoy klassifikatsii v usloviyakh statisticheskikh dannykh bol'shogo ob"yema [Nonparametric algorithm of automatic classification under conditions of large-scale statistical data] // Informatika i sistemy upravleniya [Informatics and control systems]. 2018. V. 57. No 3. P. 59-70.</mixed-citation><mixed-citation xml:lang="ru">Епанечников В.А. Непараметрическая оценка многомерной плотности вероятности // Теория вероятности и ее применения. 1969. Т. 14. № 1. С. 156-161.</mixed-citation></citation-alternatives></ref><ref id="B8"><label>8.</label><citation-alternatives><mixed-citation xml:lang="en">Zenkov I.V., Lapko A.V., Lapko V.A., Im S.T., Tuboltsev V.P., Avdeenok V.L. A nonparametric algorithm for automatic classification of large multivariate statistical data sets and its application // Computer Optics. 2021. V. 45. No 2. P. 253–260.</mixed-citation><mixed-citation xml:lang="ru">Лапко А.В., Лапко В.А. Непараметрический алгоритм автоматической классификации в условиях статистических данных большого объема // Информатика и системы управления. 2018. Т. 57. № 3. С. 59-70.</mixed-citation></citation-alternatives></ref><ref id="B9"><label>9.</label><citation-alternatives><mixed-citation xml:lang="en">Vasilyeva I.K., Popov A.V. Metod avtomaticheskoj klasterizacii dannyh distancionnogo zondirovaniya [Method for automatic clustering of remote sensing data]// Aviacionnokosmicheskaya tekhnika i tekhnologiya [Aerospace Technic and Technology]. 2019. V. 155. No 3. P. 64-75.</mixed-citation><mixed-citation xml:lang="ru">Зеньков И.В., Лапко А.В., Лапко В.А., Им С.Т., Тубольцев В.П., Авдеенок В.Л. Непараметрический алгоритм автоматической классификации многомерных статистических данных большого объёма и его применение // Компьютерная оптика. 2021. Т. 45. № 2. С. 253-260.</mixed-citation></citation-alternatives></ref><ref id="B10"><label>10.</label><citation-alternatives><mixed-citation xml:lang="en">Lapko A.V., Lapko V.A. Regressionnaya ocenka mnogomernoj plotnosti veroyatnosti i eyo svojstva [Regression estimate of the multidimensional probability density and its properties] // Avtometriya [Optoelectronics, Instrumentation and Data Processing]. 2014. V. 50. No 2. P.148–153.</mixed-citation><mixed-citation xml:lang="ru">Васильева И.К., Попов А.В. Метод автоматической кластеризации данных дистанционного зондирования // Авиационно-космическая техника и технология. 2019. Т. 155. № 3. С. 64-75. 10. Лапко А.В., Лапко В.А. Регрессионная оценка многомерной плотности вероятности и её свойства // Автометрия. 2014. Т. 50. № 2. С. 50-56.</mixed-citation></citation-alternatives></ref><ref id="B11"><label>11.</label><citation-alternatives><mixed-citation xml:lang="en">Lapko A.V., Lapko V.A. Yadernyye otsenki plotnosti veroyatnosti i ikh primeneniye [Kernel probability density estimates and their application]. Krasnoyarsk: Reshetnev University. 2021.</mixed-citation><mixed-citation xml:lang="ru">Лапко А.В., Лапко В.А. Ядерные оценки плотности вероятности и их применение. Красноярск: СибГУ им. М.Ф. Решетнёва. 2021.</mixed-citation></citation-alternatives></ref><ref id="B12"><label>12.</label><mixed-citation>Rudemo M. Empirical choice of histogram and kernel density estimators // Scandinavian Journal of Statistics. 1982. V. 9. No 2. P. 65-78.</mixed-citation></ref><ref id="B13"><label>13.</label><mixed-citation>Hall P. Large-sample optimality of least squares cross-validation in density estimation // Annals of Statistics. 1983. V. 11. No 4. P. 1156-1174.</mixed-citation></ref><ref id="B14"><label>14.</label><mixed-citation>Bowman A.W. An alternative method of cross-validation for the smoothing of density estimates // Biometrika. 1984. V. 71. No 2. P. 353-360.</mixed-citation></ref><ref id="B15"><label>15.</label><citation-alternatives><mixed-citation xml:lang="en">Heinhold I., Gaede K.W. Ingeniur statistic. München: Wien, Springler Verlag Publs, 1964.</mixed-citation><mixed-citation xml:lang="ru">Heinhold I., Gaede K.W. Ingeniur statistic. München: Wien, Springler Verlag, 1964.</mixed-citation></citation-alternatives></ref><ref id="B16"><label>16.</label><mixed-citation>Chavez P.S. Image-based atmospheric correction revisited and improved // Photogrammetric Engineering and Remote Sensing. 1996. V. 62. No 9. P. 1025-1036.</mixed-citation></ref><ref id="B17"><label>17.</label><citation-alternatives><mixed-citation xml:lang="en">Lapko A.V., Lapko V.A., Im S.T., Tuboltsev V.P., Avdeenok V.L. Programma avtomaticheskoy klassifikatsii dannykh distantsionnogo zondirovaniya Zemli na osnove neparametricheskikh algoritmov prinyatiya resheniy (NAC v. 2.0) [The program for automatic classification of Earth remote sensing data based on nonparametric decision-making algorithms (NAC v. 2.0)] // Certificate of state registration of the computer program RF No. 2022619023, 2022.</mixed-citation><mixed-citation xml:lang="ru">Лапко А.В., Лапко В.А., Им С.Т., Тубольцев В.П., Авдеенок В.Л. Программа автоматической классификации данных дистанционного зондирования Земли на основе непараметрических алгоритмов принятия решений (NAC v. 2.0) // Свидетельство о государственной регистрации программы для ЭВМ № 2022619023 от 18.05.2022. Федеральная служба по интеллектуальной собственности, 2022.</mixed-citation></citation-alternatives></ref><ref id="B18"><label>18.</label><mixed-citation>Lemenkova P. ISO Cluster classifier by ArcGIS for unsupervised classification of the Landsat TM image of Reykjavík. University thought // Bulletin of Natural Sciences Research. 2021. V. 11. No 1. P. 29-37.</mixed-citation></ref></ref-list></back></article>
