Снижение размерности данных для анализа посредством метода главных компонент
- Авторы: Гадасин Д.В.1, Тремасова Л.А.1, Калининский Д.С.1
-
Учреждения:
- Московский технический университет связи и информатики (МТУСИ)
- Выпуск: Том 12, № 3 (2025)
- Страницы: 130-140
- Раздел: ИНФОРМАТИКА И ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ
- URL: https://journals.rcsi.science/2313-223X/article/view/350193
- DOI: https://doi.org/10.33693/2313-223X-2025-12-3-130-140
- EDN: https://elibrary.ru/BLPFIZ
- ID: 350193
Цитировать
Аннотация
Несмотря на то, что современные системы интеллектуального анализа данных обладают высокой вычислительной мощностью, количество данных для анализа постоянно увеличивается и может стать критическим фактором. Таким образом, задача снижения размерности исходных данных для анализа без снижения самого качества анализа становится актуальной. Одним из методов, который позволяет снизить размерность данных является метод главных компонент. В работе рассматривается применение данного метода при анализе данных в узлах сенсорных сетей. Преимущество метода состоит в отсутствии предварительных гипотез о состоянии исследуемого объекта. Реализация метода является линейной и циклической, что определяет его хорошую алгоритмизацию средствами вычислительной техники. В качестве исходного набора данных, используется набор данных работы беспроводной сенсорной сети, которая состоит из одной тысячи узлов. Для каждого узла представлена выборка измерений по основным параметрам качества обслуживания. Проводится предобработка исходных данных. Строится матрица ковариации, для которой находятся собственные числа и собственные вектора. Результатом работы метода являются главные компоненты, получаемые при преобразовании собственных векторов. Данные компоненты служат для анализа данных. Результатом работы является снижение размерности данных.
Полный текст
Открыть статью на сайте журналаОб авторах
Денис Вадимович Гадасин
Московский технический университет связи и информатики (МТУСИ)
Автор, ответственный за переписку.
Email: dengadiplom@mail.ru
ORCID iD: 0000-0002-5601-7798
Scopus Author ID: 57203169517
ResearcherId: AAT-5451-2021
кандидат технических наук, доцент, заместитель заведующего, кафедра «Сетевые информационные технологии и сервисы»
Россия, г. МоскваЛилия Андреевна Тремасова
Московский технический университет связи и информатики (МТУСИ)
Email: l.a.tremasova@mtuci.ru
ORCID iD: 0009-0004-6852-4131
ассистент, кафедра «Сетевые информационные технологии и сервисы»
Россия, г. МоскваДаниил Сергеевич Калининский
Московский технический университет связи и информатики (МТУСИ)
Email: daniilblag28@mail.ru
ORCID iD: 0009-0005-3069-9566
ResearcherId: KIB-6020-2024
аспирант, кафедра «Сетевые информационные технологии и сервисы»
Россия, г. МоскваСписок литературы
- Айвазян А.С., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Классификация и снижение размерности. М.: Финансы и статистика, 1989. 609 с.
- Маркова С.В. Анализ данных на языке R (с практикумом): учебник. М.: КноРус, 2023. 218 с. (Бакалавриат). ISBN: 978-5-406-10865-9. EDN: BXJBWF.
- Криволапов С.Я. Введение в анализ данных. Поиск структуры данных с применением языка Python: учеб. пособие. М.: ИНФРА-М, 2024. 177 с. ISBN: 978-5-16-019001-3. doi: 10.12737/2082643. EDN: ZMJBEO.
- Кузьменко А.А., Леонов Ю.А., Мартыненко А.А. и др. Введение в анализ данных в среде Python. Курск: Университетская книга, 2024. 125 с. ISBN: 978-5-907857-52-0. EDN: PBTQKJ.
- Козырев С.В., Полянцева К.А. Комплексный анализ и сравнение передовых алгоритмов дефектовки дорожного покрытия с использованием различных систем сбора данных // Инженерный вестник Дона. 2024. № 11 (119). С. 72–116. EDN: JHKKTB.
- Полянцева К.А. Разработка алгоритмов накопления данных посредством стереопары и детектирования дефектов дорожного полотна // Современные наукоемкие технологии. 2022. № 5-1. С. 107–112. doi: 10.17513/snt.39156. EDN: EDAZTV.
- Паршинцева Л.С., Паршинцев А.А. Многомерный анализ данных на Python: учебник. М.: КноРус, 2024. 130 с. ISBN: 978-5-406-12606-6. EDN: JOPYQS.
- Царькова Е.Г. Интеллектуальный анализ данных. М.: Знание-М, 2024. 144 с. ISBN: 978-5-00187-862-9. doi: 10.38006/00187-862-9.2024.1.144. EDN: CEPBUD.
- Иванов С.А., Колмогорова С.С. Интеллектуальный анализ данных: теоретические и практические аспекты применения. СПб.: Реноме, 2024. 142 с. ISBN: 978-5-00256-023-3. doi: 10.25990/spbgltu.e567-2739. EDN: BOZUEK.
- Гадасин Д.В., Шведов А.В. Применение транспортной задачи для балансировки нагрузки в условиях нечеткости исходных данных // T-Comm: Телекоммуникации и транспорт. 2024. Т. 18. № 1. С. 13–20. doi: 10.36724/2072-8735-2024-18-1-13-20. EDN: WKNPIX.
- Гадасин Д.В. Построение бинарного дерева минимальной цены // T-Comm: Телекоммуникации и транспорт. 2024. Т. 18. № 11. С. 38–44. doi: 10.36724/2072-8735-2024-18-11-38-44. EDN: GMCEWG.
- Гадасин Д.В., Шведов А.В., Кузин И.А. Трехмерная реконструкции объекта по одному изображению с использованием глубоких сверточных нейронных сетей // T-Comm: Телекоммуникации и транспорт. 2022. Т. 16. № 7. С. 29–35. doi: 10.36724/2072-8735-2022-16-7-29-35. EDN: YTLCNW.
- Тарасова И.А., Симонова И.Э., Симонов А.Б. Эконометрический анализ данных: учеб. пособие. Волгоград: Волгоградский гос. технический университет, 2023. 96 с. ISBN: 978-5-9948-4709-1. EDN: ALTGJI.
- Мхитарян В.С., Шишов В.Ф., Искоркин Д.В., Козлов А.Ю. Вероятностно-статистический анализ данных с использованием MS Excel // Экономика и экономические науки. Ч. 1: Вероятностные методы анализа данных. М.: КУРС, 2023. 360 с. ISBN: 978-5-907535-92-3. EDN: HXJIEI.
- Пономарева Л.А., Голосов П.Е., Мосягиа А.Б. и др. Анализ данных в принятии управленческих решений. М.: ОнтоПринт, 2021. 183 с. ISBN: 978-5-00121-379-6. EDN: BRCMFY.
Дополнительные файлы


