Снижение размерности данных для анализа посредством метода главных компонент

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Несмотря на то, что современные системы интеллектуального анализа данных обладают высокой вычислительной мощностью, количество данных для анализа постоянно увеличивается и может стать критическим фактором. Таким образом, задача снижения размерности исходных данных для анализа без снижения самого качества анализа становится актуальной. Одним из методов, который позволяет снизить размерность данных является метод главных компонент. В работе рассматривается применение данного метода при анализе данных в узлах сенсорных сетей. Преимущество метода состоит в отсутствии предварительных гипотез о состоянии исследуемого объекта. Реализация метода является линейной и циклической, что определяет его хорошую алгоритмизацию средствами вычислительной техники. В качестве исходного набора данных, используется набор данных работы беспроводной сенсорной сети, которая состоит из одной тысячи узлов. Для каждого узла представлена выборка измерений по основным параметрам качества обслуживания. Проводится предобработка исходных данных. Строится матрица ковариации, для которой находятся собственные числа и собственные вектора. Результатом работы метода являются главные компоненты, получаемые при преобразовании собственных векторов. Данные компоненты служат для анализа данных. Результатом работы является снижение размерности данных.

Об авторах

Денис Вадимович Гадасин

Московский технический университет связи и информатики (МТУСИ)

Автор, ответственный за переписку.
Email: dengadiplom@mail.ru
ORCID iD: 0000-0002-5601-7798
Scopus Author ID: 57203169517
ResearcherId: AAT-5451-2021

кандидат технических наук, доцент, заместитель заведующего, кафедра «Сетевые информационные технологии и сервисы»

Россия, г. Москва

Лилия Андреевна Тремасова

Московский технический университет связи и информатики (МТУСИ)

Email: l.a.tremasova@mtuci.ru
ORCID iD: 0009-0004-6852-4131

ассистент, кафедра «Сетевые информационные технологии и сервисы»

Россия, г. Москва

Даниил Сергеевич Калининский

Московский технический университет связи и информатики (МТУСИ)

Email: daniilblag28@mail.ru
ORCID iD: 0009-0005-3069-9566
ResearcherId: KIB-6020-2024

аспирант, кафедра «Сетевые информационные технологии и сервисы»

Россия, г. Москва

Список литературы

  1. Айвазян А.С., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Классификация и снижение размерности. М.: Финансы и статистика, 1989. 609 с.
  2. Маркова С.В. Анализ данных на языке R (с практикумом): учебник. М.: КноРус, 2023. 218 с. (Бакалавриат). ISBN: 978-5-406-10865-9. EDN: BXJBWF.
  3. Криволапов С.Я. Введение в анализ данных. Поиск структуры данных с применением языка Python: учеб. пособие. М.: ИНФРА-М, 2024. 177 с. ISBN: 978-5-16-019001-3. doi: 10.12737/2082643. EDN: ZMJBEO.
  4. Кузьменко А.А., Леонов Ю.А., Мартыненко А.А. и др. Введение в анализ данных в среде Python. Курск: Университетская книга, 2024. 125 с. ISBN: 978-5-907857-52-0. EDN: PBTQKJ.
  5. Козырев С.В., Полянцева К.А. Комплексный анализ и сравнение передовых алгоритмов дефектовки дорожного покрытия с использованием различных систем сбора данных // Инженерный вестник Дона. 2024. № 11 (119). С. 72–116. EDN: JHKKTB.
  6. Полянцева К.А. Разработка алгоритмов накопления данных посредством стереопары и детектирования дефектов дорожного полотна // Современные наукоемкие технологии. 2022. № 5-1. С. 107–112. doi: 10.17513/snt.39156. EDN: EDAZTV.
  7. Паршинцева Л.С., Паршинцев А.А. Многомерный анализ данных на Python: учебник. М.: КноРус, 2024. 130 с. ISBN: 978-5-406-12606-6. EDN: JOPYQS.
  8. Царькова Е.Г. Интеллектуальный анализ данных. М.: Знание-М, 2024. 144 с. ISBN: 978-5-00187-862-9. doi: 10.38006/00187-862-9.2024.1.144. EDN: CEPBUD.
  9. Иванов С.А., Колмогорова С.С. Интеллектуальный анализ данных: теоретические и практические аспекты применения. СПб.: Реноме, 2024. 142 с. ISBN: 978-5-00256-023-3. doi: 10.25990/spbgltu.e567-2739. EDN: BOZUEK.
  10. Гадасин Д.В., Шведов А.В. Применение транспортной задачи для балансировки нагрузки в условиях нечеткости исходных данных // T-Comm: Телекоммуникации и транспорт. 2024. Т. 18. № 1. С. 13–20. doi: 10.36724/2072-8735-2024-18-1-13-20. EDN: WKNPIX.
  11. Гадасин Д.В. Построение бинарного дерева минимальной цены // T-Comm: Телекоммуникации и транспорт. 2024. Т. 18. № 11. С. 38–44. doi: 10.36724/2072-8735-2024-18-11-38-44. EDN: GMCEWG.
  12. Гадасин Д.В., Шведов А.В., Кузин И.А. Трехмерная реконструкции объекта по одному изображению с использованием глубоких сверточных нейронных сетей // T-Comm: Телекоммуникации и транспорт. 2022. Т. 16. № 7. С. 29–35. doi: 10.36724/2072-8735-2022-16-7-29-35. EDN: YTLCNW.
  13. Тарасова И.А., Симонова И.Э., Симонов А.Б. Эконометрический анализ данных: учеб. пособие. Волгоград: Волгоградский гос. технический университет, 2023. 96 с. ISBN: 978-5-9948-4709-1. EDN: ALTGJI.
  14. Мхитарян В.С., Шишов В.Ф., Искоркин Д.В., Козлов А.Ю. Вероятностно-статистический анализ данных с использованием MS Excel // Экономика и экономические науки. Ч. 1: Вероятностные методы анализа данных. М.: КУРС, 2023. 360 с. ISBN: 978-5-907535-92-3. EDN: HXJIEI.
  15. Пономарева Л.А., Голосов П.Е., Мосягиа А.Б. и др. Анализ данных в принятии управленческих решений. М.: ОнтоПринт, 2021. 183 с. ISBN: 978-5-00121-379-6. EDN: BRCMFY.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 14. Анализ результатов в координатах двух главных компонент

Скачать (130KB)


Ссылка на описание лицензии: https://www.urvak.ru/contacts/

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».