Открытый доступ Открытый доступ  Доступ закрыт Доступ предоставлен  Доступ закрыт Только для подписчиков

№ 4 (2024)

Обложка

Весь выпуск

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Обработка информации и анализ данных

Нормализация изображения текста с помощью быстрого преобразования Хафа

Безматерных П.В.

Аннотация

В работе приведено решение для двух классических задач геометрической нормализации цифрового образа текста: компенсация глобального угла наклона документа и устранение локальных наклонов его текстовых фрагментов. Для обеих задач, отличающихся видом геометрических искажений, решение построено на базе единого метода анализа образа быстрого преобразования Хафа. Проведена конкретизация данного метода и предложены два алгоритма для решения указанных задач, а также проведена их апробация: для задачи нормализации наклона текста – на множестве как известных корпусов данных, так и на специально собранном и опубликованном корпусе кириллических фрагментов KRUS; для задачи нормализации наклона документа – на популярном корпусе DISEC. Показано, что отличительной особенностью предложенного метода является высокое быстродействие с возможностью обработки большого диапазона углов, а сам метод может быть успешно применен в системах автоматической обработки изображений документов.

Информационные технологии и вычислительные системы. 2024;(4):3-16
pages 3-16 views

Цифровые двойники и задача обеспечения долговременной сохранности документов

Соловьев А.В.

Аннотация

В статье рассматривается постановка задачи долговременной сохранности документов и использование технологии цифровых двойников. Рассмотрены проблемы и риски обеспечения сохранности документов, а также негативные влияния разрушающих факторов на хранящиеся документы. Выделена проблема сохранности электронных документов. Обосновывается предположение о возможности использования технологий цифровых двойников для обеспечения долговременной сохранности в рамках цифровой трансформации экономики и общества. Приводится формальная постановка задачи обеспечения долговременной сохранности документов с использованием технологии цифровых двойников. Приводятся перспективы дальнейших исследований для решения поставленной задачи.

Информационные технологии и вычислительные системы. 2024;(4):17-25
pages 17-25 views

Индексы состояний в конечных динамических системах ориентаций полных графов

Жаркова А.В.

Аннотация

Рассматривается конечная динамическая система, состояниями которой являются все возможные ориентации полного графа, а эволюционная функция задается следующим образом: динамическим образом орграфа является орграф, полученный из исходного путем переориентации всех дуг, входящих в стоки. Других отличий между исходным орграфом и его образом нет. Предложен алгоритм вычисления индексов состояний системы (расстояние до аттрактора того бассейна, которому принадлежит состояние). Найден максимальный индекс состояний в системе, как следствие получены дополнительные характеристики. Приведены соответствующие таблицы для полных графов с количеством вершин от 1 до 8 включительно.

Информационные технологии и вычислительные системы. 2024;(4):26-31
pages 26-31 views

Применение математического программирования для выбора оптимальных структур многомерных линейных регрессий

Базилевский М.П.

Аннотация

В статье сформулирована задача одновременного отбора в многомерных линейных регрессиях как откликов, так и объясняющих переменных. Эта задача названа «отбор ключевых признаков и информативных регрессоров». Для оценивания регрессий применен метод наименьших квадратов. Сначала задача отбора заданного числа ключевых признаков и информативных регрессоров по критерию максимума суммы коэффициентов детерминации регрессий была сведена к задаче частично-булевого линейного программирования. Затем в нее были введены ограничения на знаки оценок, что позволило осуществлять отбор оптимальных структур многомерных регрессий. После чего добавлены ограничения на абсолютные вклады регрессоров в общие детерминации, что позволяет контролировать количество объясняющих переменных. При проведении вычислительных экспериментов на реальных данных при фиксированном числе ключевых признаков на построение многомерных моделей предложенным методом ушло примерно в 67,3 раза меньше времени, чем на построение их методом всех возможных регрессий. При этом ужесточение ограничений на абсолютные вклады регрессоров еще больше снизило время решения задач.

Информационные технологии и вычислительные системы. 2024;(4):32-45
pages 32-45 views

Моделирование разреженных сущностно-предметных подсхем баз данных

Родионов А.Н.

Аннотация

В процессе создания информационно-управляющих систем уровня предприятия всегда стремятся разместить предметные списки в одной таблице, которая будет задействована во всех ассоциациях, в которых принимают участие предметы. Однако большой диапазон требований, предъявляемых к структурной организации предметных списков, заставляет дробить предметную таблицу на множество локальных таблиц, ориентируясь, в первую очередь, на максимальную компактность последних. В данной работе ставится под сомнение догмат компактности, приводящий к лавинообразному росту количества предметных таблиц, и в качестве альтернативы выдвигается концепция управляемой разреженности, следование которой допускает, на усмотрение пользователя, сведение и близкородственных, и дальнеродственных предметных множеств в один предметный тип. Разрабатывается рамочный структурный примитив, заключающий в себе кроме собственно предметного блока, объединяющего предметные типы и классификаторы-словари последних, стандартные мета-типы и мета-ассоциации со всеми сопутствующими ограничениями, совместно гарантирующими корректность данных о предметах, размещаемых в базе данных.

Информационные технологии и вычислительные системы. 2024;(4):46-59
pages 46-59 views

Проект эффективной программной платформы для работы с генетическими данными респираторных вирусов

Мордвинов А.В., Стучинский А.В., Девятериков А.П., Хайрулин С.С., Пальянова Н.В., Пальянов А.Ю.

Аннотация

Статья посвящена разработке отечественной веб-платформы с необходимыми возможностями получения доступа к банкам генетической информации. Основная цель – предоставить исследователям возможность эффективно решать задачи биоинформатики, вирусологии и эпидемиологии, при необходимости расширяя набор доступных на сервере программ для анализа и моделирования. Проект основан на современных, эффективных, обоснованно выбранных программных решениях, обеспечивающих высокую производительность и предоставляющих множество полезных функциональных возможностей. Реализуемая веб-платформа позволяет загружать, хранить, искать и анализировать геномные последовательности вирусов, таких как грипп и SARSCoV-2, а в перспективе и другие вирусные патогены. Планируется сделать ее доступной для исследователей и периодически обновлять из открытых источников, чтобы повысить удобство и эффективность работы ученых, ведущих исследования в соответствующих областях науки.

Информационные технологии и вычислительные системы. 2024;(4):60-73
pages 60-73 views

Интеллектуальные системы и технологии

Сегментация легочных узлов на снимках компьютерной томографии

Теплякова А.Р.

Аннотация

В статье описывается решение задачи автоматизации процесса сегментации легочных узлов на снимках компьютерной томографии для расширения функционала разработанного ранее модуля определения размеров и объемов легочных узлов. Акцент в работе делается на сравнении точности работы моделей, имеющих архитектуры ResU-Net, Attention U-Net и Dense U-Net, при обучении на снимках компьютерной томографии в исходном виде и с применением двух предлагаемых трехканальных подходов к их предварительной обработке. Для трех рассмотренных архитектур достигнуты значения коэффициента схожести Дайса и пересечения над объединением в диапазонах 0,8570–0,8735 и 0,7545–0,7881 при обучении на трехканальных снимках с усреднением. Полученные результаты позволяют сделать вывод о том, что применение методов предварительной обработки является перспективным для повышения точности сегментации. Также в статье описано обучение модели сегментации долей легких. Доработанный программный модуль принимает на вход снимки компьютерной томографии, а его выходные данные представляют собой обработанные снимки и структурированный отчет DICOM SR.

Информационные технологии и вычислительные системы. 2024;(4):74-83
pages 74-83 views

Анализ возможностей считывания показаний стрелочных приборов при помощи алгоритмов машинного зрения

Шляхов М.В., Петренко Е.О.

Аннотация

В статье рассмотрены способы и устройства, предназначенные для считывания и дистанционной передачи показаний стрелочных приборов. Рассмотрен спектр задач, решаемых при помощи инструментов машинного зрения, и оценена применимость их к поставленной задаче. Предложено использование алгоритма машинного зрения, интегрированного в мобильное приложение для считывания показаний стрелочных приборов.

Информационные технологии и вычислительные системы. 2024;(4):84-90
pages 84-90 views

Алгоритм оценки сходимости стохастической Парето-оптимизации

Бекетов С.М., Гинцяк А.М., Дергачев М.В.

Аннотация

Статья описывает исследование по разработке алгоритма для оценки сходимости стохастической Парето-оптимизации. Актуальность работы обусловлена необходимостью снижения вычислительных затрат, возникающих при больших многокритериальных вычислениях, где требуется учитывать множество конфликтующих критериев для поиска оптимальных решений. Одной из проблем в этом контексте является нахождение компромисса между точностью фронта Парето и ресурсами, необходимыми для его вычисления. В многокритериальной оптимизации важно оценивать сходимость, чтобы избежать чрезмерного числа итераций, которые могут быть неэффективными с точки зрения улучшения результата. Проблема заключается в поиске оптимального количества итераций, при котором фронт Парето достигает достаточной точности, и дальнейшие итерации не приводят к значительному улучшению качества решений. Целью исследования является разработка алгоритма, который позволяет оценить сходимость фронта Парето и определить, когда можно завершить процесс оптимизации без потери качества решений. Результаты могут быть полезны специалистам, занимающимся задачами многокритериальной оптимизации и разработкой алгоритмов на основе стохастических условий.

Информационные технологии и вычислительные системы. 2024;(4):91-99
pages 91-99 views

Математическое моделирование

Методы синтеза цифровых двойников на основе цифровых идентификационных моделей производственных процессов

Бахтадзе Н.Н., Коньков А.Е., Елпашев Д.В., Кушнарев В.Н., Мухтаров К.С., Пуртов А.В., Пятецкий В.Е., Черешко А.А.

Аннотация

Представлен подход к созданию цифровых двойников нового типа. Предлагается использовать идентификаторы в цепи обратной связи систем управления, формирующие точечные идентификационные модели на основе ассоциативных знаний. Описаны методы формирования управляющих воздействий в условиях возможной резкой смены режима функционирования управляемого процесса.

Информационные технологии и вычислительные системы. 2024;(4):100-111
pages 100-111 views

Математические основы информационных технологий

Эвристические подходы к построению эллипсоида минимального объема вокруг подмножества точек

Щербаков П.С., Квинто Я.И.

Аннотация

В работе рассматривается следующая существенно комбинаторная задача: даны N точек в пространстве n, построить эллипсоид минимального объема, содержащий ровно N – k точек, где k много меньше N. Предлагаются шесть алгоритмов приближенного решения этой задачи, основанные на тех или иных эвристических соображениях. Приводятся численные результаты сравнительной эффективности алгоритмов при различных предположениях о механизме генерирования точек и их количестве.

Информационные технологии и вычислительные системы. 2024;(4):112-122
pages 112-122 views

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».