Том 14, № 1 (2023)
Распознавание табличной информации с использованием свёрточных нейронных сетей
Аннотация
Показана актуальность выявления табличной информации и распознавания её содержимого для обработки отсканированных документов. Описано формирование набора данных для обучения, валидации и тестирования нейронной сети глубокого обучения (DNN) YOLOv5s для обнаружения простых таблиц. Отмечена эффективность использования этой DNN при работе с отсканированными документами. С использованием Keras Functional API сформирована свёрточная нейронная сеть (CNN) для распознавания основных элементов табличной информации — цифр, основных знаков препинания и букв кириллицы. Приведены результаты исследования работы этой CNN. Описана реализация выявления и распознавания табличной информации на отсканированных документах в разработанной ИС актуализации информации в базах данных системы ЕГРН Росреестра.



О декомпозиции метода построения энкодера языковой модели
Аннотация
Энкодер в составе языковой модели является механизмом преобразования текстовой информации в эффективное числовое представление, пригодное для решения широкого круга задач обработки текста при помощи нейросетевых методов. В данной статье предложен способ декомпозиции процесса обучения языкового энкодера. Рассматриваются вопросы целесообразности такой декомпозиции с точки зрения снижения вычислительных затрат, контроля качества на промежуточных стадиях обучения, обеспечения интерпретируемости результатов каждой стадии. Приводятся оценки качества энкодера.



Исследование стационарных характеристик многосерверных моделей с избыточностью
Аннотация
В работе предложены подходы к исследованию стохастических моделей вычислительных сетей из персональных компьютеров с помощью многосерверных систем обслуживания с избыточностью. Представлены перспективы и ограничения указанного подхода, а также возможные направления дальнейших исследований.



Система извлечения упоминаний симптомов из текстов на естественном языке с помощью нейронных сетей
Аннотация
В статье представлена система для извлечения упоминаний симптомов из медицинских текстов на естественном (русском) языке. Система осуществляет нахождение симптомов в тексте, их нормализацию (приведение к стандартной форме) и отождествление — отнесение найденного симптома к группе однотипных симптомов. Каждый этап обработки реализуется с помощью отдельной нейронной сети. Состав извлекаемых симптомов ограничен тремя видами заболеваний — аллергические и пульмонологические заболевания, а также коронавирусная инфекция (COVID-19). Представлен и описан аннотированный корпус предложений, использованный для обучения нейросети нахождению упоминаний симптомов, относящихся к этим трем заболеваниям. При разметке корпуса был использован простой XML-подобный язык. Для представления предложений, непосредственно поступающих на вход нейросети, предложен расширенный BIO-формат разметки. Для каждого этапа приведены оценки точности (для первого этапа точность оценивалась при строгом и гибком тестировании). Описаны подходы и реализация приведения к стандартной форме и отождествления упоминаний симптомов. Даны сравнения с аналогичными работами по извлечению симптомов из медицинских текстов на разных языках, а также показано место данной системы в системах поддержки принятия клинических решений.



Об одном классе дискретно-непрерывных систем с параметрами
Аннотация
Рассматривается частный случай гибридной системы: дискретно-непрерывные системы (ДНС) с параметрами и промежуточными критериями. Такая система является двухуровневой. Параметры входят лишь в непрерывные системы, действующие поочередно на нижнем уровне. Верхний уровень, описываемый дискретным процессом, играет связующую роль для всех систем нижнего, определяя политику их взаимодействия и обеспечивая минимизацию функционала. В работе выводится аналог достаточных условий оптимальности Кротова и строится метод улучшения управления и параметров. Приводится иллюстративный пример. На основе полученных общих условий исследуется частный случай: квазилинейные ДНС.


