№ 1 (2023)
Статьи
Применение программных методов для автоматизированной обработки источников личного происхождения
Аннотация
Предметом настоящего исследования являются программные методы автоматизированной предобработки исторических источников и разработка эффективного решения задач при работе с источниками личного происхождения. В рамках статьи проанализировано актуальное положение в области использования современных программных методов. Авторы демонстрируют основной круг аргументов, по которым такие исторические источники с технической точки зрения необходимо рассматривать отдельно. Проведен методологический разбор особенностей применения оптического распознания символов на основе предобработанных данных. Особое внимание уделено преимуществам и ключевым параметрам эффективности конечного результата работы при использовании автоматизированной преодобработки текстов, в том числе при дальнейшем использовании OCR-методов. Научная новизна исследования заключается в предложении и подробном описании программного решения сложившейся проблемы на основе методов машинного обучения. Разработанная программа имеет три фазы работы с цифровыми копиями источников личного происхождения. В ее основе заложены использование библиотеки OpenCV и решения ряда задач с помощью преобразования Хафа. Опираясь на общий анализ исследования мы можем выделить основные преимущества автоматизированной предобработки сканированных документов: сокращение времени, повышение точности, борьба с искажениями и оптимизация процесса. Представленные результаты успешной апробации разработанного решения позволяют судить о возможных сферах ее эффективного применения.
Историческая информатика. 2023;(1):1-9
1-9
Базы данных по истории локальных миграций населения России в конце XIX – XX вв.: информационные возможности и методика обработки (часть II, базы данных Министерства обороны РФ)
Аннотация
В статье представлен методологический опыт работы с источниками военных ведомств, которые дают немало сведений о миграционных перемещениях конкретных людей. Министерство обороны создало большие возможности для историков, составив и выложив в общий доступ базы данных по десяткам миллионов погибших и награжденных советских граждан. На основе этих материалов Центрального архива Министерства обороны (ЦАМО), выстроенных по десяткам параметров связанной персональной информации, а также по сведениям областных, районных и городских военкоматов региональные власти готовили и публиковали в печатном и электронном виде соответствующие Книги памяти земляков, как погибших на фронтах Второй мировой войны, так и вернувшихся живыми домой. Сопоставление места рождения и года рождения фигуранта в упомянутых базах данных с местом и временем его призыва в РККА при высокой репрезентативности персоналий дает весьма точное представление об объемах и направленности эмиграции из родных мест. Базы данных и иные массовые источники, исходящие от Министерства обороны РФ, являются важнейшей и обязательной основой изучения российских миграций на длинных непрерывных линиях комплексной социографической информации. Их принципиальным методологическим преимуществом выступает возможность создания целостных картин формирующих социальных процессов и явлений на уровнях от индивидуальных человеческих судеб до агрегаций страновых масштабов.
Историческая информатика. 2023;(1):10-36
10-36
Моделирование демографических процессов в Тамбовской и Тверской областях, 1989 – 2020 гг.
Аннотация
Целью исследования является реконструкция демографических стратегий сельских социумов. Объект исследования – отдельные поселения и сельсоветы (группы поселений) Тамбовской и Тверской областей (в общей сложности 2861 поселение и 371 сельсовет). Представленная работа предпринята в рамках большого проекта по фрактальному моделированию демографических стратегий аграрного населения Европейской России в длительной исторической ретроспективе – начиная с середины XIX века. Хронологические рамки статьи охватывают не только кризис аграрной сферы 1990-х годов, но и определённое восстановление некоторых сельских поселений в 2000 – 2010-х годах. Для проведения экспериментов с предлагаемой компьютерной моделью была создана база данных, в которой в формализованном виде представлены основные параметры исследованных поселений и сельсоветов. Авторы приходят к выводу, что, несмотря на все отличия, демографические стратегии тверских и тамбовских поселений эволюционируют в рамках одной и той же закономерности: Тверская и Тамбовская области просто находятся в немного разных фазах одного и того же процесса. Крестьянское общество в Тверской области имеет меньший потенциал в качестве миграционного донора и базы для естественного роста. Более старая и северная Тверская область дольше шла по пути раскрестьянивания и урбанизации. Тамбовское крестьянское общество несколько менее истощено и, следовательно, могло бы демонстрировать большие демографические успехи в случае удачной демографической политики.
Историческая информатика. 2023;(1):37-54
37-54
Виртуальная реконструкция строений подмосковной усадьбы Сенницы: источники и методы исследования
Аннотация
Проблема сохранения историко-культурного наследия очень актуальна в наши дни. С каждым днем все больше памятников разрушается, при этом интерес соотечественников к достопримечательностям России постоянно возрастает. Заметно увеличение количества туристических маршрутов по Московской области, часть которых отражает интерес к многочисленным дворянским усадьбам. В Подмосковье было немало родовых имений известных семейств Российской империи, однако сегодня большая часть из них находится в руинах. Один из таких постепенно разрушающихся памятников культуры, имеющий богатую историю, – усадьба Сенницы, расположенная в городском округе Озёры Московской области. В статье проводится анализ комплекса источников, на основе которых создается виртуальная 3D-реконструкция усадьбы Сенницы (кон. XIX – нач. XX вв.), когда имение принадлежало семье графа Ф.Э. Келлера. Источниковая база исследования весьма разнообразна: планы, чертежи, картографические материалы, фотографии, описи имущества, сметы на постройку. Автором работы описывается поэтапный процесс 3D-моделирования, в рамках которого использовалось программное обеспечение SketchUp и Twinmotion. Важное место уделено строительной истории Сенниц и личностям ее владельцев. Реконструкция строений усадебного комплекса Сенницы позволяет визуализировать облик разрушенного памятника культуры, а также продемонстрировать высокий потенциал применения методик 3D-моделирования в историко-культурных исследованиях. Данная работа проводится в рамках проекта кафедры исторической информатики исторического факультета МГУ им. М. В. Ломоносова по воссозданию облика дворянских усадеб Подмосковья.
Историческая информатика. 2023;(1):55-78
55-78
Технологии 3D моделирования и 3D печати в сохранении и популяризации архитектурных памятников музея-заповедника "Василево" (Тверская область)
Аннотация
В статье представлены результаты проекта по созданию виртуальных моделей архитектурных памятников ландшафтного музея-заповедника "Василево" в Тверской области с их последующей 3D печатью и созданием масштабного макета. Музей-заповедник "Василево" расположен на территории усадьбы Львовых XVIII-XIX вв. и включает в себя усадебные постройки, а также 16 памятников деревянного зодчества XVIII-XIX вв., привезенных и установленных на территории заповедника их различных районов Тверского региона. Среди них - объекты культурного наследия федерального значения: деревянные храмы, памятники гражданской застройки. Музей является филиалом Тверского государственного объединенного музея и входит в туристический маршрут "Пушкинское кольцо Верхневолжья". В результате реализации проекта авторов статьи были выполнены виртуальные модели и масштабные физические модели 19 архитектурных объектов музея-заповедника "Василево". В работе использовались технологии фотограмметрии, полигонального 3D моделирования, FFF 3D печати, макетирования. Процесс фотографирования для создания цифровой модели по технологии фотограмметрии осуществлялся с использованием профессионального БПЛА и зеркального фотоаппарата. Основным программным обеспечением являлись Blender, Autodesk Meshmixer, Agisoft Metashape. Опыт оцифровки объектов показал, что фотограмметрия позволяет хорошо запечатлеть передать в компьютерной модели мелкие детали, которые могут быть в дальнейшем отражены в масштабных моделях при 3D печати. В частности, это деревянные стены и перекрытия различной конструкции, каменная кладка, гравированные изображения и надписи на камне. 3D печать осуществлялась на 3D-принтерах Creality Ender 3 и Creality Ender 5. Материалом для печати являлась пластмасса полилактид. Напечатанные модели были раскрашены и укреплены в виде масштабного макета. Готовый макет был передан музею "Василево" и используется в целях музейного показа.
Историческая информатика. 2023;(1):79-89
79-89
Проект "Союз-Аполлон" в советских (российских) и американской газетах: контент-анализ
Аннотация
В данном исследовании изучаются материалы советской, российской и американской прессы, посвященные программе первого советско-американского космического сотрудничества «Союз–Аполлон», реализованной в июле 1975 года. Отображение подготовки, реализации проекта и результатов полета составляет предмет данного исследования. Источниковую базу исследования составляет периодическая печать, а именно статьи советских (российских) газет «Известия» и «Правда» и американской «The New York Times», которые расположены на ресурсе «EastView» и на сайте архива «Нью Йорк Таймс». В данном исследовании использован комплекс аналитических методов и компьютерных технологий, включающий метод контент-анализа. Новизна исследования связана с постановкой задачи сравнения освещения в прессе государств-участников информации о подготовке, реализации проекта и результатах полета. Актуальность исследования заключается в апробации новых исследовательских методов и подходов при работе с большими полнотекстовыми базами данных, в том числе на иностранном языке. В ходе исследования выявлены четыре аспекта отражения программы «Союз-Аполлон» в анализируемых газетах: сотрудничество в космосе, влияние проекта на международные отношения, влияние программы на дальнейшее развитие мировой пилотируемой космонавтики, а также роль советских и американских участников программы в ее успешной реализации.
Историческая информатика. 2023;(1):90-101
90-101
Корректировка результатов OCR-распознавания текста исторического источника с помощью нечетких множеств (на примере газеты начала XX века)
Аннотация
Наша статья посвящена попытке применения современных методов NLP для оптимизации процесса распознавания текста исторических источников. Любой исследователь, решивший воспользоваться инструментами распознавания отсканированных текстов, столкнется с рядом ограничений точности конвейера (последовательности операций распознавания). Даже наиболее качественно обученные модели могут давать существенную ошибку по причине неудовлетворительного состояния дошедшего до нас источника: порезы, изгибы, кляксы, стертые буквы – всё это мешает качественному распознаванию. Наше предположение состоит в том, что, используя заранее заданный набор слов, маркирующих присутствие интересующей нас темы, с помощью модуля нечетких множеств (Fuzzy sets) из NLP-библиотеки SpaCy, мы сможем восстановить по шаблонам те слова, которые по итогам процедуры распознавания оказались распознаны с ошибками. Для проверки качества процедуры восстановления текста на выборке из 50 номеров газеты «Биржевые ведомости» мы посчитали оценки количества слов, которые бы не вошли в семантический анализ из-за неправильного распознавания. Все метрики были посчитаны также с использованием паттернов нечетких множеств. Оказалось, что в среднем на номер «Биржевых ведомостей» приходится 938.9 слов, маркирующих тему нашего исследования – торговые и финансовые операции с ценными бумагами. Из них изначально правильно распознаются в среднем 87.2% слов. Примерно 119.6 слов (в среднем на 50 номеров) содержат опечатки, связанные с некорректным распознаванием. Благодаря использованию алгоритмов нечетких множеств нам удалось эти слова восстановить и включить в семантический анализ. Мы считаем, что восполнение 12.8% слов, потенциально относящихся к изучаемой теме – это хороший результат, существенно повышающий качество дальнейшего семантического анализа текста методами компьютерного моделирования.
Историческая информатика. 2023;(1):102-113
102-113
Лазерное 3D-сканирование в оцифровке, реконструкции и копировании скульптурных памятников
Аннотация
Данная статья посвящена применению технологии лазерного 3D-сканирования для решения актуальных задач современной музейной работы. Показана возможность использования данной технологии для оцифровки объектов культурно-исторического наследия с целью их документирования, мониторинга состояния сохранности, реставрации, виртуальной реконструкции и репродуцирования. Приведены результаты практических работ по созданию высокоточных физических копий мраморных скульптур из музеев Санкт-Петербурга в результате комбинированного использования 3D-сканирования и фрезерных камнеобрабатывающих станков с числовым программным управлением. Кроме того, показана перспективность применения лазерных аддитивных технологий для реставрации и копирования исторических памятников. Приведенные в статье результаты работ по созданию копии мраморной итальянской скульптуры XVIII века «Примавера» из коллекции музея-заповедника «Царское село» являются первым опытом применения лазерного бесконтактного метода копирования скульптурных памятников в России. Данный подход был предложен и реализован автором данной статьи в кооперации с петербургской реставрационной компанией ООО «Ресстрой» и итальянскими партнерами. Кроме того, также впервые в нашей стране, автор продемонстрировал возможность применения технологии лазерного 3D-сканирования для мониторинга экстерьерных памятников и применения лазерных аддитивных технологий для реставрации и реконструкции поврежденных и полностью утраченных объектов культурно-исторического наследия.
Историческая информатика. 2023;(1):114-124
114-124
Международная научная конференция «Историческая информатика как Historical Data Science»: к 30-летию Ассоциации «История и компьютер»
Аннотация
В статье рассматривается содержание и итоги международной конференции Ассоциации «История и компьютер» (АИК) «Историческая информатика как Historical Data Science», состоявшейся 11–13 ноября 2022 г. на историческом факультете МГУ имени М.В. Ломоносова. Подробно описаны все этапы и формы проведения конференции: 2 пленарных заседания, секционные заседания, круглый стол. Конференция была посвящена 30-летию АИК и 10-летию журнала "Историческая информатика". В программу конференции вошло свыше 100 докладов, авторы которых представляли научные центры России, Азербайджана, Беларуси, Германии, Казахстана, Кыргызстана, Норвегии и Узбекистана. Основную часть конференции составили 10 секционных заседаний, где были представлены доклады по актуальным историческим проблемам, решение которых предлагалось авторами на основе методов и технологий исторической информатики. При этом в большинстве докладов значительное внимание уделялось характеристике используемых данных, методам их обработки и визуализации. Большое внимание было уделено созданию баз данных и информационных систем, статистической обработке исторических данных, методам анализа текстов, исторической геоинформатике, 3-D моделированию. Рассматривались также результаты археологических исследований с применением цифровых технологий, методы исторической информатики в исследовательской работе архивов и музеев, цифровые технологии в историческом образовании.
Историческая информатика. 2023;(1):125-146
125-146

