Information systems and automated archival technologies: formation and evolution
- Autores: Zalaev G.Z.1
-
Afiliações:
- Russian State Archive of Scientific and Technical Documentation (RGANTD)
- Edição: Nº 3 (2024)
- Páginas: 92-101
- Seção: From the experience of archival institutions and organizations
- URL: https://journals.rcsi.science/2619-1601/article/view/276974
- ID: 276974
Citar
Texto integral
Resumo
An overview of the research work on the creation of automated information retrieval systems and archival technologies developed in the Scientific Research Center for Technical Documentation of the USSR and the Russian State Archive of Scientific and Engenering Documentation (RGANTD) is presented. The automated information retrieval systems building principles for documents of the State Archival Fund are considered. The Scientific Research Center for Technical Documentation projects on the creation of previously little known information systems are analyzed.
Texto integral
Работы по разработке и внедрению в практику архивной деятельности автоматизированных информационно-поисковых систем (АИПС) начались в 1976 году. Постановлением Государственного комитета по науке и технике (ГКНТ) Совета министров СССР от 26 ноября 1976 года № 430 в пятилетний план научно-исследовательских работ Главархива СССР была включена тема по созданию автоматизированной системы научно-технической информации по документам Государственного архивного фонда (ГАФ СССР) как части Государственной системы научно-технической информации с целью наиболее эффективного использования документов ГАФ СССР в интересах народного хозяйства, науки и культуры.
Работы по этой теме были поручены Научно-исследовательскому центру технической документации (НИЦТД) СССР[1].
Для решения поставленной задачи в НИЦТД СССР был создан Вычислительный центр, оснащенный ЭВМ ЕС-1022 с развитой периферией, включающей в себя накопители в максимальной комплектации на магнитных дисках и на магнитной ленте, устройства ввода/вывода информации, устройства подготовки данных для ввода в ЭВМ. Для ввода информации в базу данных наряду с типовыми устройствами ввода данных в АИПС того времени использовалась система распознавания текста – оптическое читающее устройство (ОЧУ) фирмы IBM. Использование системы распознавания текстов для ввода данных на начало 1980-х годов являлось новаторским.
Проведенные специалистами НИЦТД СССР (отделов 23 и 24) исследования позволили разработать принципы проектирования АИПС на документы ГАФ СССР:
- Однократный ввод информации при ее многократном использовании.
- Единая технология обработки информации в автоматизированных информационно-поисковых системах различных тематических комплексов архивных документов.
- Единое программное обеспечение для различных тематических комплексов.
Результаты проведенных исследований нашли отражение в кандидатских диссертациях А.С. Шапошникова, Г.З. Залаева (технические науки) и Г.А. Медведевой (исторические науки), а также в целом ряде статей специалистов НИЦТД СССР.
В начале 1980-х годов в НИЦТД СССР были разработаны и введены в эксплуатацию автоматизированные информационно-поисковые системы [1–12] на три тематических комплекса архивных документов:
АИПС «История освоения космического пространства»;
АИПС «История архитектуры и градостроительства Москвы, Петербурга и их пригородов»;
АИПС «Документы Октябрьской революции».
АИПС «История освоения космического пространства» – это информационная система, которая работала с описаниями аудиовизуальных документов фондов НИЦТД СССР, в особенности с поливидовым составом документов (документация НИОКР, фото-, фоно-, кино- и видеодокументы). В базу данных АИПС загружались описания документов, которые готовились на специальных рабочих листах. В рабочие листы вносилась информация в зависимости от вида документа и ключевые слова для обеспечения быстрого информационного поиска. C рабочих листов производился ввод информации в базу данных АИПС.
АИПС «История архитектуры и градостроительства Москвы, Петербурга и их пригородов» – это информационная система, которая содержит описания документов из различных федеральных архивов, а также архивов Москвы и Санкт-Петербурга [6, 7, 10]. Идея создания подобной системы принадлежала заведующему отделом Российского государственного исторического архива (РГИА), кандидату исторических наук Д.И. Раскину, а директор НИЦТД СССР О.А. Михайлов эту идею поддержал.
База данных АИПС «Документы Октябрьской революции» содержала документы из Центрального государственного архива Октябрьской Революции (ЦГАОР СССР)[2].
В 1984 году НИЦТД СССР приступил к разработке системы автоматического индексирования описаний документов [13, 14], а в начале 1990-х годов начал внедрять в практику работы персональные компьютеры.
Базы данных указанных АИПС были переведены на новую программную и техническую платформы. В качестве программной платформы был выбран пакет прикладных программ CDS ISIS/M, который был разработан Департаментом развития и применения программного обеспечения бюро информационных программ и служб ЮНЕСКО для создания автоматизированных информационных систем в архивах и библиотеках [9]. В качестве технической платформы использовались персональные компьютеры. Специалистам НИЦТД потребовалось около года для разработки технического интерфейса, который совмещал накопитель на магнитной ленте ЕС ЭВМ с персональным компьютером, а также программного конвертора для переконвертирования баз данных АИПС из системы АИДОС в систему CDS ISIS/M. Задача усложнялась еще и различием кодировок символов в системах ЕС ЭВМ и персональных компьютеров.
Приобретение НИЦТД СССР сканирующего оборудования позволило приступить к оцифровке архивных документов и разработке проектов информационных систем, которые могли предоставлять исследователям в дополнение к описаниям документов еще и их цифровые копии [15–18]. Так, в 1992–1993 годах НИЦТД СССР реализовал проект по оцифровке документов из фонда «Вирт Йозеф[3] – государственный канцлер Германии» Российского центра хранения историко-документальных коллекций. Целью разработки такой информационной системы являлись разработка и апробация подходов к созданию информационных систем, работающих с цифровыми копиями архивных документов. При этом решались следующие задачи:
- разработка технологии создания полнотекстовых информационных систем на оптических дисках;
- выбор формата хранения архивных документов на оптических дисках;
- апробация записи архивных документов на оптические диски;
- разработка технологии построения системы информационного поиска и сопряжения записей базы данных с массивом цифровых копий документов.
В рамках проекта было оцифровано 282 дела, 14 362 документа, в том числе 455 фотографий, рисунков и гравюр.
При обработке многостраничных документов каждая страница сканировалась в отдельный файл. Имя файла цифровой копии формировалось по следующей схеме:
<Имя файла цифровой копии>::= < aaaaaa> <bb>, где aaaaaa – архивный номер документа, bb – порядковый номер страницы.
Такой подход позволял связывать цифровые копии страниц в единый цифровой документ.
Недостатком технологии информационной системы «Вирт Йозеф – государственный канцлер Германии» являлось отсутствие связи описаний документов в базе данных с цифровыми копиями документов. Пользователь мог или просматривать изображения документов, или отбирать и читать описания документов. В дальнейшем этот технический недостаток был устранен при разработке Российским государственным архивом научно-технической документации (РГАНТД) информационно-поисковой системы, включающей цифровые копии фотодокументов, связанных с жизнью и деятельностью первого космонавта Ю.А. Гагарина. База данных системы была сформирована из описаний фотодокументов, на которых присутствовало изображение Ю.А. Гагарина, содержащихся в базе данных АИПС «История освоения космического пространства».
Во входном формате базы данных было добавлено новое поле – «имя файла цифровой копии». Размещенная в этом поле информация устанавливала связи между цифровыми копиями фотодокументов, записанными на оптических дисках, и поисковой системой, содержащей описания документов, что позволило исследователю при информационном поиске в базе данных АИПС получать не только описание фотодокумента, но и его оцифрованную копию на экране монитора.
В связи с этим было разработано специальное программное обеспечение для визуализации цифровых копий, а также для связывания имени цифровой копии с соответствующей записью базы данных. В качестве имени цифровой копии был выбран архивный номер документа, который однозначно определяет архивный документ.
Важным этапом в развитии автоматизированных информационных систем в РГАНТД стала разработка АИПС на аудиовизуальные документы с их цифровыми копиями для фотодокументов.
АИПС на аудиовизуальные документы с их цифровыми копиями для фотодокументов (АИПС ЦКД) разработана на основании соответствующих концепции и технического задания и представляет собой информационную систему, обеспечивающую поиск информации и визуализации в цифровом виде фотодокументов, а также хранения описаний документов и их цифровых копий. В рамках реализованной архитектуры «клиент – сервер» серверная часть состоит из базы данных и веб-приложения, доступного пользователю через веб-интерфейс. Функционал серверной части системы реализуется за счет использования программного обеспечения Microsoft Net Framework 2.0, Microsoft Information Services 5.0.
Клиентские устройства обращаются к серверу по интернет-протоколу HTTP через браузер Microsoft Internet Explorer 5.5.
В качестве программного обеспечения базы данных используется система управления базами данных (СУБД) Microsoft SQL Server 2000.
Для управления правами доступа пользователей к базе данных АИПС ЦКД применяется встроенная в СУБД Microsoft SQL Server 2000 система безопасности.
АИПС ЦКД состоит из четырех функциональных блоков:
- Система ввода, поиска, выдачи информации, ведения словарей и визуализации цифровых копий фотодокументов.
- Система загрузки цифровых копий в форматах TIF и JPEG.
- Система загрузки ISO-файлов[4].
- Система установки блоков загрузки данных.
АИПС ЦКД является многопользовательской системой и ориентирована на работу в локальной сети. В зависимости от роли, которая присвоена пользователю, АИПС ЦКД работает в одном из двух режимов: «только чтение информации» либо «редактирование информации».
В режиме «только чтение информации» осуществляются поиск документов, просмотр и сохранение их данных, а также просмотр цифровых копий в сжатом виде в формате JPEG.
В режиме «редактирование информации», помимо функций режима «только чтения информации», осуществляются функции создания новых и изменения существующих описаний документов; удаления описаний документов, добавления/изменения/удаления цифровых копий; получения полноразмерных цифровых копий в формате JPEG/TIFF, а также управления словарями дополнительных объектов.
Поиск документов является основной функцией АИПС ЦКД и осуществляется методами:
- поиска по текстовым полям;
- поиска по номеру документа в системе;
- поиска по словарям.
При вводе в эксплуатацию в АИПС ЦКД была загружена полностью база данных описаний фотодокументов из АИПС «История освоения космического пространства» (65 тыс. ОД) и более 4 тыс. цифровых копий.
Следующим важным направлением деятельности в развитии автоматизированных информационных систем в РГАНТД стало создание информационных ресурсов в сети «Интернет», связанных с историей освоения космического пространства, базирующихся на коллекциях архива. Одним из первых среди федеральных архивов РГАНТД создал свой сайт и разместил на нем фотокаталог с описаниями и цифровыми копиями фотодокументов и кинокаталог с описаниями кинодокументов (2000–2001) [19–21].
В 2018 году в РГАНТД отказались от собственных разработок информационных систем. Было принято решение выбрать платформу для АИПС РГАНТД из существующих предложений на рынке. После проведенного мониторинга и анализа специалистами архива среди различных программных платформ был выбран программно-информационный комплекс «КАИСА-Архив».
С появлением и развитием информационно-коммуникационных технологий специалисты РГАНТД начинают разрабатывать автоматизированные архивные технологии (ААТ) различного назначения и внедрять их в деятельность архива, среди них:
- ААТ «Подготовка описей архивных документов»;
- ААТ «Учет физико-химического состояния архивных документов»;
- ААТ «Учет фонодокументов на оптических дисках».
Быстрое моральное и техническое устаревание аппаратных и программных средств, а также бурное развитие цифровых технологий не позволяют с большой точностью «нарисовать движение вверх», однако, проследив и проанализировав эволюцию развития автоматизированных информационных систем в архивах, а также осмыслив применение современных информационных технологий в архивной деятельности, можно с большой долей вероятности определить перспективы их развития.
Уже сейчас можно выделить такие направления, как внедрение систем искусственного интеллекта в архивах, поиск по изображениям и голосу, развитие технологий оцифровки и информационный поиск по технологии «одного входа». Это и есть ближайшее будущее РГАНТД.
[1] С 1995 года – Российский государственный архив научно-технической документации (РГАНТД).
[2] С 1992 года – Государственный архив Российской Федерации (ГА РФ).
[3] Вирт Карл Йозеф (1879–1956) – в 1921–1922 годах возглавлял Рейхсканцлярию Германии. В апреле 1922 года подписал советско-германский Рапалльский договор. После Второй мировой войны выступал против возрождения милитаризма в ФРГ и за установления дружественных отношений с СССР.
[4] ISO-файл — это образ оптического диска, в котором содержится большое количество сжатых файлов и который можно использовать только после его распаковки.
Sobre autores
Gennady Zalaev
Russian State Archive of Scientific and Technical Documentation (RGANTD)
Autor responsável pela correspondência
Email: gzalaev@mail.rgantd.ru
Código SPIN: 1985-7816
Dr. (in technics), senior researcher, deputy director – scientific director
Rússia, MoscowBibliografia
- Armaderova G.B., Epaneshnikova E.K., Zalaev G.Z., Koryukina R.D., Medvedeva G.A., Mikhailov O.A. Avtomatizirovanny`e informacionno-poiskovy`e sistemy` v arxivax [Automated information retrieval systems in archives]. Moscow: Main Archival Department; 1985. 150 p. (In Russian).
- Mikhailov O.A. Avtomatizirovannaya informacionno-poiskovaya sistema po arxivny`m dokumentam [Automated information retrieval system for archival documents]. Nauchno-texnicheskaya informaciya = Scientific and technical information. Series 1. 1985;7:8–11. (In Russian).
- Zalaev G.Z. Medvedeva G.A., Shaposhnikov A.S. Integral`naya avtomatizirovannaya informacionno-poiskovaya sistema po arxivny`m dokumentam [Integrated automated information retrieval system for archival documents]. Nauchno-texnicheskaya informaciya = Scientific and technical information. Series 2. 1985;9:8–11. (In Russian).
- Zalaev G.Z., Shaposhnikov A.S. Opy`t razrabotki i e`kspluatacii AIPS na tematicheskie kompleksy` dokumentov gosudarstvenny`x arxivov SSSR [Experience in the development and operation of automated information retrieval system for thematic complexes of documents from the state archives of the USSR]. Arxivovedenie, arxeografiya: E`kspress-informaciya = Archival studies, archeography: Express information. 1984;4(31):13–15. (In Russian).
- Mikhailov O.A., Shaposhnikov A.S. Razrabotka i vnedrenie AIPS na arxivny`e dokumenty` GAF SSSR [Development and implementation of AIPS for archival documents of the State Archive of the USSR]. Sovetskie arxivy` = Soviet archives. 1982;4:27–31. (In Russian).
- Raskin D.I. Zadachi i osobennosti informacionnoj bazy` AIPS “Istoriya pamyatnikov arxitektury` i gradostroitel`stva Moskvy`, Leningrada i ix prigorodov” [Tasks and features of the information base of automated information retrieval system “History of architectural monuments and urban planning of Moscow, Leningrad and their suburbs”]. Arxivovedenie, arxeografiya: E`kspress-informaciya = Archival studies, archeography: Express information. 1984;4(31):7–11. (In Russian).
- Raskin D.I., Shaposhnikov A.S., Mikhailova V.G. Informacionnoe i lingvisticheskoe obespechenie AIPS na kompleks dokumentov “Istoriya pamyatnikov arxitektury` i gradostroitel`stva” [Information and linguistic support of automated information retrieval system for documents complex “History of architectural and urban planning monuments”]. Sovetskie arxivy` = Soviet archives. 1984;4:23–28. (In Russian).
- Shaposhnikov A.S. Osnovny`e principy` postroeniya AIPS na dokumenty` Gosudarstvennogo arxivnogo fonda SSSR [Basic principles of constructing automated information retrieval system for documents of the State Archival Fund of the USSR]. In: Issues of information services: Interuniversity collection. Moscow: MGIAI; 1983. (In Russian).
- Shaposhnikov A.S., Zalaev G.Z., Medvedeva G.A. Osnovny`e napravleniya komp`yuterizacii v arxivax i opy`t primeneniya CDS (ISIS) M v RNICzKD [The main directions of computerization in archives and the experience of using CDS (ISIS) M in the Russian Research Center for Space Documentation]. In: Improving thematic search and restoration of archival documents based on computer technology. Moscow: Scientific Research Center for Technical Documentation of the USSR; 1993. p. 3–17. (In Russian).
- Shaposhnikov A.S., Raskin D.I., Mikhailova V.G., Naumova I.M., Parfenova V.A. Avtomatizirovannaya informacionno-poiskovaya sistema na kompleks dokumentov “Istoriya pamyatnikov arxitektury` i gradostroiel`stva Moskvy`, Leningrada i ix prigorodov” [Automated information retrieval system for a set of documents “History of architectural monuments and urban planning of Moscow, Leningrad and their suburbs”]. In: Problems of physical and chemical preservation, organization of selection, storage and search of archival documents: In 2 parts. Moscow: Main Archival Department of the USSR; 1983. (In Russian).
- Mikhailov O. Opit` ot podgotvyane i v`vezhdane v eksploataciya na avtomatizirane informacionn-t`rseshhi sistemi na arxivni dokumenti v SSSR [The experience of preparing and putting into operation the automation of information-searching systems of archival documents in the USSR]. Arxiven preglyad = Archive Preview. 1983;1:68–73. (In Bulgarian).
- Mikhailov O.A., Krylov B.V., Shaposhnikov A.S. Osnovny`e principy` sozdaniya AIPS po arxivny`m dokumentam [Basic principles of creating an automated information retrieval system based on archival documents]. In: Problems of physical and chemical preservation, organization of selection, storage and search of archival documents: Research and methodological developments of the Scientific Research Center for Technical Documentation. Moscow; 1978. p. 66–76. (In Russian).
- Zalaev G.Z. Odin iz podxodov k avtomaticheskomu indeksirovaniyu arxivny`x dokumentov GAF SSSR [One of the approaches to automatic indexing of archival documents of the State Archival Fund of the USSR]. In: Information and documentation problems of accelerating scientific and technological progress. Moscow: Moscow State Institute for History and Archives; 1988. (In Russian).
- Zalaev G.Z., Chernysheva O.N. Informacionny`j poisk v tezaurusny`x i bestezaurusny`x AIPS na baze PE`VM [Information search in thesaurus and non-thesaurus automated information retrieval system based on PC]. In: Development of automated and restoration systems for space documents. Collection of scientific works of the Scientific Research Center for Space Documentation. Moscow: Main Archival Department; 1992. (In Russian).
- Zalaev G.Z. Nekotory`e voprosy` sozdaniya e`lektronny`x arxivov [Some issues of creating electronic archives]. In: Reports and abstracts at the third All-Russian conference. February 25–26, 1999. Moscow: Scientific book; 1999. p. 258–261. (In Russian).
- Zalaev G.Z., Shaposhnikov A.S. Nekotory`e voprosy` primeneniya texnologii ocifrovaniya v arxivnom dele [Some issues of using digitization technology in archiving]. In: Second All-Russian Conference “Archival studies and source studies of Russian history. Problems of interaction at the present stage.” Conference materials. Moscow: VNIIDAD; 1997. p. 142–144. (In Russian).
- Medvedeva G.A., Rzhevkin V.R., Shaposhnikov A.S., Zalaev G.Z. Sozdanie e`ksperimental`nogo massiva polnotekstovy`x kopij na opticheskix diskax [Creation of an experimental array of full-text copies on optical disks]. In: Optical disks and their use in archives. Moscow: Scientific Research Center for Space Documentation. 1993. p. 42–47. (In Russian).
- Chernin E`.A., Shaposhnikov A.S., Zalaev G.Z. et all. Razrabotka sistemy` straxovogo kopirovaniya arxivny`x dokumentov i fondov pol`zovaniya na osnove sovremenny`x informacionny`x texnologij: Otchet o nauchno-issledovatel`skoj rabote [Development of an insurance copying system for archival documents and usage fund based on modern information technologies: Scientific report]. Moscow: VNIIDAD; 1996. (In Russian).
- Zalaev G.Z. Proekt po sozdaniyu Internet-katalogov arxivny`x kino- i fotodokumentov [Project to create Internet catalogs of archival film and photo documents]. Texnika kino i televideniya = Film and television technology. 2003;11:42–45. (In Russian).
- Zalaev G.Z. Udalenny`j fond pol`zovaniya na osnove Internet-katalogov [Remote usage fund based on Internet catalogs]. Vestnik arxivista = Herald of an Archivist. 2004;3–4(81–82):54–60. (In Russian).
- Zalaev G.Z. Koncepciya udalennogo fonda pol`zovaniya na osnove cifrovogo kopirovaniya [The concept of a remote usage fund based on digital copying]. In: Technotronic archives in modern society: science, education, heritage. Materials of the scientific and practical conference dedicated to the 10th anniversary of the Faculty of Technotronic Documents. Moscow: Russian State University for the Humanities; 2004. p. 106–108. (In Russian).
Arquivos suplementares
