Analyzing the foreign experience in implementing standardized document metadata schemes

封面

如何引用文章

全文:

详细

The foreign practice of records metadata regulation and implementation issues of standardized metadata schemes in recordkeeping are considered.

全文:

В рамках выполнения Плана научно-исследовательских и опытно-конструкторских работ по государственному заданию Федерального архивного агентства на 2022–2023 годы Всероссийский научно-исследовательский институт документоведения и архивного дела (ВНИИДАД) занимался разработкой проекта стандарта «Информация и документация. Управление документами. Логическая структура, состав метаданных документов и требования к их содержанию». Целью проекта является установление единообразия в описании документов, включаемых в системы электронного документооборота, системы хранения электронных документов и другие системы, предназначенные для управления документами. На сегодняшний день стандарт находится в стадии утверждения, начата разработка методических рекомендаций по его применению. В связи с этим определенный интерес представляет ознакомление с различными источниками информации по разработке и модернизации информационных систем с точки зрения работы с метаданными, в том числе с зарубежным опытом.

В основу национального стандарта положены принципы, определенные в ГОСТ Р ИСО 15489-1-2019 «Система стандартов по информации, библиотечному и издательскому делу. Информация и документация. Управление документами. Часть 1. Понятия и принципы», идентичном международному ISO 15489-1:2016 «Information and documentation – Records management – Part 1: Concepts and principles». Одним из них является рассмотрение метаданных о документах как их неотъемлемой части. А схема метаданных как «логический план, показывающий отношения между элементами метаданных, как правило, посредством установления правил использования и управления метаданными, особенно касающихся семантики, синтаксиса и степени обязательности данных» является одним из четырех средств управления документами. Иностранные специалисты, в том числе представители национальных архивных служб, заинтересованные в создании условий для приема аутентичных, целостных, достоверных и пригодных для использования документов, вырабатывают различные способы регламентации требований к метаданным, схем метаданных и развивают методическую поддержку решений по их реализации. Целью настоящей статьи является обзор зарубежных разработок, определяющих требования к составу «элементов метаданных» – наименьших информационных единиц, необходимых для описания документов в информационных системах, в которых они создаются, а также методов внедрения стандартизированных метаданных.

В основе большинства разработок по регламентации состава метаданных документов лежит подход, представленный в 2003 году в международном стандарте ИСО 15836 «Информация и документация. Набор элементов метаданных “Дублинское ядро”» (ISO 15836. Information and documentation – The Dublin Core metadata element set), направленном на унификацию состава и описания элементов данных для любых информационных ресурсов, которыми являются в том числе документы. В течение времени состав элементов уточнялся и на текущий момент «Дублинское ядро» состоит из двух наборов элементов – базового и расширенного. В базовый набор входит 15 элементов, а расширенный предлагает способы и варианты их сочетания для получения новых элементов.

Для конкретизации специфики работы с метаданными документов на основании требований ИСО 15489-1:2001 «Информация и документация. Управление документами. Часть 1: Общие требования» (ISO 15489-1:2001. Information and documentation – Records management – Part 1: General) была осуществлена разработка двух стандартов, на сегодняшний момент представленных в новых версиях ИСО 23081-1:2017 «Информация и документация. Процессы управления документами. Метаданные документов. Часть 1: Принципы» (ISO 23081-1:2017. Information and documentation – Records management processes – Metadata for records – Part 1: Principles) и ИСО 23081-2 «Информация и документация. Метаданные для управления документами. Часть 2: Концептуальные вопросы и вопросы реализации» (ISO 23081-2. Information and documentation – Metadata for managing records – Part 2: Conceptual and implementation issues). Первый, как следует из названия, определяет общие принципы работы с метаданными документов, рассматривая их назначение в информационном обеспечении управления документами, аспекты управления самими метаданными. ИСО 23081-2 подробно рассматривает и систематизирует метаданные документов с точки зрения классификации их на идентифицирующие, описательные метаданные, метаданные для использования, метаданные плановых и исполненных событий и связей, но при этом не представляет детального состава элементов метаданных. Также серия поддерживается техническим отчетом ИСО/ТО 23081-3:2011 «Информация и документация. Управление метаданными для документов. Часть 3: Метод самооценки» (ISO/TR 23081-3:2011. Information and documentation. Managing metadata for records. Part 3: Self-assessment method) и методическими рекомендациями «Разработка схемы метаданных – как начать» [1]. Указанные рекомендации рассматривают разработку нескольких способов регламентации метаданных, таких как стандарты на метаданные, наборы метаданных, профили приложений, схемы расшифровки.

Более детальные нормы и рекомендации в отношении работы с метаданными документов содержатся в отдельных документах, в основе которых лежат «Дублинское ядро» и стандарты серии ISO 23081.

Национальные архивы Австралии разработали «Стандарт делопроизводственных метаданных австралийского правительства» [2], который, в свою очередь, стал основой для совместного стандарта Австралии и Новой Зеландии «Эталонный набор свойств делопроизводственных метаданных» (AS/NZS 5478:2015. Recordkeeping metadata property reference set), направленного на применение в любых организациях [3]. Первая его версия увидела свет в 1999 году, все последующие редакции учитывают изменения в составе данных, возникшие в течение времени. Стандарт применим как для электронных документов, так и для «традиционной “бумажной” или гибридной среды управления документами». В первоначальной редакции стандарта группы элементов метаданных назывались «элементами», а относящиеся к ним конкретные наименьшие информационные единицы – «подэлементами». В дальнейшем такой подход претерпел терминологические изменения, и «элементы» превратились в «свойства», а «подэлементы» – в «подсвойства».

Сущностями (объектами описания) выступают документы, агенты, бизнес-функции, источники требований к управлению документами и связи между ними, что соответствует стандарту ИСО 15489 (в Австралии – AS ISO 15489.1:2017). Часть «свойств», определенных в стандарте, одинаково применима к каждой из них, остальные отображают специфику описания только одной из сущностей. Требования к обязательности наличия метаданных определяются на трех уровнях – обязательные (mandatory), обязательные при условии (conditional) и необязательные (optional).

Для представления наиболее полного описания каждого свойства и подсвойства используется форма, приведенная на рисунке 1.

 

Рисунок 1. Пример описания элемента метаданных (свойства) из Стандарта делопроизводственных метаданных австралийского правительства (Австралия)

 

Такое подробное описание позволяет отобразить как нормативную, так и справочную информацию, привести примеры и объяснить назначение каждого элемента метаданных. Всего в стандарте описано 26 классов элементов метаданных, некоторые из них разделяются на дополнительные элементы и служат для группировки информации.

Для обеспечения внедрения стандарта на метаданные Национальными архивами Австралии были изданы Рекомендации по внедрению стандарта делопроизводственных метаданных австралийского правительства (далее – Рекомендации) [4], в которых определяется методология внедрения, включающая в себя:

определение объектов, сущностей, которые подлежат описанию (в основном Рекомендации связывают описание с функционалом информационных систем; так, проработанными могут быть элементы метаданных только для документа, либо для документа и выбранных объектов (сущностей), либо для всех рассматриваемых объектов (сущностей) одновременно);

краткую характеристику формы внедрения – использование технологий, поддерживающих XML-схемы;

указание на возможность использования автоматизации с целью формирования некоторых из метаданных документов;

указание на необходимость создания связей (маппирования) между метаданными в разных версиях схем, между метаданными, основанными на разных стандартах и др.

Рекомендации представляют несколько методов проверки полноты и качества метаданных – составление проверочной таблицы для каждого существующего элемента метаданных и определение степени соответствия Стандарту делопроизводственных метаданных австралийского правительства, а также причины несоответствия (при наличии).

С точки зрения документирования работы с метаданными вся информация о них, по мнению разработчиков, должна содержаться в технической эксплуатационной документации на информационные системы.

В целом можно сказать, что Рекомендации дают исчерпывающие ответы на вопросы о том, что требуется специалисту по управлению документами или поставщику информационной системы для внедрения установленной схемы метаданных в пределах органа власти.

Также Национальные архивы Австралии и Архивы Новой Зеландии в дополнение к указанным документам, вероятно, по причине ограниченной сферы распространения одного из них (правительственный стандарт) и возмездности другого (AS/NSZ), также определили минимальные наборы метаданных.

Национальные архивы Австралии в минимальном наборе [5] выделяют метаданные только для документов, к которым относятся идентификатор, автор, дата создания, наименование, отметка об ограничении доступа, ссылка на срок хранения, формат, права, хэш-сумма. Для каждого из них требования определяют имя, источник, назначение, возможные значения, связанные подсвойства и примеры (рис. 2).

 

Рисунок 2. Пример описания элемента данных минимального набора метаданных (Австралия)

 

Архивы Новой Зеландии в Требованиях к метаданным [6] определили несколько иной минимальный набор данных для информации и документов – идентификатор, наименование, дату создания, связь с бизнес-процессом, автора (систему или человека), название и версию программного обеспечения, использованного для создания, метаданные о действиях, произошедших после включения документа в систему (характер действия, участник, дата). Определение остальных данных предлагается сделать организациям самостоятельно с учетом «обеспечения полноты и точности документа, полноценной контекстной доказательности, способности подтверждения аутентичности».

Наиболее детальным примером стандартизации метаданных для документов является Стандарт делопроизводственных метаданных для специального административного региона Гонконг [7], разработанный Правительственной службой управления документами Гонконга в 2012 году и претерпевший изменения в 2016 году. В нем представлено подробное описание сущностей, метаданных и элементов метаданных как с точки зрения лиц, не имеющих широкого представления об информационных технологиях, так и с точки зрения лиц, не имеющих представления о делопроизводстве. Стандарт не проводит различия между документами на бумажном носителе и электронными документами с точки зрения метаданных.

Для высокоуровневого разделения требований к обязательности метаданных разработчики предусмотрели четыре профиля приложений (application profiles):

1) профиль системы электронного документооборота, в которой происходят создание, регистрация, управление и хранение документов;

2) профиль для передачи документов из любой другой системы в систему электронного документооборота;

3) профиль передачи документов между агентствами;

4) профиль передачи в Правительственную службу управления документами Гонконга для обеспечения их архивного хранения.

С целью обеспечения соответствия разработчики разделяют требования к сущностям и элементам метаданных для каждого профиля, указывая степень их необходимости – обязательные (mandatory), обязательные при условии (conditional mandatory), рекомендуемые (recommended), возможные (optional).

В рамках рассматриваемых сущностей гонконгский стандарт выделяет следующие:

1) схема классификации документов – иерархическая схема организации классов, подклассов, дел, классификационных групп, томов и документов;

2) класс – совокупность связанных подклассов;

3) подкласс – группа связанных подклассов или дел;

4) дело – группа связанных документов;

5) классификационная группа – возможное подразделение папок, используемое преимущественно в кейс-менеджменте;

6) том – подразделение дел или классификационных групп, используемых для разделения крупных дел или классификационных групп на более малые управляемы единицы;

7) документ – правительственный документ, который может существовать в любом физическом формате и на любом носителе, полученный в процессе деловой деятельности федеральной службы и сохраняемый как доказательство политик, решений, процедур, функций, деятельности и транзакций;

8) компонент – отдельная битовая строка, которая самостоятельно или с другими битовыми строками составляет документ;

9) правило хранения – правило, которое предотвращает выполнение действий по передаче и/или уничтожению документов;

10) срок хранения – правило, определяющее продолжительность срока хранения документов и/или их агрегации и действие, которое должно быть применено по отношению к ним в конце этого срока;

11) история событий – сущность, используемая для документирования событий в журнале аудита;

12) триггер события – сущность, используемая для записи всего события, которое задает точку отсчета до даты, в которую должно совершиться одно из предполагаемых действий (передача или уничтожение);

13) мандат – правило, требование или политика, которые лежат в основе правила хранения;

14) разделение – сущность, используемая для записи факта того, что класс, подкласс, папка, подпапка или их часть были уничтожены или переданы;

15) пользователь – лицо, которое использует систему электронного документооборота;

16) группа – совокупность пользователей, которая может включать пользователей с одинаковыми или разными ролями.

Для каждой из выделенных сущностей в отдельном приложении приведен набор элементов метаданных (всего их около 80), а в другом – дано разъяснение для каждого из них (рис. 3).

 

Рисунок 3. Пример описания элемента метаданных из стандарта (Гонконг)

 

Гонконгский стандарт на метаданные согласуется с Функциональными требованиями к системе электронного документооборота (далее – Функциональные требования) [8], в стандарте приведено специальное положение, определяющее соответствие Функциональных требований и стандарта со ссылками и цитатами конкретных положений.

Процесс внедрения стандарта описан в Методических рекомендациях по внедрению Стандарта делопроизводственных метаданных для специального административного региона Гонконг [9]. Они включают в себя описание нескольких стадий внедрения:

планирование с учетом методологии управления документами (завершающим этапом является разработка собственного стандарта в каждом органе власти);

выбор поставщика;

настройка системы, разработка технической документации на нее, при необходимости – разработка плана миграции данных из других систем;

тестирование системы и ввод ее в эксплуатацию.

В нормативном регулировании США аспект работы с метаданными документов нашел отражение в Универсальных требованиях к управлению документами (далее – Универсальные требования) [10], которые не содержат указаний на конкретный состав элементов метаданных, ограничиваясь общим направлением требований к определению метаданных в соответствии с ИСО 15489 и ISO 23081. При этом базовый набор элементов метаданных в почти неизменном виде стал основой для Рекомендаций по метаданным для передачи электронных документов постоянного срока хранения (2015) [11], разработанных Национальным управлением документами и архивами США (The U.S. National Archives and Records Administration – NARA). Данные рекомендации распространяются на федеральные органы власти, документы которых в дальнейшем окажутся в национальном архивном фонде. Сущностями (объектами) описания являются дела (files) и документы (item). Каждая из них, в соответствии с «Дублинским ядром» должна описываться минимальным набором данных, состоящих из идентификатора, названия, описания, автора, даты создания, прав и, по возможности, охвата и связей. С точки зрения иных дополнительных метаданных, которые образуются вместе с электронными документами в процессах документооборота, NARA считает возможным прием таких метаданных с предварительным уведомлением и предоставлением необходимой информации и инструментов (схем, словарей данных) в момент передачи документов на постоянное хранение. Установленный минимальный набор метаданных может использоваться и для оцифрованных копий документов на традиционных носителях [12].

Также следует отметить, что Универсальные требования разделяются на аспекты (program), подлежащие локальному нормативному регулированию в политиках и процедурах, и требования к информационным системам (system). Тем не менее конкретных инструментов или способов внедрения в них не предлагается.

Словарь метаданных в российском стандарте (пример описания см. рис. 4) содержит описания для элементов метаданных таких объектов (сущностей), как документ, организационные документы, процессы, участники (агенты). Описание включает сведения, позволяющие классифицировать метаданные в рамках схемы, определить необходимость их наличия в зависимости от условий (процесса документирования, вида документа, носителя и др.), представить их назначение и источник появления, установить связи между ними.

В стандарте перечислены основные направления применения схемы и словаря, однако не раскрыты способы их реализации. Так как применение словаря и внедрение требований, определяемых в отечественном стандарте, играют немаловажную роль в развитии электронного документооборота, в совершенствовании информационных систем в организациях (систем электронного документооборота, систем хранения электронных документов) и на государственном уровне (информационные системы государственных и муниципальных архивов), то выработка понятной и доступной методики является необходимой работой по его внедрению.

Рассмотренные в статье примеры регулирования довольно узкого аспекта управления документами демонстрируют многообразие подходов разработчиков не только к описанию, но и к процессам внедрения, которые можно учесть при разработке методических рекомендаций по применению разработанного российского стандарта.

×

作者简介

Anna Borozdina

All-Russian Scientific and Research Institute for Records and Archives Management

编辑信件的主要联系方式.
Email: borozdina@vniidad.ru
SPIN 代码: 8099-6732

Acting Head of the Document Science Department

俄罗斯联邦, Moscow

参考

  1. Building a metadata schema – where to start. International Organization for Standardization. 2007. URL: https://committee.iso.org/files/live/sites/tc46sc11/files/documents/N800R1%20Where%20to%20startadvice%20on%20creating%20a%20metadata%20schema.pdf (accessed: 25.01.2024).
  2. Australian Government Recordkeeping Metadata Standard. National Archives of Australia. 2015. URL: https://www.naa.gov.au/sites/default/files/2019-09/AGRkMS-Version-2.2-June-2015_tcm16-93990_1.pdf (accessed: 25.01.2024).
  3. Sherman S. An integrated approach information governance. Information and data manager. 2021. URL: https://idm.net.au/article/0013268-integrated-approach-information-governance (accessed: 25.01.2024).
  4. Australian Government Recordkeeping Metadata Standard Implementation Guidelines. National Archives of Australia. 2011. URL: https://www.naa.gov.au/sites/default/files/2019-09/agrkms-implementation-guidelines_tcm16-93992_0.doc (accessed: 25.01.2024).
  5. Minimum metadata set. National Archives of Australia. URL: https://www.naa.gov.au/information-management/information-management-standards/australian-government-recordkeeping-metadata-standard/minimum-metadata-set (accessed: 25.01.2024).
  6. Requirements for metadata. Archives New Zealand. 2022. URL: https://www.archives.govt.nz/manage-information/how-to-manage-your-information/implementation/metadata/requirements-for-metadata (accessed: 25.01.2024).
  7. Recordkeeping Metadata Standard for the Government of the Hong Kong Special Administrative Region. Government records service. 2016. URL: https://www.grs.gov.hk/pdf/RKMS(v1.1)(Eng_only).pdf (accessed: 25.01.2024).
  8. Functional Requirements of an Electronic Recordkeeping System. Government records service. 2020. https://www.grs.gov.hk/pdf/ERKS_Functional_Requirements(2020-11)(Eng_only).pdf (accessed: 25.01.2024).
  9. Recordkeeping Metadata Standard for the Government of the Hong Kong Special Administrative Region: Implementation Guidelines. Government records service. 2016. https://www.grs.gov.hk/pdf/Implementation_Guidelines_of_RKMS(2016-09)(Eng_only).pdf (accessed: 25.01.2024).
  10. Universal Electronic Records Management (ERM) Requirements. The U.S. National Archives and Records Administration. 2023. https://www.archives.gov/files/records-mgmt/policy/nara-universal-erm-requirements-version3.xlsx (accessed: 25.01.2024).
  11. Metadata Guidance for the Transfer of Permanent Electronic Records. The U.S. National Archives and Records Administration. 2015. URL: https://www.archives.gov/records-mgmt/bulletins/2015/2015-04.html (accessed: 25.01.2024).
  12. Format Guidance for the Transfer of Permanent Electronic Records. The U.S. National Archives and Records Administration. 2014. URL: https://www.archives.gov/records-mgmt/bulletins/2014/2014-04.html (accessed: 25.01.2024).

补充文件

附件文件
动作
1. JATS XML
2. Figure 1. Example of a metadata element (property) description from the Australian Government (Australia) Clerical Metadata Standard

下载 (732KB)
3. Figure 2. Example of a data element description for a minimum metadata set (Australia)

下载 (429KB)
4. Figure 3. Example of a metadata element description from a standard (Hong Kong)

下载 (634KB)

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».