In progress

 

Обеспечение жизненного цикла информационных ресурсов и потоков работ в электронных библиотеках. Прикладные модули Интегрированной Системы Информационных Ресурсов РАН.

 

А. С. Лопатенко, ЦНТК РАН, (andreyl@ccas.ru)

Аннотация

В работе дан обзор современных средств обеспечения жизненного цикла информационных ресурсов которые применятся, либо применимы для прикладных областей электронных библиотек и научных информационных систем. Показаны основные требования к таковым системам в целом и в некоторых прикладных областях в частности. Описаны стандарты и разработки жизненных циклов конкретных типов ресурсов и стандарты для описания жизненных циклов. Освещены недостатки и преимущества этих стандартов. Предложена общая минимальная модель обеспечения жизненного цикла. Описаны применения авторами таковых средств для модулей Интегрированной Системы Информационных Ресурсов РАН (Системы Управления Документами Ученого Секретаря ИСИР РАН, системы управления инновационными разработками РФФИ, системы поддержки рабочих групп). Показано насколько близки и в чем отличаются модели жизненного цикла ресурсов необходимые для электронных библиотек от моделей workflow (потоков работ) и document management(управления документами).

Введение

Одним из важных аспектов деятельности информационных систем является обеспечение жизненного цикла информационных ресурсов. В большинстве систем информационные ресурсы не представляют собой застывших необрабатываемых объектов. Над ними исполняются операции, которые могут менять их состояния, значения их параметров, создавать новые ресурсы, передавать их для исполнения работ другим пользователям и в другие системы. У ресурсов есть определенный жизненный цикл.

Важность поддержки жизненного цикла ресурсах для приложений электронных библиотек показана в работах [[1], [2], [3], [4], [5], [6], [7] ]. Этот опыт работы обобщен и описан в статье.

Работы исполненные авторами и анализ ряда работ в этой области показали, что несмотря на различия всевозможных систем и методов работы с ресурсами существуют ряд общих черт, свойственных всех этих системами. Опыт показал, что выделения этих черт, их автоматизация и использование при разработке информационных систем позволят значительно упростить разработку систем, сделать ее более быстрой, избежать ошибок.

С нашей точки зрения механизмы обеспечения жизненного цикла в первую очередь необходимы

*      для поддержания необходимой функциональности системы, связанной с использованием ресурсов пользователями, их изменением, генерацией новых ресурсов, клаузальными и временными связями между ресурсами

*      для точного понимания смысла информационных ресурсов, связанного с их текущим состоянием и факторами обусловившими это состояние

*      для обеспечения корректности и целостности информационного пространства, связанного с жизненными циклами ресурсов

*      для направления хода работ по обработке информационных ресурсов, указания возможных или необходимых дальнейших действия пользователю системы

*      для координации работы пользователей или информационных систем

*      для мониторинга текущего состояния работ над информационными ресурсами

На данный момент не найдено разработки, модели или стандарта, позволяющего объять одновременно все виды деятельности, приведенные выше, поэтому в докладе приведен обзор ведущих стандартов и разработок , объемлющих какие-либо из этих видов деятельности. Также показано какие требования накладывают на эти виды деятельности разработки авторов (модули ИСИР: Системы Управления Документами Научно-Административным Документооборотом(СУНАД), системы управления инновационными разработками РФФИ (СУИР), системы поддержки рабочих групп (СПРГ) ). В докладе сформулирована общая минимальная модель, приводится ее описание в нотации UML и показаны примеры ее применения в вышеупомянутых разработках авторов.

При разработке минимальной модели на основе анализа нижеприведенных моделей, стандартов и разработок авторов было решено уделить в первую очередь следующим модулям

*      Описание жизненного цикла информационного ресурса для понимания его связей с другими ресурсами, значения данного ресурса и для представления истории данного ресурса по запросу пользователя

*      Описание метаинформации о жизненном цикле, необходимом или возможном порядке исполнения операция над ресурсам для направления хода работ пользователей по обработке данного ресурса

*      Описание матриц соответствия состояния ресурса и операция выполнимых над ним, а также матриц состояние ресурса, операции над ним и участвующие в этих операциях метаданные ресурса

*      Мониторинг продвижения ресурсов по их жизненным циклам, мониторинг исполнения хода работ в целом

Практическое обоснование выбора этих моделей дано в работе.

Приводится краткое описание

1 Модели ABC[14,15] проекта Harmony[[8]]

Цели модели:

*      Формально определить сущности и отношения для словарей метаданных

*      Описать их и их взаимоотношения в простой логической модели

*      Создать архитектуру для расширения семантики на словари метаданных в новых прикладных областях

Для удовлетворение этих требований модель имеет возможности описания жизненных циклов ресурсов и для описания того как эти циклы влияют на метаописания ресурсов в их конкретных состояниях (на схемы метаданных). Формулируется минимальный словарь типов ресурсов для описания циклов, состоящий из ресурса, события, агента, описания контекста события. Эта модель не имеет возможностей описания метаинформации о жизненных циклах (их свойств, правил целостности), а может описывать только конкретные произошедшие циклы. В работе предлагается небольшое усовершенствование модели позволяющее описывать каковым должен быть цикл.

2 Моделей Object Management Group UML State Chart & UML Collaboration & UML Activity

Эти модели служат для описания жизненного цикла ресурса (в UML объекта или экземпляра класса), взаимодействия с другими ресурсами, общих потоков информации. Описывается метаинформация о жизненных циклах. В работе показывается как они могут быть применены для описания циклов информационных ресурсов в электронных библиотеках.

3 Модель Workflow Management Coalition [[9], [10], [11], [12]]

Модель, созданная AIIM (he Association for Information and Image

Management) предназначена исключительно для описания потоков работ. Описывает исполнения хода работ в таких терминах как процесс, деятельность, участник хода работ, список единиц работы, постусловия, предусловия, условия исполнения деятельности. В рамках этой модели возможно описать как метаинформацию о жизненных циклах, так и сами жизненные циклы.

FRBR (Functional Requirement for Bibliographic Records) (IFLA Study Group on the Functional Requirement for Bibliographic Records)[[13]]

Этот набор требований не представляет собой общую модель, но послужил источником для анализа требований выдвигаемых к системам обеспечения жизненного цикла. Данная работа представляет собой точную формулировку, что такое электронная реализация библиотеки, какие сервисы одна должна предоставлять каким категориям пользователей и какие потоки работ и жизненные циклы обеспечивать. Именно эта работа вкупе с разработками авторов, а также анализом работ стандартов Digital Rights послужили основой для создания модели ограничения сервисов применимых к ресурсу, ограничений на множество его метаданных участвующих в различных операциях в зависимости от стадии жизненного цикла.

Модели Digital Rights стандартов и извлеченная из них информация о жизненных циклах соотвествующих ресурсов.

Проанализированы стандарты XrML (Extensible rights Markup Language) и DPRL (Digital Property Rights Language)

Анализ позволил составить с точки зрения Digital Rights основные требования модели ограничения сервисов применимых к ресурсу, ограничений на множество его метаданных участвующих в различных операциях в зависимости от стадии жизненного цикла.

Опыт реализации жизненных циклов и потоков работ из [1-6]

Проводятся сравнительные характеристики моделей и минимальная модель необходимая для описания жизненных циклов ресурсов в электронных библиотеках. Показано как эта модель может быть применима для координации работ пользователей различных информационных систем.

Освещены проблемы интероперабельности информации о жизненных циклов ресурсов и показано как эти проблемы можно решать на основе открытых стандартов.

В рамках усилий проекта Harmony на Workshop было показано, что понимание и формальное описание жизненного цикла метаданных необходимо для создания схем трансформации между различными словарями метаданных.

Большая часть метаданных описывающих ресурс являются производными от его обработки во время его жизненного цикла. Поэтому механизмы жизненного цикла могут быть конструкторами описания ресурса.

Жизненный цикл тесно связан с интероперабельностью информационных ресурсов. Различные стадии цикла жизни ресурса могут происходить в различных информационных системах.

Интероперабельность документарных репозиториев

Требования OMG

*      Стандартизация спецификаций интерфейса, которые обеспечат доступ к функциональности неоднородных распределенных документарных репозиториев.

*      DRI интерфейс должен обслуживать различные документарные модели (WebDAV, DMA, файловая система)

*      Использовать OMG MOF в качестве архитектуры для мета-уровневой интеграции неоднородных репозиториев

*      Использовать XMI для обмена метаданными

CORBA Document Repository RFP требования

Идентификация Identification

Запрос Retrieval

Хранение Storage

Интегрированность Integrity

Безопасность Security

Мониторинг Tracking

Ревизия Revisions

Поставки в форматы Rendition

Запросы Query

Предоставление данных Delivery

Уведомление Notification

Миграция Migration

Архивы Archival

Резервное хранение Backup

Необходимость описывать жизненные циклы

Распределенность

Коректность

 

Описание информации и метаинформации о жизненных циклах ресурсах

Имеется несколько моделей описания жизненного цикла. Рассмотрим наиболее известные и используемые из них

UML State Chart & UML Collaboration

WfMC модель

ABC Harmony

Цели ABC модели [[14], [15]]развиваемой в рамках проекта гармония

*      Формально определить сущности и отношения для словарей метаданных

*      Описать их и их взаимоотношения в простой логической модели

*      Создать архитектуру для расширения семантики на словари метаданных в новых прикладных областях

Рабочая группа пришла к выводу, что невозможно решение перечисленных выше задач без формального описания жизненного цикла ресурсов и модель ABC поддерживает UML модель для создания описаний таковых жизненных циклов.

Модель ABC описывает цикл ресурсов посредством событий, имеющих входные, выходные, влияющие ресурсы, агентов, контекста события (место и время).

Модель ABC описывает сущности следующих типов: событие, актер, ресурс, контекст.

Ресурсы могут быть следующих типов Concept, Expression, Manifestation (подтип Item),

События имеют подтип Act. Модель предлагаемая рабочей группы ABC следующая:

ABC модель, как она специфицирована рабочей группой Harmony может описывать только экземпляры прошедших жизненных циклов, она не предназначена для описания метаинформации о жизненных циклах ресурсов.

FRBR

В рамках этого проекта описывается модель жизненный цикла библиографических ресурсов. Кроме того формализована модель исполнения основных задач пользователя библиографических ресурсов поиск, идентификация, выбор, доступ. На уровне модели данных создана матрица описывающая доступность и использование атрибутов ресурсов в зависимости от операции пользователя стадии жизненного цикла ресурса.

Важно заметить, что для библиографических ресурсов в модели RFBR жизненный цикл не является четким классическим жизненным циклом в его классическом понимании. Типы ресурсов в этой модели и связи мы считаем жизненным циклом так как эти типы и связи отражают клаузальные и временные отношения между ресурсами или их проявлениями.

Модель предлагает описание жизненного цикла библиоресурсов, который состоит из Work, Expression, Manifestation, Item.

Общая математическая модель делится на следующие модули

  1. Описание жизненного цикла ресурса в виде упорядоченного множества состояний через которые он может пройти.
  2. Матрицы, описывающей множество атрибутов для каждого типа
  3. Матрицы, описывающей множество возможных связей с другими ресурсами для каждого типа
  4. Матрицы, описывающей множество возможных операций над ресурсом каждого типа
  5. Матрицы, описывающей использование атрибутов и связей в операциях над ресурсов
  6. Модели, описывающей степень охвата пространства ресурсов при операциях (в первую очередь поиска).

Digital Rights модели

Datawarehouse модели



[1] G. Sayeed Choudhury Tim DiLauro, Michael Droettboom Ichiro Fujinaga Karl MacMillan, Strike Up the Score Deriving Searchable and Playable Digital Formats from Sheet Music, D-Lib Magazine, Feb 2001 (http://www.dlib.org/dlib/february01/choudhury/02choudhury.html)

[2] Carol Ann Hughesб Lessons Learned Digitization of Special Collections at The University of Iowa Libraries, D-Lib Magazine June 2000, (http://www.dlib.org/dlib/june00/hughes/06hughes.html)

[3] Paul Conway, Yale University Library's Project Open Book Preliminary Research Findings, D-Lib Magazine, Feb 1996 (http://www.dlib.org/dlib/february96/yale/02conway.html)

[4] Edward A. Fox, John L. Eaton, Gail McMillan, Neill A. Kipp, Laura Weiss, Emilio Arce, and Scott Guyer, National Digital Library of Theses and Dissertations

A Scalable and Sustainable Approach to Unlock University Resources, D-Lib Magazine Sep 1996 (http://www.dlib.org/dlib/september96/theses/09fox.html)

[5] Diane Nester Kresh, Offering High Quality Reference Service on the Web, D-Lib Magazine June 2000, (http://www.dlib.org/dlib/june00/kresh/06kresh.html)

The Collaborative Digital Reference Service (CDRS)

[6] М. В. Кулагин, А. С. Лопатенко Интеграция электронных библиотек с система управления документами, как задача, решаемая Системой обмена информации между объектно-ориентированными информационными системами , "Электронные библиотеки: перспективные методы и технологии, электронные коллекции" -2000

[7] М. В. Кулагин , А. С. Лопатенко Интеграция системы научно-административного документооборота ученых секретарей РАН с цифровыми библиотеками Интегрированной Системы Информационных Ресурсов РАН, Открытое общество, 2000

[8] Harmony projects web page (http://metadata.net/harmony/)

[9] WFMC group web-server (http://www.aiim.org/wfmc)

[10] WFMC Reference model (http://www.aiim.org/wfmc/standards/docs/tc003v11.pdf)

[11] WFMC Terminology and Glossary (http://www.aiim.org/wfmc/standards/docs/glossy3.pdf)

[12] WFMC. Workflow standards and Associated Documents (http://www.aiim.org/wfmc/standards/docs/Stds_diagram.pdf)

[13] Functional Requirements for Bibliographic Records : final report / recommended by the IFLA Study Group on the Functional Requirements for Bibliographic

Records ; International Federation of Library Associations and Institutions, IFLA Universal Bibliographic Control and International MARC Programme. - Frankfurt

Am Main : IFLA UBCIM, 1997 (http://www.ifla.org/VII/s13/frbr/frbr.pdf)

[14] ABC A Logical Model for Metadata Interoperability - Workshop Notes (http://metadata.net/harmony/workshop_notes.html)

[15] C.Lagoze, J. Hunter, D. Brickley, "An Event-Aware Model for Metadata Interoperability" , ECDL 2000, Lisbon, September 2000 (http://archive.dstc.edu.au/RDU/staff/jane-hunter/harmony/harmony_ECDL2000.zip)

Сайт создан в системе uCoz