Драчков А.В. (г.Москва), Загребаева В.Н. (г.Москва), Савина Г.А. (г.Москва)
Проблема интеграции информационных ресурсов: опыт Архива Российской академии наук
@kizhi
Проблема интеграции информационных ресурсов учреждений культуры стала особенно актуальной в последнее время в связи с массовым созданием электронных библиотек, появлением масштабных международных проектов совместного строительства универсальных и тематических электронных каталогов, попытками формировать единое информационное пространство на корпоративном, ведомственном, национальном и международном уровнях.
Архив Российской академии наук готов поделиться своим скромным опытом и своим видением путей решения этой проблемы, как в глобальном, так и в узком смысле понятия интеграции.
С 2004 г. Архив РАН (АРАН) ведет целенаправленную работу по применению информационных технологий в освоении источниковой базы своего документального собрания. С 2007 г. можно говорить о создании в Архиве многофункциональной Информационной системы (ИСАРАН), которая на текущий момент включает в себя восемь взаимосвязанных баз данных и функциональных программных блоков.
Центральную роль в решении задач интеграции ресурсов играет программное ядро ИСАРАН и база данных «Учет и каталог». В ядре ИСАРАН изначально была заложена возможность создания централизованного хранилища интегрированных метаданных корпоративных информационных ресурсов с возможностью общего и раздельного поиска, фильтрации данных, составления общей для всей системы архивов РАН учетно–отчетной документации (объединенный паспорт, списки фондов, реестры описей, путеводители) и общего электронного каталога по широкому спектру тематики документальных собраний архивов – участников интегрированного ресурса.
В 2009 г. в Архиве РАН была создана web–версия ИСАРАН в двух вариантах: внутреннем (для служебного использования) и внешнем (для широкого представления в Сети). В конце этого же года было зарегистрировано в Роспатенте ядро программного комплекса «Учет и каталог» с целью дальнейшего бесплатного распространения этого ПО в системе академических архивов (по сценарию создания общей БД с распределенным хранением документов и централизованным хранением метаданных). [текст с сайта музея-заповедника "Кижи": http://kizhi.karelia.ru]
С появлением в Архиве РАН выделенного канала оптоволоконной связи, активизировалось участие в общеакадемическом проекте «Электронная библиотека «Научное наследие России»», который представляет собой попытку создания интегрированной системы для разных информационных объектов учреждений памяти Российской академии наук. Была начата совместная работа Архива РАН и Отдела систем математического обеспечения Вычислительного центра РАН по теме «Разработка концепции взаимодействия и обмена метаданными Информационной системы Архива РАН (ИСАРАН) с единым научным пространством (ЕНИП) РАН, в рамках которого окончательно должен быть выработан протокол обмена данными.
К концу 2010 г. тестовая версия ИСАРАН–web (для служебного пользования) уже показала свою жизнеспособность: успешно был осуществлен пилотный проект по конвертации данных учета и электронного каталога Коми научного центра Уральского отделения РАН в общую базу данных. Намерения работать с академическими архивистами в русле общей концепции, общих принципов и на базе единого программного обеспечения для строительства корпоративного информационного ресурса, представленного в Интернет для широкого пользователя, были закреплены в названиях двух корпоративных сайтов «Архивы РАН» (www.arran.ru) и Информационная система «Архивы РАН» (www.isaran.ru), последний из которых специально рассчитан на реализацию такого рода идеи.
В настоящее время сайт Информационной системы «Архивы РАН» (www.isaran.ru), работающий на CMS Drupal, представлен в Сети ресурсами, включающими базы данных с 4-х уровневым описанием: (фонд – опись – дело – документ), где два нижние уровня описания формируют общий электронный каталог с функцией поиска информации, редуцированной по условиям запроса.
Преимущества программного ядра «Учет и каталог», разработанного в Архиве РАН, заключаются, в первую очередь, в его простоте и экономичности. Система логична, ее внедрение не требует закупки дополнительного дорогостоящего оборудования, обязательного наличия в штате IT–специалистов, работы с классификаторами, серьезного администрирования и специального обучения персонала. Информационная система с электронным каталогом, работающая на данном ПО с 2005 г., присутствует в Сети в режиме on-line уже в течение трех с лишним лет (без технических перерывов на доработку или модернизацию).
В 2010 г. было принято решение выделить Информационную систему «Архивы РАН» «внешней» web–версии из структуры сайта www. arran. ru и перевести ее на самостоятельный сайт с доменным именем www. isaran. ru в связи с быстрым ростом контента и обособленностью задач сайтов. [текст с сайта музея-заповедника "Кижи": http://kizhi.karelia.ru]
Говоря об интеграции информационных ресурсов, нам кажется правильным разделить проблему на 2 части: а) программно–техническую и б) общую. В первом случае речь может идти о выработке общих концептуальных и технических стандартов, как в международном, так и в национальном информационном пространстве, о принципах описания объектов культуры и возможностях программно–технической реализации интеграции научно–справочного аппарата ресурсов родственных учреждений культуры. Во втором случае речь может идти о простом присутствии в информационном пространстве Сети ресурсов учреждений культуры в том или ином виде, и создании возможностей перехода к информационным ресурсам тематически близких массивов, начиная от простых ссылок и, заканчивая, точками доступа в корпоративные блоки.
Многолетний опыт международного сообщества институтов памяти в деле выработки общих концептуальных и технических стандартов обмена информацией имеет существенные позитивные примеры сотрудничества, которых удалось добиться зарубежным коллегам, и значительно более скромные результаты на национальном российском уровне.
На сегодня мировое архивное сообщество имеет 4 принятых Международным Советом Архивов (ICA) стандарта архивного описания и несколько зарекомендовавших свою жизнеспособность стандартов обмена описательной информацией и метаданными. Но следует констатировать, что эти стандарты не адаптированы к российской национальной архивной действительности (исключая общий концептуальный стандарт ISAD, совпадающий с принятой в российской традиции вертикалью архивного описания); в большинстве случаев они даже не переведены на русский язык, представители России не принимают участие в работе профильного комитета ICA.
Столь незначительные успехи международной стандартизации вообще и на российской почве, в частности, обусловлены не столько инертностью и консерватизмом сообщества архивистов, сколько повышенной категорией трудности архивного 4-уровневого описания, которое в разы сложнее описания библиографического или даже музейного.
Чем ниже уровень описания сверху вниз (фонд – опись – дело – документ), тем полнее и точнее представлен контент информационных систем. На сегодняшний день вполне репрезентативно выглядят результаты информатизации тех российских архивов, которым удается вести текущую работу на третьем уровне описания (дело). [текст с сайта музея-заповедника "Кижи": http://kizhi.karelia.ru]
В настоящее время для архивной отрасли в целом актуально говорить об интеграции электронных ресурсов на втором и третьем уровне описания, то есть об интеграции научно–справочного аппарата (НСА) архивов, что значительно бы облегчило жизнь пользователям – потребителям архивной информации.
Архив РАН относится к той категории российских архивов, которые по каким–то причинам или в силу определенных обстоятельств разработали свое ПО, создали информационные системы, и ищут способов интеграции результатов своего труда в информационное пространство. На сегодняшний день своим информационным резервом Архив РАН рассматривает академические архивы в количестве около 40, которым можно бесплатно предложить программное ядро «Учет и Каталог» Информационной системы ИСАРАН. В таком контексте реально иметь совместный научно–справочный аппарат архивов РАН в едином интерфейсе представления данных. Но это только один путь интеграции ресурсов.
Другой путь заключается не в объединении научно–справочного аппарата архивов в единое целое, а в создании точек доступа к информационным ресурсам родственных архивов, ссылок и иных переходов от ресурса к ресурсу в информационном пространстве. Оба пути правомерны и будут развиваться параллельно, потому что нереально привести весь НСА архивов к общему знаменателю, да и нецелесообразно концентрировать усилия только на этих попытках.
Логика работы в архивных учреждениях страны общая, поэтому процессы информатизации архивной отрасли схожи в архивах федеральных, региональных, муниципальных или отраслевых. Первоначальные мотивы формирования электронных каталогов, аккумулирующих архивные описания уровней «дело» и «документ» и оцифрованные образы самих документов у всех архивов сходны. Помимо целенаправленной работы по созданию тематических и целевых баз данных с оцифровкой документов, которая ведется по предварительному плану в рамках различных проектов, происходят спонтанные процессы оцифровки, продиктованные оперативной необходимостью. В Информационной системе ИСАРАН задача «вписать» плановую и стихийную оцифровку (с одновременным научным описанием на уровне дела или документа) в базы данных решается посредством двух программных модулей – «Тайпер» и «Каталог файлов». На повестке дня стоит создание модуля «Тайпер–web», который позволит архивам РАН, вовлеченным в совместную деятельность, работать с Информационной системой напрямую в режиме on-line (без администрирования со стороны Архива РАН).
Говоря об интеграции информационных ресурсов учреждений памяти в широком смысле, следует в первую очередь иметь ввиду сам факт присутствия этих информационных ресурсов в Сети. Современное состояние информатизации архивной отрасли пока не позволяет говорить о полноценной интеграции не только во Всемирной паутине, но и в Рунете. [текст с сайта музея-заповедника "Кижи": http://kizhi.karelia.ru]
Отслеживая статистику посещаемости сайтов «Архивы РАН» и «Информационная система «Архивы РАН»», знакомясь с «географией» и частотностью пользовательских запросов, мы пришли к выводу – сектор зарубежного интереса к сайту равен приблизительно 25% посетителей, сектор иногородних пользователей России равен примерно 50%. С одной стороны, информационный ресурс активно присутствует в международном информационном пространстве, С другой, основная его целевая аудитория остается на территории Российской Федерации. Выводы данного анализа учитываются при планировании перспектив развития ИСАРАН.
На данном этапе развития интеграционного процесса по представлению архивной документации пользователю нам представляется главным обязательное присутствие этих ресурсов в любом виде в глобальной сети Интернет. Огромное значение имеет полноценный и репрезентативный контент этих ресурсов, продуманная и удобная система поиска блоков корпоративной информации, открытость и некоммерческий подход в оказании Интернет–сообществу информационных услуг со стороны музеев, библиотек и архивов в пользовании научно–справочным аппаратом электронных средств информации.
Текст может отличаться от опубликованного в печатном издании, что обусловлено особенностями подготовки текстов для интернет-сайта.