Москин Б.Д. (г.Петрозаводск)
Компьютерный анализ родословных священников Олонецкой губернии на основе XML–технологии
@kizhi
В настоящее время широко применяются информационные технологии в гуманитарных науках. Обработка данных с помощью компьютерных программ и хранение информации в виде цифровых данных экономит ресурсы и упрощает более сложные процессы анализа. Историческая наука и, в частности, наука генеалогия не стали исключением. Генеалогические программы облегчают поиск родства, автоматизируют создание родословных деревьев и даже служат посредниками в накоплении общей родословной базы данных человечества. Развитие Internet и стандартов представления данных происходит быстрыми темпами, поэтому необходимыми становятся информационные системы, которые позволяют не только решать конкретные научные задачи, но и обеспечивать расширение базы данных, добавление новых типов запросов, обмен информацией с другими программами и публикацию данных в сети. Всплеск интереса к генеалогии [1] , наблюдающийся в последние годы, отнюдь не случаен и обусловлен сложными процессами в обществе, переосмыслением исторической науки в целом и многими другими обстоятельствами. Стали доступными ранее закрытые архивные материалы. Усилилось внимание ученых к роли личности и отдельных родов в историческом процессе. Все чаще генеалогию рассматривают не как вспомогательную, а как самостоятельную специальную историческую дисциплину. Генеалогические методы исследования все шире применяются в отечественной исторической науке, а факты, добытые генеалогической наукой, привлекаются для исследования проблем исторической демографии, исторической географии, изучения наследственности, воздействия на человека социальных и природных фактов и т.д. Растет также значение генеалогии в социальных исследованиях. В прошлом она ограничивалась в основном изучением дворянских родословных, а в современных работах наблюдается оживление интереса к происхождению недворянских родов: священнослужителей, крестьянства, пролетариата, купечества, чиновничества. Все это вызывает необходимость расширять генеалогические исследования.
Компьютерный анализ родословных на основе XML–технологии
В основе генеалогического исследования лежит составление родословия. Работа с родословными представляет собой выявление фактов жизни некоторой персоны, выяснение дат интересующих событий, восстановление пробелов в биографии, нахождение родственников, сравнение биографий нескольких персон, попытки определить общие закономерности у членов одного рода, определенного социального слоя или сословия. При увеличении количества обрабатываемого материала работа на компьютере становится очевидно более удобной, чем работа с бумажными материалами. Плюсы электронного представления родословных заключаются в быстром и эффективном поиске событий или персон, легкости копирования и переноса информации, а также ее обновлении, возможности размещения информации в Internet.
Компьютерное представление родословной – это набор записей о событиях из жизни персоны и записей о родственных связях с другими персонами. Записи о событиях из жизни не представляют собой сплошной текст, а организованы в генеалогическую структуру, задаваемую генеалогическим форматом. Вкупе сведения о каждой персоне из родословной составляют базу данных. Для хранения информации можно использовать реляционную базу данных (например, базу данных Access), но также для хранения и работы с генеалогической информацией используется XML–технология [2] .
XML [3] – это метаязык, на котором пишутся специализированные языки, описывающие данные определенной структуры, как, например, язык описания генеалогических данных. Для генеалогии и исторических наук, где основная часть исследований состоит в обработке текстов, применение XML–технологии дает больше преимуществ по сравнению с применением реляционных баз данных. Одно из преимуществ – это текстовое представление информации, которое интуитивно понятнее. Особенно это ощущается для источнико–ориентированного подхода исследования, когда стараются сохранить всю информацию от источника, даже если часть этой информации не пригодится для текущей работы. XML – это прогрессивный стандарт, удобный для публикации информации в Web, для успешного использования которого достаточно стандартного браузера, например Internet Explorer. XML–документ вместе с описываемой информацией содержит также и ее структуру. Если рассматривается текст, то его XML представление кроме данных может описывать организацию документа, посредством выделения предложений, абзацев или слов и дополнительную информацию об источнике текста, типе физического носителя и т.д. Для научных исследований важен тот факт, что, используя один и тот же XML–формат представления информации, возможен быстрый обмен данными между исследователями с помощью современных сетевых технологий. XML–документ не содержит никаких указаний на то, как описанные в нем данные должны отображаться. Способ отображения данных для различных устройств задается языком описания стилей XSLT [4] . Запросы на языке XSLT – это мощное средство для преобразования XML–данных, например, сразу в вид HTML–страницы. Существует множество областей применения XML, например MathML – язык математических формул, SVG – язык двумерной векторной графики, XHTML – переформулировка HTML в терминах XML.[текст с сайта музея-заповедника "Кижи": http://kizhi.karelia.ru]
GenXML [5] – это один из генеалогических XML форматов. Создатель GenXML, норвежский программист Кристиан Ове, сделал попытку выйти за пределы той информации, которая фигурирует в традиционном формате представления генеалогических данных GEDCOM [6] и его XML аналоге GEDCOM XML [7] . По словам автора, GenXML более приспособлен к исследовательским целям, а также лучше отражает неполные или приблизительные сведения, которые часто фигурируют в генеалогических источниках. Кроме того, представление данных в GenXML более детализировано. Формат GenXML основан на Gentech Genealogical Data Model [8] (Модели описания генеалогической данных Gentech, составленной подразделением Национального Генеалогического Общества США). Стоит отметить существование других генеалогических XML–форматов: GedML, XGenML, gdmxml, GeniML, FamilyML.
Компьютерный анализ родословных на примере информационной системы по родословным священников Олонецкой губернии
Примером анализа родословных на основе XML–технологии может служить информационная система по родословным священников Олонецкой губернии. Генеалогическая информация для системы взята из записей бесед с информаторами и архивных материалов. Сбор сведений о священнических семьях, быте, культуре священнического сословия Олонецкой губернии в музее «Кижи» проводились Р.Б.Калашниковой. Исследование началось с восстановления биографий кижских священников А.С.Петухова и М.А.Русанова [9] , продолжилось на заонежском материале (А.Светлов, с.Типиницы; П.Логиневский, с.Яндомозеро; Н.Петропавловский [10] , д.Леликово; В.Ржановский, с.Сенная Губа; В.Соловьев и Велеславовы из с.Толвуя). Затем началось знакомство с документальными источниками всей Олонецкой губернии (семья Казанских из Каргополья, св. И.Ивановский из Каргополя; св. И.Георгиевский и П.Глазачев из Пудожа; Плотниковы [11] из Лижмы; Ладвинские из Падан и Шокши; Романовы из Кижей; Вишневские из Шуньги; Звероловлевы с Шустручья и др.). Отправной точкой в изучении той или иной священнической семьи служили либо знакомство с потомками священника, либо наличие рукописи священника, хранящейся в архиве Русского географического общества (РГО) в Санкт–Петербурге или напечатанной в газете «Олонецкие губернские ведомости». После чтения многостраничной рукописи или детально выверенной этнографической статьи возникала потребность узнать как можно больше об авторе. Следующий этап исследования – экспедиционный, во время которого по возможности проводилась попытка побывать в церкви (или на месте церкви), где служил священник, собрать хотя бы единичные свидетельства прихожан.
Информационная система по родословным священников Олонецкой губернии состоит из HTML страниц, XML файлов и XSLT преобразований к ним. В XML файлах в формате GenXML 2.0 содержится генеалогическая информация по священникам, родившихся в середине XIX в. в Олонецкой губернии. Генеалогическая информация о каждом священнике содержится в отдельном XML файле и представляет собой записи о самом священнике, его родственниках и ссылки между записями. Запись о конкретной персоне из родословной содержит даты рождения и смерти, места обучения, места работы – приходы и должности, заключенные браки, имена детей, а так же специфическую информацию: такую, как награды и наказания, публикации и даты посвящения в сан. На данный момент информационная система насчитывает девять родословных, существует также текстовой материал на столько же родословных. Каждая родословная содержит информацию о 15–50 персонах. Различные запросы, реализованные в системе, осуществляют вывод событий жизни любой персоны из рассматриваемой родословной, текстового родословного дерева, событий из жизни всех персон из родословной за некоторый задаваемый промежуток времени, список учебных заведений и должностей священнослужителей. В каждый момент времени информационная система предоставляет возможность работы с одной родословной и выводит результат обработки одного запроса. Число запросов может быть легко увеличено как и число обрабатываемых родословных. В перспективе, при достаточном количестве фактического материала, информационная система может наглядно и статистически доказывать различные теоретические предположения, например, о замкнутости священнического сословия.
Кратко рассмотрим типы запросов в информационной системе. Запрос «Общее дерево» (см. рис.1) выводит всех потомков одного человека: максимально возможного предка по мужской линии рассматриваемого священника (отца или деда (по отцу) или прадеда и т.д.). Синим цветом выделяется имя рассматриваемого священника. Задача этого запроса показать общий вид родословной. Общее дерево содержит только потомков основателя рода. В общее дерево не попадают некоторые персоны, например отец или мать жены священника, отцы или матери жен сыновей священника. Для просмотра родословного дерева отсутствующей персоны необходимо воспользоваться запросом «Деревья (всех)».[текст с сайта музея-заповедника "Кижи": http://kizhi.karelia.ru]
В запросе «Деревья (всех)» выводятся текстовые родословные деревья для каждой персоны из родословной. Текстовое родословное дерево представляет из себя построковое перечисление предков и потомков некоторой персоны. Предки перечисляются только по мужской линии. Каждая строка заключается в скобки с порядковым числом – глубиной родства (1 – дети, 2 – внуки, –1 – отец/мать, – 2 – дед/бабушка и т.д.). Если у упомянутой персоны существовал супруг или супруга, то имя супруга или супруги помещаются в ту же строку через знак плюс. Имя персоны, чье текстовое родословное дерево выводится, обозначается жирным шрифтом. Пример текстового родословного дерева вы можете увидеть на картинке иллюстрирующей запрос «Персонально».
Запрос «Персонально» (см. рис.2) представляет список ссылок на каждую персону из родословной рассматриваемого священника, при нажатии на которые выводятся личное текстовое родословное дерево, линия событий жизни персоны и дополнительная информация о некоторых специальных событиях: таких, как наказания, награды, духовное происхождение и факты биографии. «Линия жизни» – это таблица, в которой в порядке возрастания даты идут даты рождения, женитьбы, обучения, работы, посвящения в сан, смерти.
Запрос «Содержимое xml» выводит всю присутствующую в XML файле информацию о каждой персоне из родословной. Данные для каждой персоны организуются в отдельную таблицу. В строках таблицы содержится та же информация, что выводится в запросе «Персонально» только в другой форме. Родственные связи, представляемые в запросе «Персонально» текстовым родословным деревом, в этом запросе представляют собой список с именами супруга/супруги, детей, родителей, братьев, сестер, дедушек и бабушек. Форма вывода информации о персоне в запросе «Содержимое xml» более формальна и удобна для уточнения деталей событий и для контроля правильности ввода данных.
Запрос «Линии жизни (всех)» выводит линии жизни для каждой персоны из родословной рассматриваемого священника.
Запрос «Учебные заведения» выводит список названий учебных заведений, причем каждое название представляет собой ссылку, по которой в правой части HTML страницы выводится список персон из родословной рассматриваемого священника, которые обучались в этом учебном заведении. Выводятся также даты обучения.[текст с сайта музея-заповедника "Кижи": http://kizhi.karelia.ru]
Запрос «Assertions» используется для контроля правильности ссылок в XML файле и выводит содержимое всех тегов assertion (утверждение) для всех персон из родословной рассматриваемого священника.
По ссылке «Еще запросы» происходит переход на страницу дополнительных запросов. На этой странице осуществляется выборка информации в задаваемых временных рамках по отдельным событиям из жизни всех персон из родословной рассматриваемого священника. Дополнительные запросы: «Все события», «Рождения», «Смерти», «Женитьбы», «Рукоположения», «Наказания/Награды» и «Работа».
Информация по священникам Олонецкой губернии относительно неизучена и требует новых подходов к исследованию и анализу материала с помощью компьютерных технологий. Использование технологии XML и генеалогического формата GenXML 2.0 предоставляет богатые возможности для хранения, визуализации и работы с генеалогической информацией, что и было продемонстрировано созданием информационной системы.
- [1] Кобрин В.Б. Перспективы развития генеалогических исследований // Генеалогия. Источники. Проблемы. Методы исследования: Тез. докл. и сообщ. межвуз. науч. конф. Москва, 31 янв. – 3 февр. 1989 г. М., 1989. С.4–7.
- [2] Рэй Э. Изучаем XML / Пер. с англ. СПб., 2001.
- [3] Спецификация XML 1.0 (вторая редакция).
- [4] Спецификация XSL (XSLT) 1.0
- [5] Спецификация GenXML 2.0
- [6] Спецификация THE GEDCOM STANDARD Release 5.5 http://www.familysearch.org
- [7] Спецификация GEDCOM XML Specification Release 6.0 Beta
- [8] Genealogical Data Model http://www.gentech.org
- [9] Калашникова Р. Б. Судьба священника // Лицей. 1997, №4. С.13.
- [10] Калашникова Р.Б. Самые образованные люди в деревне // ТВР–Панорама. 2004, №19. С.10.
- [11] Калашникова Р.Б. Тебе будет фамилия Плотников за твои дела // Лицей. 2004, №10. С.22.
Текст может отличаться от опубликованного в печатном издании, что обусловлено особенностями подготовки текстов для интернет-сайта.