Москин Н.Д. (г.Петрозаводск)
Применение теоретико-графовых моделей при классификации бесёдных песен Заонежья XIX – начала XX века
@kizhi
На сегодняшний день специалистами, изучающими народную культуру России и ближнего зарубежья, накоплены большие по объему коллекции фольклорных текстов, которые хранятся как в печатной, так и в электронной форме в виде реляционных баз данных. При анализе подобных коллекций часто возникают достаточно сложные задачи, к которым можно отнести классификацию фольклорных текстов, решение вопросов жанровой дифференциации и атрибуции текстов, поиск устойчивых языковых конструкций (мотивов, сюжетов) и т. д. Однако традиционные методики оказываются не всегда достаточными для проведения подобных исследований. Поэтому возникает необходимость в разработке новых методов и технологий анализа текстов.
Объектом нашего исследования являются бесёдные песни Заонежья XIX – начала XX в., по поводу научной классификации которых среди фольклористов до сих пор не выработалось единого мнения. Бесёдными назывались песни, исполнявшиеся в закрытом помещении – избе – во время заонежских молодежных вечеринок в осенне–зимний период [1] . Таким песням была присуща определенная система образов (главные из них: парень – молодой муж, девушка – молодая жена), круг мотивов (действий), набор художественных средств (метафоричность, динамизм, наличие внутренней сценарной схемы, магичность текста) и т.д.
В качестве математической модели песни мы предлагаем использовать граф, который состоит из совокупности объектов и связей между этими объектами [2] . В основе модели лежит понятие мотива, который, по выражению Б.Н.Путилова [3] , является «узловой категорией художественной организации произведения фольклора». Мотивы повторяются в других песнях (не всегда в одной и той же последовательности) и служат исходными элементами для построения новых текстов. Правда, до сих пор остается дискуссионным вопрос о границах и объеме содержания термина.
Рассмотрим бесёдную песню «Уж ты Ванюша, Иван», записанную В.Дашковым в 1842 г. [4] :
Уж ты Ванюша, Иван,Ваня, братец мой!Прилюбился разум твой,Весь обычай дорогой.Перестань, Ваня, пить;Будут девушки любить,Станут молодушки хвалить.Уж как я молодаОдинакая была, в одиночестве жила;Затопила млада печку,Сама по воду пошла.На водушке, на водеГуси, лебеди сидят,Свежу водушку мутят.Почерпнула я, пошла;До полугоры дошла,До царева кабака.У царева кабака сочинилася беда:Загорелась слобода.Как на этот на пожарСоезжались господа,Со уездного суда.Ах, что этот за пожар!Он не жарко горит,Только смахивает.Ах, что это за муж!Молоду жену не бьёт.Бей жену к обеду;К ужину снова, да опять,Чтобы щи были горячи,Каша масляная…
В данной песне можно выделить следующие мотивы (см. указатель мотивов песен зимних хороводов Заонежья, составленный Р.Б.Калашниковой [5] ):
- Мотив 1: «Девушка любит молодца и уговаривает его не пить».
- Мотив 2: «Девушка затопила печь и пошла по воду».
- Мотив 3: «Девушка набрала воды и дошла до кабака».
- Мотив 4: «Пожар у царева кабака».
- Мотив 5: «Пожар не жарко горит – муж жену не сильно бьет».
Содержательную основу мотива можно представить в виде графа, в узлах которого находятся основные персонажи песни, животные, явления природы, постройки, предметы обихода и т.д. Между объектами устанавливаются связи двух видов: локальные, которые подкреплены в тексте глаголами или отглагольными формами, и глобальные, которые распространяются на всю песню и, как правило, никак не выражены в тексте (например, «молодец» – «ясный сокол» (равенство), «девушка» – «коса» (принадлежность), «горенка» – «стол» (месторасположение)). Если связать графы мотивов, объединив одинаковые персонажи в одну вершину, то такую структуру можно изобразить в виде единого графа сюжета песни. Например, подобный граф для песни «Уж ты Ванюша, Иван» изображен на рисунке 1 (здесь локальные связи обозначены сплошной линией, а глобальные – пунктиром).
При исследовании коллекции бесёдных песен была составлена выборка из 50 текстов. В ней представлены как небольшие «утушные» песни в 7–8 строк (например, «Вьюнчик» [6] ), так и песни в 38–40 строк (например, хороводная песня «Ты, отеческая дочь» [7] ). Ряд песен данной выборки имеются в нескольких вариантах, записанных разными собирателями (например, «Все мужья до жен добры» – в записи В.Дашкова [8] и Ф.Студитского [9] , «Позябло, позябло лицо» – в записи Ф.Студитского [10] и В.Лысанова [11] и др.). Заметим, что при построении выборки предпочтение отдавалось наиболее распространенным в Заонежье песням, которые рассматриваются в монографии Р.Б.Калашниковой.
Каждой песне были поставлены в соответствие следующие характеристики:[текст с сайта музея-заповедника "Кижи": http://kizhi.karelia.ru]
- Автор: фамилия, имя, отчество.
- Собиратель: фамилия, имя, отчество.
- Место записи: губерния, уезд, год записи.
- Вид: бесёдная, плясовая, свадебная, бытовая и т.д.
- Жанр: круговая, хороводная, плясовая, игровая и т.д.
- Тема: любовная, семейная, хвалебная, шуточная и т.д.
- Темп: частый, быстрый, медленный, протяжный и т.д.
- Движение: при пляске, при ходьбе парами, при игре и т.д.
В результате анализа теоретико–графовых моделей, были обнаружены следующие закономерности. В среднем бесёдная песня состоит из 12 объектов и 14 связей (каждому объекту песни соответствует приблизительно одна связь). Песни, которые исполнялись в быстром темпе, в основном содержат большое количество объектов и связей (число вершин m > 14 , а ребер n > 17). В эту группу входят семейные и любовные песни. Напротив, медленные песни характеризуются небольшим числом объектов и связей (число вершин m < 14, а ребер n < 17). В эту группу попали все песни на темы «свадьба» и «игра». Здесь, однако, не учитывались песни из сборников К.М.Петрова, В.Д.Лысанова и Е.В.Барсова, поскольку для этих текстов характеристика «темп» не определена.
Объекты в песне неравнозначны между собой. В сюжете, как правило, доминируют два основных персонажа: парень и девушка. Остальные объекты являются второстепенными, они встречаются в тексте один–два раза. Значимость объекта можно определить по числу связей, которые входят в соответствующую вершину графа. Введем параметр Δ – значимость главного персонажа песни (например, в песне «Уж ты Ванюша, Иван» главный персонаж – девушка – связана с пятью объектами, поэтому Δ будет равно 5). Подсчитав эти параметры для всех графов, получилось, что для песен, которые исполнялись «довольно бегло» «с тихой пляской–шеном», значение Δ больше 10. Для песен вида «бесёдная», «свадебная бесёдная» и «плясовая» значение Δ в среднем равно 6,5 и не превышает 10. Для песен «в кругу–круговая» и «пляска в кругу» этот параметр в среднем равняется 10,5 с достаточно большим разбросом.
Не менее интересным представляется анализ песен по распределению объектов и связей на группы [12] . Чаще всего в текстах встречаются объекты группы «люди» (35,15%), затем «части человеческого тела» (8,75%), «земля и воды» (8,58%), «конструкции» (7,59%), «одежда, украшения» (7,1%), «разные предметы» (6,44%), «жилище» (6,44%), «пища, питье» (5,12%), «животный мир» (4,62%), «явления природы» (2,81%), «обычаи, традиции» (2,64%), «растительный мир» (2,15%) и т.д. Наиболее ярко видны закономерности присутствия объектов определенной группы при разбиении песен на основные «темы». В любовных песнях чаще, чем в остальных, встречаются объекты групп «части человеческого тела», «проявление качеств человека» и «земля и воды». Для семейных песен характерны группы «разные предметы» и «конструкции», почти не встречаются объекты группы «проявление качеств человека». В свадебных песнях ярко выраженных групп не выделяется (при этом практически не встречаются объекты группы «обычаи, традиции»). Объекты из других групп встречаются в текстах в приблизительно одинаковой пропорции.
Для классификации песен по распределению объектов на группы можно использовать коэффициент Роджерса–Танимото, который применяется при атрибуции анонимных текстов [13] . Как показали эксперименты, эта мера позволяет достаточно хорошо определять песни заданной «темы» (в частности, находить варианты одного текста, записанные разными собирателями).[текст с сайта музея-заповедника "Кижи": http://kizhi.karelia.ru]
При помощи этого коэффициента были выделены наиболее типичные песни по каждой «теме», например:
- «Девушка в горенке сидела» [14] – типичная любовная песня.
- «Все мужовья до жен добры» [15] – типичная семейная песня.
- «Тут шла, прошла корета» [16] и «Молодцам–то жениться пора» [17] – типичные свадебные песни.
Другим направлением исследования является анализ связности мотивов в структуре песни. Для этого введем понятие графа связности мотивов. Два мотива будем считать связанными, если у них существует общий объект или между некоторыми объектами существует глобальное отношение. На рисунке 2 изображен граф связности мотивов песни «Уж ты Ванюша, Иван»:
При анализе связности структуры песен можно ввести параметр C, который находится как отношение числа пар мотивов, связанных между собой, к общему числу возможных связей. Для данной песни C = 0,5, а, например, для песни «Девушка в горенке сидела» этот параметр равен единице. Подобная характеристика полезна при сравнении песен как с большим, так и с небольшим числом мотивов.
По структуре связности мотивов песни можно разделить на следующие группы [18] . В большинстве песен (24 песни или 48%) все мотивы связаны друг с другом и образуют монолитную структуру. В таких песнях параметр связности мотивов C превышает значение 0,8. У 12% (6 песен) песен, напротив, мотивы практически не связаны (C не превышает значение 0,33). 34% песен имеют незамкнутую цепочечную (12 песен) или кусочно–линейную структуру (5 песен), т.е. мотивы связаны последовательно, один за другим. Остальные структуры в бесёдных песнях практически не встречаются.[текст с сайта музея-заповедника "Кижи": http://kizhi.karelia.ru]
Приведенные результаты были получены при помощи информационной системы по исследованию фольклорных коллекций с теоретико–графовой формализацией текстов, разработанной на кафедре информатики и математического обеспечения Петрозаводского государственного университета [19] . В дальнейшем принципы построения и анализа теоретико–графовых моделей можно адаптировать для исследования коллекций других фольклорных жанров: духовных стихов, сказок, причитаний и т.д.
- [1] Калашникова Р.Б. Бесёды и бесёдные песни Заонежья второй половины XIX века. Петрозаводск, 1999. C.18.
- [2] Варфоломеев А.Г., Москин Н. Д. О применении компьютерных технологий в исследовании фольклорных песен // Локальные традиции в народной культуре Русского Севера: Материалы IV Международной конференции «Рябининские чтения». Петрозаводск, 2003. С.424–427.
- [3] Путилов Б.Н. Фольклор и народная культура. In Memoriam: Сб. СПб., 2003. С.183.
- [4] Описание Олонецкой губернии в историческом, статистическом и этнографическом отношениях / Сост. В.Дашков. СПб., 1842. С.181–182.
- [5] Калашникова Р.Б. Бесёды и бесёдные песни Заонежья второй половины XIX века. C.135–153.
- [6] Лысанов В.Д. Досюльная свадьба, песни, игры и танцы в Заонежье Олонецкой губернии. Петрозаводск, 1916. С.72.
- [7] Описание Олонецкой губернии в историческом, статистическом и этнографическом отношениях. С.184–185.
- [8] Там же. C.179.
- [9] Народные песни Вологодской и Олонецкой губерний, собранные Ф. Студитским. СПб., 1841. C.67.
- [10] Там же. C.63.
- [11] Лысанов В.Д. Досюльная свадьба, песни, игры и танцы в Заонежье Олонецкой губернии. C.73.
- [12] Хроленко А.Т. Поэтическая фразеология русской народной лирической песни. Воронеж, 1981. С 41–42.
- [13] От Нестора до Фонвизина: Новые методы определения авторства / Под редакцией Л. В. Милова. М., 1994. C.35–36.
- [14] Описание Олонецкой губернии в историческом, статистическом и этнографическом отношениях. C.179–181.
- [15] Народные песни Вологодской и Олонецкой губерний, собранные Ф.Студитским. C.67.
- [16] Там же. C.87.
- [17] Песни, собранные П.Н.Рыбниковым / Под ред. Б.Н.Путилова. Петрозаводск, 1991. Т.3. С.125.
- [18] Скороходько Э.Ф. Семантические сети и автоматическая обработка текста. Киев, 1983. С.137–140.
- [19] Москин Н.Д. Программа «Фольклор»: моделирование сюжета бесёдных песен на основе теоретико–графовых структур // Проблемы компьютерной лингвистики: Сб. науч. трудов. Воронеж, 2005. Вып.2. С.121–130.
Текст может отличаться от опубликованного в печатном издании, что обусловлено особенностями подготовки текстов для интернет-сайта.