ЛАБОРАТОРИЯ АВТОМАТИЗИРОВАННЫХ ЛЕКСИКОГРАФИЧЕСКИХ СИСТЕМ |
|
English |
|
Документация и исследование исчезающих языков |
||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Научный руководитель: О. А. Казакевич Исполнители: Т. Б. Багаряцкая, Е. М. Будянская, О. А. Казакевич, Т. Е. Реутт, С. Ф. Членова, В. С. Хоружая.
Это направление развивается в рамках лаборатории с 1987 г., когда О. А. Казакевич и Ж. Г. Аношкина приступили к работе над полнотекстовой базой данных селькупского язык. В 1990-е гг. в работе над проектом участвовала также А. Д. Салий и студенты ОТиПЛ МГУ, проходившие практику в НИВЦ. Собственно, проект машинного фонда селькупского языка, основной составляющей которого стала полнотекстовая база данных (наряду с проектом машинного фонда чукотско-камчатских языков в ИЛ РАН, СПб), положил начало использованию ЭВМ для исследования бесписьменных и младописьменных языков в России. В 2000 г. в лаборатории создана группа по документации и исследованию исчезающих языков. Работа группы ведется в двух направлениях: 1. Документация и исследование исчезающих языков Западной и Центральной Сибири ( Т. Б. Багаряцкая, Е. М. Будянская, О. А. Казакевич, Т. Е. Реутт, В. С. Хоружая).2. Документация и исследование малых языков Молуккского архипелага (С. Ф. Членова). направления На базе лаборатории регулярно проводятся лингвистические экспедиции по комплексной документации языков Сибири, находящихся под угрозой исчезновения. Объектами документации стали говоры селькупского, кетского и эвенкийского языков. С 2001 г. проведено 10 экспедиций в поселки Пуровского и Красноселькупского районов Ямало-Ненецкого АО, Туруханского района и Эвенкийского муниципального района Красноярского края, во время которых собран большой объем лингвистического, социолингвистического и этнолингвистического материала. Экспедиции проводились при поддержке РФФИ и РГНФ (http://minlang.srcc.msu.ru/expeditions.htm). В процессе сбора материала используются новейшие технологии аудио- и видеозаписи звучащей речи. Разработана стандартная процедура сбора материала в ситуации языкового сдвига (наблюдаемого сегодня массового перехода представителей малых этносов Сибири со своего этнического языка на русский). В экспедициях принимали участие студенты ОТиПЛ МГУ (2002, 2003, 2005) и Института лингвистики РГГУ (2005, 2006, 2007). Обработка собранного материала, на разных этапах поддержанная грантами Российского фонда фундаментальных исследований, Российского гуманитарного научного фонда и Международного института «Открытое общество»), ведется в нескольких направлениях: 1) создание и пополнение мультимедийных компьютерных архивов селькупской, кетской и эвенкийской речи, включающих озвученные словарные материалы и бытовые и фольклорные тексты в аудио-, видео- и графическом представлении на говорах обследованных поселков; организация архивных материалов в мультимедийные базы данных; 2) анализ языковой ситуации в местах сбора материала; 3) инструментальный анализ сегментных и супрасегментных фонетических характеристик селькупской, кетской и эвенкийской речи; 4) морфологическое индексирование словоформ текстов; 5) анализ фонетических и грамматических изменений, происходящих в исследуемых языках на протяжении последнего столетия;6) дискурсивный анализ текстов; 7) содержательный анализ текстов (выход в фольклористику и этнографию, с одной стороны, и в историю России, с другой);8) исследование лингвистических результатов селькупско-кетско-эвенкийских языковых контактов; 9) обработка отснятых видеоматериалов: создание компьютерного видеоархива и подготовка видеофильмов о жизни поселков, в которых мы работаем, и о функционировании в них языков автохтонного населения. Некоторые результаты Создана мультимедийная база данных кетского языка ( демоверсия http://minlang.srcc.msu.ru/kets/index.htm)Созданы пилотные версии мультимедийных баз данных селькупского (http://minlang.srcc.msu.ru/selkups/index.htm) и эвенкийского (http://minlang.srcc.msu.ru/evenki1/index.htm) языков. Подготовлено и частично опубликовано описание языковой ситуации у кетов, северных селькупов и западных эвенков. На материале созданных мультимедийных архивов впервые проведено инструментальное исследование селькупской и кетской фразовой интонации и продолжено инструментальное исследование эвенкийской фразовой интонации.Подготовлено и опубликовано описание изменения некоторых грамматических категорий (число, наклонение, тип спряжения) в говорах северных селькупов, происходящее на протяжении последнего столетия. По материалам видеоархива создано три документальных видеофильма: «Язык как воспоминание: кеты Суломая» (2005), «Кеты Мундуйского озера» (2008). (О. А. Казакевич, А. В. Чвырев) и «Эвенки Боговых озер» (2010). (О. А. Казакевич, А. В. Чвырев). В настоящее время при поддержке РФФИ (грант 10-06-00532) ведется работа над проектом «Мультимедийный размеченный корпус текстов на говорах западных эвенков», целью которого является построение мультимедийного корпуса аннотированных текстов на говорах западных эвенков, в котором будет обеспечиваться хранение языковой и метаязыковой информации и осуществляться поиск информации по различным параметрам. В рамках проекта анализируются проблемы, возникающих в ходе работы над подобным корпусом.
В рамках молуккского направленияСоздан и продолжает пополняться уникальный компьютерный архив полевых материалов по языкам Молуккских островов, одному из наименее изученных регионов локализации австронезийской языковой семьи. Данные по тридцати одному языку были получены С. Ф. Членовой и М. А. Членовым в 1960-х гг. во время пребывания на острове Амбон, в центре Восточной Индонезии. Сбор материалов осуществлялся с помощью специально разработанного опросника, разделенного на словарную, грамматическую и социолингвистическую зоны. Особая ценность полевых материалов состоит в том, что они документируют синхронный срез молуккских языков до их ускоренного разрушения, происходящего в последние десятилетия под резко усилившимся давлением индонезийского языка. Анализ молуккских материалов лежит в основе лингвистических и социолингвистических исследований, результаты которых регулярно представляются в научных публикациях.[1] К настоящему времени компьютерный архива включает словники двенадцати языков. На базе архива составлены и опубликованы грамматические описания шести языков, причем три из них (давлор, дамар и теунский ветан) описаны впервые . Публикация по языку дамар приводится в качестве единственного источника в авторитетнейшем международном справочник по языкам мира Ethnologue: http://www.ethnologue.com/show_language.asp?code=drn |