ЛАБОРАТОРИЯ
АВТОМАТИЗИРОВАННЫХ
ЛЕКСИКОГРАФИЧЕСКИХ
СИСТЕМ
  English
Главная
История лаборатории
Основные направления
Публикации
Экспедиции
Семинар
Сотрудники
Контакты

Фотогалерея

Проект РФФИ

ICASS VI: PHOTOS

Документация и исследование исчезающих языков

   

Научный руководитель: О. А. Казакевич

Исполнители: Т. Б. Багаряцкая, Е. М. Будянская, О. А. Казакевич, Т. Е. Реутт, С. Ф. Членова, В. С. Хоружая.

 

     Это направление развивается в рамках лаборатории с 1987 г., когда О. А. Казакевич и Ж. Г. Аношкина приступили к работе над полнотекстовой базой данных селькупского язык. В 1990-е гг. в работе над проектом участвовала также А. Д. Салий и студенты ОТиПЛ МГУ, проходившие практику в НИВЦ. Собственно, проект машинного фонда селькупского языка, основной составляющей которого стала полнотекстовая база данных (наряду с проектом машинного фонда чукотско-камчатских языков в ИЛ РАН, СПб), положил начало использованию ЭВМ для исследования бесписьменных и младописьменных языков в России.

     В 2000 г. в лаборатории создана группа по документации и исследованию исчезающих языков. Работа группы ведется в двух направлениях:

1. Документация и исследование исчезающих языков Западной и Центральной Сибири (Т. Б.  Багаряцкая, Е. М. Будянская, О. А. Казакевич, Т. Е. Реутт, В. С. Хоружая).

2. Документация и исследование малых языков Молуккского архипелага (С. Ф. Членова).

 

     В рамках сибирского направления

     На базе лаборатории регулярно проводятся лингвистические экспедиции по комплексной документации языков Сибири, находящихся под угрозой исчезновения. Объектами документации стали говоры селькупского, кетского и эвенкийского языков. С 2001 г. проведено 10 экспедиций в поселки Пуровского и Красноселькупского районов Ямало-Ненецкого АО, Туруханского района и Эвенкийского муниципального района Красноярского края, во время которых собран большой объем лингвистического, социолингвистического и этнолингвистического материала. Экспедиции проводились при поддержке РФФИ и РГНФ (http://minlang.srcc.msu.ru/expeditions.htm). В процессе сбора материала используются новейшие технологии аудио- и видеозаписи звучащей речи. Разработана стандартная процедура сбора материала в ситуации языкового сдвига (наблюдаемого сегодня массового перехода представителей малых этносов Сибири со своего этнического языка на русский). В экспедициях принимали участие студенты ОТиПЛ МГУ (2002, 2003, 2005) и Института лингвистики РГГУ (2005, 2006, 2007).

     Обработка собранного материала, на разных этапах поддержанная грантами Российского фонда фундаментальных исследований, Российского гуманитарного научного фонда и Международного института «Открытое общество»), ведется в нескольких направлениях:

1) создание и пополнение мультимедийных компьютерных архивов селькупской, кетской и эвенкийской речи, включающих озвученные словарные материалы и бытовые и фольклорные тексты в аудио-, видео- и графическом представлении на говорах обследованных поселков; организация архивных материалов в мультимедийные базы данных;

2) анализ языковой ситуации в местах сбора материала;

3) инструментальный анализ сегментных и супрасегментных фонетических характеристик селькупской, кетской и эвенкийской речи;

4) морфологическое индексирование словоформ текстов;

5) анализ фонетических и грамматических изменений, происходящих в исследуемых языках на протяжении последнего столетия;

6) дискурсивный анализ текстов;

7) содержательный анализ текстов (выход в фольклористику и этнографию, с одной стороны, и в историю России, с другой);

8) исследование лингвистических результатов селькупско-кетско-эвенкийских языковых контактов;

9) обработка отснятых видеоматериалов: создание компьютерного видеоархива и подготовка видеофильмов о жизни поселков, в которых мы работаем, и о функционировании в них языков автохтонного населения.

     Некоторые результаты

   Создана мультимедийная база данных кетского языка (демоверсия http://minlang.srcc.msu.ru/kets/index.htm)

   Созданы пилотные версии мультимедийных баз данных селькупского (http://minlang.srcc.msu.ru/selkups/index.htm) и эвенкийского (http://minlang.srcc.msu.ru/evenki1/index.htm) языков.

     Подготовлено и частично опубликовано описание языковой ситуации у кетов, северных селькупов и западных эвенков.

   На материале созданных мультимедийных архивов впервые проведено инструментальное исследование селькупской и кетской фразовой интонации и продолжено инструментальное исследование эвенкийской фразовой интонации.

Подготовлено и опубликовано описание изменения некоторых грамматических категорий (число, наклонение, тип спряжения) в говорах северных селькупов, происходящее на протяжении последнего столетия.

     По материалам видеоархива создано три документальных видеофильма: «Язык как воспоминание: кеты Суломая» (2005), «Кеты Мундуйского озера» (2008). (О. А. Казакевич, А. В. Чвырев) и «Эвенки Боговых озер» (2010). (О. А. Казакевич, А. В. Чвырев).

     В настоящее время при поддержке РФФИ (грант 10-06-00532) ведется работа над проектом «Мультимедийный размеченный корпус текстов на говорах западных эвенков», целью которого является построение мультимедийного корпуса аннотированных текстов на говорах западных эвенков, в котором будет обеспечиваться хранение языковой и метаязыковой информации и осуществляться поиск информации по различным параметрам. В рамках проекта анализируются проблемы, возникающих в ходе работы над подобным корпусом.

 

     В рамках молуккского направления

Создан и продолжает пополняться уникальный компьютерный архив полевых материалов по языкам Молуккских островов, одному из наименее изученных регионов локализации австронезийской языковой семьи. Данные по тридцати одному языку были получены С. Ф. Членовой и М. А. Членовым в 1960-х гг. во время пребывания на острове Амбон, в центре Восточной Индонезии. Сбор материалов осуществлялся с помощью специально разработанного опросника, разделенного на словарную, грамматическую и социолингвистическую зоны. Особая ценность полевых материалов состоит в том, что они документируют синхронный срез молуккских языков до их ускоренного разрушения, происходящего в последние десятилетия под резко усилившимся давлением индонезийского языка.

    Анализ молуккских материалов лежит в основе  лингвистических и социолингвистических исследований, результаты которых регулярно представляются в научных публикациях.[1]

    К настоящему времени компьютерный архива включает словники двенадцати языков. На базе архива составлены и опубликованы грамматические описания шести языков, причем три из них (давлор, дамар и теунский ветан) описаны впервые. Публикация по языку дамар приводится в качестве единственного источника в авторитетнейшем международном справочник по языкам мира Ethnologue: http://www.ethnologue.com/show_language.asp?code=drn