ФОНЕТИЧЕСКАЯ БАЗА ДАННЫХ БУРЯТСКИХ ДИАЛЕКТОВ: ПРИНЦИПЫ СОСТАВЛЕНИЯ И РАЗМЕТКИ
Абаева Юлия Догоржаповна
Институт монголоведения, буддологии и тибетологии Сибирского отделения Российской академии наук
Аннотация. Статья посвящена научно-исследовательскому проекту по созданию фонетической базы данных бурятских диалектов. В статье рассматриваются основные этапы работы, принципы составления базы данных, диалектный материал, который войдет в корпус, приводятся основные параметры разметки. Особенность разрабатываемого проекта в том, что современное состояние звукового облика бурятских диалектов впервые представлено в формате базы данных.
Ключевые слова и фразы: база данных звуковых файлов, речевой корпус, диалекты бурятского языка, сегментация звуковых файлов, компьютерная обработка звуковых файлов, параметры разметки, database of sound files, speech corpus, dialects of the Buryat language, segmentation of sound files, computer processing of sound files, marking parameters
Открыть полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
Список литературы:
Бадмаева Л. Д. Бурятский языковой корпус: создание, проблемы и перспективы // Вестник Бурятского научного центра Сибирского отделения Российской академии наук. 2013. № 2 (10). С. 118-122.
Богданов Д. С., Кривнова О. Ф., Подрабинович А. Я., Фарсобина В. В. База речевых фрагментов русского языка "ISABASE" [Электронный ресурс]. URL: http://kk.convdocs.org/docs/index-101775.html (дата обращения: 22.08.2014).
Бураев И. Д. Основные этапы исследования бурятских диалектов и их классификация // Развитие и взаимодействие диалектов Прибайкалья. Улан-Удэ, 1988. С. 3-25.
Бурятский корпус [Электронный ресурс]. URL: http://web-corpora.net/BuryatCorpus/search/index.php?interface_language=ru (дата обращения: 25.08.2014).
Долозова О. Н. Создание и лингвистическая разметка звуковой словарно-грамматической базы данных по ительменскому языку [Электронный ресурс]. URL: http://www.dialog-21.ru/digests/dialog2010/materials/html/18.htm (дата обращения: 22.08.2014).
Жолобова А. О. Национальный корпус испанского языка: CORDE и CREA // Филологические науки. Вопросы теории и практики. Тамбов: Грамота, 2014. № 9. Ч. 1. С. 56-58.
Казакевич О. А. Мультимедийная база данных исчезающего языка [Электронный ресурс]. URL: http://www.dialog-21.ru/ Archive/2001/volume1/1_17.htm (дата обращения: 22.08.2014).
Летучий А. Б. Корпус диалектных текстов: задачи и проблемы // Национальный корпус русского языка: 2003-2005: результаты и перспективы. М., 2005. С. 215-232.
Национальный корпус русского языка [Электронный ресурс]. URL: http://ruscorpora.ru/ (дата обращения: 22.08.2014).
Некрасова Г. А. Электронный диалектный корпус как ресурс сохранения и изучения коми диалектов // Финно-угорский мир. 2010. № 1. С. 13-16.
Рассказы о сновидениях и другие корпуса звучащей речи [Электронный ресурс]. URL: http://spokencorpora.ru/ (дата обращения: 22.08.2014).
Скрелин П. А., Щербаков П. П. Требования к современной фонетической базе данных для фундаментальных и прикладных исследований // Технологии информационного общества - Интернет и современное общество: труды VI Всероссийской объединенной конференции (Санкт-Петербург, 3-6 ноября 2003 г.). СПб.: Изд-во филологического фак-та СПбГУ, 2003. С. 62-63.
Степанова С. Б., Асиновский А. С., Богданова Н. В., Русакова М. В., Шерстинова Т. Ю. Звуковой корпус русского языка повседневного общения "один речевой день": концепция и состояние формирования [Электронный ресурс]. URL: http://www.dialog-21.ru/digests/dialog2008/materials/html/76.htm (дата обращения: 22.08.2014).
The IViE Corpus [Электронный ресурс]. URL: http://www.phon.ox.ac.uk/files/apps/IViE/ (дата обращения: 22.08.2014).