Сегментация речи при создании корпуса устных текстов
Бурова Евгения Евгеньевна
Иркутский государственный университет
Дата поступления рукописи в редакцию: 17.08.2021
Аннотация. Проблема сегментации устной речи в настоящее время находится в центре внимания лингвистов и рассматривается с различных позиций, однако при работе с конкретным материалом по-прежнему возникают трудности членения звучащего текста на составляющие. Цель настоящей статьи - предложить пути решения проблемы сегментации живой устной речи. В статье анализируются основания и возможности фонетического (просодического) и дискурсивного подходов к сегментации текста. Научная новизна исследования заключается в формулировании принципов сегментации речи, которые являются оптимальными для расшифровки устных монологических текстов в рамках создания лингвистического корпуса, включающего диалектные материалы и глубинные интервью. В результате исследования разработан способ членения устного текста на основе использования нескольких разнородных критериев (комбинированный подход).
Ключевые слова и фразы: сегментация устной речи, просодическое членение текста, элементарная дискурсивная единица, устный дискурс, oral speech segmentation, prosodic division of the text, elementary discursive unit, oral discourse
Открыть полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
Список литературы:
Кибрик А. А., Кодзасов С. В., Худякова М. В. Просодическая транскрипция: уровни детализации // Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегод. Междунар. конф. "Диалог". М., 2009. С. 143-148.
Князев С. В. Коартикуляция на стыках слов как показатель наличия просодического шва в русском языке // Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегод. Междунар. конф. "Диалог". М., 2016. С. 251-264.
Князев С. В., Красько А. В. Коартикуляция по голосу в сочетаниях "велярный + звонкий губно-зубной спирант" внутри и на стыках фонетических слов в современном русском языке // Русский язык в научном освещении. 2019. Т. 38. № 2. С. 9-24.
Князев С. В., Утешева А. С. Коартикуляционные изменения носовых согласных как показатель наличия просодического шва и порядка применения фонологических правил в русском языке // Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегод. Междунар. конф. "Диалог". М., 2017. С. 162-182.
Коротаев Н. А. Коммуникативно-просодический подход к выявлению элементарных дискурсивных единиц в устном монологическом тексте // Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегод. Междунар. конф. "Диалог". М., 2015. С. 294-307.
Кривнова О. Ф. Ритмизация и интонационное членение текста в "процессе речи-мысли": опыт теоретико-экспериментального исследования: автореф. дисс. … д. филол. н. М., 2007. 53 с.
Кривнова О. Ф. Фонетические характеристики дыхательных пауз с разной текстовой локализацией // Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегод. Междунар. конф. "Диалог". М., 2017. Т. 2. С. 207-220.
Кривнова О. Ф., Князев С. В., Моисеева Е. В. Исследования просодического членения звучащего текста на материале русского языка // Вестник Московского университета. Серия 9 "Филология". 2016. № 4. С. 7-33.
Кривнова О. Ф., Князев С. В., Смирнова О. С. Интонационное членение и сегментирующая сила словоразделов в звучащем тексте (данные перцептивного эксперимента) // Труды Института русского языка им. В. В. Виноградова. 2018. Т. 17. С. 128-140.
Кривнова О. Ф., Смирнова О. С. Интроспективная просодическая разметка письменного текста и его реальное озвучивание (сравнительный анализ на материале коллекции текстов Р. И. Аванесова) // Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегод. Междунар. конф. "Диалог". М., 2019. С. 295-309.
Рассказы о сновидениях: корпусное исследование устного русского дискурса / под ред. А. А. Кибрика и В. И. Подлесской. М.: Языки славянских культур, 2009. 736 с.