СЕМАНТИКО-ГРАММАТИЧЕСКАЯ АННОТАЦИЯ В РУССКО-ТАТАРСКОЙ ЛЕКСИКОГРАФИЧЕСКОЙ БАЗЕ ДАННЫХ
Невзорова Ольга Авенировна, Салимов Фарид Ибрагимович, Хакимов Булат Э
Научно-исследовательский институт "Прикладная семиотика" Академии наук Республики Татарстан
Аннотация. В статье описаны модели и методы представления лингвистической информации в разработанной русско-татарской лексикографической базе данных, отличительными чертами которой являются ориентация на компьютерные системы обработки текстов, а также глубокая детализация и взаимная интеграция лингвистических сведений. Созданная лексикографическая база впервые использует семантико-грамматические аннотации татарских лексем, построенные с учетом типологических особенностей тюркских языков, и в перспективе может быть использована в многоязычных компьютерных приложениях.
Ключевые слова и фразы: лексикографическая база данных, автоматическая обработка текста, лингвистическая аннотация, грамматика, семантика, поисковый запрос, тюркские языки, lexicographical database, automatic text processing, linguistic annotation, grammar, semantics, retrieval request, Turkic languages
Открыть полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
Список литературы:
Бухараев Р. Г., Сафиуллина Ф. С., Сулейманов Д. Ш. и др. К концепции Машинного фонда Республики Татарстан // Интеллект. Язык. Компьютер. Казань: Изд-во Казан. гос. ун-та, 1995. Вып. 2. С. 20-35.
Восточно-армянский национальный корпус [Электронный ресурс]. URL: http://eanc.net (дата обращения: 15.09.2012).
Зализняк А. А. Грамматический словарь русского языка. Словоизменение. М.: Русский язык, 1977. 880 с.
Казанский лингвографический фонд [Электронный ресурс]. URL: http://klf.ksu.ru (дата обращения: 12.09.2012).
Машинный фонд башкирского языка [Электронный ресурс]. URL: http://mfbl.ru (дата обращения: 15.09.2012).
Национальный корпус русского языка [Электронный ресурс]. URL: http://ruscorpora.ru (дата обращения: 15.09.2012).
Невзорова О. А., Хакимов Б. Э., Салимов Ф. И., Гатиатуллин А. Р., Гильмуллин Р. А. Проект создания двуязычного лексикографического ресурса для задач автоматической обработки текстов // Диалектология, история и грамматическая структура тюркских языков. Казань, 2011. С. 169-172.
Русско-татарский словарь / под ред. Ф. А. Ганиева. М.: ИНСАН, 1997. 718 с.
Сулейманов Д. Ш., Гильмуллин Р. А. Двухуровневое описание морфологии татарского языка // Тезисы Международной научной конференции "Языковая семантика и образ мира". Казань: Изд-во Казан. гос. ун-та, 1997. Кн. 2. С. 65-67.
Сулейманов Д. Ш., Невзорова О. А., Гатиатуллин А. Р. и др. Основные компоненты прикладной грамматической модели татарского языка // Труды Международной научной конференции "Диалог-2007". М., 2007. C. 525-530.
Сулейманова Д. Д. Особенности семантической классификации имен существительных с конкретным значением в русском и татарском языках" // Труды Казанской школы-семинара по компьютерной и когнитивной лингвистике TEL’2012. Казань: Фэн, 2012. С. 168-174.
Хакимов Б. Э., Гильмуллин Р. А. К разработке морфологического стандарта для систем автоматической обработки текстов на татарском языке // Системный анализ и семиотическое моделирование: материалы всеросс. конф. с междунар. участием (SASM-2011). Казань, 2011. С. 209-214.
Turk Dil Kurumu [Электронный ресурс]. URL: http://tdk.org.tr (дата обращения: 10.09.2012).