Принципы разработки лингвистической информационной системы
Яцко Вячеслав Александрович
Хакасский государственный университет имени Н. Ф. Катанова
Дата поступления рукописи в редакцию: 13.05.2020
Аннотация. Цель исследования - сформулировать принципы разработки лингвистической информационной системы, предназначенной для интегрированного представления лингвистических ресурсов. Научная новизна - впервые предлагаются принципы универсальности и комплементарности разработки лингвистической информационной системы. Под универсальностью понимается поддержка всех видов исследований, включая теоретические, прикладные и информационные. Комплементарность предполагает адекватное распределение электронных ресурсов, которые выступают в качестве компонентов системы. Выделяется семантическая, прагматическая и функциональная комплементарность. Полученные результаты показали, что структура системы должна включать в качестве центральных элементов лингвистическую онтологию и национальный корпус.
Ключевые слова и фразы: лингвистические технологии, лингвистическая информационная система, принципы разработки, лингвистическая онтология, текстовые корпуса, linguistic technologies, linguistic information system, design principles, linguistic ontology, text corpora
Открыть полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
Список литературы:
Чеснокова И. Д., Маньшин М. Е. Национальный корпус русского языка как основной инструмент поиска при лингвистических исследованиях (на примере поиска антонимов в публицистических текстах) // Известия Волгоградского государственного педагогического университета. 2018. № 5. С. 97-103.
Яцко В. А. Компьютерная лингвистика или лингвистическая информатика? // Научно-техническая информация. Серия 2. Информационные процессы и системы. 2014. № 5. С. 1-10.
Яцко В. А., Яцко Т. С. Особенности структуры лингвистической онтологии // Научно-техническая информация. Серия 2. Информационные процессы и системы. 2017. № 6. С. 16-25.
Colton D. Text classification using Python // Text mining and visualization: Case studies using open-source tools. Boca Raton, 2016. P. 199-220.
Dash N. S., Arulmozi S. Type and purpose of text // History, features, and typology of language corpora. Singapore, 2018. P. 67-83. DOI: 10.1007/978-981-10-7458-5_5.
Farzandipour M., Meidani Z., Gilasi H., Dehghan R. Evaluation of key capabilities for hospital information system: A milestone for meaningful use of information technology [Электронный ресурс] // Annals of Tropical Medicine and Public Health. 2017. Vol. 10. Iss. 6. URL: http://www.atmph.org/text.asp?2017/10/6/1579/222676 (дата обращения: 14.05.2020).
L?pez G., Quesada L., Guerrero L. A. Alexa vs. Siri vs. Cortana vs. Google Assistant: A comparison of speech-based natural user interfaces // Advances in Intelligent Systems and Computing. Cham: Springer, 2018. Vol. 592. P. 241-250.
Oliveira N., Areal N. Sentiment analysis of stock market behavior from Twitter using the R Tool // Text mining and visualization: Case studies using open-source tools. Boca Raton, 2016. P. 223-240.
Wiechmann D., Fuhs S. Concordancing software // Corpus Linguistics and Linguistic Theory. 2006. Vol. 2. Iss. 1. P. 107-127. DOI: 10.1515/CLLT.2006.006.
Yu-Chun Lo, Jhih-Jie Chen, Ching-Yu Yang, Jason S. Cool English: A grammatical error correction system based on large learner corpora // Proceedings of the 27th International Conference on Computational Linguistics: System Demonstrations. Santa Fe, 2018. P. 82-85.