Выявление ключевых слов тематического поля "Образование/Education"
Башмакова Анастасия Юрьевна
Тюменский государственный университет
Дата поступления рукописи в редакцию: 26.10.2021
Аннотация. Цель исследования - определить состав и особенности ключевой лексики тематического поля "Образование/Education" для русского и английского языков. В статье описываются этапы автоматизированного сбора корпуса новостных статей с сайтов образовательных онлайн-порталов "EDU-Inform" и "Education Today Magazine". Значительное внимание уделяется лингвистическому анализу выявленной ключевой лексики. Научная новизна исследования заключается в междисциплинарном рассмотрении вопроса изучения ключевых слов и использовании инструментов компьютерного программирования для автоматической обработки текстов на естественном языке. В результате исследования была представлена визуализация тематического поля "Образование/Education" в формате облака слов для русского и английского языков.
Ключевые слова и фразы: компьютерная лингвистика, извлечение ключевых слов, образование, облако слов, computational linguistics, keyword extraction, education, BERT, word cloud
Открыть полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
Список литературы:
Арнольд И. В. Семантическая структура слова в современном английском языке и методика ее исследования. Л.: Просвещение, 1966.
Ахманова О. С. Очерки по общей и русской лексикологии. М.: Государственное учебно-педагогическое Издательство Министерства Просвещения РСФСР, 1957.
Глобина Л. В. Лексико-семантическое поле партитивной лексики в современном русском языке: автореф. дисс. … к. филол. н. Воронеж, 1995.
Лысякова М. В. Лексико-семантические парадигмы: лингвистический статус, критерии разграничения // Russian Journal of Linguistics. 2005. № 7.
Филин Ф. П. О лексико-семантических группах слов // Езиковедскиі изъследования в чест на академик Стефан Младенов. София: Бьлг. акад. на науките, 1967.
Anandarajan M., Hill C., Nolan T. Practical Text Analytics. Maximizing the Value of Text Data. Advances in Analytics and Data Science. Springer Nature Switzerland, Cham, 2019.
Grootendorst M. Keybert: Minimal keyword extraction with bert. 2020. URL: https://github.com/MaartenGr/KeyBERT
Kaser O., Lemire D. Tag-cloud drawing: Algorithms for cloud visualization // Proceedings of the World Wide Web Workshop on Tagging and Metadata for Social Information Organization. Coleman, 2007.