АВТОМАТИЗИРОВАННЫЙ КОНТЕНТ-АНАЛИЗ МНЕНИЙ ТРЕХ ПРЕДМЕТНЫХ ОБЛАСТЕЙ
Брунова Елена Георгиевна
Тюменский государственный университет
Аннотация. Исследование, выполненное в рамках прикладной лингвистики, посвящено анализу субъективной информации в пользовательском контенте. Проанализированы отзывы на русском языке из трех предметных областей, в качестве критерия эффективности применялась мера Ван Ризбергена. Установлено, что эффективность применяемого алгоритма не снижается при анализе отзывов из других предметных областей. Доказано, что система распознает положительные отзывы лучше, чем отрицательные.
Ключевые слова и фразы: прикладная лингвистика, обработка естественного языка, алгоритм, контент-анализ мнений, предметная область, пользовательский контент, applied linguistics, processing natural language, algorithm, content analysis of comments, subject area, user’s content
Открыть полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
Список литературы:
Брунова Е. Г. Составление лексикона для контент-анализа мнений // Теоретические и прикладные аспекты изучения речевой деятельности. Н. Новгород: НГЛУ им. Н. А. Добролюбова, 2013. Вып. 1 (8). С. 24-29.
Брунова Е. Г., Бидуля Ю. В. Алгоритм с элементами формальной грамматики для контент-анализа мнений // Вестник Тюменского государственного университета. Серия "Физико-математические науки. Информатика". 2014. № 7. С. 242-250.
Ермаков С. А., Ермакова Л. М. Методы оценки эмоциональной окраски текста // Вестник Пермского университета. 2012. Вып. 1 (19). С. 85-89.
Куликов С. Ю. Автоматизация составления оценочного словаря широкой предметной области (опыт использования неспециализированного корпуса текстов) // Вестник Иркутского государственного технического университета. 2014. № 8 (91). С. 240-243.
Лукашевич Н. В., Четверкин И. И. Извлечение и использование оценочных слов в задаче классификации отзывов на три класса // Вычислительные методы и программирование. 2011. Т. 12. С. 73-81.
Оробинская Е. А., Кочуева З. А. Технологии Text Mining: Обзор методов и задач обработки смысловой информации // Вестник Херсонского национального технического университета. 2010. № 2 (38). С. 348-353.
Пазельская А. Г., Соловьев А. Н. Метод определения эмоций в текстах на русском языке // Компьютерная лингвистика и интеллектуальные технологии: "Диалог-2011". М.: Изд-во РГГУ, 2011. Вып. 10 (17). С. 510-522.
Полякова Е. В. Когнитивные особенности выражения моральных чувств "Любовь" и "Страх" в идиоматике русского и английского языков // Филологические науки. Вопросы теории и практики. Тамбов: Грамота, 2013. № 9 (27): в 2-х ч. Ч. 2. С. 157-163.
Ganapathibhotla M., Liu B. Mining Opinions in Comparative Sentences // Proc. of the 22nd International Conference on Computational Linguistics. Manchester: Brighton, 2008. P. 241-248.
Liu B. Sentiment Analysis and Subjectivity [Электронный ресурс] // Handbook of Natural Language Processing. 2010. URL: http://www.cs.uic.edu/~liub/FBS/NLP-handbook-sentiment-analysis.pdf (дата обращения: 27.09.2014).
Manning Ch., Raghavan P., Sch?tze H. Introduction to Information Retrieval. Cambridge: Cambridge UP, 2009. 544 p.
Pal J., Saha A. Identifying Themes in Social Media and Detecting Sentiments // International Journal of Statistics and Applications. 2011. Vol. 1. No. 1. P. 14-19.
Pang B., Lee L. Opinion Mining and Sentiment Analysis // Foundations and Trends in Information Retrieval. 2008. Vol. 2. No 1-2. P. 1-135.
Pang B., Lee L., Vaithyanathan S. Thumbs up? Sentiment Classification Using Machine Learning Techniques [Электронный ресурс] // Proc. of EMNLP. 2002. URL: http://www.cs.cornell.edu/people/pabo/papers/sentiment.pdf (дата обращения: 27.09.2014).
Turney P. Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews // Proc. of the 40th Annual Meeting on Association for Computational Linguistics. Philadelphia: University of Pennsylvania, 2002. P. 417-424.
Wiebe J., Bruce R., O’Hara T. Development and Use of a Gold-Standard Data Set for Subjectivity Classifications // Proc. of the 37th Annual Meeting of the Association for Computational Linguistics. Maryland: University of Maryland, 1999. P. 246-253.