АПРИОРНАЯ ИНФОРМАЦИЯ КАК СПОСОБ РАЗРЕШЕНИЯ ОНТОЛОГИЧЕСКОЙ И ЯЗЫКОВОЙ ОМОНИМИИ
Антонов Егор Сергеевич
Московский государственный университет им. М. В. Ломоносова
Аннотация. В статье рассматривается целесообразность использования априорной информации для разрешения языковой и онтологической омонимии именованных сущностей. На материале размеченного корпуса из 1700 англо-язычных новостных статей опробована стратегия выбора наиболее вероятного объекта с двумя настраиваемыми параметрами (минимальная вероятность соответствия, минимальное количество упоминаний в корпусе). Подобная стратегия позволяет достигнуть большой точности разрешения омонимии, однако ее применение не имеет смысла при большом количестве объектов онтологии из-за низкой полноты.
Ключевые слова и фразы: распознавание именованных сущностей, разрешение омонимии именованных сущностей, онтология, априорная информация, географические объекты, новостные тексты, named entities recognition, disambiguation of named entities homonymy, ontology, a priory information, geographic objects, news texts
Открыть полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
Список литературы:
Антонов Е. С. Как найти миллион // RSDN Magazine. СПб.: K-Press, 2011. № 1. С. 60-68.
Cucerzan S. Large Scale Named Entity Disambiguation Based on Wikipedia Data // Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. Stroudsburg, PA: Association for Computational Linguistics, 2007. P. 708-716.
Fader A., Soderland S., Etzioni O. Scaling Wikipedia-Based Named Entity Disambiguation to Arbitrary Web Text // Proceedings of the WikiAI 09 - IJCAI Workshop: User Contributed Knowledge and Artificial Intelligence: an Evolving Synergy. Pasadena, CA: IJCAI Organization, 2009. P. 21-28.
Hoffart J., Yosef M. A., Bordino I., Furstenau H., Pinkal M., Spaniol M., Taneva B., Thater S., Weikum G. Robust Disambiguation of Named Entities in Text // Proceedings of Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA: ACL, 2011. P. 782-792.