МЕТОД ОПРЕДЕЛЕНИЯ ТОНАЛЬНОСТИ АСПЕКТНЫХ ТЕРМИНОВ

Pavel Dmitrievich Blinov, Evgeniy Vyacheslavovich Kotelnikov


Аннотация


Автоматическое определение тональности текста в настоящее время в основном осуществляется с использованием специализированных лингвистических ресурсов - текстовых корпусов, словарей и тезаурусов, создание которых представляет собой весьма трудоемкую задачу. Поэтому актуальной является проблема разработки метода, позволяющего с минимальными трудозатратами создавать словарь оценочной лексики и на его основе осуществлять анализ тональности текстов. В зависимости от предметной области анализ тональности требуется выполнять на различных уровнях детализации. В настоящей статье рассматривается задача определения тональности, выраженной по отношению к отдельным аспектам исследуемой сущности, представленным с помощью аспектных терминов. В статье предложен метод определения тональности аспектных терминов, отличающийся от известных способом автоматического построения словаря оценочной лексики на основе взаимной информации и распределённых представлений слов. Приведены результаты экспериментов на англоязычном корпусе международного семинара SemEval-2014, подтверждающие приемлемое качество решения задачи определения тональности аспектов на основе разработанного метода.

Ключевые слова


АСПЕКТНО-ЭМОЦИОНАЛЬНЫЙ АНАЛИЗ ТЕКСТА; ВЗАИМНАЯ ИНФОРМАЦИЯ; РАСПРЕДЕЛЁННЫЕ ПРЕДСТАВЛЕНИЯ СЛОВ; МАШИННОЕ ОБУЧЕНИЕ

Литература


Hu M., Liu B. Mining and Summarizing Customer Reviews. Proceedings of the Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD ‘04), 2004, pp. 168-177.

Liu B. Sentiment Analysis and Opinion Mining. Synthesis Lectures on Human Language Technologies, 2012, 168 p.

Blinov P. D., Kotelnikov E. V. Using Distributed Representation for Aspect-Based Sentiment Analysis. Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference «Dialogue», Bekasovo, 2014, Issue 13, pp. 68-79.

Chernyshevich M. IHS R&D Belarus: Cross-domain extraction of product features using CRF. Proceedings of the 8th International Workshop on Semantic Evaluation (SemEval 2014), Dublin, Ireland, 2014, pp. 309-313.

Блинов П. Д. Автоматическое выделение именованных сущностей в русскоязычных текстах//Научно-технический вестник Поволжья. 2013. № 3. С. 91-96.

Kiritchenko S., Zhu X., Cherry C., Mohammad S. NRC-Canada-2014: Detecting Aspects and Sentiment in Customer Reviews. Proceedings of the 8th International Workshop on Semantic Evaluation (SemEval 2014), Dublin, Ireland, 2014, pp. 437-442.

Baccianella S., Esuli A., Sebastiani F. SentiWordNet 3.0: An Enhanced Lexical Resource for Sentiment Analysis and Opinion Mining. Proceedings of the Seventh Conference on International Language Resources and Evaluation (LREC’10), 2010, pp. 2200-2204.

Wiebe J., Wilson T., Cardie C. Annotating expressions of opinions and emotions in language. Language Resources and Evalution, 2005, vol. 39, pp. 165-210.

Chetviorkin I. I., Loukachevitch N. V. Extraction of Russian Sentiment Lexicon for Product Meta-Domain. Proceedings of COLING 2012: Technical Papers, 2012, pp. 593-610.

Блинов П. Д., Клековкина М. В., Котельников Е. В., Пестов О. А. Исследование словарного подхода и методов машинного обучения для анализа тональности//Компьютерная лингвистика и интеллектуальные технологии. 2013. Т. 2. № 12. С. 48-58.

Wagner J., Arora P., Cortes S., Barman U., Bogdanova D., Foster J., Tounsi L. DCU: Aspect-based Polarity Classification for SemEval Task 4. Proceedings of the 8th International Workshop on Semantic Evaluation (SemEval 2014), Dublin, Ireland, 2014, pp. 223-229.

Pontiki M., Galanis D., Pavlopoulos J., Papageorgiou H., Androutsopoulos I., Manandhar S. SemEval-2014 Task 4: Aspect Based Sentiment Analysis. Proceedings of the 8th International Workshop on Semantic Evaluation (SemEval 2014), Dublin, Ireland, 2014, pp. 27-35.

Padró L., Stanilovsky E. FreeLing 3.0: Towards Wider Multilinguality. Proceedings of the Language Resources and Evaluation Conference (LREC’12), 2012, pp. 2473-2479.

Zhu X., Guo H., Mohammad S., Kiritchenko S. An empirical study on the effect of negation words on sentiment. Proceedings of the Annual Meeting of the Association for Computational Linguistics (ACL ’14), 2014, pp. 304-313.

Mohammad S., Kiritchenko S., Zhu X. NRC-Canada: Building the stateof-the-art in sentiment analysis of tweets. Proceedings of the International Workshop on Semantic Evaluation (SemEval 2013), Atlanta, Georgia, 2013, pp 321-327.

Islam A., Inkpen D. Second Order Co-occurrence PMI for Determining the Semantic Similarity of Words. Proceedings of the International Conference on Language Resources and Evaluation (LREC 2006), Genoa, Italy, 2013, pp. 1033-1038.

Rumelhart D., Hintont G., Williams R. Learning representations by back-propagating errors, Nature, 1986, vol. 323, pp. 533-536.

Mikolov T., Sutskever I., Chen K., Corrado G., Dean J. Distributed Representations of Words and Phrases and their Compositionality. Proceedings of NIPS, 2013, pp. 3111-3119.

Řehůřek R., Sojka P. Software Framework for Topic Modelling with Large Corpora. Proceedings of the LREC 2010 Workshop on New Challenges for NLP Frameworks, 2010, pp. 46-50.

Manning C., Raghavan P., Schütze H. Introduction to Information Retrieval. Cambridge University Press. New York, 2008, 496 p.

Friedman J. Greedy Function Approximation: A Gradient Boosting Machine. The Annals of Statistics, 2001, vol. 29, no. 5, pp. 1189-1232.

Pedregosa F., Varoquaux G., Gramfort A., Michel V., Thirion B., Grisel O., Blondel M., Prettenhofer P., Weiss R., Dubourg V., Vanderplas J., Passos A., Cournapeau D., Brucher M., Perrot M., Duchesnay E. Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research, 2011, vol. 12, pp. 2825-2830.




DOI: https://doi.org/10.12731/wsd-2014-12.1-8

Ссылки

  • На текущий момент ссылки отсутствуют.




(c) 2016 В мире научных открытий



ISSN 2658-6649 (print)

ISSN 2658-6657 (online)

HotLog Яндекс цитирования