Изучены проблемы и существующие подходы сентиментального анализа

04 Март 2020 - 16:22 | Конференции, собрания

В Институте информационных технологий НАНА состоялся очередной научный семинар отдела № 1.

С докладом на тему «Сентиментальный анализ: проблемы и существующие подходы» выступила старший научный сотрудник института Марзия Исмайлова, которая дала подробную информацию о нем.

Докладчица отметила, что сентиментальный анализ характеризуется обработкой естественного языка (Natural Language Processing), извлечением, распознаванием или другими методами эмоционального содержания текста из текстовых документов с использованием статистических или машинных методов обучения.

М.Исмайлова отметила, что компьютерный сентиментальный анализ осуществляется с наличием субъективных текстов в Интернете. Она отметила, что целью сентиментального анализа является поиск идей в тексте и определение их особенностей.

По её словам, сентиментальный анализ – это сложный многоязычный вопрос, который включает обработку естественного языка, веб-анализ и машинное обучение. Она подчеркнула, что классификация субъективности – это метод классификации предложений, который выражается или не выражается как идея, а сентиментальная классификация – это метод поиска противоречий текста, другими словами, выражает ли он позитивное или отрицательное мнение.

Говоря об уровнях сентиментального анализа, докладчица рассказала о сентиментальном анализе на уровне слов, предложений, документов и функций. Она отметила, что сентиментальный анализ на уровне слова служит определению субъективности, ориентации или противоречия слов в документе, а также количества ориентаций. Сентиментальный анализ на уровне слов выполняется на основе словаря и корпуса. Она отметила, что в словарном подходе используются различные словари (WordNet, SentiWordNet) в зависимости от характера, структуры и лексических связей слов, а на корпусной основе-междометия (синтаксис или совместные связи) в больших корпусах. Она отметила, что сентиментальный анализ на уровне предложения состоит из классификации эмоций, выраженных в каждом предложении, а сентиментальный анализ на уровне документа-из классификации выражения документа позитивных и негативных мыслей. Она также рассказала о типах сентиментального анализа, основанных на характеристике, отметив его типы слов и частоту их использования, положение термина, части речи, отрицательные слова.

По словам М.Исмаиловой в классификации сентиментального анализа представлена машина для векторов опоры (SVM), нейронная сеть, глубокое обучение (Deep Learning), наивные Байесы и др.,   и были применены методы машинного обучения.  В последние годы для сентиментального анализа используются Autoencoder Neural Network (ANN), Convolutional Neural Network (CNN), Recurrent Neural Network (RNN), Long Short Term Memory network (LSTM), Recursive Neural Network (RecNN) и т. д. отметив, что методы глубокого обучения, такие как Deep Learning, широко используются, также проинформировал о некоторых исследований, проведенных в этой области. Она также подчеркнула, что существует набор данных как Amazon Product Data, Stanford Sentiment Treebank (SSTb), Stanford Twitter Sentiment (STS), IMDB Movie Reviews Dataset и др.

Докладчица отметила, что есть такие проблемы, которые зависят от предмета анализа, включая несколько точек зрения, сравнительные предложения, секретные комментарии, многоязычный анализ настроений, выбор ключевых слов и так далее.

М.Исмаилова также подробно рассказала о конференциях, симпозиумах и «workshop» по сентиментальному анализу, а также ученых-исследователей, занимающихся этой сферой.

Состоялся обмен мнениями по докладу, были даны ответы на вопросы.

© Все права защищены. При использовании информации гиперссылка на сайт www.iсt.az обязательна.