В Институте информационных технологий НАНА состоялся очередной научный семинар отдела № 1.
С докладом на тему «Сентиментальный анализ: проблемы и существующие подходы» выступила старший научный сотрудник института Марзия Исмайлова, которая дала подробную информацию о нем.
Докладчица отметила, что сентиментальный анализ характеризуется обработкой естественного языка (Natural Language Processing), извлечением, распознаванием или другими методами эмоционального содержания текста из текстовых документов с использованием статистических или машинных методов обучения.
М.Исмайлова отметила, что компьютерный сентиментальный анализ осуществляется с наличием субъективных текстов в Интернете. Она отметила, что целью сентиментального анализа является поиск идей в тексте и определение их особенностей.
По её словам, сентиментальный анализ – это сложный многоязычный вопрос, который включает обработку естественного языка, веб-анализ и машинное обучение. Она подчеркнула, что классификация субъективности – это метод классификации предложений, который выражается или не выражается как идея, а сентиментальная классификация – это метод поиска противоречий текста, другими словами, выражает ли он позитивное или отрицательное мнение.
Говоря об уровнях сентиментального анализа, докладчица рассказала о сентиментальном анализе на уровне слов, предложений, документов и функций. Она отметила, что сентиментальный анализ на уровне слова служит определению субъективности, ориентации или противоречия слов в документе, а также количества ориентаций. Сентиментальный анализ на уровне слов выполняется на основе словаря и корпуса. Она отметила, что в словарном подходе используются различные словари (WordNet, SentiWordNet) в зависимости от характера, структуры и лексических связей слов, а на корпусной основе-междометия (синтаксис или совместные связи) в больших корпусах. Она отметила, что сентиментальный анализ на уровне предложения состоит из классификации эмоций, выраженных в каждом предложении, а сентиментальный анализ на уровне документа-из классификации выражения документа позитивных и негативных мыслей. Она также рассказала о типах сентиментального анализа, основанных на характеристике, отметив его типы слов и частоту их использования, положение термина, части речи, отрицательные слова.
По словам М.Исмаиловой в классификации сентиментального анализа представлена машина для векторов опоры (SVM), нейронная сеть, глубокое обучение (Deep Learning), наивные Байесы и др., и были применены методы машинного обучения. В последние годы для сентиментального анализа используются Autoencoder Neural Network (ANN), Convolutional Neural Network (CNN), Recurrent Neural Network (RNN), Long Short Term Memory network (LSTM), Recursive Neural Network (RecNN) и т. д. отметив, что методы глубокого обучения, такие как Deep Learning, широко используются, также проинформировал о некоторых исследований, проведенных в этой области. Она также подчеркнула, что существует набор данных как Amazon Product Data, Stanford Sentiment Treebank (SSTb), Stanford Twitter Sentiment (STS), IMDB Movie Reviews Dataset и др.
Докладчица отметила, что есть такие проблемы, которые зависят от предмета анализа, включая несколько точек зрения, сравнительные предложения, секретные комментарии, многоязычный анализ настроений, выбор ключевых слов и так далее.
М.Исмаилова также подробно рассказала о конференциях, симпозиумах и «workshop» по сентиментальному анализу, а также ученых-исследователей, занимающихся этой сферой.
Состоялся обмен мнениями по докладу, были даны ответы на вопросы.
© Все права защищены. При использовании информации гиперссылка на сайт www.iсt.az обязательна.