В Институте информационных технологий НАНА состоялся очередной научный семинар отдела №13, посвященный обсуждению книги «Кластеризация данных. Алгоритмы и исследования» (“Data Clustering. Algorithms and Applications”).
Магистрант института Шалала Мансурова рассказала об интеллектуальном анализе данных, о выборе признаков, как одного из решений проблем в вопросах машинного обучения и о кластеризации данных, охватывающих вторую главу книги.
Ш.Мансурова предоставила информацию о ключевых этапах и моделях выбора признаков, как одного из решений многомерных проблем в вопросах интеллектуального анализа данных. Она отметила, что для выбора признаков, существуют такие ключевые этапы, как «subsetgeneration», «subsetevaluation», «stoppingcriterion» и «resultvalidation». В основном, для выбора признаков используются модели «filter», «wrapper», «hybrid».
Рассказывая об основных методах, используемых при кластерном анализе данных, она подчеркнула, что сюда входят и «partitioning», «hierarchical», «density-based» методы. Также проинформировала об алгоритмах общих данных, текстовых данных, потоковых данных, связанных данных и других и в качестве примера отметила алгоритмы Spectral FS, Laplacian Score (LS), MultiClaster FS (MCFS), Featureweightingk-Means. Проанализированы проблемы выбора модели, масштабирования, а также некоторые другие проблемы.
В заключение состоялся обмен мнениями, прозвучали ответы на вопросы. Научный руководитель магистранта, член-корреспондент НАНА, доктор технических наук Рамиз Алыгулиев озвучил рекомендации для дальнейшего углубления исследований.
© Все права защищены. При использовании информации гиперссылка на сайт www.iсt.az обязательна.