Статья «Classification ensemble based anomaly detection in network traffic» («Обнаружение аномалий в сетевом трафике на основе ансамбля классификации»), соавторами которой являются заведующий отделом Института информационных технологий НАНА, член-корреспондент НАНА, доктор технических наук Рамиз Алыгулиев и главный инженер Отдела №1, доктор философии по технике, доцент Макруфа Гаджирагимова, опубликована в журнале Review of Computer Engineering Research. Журнал индексируется в таких научных базах, как Crossref, Scilit (Швецария), Web Global Serials Directory (США), CNKI Scholar (Китай), China National Scientific Reports Database (Китай), Socionet (Россия), Q-Sense (Германия), DOI, Google Scholar, Microsoft Academic Search, Worldcat, CiteFactor.
В статье говорится, что обнаружение аномалий является ключевой проблемой в анализе данных и широко используется для обнаружения сетевых угроз. Анализ logфайлов в компьютерных сетях, раннее обнаружение опасных трафиков, принятие мер по предотвращению атак, фильтрация ранее невстречаемых и вредоносных данных имеют важное значение в обеспечение безопасности сети. С этой целью в статье предложена модель ансамбля классификации для более точного обнаружения аномалий в различных объектах информационной безопасности на основе аналитики Big Data. В предлагаемой модели объект исследования был взят сетевой трафик, рассматриваемый как источник Big Data.
Для обнаружения аномалий в сетевом трафике были использованы обучающие (125973 статьи) и тестовые (22544 статьи) файлы .arff набора данных NSL-KDD. В модели сначала на основе всех признаков векторов по классификаторам J48, LogitBoost, IBk, AdaBoost, RandomTree отдельно тестировалось обнаружение аномалий. Затем была реализована комбинация этих классификаторов. Метод Stacking применен в создании ансамбля классификаторов, а функция SVM Radial Basisбыла классифицирована как meta -классификатор в группе классификации. Результаты, полученные в программной среде WEKA, показали, что ансамбль классификатора выше точности обнаружения отдельных классификаторов.
Чтобы оценить эффективность предложенной модели, ее сравнили с другими пятью классификаторами. Точность обнаружения классификаторов оценена на основе таких метрик, как точность (precision), отзыв (recall), ложные положительные обстоятельства (false positive rate-FPR), истинные положительные обстоятельства (true positive rate - TP), f-мера (f-measure), истинность (aсcuracy). Результаты экспериментов показали, что предложенная модель ансамбля классификации демонстрирует большую точность, чем классификаторы, взятые отдельно с точки зрения этих метрик.
Отметим, что эта работа проводилась в рамках грант проекта Фонда развития науки при Президенте Азербайджанской Республики (EİF-KETPL-2-2015-1(25)-56/05/).
© Все права защищены. При использовании информации гиперссылка на сайт www.iсt.az обязательна.