AMEA İnformasiya Texnologiyaları İnstitutunun 2 saylı şöbəsinin “Böyük verilənlərdə anomaliyaların aşkarlanması üçün klassifikatorların hibridləşdirilməsi” mövzusuna həsr olunmuş növbəti elmi seminar keçirildi.
Məruzəni təqdim edən institutun aparıcı elmi işçisi, texnika üzrə fəlsəfə doktoru, dosent Fərqanə Abdullayeva mövzunun aktuallığını qeyd edərək bulud infrastrukturunun təhlükəsizliyini təmin etmək üçün bu infrastrukturun aparat təminatı, sistemlərin vəziyyəti və proqram təminatlarının yerinə yetirilməsində baş verə bilən keyfiyyət göstəriciləri anomaliyalarının aşkarlanmasının vacib məsələlərdən olduğunu diqqətə çatdırdı.
Bildirdi ki, bulud texnologiyaları müasir İKT-nin ən mühüm yeniliklərindən biridir və mürəkkəb hesablamaları həyata keçirə bilən nəhəng arxitekturaya malikdir. Virtuallaşmış resurslar, parallel hesablamalar, miqyaslanan verilən saxlanclarında verilənlərin inteqrasiya oluna bilməsi bulud texnologiyalarının üstünlüklərindəndir. Onun sözlərinə görə, bulud platformasından istifadə edən proqram tətbiqlərinin sayının artması bu mühitdə generasiya olunan verilənlərin miqyasının kəskin artmasına səbəb olmuşdur.
Bulud sisteminin istifadəçilərə sorğu əsasında elastik resurslar təqdim etdiyini söyləyən məruzəçi bu sistemlərə istənilən qurğu vasitəsilə daxil olmağın mümkünlüyünü və açıq şəbəkələrdən istifadə etməsini bulud mühitini müxtəlif tipli kiber-hücumların təsirinə məruz qoyduğunu qeyd etdi.
F.Abdullayeva bulud mühitində informasiya təhlükəsizliyi hücumlarının reallaşmasının sistemin yaddaş, prosessor resurslarında anomal davranışlar yaratdığını söylədi, bulud sistemində anomal davranışı real zamanda aşkarlamaq üçün resurs sərfiyyatının vəziyyətinin qiymətləndirilməsinin zəruri olduğunu vurğuladı: “Bu qiymətləndirmənin zaman sıraları ilə təsvir edilmiş server kriteriyalarını izləməklə təmin edilməsi məqsədəuyğundur”.
Bu sistemlərin generasiya etdiyi böyük həcmdə verilənlər sinfinin təsnifatlaşdırılması prosesinin böyük xərc və vaxt tələb etdiyini bildirən məruzəçi bu məsələnin həllində anomaliyaların təsnif edilməmiş verilənlər əsasında yarım-öyrədilən (semi-supervised) aşkarlanması yanaşmasının qənaətbəxş olduğunu bildirdi.
“Klassifikatorlar ansamblı ideyasına əsaslanan model Bayes klassifikatorları, neyron şəbəkələri və qərar ağacları kimi məşhur klassifikator siniflərinə daxil olan alqoritmlər əsasında qurulmuşdur”, – deyə bildirən F.Abdullayeva modeldə çoxsaylı klassifikatorların istifadə edilməsində məqsədin modelin anomaliyaları aşkarlama dəqiqliyini yüksəltmək olduğunu bildirdi.
F.Abdullayeva təklif edilən modelin effektivliyinin qiymətləndirilməsinin “Google cluster trace” və “Yahoo!S5” açıq bulud verilənlər bazaları üzərində aparıldığını və aşkarlama dəqiqliyinin bir sıra metrikalar əsasında qiymətləndirildiyini vurğuladı.
Eksperimentlərin aparılması üçün istifadə olunan “Google cluster trace” verilənlər bazasının “machine usage” loq yazıları 6 elementdən ibarət əlamət vektorundan və 1048576 sətrdən ibarət olaraq təşkil olunmuşdur. Burada toplanmış verilənlər kifayət qədər böyük həcmə malikdir. Bu həcmə malik verilənlərin fərdi kompüterlər vasitəsi ilə emalı demək olar ki, qeyri-mümkün hesab olunur. Bu səbəbdən işdə təklif edilmiş üsulun eksperimental tədqiqi AMEA İnformasiya Texnologiyaları İnstitutunun nəzdində fəaliyyət göstərən AzScienceNet elm-kompüter şəbəkəsində bulud mühitində aparılmışdır.
Sonda məruzəçi qeyd etdi ki, modelin mövcud verilənlər bazaları üzərində test olunması zamanı onun anomaliyaları aşkarlanması prosesində yüksək nəticələr əldə olunmuşdur.
Məruzə ətrafında müzakirələr aparıldı, suallar cavablandırıldı.
© Bütün hüquqlar qorunur. Xəbərlərdən istifadə edərkən www.iсt.az saytına istinad zəruridir.