“Böyükölçülü məlumatlarda anomaliyaların aşkarlanması metodlarının analizi” mövzusunda magistr dissertasiyası müzakirə olundu

31 May 2021 - 11:58 | Konfranslar, İclaslar
“Böyükölçülü məlumatlarda anomaliyaların aşkarlanması metodlarının analizi” mövzusunda magistr dissertasiyası müzakirə olundu

AMEA İnformasiya Texnologiyaları İnstitutunda 1 saylı şöbənin “Böyükölçülü məlumatlarda anomaliyaların aşkarlanması metodlarının analizi” mövzusunda magistrlik dissertasiya işinin müzakirəsinə həsr olunmuş onlayn elmi seminarı keçirildi.

Məruzəni təqdim edən institutun magistrantı Leyla Yusifova öncə Big data konsepsiyası, Big data texnologiyalarının imkanları, anomaliyaların aşkarlanması probleminin müxtəlif aspektlərinin araşdırılması, maşın təlimi metodlarının analizi  və s. haqqında ətraflı məlumat verdi.

L.Yusifova bildirdi ki, dissertasiya işi giriş, 3 fəsil, nəticə və ədəbiyyat siyahısı da daxil olmaqla 80 səhifədən ibarətdir. Dissertasiya işində 4 cədvəl, 4 qrafik və 10 şəkil var. Ədəbiyyat siyahısının sayı isə 74-dür.

Məsələnin aktuallığını diqqətə çatdıran iddiaçı qeyd etdi ki, kompüterlər insan fəaliyyətinin bütün sferalarına nüfuz etdikcə informasiya axınının artması və XXI əsrin əvvəllərindən başlayaraq Big data fenomenin meydana gəlməsi, kredit kartlar üzrə tranzaksiya verilənlərində fırıldaqçılığın, kompüter şəbəkələrində anomal trafiklərin, şübhəli kiber aktivliyin və s. aşkarlanması Big Data analitikanın əsas məsələlərindəndir. Bu baxımdan böyük verilənlərdə şablonlara uyğun olmayan verilənlərin - anomaliyaların aşkarlanması mövzusu böyük aktuallıq kəsb edir.

Məruzəçi tədqiqat işinin əsas məqsədinin böyük verilənlərdə anomaliyaların aşkarlanmasında istifadə edilən maşın təlimi metodlarının müqayisəli şəkildə analiz etmək və şəbəkə trafiki verilənlərində anomaliyaları aşkarlamaq üçün geniş yayılmış təlim alqoritmlərini tətbiq etməkdən ibarət olduğunu söylədi.

Tədqiqatın elmi yeniliyi və praktik əhəmiyyətindən söz açan L.Yusifova bildirdi ki,  tədqiqat işində böyükölçülü şəbəkə trafiki verilənlərində DoS hücumların aşkarlanması üçün klassifikasiya ansamblına əsaslanan yanaşma təklif olunub və WEKA proqram mühitində realizasiya edilib.

Sonra o, Big data texnologiyanın elmi-nəzəri problemlərinin tədqiqindən söhbət açdı. Verilənlər probleminin həcm, sürət, müxtəliflik, həqiqiliklə əlaqədar olduğunu, Böyük verilənlərin emalı, saxlanması, vizuallaşdırma və təhlükəsizlik problemlərinin meydana çıxdığını dedi. Bildirdi ki, böyük verilənlərin analizi problemlərinə mətn analizi, video-analitika, audio-analitika və sosial-media analitikası daxildir.

L.Yusifova qeyd etdi ki, tədqiqat işinin ikinci fəslində anomaliyaların aşkarlanması metodlarının analizindən bəhs olunur. Anomaliya verilənlərdə müəyyən olunmuş normal davranışa uyğun olmayan qanunauyğunluq kimi başa düşülür və ya verilənlərin göstəricisi kimi təyin olunur.

Tədqiqatçı maşın təlimi metodlarının nəzarətli öyrənmə (Supervised Learning), nəzarətsiz öyrənmə (Unsupervised Learning), yarınəzarətli öyrənmə (Semi-supervised Learning) növlərinə ayrıldığını söylədi: “Təlimə əsaslanan alqoritmlərin isə öz növbəsində SVM (dəstək vektor maşınları), Qərar ağacı, Təsadüfi meşələr, k-yaxın qonşu, Naive-Bayes teoremi və Neyron şəbəkə növləri var”.

1950-ci illərdə Hunt tərəfindən Qərar ağacının əsası qoyulub. Qaydaların iyerarxik ardıcıl strukturda təsviri üsuludur, burada hər bir obyektə qərar verən yeganə qovşaq uyğun gəlir. Qərar ağacı maşın öyrənmə, məlumat təhlili və statistikada istifadə edilən qərar dəstəkləmə vasitəsidir”.

Məruzəçi qeyd etdi ki, təsadüfi meşələr adından da göründüyü kimi, ansambl kimi fəaliyyət göstərən çox sayda fərdi qərar ağacından ibarətdir. Təsadüfi qərar meşələri üçün ilk alqoritm 1995-ci ildə Tin Kam Ho tərəfindən təsadüfi alt məkan metodu ilə yaradılıb.

K-yaxın qonşu alqoritmi isə ilk dəfə 1951-ci ildə Evelyn Fix və Joseph Hodges tərəfindən hazırlanmış metoddur. k-NN alqoritmindən, k ən oxşar halların və ya itkin məlumat sətri ilə eyni naxışları göstərən qonşuların sayını axtarmaq üçün istifadə edilir.

L.Yusifova əlavə etdi ki, neyron şəbəkə 1943-cü ildə yaranıb. Bioloji neyron şəbəkələrin - canlıların sinir hüceyrələrinin şəbəkələrinin təşkili və işləməsi prinsipi əsasında qurulmuş riyazi modeldir, həmçinin proqram və ya aparat tətbiqidir.

Daha sonra tədqiqatçı vurğuladı ki, dissertasiya işinin üçüncü fəsli böyük məlumatlarda anomaliyaların aşkarlanmasında maşın təlimi alqoritmlərinin realizasiyasına həsr olunub.

O, WEKA (Waikato Environment for Knowledge Analysis) proqram platformasından da söz açdı. “WEKA açıq proqram təminatının ilkin versiyası 1993-cü ildə Yeni Zelandiyanın Vaikato universitetində Java proqramlaşdırma dilində yazılmışdır. WEKA tədqiqatçılara ilkin emal alətləri, çoxsaylı klassifikasiya və klasterizasiya, reqresiya metodları təqdim edir və nəticələrin vizuallaşdırılması imkanı verir”, - deyə iddiaçı əlavə etdi.

L.Yusifova bildirdi ki, həyata keçirilmiş təcrübələr, böyük şəbəkə trafiki verilənlərində anomaliyaların aşkarlanmasında təlimə əsaslanan maşın təlimi alqoritmlərinin istifadəsinin mümkünlüyüni göstərir. Data set-dəki xüsusiyyətləri seçməklə məlumat ölçüsünü azaltmağa və nəticə etibarı ilə təsnifatlandırma alqoritmlərinin səmərəliliyini, dəqiqliyini artırmağa, modelin seçilməsi prosedurunun sadələşdirilməsinə, hesablama xərclərinin azaldılmasına, yaddaşa, qənaətə  və s. nail olmaq olar.

Sonda magistr dissertasiya işi ilə bağlı müzakirələr aparıldı,  iddiaçı çoxsaylı sualları cavablandırdı.

© Bütün hüquqlar qorunur. Xəbərlərdən istifadə edərkən www.ict.az saytına istinad zəruridir.