AMEA İnformasiya Texnologiyaları İnstitutunun 3 saylı şöbəsinin növbəti onlayn seminarı “Loq faylların intellektual analiz metodlarının müqayisəli analizi” mövzusuna həsr olunub.
Bu mövzuda institutun magistrantı Fuad Əhmədov çıxış edərək loq fayllar, klasterizasiya və klassifikasiya alqoritmləri, eləcə də onların iş prinsipi haqqında ətraflı məlumat verib.
Məruzəçi diqqətə çatdırıb ki, klasterizasiya metodunda klasterlər əvvəlcədən məlum olmur. Bu zaman verilənlər ümumi xüsusiyyətlərinə görə qruplaşdırılır. “Klassifikasiya metodunda isə klasterizasiyadan fərqli olaraq obyekt yaxud verilənlər əvvəlcədən müəyyən edilmiş kateqoriyalar üzrə qruplaşdırılır”, - deyə o, əlavə edib.
Klasterizasiya alqoritmləri haqqında ətraflı məlumat verən F.Əhmədov onların əsas məqsədinin müəyyən olunmuş klasterlər arasındakı məsafəni maksimallaşdırmaq və klaster daxilindəki verilənlər arası məsafəni minimallaşdırmaqdan ibarət olduğunu bildirib. Söyləyib ki, klasterizasiya alqoritmlərinə K-Means, E-M (Expectation and Maximization), CURE (Clastering using Representatives) aiddir.
Onun sözlərinə görə, K-Means böyükhəcmli verilənlərin klasterləşdirilməsi üçün istifadə olunur. Metodik olaraq ilkin “böyük verilənlər” əvvəlcə paketlərə bölünür,daha sonra isə paralel olaraq klasterləşdirilir: “CURE ixtiyari formalı klasterlər ilə işləyə bilir, kənar verilənləri effektiv şəkildə klasterləşdirir. E-M isə 3- expectation, maximization, təkrarlanma və ya iterasiya mərhələsindən ibarətdir. Xüsusilə maşın təlimində problemlərin həlli zamanı E-M mərhələlərinin tətbiq olunması olduqca asandır".
Sonra tədqiqatçı klassifikasiya alqoritmləri haqqında söhbət açaraq qeyd edib ki, onun K-Nearest Neighbors (KNN), Naive Bayes və Decision Trees növləri var.
Məruzəçi klassifikasiya alqoritmlərin bəzi xüsusiyyətlərini də nəzərə çatdırıb: “KNN sürətli hesablama, yüksək dəqiqliklə təsnif etmə xüsusiyyətlərinə malikdir, tətbiqi və şərhi asandır. Naive Bayes Bayes teoreminə əsaslanan klassifikasiya alqoritmidir, tətbiqi asandır, xüsusilə də çox böyük dataset-lər üçün əlverişli hesab olunur. Decision Trees isə klassifikasiya metodunun ən effektiv alqoritmlərindən hesab olunur. Alqoritm verilən məlumatlara sual verməklə alınmış nəticələri təsnif edir. Başa düşülməsi,şərh olunması və tətbiqi asandır, həm ədədi,həm də kateqoriyalı verilənlərlə işləyə bilir”.
O, loqların analizi və K-Means klasterizasiya metodundan istifadə etməklər kiber profilləşdirmə, böyük verilənlər bazaları üçün səmərəli CURE alqoritmi, E-M klasterizasiya alqoritminin müqayisəli analizi, loqlarda anomaliyaların aşkarlanması üçün təkmilləşdirilmiş KNN alqoritmi, loq faylların analizi üçün Naive Bayes filtrləri, eləcə də veb loqlarının mininqi üçün Decision Trees alqoritmi haqqında əsas məqamları vurğulayıb.
Sonda F.Əhmədov seminar iştirakçılarının suallarını cavablandırıb.
İnstitutun icraçı direktoru, şöbə müdiri, texnika üzrə fəlsəfə doktoru, dosent Rəşid Ələkbərov loq fayllar, klasterizasiya və klassifikasiya ilə bağlı beynəlxalq təcrübənin araşdırılmasının, məqalələrin hazırlanmasının zəruriliyini qeyd edib.
© Bütün hüquqlar qorunur. Xəbərlərdən istifadə edərkən www.iсt.az saytına istinad zəruridir.