“Data Mining texnologiyaları” mövzusunda seminar keçirildi

05 Aprel 2018 - 16:57 | Konfranslar, İclaslar

AMEA İnformasiya Texnologiyaları İnstitutunun 1 saylı şöbəsinin “Data Mining texnologiyaları” mövzusuna həsr olunmuş növbəti elmi seminarı keçirildi.

Mövzuya dair çıxış edən şöbə əməkdaşı Elmar Qarayev Data Mining texnologiyalarının qərarların qəbuluna dəstək məqsədilə müxtəlif tipli verilənlərin intellektual analizi, verilənlərdə gizli, mürəkkəb, praktik faydalı biliklərin əldə edilməsi metodlarını özündə ehtiva etdiyini vurğuladı.

Data Mining-in tarixi haqqında məlumat verən E. Qarayev onun əvvəllər verilənlər bazasından biliyin kəşf  olunması (KDD - knowledge discovery in database) kimi adlandırıldığını, termin kimi isə Q.P. Şapiro tərəfindən 1989-cu ildə işlədildiyini diqqətə çatdırdı. Məruzəçi data mining-in deskriptiv və prediktiv məsələlərini də mərhələli şəkildə izah etdi.

Data mining-in multidissiplinar sahə olduğunu vurğulayan məruzəçi onun statistika, süni intellekt, maşın təlimi və s. özündə ehtiva etdiyini dedi. Data mining alqoritm və metodlarına klassifikasya, klasterizasiya, reqresiya, süni intellekt, neyron şəbəkər, assosiativ qaydalar, qərar ağacı, genetik alqoritmlər və s. aid olduğunu qeyd etdi.

E.Qarayev data mining metodları ilə məsələlərin həlli mərhələlərinin analiz məsələsinin qoyuluşundan, verilənlərin toplanması və hazırlanmasından, modelin seçilməsi və təlimindən, alqoritmin seçilməsindən, aşkarlanmış qanunauyğunluqların analizindən ibarət olduğunu nəzərə çatdırdı.

O, data mining texnologiyalarının müştəri əlaqələrinin idarə olunması, maliyyə, bankçılıq, reklam, elm sahələri, səhiyyə, fırıldaqçılığın aşkarlanması, pərakəndə satış, sığorta işi, e-ticarət, telekomunikasiya, sosial media, proqram təminatı, neft-qaz, enerji  və s. kimi sahələrdə tətbiq olunduğunu qeyd etdi.

Məruzəçi data mining texnologiyalarının əsasını təşkil edən klassifikasiyanı diqqət önünə çəkdi. O, klassifikasiyanın obyektlər çoxluğunun oxşarlıq və yaxınlıq əlamətlərinə görə siniflər üzrə bölünməsi prosesi olduğunu qeyd etdi.

Sonra o, bir sıra klassifikasiya alqoritmləri haqqında məlumat verdi. Bunlardan KNN (k-nearest neighbor) alqoritmi, qərarlar ağacları, Bayes klasifikasya metodu, qaydalara əsaslanan alqoritmlər, genetik alqoritmlər, neyron şəbəkələr, dəstək vektorları maşını (SVM-support vector machine) alqoritmi və digər alqoritmlərə dair məlumatları diqqətə çatdırdı.  

Daha sonra E. Qarayev data mining texnologiyalarında klassifikasiya məsələsinin həllində tətbiq olunan KNN alqoritminin daha geniş araşdırdığını söylədi.

KNN alqoritmini geniş izah edən məruzəçi onun ABŞ ordusunun hava qüvvələrinin 1951-ci ildə yayımladığı bir hesabatında Fix və Hodges  tərəfindən irəli sürüldüyünü, 1967-ci ildə Cover və Hart tərəfindən inkişaf etdirildiyini nəzərə çatdırdı. KNN adlandırılan klasifikasya alqoritminın “bir-birinə yaxın olan obyektlər ehtimal ki, eyni sinifə aiddir“ məntiqinə əsaslandığını vurğuladı. O, alqoritmin əsas ideyasının hər yeni obyektin əlamətlər fəzasında ona yaxın olan k sayda qonşunun ən çox rast gəlinəninin sinfinə aid edildiyini dedi. Məruzəçi belə obyektlərin məsafəcə yaxınlığının təyin edilməsində istifadə edilən Evklid, Manhetten, Minkovski, Çebışev metrikaları haqqında məlumat verdi.

KNN alqoritminin kredit istəklərinin dəyərləndirilməsi, xəstəlik diaqnozunun qoyulması, səslərin tanınması, surətlərin tanınması, istifadəçi davranışlarının müəyyən olunması, əl yazmalarının tanınması və s. sahələrə tətbiqinin mümkünlüyünü qeyd etdi. Bu alqoritmin klassifikasiya alqoritmləri içərisində ən sadəsi olduğundan daha çox istifadə edildiyini vurğuladı.

O, KNN alqoritminin əsas mənfi cəhətini də qeyd edərək, dəqiqliyinin az olması və hər bir nümunə üçün məsafə hesablandığından daha çox zaman itkisinə gətirib çıxardığını diqqətə çatdırdı.

Sonda məruzəyə dair fikir mübadiləsi aparıldı, suallar cavablandırıldı. İnstitutun baş mühəndisi, texnika üzrə fəlsəfə doktoru, dosent Məkrufə Hacırəhimova busahədə tədqiqatların davam etdirilərək dərinləşdirilməsini, araşdırmaların nəticəsi üzrə məqalənin hazırlanmasını, data mining sinfindən olan əsas metod və alqoritmlərin tədqiq olunaraq şöbə seminarlarında mütəmadi müzakirə olunmasını tövsiyə etdi.

© Bütün hüquqlar qorunur. Xəbərlərdən istifadə edərkən www.iсt.az saytına istinad zəruridir.