Mətnlərin avtomatik referatlaşdırılması üçün model təklif olunub

21 Fevral 2019 - 09:23 | Mühüm hadisələr
Mətnlərin avtomatik referatlaşdırılması üçün model təklif olunub

İnstitut əməkdaşlarının beynəlxalq əməkdaşlıq çərçivəsində hazırladığı “COSUM: Text summarization based on clustering and optimization” (“COSUM: Klasterləşmə və optimallaşdırma əsasında mətnlərin referatlaşdırılması”) adlı məqalə İmpakt Faktoru 1.43-ə bərabər olan “Expert Systems” jurnalında dərc olunub. “Expert Systems” bilik mühəndisliyi sahəsində dərc olunan nüfuzlu jurnallardan hesab olunur.

Məqalənin müəllifləri AMEA-nın akademik-katibi, AMEA İnformasiya Texnologiyaları İnstitutunun direktoru, akademik Rasim Əliquliyev, institutun şöbə müdiri, AMEA-nın müxbir üzvü, texnika elmləri doktoru Ramiz Alıquliyev, Axen Reyn Vestfal Texniki Universitetinin (RWTH Aachen University) tələbəsi Nicat İsazadə, Malayziya Texnologiya Universitetinin Big Data Mərkəzinin elmi işçisi, fəlsəfə doktoru Asad Abdi və Malaya Universitetinin kompüter elmləri və informasiya texnologiyaları fakültəsinin elmi işçisi Norisma İdrisdir.

Son zamanlar mətnlərin avtomatik referatlaşdırılması üçün klasterləşmə, optimallaşdırma və təkamül alqoritminə əsaslanan tədqiqatlarda yüksək nəticələr əldə olunmuş və bu sahə perspektivli bir sahəyə çevrilmişdir. Məqalədə mətnlərin avtomatik referatlaşdırılması üçün klasterləşmə və optimallaşdırma metodlarına əsaslanan iki mərhələli cümlə seçimi modeli təklif olunmuşdur. Birinci mərhələdə mətndəki bütün mövzuları müəyyən etmək üçün k-means metodu ilə cümlələr klasterləşdirilir. İkinci mərhələdə isə, hər bir klasterdən əsas informasiya daşıyıcıları olan, başqa sözlə klasterlərin semantik məzmununu özündə daşıyan cümlələrin seçilməsi üçün optimallaşdırma modeli təklif olunmuşdur. Bu modeldə optimallaşdırılan məqsəd funksiyası iki kriteriyalıdır. Birinci kriteriya funksiyası seçilmiş cümlələrin mövzu əhatəliyini, ikinci kriteriya funksiyası isə, seçilmiş cümlələrin semantik cəhətdən müxtəlifliyini təmin edir.

Məlumdur ki, mətnlərin avtomatik referatlaşdırılmasında ən mühüm problemlərdən biri avtomatik yaradılmış referatın oxunaqlığıdır. Təklif edilmiş modeldə, həmçinin seçilmiş cümlələrin uzunluğuna nəzarət imkanı var ki, bu da referatın oxunaqlığı baxımından mühüm əhəmiyyət kəsb edir. Qeyd etmək lazımdır ki, bu, mətnlərin avtomatik referatlaşdırılması sahəsində yenilik hesab olunur. Nəhayət, optimallaşdırma məsələsinin həlli üçün adaptiv mutasiya strategiyasına malik diferensial təkamül alqoritmi işlənilmişdir.

Təklif olunmuş metodun effektivliyinin qiymətləndirilməsi üçün o, digər metodlarla (14 metodla) müqayisə edilmişdir. Eksperimentlər göstərmişdir ki, təklif olunan metod ROUGE-1 və ROUGE-2 metrikaları baxımından bu metodlardan daha yüksək dəqiqlik nümayiş etdirir.

© Bütün hüquqlar qorunur. Xəbərlərdən istifadə edərkən www.iсt.az saytına istinad zəruridir.