Video axında jestlərin tanınması prosesi tədqiq edilir

24 May 2021 - 15:50 | Konfranslar, İclaslar
Video axında jestlərin tanınması prosesi tədqiq edilir

AMEA İnformasiya Texnologiyaları İnstitutunun növbəti onlayn elmi seminarında “Video axında jestlərin tanınması prosesinin analizi” mövzusunda məruzə dinlənildi.

Məruzəni institutun baş mütəxəssisi Kəmalə Qurbanova təqdim edərək qeyd etdi ki, son  illərdə rəqəmsal texnologiyaların inkişafı elə bir səviyyəyə çatmışdır ki, müxtəlif istifadəçi qrupları, o cümlədən eşitmə və nitq əngəlli insanlar multimodal insan-maşın interfeyslərinə yiyələnərək mobil informasiya robotları ilə təmassız əlaqə qura bilirlər.

O, diqqətə çatdırdı ki, Ümumdünya Səhiyyə Təşkilatının məlumatlarına görə, dünyada təxminən 466 milyon insan rəsmi olaraq nitq və eşitmə problemi yaşayır, bunlardan 432 milyonu yetkin, 34 milyonu uşaqlardır. Vurğuladı ki, 2050-ci ilə qədər təxminən 2 milyard 500 min insanın müəyyən dərəcədə eşitmə qabiliyyətindən əziyyət çəkəcəyi və ən az 700 milyon insanın eşitmə itkisi üçün reabilitasiya xidmətinə ehtiyacı olacağı proqnozlaşdırılır. Bu səbəbdən insanın avtomatlaşdırılmış sistemlərlə qarşılıqlı əlaqə prosesi bir çox tədqiqat sahəsini əhatə edir. Bu kimi sistemlər, bir qayda olaraq, nitq və jest məlumatlarının avtomatik olaraq tanınmasına və sintez edilməsinə imkan yaradır.

Məruzəçi bildirdi ki, optik kameralardan və insan-maşın qarşılıqlı əlaqəsindən istifadə edərək hərəkətlərin video təhlili jestlərin tanınması prosesinin tərkib hissəsidir. Jest dilinin elementlərinin tanınması müasir informasiya mühitində çox aktual məsələdir.

K.Qurbanova əl hərəkətləri ilə göstərilən jestlərin tanınmasının videoanaliz üsulundan bəhs etdi. “Tanınma zamanı ələ uyğun olan şəkil sahələri seçilir və bu sahələrin nöqtələrinin (piksel) görünüşü və sahənin hərəkətinin təhlili aparılır”, – deyə o, əlavə etdi.

Tədqiqatçı diqqətə çatdırdı ki, hərəkət analizinə əsaslanan dinamik əl jestinin aşkarlanması və tanınması prosesi bir neçə mərhələyə bölünür. Bunlara videoyayım kadrlarının qeydiyyatı, video axınında əl şəkillərinin aşkarlanması, hərəkətinə görə əlin təsvirinin çərçivələrlə seqmentləşdirilməsi, ardıcıl çərçivələrdə əlin təsvirinin əsas nöqtələri arasındakı uyğunluğun təyin edilməsi, əl təsvirinin əsas nöqtələrinin hərəkət xüsusiyyətlərinin təhlili və hesablanması daxildir.

O, jestlərin aşkarlanması və bu prosesdə optimal nəticəni müəyyənləşdirmək üçün bir neçə metodu nəzərə çatdırdı. Bunlara təkmilləşdirilmiş Viola-Jones metodu, Resnet-10 modeli ilə Single Shot Multibox Dedector arxitekturaları, İstiqamətlənmiş Qradiyentlər Qiastoqramı və Dayaq Vektorları metodunun aid olduğunu söylədi.

K.Qurbanova bildirdi ki, bu metodlar kompüter görməsi və maşın təlimi üçün müasir alqoritmləri birləşdirir. Bu isə real vaxt çərçivəsində optik kamera və insan-maşın qarşılıqlı interfeysi vasitəsi ilə  əl hərəkətlərinin və jestlərin tanınmasına imkan yaradan avtomatik video analizə imkan verir.

O, bu prosesdə yaranan bəzi problemləri də qeyd etdi: Bu metodlar vasitəsilə jestlərin tanınması probleminin ən əhəmiyyətli çatışmazlığı ondan ibarətdir ki, kompüterlərdə rəngli video məlumatları real vaxtda sinxron şəkildə qəbul edə bilən texniki komponent mövcud deyil. Bu problemin həlli nəzərə alınmalıdır ki, sonrakı tədqiqatlarda daha müasir bir komponent ilə əvəz etmək mümkün olsun”.

Sonda məruzəçi vurğuladı ki, bu yanaşma jest dillərinin tanınması üçün avtomatik sistemlərin yaranmasını, həmçinin müxtəlif istifadəçi qruplarının, eşitmə və nitq məhdudiyyəti olan insanların mobil informasiya robotları ilə təmassız qarşılıqlı əlaqəsini təmin edə bilər.

Mövzu ətrafında fikir mübadiləsi aparıldı, suallar cavablandırıldı.

© Bütün hüquqlar qorunur. Xəbərlərdən istifadə edərkən www.iсt.az saytına istinad zəruridir.