Şəkillərin tanınması, Kompüter Görməsi kontekstində proqram təminatının şəkillərdəki obyektləri, yerləri, insanları, yazıları və hərəkətləri müəyyən etmək qabiliyyətidir. Kompüterlər təsvirin tanınmasına nail olmaq üçün kamera və süni intellekt proqramı ilə birlikdə maşın görmə texnologiyalarından istifadə edə bilər.
Təsvirin təsnifatı, vizual məzmununa görə təsviri təsnif edə bilən kompüter görmə prosesinə aiddir. Məsələn, təsvirin təsnifat alqoritmi təsvirdə insan fiqurunun olub-olmadığını göstərmək üçün tərtib edilə bilər. Obyekt aşkarlanması insanlar üçün əhəmiyyətsiz olsa da, görüntünün möhkəm təsnifatı kompüter görmə tətbiqləri üçün problem olaraq qalır.
Bu tədqiqatın məqsədi dərin neyron şəbəkəsini şəkil/video məlumatları kimi mürəkkəb verilənləri nəyin daha sürətli və dəqiq emal etdiyini müəyyən etməkdir. Biz ən effektiv (və ən sürətli) olanı müəyyən etmək üçün ən son uğurlu neyron şəbəkə arxitekturalarını araşdıracağıq. təsvirin təsnifatında arxitektura(lar) və biz həmçinin bu tip məlumatlarda hansı optimallaşdırma üsullarının ən yaxşı işlədiyini araşdıracağıq.
Biz tədqiqatçıların bu yaxınlarda şəkilləri təsnif etməklə vizual tanınmada necə böyük addım atdıqlarını anlamağa çalışırıq və onların ImageNet problemində necə inanılmaz dəqiqlik balı topladıqlarını görməyə çalışırıq. Nəzərə alsaq ki, təsvir məlumatları kimi mürəkkəb məlumatları necə daha sürətli emal edə bilərik, bu məlumatlara həddən artıq uyğunlaşma problemini necə həll edə bilərik və arxitekturamızın məşq vaxtını necə minimuma endirəcəyik.
Güncəlləmə vaxtı
2 iyl 2022