გამოსახულების ამოცნობა, კომპიუტერული ხედვის კონტექსტში, არის პროგრამული უზრუნველყოფის უნარი, ამოიცნოს ობიექტები, ადგილები, ადამიანები, ნაწერები და მოქმედებები სურათებში. კომპიუტერებს შეუძლიათ გამოიყენონ მანქანური ხედვის ტექნოლოგიები კამერასთან და ხელოვნური ინტელექტის პროგრამულ უზრუნველყოფასთან ერთად გამოსახულების ამოცნობის მისაღწევად.
გამოსახულების კლასიფიკაცია ეხება პროცესს კომპიუტერულ ხედვაში, რომელსაც შეუძლია გამოსახულების კლასიფიკაცია მისი ვიზუალური შინაარსის მიხედვით. მაგალითად, გამოსახულების კლასიფიკაციის ალგორითმი შეიძლება შეიქმნას იმისთვის, რომ მიუთითოს, შეიცავს თუ არა სურათი ადამიანის ფიგურას. მიუხედავად იმისა, რომ ობიექტების აღმოჩენა ტრივიალურია ადამიანისთვის, გამოსახულების ძლიერი კლასიფიკაცია კვლავ გამოწვევად რჩება კომპიუტერული ხედვის აპლიკაციებისთვის.
ამ კვლევის მიზანია იმის დადგენა, თუ რა ხდის ღრმა ნერვულ ქსელს, რომელიც ამუშავებს კომპლექსურ მონაცემებს, როგორიცაა სურათი/ვიდეო მონაცემები, უფრო სწრაფი და ზუსტი, ჩვენ განვიხილავთ უახლეს წარმატებულ ნერვულ ქსელის არქიტექტურას, რათა დავადგინოთ რომელია ყველაზე ეფექტური (და ყველაზე სწრაფი) არქიტექტურ(ებ)ი სურათების კლასიფიკაციაში და ჩვენ ასევე გამოვიკვლევთ, რომელი ოპტიმიზაციის ტექნიკა მუშაობს საუკეთესოდ ამ ტიპის მონაცემებში.
ჩვენ ვცდილობთ გავიგოთ, როგორ გადადგნენ მკვლევარებმა ცოტა ხნის წინ დიდი ნაბიჯი ვიზუალური ამოცნობის მიმართულებით სურათების კლასიფიკაციით და ვნახოთ, როგორ დააგროვეს წარმოუდგენელი სიზუსტის ქულა ImageNet გამოწვევაზე. იმის გათვალისწინებით, თუ როგორ შეგვიძლია უფრო სწრაფად დავამუშაოთ რთული მონაცემები, როგორიცაა გამოსახულების მონაცემები, როგორ გავუმკლავდეთ ამ მონაცემებზე გადატვირთვის პრობლემას და როგორ შევამციროთ ჩვენი არქიტექტურის ტრენინგის დრო.