Препознавање слика, у контексту компјутерског вида, је способност софтвера да идентификује објекте, места, људе, списе и радње на сликама. Рачунари могу да користе технологије машинског вида у комбинацији са камером и софтвером за вештачку интелигенцију да би постигли препознавање слике.
Класификација слике се односи на процес у компјутерском виду који може класификовати слику на основу њеног визуелног садржаја. На пример, алгоритам за класификацију слика може бити дизајниран да покаже да ли слика садржи људску фигуру или не. Иако је детекција објеката тривијална за људе, робусна класификација слика остаје изазов за апликације компјутерског вида.
Циљ ове студије је да утврди шта чини дубоку неуронску мрежу која обрађује сложене податке, као што су слике/видео подаци, бржом и тачнијом, ми ћемо испитати најновије успешне архитектуре неуронских мрежа како бисмо утврдили шта је најефикасније (и најбрже) архитектуре(е) у класификацији слика, а такође ћемо истражити које технике оптимизације најбоље функционишу у овој врсти података.
Покушавамо да разумемо како су истраживачи недавно направили велики корак напред у визуелном препознавању класификујући слике и да видимо како су постигли невероватну тачност на ИмагеНет изазову. Узимајући у обзир како можемо брже да обрађујемо сложене податке као што су подаци о слици, како можемо да се носимо са проблемом прекомерног прилагођавања ових података и како можемо да минимизирамо време обуке наше архитектуре.