Prepoznavanje slik je v kontekstu računalniškega vida zmožnost programske opreme za prepoznavanje predmetov, krajev, ljudi, zapisov in dejanj v slikah. Računalniki lahko uporabljajo tehnologije strojnega vida v kombinaciji s kamero in programsko opremo za umetno inteligenco, da dosežejo prepoznavanje slike.
Klasifikacija slik se nanaša na proces v računalniškem vidu, ki lahko razvrsti sliko na podlagi njene vizualne vsebine. Na primer, algoritem za klasifikacijo slik je lahko zasnovan tako, da pokaže, ali slika vsebuje človeško figuro ali ne. Čeprav je zaznavanje predmetov za ljudi nepomembno, robustna klasifikacija slik ostaja izziv za aplikacije računalniškega vida.
Cilj te študije je ugotoviti, zakaj je globoka nevronska mreža, ki obdeluje kompleksne podatke, kot so slikovni/video podatki, hitrejša in natančnejša, preučili bomo najnovejše uspešne arhitekture nevronskih omrežij, da bi ugotovili, kaj je najučinkovitejše (in najhitrejše) arhitekturo(-e) pri klasifikaciji slik, raziskali pa bomo tudi, katere tehnike optimizacije najbolje delujejo pri tej vrsti podatkov.
Poskušamo razumeti, kako so raziskovalci pred kratkim naredili velik korak naprej pri vizualnem prepoznavanju z razvrščanjem slik, in videti, kako so dosegli neverjetno oceno natančnosti pri izzivu ImageNet. Ob upoštevanju, kako lahko hitreje obdelamo zapletene podatke, kot so slikovni podatki, kako se lahko spopademo s problemom prekomernega prilagajanja teh podatkov in kako lahko skrajšamo čas usposabljanja naše arhitekture.
Posodobljeno dne
2. jul. 2022