Rozpoznávání obrazu v kontextu počítačového vidění je schopnost softwaru identifikovat předměty, místa, lidi, nápisy a akce v obrazech. Počítače mohou využívat technologie strojového vidění v kombinaci s kamerou a softwarem umělé inteligence k dosažení rozpoznání obrazu.
Klasifikace obrazu se týká procesu v počítačovém vidění, který dokáže klasifikovat obraz na základě jeho vizuálního obsahu. Algoritmus klasifikace obrazu může být například navržen tak, aby indikoval, zda obraz obsahuje lidskou postavu či nikoli. Ačkoli je detekce objektů pro člověka triviální, robustní klasifikace obrazu zůstává pro aplikace počítačového vidění výzvou.
Cílem této studie je zjistit, co dělá hlubokou neuronovou síť zpracovávající složitá data, jako jsou obrazová/video data, rychlejší a přesnější, prozkoumáme nejnovější úspěšné architektury neuronových sítí, abychom určili, co je nejúčinnější (a nejrychlejší) architekturu(y) v klasifikaci obrázků a také prozkoumáme, které optimalizační techniky fungují nejlépe v tomto typu dat.
Snažíme se pochopit, jak vědci nedávno udělali velký krok vpřed ve vizuálním rozpoznávání pomocí klasifikace obrázků, a uvidíme, jak dosáhli neuvěřitelného skóre přesnosti ve výzvě ImageNet. Vezmeme-li v úvahu, jak můžeme zpracovávat složitá data, jako jsou obrazová data, rychleji, jak se vypořádat s problémem přeplňování těchto dat a jak můžeme minimalizovat čas školení naší architektury.
Datum aktualizace
2. 7. 2022