Utambuzi wa Picha, katika muktadha wa Maono ya Kompyuta, ni uwezo wa programu kutambua vitu, mahali, watu, maandishi na vitendo katika picha. Kompyuta zinaweza kutumia teknolojia ya kuona kwa mashine pamoja na kamera na programu ya akili bandia ili kufikia utambuzi wa picha.
Uainishaji wa picha unarejelea mchakato katika mwono wa kompyuta ambao unaweza kuainisha picha kulingana na maudhui yake yanayoonekana. Kwa mfano, algoriti ya uainishaji wa picha inaweza kuundwa ili kuonyesha ikiwa picha ina umbo la binadamu au la. Ingawa utambuzi wa kitu ni jambo dogo kwa wanadamu, uainishaji thabiti wa picha unasalia kuwa changamoto kwa programu za kuona za kompyuta.
Madhumuni ya utafiti huu ni kubainisha ni nini hufanya usindikaji wa data changamano wa mtandao wa neva, kama vile data ya picha/video, haraka na sahihi zaidi, tutachunguza usanifu wa hivi punde wa mtandao wa neva ili kubaini ni ipi iliyo bora zaidi (na ya haraka zaidi) usanifu katika uainishaji wa picha, na pia tutatafiti ni mbinu zipi za uboreshaji zinazofanya kazi vyema katika aina hii ya data.
Tunajaribu kuelewa jinsi watafiti walivyopiga hatua kubwa hivi majuzi katika utambuzi wa picha kwa kuainisha picha, na kuona jinsi walivyopata alama ya usahihi wa ajabu kwenye changamoto ya ImageNet. Kwa kuzingatia jinsi gani tunaweza kuchakata data changamano kama vile data ya picha kwa haraka zaidi, tunawezaje kushughulikia tatizo la kuweka data kupita kiasi kwenye data hii, na jinsi gani tunaweza kupunguza muda wa mafunzo ya usanifu wetu.
Ilisasishwa tarehe
2 Jul 2022