ઇમેજ રેકગ્નિશન, કમ્પ્યુટર વિઝનના સંદર્ભમાં, છબીઓમાં ઑબ્જેક્ટ્સ, સ્થાનો, લોકો, લખાણો અને ક્રિયાઓને ઓળખવા માટે સોફ્ટવેરની ક્ષમતા છે. ઇમેજની ઓળખ મેળવવા માટે કમ્પ્યુટર્સ કેમેરા અને આર્ટિફિશિયલ ઇન્ટેલિજન્સ સૉફ્ટવેર સાથે સંયોજનમાં મશીન વિઝન ટેક્નોલોજીનો ઉપયોગ કરી શકે છે.
છબી વર્ગીકરણ એ કમ્પ્યુટર વિઝનમાં એક પ્રક્રિયાનો સંદર્ભ આપે છે જે તેની દ્રશ્ય સામગ્રીના આધારે છબીને વર્ગીકૃત કરી શકે છે. ઉદાહરણ તરીકે, ઇમેજ ક્લાસિફિકેશન એલ્ગોરિધમ એ દર્શાવવા માટે ડિઝાઇન કરી શકાય છે કે ઇમેજમાં માનવ આકૃતિ છે કે નહીં. માનવીઓ માટે ઑબ્જેક્ટ શોધ નજીવી હોવા છતાં, મજબૂત ઇમેજ વર્ગીકરણ એ કમ્પ્યુટર વિઝન એપ્લિકેશન્સ માટે એક પડકાર છે.
આ અભ્યાસનો ઉદ્દેશ એ નિર્ધારિત કરવાનો છે કે ડીપ ન્યુરલ નેટવર્ક પ્રોસેસિંગ જટિલ ડેટા, જેમ કે ઇમેજ/વિડિયો ડેટા, ઝડપી અને વધુ સચોટ બનાવે છે, અમે સૌથી કાર્યક્ષમ (અને સૌથી ઝડપી) શું છે તે નિર્ધારિત કરવા માટે અમે નવીનતમ સફળ ન્યુરલ નેટવર્ક આર્કિટેક્ચરની તપાસ કરીશું. ઇમેજ વર્ગીકરણમાં આર્કિટેક્ચર(ઓ) અને અમે એ પણ સંશોધન કરીશું કે કઈ ઑપ્ટિમાઇઝેશન તકનીક આ પ્રકારના ડેટામાં શ્રેષ્ઠ કામ કરે છે.
અમે એ સમજવાનો પ્રયાસ કરીએ છીએ કે સંશોધકોએ તાજેતરમાં છબીઓનું વર્ગીકરણ કરીને વિઝ્યુઅલ રેકગ્નિશનમાં કેવી રીતે મોટું પગલું ભર્યું, અને જુઓ કે કેવી રીતે તેઓએ ઈમેજનેટ ચેલેન્જ પર અકલ્પનીય ચોકસાઈનો સ્કોર બનાવ્યો. અમે કેવી રીતે ઇમેજ ડેટા જેવા જટિલ ડેટાને ઝડપથી પ્રક્રિયા કરી શકીએ છીએ, આ ડેટા પર ઓવરફિટિંગની સમસ્યાને કેવી રીતે હેન્ડલ કરી શકીએ છીએ અને અમે અમારા આર્કિટેક્ચરના તાલીમ સમયને કેવી રીતે ઘટાડી શકીએ છીએ તે ધ્યાનમાં લેતા.
આ રોજ અપડેટ કર્યું
2 જુલાઈ, 2022