इमेज रेकग्निशन, कॉम्प्युटर व्हिजनच्या संदर्भात, प्रतिमांमधील वस्तू, ठिकाणे, लोक, लेखन आणि क्रिया ओळखण्याची सॉफ्टवेअरची क्षमता आहे. प्रतिमा ओळख मिळवण्यासाठी संगणक कॅमेरा आणि कृत्रिम बुद्धिमत्ता सॉफ्टवेअरच्या संयोगाने मशीन व्हिजन तंत्रज्ञान वापरू शकतात.
प्रतिमेचे वर्गीकरण म्हणजे संगणकाच्या दृष्टीमधील एका प्रक्रियेचा संदर्भ आहे जी प्रतिमा त्याच्या दृश्य सामग्रीवर आधारित वर्गीकृत करू शकते. उदाहरणार्थ, प्रतिमेमध्ये मानवी आकृती आहे की नाही हे दर्शविण्यासाठी प्रतिमा वर्गीकरण अल्गोरिदम डिझाइन केले जाऊ शकते. जरी मानवांसाठी ऑब्जेक्ट शोधणे क्षुल्लक असले तरी, मजबूत प्रतिमा वर्गीकरण हे संगणक दृष्टी अनुप्रयोगांसाठी एक आव्हान आहे.
या अभ्यासाचे उद्दिष्ट म्हणजे डीप न्यूरल नेटवर्क प्रोसेसिंग कॉम्प्लेक्स डेटा, जसे की इमेज/व्हिडिओ डेटा, जलद आणि अधिक अचूक काय बनवते हे निर्धारित करणे, सर्वात कार्यक्षम (आणि वेगवान) काय आहे हे निर्धारित करण्यासाठी आम्ही नवीनतम यशस्वी न्यूरल नेटवर्क आर्किटेक्चरचे परीक्षण करू. प्रतिमा वर्गीकरणामध्ये आर्किटेक्चर आणि आम्ही या प्रकारच्या डेटामध्ये कोणते ऑप्टिमायझेशन तंत्र सर्वोत्तम कार्य करते यावर देखील संशोधन करू.
प्रतिमांचे वर्गीकरण करून संशोधकांनी अलीकडेच व्हिज्युअल ओळखीमध्ये एक मोठे पाऊल कसे पुढे टाकले हे समजून घेण्याचा आम्ही प्रयत्न करतो आणि इमेजनेट चॅलेंजवर त्यांनी अविश्वसनीय अचूकता स्कोअर कसा मिळवला ते पाहतो. आम्ही इमेज डेटा सारख्या जटिल डेटावर जलद प्रक्रिया कशी करू शकतो, आम्ही या डेटावर ओव्हरफिटिंगची समस्या कशी हाताळू शकतो आणि आमच्या आर्किटेक्चरचा प्रशिक्षण वेळ कसा कमी करू शकतो हे लक्षात घेऊन.
या रोजी अपडेट केले
२ जुलै, २०२२