कंप्यूटर विज़न के संदर्भ में इमेज रिकॉग्निशन, इमेज में वस्तुओं, स्थानों, लोगों, लेखन और कार्यों की पहचान करने के लिए सॉफ़्टवेयर की क्षमता है। छवि पहचान प्राप्त करने के लिए कंप्यूटर कैमरा और आर्टिफिशियल इंटेलिजेंस सॉफ़्टवेयर के संयोजन में मशीन विज़न तकनीकों का उपयोग कर सकते हैं।
छवि वर्गीकरण कंप्यूटर दृष्टि में एक प्रक्रिया को संदर्भित करता है जो किसी छवि को उसकी दृश्य सामग्री के आधार पर वर्गीकृत कर सकता है। उदाहरण के लिए, एक छवि वर्गीकरण एल्गोरिदम को यह इंगित करने के लिए डिज़ाइन किया जा सकता है कि किसी छवि में मानव आकृति है या नहीं। यद्यपि वस्तु का पता लगाना मनुष्यों के लिए तुच्छ है, कंप्यूटर दृष्टि अनुप्रयोगों के लिए मजबूत छवि वर्गीकरण एक चुनौती बना हुआ है।
इस अध्ययन का उद्देश्य यह निर्धारित करना है कि गहरी तंत्रिका नेटवर्क प्रसंस्करण जटिल डेटा, जैसे कि छवि / वीडियो डेटा, तेज और अधिक सटीक, हम यह निर्धारित करने के लिए नवीनतम सफल तंत्रिका नेटवर्क आर्किटेक्चर की जांच करेंगे कि सबसे कुशल (और सबसे तेज़) क्या है। छवि वर्गीकरण में वास्तुकला (ओं), और हम यह भी शोध करेंगे कि इस प्रकार के डेटा में कौन सी अनुकूलन तकनीक सबसे अच्छा काम करती है।
हम यह समझने की कोशिश करते हैं कि कैसे शोधकर्ताओं ने हाल ही में छवियों को वर्गीकृत करके दृश्य पहचान में एक बड़ा कदम उठाया है, और देखें कि कैसे उन्होंने इमेजनेट चुनौती पर एक अविश्वसनीय सटीकता स्कोर प्राप्त किया। इस बात को ध्यान में रखते हुए कि हम छवि डेटा जैसे जटिल डेटा को तेजी से कैसे संसाधित कर सकते हैं, हम इस डेटा पर ओवरफिटिंग की समस्या को कैसे संभाल सकते हैं, और हम अपने आर्किटेक्चर के प्रशिक्षण समय को कैसे कम कर सकते हैं।
पिछली बार अपडेट होने की तारीख
2 जुल॰ 2022