छवि पहिचान, कम्प्युटर भिजनको सन्दर्भमा, छविहरूमा वस्तुहरू, ठाउँहरू, व्यक्तिहरू, लेखहरू र कार्यहरू पहिचान गर्न सफ्टवेयरको क्षमता हो। कम्प्युटरहरूले छवि पहिचान हासिल गर्न क्यामेरा र आर्टिफिसियल इन्टेलिजेन्स सफ्टवेयरको संयोजनमा मेसिन भिजन टेक्नोलोजीहरू प्रयोग गर्न सक्छन्।
छवि वर्गीकरणले कम्प्यूटर दृष्टिमा एक प्रक्रियालाई बुझाउँछ जसले छविलाई यसको दृश्य सामग्रीको आधारमा वर्गीकृत गर्न सक्छ। उदाहरण को लागी, छवि वर्गीकरण एल्गोरिदम को चित्र मा मानव आकृति समावेश छ वा छैन भनेर संकेत गर्न को लागी डिजाइन गर्न सकिन्छ। यद्यपि वस्तु पत्ता लगाउने मानिसका लागि मामूली छ, बलियो छवि वर्गीकरण कम्प्युटर दृष्टि अनुप्रयोगहरूको लागि चुनौती बनेको छ।
यस अध्ययनको उद्देश्य भनेको डिप न्यूरल नेटवर्क प्रोसेसिङ जटिल डेटा, जस्तै छवि/भिडियो डेटा, छिटो र अधिक सटीक बनाउँछ भनेर निर्धारण गर्नु हो, हामी सबैभन्दा प्रभावकारी (र सबैभन्दा छिटो) के हो भनेर निर्धारण गर्न नवीनतम सफल न्यूरल नेटवर्क आर्किटेक्चरहरूको जाँच गर्नेछौं। छवि वर्गीकरणमा वास्तुकला(हरू) र हामी यस प्रकारको डेटामा कुन अप्टिमाइजेसन प्रविधिले राम्रो काम गर्छ भनेर पनि अनुसन्धान गर्नेछौं।
हामी बुझ्न कोशिस गर्छौं कि कसरी शोधकर्ताहरूले हालसालै छविहरू वर्गीकरण गरेर भिजुअल मान्यतामा ठूलो कदम अगाडि बढाए, र तिनीहरूले ImageNet चुनौतीमा कसरी अविश्वसनीय सटीकता स्कोर गरे। हामी कसरी छवि डेटा जस्ता जटिल डेटालाई छिटो प्रशोधन गर्न सक्छौं, हामी कसरी यस डेटामा ओभरफिटिंगको समस्यालाई ह्यान्डल गर्न सक्छौं, र हामी कसरी हाम्रो वास्तुकलाको प्रशिक्षण समयलाई कम गर्न सक्छौं भन्ने कुरालाई ध्यानमा राख्दै।
मा अपडेट गरिएको
२०२२ जुलाई २