கம்ப்யூட்டர் விஷன் பின்னணியில், பட அங்கீகாரம் என்பது, படங்களில் உள்ள பொருள்கள், இடங்கள், நபர்கள், எழுத்துக்கள் மற்றும் செயல்களை அடையாளம் காணும் மென்பொருளின் திறன் ஆகும். கணினிகள் கேமரா மற்றும் செயற்கை நுண்ணறிவு மென்பொருளுடன் இணைந்து இயந்திர பார்வை தொழில்நுட்பங்களைப் பயன்படுத்தி படத்தைப் பெறலாம்.
பட வகைப்பாடு என்பது கணினி பார்வையில் ஒரு படத்தை அதன் காட்சி உள்ளடக்கத்தின் அடிப்படையில் வகைப்படுத்தக்கூடிய ஒரு செயல்முறையைக் குறிக்கிறது. எடுத்துக்காட்டாக, ஒரு படத்தில் மனித உருவம் உள்ளதா இல்லையா என்பதைக் குறிக்க பட வகைப்பாடு அல்காரிதம் வடிவமைக்கப்படலாம். பொருள் கண்டறிதல் மனிதர்களுக்கு அற்பமானது என்றாலும், கணினி பார்வை பயன்பாடுகளுக்கு வலுவான பட வகைப்பாடு ஒரு சவாலாக உள்ளது.
இந்த ஆய்வின் நோக்கம், படம்/வீடியோ தரவு போன்ற சிக்கலான தரவை விரைவாகவும் துல்லியமாகவும் செயலாக்குவது எது என்பதைத் தீர்மானிப்பதே ஆகும், எது மிகவும் திறமையானது (மற்றும் வேகமானது) என்பதைத் தீர்மானிக்க சமீபத்திய வெற்றிகரமான நியூரல் நெட்வொர்க் கட்டமைப்புகளை ஆராய்வோம். பட வகைப்பாட்டில் கட்டிடக்கலை(கள்) மற்றும் இந்த வகை தரவுகளில் எந்த தேர்வுமுறை நுட்பங்கள் சிறப்பாக செயல்படுகின்றன என்பதையும் நாங்கள் ஆராய்வோம்.
படங்களை வகைப்படுத்துவதன் மூலம் காட்சி அங்கீகாரத்தில் ஆராய்ச்சியாளர்கள் சமீபத்தில் எவ்வாறு ஒரு பெரிய படி முன்னேறினார்கள் என்பதைப் புரிந்துகொள்ள முயற்சிக்கிறோம், மேலும் இமேஜ்நெட் சவாலில் அவர்கள் எப்படி நம்பமுடியாத துல்லிய மதிப்பெண்களைப் பெற்றனர் என்பதைப் பார்க்கிறோம். படத் தரவு போன்ற சிக்கலான தரவை எவ்வாறு விரைவாகச் செயலாக்குவது, இந்தத் தரவை மிகையாகப் பொருத்துவதில் உள்ள சிக்கலை எவ்வாறு கையாள்வது மற்றும் நமது கட்டிடக்கலையின் பயிற்சி நேரத்தை எவ்வாறு குறைக்கலாம் என்பதை கணக்கில் எடுத்துக்கொள்வது.
புதுப்பிக்கப்பட்டது:
2 ஜூலை, 2022