රූප හඳුනාගැනීම, පරිගණක දැක්මෙහි සන්දර්භය තුළ, රූපවල වස්තූන්, ස්ථාන, පුද්ගලයන්, ලේඛන සහ ක්රියාවන් හඳුනා ගැනීමට මෘදුකාංගයට ඇති හැකියාවයි. රූප හඳුනාගැනීම සඳහා පරිගණකයට කැමරාවක් සහ කෘතිම බුද්ධි මෘදුකාංගයක් සමඟ ඒකාබද්ධව යන්ත්ර දෘෂ්ඨි තාක්ෂණය භාවිතා කළ හැක.
රූප වර්ගීකරණය යනු එහි දෘශ්ය අන්තර්ගතය මත පදනම්ව රූපයක් වර්ගීකරණය කළ හැකි පරිගණක දර්ශනයේ ක්රියාවලියකි. උදාහරණයක් ලෙස, රූපයක මිනිස් රූපයක් තිබේද නැද්ද යන්න දැක්වීමට රූප වර්ගීකරණ ඇල්ගොරිතමයක් නිර්මාණය කළ හැක. වස්තු හඳුනාගැනීම මිනිසුන්ට සුළු දෙයක් වුවද, ශක්තිමත් රූප වර්ගීකරණය පරිගණක දර්ශන යෙදුම් සඳහා අභියෝගයක් ලෙස පවතී.
මෙම අධ්යයනයේ පරමාර්ථය වන්නේ රූප/වීඩියෝ දත්ත වැනි ගැඹුරු ස්නායුක ජාල සැකසීමේ සංකීර්ණ දත්ත වේගවත් සහ වඩාත් නිවැරදි බවට පත් කරන්නේ කුමක් දැයි තීරණය කිරීම, අපි වඩාත් කාර්යක්ෂම (සහ වේගවත්ම) කුමක්ද යන්න තීරණය කිරීම සඳහා නවතම සාර්ථක ස්නායුක ජාල ගෘහ නිර්මාණ ශිල්පය පරීක්ෂා කරන්නෙමු. රූප වර්ගීකරණයේ ගෘහනිර්මාණ ශිල්පය (ය) සහ අපි මෙම වර්ගයේ දත්තවල වඩාත් හොඳින් ක්රියා කරන්නේ කුමන ප්රශස්තිකරණ ශිල්පීය ක්රමදැයි පර්යේෂණ කරන්නෙමු.
පර්යේෂකයන් මෑතකදී රූප වර්ගීකරණය කිරීමෙන් දෘශ්ය හඳුනාගැනීමේ විශාල පියවරක් ඉදිරියට ගෙන ගිය ආකාරය තේරුම් ගැනීමට අපි උත්සාහ කරමු, සහ ImageNet අභියෝගයේදී ඔවුන් ඇදහිය නොහැකි නිරවද්යතා ලකුණු ලබා ගත් ආකාරය බලන්න. රූප දත්ත වැනි සංකීර්ණ දත්ත අපට වේගයෙන් සකසන්නේ කෙසේද, මෙම දත්තවල වැඩිපුර ගැළපීම පිළිබඳ ගැටලුව හැසිරවිය හැක්කේ කෙසේද සහ අපගේ ගෘහ නිර්මාණ ශිල්පයේ පුහුණු කාලය අවම කර ගත හැක්කේ කෙසේද යන්න සැලකිල්ලට ගනිමින්.
යාවත්කාලීන කළේ
2022 ජූලි 2