Pengecaman Imej, dalam konteks Penglihatan Komputer, ialah keupayaan perisian untuk mengenal pasti objek, tempat, orang, tulisan dan tindakan dalam imej. Komputer boleh menggunakan teknologi penglihatan mesin dalam kombinasi dengan kamera dan perisian kecerdasan buatan untuk mencapai pengecaman imej.
Pengelasan imej merujuk kepada proses dalam penglihatan komputer yang boleh mengklasifikasikan imej berdasarkan kandungan visualnya. Sebagai contoh, algoritma pengelasan imej boleh direka bentuk untuk menunjukkan sama ada imej mengandungi figura manusia atau tidak. Walaupun pengesanan objek adalah remeh untuk manusia, klasifikasi imej yang teguh kekal sebagai cabaran untuk aplikasi penglihatan komputer.
Objektif kajian ini adalah untuk menentukan perkara yang menjadikan rangkaian neural dalam memproses data yang kompleks, seperti data imej/video, lebih pantas dan tepat, kami akan meneliti seni bina rangkaian neural terkini yang berjaya untuk menentukan apakah yang paling cekap (dan terpantas) seni bina dalam klasifikasi imej, dan kami juga akan menyelidik teknik pengoptimuman yang paling berkesan dalam jenis data ini.
Kami cuba memahami cara penyelidik baru-baru ini mengambil langkah besar ke hadapan dalam pengecaman visual dengan mengklasifikasikan imej, dan melihat cara mereka menjaringkan skor ketepatan yang luar biasa pada cabaran ImageNet. Mengambil kira bagaimana kami boleh memproses data kompleks seperti data imej dengan lebih pantas, bagaimana kami boleh menangani masalah overfitting pada data ini, dan bagaimana kami boleh meminimumkan masa latihan seni bina kami.
Dikemas kini pada
2 Jul 2022