ইমেজ রিকগনিশন, কম্পিউটার ভিশনের পরিপ্রেক্ষিতে, সফ্টওয়্যারের সক্ষমতা যা ইমেজে বস্তু, স্থান, মানুষ, লেখা এবং ক্রিয়া সনাক্ত করতে পারে। কম্পিউটারগুলি চিত্রের স্বীকৃতি অর্জনের জন্য একটি ক্যামেরা এবং কৃত্রিম বুদ্ধিমত্তা সফ্টওয়্যারের সংমিশ্রণে মেশিন ভিশন প্রযুক্তি ব্যবহার করতে পারে।
ইমেজ শ্রেণীবিভাগ কম্পিউটার ভিশনের একটি প্রক্রিয়াকে বোঝায় যা একটি চিত্রকে তার ভিজ্যুয়াল বিষয়বস্তুর উপর ভিত্তি করে শ্রেণীবদ্ধ করতে পারে। উদাহরণস্বরূপ, একটি ইমেজ শ্রেণীবিভাগের অ্যালগরিদম একটি ইমেজ একটি মানব চিত্র আছে কিনা তা নির্দেশ করার জন্য ডিজাইন করা যেতে পারে। যদিও বস্তু সনাক্তকরণ মানুষের জন্য তুচ্ছ, তবে শক্তিশালী চিত্র শ্রেণীবিভাগ কম্পিউটার দৃষ্টি অ্যাপ্লিকেশনের জন্য একটি চ্যালেঞ্জ রয়ে গেছে।
এই অধ্যয়নের উদ্দেশ্য হ'ল গভীর নিউরাল নেটওয়ার্ক প্রক্রিয়াকরণ জটিল ডেটা, যেমন চিত্র/ভিডিও ডেটা, দ্রুত এবং আরও নির্ভুল করে তা নির্ধারণ করা, আমরা সবচেয়ে কার্যকরী (এবং দ্রুততম) কী তা নির্ধারণ করতে সর্বশেষ সফল নিউরাল নেটওয়ার্ক আর্কিটেকচারগুলি পরীক্ষা করব৷ চিত্র শ্রেণীবিভাগে স্থাপত্য(গুলি), এবং আমরা গবেষণা করব কোন অপ্টিমাইজেশন কৌশলগুলি এই ধরণের ডেটাতে সবচেয়ে ভাল কাজ করে।
আমরা বোঝার চেষ্টা করি যে গবেষকরা সম্প্রতি চিত্রগুলিকে শ্রেণিবদ্ধ করে ভিজ্যুয়াল স্বীকৃতির ক্ষেত্রে কীভাবে একটি বড় পদক্ষেপ নিয়েছিলেন এবং দেখুন কিভাবে তারা ImageNet চ্যালেঞ্জে একটি অবিশ্বাস্য নির্ভুলতা স্কোর করেছে৷ আমরা কীভাবে ইমেজ ডেটার মতো জটিল ডেটা দ্রুত প্রক্রিয়া করতে পারি, কীভাবে আমরা এই ডেটাতে ওভারফিটিংয়ের সমস্যাটি পরিচালনা করতে পারি এবং কীভাবে আমরা আমাদের আর্কিটেকচারের প্রশিক্ষণের সময়কে কমিয়ে আনতে পারি।
আপডেট করা হয়েছে
২ জুল, ২০২২