Кескінді тану, Computer Vision контекстінде, бағдарламалық құралдың кескіндердегі объектілерді, орындарды, адамдарды, жазбалар мен әрекеттерді анықтау мүмкіндігі. Компьютерлер кескінді тануға қол жеткізу үшін камерамен және жасанды интеллект бағдарламалық құралымен бірге машиналық көру технологияларын пайдалана алады.
Кескінді жіктеу кескінді оның көрнекі мазмұнына қарай жіктей алатын компьютерлік көру процесін білдіреді. Мысалы, кескінді жіктеу алгоритмі суретте адам фигурасы бар-жоғын көрсету үшін жасалуы мүмкін. Объектіні анықтау адамдар үшін тривиальды болғанымен, кескінді сенімді классификациялау компьютерлік көру қолданбалары үшін қиындық болып қала береді.
Бұл зерттеудің мақсаты кескін/бейне деректері сияқты күрделі деректерді өңдейтін терең нейрондық желіні нені жылдамырақ және дәлірек ететінін анықтау болып табылады, біз ең тиімді (және ең жылдам) қайсысы екенін анықтау үшін соңғы сәтті нейрондық желінің архитектурасын қарастырамыз. кескін классификациясындағы архитектура(лар) және біз деректердің осы түрінде қай оңтайландыру әдістері жақсы жұмыс істейтінін де зерттейміз.
Біз зерттеушілердің суреттерді жіктеу арқылы визуалды тануда жақында қалай үлкен қадам жасағанын түсінуге тырысамыз және олардың ImageNet сынында керемет дәлдік ұпайын қалай жинағанын көреміз. Кескін деректері сияқты күрделі деректерді қалай тезірек өңдеуге болатынын, осы деректерге шамадан тыс орнату мәселесін қалай шешуге болатынын және сәулетіміздің оқу уақытын қалай азайтуға болатынын ескере отырып.
Жаңартылған күні
2022 ж. 02 шіл.