Image Recognition-ը, Computer Vision-ի համատեքստում, ծրագրային ապահովման կարողությունն է՝ բացահայտելու առարկաները, վայրերը, մարդկանց, գրությունները և գործողությունները պատկերներում: Համակարգիչները կարող են օգտագործել մեքենայական տեսողության տեխնոլոգիաները տեսախցիկի և արհեստական ինտելեկտի ծրագրերի հետ համատեղ՝ պատկերների ճանաչման հասնելու համար:
Պատկերների դասակարգումը վերաբերում է համակարգչային տեսողության գործընթացին, որը կարող է դասակարգել պատկերը՝ հիմնվելով նրա տեսողական բովանդակության վրա: Օրինակ, պատկերների դասակարգման ալգորիթմը կարող է նախագծվել՝ ցույց տալու համար, թե արդյոք պատկերը պարունակում է մարդու կերպար, թե ոչ: Թեև օբյեկտների հայտնաբերումը աննշան է մարդկանց համար, պատկերների կայուն դասակարգումը մնում է մարտահրավեր համակարգչային տեսլականի հավելվածների համար:
Այս ուսումնասիրության նպատակն է որոշել, թե ինչն է դարձնում խորը նեյրոնային ցանցը, որը մշակում է բարդ տվյալներ, ինչպիսիք են պատկերի/վիդեո տվյալները, ավելի արագ և ճշգրիտ: ճարտարապետություն(ներ) պատկերների դասակարգման մեջ, և մենք նաև կուսումնասիրենք, թե օպտիմալացման որ տեխնիկան է լավագույնս աշխատում այս տեսակի տվյալների մեջ:
Մենք փորձում ենք հասկանալ, թե ինչպես են հետազոտողները վերջերս մեծ քայլ առաջ կատարել տեսողական ճանաչման գործում՝ դասակարգելով պատկերները, և տեսնել, թե ինչպես են նրանք ստացել անհավանական ճշգրտության միավոր ImageNet մարտահրավերում: Հաշվի առնելով, թե ինչպես կարող ենք ավելի արագ մշակել բարդ տվյալներ, ինչպիսիք են պատկերի տվյալները, ինչպես կարող ենք լուծել այս տվյալների վրա գերհամապատասխանության խնդիրը և ինչպես կարող ենք նվազագույնի հասցնել մեր ճարտարապետության վերապատրաստման ժամանակը:
Վերջին թարմացումը՝
02 հլս, 2022 թ.