Beeldherkenning, in die konteks van Rekenaarvisie, is die vermoë van sagteware om voorwerpe, plekke, mense, geskrifte en handelinge in beelde te identifiseer. Rekenaars kan masjienvisietegnologieë in kombinasie met 'n kamera en kunsmatige intelligensie-sagteware gebruik om beeldherkenning te verkry.
Beeldklassifikasie verwys na 'n proses in rekenaarvisie wat 'n beeld kan klassifiseer op grond van die visuele inhoud daarvan. Byvoorbeeld, 'n beeldklassifikasiealgoritme kan ontwerp word om aan te dui of 'n beeld 'n menslike figuur bevat of nie. Alhoewel voorwerpopsporing vir mense onbenullig is, bly robuuste beeldklassifikasie 'n uitdaging vir rekenaarvisietoepassings.
Die doel van hierdie studie is om te bepaal wat 'n diep neurale netwerk verwerking van komplekse data, soos beeld/video data, vinniger en meer akkuraat maak, ons sal die nuutste suksesvolle neurale netwerkargitekture ondersoek om te bepaal wat die doeltreffendste (en vinnigste) is. argitektuur(s) in beeldklassifikasie, en ons sal ook navors watter optimaliseringstegnieke die beste werk in hierdie tipe data.
Ons probeer verstaan hoe navorsers onlangs 'n groot stap vorentoe geneem het in visuele herkenning deur beelde te klassifiseer, en sien hoe hulle 'n ongelooflike akkuraatheidtelling op die ImageNet-uitdaging behaal het. Met inagneming van hoe ons komplekse data soos beelddata vinniger kan verwerk, hoe kan ons die probleem van oorpassing op hierdie data hanteer, en hoe kan ons die opleidingstyd van ons argitektuur verminder.
Opgedateer op
02 Jul. 2022