Pildituvastus on arvutinägemise kontekstis tarkvara võime tuvastada piltidel objekte, kohti, inimesi, kirjutisi ja tegevusi. Arvutid saavad pildituvastuse saavutamiseks kasutada masinnägemistehnoloogiaid koos kaamera ja tehisintellekti tarkvaraga.
Kujutise klassifitseerimine viitab arvutinägemise protsessile, mis suudab pilti klassifitseerida selle visuaalse sisu alusel. Näiteks saab piltide klassifitseerimisalgoritmi kavandada näitama, kas kujutis sisaldab inimfiguuri või mitte. Kuigi objektide tuvastamine on inimeste jaoks triviaalne, on piltide tugev klassifitseerimine arvutinägemisrakenduste jaoks endiselt väljakutse.
Selle uuringu eesmärk on teha kindlaks, mis muudab sügava närvivõrgu keerukate andmete (nt pildi-/videoandmed) töötlemise kiiremaks ja täpsemaks. Uurime uusimaid edukaid närvivõrgu arhitektuure, et teha kindlaks, milline on kõige tõhusam (ja kiireim) arhitektuur(id) piltide klassifitseerimisel ja uurime ka, millised optimeerimistehnikad seda tüüpi andmete puhul kõige paremini töötavad.
Püüame mõista, kuidas teadlased astusid hiljuti piltide klassifitseerimisega visuaalses tuvastamises suure sammu edasi, ja näeme, kuidas nad saavutasid ImageNeti väljakutses uskumatu täpsuse. Võttes arvesse, kuidas saaksime keerukaid andmeid, näiteks pildiandmeid, kiiremini töödelda, kuidas saame hakkama nende andmete ülepaigutamise probleemiga ja kuidas saaksime oma arhitektuuri treenimisaega minimeerida.
Värskendatud:
2. juuli 2022