Njohja e imazhit, në kontekstin e vizionit kompjuterik, është aftësia e softuerit për të identifikuar objektet, vendet, njerëzit, shkrimet dhe veprimet në imazhe. Kompjuterët mund të përdorin teknologjitë e vizionit të makinës në kombinim me një kamerë dhe softuer të inteligjencës artificiale për të arritur njohjen e imazhit.
Klasifikimi i imazhit i referohet një procesi në vizionin kompjuterik që mund të klasifikojë një imazh bazuar në përmbajtjen e tij vizuale. Për shembull, një algoritëm i klasifikimit të imazhit mund të projektohet për të treguar nëse një imazh përmban apo jo një figurë njerëzore. Megjithëse zbulimi i objekteve është i parëndësishëm për njerëzit, klasifikimi i fuqishëm i imazheve mbetet një sfidë për aplikacionet e vizionit kompjuterik.
Objektivi i këtij studimi është të përcaktojë se çfarë e bën një rrjet të thellë nervor që përpunon të dhëna komplekse, të tilla si të dhënat e imazhit/video, më të shpejtë dhe më të saktë, ne do të shqyrtojmë arkitekturat më të fundit të suksesshme të rrjetit nervor për të përcaktuar se cila është më efikasja (dhe më e shpejta) arkitektura(at) në klasifikimin e imazheve, dhe ne gjithashtu do të hulumtojmë se cilat teknika optimizimi funksionojnë më mirë në këtë lloj të dhënash.
Ne përpiqemi të kuptojmë se si studiuesit kohët e fundit bënë një hap të madh përpara në njohjen vizuale duke klasifikuar imazhet dhe të shohim se si ata shënuan një rezultat të pabesueshëm saktësie në sfidën ImageNet. Duke marrë parasysh se si mund t'i përpunojmë më shpejt të dhënat komplekse si të dhënat e imazhit, si mund ta trajtojmë problemin e përshtatjes së tepërt në këto të dhëna dhe si mund të minimizojmë kohën e trajnimit të arkitekturës sonë.
Përditësuar më
2 korr 2022