Image Recognition, nel contesto della Computer Vision, è la capacità del software di identificare oggetti, luoghi, persone, scritti e azioni nelle immagini. I computer possono utilizzare le tecnologie di visione artificiale in combinazione con una fotocamera e un software di intelligenza artificiale per ottenere il riconoscimento delle immagini.
La classificazione delle immagini si riferisce a un processo nella visione artificiale che può classificare un'immagine in base al suo contenuto visivo. Ad esempio, un algoritmo di classificazione delle immagini può essere progettato per indicare se un'immagine contiene o meno una figura umana. Sebbene il rilevamento di oggetti sia banale per gli esseri umani, una solida classificazione delle immagini rimane una sfida per le applicazioni di visione artificiale.
L'obiettivo di questo studio è determinare cosa rende una rete neurale profonda che elabora dati complessi, come dati di immagini/video, più veloce e accurata, esamineremo le ultime architetture di reti neurali di successo per determinare qual è la più efficiente (e veloce) architetture nella classificazione delle immagini e ricercheremo anche quali tecniche di ottimizzazione funzionano meglio in questo tipo di dati.
Cerchiamo di capire come i ricercatori abbiano recentemente fatto un grande passo avanti nel riconoscimento visivo classificando le immagini e vediamo come hanno ottenuto un punteggio di precisione incredibile nella sfida ImageNet. Tenendo conto di come possiamo elaborare dati complessi come i dati di immagine più velocemente, come possiamo gestire il problema dell'overfitting su questi dati e come possiamo ridurre al minimo il tempo di addestramento della nostra architettura.
Ultimo aggiornamento
2 lug 2022