Reconhecimento de Imagem, no contexto da Visão Computacional, é a capacidade de um software de identificar objetos, lugares, pessoas, escritos e ações em imagens. Os computadores podem usar tecnologias de visão de máquina em combinação com uma câmera e software de inteligência artificial para obter reconhecimento de imagem.
A classificação de imagens refere-se a um processo em visão computacional que pode classificar uma imagem com base em seu conteúdo visual. Por exemplo, um algoritmo de classificação de imagem pode ser projetado para indicar se uma imagem contém ou não uma figura humana. Embora a detecção de objetos seja trivial para humanos, a classificação robusta de imagens continua sendo um desafio para aplicações de visão computacional.
O objetivo deste estudo é determinar o que torna uma rede neural profunda que processa dados complexos, como dados de imagem/vídeo, mais rápido e preciso. arquitetura(s) na classificação de imagens, e também pesquisaremos quais técnicas de otimização funcionam melhor neste tipo de dados.
Tentamos entender como os pesquisadores recentemente deram um grande passo no reconhecimento visual ao classificar imagens e ver como eles obtiveram uma pontuação de precisão incrível no desafio ImageNet. Levando em consideração como podemos processar dados complexos como dados de imagem mais rapidamente, como podemos lidar com o problema de overfitting nesses dados e como podemos minimizar o tempo de treinamento de nossa arquitetura.
Atualizado em
2 de jul. de 2022