컴퓨터 비전의 맥락에서 이미지 인식은 이미지에서 사물, 장소, 사람, 글 및 동작을 식별하는 소프트웨어의 기능입니다. 컴퓨터는 이미지 인식을 달성하기 위해 카메라 및 인공 지능 소프트웨어와 함께 머신 비전 기술을 사용할 수 있습니다.
이미지 분류는 시각적 내용을 기반으로 이미지를 분류할 수 있는 컴퓨터 비전의 프로세스를 나타냅니다. 예를 들어, 이미지 분류 알고리즘은 이미지에 사람의 모습이 포함되어 있는지 여부를 나타내도록 설계할 수 있습니다. 물체 감지는 인간에게는 사소하지만 강력한 이미지 분류는 컴퓨터 비전 애플리케이션에서 여전히 어려운 과제입니다.
이 연구의 목적은 이미지/비디오 데이터와 같은 복잡한 데이터를 처리하는 심층 신경망을 더 빠르고 정확하게 만드는 요인을 결정하는 것입니다. 이미지 분류에서 아키텍처를 살펴보고 이러한 유형의 데이터에서 어떤 최적화 기술이 가장 잘 작동하는지 연구할 것입니다.
우리는 연구원들이 최근에 이미지를 분류하여 시각적 인식에서 큰 진전을 이룬 방법을 이해하고 ImageNet 챌린지에서 놀라운 정확도 점수를 얻은 방법을 확인합니다. 이미지 데이터와 같은 복잡한 데이터를 더 빠르게 처리하는 방법, 이 데이터에 대한 과적합 문제를 처리하는 방법, 아키텍처의 교육 시간을 최소화하는 방법을 고려합니다.