Bilderkennung ist im Zusammenhang mit Computer Vision die Fähigkeit von Software, Objekte, Orte, Personen, Schriften und Handlungen in Bildern zu erkennen. Computer können maschinelle Bildverarbeitungstechnologien in Kombination mit einer Kamera und Software für künstliche Intelligenz verwenden, um eine Bilderkennung zu erreichen.
Die Bildklassifizierung bezieht sich auf einen Prozess in der Computer Vision, der ein Bild basierend auf seinem visuellen Inhalt klassifizieren kann. Beispielsweise kann ein Bildklassifizierungsalgorithmus entworfen werden, um anzuzeigen, ob ein Bild eine menschliche Figur enthält oder nicht. Obwohl die Objekterkennung für den Menschen trivial ist, bleibt die robuste Bildklassifizierung eine Herausforderung für Computer-Vision-Anwendungen.
Das Ziel dieser Studie ist es festzustellen, was ein tiefes neuronales Netzwerk bei der Verarbeitung komplexer Daten wie Bild-/Videodaten schneller und genauer macht. Wir werden die neuesten erfolgreichen neuronalen Netzwerkarchitekturen untersuchen, um festzustellen, was am effizientesten (und schnellsten) ist. Architektur(en) in der Bildklassifizierung, und wir werden auch untersuchen, welche Optimierungstechniken bei dieser Art von Daten am besten funktionieren.
Wir versuchen zu verstehen, wie Forscher kürzlich einen großen Schritt in der visuellen Erkennung gemacht haben, indem sie Bilder klassifiziert haben, und sehen, wie sie bei der ImageNet-Herausforderung eine unglaubliche Genauigkeit erzielt haben. Unter Berücksichtigung, wie wir komplexe Daten wie Bilddaten schneller verarbeiten können, wie können wir das Problem der Überanpassung dieser Daten bewältigen und wie können wir die Trainingszeit unserer Architektur minimieren.
Aktualisiert am
02.07.2022