זיהוי תמונה, בהקשר של Computer Vision, הוא היכולת של תוכנה לזהות אובייקטים, מקומות, אנשים, כתבים ופעולות בתמונות. מחשבים יכולים להשתמש בטכנולוגיות ראיית מכונה בשילוב עם מצלמה ותוכנת בינה מלאכותית כדי להשיג זיהוי תמונה.
סיווג תמונה מתייחס לתהליך בראייה ממוחשבת שיכול לסווג תמונה על סמך התוכן הוויזואלי שלה. לדוגמה, אלגוריתם סיווג תמונה יכול להיות מתוכנן כדי לציין אם תמונה מכילה דמות אנושית או לא. למרות שזיהוי אובייקטים הוא טריוויאלי עבור בני אדם, סיווג תמונות חזק נותר אתגר עבור יישומי ראייה ממוחשבת.
מטרת מחקר זה היא לקבוע מה הופך רשת עצבית עמוקה לעיבוד נתונים מורכבים, כגון נתוני תמונה/וידאו, למהיר ומדויק יותר, נבחן את ארכיטקטורות הרשת העצבית המוצלחות העדכניות ביותר כדי לקבוע מהי היעילה ביותר (והמהירה ביותר) ארכיטקטורות בסיווג תמונה, ואנו גם נחקור אילו טכניקות אופטימיזציה עובדות בצורה הטובה ביותר בסוג זה של נתונים.
אנו מנסים להבין כיצד חוקרים עשו לאחרונה צעד גדול קדימה בזיהוי חזותי על ידי סיווג תמונות, ולראות כיצד הם השיגו ציון דיוק מדהים באתגר ImageNet. אם ניקח בחשבון כיצד נוכל לעבד נתונים מורכבים כמו נתוני תמונה מהר יותר, כיצד נוכל להתמודד עם בעיית התאמת הנתונים הללו, וכיצד נוכל למזער את זמן האימון של הארכיטקטורה שלנו.
עדכון אחרון בתאריך
2 ביולי 2022