Сүрөттөрдү таануу, Computer Vision контекстинде, программалык камсыздоонун сүрөттөрдөгү объектилерди, жерлерди, адамдарды, жазууларды жана аракеттерди аныктоо мүмкүнчүлүгү. Компьютерлер сүрөттү таанууга жетүү үчүн камера жана жасалма интеллект программасы менен бирге машина көрүү технологияларын колдоно алышат.
Сүрөттүн классификациясы сүрөттү визуалдык мазмунуна жараша классификациялай турган компьютердик көрүү процессин билдирет. Мисалы, сүрөттү классификациялоо алгоритми сүрөттө адамдын фигурасы бар же жок экенин көрсөтүү үчүн иштелип чыгышы мүмкүн. Объектти аныктоо адамдар үчүн анча деле маанилүү эмес болсо да, сүрөттөрдү бекем классификациялоо компьютердик көрүү колдонмолору үчүн кыйынчылык бойдон калууда.
Бул изилдөөнүн максаты - сүрөт/видео маалыматтары сыяктуу татаал маалыматтарды иштетүүчү терең нейрон тармагын эмне тезирээк жана так кылаарын аныктоо, биз эң эффективдүү (жана эң ылдам) кайсынысын аныктоо үчүн акыркы ийгиликтүү нейрон тармактарынын архитектураларын карап чыгабыз. сүрөттөрдү классификациялоодо архитектура(лар) жана биз ошондой эле маалыматтардын бул түрүндө кайсы оптималдаштыруу ыкмалары эң жакшы иштээрин изилдейбиз.
Биз изилдөөчүлөр жакында сүрөттөрдү классификациялоо менен визуалдык таанууда кандайча чоң кадам таштаганын түшүнүүгө аракет кылабыз жана алардын ImageNet чакырыгында кандай укмуштуудай тактык упай алганын көрүүгө аракет кылабыз. Сүрөт маалыматтары сыяктуу татаал маалыматтарды кантип тезирээк иштете аларыбызды, бул маалыматтарга ашыкча кирүү маселесин кантип чечсек болот жана архитектурабыздын окуу убактысын кантип азайта алабыз.
Качан жаңырды
2022-ж., 2-июл.