MSRNet: Многоуровневая Рекурсивная Сеть для Обнаружения Камуфляжа

Введение

Обнаружение камуфлированных объектов — это новая и сложная задача в области компьютерного зрения, которая требует идентификации и сегментации объектов, сливающихся с окружающей средой из-за высокой схожести в цвете, текстуре и размере.

Сложности задачи

Эта задача усложняется низким освещением, частичными遮蔽ами, небольшими размерами объектов, сложными фоновыми узорами и множеством объектов. Несмотря на существование множества сложных методов, современные подходы все еще имеют трудности с точным обнаружением камуфлированных объектов в сложных сценариях, особенно когда речь идет о мелких и множественных объектах.

Предлагаемое решение

Мы предлагаем Многоуровневую Рекурсивную Сеть (MSRNet), которая извлекает многоуровневые признаки с помощью основы Pyramid Vision Transformer и объединяет их через специализированные единицы интеграции на основе внимания, позволяя выборочное слияние признаков.

Улучшение точности обнаружения

Для более точного обнаружения объектов наш декодер рекурсивно уточняет признаки, включая единицы мульти-гранулярной фузии. Разработана новая стратегия декодирования с рекурсивной обратной связью для повышения понимания глобального контекста, что помогает модели справляться с задачами.

Заключение

Совместное использование многоуровневого обучения и рекурсивного извлечения признаков позволяет улучшить результаты в обнаружении камуфлированных объектов.