Дослідження робастності ідентифікації людей при масштабуванні та перекритті

Ключові слова: робастність, візуальні завади, глибинне навчання, комп’ютерний зір, обробка зображень

Анотація

Праця присвячена дослідженню робастності ідентифікації людей у системах комп’ютерного зору, зокрема для завдань відеоспостереження, в умовах масштабування, перекриття та впливу візуальних завад. Метою дослідження є глибокий аналіз сучасних підходів і розробка інтегрованого методу, що гарантує стабільну роботу нейромережевих моделей у складних неконтрольованих умовах. В ході дослідження сформовано структуровану вибірку з 350 зображень на основі власних даних і наборів COCO та CrowdHuman, розділених за щільністю сцен (одиночні особи, групи, щільні натовпи). Для відтворення реальних умов експлуатації виконано моделювання різних деградацій зображення: розмиття Гаусса, імпульсний шум, зміни освітлення та різке зниження контрасту. Для їх дієвої компенсації реалізовано комплексний конвеєр адаптивної попередньої обробки з використанням екстракції ознак, еквалiзацiї гiстограми та методу CLAHE. Для аналізу використано детектор YOLOv8, моделі просторової сегментації U-Net і Mask R-CNN, а також алгоритми кластеризації K-Means і DBSCAN для відокремлення об'єктів. Результати дослідження показали суттєву залежність якості детекції від несприятливих умов: для дуже малих об’єктів показник IoU знижується до 0.56; при критичному перекритті (понад 80 %) повнота Recall падає до 0.60; а при комбінованих завадах точність mAP знижується до 0.45. Базові середні значення по всій вибірці становлять IoU=0.82, mAP=0.80, Precision=0.88, Recall=0.81. Запропонований тут інтегрований підхід забезпечує підвищення точності до mAP=0.95 та демонструє приріст ефективності до 44 % у найскладніших умовах комбінованих деградацій. Отримані результати підтверджують ефективність поєднання багатомасштабного аналізу, адаптивної попередньої обробки та компенсації перекриття для підвищення робастності систем детекції

Посилання

Tong et al. ACD-DETR: adaptive cross-scale detection transformer for small object detection in UAV imagery / Sensors. 2025. Vol. 25, no. 17. P. 5556. URL: https://doi.org/10.3390/s25175556 .

Y. Kang et al. A cross-scale feature fusion method for effectively enhancing small object detection performance / Information. 2025. Vol. 17, no. 1. P. 25. https://doi.org/10.3390/info17010025 .

A. Wang et al. Adaptive cross-scale feature aggregation for few-shot object detection / A Neurocomputing. 2026. Vol. 669. P. 132514. URL: doi.org/10.1016/j.neucom.2025.132514 .

Q. Sun et al. AMAF-YOLO: dynamic cross-region attention and multi-scale fusion for small object detection / Nondestructive testing and evaluation. 2025. P. 1–31. URL: doi.org/10.1080/10589759.2025.2586076 .

Z. Guo et al. An enhanced framework for small object detection with middle-order interaction and adaptive cross-scale aggregation / Engineering applications of artificial intelligence. 2025. Vol. 159. P. 111730. URL: doi.org/10.1016/j.engappai.2025.111730 .

Опубліковано
2026-05-29
Як цитувати
Угрин, Д., Терлецький , Т., & Бреславський O. (2026). Дослідження робастності ідентифікації людей при масштабуванні та перекритті. КОМП’ЮТЕРНО-ІНТЕГРОВАНІ ТЕХНОЛОГІЇ: ОСВІТА, НАУКА, ВИРОБНИЦТВО, (63), 43-58. https://doi.org/10.36910/6775-2524-0560-2026-63-05
Розділ
Інформатика та обчислювальна техніка