Research of the robustness of human identification under scaling and overlapping

Д.І. Угрин; Т.В. Терлецький; O.I. Бреславський

doi:10.36910/6775-2524-0560-2026-63-05

Д.І. Угрин https://orcid.org/0000-0003-4858-4511
Т.В. Терлецький https://orcid.org/0000-0002-4114-0734
O.I. Бреславський https://orcid.org/0009-0005-5164-2913

DOI: https://doi.org/10.36910/6775-2524-0560-2026-63-05

Ключові слова: робастність, візуальні завади, глибинне навчання, комп’ютерний зір, обробка зображень

Анотація

Праця присвячена дослідженню робастності ідентифікації людей у системах комп’ютерного зору, зокрема для завдань відеоспостереження, в умовах масштабування, перекриття та впливу візуальних завад. Метою дослідження є глибокий аналіз сучасних підходів і розробка інтегрованого методу, що гарантує стабільну роботу нейромережевих моделей у складних неконтрольованих умовах. В ході дослідження сформовано структуровану вибірку з 350 зображень на основі власних даних і наборів COCO та CrowdHuman, розділених за щільністю сцен (одиночні особи, групи, щільні натовпи). Для відтворення реальних умов експлуатації виконано моделювання різних деградацій зображення: розмиття Гаусса, імпульсний шум, зміни освітлення та різке зниження контрасту. Для їх дієвої компенсації реалізовано комплексний конвеєр адаптивної попередньої обробки з використанням екстракції ознак, еквалiзацiї гiстограми та методу CLAHE. Для аналізу використано детектор YOLOv8, моделі просторової сегментації U-Net і Mask R-CNN, а також алгоритми кластеризації K-Means і DBSCAN для відокремлення об'єктів. Результати дослідження показали суттєву залежність якості детекції від несприятливих умов: для дуже малих об’єктів показник IoU знижується до 0.56; при критичному перекритті (понад 80 %) повнота Recall падає до 0.60; а при комбінованих завадах точність mAP знижується до 0.45. Базові середні значення по всій вибірці становлять IoU=0.82, mAP=0.80, Precision=0.88, Recall=0.81. Запропонований тут інтегрований підхід забезпечує підвищення точності до mAP=0.95 та демонструє приріст ефективності до 44 % у найскладніших умовах комбінованих деградацій. Отримані результати підтверджують ефективність поєднання багатомасштабного аналізу, адаптивної попередньої обробки та компенсації перекриття для підвищення робастності систем детекції

Посилання

Tong et al. ACD-DETR: adaptive cross-scale detection transformer for small object detection in UAV imagery / Sensors. 2025. Vol. 25, no. 17. P. 5556. URL: https://doi.org/10.3390/s25175556 .

Y. Kang et al. A cross-scale feature fusion method for effectively enhancing small object detection performance / Information. 2025. Vol. 17, no. 1. P. 25. https://doi.org/10.3390/info17010025 .

A. Wang et al. Adaptive cross-scale feature aggregation for few-shot object detection / A Neurocomputing. 2026. Vol. 669. P. 132514. URL: doi.org/10.1016/j.neucom.2025.132514 .

Q. Sun et al. AMAF-YOLO: dynamic cross-region attention and multi-scale fusion for small object detection / Nondestructive testing and evaluation. 2025. P. 1–31. URL: doi.org/10.1080/10589759.2025.2586076 .

Z. Guo et al. An enhanced framework for small object detection with middle-order interaction and adaptive cross-scale aggregation / Engineering applications of artificial intelligence. 2025. Vol. 159. P. 111730. URL: doi.org/10.1016/j.engappai.2025.111730 .

Дослідження робастності ідентифікації людей при масштабуванні та перекритті

Анотація

Посилання