Система розпізнавання динамічних жестів рук у реальному часі на периферійних пристроях
Анотація
У даній роботі представлено систему розпізнавання динамічних жестів рук у реальному часі, призначену для ефективної взаємодії з інтелектуальними пристроями та безконтактними інтерфейсами, зокрема на периферійних пристроях. Розроблена система інтегрує Google Mediapipe для визначення пози рук, який є достатньо легким для запуску на мобільних пристроях, з модифікованою архітектурою DD-Net, оптимізованою для онлайн класифікації жестів з використанням 2D та 3D даних. Ключові нововведення включають впровадження допоміжної класифікаційної гілки для вирішення проблеми дисбалансу класів та механізму уваги для покращення розпізнавання частково спостережуваних жестів. Розроблена система була протестована на наборах даних NVGesture та SHREC22, досягнуто точності 0.784 та 0.924, відповідно, що перевищує попередні результати. Експериментальні результати демонструють високу ефективність запропонованого підходу у задачах розпізнавання жестів в реальному часі, зокрема на мобільних платформах. Показано, що використання 3D даних та механізму уваги дозволяє значно покращити точність розпізнавання, особливо для складних та частково видимих жестів. Запропонована система може бути використана в широкому спектрі застосувань, включаючи системи віртуальної та доповненої реальності, робототехніку та безконтактні інтерфейси на периферійних пристроях
Посилання
2. Teslyuk, V., Chornenkyi, V., Tsapiv, V., & Kazymyra, I. (2024). Investigating hand gesture recognition models: 2D CNNs vs. visual transformers. CEUR Workshop Proceedings. Vol. 3688: Proc. of the 8th Int. conf. on computational linguistics and intelligent systems. Vol. III: Intelligent systems workshop. Lviv, Ukraine, Apr. 12-13, 2024, 29–38. CEUR-WS.org.
3. Tsapiv, V., & Kazymyra, I. (2024). Gesture Control in Real-time: a framework for 3D hand pose recognition for smart devices and touchless interfaces. In 1st International Scientific and Practical Conference on Computational Intelligence and Smart Systems, 126–128.
4. Zhang, W., Lin, Z., Cheng, J., Ma, C., Deng, X., & Wang, H. (2020). STA-GCN: two-stream graph convolutional network with spatial–temporal attention for hand gesture recognition. The Visual Computer, 36(10–12), 2433–2444.
5. Do, N.-T., Kim, S.-H., Yang, H.-J., & Lee, G.-S. (2020). Robust hand shape features for Dynamic Hand Gesture Recognition using multi-level feature LSTM. Applied Sciences (Basel, Switzerland), 10(18), 6293.




