Адаптивний розподіл нейромережевого висновку в мультимодальних асистентах з урахуванням енерго-часових обмежень AIoT-мереж

Р.Л. Орел; І.О. Розломій

doi:10.36910/6775-2524-0560-2026-63-27

Р.Л. Орел https://orcid.org/0009-0008-2353-1329
І.О. Розломій https://orcid.org/0000-0001-5065-9004

DOI: https://doi.org/10.36910/6775-2524-0560-2026-63-27

Ключові слова: мультимодальні асистенти, інтернет речей, обчислення периферія-хмара, розподіл обчислень, глибокі нейронні мережі, енергоефективність, багатокритеріальна оптимізація

Анотація

Розвиток інтелектуальних систем та впровадження парадигми Інтернету речей (AIoT) супроводжується стрімким поширенням мультимодальних асистентів, здатних синхронно обробляти гетерогенні потоки даних, такі як відео високої роздільної здатності, просторове аудіо та текст. Однак їхня інтеграція стикається з фундаментальними технологічними суперечностями: громіздкі глибокі нейронні мережі (зокрема Transformer та CNN) потребують значних обчислювальних ресурсів, якими не володіють периферійні (edge) пристрої. Використання класичного локального підходу (Edge-only) призводить до швидкого виснаження акумуляторних батарей та недопустимих затримок висновку. З іншого боку, централізований хмарний підхід (Cloud-only) генерує експоненційне навантаження на бездротові канали зв’язку через безперервну трансляцію сирих мультимедійних даних, що створює мережеві «вузькі місця» та порушує суворі вимоги щодо конфіденційності користувачів. У даній статті вирішується науково-практична проблема оптимізації мультимодального висновку шляхом розробки методу динамічного розподілу обчислювального навантаження в колаборативній архітектурі edge-cloud. В основу рішення покладено технологію Split Computing, яка передбачає просторове розрізання графа нейромережі. Запропоновано нову математичну модель багатокритеріальної оптимізації, яка використовує зважену цільову функцію для балансування між загальною затримкою системи та сумарним енергоспоживанням пристрою. На базі цієї моделі розроблено легковаговий диспетчерський алгоритм, що працює в режимі реального часу. На відміну від існуючих рішень зі статичною точкою розрізу, розроблений алгоритм враховує ефект інформаційного вузького місця, безперервно оцінює поточну пропускну здатність радіоканалу та критичний рівень заряду батареї, адаптивно зміщуючи точку розрізу індивідуально для кожної модальності. Проведене імітаційне моделювання підтвердило високу результативність запропонованого підходу. Доведено, що в умовах нестабільної мережі динамічний метод дозволяє зменшити час відгуку системи на 28–35% (з піковим виграшем до 45%) порівняно з Cloud-only сценарієм. Крім того, за рахунок мінімізації роботи енергоємного радіомодуля при передачі стиснених проміжних тензорів, енергоефективність периферійного вузла підвищується на 18–25% відносно моделей статичного розподілу. Отримані результати формують надійне наукове підґрунтя для розробки автономних, конфіденційних та високошвидкісних мультимодальних систем реального часу з підвищеною стійкістю до деградації комунікаційної інфраструктури.

Посилання

1. Mohammadi M., Al-Fuqaha A., Sorour S., Guizani M. Deep learning for IoT big data and streaming analytics: A review. IEEE Communications Surveys & Tutorials. 2018. Vol. 20, No. 4. P. 2923–2960. DOI: https://doi.org/10.1109/COMST.2018.2844341
2. Zhou Z., Chen X., Li E., Zeng L., Luo K., Zhang J. Edge intelligence: Paving the last mile of artificial intelligence with edge computing. Proceedings of the IEEE. 2019. Vol. 107, No. 8. P. 1738–1762. DOI: https://doi.org/10.1109/JPROC.2019.2918951
3. Xu X., Ding H., Hu C., Wang Y., Chen S. Edge computing for multimodal data processing: A survey. IEEE Internet of Things Journal. 2022. Vol. 9, No. 12. P. 9477–9493. DOI: https://doi.org/10.1109/JIOT.2022.3153549
4. Merenda M., Porcaro C., Iero D. Edge machine learning for AI-enabled IoT devices: A review. Sensors. 2020. Vol. 20, No. 9. Article 2533. DOI: https://doi.org/10.3390/s20092533
5. Wang Y., Chen Y., Lu Y. Resource-constrained multimodal transformers for edge AI: Challenges and solutions. IEEE Communications Surveys & Tutorials. 2023. Vol. 25, No. 3. P. 1500–1525. URL: https://ieeexplore.ieee.org/document/10144670