Метод динамічного розподілу криптографічних операцій між CPU та апаратними прискорювачами
Анотація
У статті досліджено проблему оптимального розподілу криптографічних операцій між центральним процесором та спеціалізованими апаратними прискорювачами (GPU, FPGA, криптографічні співпроцесори) в умовах обмежених обчислювальних ресурсів. Запропоновано метод динамічного розподілу, що базується на моніторингу поточного навантаження обчислювальних вузлів, характеристиках криптографічних завдань та вимогах до часу виконання. Розроблено формальну модель різнорідної обчислювальної системи, що враховує різнорідність апаратних ресурсів, пропускну здатність шин передачі даних та специфіку криптографічних примітивів. Сформульовано задачу оптимізації розподілу як задачу мінімізації сумарної затримки за обмеженнями на пропускну здатність, енергоспоживання та рівень захищеності. Запропоновано евристичний алгоритм планування, що адаптується до змінних умов навантаження в реальному часі та враховує вартість передачі даних між CPU та прискорювачами. Проведено серію обчислювальних експериментів на модельних сценаріях, що імітують типові робочі навантаження серверних криптографічних систем, IoT-шлюзів та хмарних платформ. Результати демонструють, що запропонований метод забезпечує конкурентну продуктивність виконання криптографічних операцій порівняно зі статичними стратегіями розподілу та порівняно з існуючими евристичними підходами. Показано, що динамічна адаптація дозволяє утримувати стабільну пропускну здатність навіть при піковому навантаженні, коли статичні стратегії демонструють суттєву деградацію продуктивності. Практична значущість роботи полягає в тому, що запропонований підхід може бути інтегрований у існуючі криптографічні бібліотеки та TLS-стеки без модифікації прикладного програмного забезпечення.
Посилання
2. Hu X., Wei C., Li J., Will B., Yu P., Gong L., Guan H. QTLS: High-Performance TLS Asynchronous Offload Framework with Intel® QuickAssist Technology. Proceedings of the 24th Symposium on Principles and Practice of Parallel Programming (PPoPP '19). ACM. 2019. С. 158–172. URL: https://doi.org/10.1145/3293883.3295705 (дата звернення: 15.05.2026).
3. Gregg C., Hazelwood K. Where Is the Data? Why You Cannot Debate CPU vs. GPU Performance Without the Answer. Proceedings of the IEEE International Symposium on Performance Analysis of Systems and Software. 2011. С. 134–144. URL: https://doi.org/10.1109/ISPASS.2011.5762730 (дата звернення: 15.05.2026).
4. Coarfa C., Druschel P., Wallach D. S. Performance Analysis of TLS Web Servers. ACM Transactions on Computer Systems. 2006. Vol. 24, No. 1. С. 39–69. URL: https://doi.org/10.1145/1124153.1124155 (дата звернення: 15.05.2026).
5. Gueron S., Kounavis M. E. Intel® Carry-Less Multiplication Instruction and its Usage for Computing the GCM Mode. Intel Corporation. 2014. URL: https://surl.li/xuxgmt (дата звернення: 15.05.2026).




