Оптимізація інтеграції машинного навчання у платформи аналізу текстових потоків у реальному часі: технічні підходи та критерії ефективності

Ключові слова: машинне навчання, текстові потоки, платформи реального часу, адаптивність алгоритмів, аналіз даних, розподілені обчислення, оптимізація продуктивності, прозорість алгоритмів

Анотація

У статті досліджується інтеграція алгоритмів машинного навчання у платформи реального часу для аналізу текстових потоків. Актуальність теми зумовлена стрімким зростанням обсягів неструктурованих текстових даних та необхідністю їх своєчасної обробки для підтримки прийняття рішень у сферах медіа-моніторингу, кібербезпеки, фінансів і медицини. Показано, що ефективність таких платформ залежить від адаптивності алгоритмів, точності аналізу, масштабованості та прозорості результатів. Особливу увагу приділено технічним аспектам реалізації, зокрема розподіленій архітектурі, потоковій обробці даних, оптимізації обчислювальних ресурсів і впровадженню пояснюваних моделей. Метою статті є дослідження можливостей інтеграції алгоритмів машинного навчання у платформи реального часу для аналізу текстових потоків, зокрема розроблення підходів до підвищення ефективності обробки даних, забезпечення їх прозорості та адаптивності в умовах змінного інформаційного середовища. Для досягнення поставленої мети використано методи аналізу наукових джерел, порівняння існуючих алгоритмів та експериментального дослідження технічних рішень. У результаті встановлено, що основними проблемами інтеграції є висока обчислювальна складність глибоких моделей, обмеження масштабованості та затримки при обробці потоків. Доведено, що застосування технологій розподілених обчислень, апаратних прискорювачів (GPU/TPU) та механізмів онлайн-навчання суттєво підвищує продуктивність таких платформ. Впровадження адаптивних алгоритмів з можливістю оновлення параметрів у реальному часі покращує якість аналізу в умовах нестабільних даних. Зроблено висновок, що інтеграція машинного навчання у платформи реального часу забезпечує підвищення швидкості, надійності та масштабованості аналітики текстових потоків. Перспективи подальших досліджень пов’язані з розробленням універсальних багатомовних платформ, які поєднують енергоефективність, модульність і високу аналітичну продуктивність

Посилання

1. Guha, A., & Samanta, D. (2020). Real-time application of document classification based on machine learning. In L. Jain, S. L. Peng, B. Alhadidi, & S. Pal (Eds.), Intelligent computing paradigm and cutting-edge technologies. ICICCT 2019 (Vol. 9, pp. 401–416). Springer.
2. Yu, M., Huang, Q., Qin, H., Scheele, C., & Yang, C. (2020). Deep learning for real-time social media text classification for situation awareness – Using Hurricanes Sandy, Harvey, and Irma as case studies. In Social sensing and big data computing for disaster management (pp. 33–50). Routledge.
3. Li, Q., Peng, H., Li, J., Xia, C., Yang, R., Sun, L., Yu, P. S., & He, L. (2022). A survey on text classification: From traditional to deep learning. ACM Transactions on Intelligent Systems and Technology (TIST), 13(2), 1–41.
4. Gomes, H. M., Read, J., Bifet, A., Barddal, J. P., & Gama, J. (2019). Machine learning for streaming data: State of the art, challenges, and opportunities. ACM SIGKDD Explorations Newsletter, 21(2), 6–22.
5. Bahri, M., Bifet, A., Gama, J., & Maniu, S. (2021). Data stream analysis: Foundations, major tasks and tools. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 11(3), e1405.
Опубліковано
2025-03-26
Як цитувати
Коростін, О. (2025). Оптимізація інтеграції машинного навчання у платформи аналізу текстових потоків у реальному часі: технічні підходи та критерії ефективності. КОМП’ЮТЕРНО-ІНТЕГРОВАНІ ТЕХНОЛОГІЇ: ОСВІТА, НАУКА, ВИРОБНИЦТВО, (58), 38-45. https://doi.org/10.36910/6775-2524-0560-2025-58-05
Розділ
Інформатика та обчислювальна техніка