Методи лінійної регресії та k-means для прогнозування і кластеризації виробничих показників у Orange Data Mining

Ключові слова: лінійна регресія, Clustering, Orange Data Mining, дата аналітика, підприємство, K-means, передбачення, машинне навчання

Анотація

У роботі представлено специфіку роботи програмної системи Orange Data Mining у сфері дата аналітики, а саме практичне застосування для прогнозування та кластеризації виробничих показників підприємств. Розроблено та протестовано модель лінійної регресії, яка має універсальні властивості та може використовуватися підприємствами для прогнозування й коригування даних. Додатково модель доповнено алгоритмом кластеризації K-Means, що дозволяє отримати точні кластери та провести аналітику результатів. Отримані результати візуалізовано за допомогою внутрішніх інструментів програмного забезпечення. Запропоновано проміжні та загальні рекомендації щодо застосування моделі з різними типами даних. Результати експерименту свідчать, що програмна система Orange Data Mining успішно може використовуватись для прогнозування та кластеризації виробничих показників.

Посилання

1. Saumya Singh, Smriti Srivastava. Review of Clustering Techniques in Control System: Review of Clustering Techniques in Control System, 2020
2. Richard A. Johnson, Dean W. Wichern. Applied Multivariate Statistical Analysis, 2007
3. James, G., Witten, D., Hastie, T., & Tibshirani, R. An Introduction to Statistical Learning: With Applications in R, 2013
4. Orange Data Mining.
5. Montgomery D. C., Peck E. A., Vining G. G. Introduction to Linear Regression Analysis, 2012
Опубліковано
2025-02-13
Як цитувати
Коваль, І., & Головня, С. (2025). Методи лінійної регресії та k-means для прогнозування і кластеризації виробничих показників у Orange Data Mining. КОМП’ЮТЕРНО-ІНТЕГРОВАНІ ТЕХНОЛОГІЇ: ОСВІТА, НАУКА, ВИРОБНИЦТВО, (57), 57-68. https://doi.org/10.36910/6775-2524-0560-2024-57-08
Розділ
Інформатика та обчислювальна техніка