Методи лінійної регресії та k-means для прогнозування і кластеризації виробничих показників у Orange Data Mining

І.М. Коваль; С.А. Головня

doi:10.36910/6775-2524-0560-2024-57-08

І.М. Коваль https://orcid.org/0009-0001-2083-1747
С.А. Головня https://orcid.org/0009-0005-2997-9202

DOI: https://doi.org/10.36910/6775-2524-0560-2024-57-08

Ключові слова: лінійна регресія, Clustering, Orange Data Mining, дата аналітика, підприємство, K-means, передбачення, машинне навчання

Анотація

У роботі представлено специфіку роботи програмної системи Orange Data Mining у сфері дата аналітики, а саме практичне застосування для прогнозування та кластеризації виробничих показників підприємств. Розроблено та протестовано модель лінійної регресії, яка має універсальні властивості та може використовуватися підприємствами для прогнозування й коригування даних. Додатково модель доповнено алгоритмом кластеризації K-Means, що дозволяє отримати точні кластери та провести аналітику результатів. Отримані результати візуалізовано за допомогою внутрішніх інструментів програмного забезпечення. Запропоновано проміжні та загальні рекомендації щодо застосування моделі з різними типами даних. Результати експерименту свідчать, що програмна система Orange Data Mining успішно може використовуватись для прогнозування та кластеризації виробничих показників.

Посилання

1. Saumya Singh, Smriti Srivastava. Review of Clustering Techniques in Control System: Review of Clustering Techniques in Control System, 2020
2. Richard A. Johnson, Dean W. Wichern. Applied Multivariate Statistical Analysis, 2007
3. James, G., Witten, D., Hastie, T., & Tibshirani, R. An Introduction to Statistical Learning: With Applications in R, 2013
4. Orange Data Mining.
5. Montgomery D. C., Peck E. A., Vining G. G. Introduction to Linear Regression Analysis, 2012