Методи лінійної регресії та k-means для прогнозування і кластеризації виробничих показників у Orange Data Mining
Анотація
У роботі представлено специфіку роботи програмної системи Orange Data Mining у сфері дата аналітики, а саме практичне застосування для прогнозування та кластеризації виробничих показників підприємств. Розроблено та протестовано модель лінійної регресії, яка має універсальні властивості та може використовуватися підприємствами для прогнозування й коригування даних. Додатково модель доповнено алгоритмом кластеризації K-Means, що дозволяє отримати точні кластери та провести аналітику результатів. Отримані результати візуалізовано за допомогою внутрішніх інструментів програмного забезпечення. Запропоновано проміжні та загальні рекомендації щодо застосування моделі з різними типами даних. Результати експерименту свідчать, що програмна система Orange Data Mining успішно може використовуватись для прогнозування та кластеризації виробничих показників.
Посилання
2. Richard A. Johnson, Dean W. Wichern. Applied Multivariate Statistical Analysis, 2007
3. James, G., Witten, D., Hastie, T., & Tibshirani, R. An Introduction to Statistical Learning: With Applications in R, 2013
4. Orange Data Mining.
5. Montgomery D. C., Peck E. A., Vining G. G. Introduction to Linear Regression Analysis, 2012


