Порівняльне дослідження методів попередньої обробки тексту в Orange Data Mining та KNIME

Ключові слова: Text Preprocess, Clustering, Orange Data Mining, Data mining, Knime Analytics, Word Cloud, попередня обробка тексту, Text to Vector

Анотація

У роботі досліджується порівняння результатів попередньої обробки текстових даних у програмних системах Knime Analytics та Orange Data Mining. Представлено детальний опис методології дослідження, включаючи інструменти попередньої обробки текстових даних, налаштування та створення моделей відповідно до можливостей кожної з програм. Отримані результати аналізуються з використанням інструментів візуалізації, при цьому використовуються різні формати представлення результату. Переваги та недоліки кожного інструменту виявляються у рекомендаціях щодо застосування тієї чи іншої програмної системи у різних умовах. Результати попередньої обробки текстових даних в обох програмних системах показали, що дані були очищені від шуму, небажаних слів та синтаксичних елементів, що дозволило виділити ключові теми і тенденції із тестового матеріалу.

Посилання

1. Manning C. D., Raghavan P., & Schütze H. Introduction to Information Retrieval, 2022.
2. Charu C. Aggarwal, ChengXiang Zhai. Mining Text Data, 2012.
3. Orange Data Mining.
4. KNIME Analytics Platform.
5. Text Preprocessing Orange Blog.
Опубліковано
2024-09-28
Як цитувати
Коваль, І., & Суринович, О. (2024). Порівняльне дослідження методів попередньої обробки тексту в Orange Data Mining та KNIME. КОМП’ЮТЕРНО-ІНТЕГРОВАНІ ТЕХНОЛОГІЇ: ОСВІТА, НАУКА, ВИРОБНИЦТВО, (56), 191-198. https://doi.org/10.36910/6775-2524-0560-2024-56-24
Розділ
Інформатика та обчислювальна техніка