Порівняльне дослідження методів попередньої обробки тексту в Orange Data Mining та KNIME
Анотація
У роботі досліджується порівняння результатів попередньої обробки текстових даних у програмних системах Knime Analytics та Orange Data Mining. Представлено детальний опис методології дослідження, включаючи інструменти попередньої обробки текстових даних, налаштування та створення моделей відповідно до можливостей кожної з програм. Отримані результати аналізуються з використанням інструментів візуалізації, при цьому використовуються різні формати представлення результату. Переваги та недоліки кожного інструменту виявляються у рекомендаціях щодо застосування тієї чи іншої програмної системи у різних умовах. Результати попередньої обробки текстових даних в обох програмних системах показали, що дані були очищені від шуму, небажаних слів та синтаксичних елементів, що дозволило виділити ключові теми і тенденції із тестового матеріалу.
Посилання
2. Charu C. Aggarwal, ChengXiang Zhai. Mining Text Data, 2012.
3. Orange Data Mining.
4. KNIME Analytics Platform.
5. Text Preprocessing Orange Blog.


