Порівняльний аналіз методів для вирішення задачі сентимент аналізу тексту.

  • С. Мироненко Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, Україна https://orcid.org/0000-0001-7561-8305
  • Є. Онищенко Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, Україна https://orcid.org/0000-0001-6502-0406
Ключові слова: класифікація тексту, сентимент-аналіз, машинне навчання, Natural Language Processing, поглиблене навчання.

Анотація

В даній статті розглядається підхід навчання з вчителем (supervised learning) для вирішення проблеми, пов’язаної з Natural Language Processing (NLP), а саме сентимент-аналіз текстових даних. В ході роботи було реалізовано 4 різних класифікатори на одній й тій самій виборці даних та порівняно їх ефективність за часом навчання, тестування та точності класифікації. В результаті роботи було визначено, що найкращий метод серед реалізованих – 3D CNN модель, яка використовує BERT токенізатор для попередньої обробки тексту. Саме завдяки використанню  BERT для препроцессінгу тексту цей метод показав кращі результати.

Посилання

Bing Liu. (2012) Sentiment Analysis and Opinion Mining, Morgan & Claypool Publishers, May 2012.

Kobec N.M., Kovalyuk T.V. (2018) Zadachi sentiment-analizu yak instrument monitoringu mirkuvan koristuvachiv socialnih merezh.Materiali naukovoyi konferenciyi studentiv, magistrantiv ta aspirantiv 23 – 24 kvitnya 2018 roku «Informatika ta obchislyuvalna tehnika» – IOT-2018, Kiyiv. S.151-153.

Maznichenko N. I. (2017) Avtomatichnij analiz tekstiv elektronnih dokumentiv. Suchasni tendenciyi rozvitku ukrayinskoyi nauki : materiali Vseukr. nauk. konf., 6–7 trav. 2017 r.. Pereyaslav-Hmelnickij. Vip. 2. S. 136–139.

Shingalov D. V. (2017) Metodi avtomatichnogo analizu tonalnosti kontentu u socialnih merezhah dlya viyavlennya informacijno-psihologichnih vpliviv / D. V. Shingalov, Ye. V. Meleshko, R. M. Minajlenko, V. A. Reznichenko // Zbirnik naukovih prac Kirovogradskogo nacionalnogo tehnichnogo universitetu. Tehnika v silskogospodarskomu virobnictvi, galuzeve mashinobuduvannya, avtomatizaciya. Vip. 30. S. 196-202. Rezhim dostupu: http://nbuv.gov.ua/UJRN/znpkntu_2017_30_29.

Shahovska N. B. (2017) Shkalyuvannya emocijno zabarvlenih sliv dlya vikoristannya u metodah klasifikaciyi tonalnosti / N. B. Shahovska, H. Yu. Girak // Visnik Nacionalnogo universitetu "Lvivska politehnika". Informacijni sistemi ta merezhi. № 872. S. 195-203. Rezhim dostupu: http://nbuv.gov.ua/UJRN/VNULPICM_2017_872_23.

Large Movie Review Dataset [Elektronnij resurs]. - URL: https://www.kaggle.com/lakshmi25npathi/imdb-dataset-of-50k-movie-reviews

Stuart J. (2003) Russell and Peter Norvig. Artificial Intelligence: A Modern Approach, Prentice Hall.

Understanding RNN and LSTM [Elektronnij resurs]. – URL: https://towardsdatascience.com/understanding-rnn-and-lstm-f7cdf6dfc14e

Primenenie svyortochnyh nejronnyh setej dlya zadach NLP [Elektronnij resurs] – URL: https://habr.com/ru/company/ods/blog/353060/

TensorFlow [Elektronnij resurs] – URL: https://en.wikipedia.org/wiki/TensorFlow

Keras [Elektronnij resurs] – URL: https://en.wikipedia.org/wiki/Keras

Understanding of Convolutional Neural Network (CNN) — Deep Learning [Elektronnij resurs] – URL: https://medium.com/@RaghavPrabhu/understanding-of-convolutional-neural-network-cnn-deep-learning-99760835f148

Sentiment Analysis: Concept, Analysis and Applications [Elektronnij resurs] – URL: https://towardsdatascience.com/sentiment-analysis-concept-analysis-and-applications-6c94d6f58c17

Опубліковано
2020-09-24
Як цитувати
Мироненко, С., & Онищенко, Є. (2020). Порівняльний аналіз методів для вирішення задачі сентимент аналізу тексту . КОМП’ЮТЕРНО-ІНТЕГРОВАНІ ТЕХНОЛОГІЇ: ОСВІТА, НАУКА, ВИРОБНИЦТВО, (40), 140-145. https://doi.org/10.36910/6775-2524-0560-2020-40-21
Розділ
Інформатика та обчислювальна техніка