Програмне порівняння анотацій наукових статей за допомогою статистичних методик обробки природніх мов.
Анотація
Стаття присвячена розробці та аналізу методик автоматизованого порівняння анотацій наукових статей за допомогою статистичних методів обробки природної мови (NLP). Авторами розглянуто сучасні підходи до текстової аналітики, включаючи алгоритми Cosine Similarity, Jaccard Similarity та TF-IDF, а також використання кластеризації та моделей машинного навчання, зокрема SciBERT та BioBERT. Запропонована дослідницька модель програмного забезпечення дозволяє автоматично визначати схожість між текстами, що сприяє ефективному аналізу наукових публікацій, зменшенню дублювання досліджень і підвищенню якості бібліографічного аналізу. Робота має значний потенціал для застосування в науковій комунікації, академічному плагіат-менеджменті та автоматизованих системах оцінки літератури. Подальші дослідження спрямовані на вдосконалення алгоритмів та інтеграцію запропонованої системи з науковими базами даних
Посилання
2. Masoumi, S., Amirkhani, H., Sadeghian, N. et al. Natural language processing (NLP) to facilitate abstract review in medical research: the application of BioBERT to exploring the 20-year use of NLP in medical research. Syst Rev 13, 107 (2024).
3. Timur, Ishankulov., Gleb, Danilov., Konstantin, Kotik., Yu., N., Orlov., Mikhail, Shifrin., Alexander, Potapov. (2022). The Classification of Scientific Abstracts Using Text Statistical Features. MedInfo, 290:263-267
4. Starukhin, Yaroslav & Diukarev, Vladimir. (2024). Automation of text data processing using NLP. The American Journal of Engineering and Technology. 6. 24-39.
5. (2022). The Classification of Scientific Abstracts Using Text Statistical Features.




