Порівняльний аналіз розподілених суфіксних дерев і традиційних методів управління даними.
Анотація
Дана стаття містить огляд різних методів реалізації суфіксних дерев, порівнюючи їх із традиційними методами подання даних, такими як префіксні дерева та перетворення Берроуза-Вілера (BWT). Переглянуті методи включають наївний підхід, алгоритм Укконена та алгоритм розділення та запису лише зверху вниз (Partition and Write Only Top Down – PWOTD). Серед розглянутих методів алгоритм PWOTD виявляється найефективнішим для реалізації суфіксних дерев. Використовуючи розбиття суфіксів, цей підхід значно зменшує вимоги до основної пам’яті для побудови дерева суфіксів, дозволяючи створювати незалежні піддерева повністю в основній пам’яті. Незважаючи на збільшення обчислювальних витрат, пов’язаних із розділенням, алгоритм PWOTD пропонує суттєве скорочення вимог до простору для суфіксів і тимчасових масивів, а також масиву дерева. Порівняльний аналіз показує, що суфіксні дерева перевершують інші методи завдяки ефективному зберіганню та представленню всіх суфіксів певного рядка в компактному та доступному форматі. Крім того, суфіксні дерева підтримують динамічні оновлення з логарифмічною часовою складністю, полегшуючи додавання або видалення рядків з вихідного набору даних без необхідності повної реконструкції, на відміну від префіксних дерев. У підсумку, ця стаття підкреслює ефективність алгоритму PWOTD у реалізації суфіксальних дерев і підкреслює переваги суфіксальних дерев над традиційними методами представлення даних. Універсальність, ефективність і динамічні можливості дерев суфіксів роблять їх незамінними для широкого спектру завдань обробки рядків у різних областях, включаючи біоінформатику, індексування тексту та обробку природної мови.
Посилання
2. Louza F., Telles G., Gog S., Prezza N., Rosone G. gsufsort: constructing suffix arrays, LCP arrays and BWTs for string collections. Algorithms for molecular biology : AMB. 2020. №15. №18.
3. Farruggia A., Gagie T., Navarro G., Puglisi S., Sirén J. Relative Suffix Trees. The Computer Journal. 2018. №61. P.773-788.
4. Funakoshi M., Mieno T., Nakashima Y., Inenaga S., Bannai H., Takeda M. Computing palindromes and suffix trees of dynamic trees. 2024.
5. Caceres M., Navarro G. Faster Repetition-Aware Compressed Suffix Trees based on Block Trees. Information and Computation. 2021. №285.


