Подальший розвиток пошуку по дереву методом Монте-Карло за допомогою контролю форми дерева пошуку
Анотація
Представлення інформації певної задачі у вигляді дерева і пошук найкращих рішень в рамках цієї задачі з побудовою дерева рішень методом Монте-Карло, який отримав назву MCTS (Monte Carlo Tree Search) є одним з найкращих підходів для виконання пошуку для розв’язку задач, в яких знаходження найкращих рішень є дуже складним і часовитратним процесом. Стаття присвячена запропонованому раніше варіанту подальшого розвитку пошуку по дереву методом MCTS за допомогою контролю форми дерева пошуку. Цей варіант був названий MCTS-TSC (Monte-Carlo Tree Search with Tree Shape Control) і базується на критеріях виду DW (Depth-Width) з метою контролювання форми дерева пошуку під час його побудови. В статті пропонується два нових критерії виду DW: DWC і WDC, принцип впливу яких на форму дерева пошуку, що будується, відрізняється від раніше запропонованих критеріїв. Апробація використання нових запропонованих критеріїв контролю форми дерева DWC і WDC показала підвищення ефективності пошуку кращих подальших ходів гравця, який використовував варіант пошуку MCTS-TSC з контролем форми дерева, порівняно до гравця, що використовував стандартний варіант пошуку MCTS-UCT. Гравець MCTS-TSC при використанні критерію DWC виграв у гравця MCTS-UCT на 55% партій більше, а при використанні критерію WDC – на 42% більше, що суттєво краще, ніж у запропонованих раніше критеріїв. У якості висновків зазначено, що оскільки формули обчислення критеріїв виду DW є нескладними, то їх реалізація для контролю форми дерева не буде суттєво впливати на час пошуку варіантом MCTS-TSC. Крім того, відзначено, що запропоновані нові критерії виду DW можуть бути також використані для більш ефективного розпаралелення процесу пошуку MCTS і більш ефективного використання наявних апаратних ресурсів. Запропоновані також можливі напрямки подальшого розвитку пошуку методом Монте-Карло з контролем форми дерева пошуку MCTS-TSC.
Посилання
2. Marco Kemmerling, Daniel Lütticke, and Robert H. Schmitt, “Beyond games: a systematic review of neural Monte Carlo tree search Applications”, Applied Intelligence, vol.54, 2024, pp. 1020–1046.
3. Jorik Jooken, Pieter Leyman, Tony Wauters, Patrick De Causmaecker, “Exploring search space trees using an adapted version of Monte Carlo tree search for combinatorial optimization problems”, Computers & Operations Research, ISSN: 0305-0548, vol. 150, pp. 1–46.
4. T. Ou, Y. Lu, X. Wu and J. Cao, "Monte Carlo Tree Search: A Survey of Theories and Applications," 2022 3rd International Conference on Big Data, Artificial Intelligence and Internet of Things Engineering (ICBAIE), Xi’an, China, 2022, pp. 388-396.
5. G. M. J.-B. Chaslot, M. H. M. Winands, and H.J. van den Herik, “Parallel Monte-Carlo Tree Search”, Computers and Games. CG 2008. Lecture Notes in Computer Science, vol. 5131, pp.60–71, 2008, Springer, Berlin, Heidelberg.


