Формалізація процесу розпізнавання ключових слів у голосовому сигналі
Анотація
У даній роботі було здійснено формалізацію процесу розпізнавання ключових слів у голосовому сигналі, що стало основою для розробки деталізованої концептуальної моделі. Запропонована модель надає комплексний і систематизований опис процесу створення ефективних засобів розпізнавання. Модель охоплює критичні компоненти такі як виділення ознак, методологію моделювання, стратегію навчання, процедури тестування, та механізми використання. Значна увага приділяється впровадженню передових методів глибокого навчання, включаючи нейронні мережі, марковські моделі та техніки аугментації даних, що сприяє підвищенню точності розпізнавання ключових слів. Ця робота враховує численні виклики, пов'язані з варіативністю голосових сигналів, стійкістю до шумів, обмеженістю навчальних даних та вимогами до продуктивності в режимі реального часу. Запропонований формалізований підхід дозволяє оптимізувати взаємодію між компонентами та підвищити загальну ефективність системи розпізнавання ключових слів у голосовому сигналі.
Посилання
2. Rashmi, S., Hanumanthappa, M., & Reddy, M. V. (2018). Hidden Markov Model for speech recognition system—a pilot study and a naive approach for speech-to-text model. In Speech and Language Processing for Human-Machine Communications: Proceedings of CSI 2015 (pp. 77-90). Springer Singapore.
3. Gunawan, A. (2010). English digits speech recognition system based on hidden Markov models. In Proceedings of International Conference Computer.
4. Deshmukh, A. M. (2020). Comparison of hidden markov model and recurrent neural network in automatic speech recognition. European Journal of Engineering and Technology Research, 5(8), 958-965.
5. Khurana, S., Laurent, A., Hsu, W. N., Chorowski, J., Lancucki, A., Marxer, R., & Glass, J. (2020). A convolutional deep markov model for unsupervised speech representation learning. arXiv preprint arXiv:2006.02547.


