Розробка системи розпізнавання номерних знаків засобами штучного інтелекту
Анотація
У статті запропоновано технологію створення системи розпізнавання номерних знаків засобами штучного інтелекту. Програма розпізнавання номерних знаків розроблена в інтегрованому середовищі розробки (IDE) PyCharm, яке підтримує Python та забезпечує доступ до бібліотек для машинного навчання та обробки зображень. Бібліотеки для роботи з зображеннями та текстом, такі як OpenCV, imutils, pytesseract, та інші, встановлюються через термінал PyCharm. Для обробки та розпізнавання номерних знаків був підготовлений набір зображень, які власне містять різні автомобільні номерні знаки. Ці зображення виконані з різних ракурсів, з різною освітленістю та якістю, що викликане необхідністю забезпечення відповідного реагування програми на різні вхідні дані для забезпечення її коректної роботи. Після завантаження зображення за допомогою бібліотеки OpenCV воно перетворюється у відтінки сірого, оскільки детекція контурів та обробка зображення значно простіша в градаціях сірого. Для виявлення контурів застосовувався алгоритм Canny. Контури на зображенні використовуються для подальшого виявлення номерного знака. Визначення горизонтальних та вертикальних контурів виконувалися за допомогою оператора Собеля. Для розпізнавання тексту номерного знака застосовуємо Tesseract OCR. Після того, як номерний знак був розпізнаний, порівнюємо його з наявними у базі даних. Після завершення налаштування програми необхідно провести її тестування з різними зображеннями, щоб переконатись у точності розпізнавання номерних знаків. Це дозволяє виявити можливі проблеми у процесі розпізнавання, такі як низька контрастність зображення, забруднення номерних знаків чи нестабільне освітлення, нахил або спотворення номерних знаків на зображенні, що може впливати на точність розпізнавання.
Посилання
2. Buzzelli, M. and Segantin, L. « Revisiting the compcars dataset for hierarchical car classification: New annotations, experiments, and results» 2021.
3. Cherti, M., Beaumont, R., Wightman, R., Wortsman, M., Ilharco, G., Gordon, C., Schuhmann, C., Schmidt, L., and Jitsev, J. «Reproducible scaling laws for contrastive language-image learning. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition» 2023.
4. Dosovitskiy, A. «An image is worth 16x16 words: Transformers for image recognition at scale» 2020.
5. Henry, C., Ahn, S. Y., and Lee, S.-W. «Multinational license plate recognition using generalized character sequence detection» 2020.


