Система распознания различных сортов яблок на основе нейронной сети YOLOv8x
Авторы: Михеев Д.А., Китаев Д.Н. | |
Опубликовано в выпуске: #3(92)/2024 | |
DOI: | |
Раздел: Информатика, вычислительная техника и управление | Рубрика: Информационные технологии. Компьютерные технологии. Теория вычислительных машин и систем |
|
Ключевые слова: компьютерное зрение, распознание объектов, нейронные сети, сверточная нейронная сеть, одноступенчатый детектор, YOLOv8x, весовой товар, сорта яблок, розничная торговля |
|
Опубликовано: 28.07.2024 |
В данной работе проведен выбор нейросетевой модели для решения задачи детекции весового товара, рассмотрено семейство одноступенчатых моделей сверточных нейронных сетей YOLOv8, произведена первичная оценка работоспособности самой крупной модели YOLOv8x на кадрах с изображениями фруктов и овощей в продуктовом магазине, собраны и подготовлены данные для обучения оцененной сети для распознания пяти сортов яблок: Golden Delicious (Голден Делишес), Granny Smith (Гренни Смит), Gala (Гала), Honey Crisp (Медовый хруст) и Red Chief (Ред Чиф), на полученных данных обучена модель YOLOv8x с использованием трансферного обучения, проанализированы результаты работы обученной модели.
Литература
[1] Андриянов Н.А., Дементьев В.Е., Ташлинский А.Г. Обнаружение объектов на изображении: от критериев Байеса и Неймана — Пирсона к детекторам на базе нейронных сетей EfficientDet. Компьютерная оптика, 2022, т. 46, № 1, с. 139–159. https://doi.org/10.18287/2412-6179-CO-922
[2] Albumentations, “Сomputer vision tool that boosts the performance of deep convolutional neural networks”. Available at: https://albumentations.ai/ (accessed April 15, 2024).
[3] Computer Hope, Dictionary, Definitions, “FLOPS”. Available at: https://www.computerhope.com/jargon/f/flops.htm (accessed April 15, 2024).
[4] GitHub, ultralytics repository, YOLOv8. URL: https://github.com/ultralytics/ultralytics (accessed April 15, 2024).
[5] Hui J. mAP (mean Average Precision) for object detection. Available at: https://jonathan-hui.medium.com/map-meanaverage-precision-for-object-detection-45c121a31173 (accessed April 15, 2024).
[6] Alzubaidi L., Zhang J., Humaidi A.J. Review of deep learning: concepts, CNN architectures, challenges, applications, future directions. Journal of Big Data, 2021, art. 53. https://doi.org/10.1186/s40537-021-00444-8
[7] Open Neural Network Exchange. Available at: https://onnx.ai/ (accessed April 15, 2024).
[8] Powers D. Evaluation: From precision, recall and f-measure to ROC, Informedness, markedness & correlation. Journal of Machine Learning Technologies, 2011, vol. 2 (1), pp. 37–63.
[9] Redmon J., Divvala S., Girshick R., Farhadi A. You only look once: Unified, real-time object detection. Proc IEEE Conf on Computer Vision and Pattern Recognition (CVPR), 2016, vol. 1, pp. 779–788. https://doi.org/10.48550/arXiv.1506.02640
[10] Ockay M., Harakal M., Liska M. Compute Unified Device Architecture (CUDA) GPU programming model and possible integration to the parallel environment. Science & Military, no. 2, vol. 3, 2008, pp. 64–68.
[11] Roboflow, Jacob Solawetz, Francesco “What is YOLOv8? The Ultimate Guide”. Available at: https://blog.roboflow.com/whats-new-in-yolov8/ (accessed April 15, 2024).
[12] Roboflow, “Quickly Label Training Data and Export to Any Format”. Available at: https://roboflow.com/annotate (accessed April 15, 2024).