|

Применение метода глубокого обучения в задаче идентификации достопримечательностей на изображении

Авторы: Нгуен Куй Тхань
Опубликовано в выпуске: #11(88)/2023
DOI: 10.18698/2541-8009-2023-11-950


Раздел: Информатика, вычислительная техника и управление | Рубрика: Информационные технологии. Компьютерные технологии. Теория вычислительных машин и систем

Ключевые слова: компьютерное зрение, сверточная нейронная сеть, распознавание изображения, обнаружение объектов, обработка изображений, глубокое обучение, методы искусственного интеллекта, DELF

Опубликовано: 19.12.2023

Рассмотрен подход к идентификации достопримечательностей на изображениях с использованием сверточных нейронных сетей. Представлен обзор основных этапов алгоритма: подготовка данных, выбор архитектуры CNN, обучение модели, оценка результатов. Описаны такие методы предобработки изображений, как удаление шума и объектов заднего плана. Приведены примеры популярных архитектур CNN. Этап обучения включает инициализацию весов, прямое и обратное распространение, обновление весов с целью минимизации потерь. Для оценки точности классификации применены метрики типа accuracy, precision, recall. Рассмотрены подходы к улучшению результатов, такие как увеличение данных, изменение структуры сети, улучшение качества изображений. Подчеркнута важность распознавания достопримечательностей в сферах туризма, архитектуры, наследия. Выполнен обзорный анализ применения глубокого обучения для автоматизации данной задачи.


Литература

[1] Распознавание сцен на изображениях с помощью глубоких сверточных нейронных сетей. URL: https://habr.com/ru/companies/vk/articles/359214/ (дата обращения 19.05.2023).

[2] Noh H., Araujo A., Sim J., Weyand T., Han B. Large-Scale Image Retrieval with Attentive Deep Local Features. ICCV, 2017, pp. 3456–3465.

[3] Weyand T., Araujo A., Cao B., Sim J. Google Landmarks Dataset v2 – A Large-Scale Benchmark for Instance-Level Recognition and Retrieval. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2020, pp. 2575–2584.

[4] Google Landmark Recognition 2021. URL: https://www.kaggle.com/c/landmark-recognition-2021/overview/iccv-2021 (accessed May 19, 2023).

[5] Xu C., Wang W., Liu S., Wang Y., Tang Y., Bian T., Yan Y., She Q., Yang C. 3rd Place Solution to Google Landmark Recognition Competition 2021. arXiv preprint arXiv:2110.02794, 2021.

[6] AlexNet — Сверточная нейронная сеть для классификации изображений. URL: https://neurohive.io/ru/vidy-nejrosetej/alexnet-svjortochnaja-nejronnaja-set-dlja-raspoznavanija-izobrazhenij/ (дата обращения 19.05.2023).

[7] VGG Very Deep Convolutional Networks (VGGNet) — What you need to know. URL: https://viso.ai/deep-learning/vgg-very-deep-convolutional-networks/ (accessed May 19, 2023).

[8] ResNet (34, 50, 101): «остаточные» CNN для классификации. URL: https://neurohive.io/ru/vidy-nejrosetej/resnet-34-50-101/ (дата обращения 19.05.2023).

[9] Нгуен Т.К., Сырямкин В.И., Нгуен Ч.Х.Т. Модель метода распознавания объектов на изображениях с использованием «сверточной нейронной сети — CNN». Современные наукоемкие технологии, 2020, vol. 12–2, с. 269–280. http://doi.org/10.17513/snt.38445

[10] Шарибаев Р.Н., Джураев Ш.С., Тохиржонова М.Р. Улучшение классификации по сортам коконов с использованием сверточных нейронных сетей. Теория и практика современной науки, 2023, № 6 (96), c. 212–214.