|

Комплексная оптимизация Deeplabv3 для мобильных устройств с применением облегченных архитектур

Авторы: Малышев П.В.
Опубликовано в выпуске: #6(101)/2025
DOI:


Раздел: Информатика, вычислительная техника и управление | Рубрика: Информационные технологии. Компьютерные технологии. Теория вычислительных машин и систем

Ключевые слова: сверточные нейронные сети, сегментация, цифровая обработка изображений, глубокое обучение, оптимизация

Опубликовано: 09.12.2025

Глубокие сверточные нейронные сети (CNN) стали основой для решения задач сегментации изображений, что делает их незаменимыми для различных приложений, включая автономные системы и мобильные устройства. Однако высокие требования к вычислительным ресурсам делают использование моделей, таких как Deeplabv3, затруднительным на устройствах с ограниченными ресурсами. В данной статье исследованы возможности оптимизации модели Deeplabv3 с помощью замены бэкбона ResNet-50 более легкими архитектурами, такими как ResNet-18 и MobileNetV2. Исследовано снижение потребления ресурсов без значительных потерь точности модели при использовании облегченных архитектур.


Литература

[1] Usmani I.A., Qadri M.T., Zia R., Alrayes F.S., Saidani O., Dashtipour K. Interactive effect of learning rate and batch size to implement transfer learning for brain tumor classification. Electronics, 2023, vol. 12, art. no. 964. https://doi.org/10.3390/electronics12040964

[2] Zhou P., Xie X., Lin Z., Yan S. Towards Understanding Convergence and Generalization of AdamW. IEEE Transactions on Pattern Analysis and Machine Intelligence, 46, vol. 9, pp. 6486–6493. https://doi.org/10.1109/TPAMI.2024.3382294

[3] Kolarik M., Burget R., Riha K. Comparing normalization methods for limited batch size segmentation neural networks. 43rd International Conference on Telecommunications and Signal Processing (TSP), Milan, Italy, 2020, pp. 677–680. https://doi.org/10.48550/arXiv.2011.11559

[4] Gou J., Yu B., Maybank S.J. et al. Knowledge distillation: a survey. Int. J. Comput. Vis., 2021, vol. 129, pp. 1789–1819. https://doi.org/10.1007/s11263-021-01453-z

[5] Shorten C., Khoshgoftaar T.M. A survey on image data augmentation for deep learning. J. big data, 2019, vol. 6. https://doi.org/10.1186/s40537-019-0197-0

[6] Cordts M., Omran M., Ramos S., Scharw?chter T., Enzweiler M., Benenson R., Franke U., Roth S., Schiele B. The Cityscapes dataset for semantic urban scene understanding. URL: https://markus-enzweiler.de/downloads/publications/cordts15-cvprws.pdf

[7] van de Ven G.M., Tuytelaars T., Tolias A.S. Three types of incremental learning. Nat Mach Intell., 2022, vol. 4, pp. 1185–1197. https://doi.org/10.1038/s42256-022-00568-3

[8] Liang T., Glossner J., Wang L., Shi S., Zhang X. Pruning and quantization for deep neural network acceleration: a survey. Neurocomputing, 2021, vol. 461, pp. 370–403. https://doi.org/10.1016/j.neucom.2021.07.045