Classificação automática de imagens utilizando redes neurais convolucionais MobileNet: um estudo de caso com reconhecimento de felinos

Vitor Amadeu Souza

doi:10.47385/tudoeciencia.2456.2025

Autores

Vitor Amadeu Souza UniFOA, Centro Universitário de Volta Redonda, Volta Redonda, RJ. https://orcid.org/0009-0002-1857-6799

DOI:

https://doi.org/10.47385/tudoeciencia.2456.2025

Palavras-chave:

MobileNet; Redes Neurais Convolucionais. Classificação de Imagens. Deep Learning. Visão Computacional. ImageNet.

Resumo

Este trabalho apresenta uma implementação da arquitetura MobileNet para classificação automática de imagens, com foco específico no reconhecimento de felinos domésticos. O estudo utilizou um modelo MobileNet pré-treinado na base de dados ImageNet, aplicando-o na classificação de uma imagem de um gato persa. A metodologia envolveu o carregamento e pré-processamento da imagem, seguido pela aplicação do modelo de deep learning para obtenção das predições. Os resultados demonstraram precisão na classificação, com 90,97% de confiança para a classe "Persian_cat", evidenciando a eficácia das redes neurais convolucionais móveis para tarefas de visão computacional. O estudo confirma a aplicabilidade das arquiteturas MobileNet em cenários reais de classificação de imagens, oferecendo uma solução computacionalmente eficiente para dispositivos com recursos limitados. A pesquisa contribui para a compreensão das capacidades e limitações dos modelos de deep learning em tarefas de reconhecimento visual automatizado.

Downloads

Não há dados estatísticos.

Referências

ABADI, Martín et al. TensorFlow: A system for large-scale machine learning. In: 12th USENIX symposium on operating systems design and implementation (OSDI 16). 2016. p. 265-283. Disponível em: https://www.usenix.org/system/files/conference/osdi16/osdi16-abadi.pdf. Acesso em: 14 set. 2025.

DENG, Jia et al. Imagenet: A large-scale hierarchical image database. In: 2009 IEEE conference on computer vision and pattern recognition. IEEE, 2009. p. 248-255. DOI: 10.1109/CVPR.2009.5206848. Acesso em: 14 set. 2025.

DODGE, Samuel; KARAM, Lina. Understanding how image quality affects deep neural networks. In: 2016 eighth international conference on quality of multimedia experience (QoMEX). IEEE, 2016. p. 1-6. DOI: 10.1109/QoMEX.2016.7498955. Acesso em: 14 set. 2025.

FIELDING, Roy et al. Hypertext transfer protocol--HTTP/1.1. RFC 2616, 1999. Disponível em: https://tools.ietf.org/html/rfc2616. Acesso em: 14 set. 2025.

GIRSHICK, Ross et al. Rich feature hierarchies for accurate object detection and semantic segmentation. In: Proceedings of the IEEE conference on computer vision and pattern recognition. 2014. p. 580-587. DOI: 10.1109/CVPR.2014.81. Acesso em: 14 set. 2025.

GUO, Chuan et al. On calibration of modern neural networks. In: International conference on machine learning. PMLR, 2017. p. 1321-1330. Disponível em: http://proceedings.mlr.press/v70/guo17a.html. Acesso em: 14 set. 2025.

HE, Kaiming et al. Deep residual learning for image recognition. In: Proceedings of the IEEE conference on computer vision and pattern recognition. 2016. p. 770-778. DOI: 10.1109/CVPR.2016.90. Acesso em: 14 set. 2025.

HOWARD, Andrew G. et al. Mobilenets: Efficient convolutional neural networks for mobile vision applications. arXiv preprint arXiv:1704.04861, 2017. DOI: 10.48550/arXiv.1704.04861. Acesso em: 14 set. 2025.

IOFFE, Sergey; SZEGEDY, Christian. Batch normalization: Accelerating deep network training by reducing internal covariate shift. In: International conference on machine learning. PMLR, 2015. p. 448-456.

KRIZHEVSKY, Alex; SUTSKEVER, Ilya; HINTON, Geoffrey E. Imagenet classification with deep convolutional neural networks. Communications of the ACM, v. 60, n. 6, p. 84-90, 2017. DOI: 10.1145/3065386. Acesso em: 14 set. 2025.

RUSSAKOVSKY, Olga et al. ImageNet Large Scale Visual Recognition Challenge. International Journal of Computer Vision, v. 115, n. 3, p. 211-252, 2015. DOI: 10.1007/s11263-015-0816-y. Acesso em: 14 set. 2025.

SANDLER, Mark et al. Mobilenetv2: Inverted residuals and linear bottlenecks. In: Proceedings of the IEEE conference on computer vision and pattern recognition. 2018. p. 4510-4520. DOI: 10.1109/CVPR.2018.00474. Acesso em: 14 set. 2025.

SHORTEN, Connor; KHOSHGOFTAAR, Taghi M. A survey on image data augmentation for deep learning. Journal of big data, v. 6, n. 1, p. 1-48, 2019.

ZEILER, Matthew D.; FERGUS, Rob. Visualizing and understanding convolutional networks. In: European conference on computer vision. Springer, 2014. p. 818-833. DOI: 10.1007/978-3-319-10590-1_53. Acesso em: 14 set. 2025.

ZHANG, Ning et al. Part-based R-CNNs for fine-grained category detection. In: European conference on computer vision. Springer, 2014. p. 834-849. DOI: 10.1007/978-3-319-10590-1_54. Acesso em: 14 set. 2025.

WATKIN, A. Gato. Wikipédia, a enciclopédia livre, 24 ago. 2025. Disponível em: https://pt.wikipedia.org/wiki/Gato. Acesso em: 15 set. 2025.

Classificação automática de imagens utilizando redes neurais convolucionais MobileNet

um estudo de caso com reconhecimento de felinos

Autores

DOI:

Palavras-chave:

Resumo

Downloads

Referências

Downloads

Publicado

Como Citar

Edição

Seção

Licença

Enviar Submissão