Visualização textual automatizada com nuvem de palavras
uma análise da página da wikipedia sobre inteligência artificial
DOI:
https://doi.org/10.47385/tudoeciencia.2605.2025Palavras-chave:
Nuvem de palavras. Análise de conteúdo web. Visualização textual. Web scraping. Processamento de linguagem natural. Wikipedia.Resumo
Este estudo apresenta uma análise de conteúdo web utilizando técnicas de visualização textual através de nuvem de palavras, aplicada especificamente à página da Wikipedia sobre inteligência artificial. O objetivo principal foi desenvolver e implementar um sistema automatizado para extração, processamento e visualização de conteúdo textual web, demonstrando a eficácia das nuvens de palavras como ferramenta de análise exploratória de dados textuais. A metodologia empregou web scraping com Python utilizando as bibliotecas requests e BeautifulSoup para extração de conteúdo, NLTK para processamento de linguagem natural incluindo remoção de stopwords, e WordCloud para geração da visualização final. Os resultados obtidos através da análise da página revelaram a predominância de termos técnicos e conceituais relacionados ao domínio da inteligência artificial. A nuvem de palavras gerada evidenciou "inteligência", "artificial", "sistema", "máquina", "código", "humano", "ciência", "computador" e "pesquisa" como os termos de maior frequência, refletindo adequadamente o conteúdo temático da fonte analisada. O estudo demonstra que a visualização através de nuvens de palavras constitui uma ferramenta eficaz para análise exploratória rápida de conteúdo web, permitindo identificação imediata dos principais tópicos e conceitos abordados em textos extensos.
Downloads
Referências
BIRD, S.; KLEIN, E.; LOPER, E. Natural language processing with Python: analyzing text with the natural language toolkit. Beijing: O'Reilly, 2009.
GILES, J. Internet encyclopaedias go head to head. Nature, v. 438, n. 7070, p. 900-901, 2005.
GOODFELLOW, I.; BENGIO, Y.; COURVILLE, A. Deep learning. Cambridge: MIT Press, 2016.
HEIMERL, F. et al. Word cloud explorer: text analytics based on word clouds. In: 47th Hawaii International Conference on System Sciences. Proceedings... IEEE, 2014. p. 1833-1842.
HUNTER, J. D. Matplotlib: A 2D graphics environment. Computing in Science & Engineering, v. 9, n. 3, p. 90-95, 2007.
LUTZ, M. Learning Python. 5th ed. Beijing: O'Reilly Media, 2013.
MANNING, C. D.; RAGHAVAN, P.; SCHÜTZE, H. Introduction to information retrieval. Cambridge: Cambridge University Press, 2008.
MITCHELL, R. Web scraping with Python: collecting more data from the modern web. 2nd ed. Beijing: O'Reilly Media, 2018.
MUELLER, A. WordCloud for Python documentation. Disponível em: https://amueller.github.io/word_cloud/. Acesso em: 31 jul. 2025.
NILSSON, N. J. The quest for artificial intelligence: a history of ideas and achievements. Cambridge: Cambridge University Press, 2009.
RICHARDSON, L. Beautiful Soup documentation. Disponível em: https://www.crummy.com/software/BeautifulSoup/bs4/doc/. Acesso em: 31 jul. 2025.
RUSSELL, S. J.; NORVIG, P. Artificial intelligence: a modern approach. 3rd ed. Boston: Pearson, 2016.
VIÉGAS, F. B.; WATTENBERG, M.; FEINBERG, J. Participatory visualization with Wordle. IEEE Transactions on Visualization and Computer Graphics, v. 15, n. 6, p. 1137-1144, 2009.
WILBUR, W. J.; SIROTKIN, K. The automatic identification of stop words. Journal of Information Science, v. 18, n. 1, p. 45-55, 1992.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2025 Tudo é Ciência: Congresso Brasileiro de Ciências e Saberes Multidisciplinares

Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.