Implementação de regressão linear com scikit-learn

uma análise prática da relação entre horas de estudo e desempenho acadêmico

Autores

DOI:

https://doi.org/10.47385/tudoeciencia.2606.2025

Palavras-chave:

Regressão Linear. Scikit-learn. Python. Aprendizado de Máquina. Machine Learning. Análise Preditiva.

Resumo

Este estudo apresenta uma implementação prática de regressão linear utilizando a biblioteca Scikit-learn para modelar a relação entre horas de estudo e desempenho acadêmico. O objetivo principal foi demonstrar a aplicação de técnicas de aprendizado de máquina supervisionado através de um exemplo educacional, enfatizando os aspectos metodológicos e técnicos da implementação. Utilizando um conjunto de dados sintéticos adequado para fins didáticos, foi desenvolvido um modelo de regressão linear empregando as ferramentas do Python. A metodologia incluiu pré-processamento de dados, divisão em conjuntos de treinamento e teste (80/20), treinamento do modelo LinearRegression do Scikit-learn e avaliação através do coeficiente de determinação (R²). Os resultados produziram a equação y = 9,68x + 2,83 e demonstraram a eficácia da implementação através de métricas de avaliação apropriadas. A visualização dos dados e da linha de regressão foi realizada com Matplotlib, proporcionando uma representação gráfica dos resultados. Este trabalho contribui para a compreensão prática da implementação de algoritmos de regressão linear e serve como base para aplicações mais complexas de aprendizado de máquina em contextos educacionais e científicos.

Downloads

Não há dados estatísticos.

Referências

BISHOP, C. M. Pattern recognition and machine learning. New York: Springer, 2006.

GÉRON, A. Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow. 2. ed. Sebastopol: O'Reilly Media, 2019.

HARRIS, C. R. et al. Array programming with NumPy. Nature, v. 585, n. 7825, p. 357-362, 2020.

HASTIE, T.; TIBSHIRANI, R.; FRIEDMAN, J. The elements of statistical learning: Data mining, inference, and prediction. 2. ed. New York: Springer, 2009.

HUNTER, J. D. Matplotlib: A 2D graphics environment. Computing in Science & Engineering, v. 9, n. 3, p. 90-95, 2007.

JAMES, G. et al. An introduction to statistical learning: with applications in R. New York: Springer, 2013.

KOHAVI, R. A study of cross-validation and bootstrap for accuracy estimation and model selection. In: INTERNATIONAL JOINT CONFERENCE ON ARTIFICIAL INTELLIGENCE, 14., 1995, Montreal. Proceedings... Montreal: Morgan Kaufmann, 1995. p. 1137-1143.

MCKINNEY, W. Data structures for statistical computing in Python. In: PROCEEDINGS OF THE 9TH PYTHON IN SCIENCE CONFERENCE, 9., 2010, Austin. Anais... Austin: SciPy, 2010. p. 51-56.

MONTGOMERY, D. C.; PECK, E. A.; VINING, G. G. Introduction to linear regression analysis. 5. ed. Hoboken: John Wiley & Sons, 2012.

MÜLLER, A. C.; GUIDO, S. Introduction to machine learning with Python: A guide for data scientists. Sebastopol: O'Reilly Media, 2016.

PEDREGOSA, F. et al. Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, v. 12, p. 2825-2830, 2011.

SCULLEY, D. et al. Hidden technical debt in machine learning systems. In: ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS, 28., 2015, Montreal. Proceedings... Cambridge: MIT Press, 2015. p. 2503-2511.

TUFTE, E. R. The visual display of quantitative information. 2. ed. Cheshire: Graphics Press, 2001.

VAN ROSSUM, G.; DRAKE, F. L. Python 3 reference manual. Scotts Valley: CreateSpace, 2009.

WILSON, G. et al. Best practices for scientific computing. PLoS Biology, v. 12, n. 1, p. e1001745, 2014.

ZHENG, A.; CASARI, A. Feature engineering for machine learning: Principles and techniques for data scientists. Sebastopol: O'Reilly Media, 2018.

Downloads

Publicado

15-01-2026

Como Citar

Amadeu Souza, V. (2026). Implementação de regressão linear com scikit-learn: uma análise prática da relação entre horas de estudo e desempenho acadêmico. Tudo é Ciência: Congresso Brasileiro De Ciências E Saberes Multidisciplinares, (4). https://doi.org/10.47385/tudoeciencia.2606.2025

Edição

Seção

Ciências Exatas, Tecnologias e Engenharias