Semana 17: Explorando Modelos de Classificação e Regressão

 
 
Bem-vindo à nossa postagem sobre a semana 17 do Projeto ZL Academy. Durante esta semana, exploramos os fundamentos de modelos de classificação e regressão, aplicamos algoritmos a datasets reais e realizamos uma atividade prática desafiadora. Vamos conferir os detalhes?

06 de Janeiro de 2025: Introdução aos Modelos de Classificação

Iniciamos a semana estudando três modelos de classificação amplamente utilizados:

  1. Decision Tree Classifier
  2. Random Forest Classifier
  3. Logistic Regression

Para exemplificar esses conceitos, utilizamos o dataset load_iris da biblioteca sklearn.datasets. Esse dataset é composto por quatro características de flores e é amplamente conhecido por ser simples, mas eficiente para aprender conceitos de classificação.

Figura 1: Código ministrado em aula. Fonte: Próprio autor.

  

A seguir, é possível observar a Árvore de Decisão sendo visualizada através do código:

from sklearn import tree
tree.plot_tree(modelo_tree)

Figura 2: Visualização da Árvore de decisão. Fonte: Próprio autor. 

 

07 de Janeiro de 2025: Iteração entre Múltiplos Modelos e Introdução à Regressão

Nesta aula, ampliamos o que foi aprendido sobre os modelos de classificação, adicionando uma abordagem prática para comparar diversos modelos de uma só vez em um único dataset utilizando laços de repetição. Isso nos permitiu observar as diferenças de desempenho entre os algoritmos.

Além disso, demos os primeiros passos no estudo de modelos de regressão, essenciais para prever valores contínuos.

 O dataset que utilizamos durante a aula foi load_breast_cancer disponível no módulo sklearn.datasets é um conjunto de dados amplamente utilizado para treinar e avaliar algoritmos de aprendizado de máquina em tarefas de classificação binária. Ele está relacionado à detecção de câncer de mama.

Resultados observados com os seguintes modelos:


Modelo Acurácia
0 GaussianNB 0.929825
1 SVM (Linear) 0.956140
2 SVM (RBF) 0.929825
3 SVM (Polinômio) 0.912281

 

Figura 3: Comparação de Acurácias. Fonte: Próprio autor.


10 de Janeiro de 2025: Trabalhando com Modelos e Inferências

Nesta aula, trabalhamos com dois novos datasets:

  1. ConsumoxCo2 (regressão)
  2. load_digits (classificação de dígitos manuscritos com KNN e GaussianNB)

Aprendemos como:

  • Instanciar os datasets.
  • Selecionar as características e o alvo.
  • Dividir os dados em treino e teste.
  • Treinar e avaliar os modelos.
  • Realizar inferências e análises.
Figura 4: Visualização das imagens do dataset load_digits. Fonte: Próprio autor. 

 

Atividade Prática da Semana

Descrição da Atividade

Os participantes receberam dois datasets para análise:

  • aluguel_residencial.csv (regressão)
  • diabetes.csv (classificação)

A atividade consistiu em: 

  1. Comparar pelo menos 5 modelos de classificação e 5 modelos de regressão.
  2. Avaliar o impacto de variações como:
  3. Colunas escolhidas como características.
  4. Divisão treino/teste.
  5. Parâmetros de cada modelo.
  6. Gerar relatórios detalhados, incluindo:
  7. Relatórios de classificação e matrizes de confusão.
  8. Análises textuais com um ranking de desempenho dos modelos.

Conclusão

Essa semana foi repleta de aprendizado e prática. Exploramos modelos essenciais no aprendizado de máquina e aplicamos conceitos fundamentais em problemas reais, promovendo uma compreensão mais profunda dos algoritmos estudados.

Gostou do conteúdo? Continue acompanhando as postagens do ZL Academy para mais insights e exemplos práticos!