Semana 19: Aplicação de PCA, Configuração do Ambiente Cloud e Preparativos para a Feira do ZL Academy

Bem-vindos à postagem da Semana 19 do Projeto ZL Academy! Nesta semana, continuamos nossa jornada em aprendizado de máquina e infraestrutura em nuvem, explorando novas técnicas para melhoria de modelos, a aplicação de PCA, e nos preparamos para a Feira de Projetos.


20 de Janeiro de 2025: Ambiente Cloud e PCA

Na segunda-feira, tivemos uma aula que combinou teoria e prática. Exploramos a aplicação de PCA (Principal Component Analysis) e recebemos uma visita dos colaboradores da LG Eletronics, Lohan e Vitor, que nos ajudaram a configurar o ambiente Cloud.

Passos para Configuração do Ambiente Cloud:

  1. Acesso ao portal: Acesse savpc.lge.com usando o login e senha fornecidos pela equipe LG.

  2. Download e instalação do Cloud PC Connect APP: Clique no botão cinza “Download” para baixar o aplicativo e instale-o em sua máquina.

  3. Utilização do OTP: Gere um código temporário (Token) pelo celular para autenticação segura.

  4. Iniciação do ambiente: Clique em “Start&Connect” e aguarde de 3 a 5 minutos. Caso não funcione, tente reiniciar ou utilize a opção “Repair”.

Observações Importantes:

  • O ambiente Cloud não pode estar logado em mais de uma máquina simultaneamente.

  • Utilize o navegador padrão (Google Chrome) para melhor compatibilidade.

  • Mantenha os arquivos organizados e salve-os em pastas adequadas para evitar problemas de performance.

Benefícios do PCA explorados em aula:

  • Redução de ruído nos dados.

  • Menor consumo de memória e tempo de treinamento.

  • Redução de overfitting.

  • Seleção de componentes com maior variância, mantendo a representatividade dos dados.


21 de Janeiro de 2025: ResNet50 e PCA

A aula de terça-feira foi dedicada ao uso do modelo pré-treinado ResNet50 como extrator de características. A pipeline desenvolvida foi a seguinte:

  1. Dados: Entrada com 2000 imagens.

  2. Modelo pré-treinado: Utilização do ResNet50 sem a camada TOP, com parâmetros congelados.

  3. Redução de dimensionalidade com PCA: Os 2000 dados foram reduzidos para 100 componentes principais.

  4. Classificação: Aplicamos classificadores tradicionais (SVM, Random Forest e Logistic Regression).

Figura 1: Anotações da aula do dia 21 de janeiro de 2025.


Vantagens de usar o PCA nesse processo:

  • Menor consumo de recursos computacionais.

  • Melhor desempenho ao evitar redundâncias nos dados.

  • Aumento da capacidade de generalização dos modelos treinados.


22 de Janeiro de 2025: Desenvolvimento do Trabalho 6

A quarta-feira foi voltada para a realização do Trabalho 6, que consistiu em:

  • Utilizar o ResNet50 como extrator de características.

  • Aplicar PCA com diferentes valores de n_componentes, avaliando os resultados para cada variação.

  • Testar três classificadores tradicionais:

    1. Logistic Regression

    2. SVM (kernel RBF)

    3. Random Forest (100 a 500 árvores)

Os resultados foram analisados através de matrizes de confusão e relatórios de classificação.


23 e 24 de Janeiro de 2025: Mentoria, Preparativos para a Feira de Projetos e Desenvolvimento do Trabalho 7

Nesses dias, recebemos orientação para finalizar os relatórios mensais de atividades e nos organizamos para a Feira de Projetos, que contará com a presença de representantes de iniciativas importantes como DX Eldorado e Machine Maclyne.

Atividades realizadas:

  • Configuração do ambiente Cloud para execução de exercícios práticos com automação.

  • Elaboração de um pitch de 5 minutos para apresentar os processos e soluções desenvolvidas durante o projeto.

  • Discussão sobre a apresentação de artigos científicos por dois membros do projeto ZL Academy.

  • Conclusão do Trabalho 7, feito em sala de aula com os membros Ademar Castro, Jade Santos e Natália Rufino.


Trabalho 7: Comparativo de Modelos

Neste trabalho, utilizamos datasets gerados pelas equipes para realizar uma análise detalhada do desempenho de classificadores tradicionais. Os passos incluíram:

1. Extração de Características: ResNet50 como base.
2. Redução com PCA: Seleção das principais componentes.
3. Teste com Classificadores:
  - SVM
  - Random Forest
  - Logistic Regression

Resultados:

  • O desempenho foi avaliado através de relatórios de classificação e matrizes de confusão, destacando o modelo mais eficiente.