Semana 15: Início da Jornada por Data Science e Business Intelligence

Ao longo das últimas semanas a equipe Linus esteve focada em estudar Data Science, conceitos fundamentais, ferramentas práticas e desafios que refletem o potencial transformador dessa área.

Primeiros Passos: Big Data e Data Science

Iniciamos nossa jornada explorando os conceitos básicos de Big Data e Data Science, compreendendo como o volume, a variedade e a velocidade dos dados impulsionam decisões estratégicas em indústrias modernas. Esse entendimento inicial abriu caminho para aplicarmos técnicas e ferramentas em atividades práticas, possibilitando uma visão mais ampla e fundamentada.

Preparação do Ambiente de Desenvolvimento

Para estruturar nosso trabalho, configuramos o ambiente utilizando Conda e Jupyter Notebook. Essa etapa foi útil para organizar as bibliotecas e facilitar o desenvolvimento de análises interativas.

Análise de Dados com Numpy, Pandas e Seaborn

Em seguida, aplicamos na prática bibliotecas como Numpy e Pandas, utilizando datasets para simular cenários reais. Dois exemplos foram:

Tabelas do IBGE: Trabalhamos com dados de municípios e estados brasileiros, manipulando e analisando informações demográficas, como latitude e longitude.

Histograma de latitude dos municípios.

Boxplot da distribuição do peso por Esporte e Gênero.

Olímpiadas de Londres 2012: Exploramos dados sobre medalhas, idade, sexo e esportes dos atletas. Geramos gráficos com a biblioteca Seaborn, para visualizar tendências nos dados.

Gráfico de distribuição da idade dos atletas.

Tratamento de Dados e Matriz de Correlação

Outro destaque foi o uso de técnicas de pré-processamento, como a verificação de valores nulos e seu tratamento. Também utilizamos o Label Encoder do Scikit-learn para converter dados categóricos (como sexo e esporte) em valores numéricos, permitindo análises mais robustas, como a criação de uma matriz de correlação.

Verificação de valores ausentes.

Transformação de variáveis categóricas em numéricas.

Matriz de correlação das variáveis do dataset.

Gráfico de distribuição peso x altura por esporte.

Conexão Teórica e Prática: Artigos Científicos

Uma atividade que conectou teoria e prática foi a apresentação de artigos científicos. Analisamos três estudos selecionados com base em uma busca estruturada, que abordaram Big Data e Ciência de Dados na Indústria 4.0. Destacamos:

Enhancing supply chain performance using RFID technology and decision support systems in the industry 4.0: Otimização operacional com tecnologias emergentes.
Industry 4.0 based process data analytics platform: A waste-to-energy plant case study: Aplicações práticas de machine learning e IIoT.
Integrating human-centric automation and sustainability through the NAToRM framework: neuromorphic computing approach for resilient industry 5.0 supply chains: Abordagem inovadora com computação neuromórfica.

Esses artigos proporcionaram uma visão sobre as técnicas atuais, os desafios enfrentados e os exemplos práticos de aplicação em setores estratégicos.

Reflexão e Próximos Passos

Esse início promissor deixou claro como Data Science pode transformar dados em valor. Seguimos empolgados para aprofundar os aprendizados e aplicá-los em soluções reais, conectando conhecimento teórico com desafios práticos do mercado.

Se você também acredita no potencial do Data Science, compartilhe conosco suas experiências e insights nos comentários! Acompanhe o blog da Equipe Linus para mais atualizações sobre nossa capacitação e projetos.