69h

Para conclusão

8
Cursos
3
Vídeos extras
5
Artigos
O que você vai aprender nesta Formação?

Conheça a formação Python para Data Science

A formação de Python para Data Science da Alura é um guia de estudos com o passo a passo necessário para quem deseja aprender sobre uma das áreas com mais demanda de profissionais nos últimos anos. Cada etapa desse processo foi cuidadosamente pensada por nossa equipe, fazendo com que você, ao final da formação, tenha desenvolvido habilidades para enfrentar diversos desafios na área de Ciência de Dados.

POR QUE ESTUDAR PYTHON?

Python é uma linguagem de código aberto, interpretada e de alto nível, sendo uma das linguagens mais utilizadas em projetos de Data Science. Além de sua facilidade de uso e da sintaxe simples, essa linguagem possui excelentes bibliotecas para lidar com dados, seja nas etapas de obtenção, limpeza e exploração dos dados ou na aplicação de modelos de Machine Learning.

O QUE APRENDEREMOS?

Na Formação Python para Data Science da Alura, você conhecerá Python, a linguagem mais popular em Data Science, explorando as bibliotecas mais utilizadas em Ciência de Dados, como Pandas e Numpy. Você aprenderá sobre a coleta, preparação e exploração dos dados com o Pandas em projetos dos mais diversos assuntos.

Se você quer trabalhar com Data Science, esta formação vai te preparar para entrar no mercado e dar seus primeiros passos na profissão.

Se você está com dúvida de qual sequência seguir nas formações de Data Science, sugerimos que comece seus estudos pela formação Python para Data Science, em seguida faça a formação Avançando em Data Science com Python, finalizando com a formação Data Science.

Por que estudar esta formação?

  • Guia de aprendizado

    Conteúdos pensados para facilitar seu estudo

  • Do básico ao avançado

    Formação completa para o mercado

  • Você dentro do mercado

    Do zero ao sonhado emprego em sua área de interesse

Comece essa formação agora mesmo e capacite-se para seu próximo projeto!

Conheça os planos

Com quem você vai aprender?

  • Mirla Costa

    Instrutora em Data Science, graduanda em Engenharia Elétrica pela UFPI com pesquisa focada em Aprendizado de Máquina e Inteligência Computacional. Amante de programação, tecnologia, cachorros, animações e jogar RPG de mesa.

  • Mirla Costa

    Instrutora em Data Science, graduanda em Engenharia Elétrica pela UFPI com pesquisa focada em Aprendizado de Máquina e Inteligência Computacional. Amante de programação, tecnologia, cachorros, animações e jogar RPG de mesa.

  • Bruno Raphaell

    Bruno é um instrutor de Data Science e Engenheiro Eletricista pela Universidade Federal do Piauí. Se dedica em áreas como Data Science, Machine Learning e Deep Learning, e possui grande interesse em engenharia de dados e engenharia de machine learning. Além disso, em seu tempo livre, ele gosta de jogar xadrez, tocar instrumentos musicais e jogar League of Legends.

  • Bruno Raphaell

    Bruno é um instrutor de Data Science e Engenheiro Eletricista pela Universidade Federal do Piauí. Se dedica em áreas como Data Science, Machine Learning e Deep Learning, e possui grande interesse em engenharia de dados e engenharia de machine learning. Além disso, em seu tempo livre, ele gosta de jogar xadrez, tocar instrumentos musicais e jogar League of Legends.

  • Afonso Augusto Rios

    Formado em Engenharia Elétrica, mas sempre com um pézinho na área da educação básica e tecnológica. Apaixonado por tecnologia, futebol e estudo de línguas, tenta trazer um pouco de ambos os mundos para seus estudos. Atuou como professor de Matemática em escolas públicas de Petrolina, através de um ONG na área de educação, e em projetos educacionais em diversos estados. Com conhecimento em Python e Data Visualization, vem se desenvolvendo na linguagem R, SQL e Power BI.

  • Afonso Augusto Rios

    Formado em Engenharia Elétrica, mas sempre com um pézinho na área da educação básica e tecnológica. Apaixonado por tecnologia, futebol e estudo de línguas, tenta trazer um pouco de ambos os mundos para seus estudos. Atuou como professor de Matemática em escolas públicas de Petrolina, através de um ONG na área de educação, e em projetos educacionais em diversos estados. Com conhecimento em Python e Data Visualization, vem se desenvolvendo na linguagem R, SQL e Power BI.

  • Allan Segovia Spadini

    Allan trabalha como instrutor de Ciência de dados na Alura desde 2019. Também é um dos autores do livro Séries temporais com Prophet pela Casa do Código.

  • Allan Segovia Spadini

    Allan trabalha como instrutor de Ciência de dados na Alura desde 2019. Também é um dos autores do livro Séries temporais com Prophet pela Casa do Código.

  • Millena Gená Pereira

    Millena Gená é estudante de Ciência da Computação. Atualmente, é Instrutora de Dados aqui na Alura atuando principalmente na área de Engenharia de dados. Ela está sempre procurando aprender algo novo sobre tecnologia e é apaixonada por novas aventuras. Programar e ajudar as pessoas são seus hobbies favoritos! ^^

  • Millena Gená Pereira

    Millena Gená é estudante de Ciência da Computação. Atualmente, é Instrutora de Dados aqui na Alura atuando principalmente na área de Engenharia de dados. Ela está sempre procurando aprender algo novo sobre tecnologia e é apaixonada por novas aventuras. Programar e ajudar as pessoas são seus hobbies favoritos! ^^

  • Valquíria Alencar 

    Doutora em Biotecnologia e realizou pós-doutorado na Universidade Federal do ABC. Atualmente, atua como instrutora na escola de Data Science, onde desenvolve projetos e cursos abrangendo o pré-processamento e análise exploratória de dados, visualização de dados em Python, aplicação de inteligências artificiais generativas, além da implementação e otimização de modelos de aprendizado de máquina. Também é uma das autoras do livro Séries Temporais com Prophet, publicado pela Editora Casa do Código.

  • Valquíria Alencar 

    Doutora em Biotecnologia e realizou pós-doutorado na Universidade Federal do ABC. Atualmente, atua como instrutora na escola de Data Science, onde desenvolve projetos e cursos abrangendo o pré-processamento e análise exploratória de dados, visualização de dados em Python, aplicação de inteligências artificiais generativas, além da implementação e otimização de modelos de aprendizado de máquina. Também é uma das autoras do livro Séries Temporais com Prophet, publicado pela Editora Casa do Código.

  • João Vitor de Miranda

    Bacharel em Matemática e pós graduado em Data Science e Analytics. Com conhecimento em Matemática, Estatística, Excel, Python, R e SQL/NoSQL.

  • João Vitor de Miranda

    Bacharel em Matemática e pós graduado em Data Science e Analytics. Com conhecimento em Matemática, Estatística, Excel, Python, R e SQL/NoSQL.

  • Paulo Calanca

    Estudante de Engenharia de Computação, na Universidade Candido Mendes. Atualmente atua como Monitor da escola de dados da Alura. Com muito interesse em Estatística, Data Science e Engenharia de Dados. Constantemente aprendendo novas tecnologias.

  • Paulo Calanca

    Estudante de Engenharia de Computação, na Universidade Candido Mendes. Atualmente atua como Monitor da escola de dados da Alura. Com muito interesse em Estatística, Data Science e Engenharia de Dados. Constantemente aprendendo novas tecnologias.

Passo a passo
  1. 1 Primeiros passos

    Neste primeiro momento, você iniciará a jornada conhecendo a linguagem de programação Python já com o foco em Ciência de Dados.

    Você vai aprender e executar conceitos, técnicas e ferramentas importantes para se desenvolver na linguagem ao mesmo tempo que aplicará o que foi aprendido a projetos e a situações-problema.

    Vamos explorar os conceitos básicos da linguagem Python, como o uso de variáveis, estruturas condicionais e de repetição e, também, estruturas de dados simples, como listas e dicionários, utilizando o Jupyter Notebook por meio da ferramenta Google Colab.

    Vamos aprender o que são as bibliotecas em Python e como utilizá-las em nossos projetos, como criar e interpretar funções, como trabalhar com estruturas de dados compostas e como lidar com erros e exceções que ocorram em nossos códigos.

    • Artigo O que é Python?

    • Artigo Jupyter Notebook: Exemplos de Códigos e Como Usar

    • Curso Python para Data Science: primeiros passos

      10h
      • Entenda comandos básicos da linguagem Python
      • Diferencie os tipos de variáveis
      • Manipule tipos básicos de dados em Python
      • Distingua estruturas condicionais
      • Construa diferentes estruturas de repetição
      • Trabalhe com estruturas de dados
      • Relacione as estruturas da linguagem de programação à construção de projetos
    • Alura+ Trabalhando com Sets no Python

    • Curso Python para Data Science: trabalhando com funções, estruturas de dados e exceções

      08h
      • Entenda as funções das bibliotecas e pacotes na linguagem Python
      • Conheça as built-in functions e suas utilidades
      • Crie funções personalizadas
      • Trabalhe com estruturas de dados compostas e aninhadas
      • Construa listas e dicionários seguindo padrões por meio de list e dict comprehension
      • Diferencie os tipos de erros e exceções em códigos Python
      • Trate erros e comportamentos indesejados em seu código
  2. 2 Pacotes de dados

    Neste passo, você aprenderá sobre a biblioteca NumPy para trabalhar com a manipulação de arrays, que permitem armazenar e fazer operações com dados. A biblioteca NumPy possui uma ampla variedade de operações em arrays, incluindo cálculos matemáticos, operações estatísticas básicas, classificação, seleção e muito mais.

    Você também vai dar seus primeiros passos com Pandas, uma das principais bibliotecas em Python para manipulação e análise de dados em projetos de Data Science. Nessa parte da formação, vamos iniciar nossa jornada com a biblioteca Pandas, aplicando seus recursos básicos em um projeto de ciência de dados. Na sequência, vamos ver como importar dados de diversos tipos de arquivos - como CSV, Excel, JSON, e até mesmo páginas web - e transformá-los em estruturas de dados conhecidas como DataFrames. Essas estruturas permitem a realização de diversas operações com dados, como filtragem, ordenação, agregação, entre outras.

    • Artigo Numpy: trabalhando computação científica com Python

    • Curso NumPy: análise numérica eficiente com Python

      08h
      • Aprenda a ler e escrever dados usando Numpy
      • Crie e manipule arrays multidimensionais
      • Saiba como gerar números aleatórios com a biblioteca Numpy
      • Descubra como utilizar seeds para trabalhar com aleatoriedade
      • Faça o cálculo de regressão linear com Numpy
      • Explore funções de agregação na Numpy
    • Artigo Pandas: o que é, para que serve e como instalar

    • Curso Pandas: conhecendo a biblioteca

      08h
      • Utilize os principais recursos da biblioteca Pandas pra desenvolver um projeto
      • Realize análises exploratórias
      • Construa diferentes gráficos
      • Selecione dados específicos
      • Aprenda a lidar com dados nulos
      • Remova linhas e colunas
      • Crie diversos tipos de colunas
    • Curso Pandas I/O: trabalhando com diferentes formatos de arquivos

      08h
      • Entenda o que são arquivos do tipo CSV, XLSX, JSON, HTML e XML
      • Compreenda como trabalhar com diferentes tipos de dados, tanto na entrada como na saída (input/output)
      • Leia dados provenientes do Google Planilhas
      • Obtenha tabelas a partir de páginas web
      • Crie um banco de dados local
      • Escreva em um banco de dados local
      • Realize consultas SQL
  3. 3 Avançando em pandas

    Nesta última etapa, vamos continuar trabalhando com a biblioteca Pandas, focando agora em etapas específicas de um processo de análise de dados. A ideia aqui foi aprofundar e colocar em prática nossos conhecimentos nas principais etapas de projetos que envolvam ciência de dados: seleção e agrupamento de dados, transformação e manipulação de dados e limpeza e tratamento de dados. Cada uma destas etapas vem acompanhada de um projeto básico e de material extra de estudo.

    • Artigo Ampliando a análise com o Describe

    • Curso Pandas: selecionando e agrupando dados

      08h
      • Selecione e extraia informações a partir dos dados
      • Agrupe dados para criação de tabelas
      • Elabore gráficos para ajudar na análise dos dados
      • Aplique filtragem e seleção de dados usando a biblioteca pandas
    • Curso Pandas: transformação e manipulação de dados

      06h
      • Entenda e aplique comandos de transformação de dados
      • Diferencie os tipos de informação que estão presentes nos dados
      • Manipule valores numéricos dentro do dataframe Pandas
      • Distingua métodos de manipulação de dados textuais
      • Realize transformações com tipo datetime de dados
      • Relacione conversões de dados à construção de projetos
    • Alura+ Manipulação de strings com Pandas

    • Curso Pandas: limpeza e tratamento de dados

      08h
      • Entenda o objetivo de tratar uma base de dados antes de inserir em modelos de machine learning
      • Conheça quais impurezas uma base de dados apresenta
      • Descubra formas de limpar e tratar as impurezas na base de dados
      • Compreenda como realizar a limpeza e o tratamento da base de dados
      • Construa um passo a passo para deixar a base de dados pronta para ser inserida em um modelo de machine learning
    • Vídeo Conclusão Formação Python para data science - YouTube

Escola

Data Science

Além dessa, a categoria Data Science conta com cursos de Ciência de dados, BI, SQL e Banco de Dados, Excel, Machine Learning, NoSQL, Estatística,e mais...

Conheça a Escola

Comece a estudar agora na maior escola de tecnologia do país

Conheça os Planos para Empresas