Jupyter Notebook: Exemplos de Códigos e Como Usar
Introdução
No mundo da programação, estamos familiarizados com editores de textos ou IDEs que facilitam o trabalho da escrita de códigos. São inúmeros os softwares que podemos escolher que vão atender às necessidades.
É de se esperar que, ao trabalhar com ciência de dados, utilizemos alguma dessas IDEs, já que a programação está fortemente ligada à área de ciência de dados. Mas a forma tradicional de escrever o código, em um único bloco com comentários ao longo do caminho, traz algumas desvantagens se comparado aos notebooks utilizados em projetos de ciência de dados.
O que faz uma Cientista de Dados? com Mikaeri Ohana | #HipstersPontoTube
O que são Notebooks?
Um Notebook se parece com um caderno, onde será escrito uma história. Essa história é narrada em partes e segue um fluxo lógico, desde a introdução até a conclusão. Como os projetos de ciência de dados envolvem resolver um problema de negócio, precisamos escrever uma história com os objetivos, possíveis soluções do problema e a conclusão que chegamos através da exploração dos dados.
Temos a opção de criar blocos de texto e blocos de código no Notebook. Cada bloco é conhecido como uma célula do Notebook.
Através dos blocos de texto, podemos explicar o contexto, o objetivo do nosso projeto, o conhecimento que está sendo extraído dos dados e as conclusões, ou seja, as possíveis soluções para o problema que estamos tentando resolver, ou até mesmo se ainda não conseguimos chegar a nenhuma solução.
Também é possível explorar o conjunto de dados, fazer o tratamento e limpeza, criar gráficos representativos, entre outras coisas. As saídas ou resultados de cada um desses blocos de código podem ser verificados logo abaixo de cada um dos códigos. Além disso, não é necessário rodar todo o seu código anterior todas as vezes, uma vez que o processo fica armazenado na memória e as células vão funcionar de uma forma um pouco independente.
O que é Jupyter Notebook?
O Jupyter Notebook é um ambiente que oferece essa abordagem de Notebooks, com um visual simples e muito fácil de utilizar.
O que faz o Jupyter Notebook? com Mikaeri Ohana | #HipstersPontoTube
Vamos começar pela sua instalação.
Como instalar o Jupyter Notebook?
Uma possibilidade seria instalar o Anaconda, que é uma plataforma que disponibiliza. além do Jupyter Notebook, alguns outros ambientes como JupyterLab e Spyder.Também dá a possibilidade de criar ambientes virtuais e já instala a linguagem Python e as principais bibliotecas que serão utilizadas para desenvolver projetos em ciência de dados, como a biblioteca numpy e pandas.
Para realizar a instalação dessa forma, basta ir até o site oficial e escolher o instalador de acordo com o sistema operacional.
Assim que a instalação for concluída, ao abrirmos o Anaconda Navigator, o Jupyter Notebook estará pronto para uso.
Outra forma de instalar é através do pip (Gerenciador de pacotes do python). Nesse caso, precisamos instalar o Python em nosso computador e através do terminal do sistema operacional, digitamos o comando:
pip install jupyter
Caso opte pela segunda forma e não tenha o Python instalado, pode conseguir a versão mais atual no site oficial: https://www.python.org/
O Jupyter Notebook é aberto no navegador, mas funciona localmente. A página inicial dá acesso às pastas do nosso sistema, onde conseguimos abrir Notebooks criados anteriormente e criar novos Notebooks.
Ao criarmos um novo Notebook, temos acesso às ferramentas de maneira rápida. Na imagem a seguir podemos ver células do tipo Markdown, células de código e saída dos respectivos códigos, inclusive de gráficos. Temos acesso aos botões de criar novas células, rodar o código, mudar o tipo de célula e diversas outras funcionalidades.
Há ainda alguns atalhos que agilizam o processo. Dentre eles, os mais usados:
- ‘Ctrl + Enter’ : Executa a célula selecionada
- ‘Shift + Enter’ : Executa a célula selecionada e seleciona a próxima célula. Se for a - última célula do Notebook, uma nova célula é criada automaticamente.
- ‘a’ : Cria uma célula antes da célula selecionada
- ‘b’ : Cria uma célula depois da célula selecionada
- ‘d + d : Deleta a célula selecionada
- ‘t’ : Transforma a célula em uma célula de código
- ‘m’ : Transforma a célula em uma célula do tipo Markdown
Repare que para usar alguns dos comandos, a célula precisa estar selecionada mas não pode estar sendo editada, caso contrário estaríamos digitando dentro da célula.
Alternativas ao Jupyter
Apesar de ser muito utilizado, o Jupyter Notebook não é o único a oferecer Notebooks. Nós podemos utilizar o Spyder, o RStudio, o JupyterLab (uma evolução do Jupyter Notebook) e o Google Collaboratory, conhecido também como Google Colab. Podemos também rodar o Jupyter Notebook em uma IDE como o VSCode.
O JupyterLab é um ambiente mais avançado que possibilita personalizações e acesso a outras ferramentas que não estão presentes no Jupyter Notebook padrão. Para saber mais a respeito dele, leia nosso artigo Conhecendo o JupyterLab.
Uma diferença entre o Google Colab e o Jupyter Notebook é a facilidade de utilizá-lo sem a necessidade de instalar algo em seu computador. Ele roda diretamente da nuvem, bastando acesso à internet e uma conta Google.
É um ambiente muito amigável e logo ao abrir pela primeira vez ele te dá as boas-vindas com um pequeno tutorial de utilização.
Pronto! Agora com toda essa informação você já pode começar a utilizar um Notebook para os seus projetos de Ciência de Dados e deixar de digitar tudo em um único bloco de código. Verá como é muito mais prático e agradável!