Alura > Cursos de Data Science > Cursos de Data Science > Conteúdos de Data Science > Primeiras aulas do curso Oracle ADS: análise de dados na nuvem

Oracle ADS: análise de dados na nuvem

Conhecendo o ambiente Oracle - Apresentação

Olá e boas vindas ao curso de análise de dados com o Oracle ADS. Bom, eu queria falar um pouco do que vamos aprender nesse curso.

Para mim e para muitas pessoas, essa pode ser a primeira vez que eles vão se deparar com ciência de dados trabalhando na nuvem, e quando trabalhamos na nuvem tem várias questões diferentes do que trabalhar na nossa máquina.

Então essa foi a primeira nuvem que eu tive contato, se for a sua primeira também, não tem problema, vamos ensinar a você a como configurar a nuvem do zero, como criar uma stack, como criar um serviço de Data Science, como que eu vou criar esse notebook que estou mostrando para vocês.

Uma vez criado o notebook, vamos trabalhar com dados, vamos fazer visualizações, vai conhecer melhor esses dados, fazer tratamentos, vai gerar alguns gráficos bacanas, vai discutir como que esses dados estão sendo influenciados pelo modelo de negócio, o quanto que eu preciso entender daquela área, para que você conheça o modelo de negócio.

Por que vamos fazer isso tudo? Porque meus parabéns! Você acabou de ser contratado por uma empresa, para ser um analista de ciência de dados júnior. E o que faz um analista de ciência de dados júnior? Vamos descobrir juntos.

Mas, dentro dessa empresa, nós temos o time de ciência de dados bastante grande. Eu sou o seu colega e eu vou te ajudar nesse seu primeiro projeto, que vai ser um projeto para você ser a primeira pessoa que vai passar os dados na empresa.

Então você vai receber essa tarefa, de verificar os problemas que tem com os dados, fazer algumas visualizações, conhecer bem os dados, e você vai ter que bolar um jeito de passar tudo isso que você aprendeu, para os seus colegas de equipe. Então vem comigo que vamos aprender bastante nesse curso.

Conhecendo o ambiente Oracle - Free Trial

Olá, vamos dar início ao nosso curso de análise de dados com o Oracle. Bom, o que um analista de dados júnior faz, pelo menos nessa empresa? Ele é responsável por ter o primeiro contato com o conjunto de dados.

O que isso significa? Significa que ele é a pessoa responsável, que vai dar uma olhada nos dados, conhecer um pouco mais sobre o domínio desses dados, verificar se tem algum problema nesses dados, verificar possíveis soluções para esses problemas e aplicar essas soluções, para, no final, gerar uma nova base de dados sem esses problemas, que você vai poder passar para a sua equipe, para que ela possa fazer uma visualização de dados, trabalhar com machine learning em cima desses dados, e de uma forma mais tranquila, porque você já vai ter alguém que conhece esses dados, e isso é muito bacana.

Além disso, essa empresa trabalha com o ecossistema Oracle. Por que ela fez essa escolha? Por que ela não escolheu um ecossistema X ou Y e resolveu usar o da Oracle? São 2 fatores principais: essa empresa já usava o banco de dados da Oracle, então fazia bastante sentido, tinha uma excelente configuração para trazer esses bancos para esse novo ecossistema.

Além disso, o Ecossistema da Oracle nos oferece algumas ferramentas para trabalhar com Data Science, que vai facilitar a nossa vida. Vão ser algumas ferramentas que vão dar mais eficiência para alguns processos, ou mesmo, que vão fazer as coisas que você já faz, de uma maneira mais rápida.

Agora eu queria apresentar para vocês como que eu posso ter o primeiro acesso à essa plataforma da Oracle, que chamamos de Oracle Cloud.

Primeiro você vai entrar nesse site “oracle.com/cloud/”, depois nós temos duas maneiras de fazer: se você já tem o acesso configurado, você pode vir no canto superior direito, em “Sign in to Oracle Cloud”. Nesse momento você vai ser pedido algumas informações da sua conta, as informações do seu usuário, e então você pode entrar sem problemas.

Mas, caso você não tenha esse acesso ainda, tem uma outra possibilidade, que para a gente vai ser super interessante e eu queria apresenta-la para vocês, que é esse “Try Oracle Cloud for free”. Vou clicar nesse botão e ele vai abrir essa página de Oracle Cloud de graça. Então o que podemos usar do Oracle Cloud de maneira gratuita?

Tem alguns serviços que podemos usar de maneira gratuita para sempre, que é o que eles chamam de “Always Free”. Então, nesse modo, você tem até dois bancos de dados autônomos, você tem duas máquinas AMD, 4 instâncias, objetos, blocos, arquivos, e isso não vai ser cobrado de você.

Lembra que estamos trabalhando com computação na nuvem, então não estou trabalhando com as coisas dentro do meu computador, eu estou pegando o computador de uma empresa, no nosso caso o da Oracle, e vamos rodar essas coisas dentro desses computadores.

Só que, mais interessante que esses serviços gratuitos para sempre, a Oracle também oferece um “free trial” para você testar o serviço da Oracle por 30 dias, e é exatamente isso que eu quero mostrar para vocês. Você tem 30 dias, os 300 dólares em créditos gratuitos, para acessar tudo que a Oracle Cloud tem à disposição da gente.

E por que que eu estou falando disso especificamente? Porque esses 30 dias ou 300 dólares são mais do que suficiente para você cumprir esse projeto e, por tanto, todas as atividades desse curso. Então como que eu faço para ter acesso à Oracle Cloud de maneira gratuita?

Vou voltar para cima e vou clicar no botão “Start for free”. Clicando nele ele vai me enviar para esse formulário apresentado, que é um formulário tranquilo; eu preciso colocar o meu país ou território, meu nome, sobrenome e e-mail. Fechou por aí? Ainda não. Eu vou colocar o meu e-mail, fazer o captcha e verificar o meu e-mail.

Quando eu clico nesse botão, vai enviar agora para o seu e-mail pessoal, um outro formulário, onde você tem vários dados pessoais, para colocar qual é o seu nome, quais são as suas informações pessoais, seu endereço, e vai pedir um cartão de crédito.

Eu vou ser cobrado por esse cartão de crédito? Nesse momento não. Lembra que você tem para usar os 30 dias, ou 300 dólares, de maneira gratuita. Então não precisa se preocupar em cobranças nesse momento. Mas se você quiser usando os serviços da Oracle, depois desses 30 dias, ou 300 dólares, aí sim você pode ser cobrado.

Não se preocupe, mas lembre-se que se você for utilizar o “free trial” é importante, se você não quiser usar mais nenhum serviço da Oracle depois, cancelar no seu cartão, ou então desvincular a sua conta, para que não gere nenhum custo adicional.

Então espero que vocês estejam animados como eu estou animado, e vamos para o nosso curso.

Conhecendo o ambiente Oracle - Criando um Notebook

Vamos analisar dados na Oracle Cloud. Bom, no último vídeo nós vimos um pouco do que eu posso fazer para acessar ao Oracle; se eu posso criar uma conta, se eu faço uso dos 30 dias grátis, e agora que você já tem esse acesso falta o executarmos para entrar na Oracle Cloud.

Antes disso eu tenho que dar um pequeno aviso, que o Oracle Cloud não é compatível com todos os navegadores, então eu recomendo que você use o Mozilla Firefox ou Google Chrome.

Uma vez que eu estou nesses navegadores eu vou entrar no “oracle.com/cloud/”, que é site principal, e vou, no canto superior direito, em “Sign in to Oracle Cloud”. Uma vez que eu fiz isso vai pedir os dados da minha conta. Vou colocar o nome da minha conta e vou clicar em “Next”.

Cliquei em “Next”, o próximo passo que ele vai me perguntar é “qual é o modo que eu quero fazer o meu login”, e então eu vou nesse primeiro “Single Sign-On” e, sempre, por padrão, provedor é o “oracleIdentitycloudservice”. Vou clicar em “Continue”.

Então ele vai pedir as informações pessoais da minha conta Oracle. Vou preencher rapidamente e vou clicar em “Acessar”. Cliquei em “Acessar”, e se as informações corretas ele vai me colocar dentro dessa Home Page. E agora já podemos ver várias coisas interessantes. Vamos passar pelas principais.

Primeiro vocês podem ver que eu estou usando aqui um free trial, que é aquele teste gratuito de 30 dias, onde eu tenho uma certa quantidade de dinheiro para usar no Oracle Cloud.

Eu vou fechar essa [ININTELIGÍVEL], que para mim não é interessante agora. E nós vamos começar pelo canto superior direito. Então a primeira informação no meu caso é “US East”, que é aonde que está localizado os computadores dos servidores que eu estou utilizando. No meu caso está nos Estados Unidos.

Nessa barra nós também temos o “Cloud Shell”, se você precisar você pode pedir ajuda, mudar linguagem e também ver o seu perfil, se você quiser alterar a senha ou alguma coisa do tipo.

Ainda do lado direito, nós temos essa parte de “Account Center”, que é super importante, por quê? Porque eu posso adicionar ou criar novos usuários, deletar usuários, modificar permissões, e tem essa parte de custos. Como eu estou usando o free trial, eu consigo ver o meu total de custo, e eu consigo ver também quantos dias eu estou usando esse compartimento específico.

Agora vindo para essa parte principal nós temos várias coisas que podemos fazer. Então nós podemos fazer um e-commerce, podemos fazer um website, podemos fazer um container, um banco de dados, mas não vamos mexer com essa parte ainda. O que eu quero mostrar para vocês, dentro dessa parte principal, é o dashboard.

O dashboard é uma outra forma que eu posso ver as principais informações sobre esse meu compartimento na nuvem, eu posso ver, por exemplo, quais recursos estão sendo explorados, como que está a conta disso, quais são os principais dados que eu estou usando, e assim por diante. Não se preocupe se da primeira vez que você ver isso estiver em branco ou com poucas informações, com o uso essas informações vão chegando.

Mas o que temos que fazer agora é a configuração do ambiente, para que possamos trabalhar com o Data Science, e vamos fazer isso em três etapas. A primeira etapa é a configuração de uma stack, a segunda etapa é configuração do serviço de Data Science e a terceira etapa é a configuração de um notebook. Então vamos para essa primeira etapa?

Para isso vamos clicar no canto superior esquerdo, nessa barra lateral, e vamos abrir o menu. É por esse menu que vamos acessar a maior parte das coisas. No meu caso, me interessa o “Developer Services”, mais especificamente a parte de stacks, então vou clicar em “Stacks” na coluna central.

Clicando em “Stacks” ele vai me jogar para essa nova página, e ela é muito bacana, porque eu posso ver todas as stacks, porque elas estão ativas, mas o que queremos vai ser criar uma nova stack. Se no seu caso não tiver nenhuma aparecendo nessa página, também não tem nenhum problema.

Vou clicar em “Create Stack” e olha que bacana: nós podemos ver algumas informações sobre a stack e que eu posso criar ela de várias formas diferentes. Eu posso fazer uma configuração pessoal, da maneira que eu quiser, posso usar templates, posso usar do código-fonte, posso copiar de outros compartimentos que já existem.

Só que, agora, é a primeira parte bastante importante, eu vou escolher usar um template, e por que que eu vou escolher isso? Porque se eu for em “Select Template”, dentro de vários templates tem algumas coisas que já vão facilitar o meu uso, já não ter pré-configurações que vão facilitar o uso de Data Science, que é o que estávamos buscando.

Então para achar “Data Science” eu vou em “Serviços”, e agora vou selecionar “Data Science”, por quê? Porque essa já é uma provisão que vai vir com os pré-requisitos e pré-configurações, para trabalharmos com Data Science na nuvem. Vou clicar em “Select Templatae” e ele já vai me dar algumas informações.

Primeiro é nome. O nome que eu vou dar, por exemplo, é “Análise de dados de saúde”, que eu acho que é um nome bacana e fica melhor. A descrição eu vou fazer assim “Análise de dados”, só. Nessa parte é mais isso. Eu vou adicionar uma tag? Ainda não, nesse momento não. Eu vou simplesmente clicar em “Next”, no canto inferior esquerdo.

Clicando em “Next” tem algumas informações que são importantes, então vamos dar uma olhada nelas. Primeiro é “IAM Group and Policy Configuration”, não vou mexer aqui, vou deixar tudo como vem por padrão.

E essa parte de network é bastante interessante. Network é rede. E eu estou usando a minha rede pessoal, meu wi-fi de casa? Não, porque eu estou acessando essa máquina da nuvem. Então é importante fazer essa configuração de rede, para que eu consiga ter uma rede especial que vai me dar acesso, por exemplo, a internet, e essa rede chamamos de VNC, que é Virtual Cloud Network, ou Rede Virtual da Cloud.

Eu vou deixar o nome, gosto desse nome VNC de Data Science. O resto eu posso deixar tudo por padrão. Projeto no e configuração de notebook eu não vou ticar. Também não vou ticar a configuração de “Wault” nem de “Gateway”, eu vou simplesmente clicar em “Next”. E nessa página que aparece eu posso ver um pouco sobre, um overview, um resumo, do que foram as minhas escolhas. Se estiver tudo certo eu posso vir clicar em “Create”.

Essa nova página pode demorar um pouco, mas eu já criei essa nova stack. Eu já apliquei as configurações? Ainda não. Então tem um outro passo, que o último passo para essa configuração de stack, que é clicar em “Apply”.

Clicando em “Apply” pode demorar um pouco, então pode ficar tranquilo. Ele vai criar um job, que vai ser o responsável por cuidar dessa nossa stack, e eu vou simplesmente clicar em “Apply” na parte de baixo. Agora você espera um pouco, e assim que tiver voltados nós voltamos também.

Voltamos agora e já conseguimos fazer essa primeira configuração de stack. Por enquanto é isso. E lembra que ainda temos duas partes: a configuração do serviço do Data Science e a configuração do notebook. Até as próximas aulas.

Sobre o curso Oracle ADS: análise de dados na nuvem

O curso Oracle ADS: análise de dados na nuvem possui 152 minutos de vídeos, em um total de 62 atividades. Gostou? Conheça nossos outros cursos de Data Science em Data Science, ou leia nossos artigos de Data Science.

Matricule-se e comece a estudar com a gente hoje! Conheça outros tópicos abordados durante o curso:

Aprenda Data Science acessando integralmente esse e outros cursos, comece hoje!

Conheça os Planos para Empresas