Boas-vindas ao curso de BI com Excel: crie bancos de dados com planilhas!
Aqui na plataforma, já temos formação de Excel e Alura+. Agora, preparemos este curso para falar de dados.
Alura+ são pequenos vídeos com conteúdo complementar. O link deve direcioná-lo para os materiais neste formato. Nele, você pode filtrar pelo tópico de excel na aba de Data Science.
Meu nome é Roberto Sabino e vou te acompanhar nesta jornada, onde aprenderemos sobre base de dados e como organizá-las, além de como trabalhar com tabelas.
Roberto Sabino é um homem de pele clara, cabelos curtos ondulados na cor castanho escuro e repartidos na lateral esquerda. Possui barba e bigode na mesma cor do cabelo, mas o cavanhaque é grisalho. Veste uma camiseta lisa na cor preta e está sentado sobre uma cadeira preta acolchoada. À sua frente, um microfone na altura da boca. Ao fundo, uma parede lisa, na cor branca, iluminada por uma luz verde.
Clara montou uma cafeteria chamada Café Alura e faz o controle no Excel, através de uma planilha. No entanto, esta planilha está ficando muito complexa, tornando a manutenção e o acesso às informações cada vez mais difícil. Pensando nisso, ela nos pediu ajuda.
Nosso papel, então, é mostrar para a Clara quais são os problemas e tornar sua uma planilha mais organizada, contendo produtos, fornecedores, entradas, saídas, visão de controle de estoque, formulários e quadros.
Aprenderemos passo a passo a fazer cada um destes itens e, neste processo, usaremos funções de banco de dados, PROCX, referências estruturadas, tabelas e até formatação condicional. Para isso, iniciaremos aprendendo a montar uma base de dados e entendendo os erros mais comuns.
Esperamos que você goste deste curso e o aproveite ao máximo! Vamos nessa?
Você pode estar se questionando se esse projeto não deveria ser feito no Power BI, então vamos pontuar algumas questões.
A diferença entre trabalhar no Excel e no Power BI é que o último trata-se de uma ferramenta mais nova, que foi concebida para trabalhar com uma quantidade maior de dados e com possibilidades de manipulação mais profissional no formato de base de dados. O Excel, por sua vez, é uma ferramenta mais genérica, que possui funcionalidades que também permitem trabalhar com dados.
Embora seja possível utilizar o Excel para trabalhar com dados, temos que ter o cuidado de conseguir separar o que é trabalhar com dados do que é trabalhar com o Excel. Sendo assim, nesta aula focaremos no que é e no que não é uma base de dados. No Power BI não temos esta confusão porque a ferramenta lê base de dados, diferentemente do Excel, onde podemos trabalhar com algo pensando tratar-se uma base de dados sem que seja de fato.
A nossa cliente, Clara, abriu a cafeteria Café Alura e quer controlá-la. Para isso, criou uma planilha, a qual você teve acesso e analisaremos agora.
Um dos primeiros pontos que notamos nesta planilha é a mesclagem de células e, se você trabalha com Excel e base de dados, provavelmente sabe que não devemos mesclá-las.
Quando trabalhamos com banco de dados, seja no Excel ou não, temos uma estrutura com os rótulos preferencialmente na primeira linha e os dados nas linhas abaixo dos rótulos. Cada linha desse banco tem um registro, que é o conjunto das informações que existem em uma linha. Tomemos como exemplo a tabela seguinte:
Nome | Data de Nascimento | CPF | Endereço |
---|---|---|---|
Dados | Dados | Dados | Dados |
Dados | Dados | Dados | Dados |
Dados | Dados | Dados | Dados |
Dados | Dados | Dados | Dados |
Se pedimos o registro de determinada linha, o Excel sabe que a informação daquela linha corresponde ao tipo estabelecido no rótulo. Portanto, quando trabalhamos com base de dados, precisamos estruturá-la de forma que ele consiga localizar as informações. Então, se pedimos o registro da linha 3, ele saberá que na coluna "Nome" haverá um nome; na "Data de nascimento", uma data; e assim sucessivamente, além de saber que os dados dessa linha estão relacionados, ou seja, pertencem ao mesmo registro.
Se pegamos uma coluna, como "Nome", a ferramenta sabe que ela conterá nomes e já se pode, por exemplo, trabalhar com tipos de dados. Dessa forma, esta coluna "Nome" conterá dados do tipo texto; "Data de nascimento", do tipo data; "CPF", do tipo número; e "Endereço" do tipo texto.
Então, não podemos mesclar linhas e colunas em um banco de dados, pois, fazendo isso, quebramos a ideia de registro e já não conseguimos identificar à qual registro pertence o dado contido no campo mesclado. Colunas mescladas, por exemplo, dificultam a identificação do tipo de dado, ou seja, qual o rótulo do dado. Por isso não devemos criar dados com células mescladas, como os subtotais (à exemplo, linha 22 da planilha) que podemos observar na planilha da Clara.
Outro ponto a destacar é que não podemos ter mais de uma linha como rótulo, algo que também há na planilha da Clara. Perceba que ela colocou o nome do rótulo "Saldo em Estoque" (linhas 6 e 7 da planilha) em 2 linhas distintas, provavelmente por pensar que o nome não caberia na mesma coluna. Mas, no Excel, podemos escrever todo o texto e trabalhar, por exemplo, com a quebra automática de texto, que nos permitirá ver todo o conteúdo sem que precisemos aumentar o número de linhas.
Ao utilizar este recurso, podemos ter a impressão visual de que há mais de uma linha, já que o texto se dividirá dentro da célula, podendo aparecer embaixo um do outro. Mas, na prática, estamos estruturando apenas uma única linha, e o Excel sabe que este texto, embora visualmente aparente ter mais linhas, compõe uma só.
Recapitulando: 2 coisas que não devem ser feitas é mesclar e utilizar mais de uma linha no rótulo. Portanto, corrigiremos esses primeiros erros para que possamos seguir com as análises dos problemas desta planilha, já que esta primeira aula é para que possamos entender melhorias aplicáveis à esta base de dados ou elementos que não deveriam ser postos em uma base.
Antes de começar a construir um banco de dados para a Clara, faremos mais uma análise em sua planilha.
Já vimos que devemos sempre manter uma única linha como rótulo e não mesclar células em um banco de dados. Além do mais, os subtotais existentes na planilha da cliente quebram a linha de dados, então são outro exemplo do que não fazer.
Temos que aprender a separar dois objetos fundamentais: os dados e a apresentação dos dados. Isso porque quando vamos mostrar os dados para alguém, podemos, por exemplo, precisar fazer uma função. Daí é necessário primeiro nos questionarmos: quais dados queremos guardar?
Na planilha da Clara, note que há uma coluna "Produto" - o dado que ela deseja armazenar. Tendo isso em vista, ela o associou às colunas de data de compra, unidade de medida e fornecedor. Esta última coluna, "Fornecedor", está mesclada, mas vamos supor que não está assim, mas sim que a informação em questão foi preenchida corretamente, linha por linha:
Planilha da Clara (Exemplo de exibição de apenas 4 registros das 4 primeiras colunas, mas sem mesclar a coluna de fornecedor. Para ler a planilha completa, acesse o arquivo no seu Excel.)
Data Compra | Produto | Unidade de Medida | Fornecedor |
---|---|---|---|
01/08/2022 | Café | Unidade | Mercado Express |
09/09/2022 | Chá | Unidade | Mercado Express |
09/08/2022 | Manteiga | Unidade | Mercado Express |
01/11/2022 | Leite | Caixa | Mercado Express |
Mesmo que estivesse neste formato, ainda haveria um problema: o fornecedor pode ser mais que um mero atributo do produto. Talvez seja necessário controlar quais são os fornecedores, o contato deles, quando podemos contatá-los, quando compramos a última vez, entre outros. E essas informações não fazem sentido para um produto.
Podemos ir ao Mercado Express para obter café, chá e manteiga, por exemplo, e a partir disso surgirem os questionamentos:
É a partir daí que surge a reflexão de que, talvez, o fornecedor seja mais importante do que meramente um atributo do produto em questão.
Então vamos pensar que, além do banco de dados ter este formato
Nome | Data de Nascimento | CPF | Endereço |
---|---|---|---|
Dados | Dados | Dados | Dados |
Dados | Dados | Dados | Dados |
Dados | Dados | Dados | Dados |
Dados | Dados | Dados | Dados |
Tabela de exemplo do vídeo anterior
ele possui uma identificação, normalmente, na primeira coluna (na planilha, Clara a colocou na segunda coluna) e este produto possui um identificador e um significado. Vamos supor, por exemplo, que nossa identificação é produto:
Identificação | Data de Nascimento | CPF | Endereço |
---|---|---|---|
Produto | Dados | Dados | Dados |
Produto | Dados | Dados | Dados |
Produto | Dados | Dados | Dados |
Produto | Dados | Dados | Dados |
Ou melhor, chamaremos de entidade. Portanto, é uma entidade produto.
Entidade | Data de Nascimento | CPF | Endereço |
---|---|---|---|
Produto | Dados | Dados | Dados |
Produto | Dados | Dados | Dados |
Produto | Dados | Dados | Dados |
Produto | Dados | Dados | Dados |
Para compreender o conceito de entidade, pense em algo no qual você precise armazenar informações - no caso, queremos guardar informações de produto. O que vem à direita, são atributos deste produto. Ou seja, tudo que temos à direita da identificação de qual é a entidade, são dados de atributos.
Entidade | Atributos | Atributos | Atributos |
---|---|---|---|
Produto | Dados | Dados | Dados |
Produto | Dados | Dados | Dados |
Produto | Dados | Dados | Dados |
Produto | Dados | Dados | Dados |
Na planilha da Clara, temos a coluna de produto e os atributos de unidade de medida e data de compra deste produto. Neste caso, a data poderia ser colocada à direita, e não à esquerda, embora isso não seja necessariamente uma regra.
Planilha da Clara (Exemplo de exibição de apenas 4 registros das 5 primeiras colunas, mas sem mesclar a coluna de fornecedor. Para ler a planilha completa, acesse o arquivo no seu Excel.)
Data Compra | Produto | Unidade de Medida | Fornecedor | Quantidade |
---|---|---|---|---|
01/08/2022 | Café | Unidade | Mercado Express | 100 |
09/09/2022 | Chá | Unidade | Mercado Express | 35 |
09/08/2022 | Manteiga | Unidade | Mercado Express | 15 |
01/11/2022 | Leite | Caixa | Mercado Express | 24 |
A coluna de quantidade é um atributo do produto? No sentido de estoque, sim. No entanto, o problema se instala quando pensamos em fornecedor, porque ele não é só um atributo do produto café, por exemplo, mas trata-se também de uma entidade, porque precisamos ver dados sobre ele, como e-mail, data da última compra, gastos por mês etc.
Mais adiante, conforme o curso for avançando, provavelmente teremos uma planilha para produto e outra para fornecedor. Ou seja, em uma, a entidade será produto; em outra, será fornecedor. Por isso precisamos entender quais são as entidades.
Ao pensar no nome entidade, pense, por exemplo, em quais são as coisas, objetos ou conceitos sobre os quais precisamos manter informações. Assim, tente criar uma tabela para cada um deles. A ideia é que, futuramente, precisaremos separá-los, por isso não os colocaremos na mesma planilha.
O conceito de tabela será visto na sequência, onde entenderemos o que é tabela para o Excel e como podemos manuseá-las.
Veja, por exemplo, a coluna "Saldo em estoque", na planilha da Clara, e note que há uma fórmula - que, inclusive, está errada e pode gerar um erro de negócio, fazendo com que peçamos o pedido ou quantidade errados, por exemplo. Mas esta correção será feita futuramente.
O ponto é que o saldo em estoque talvez não seja um atributo do produto, embora corresponda à quantidade menos o quanto já foi vendido. Isso porque ele é um atributo do produto ao longo do tempo. O saldo em estoque do dia 5, por exemplo, pode ser diferente do dia 6, 7 ou 8. Então precisamos pensar que, talvez, tenhamos uma entidade de vendas, onde precisamos guardar as vendas por dia, para, posteriormente, calcularmos o saldo em estoque daquele dia. Pode parecer complexo, mas aos poucos se tornará mais simples.
Ao fazer uma base de dados, é comum cometermos erros. Aprenderemos, aos poucos, algumas regras que podemos usar e algumas que não precisam ser aplicadas logo no primeiro momento. Então, vamos recapitular o que definimos até agora:
Essas questões são mais para que você tenha um entendimento melhor quando forem pontuadas ou realizadas. Não se preocupe em assimilá-las como regras, pois, ao longo do tempo, serão lembradas naturalmente. Conforme for avançando, você conseguirá identificar quando algo precisará de uma tabela própria, por exemplo.
A partir do próximo vídeo, faremos intervenções mais práticas e começaremos a trabalhar no banco de dados da Clara, já que, até aqui, estamos tratando mais da teoria.
O curso BI com Excel: criando bancos de dados com planilhas possui 159 minutos de vídeos, em um total de 46 atividades. Gostou? Conheça nossos outros cursos de Excel em Data Science, ou leia nossos artigos de Data Science.
Matricule-se e comece a estudar com a gente hoje! Conheça outros tópicos abordados durante o curso:
Impulsione a sua carreira com os melhores cursos e faça parte da maior comunidade tech.
1 ano de Alura
Assine o PLUS e garanta:
Formações com mais de 1500 cursos atualizados e novos lançamentos semanais, em Programação, Inteligência Artificial, Front-end, UX & Design, Data Science, Mobile, DevOps e Inovação & Gestão.
A cada curso ou formação concluído, um novo certificado para turbinar seu currículo e LinkedIn.
No Discord, você tem acesso a eventos exclusivos, grupos de estudos e mentorias com especialistas de diferentes áreas.
Faça parte da maior comunidade Dev do país e crie conexões com mais de 120 mil pessoas no Discord.
Acesso ilimitado ao catálogo de Imersões da Alura para praticar conhecimentos em diferentes áreas.
Explore um universo de possibilidades na palma da sua mão. Baixe as aulas para assistir offline, onde e quando quiser.
Acelere o seu aprendizado com a IA da Alura e prepare-se para o mercado internacional.
1 ano de Alura
Todos os benefícios do PLUS e mais vantagens exclusivas:
Luri é nossa inteligência artificial que tira dúvidas, dá exemplos práticos, corrige exercícios e ajuda a mergulhar ainda mais durante as aulas. Você pode conversar com a Luri até 100 mensagens por semana.
Aprenda um novo idioma e expanda seus horizontes profissionais. Cursos de Inglês, Espanhol e Inglês para Devs, 100% focado em tecnologia.
Transforme a sua jornada com benefícios exclusivos e evolua ainda mais na sua carreira.
1 ano de Alura
Todos os benefícios do PRO e mais vantagens exclusivas:
Mensagens ilimitadas para estudar com a Luri, a IA da Alura, disponível 24hs para tirar suas dúvidas, dar exemplos práticos, corrigir exercícios e impulsionar seus estudos.
Envie imagens para a Luri e ela te ajuda a solucionar problemas, identificar erros, esclarecer gráficos, analisar design e muito mais.
Escolha os ebooks da Casa do Código, a editora da Alura, que apoiarão a sua jornada de aprendizado para sempre.