Alura > Cursos de Data Science > Cursos de Business Intelligence > Conteúdos de Business Intelligence > Primeiras aulas do curso Power BI: modelagem de dados

Power BI: modelagem de dados

Entendendo o projeto - Apresentação

David: Olá! Meu nome é David Neves e sou instrutor na Escola de Dados!

Autodescrição: Sou um homem pardo, de olhos castanhos escuros, cabelos curtos e lisos na cor preta, e barba e bigode também castanhos escuros. Visto uma camisa preta com o símbolo de Data Science e, ao meu fundo, há uma parede amarela com quadros e um sofá, ambos sob iluminação verde. À minha direita, uma janela com persiana preta fechada.

Daniel: Olá! Meu nome é Daniel Siqueira e também sou instrutor na Escola de Dados!

Autodescrição: Sou um homem pardo e careca, uso óculos de armação quadrada e headphone, ambos na cor preta, além de vestir uma blusa de mangas longas com estampa xadrez. Estou sentado em uma cadeira gamer nas cores preto e azul e um microfone está posicionado à minha frente, mais ou menos na altura do pescoço. Ao fundo, uma parede com prateleiras com livros e miniaturas sob uma iluminação verde.

Estamos aqui para lhe dar as boas-vindas ao curso de Power BI: modelagem de dados!

Durante esta jornada, faremos parte de um projeto em conjunto com uma empresa que trabalha com artigos e acessórios esportivos, onde teremos a responsabilidade de organizar e trabalhar com a modelagem dos dados.

Para começar, importaremos todas as tabelas disponibilizadas pela empresa e entenderemos como o Power BI as trata em relacionamento. Portanto, aprenderemos o que é tabela fato e tabela dimensão, além do conceito de cardinalidade e seus tipos, entendendo como o Power BI trata essas cardinalidades, as propriedades de relacionamento entre as tabelas e os esquemas que utilizaremos na modelagem.

David: Visando a performance do projeto, lidaremos com alguns casos de um-para-um e um-para-muitos encontrando soluções de dimensão compartilhada e dimensão de múltiplas funções. Além do mais, lidaremos com relacionamentos ativos e inativos utilizando a função Dax.

Daniel: Depois que fizermos todos esses tratamentos, vamos organizar o nosso modelo e aprender a trabalhar com uma ferramenta externa, que pode, inclusive, ser acessada dentro do Power BI: o Power BI Helper. Com ela, conseguimos analisar a performance de toda a nossa modelagem, além de documentar o nosso projeto.

David: Vamos nessa entender sobre a modelagem de dados!

Entendendo o projeto - Case a ser desenvolvido

David: Em todo projeto de BI e de análise de dados, um processo que acontece com frequência quando utilizamos a ferramenta do Power BI é a de importação da base de dados, a partir do qual passamos a ter várias tabelas com diversos relacionamentos.

Daniel: Mas será que esses relacionamentos sempre vão nos atender da melhor forma possível com todas as maneiras que precisamos no nosso projeto?

David: A resposta é que nem sempre encontraremos a solução de maneira assertiva. Isso porque, alguns relacionamentos e vários detalhes internos ao projeto da ferramenta em si, precisamos conhecer para que possamos trazer o resultado da melhor maneira possível e com uma melhor performance.

Daniel: Nosso case (ou projeto) neste curso consiste em importar uma base de dados de uma empresa relacionada à artigos e acessórios esportivos, e analisar os relacionamentos que esta base nos trará de forma automática para verificar se vão nos atender da melhor maneira.

David: A partir desse momento, aprenderemos a modificar toda essa estrutura e compreender as ações para trabalhar com o Power BI desktop.

Daniel: Muitas pessoas que já estão na área de dados já sabem a importância de se trabalhar com modelagem de dados. O que descobriremos no nosso projeto é que conseguimos trabalhar com a modelagem dentro do Power BI. Vamos lá?

Entendendo o projeto - Importação da base de dados

Daniel: O primeiro passo do nosso projeto será importar a base de dados. Ela será um arquivo de entensão .xlsx, ou seja, uma planilha de Excel onde estão armazenados todos os dados da nossa empresa de artigos e acessório esportivos.

Para começarmos, vamos dar uma olhada em nossa tabela antes de trazê-la para o Power BI.

David: Com a base aberta, note que temos 6 guias, respectivamente:

  1. PedidosVendas_data;
  2. VendasTerritorio_data;
  3. Vendas_data;
  4. Revendedor_data;
  5. Produto_data;
  6. Cliente_data.

Cada uma traz um contexto diferente e a primeira. PedindosVendas_data, é em relação aos pedidos, que contém uma tabela com 4 colunas: Canal, PedidosKey, Pedido de venda e Pedidos.

PedidosVendas_data (Exemplo de exibição dos 5 primeiros registros das 4 colunas. Para ler a planilha completa, acesse o arquivo no seu Excel.)

CanalPedidosKeyPedido de vendaPedidos
Revendedor(a)43659001SO43659SO43659 - 1
Revendedor(a)43659002SO43659SO43659 - 2
Revendedor(a)43659003SO43659SO43659 - 3
Revendedor(a)43659004SO43659SO43659 - 4
Revendedor(a)43659005SO43659SO43659 - 5

A primeira coluna, Canal, trata da pessoa pela qual se vendeu e as demais referem-se aos ids dos pedidos, que terão algum relacionamentos com as demais colunas e tabelas.

Daniel: A segunda aba, VendasTerritorio_data, é relativa às vendas por território. Nela, temos 4 colunas: VendasTerritorioKey, Regiao, País e Continente.

Na primeira coluna, VendasTerritorioKey, temos os id; enquanto nas demais temos as informações referente à região, país e continente, respectivamente, como seus próprios nomes sugerem.

VendasTerritorio_data (Exemplo de exibição dos 5 primeiros registros das 4 colunas. Para ler a planilha completa, acesse o arquivo no seu Excel.)

VendasTerritorioKeyRegiaoPaísContinente
1NorthwestUnited StatesNorth America
2NortheastUnited StatesNorth America
3CentralUnited StatesNorth America
4SouthwestUnited StatesNorth America
5SoutheastUnited StatesNorth America

David: Na terceira guia, Vendas_data, temos diversas informações, incluindo dados referentes à todas as vendas realizadas, ou seja, às transações. Portanto, temos colunas que trazem datas sobre quando o pedido foi feito, estimativa de entrega e quando o prazo de entrega venceu. Além do mais, temos informações referentes aos produtos, como quantidade vendida de determinado produto.

No total, são 11 colunas, sendo elas:

  1. PedidoKey;
  2. RevendedorKey;
  3. ClienteKey;
  4. ProdutoKey;
  5. VendasTerritorioKey;
  6. QuantidadePedido;
  7. Preço unitário;
  8. Custo;
  9. PedidoVendaData;
  10. VencimentoData;
  11. EntregaData.

Vendas_data (Exemplo de exibição dos 5 primeiros registros das 4 primeiras colunas. Para ler a planilha completa, acesse o arquivo no seu Excel.)

PedidoKeyRevendedorKeyClienteKeyProdutoKey
43659001676-1349
43659002676-1350
43659003676-1351
43659004676-1344
43659005676-1345

Daniel: A aba seguinte, Revendedor_data, traz informações sobre os revendedores. Nela, temos 7 colunas:

  1. RevendorKey - que nos traz o id do revendedor;
  2. Tipo de negócio;
  3. Revendedor;
  4. Cidade;
  5. Estado - Provincia;
  6. País;
  7. Código postal.

Revendedor_data (Exemplo de exibição dos 5 primeiros registros das 4 primeiras colunas. Para ler a planilha completa, acesse o arquivo no seu Excel.)

RevendedorKeyTipo de negócioRevendedorCidade
-1Não aplicávelNão aplicávelNão aplicável
1Value Added ResellerA Bike StoreSeattle
2Specialty Bike ShopProgressive SportsRenton
3WarehouseAdvanced Bike ComponentsIrving
4Value Added ResellerModular Cycle SystemsAustin

David: Na quinta e penúltima aba, Produto_data, temos uma tabela com informações referentes ao produto. Nela, constam 9 colunas:

  1. ProdutoKey;
  2. SKU;
  3. Produto;
  4. Custo padrão;
  5. Cor;
  6. Preço listado;
  7. Modelo;
  8. Categoria;
  9. Subcategoria.

Produto_data (Exemplo de exibição dos 5 primeiros registros das 4 primeiras colunas. Para ler a planilha completa, acesse o arquivo no seu Excel.)

ProdutoKeySKUProdutoCusto padrão
210FR-R92B-58HL Road Frame - Black, 58$ 868,63
211FR-R92R-58HL Road Frame - Red, 58$ 868,63
212HL-U509-RSport-100 Helmet, Red$ 12,03
213HL-U509-RSport-100 Helmet, Red$ 13,88
214HL-U509-RSport-100 Helmet, Red$ 13,09

Daniel: Finalizando, a última aba, Cliente_data, nos traz informações referentes aos clientes em 6 colunas:

  1. ClienteKey - referente ao id do cliente;
  2. Cliente;
  3. Cidade;
  4. Estado;
  5. País;
  6. Código postal.

Cliente_data (Exemplo de exibição dos 5 primeiros registros das 4 primeiras colunas. Para ler a planilha completa, acesse o arquivo no seu Excel.)

ClienteKeyClienteCidadeEstado
-1Não aplicávelNão aplicávelNão aplicável
11000Jon YangRockhamptonQueensland
11001Eugene HuangSeafordVictoria
11002Ruben TorresHobartTasmania
11003Christy ZhuNorth RydeNew South Wales

Agora que a conhecemos melhor, podemos importar nossa base de dados e trazê-la para dentro do Power BI.

Ao abrirmos nosso software, temos uma janela com a opção "Obter dados" no menu lateral esquerdo. Clicaremos nela, informaremos o tipo de arquivo selecionando a opção "Pasta de Trabalho do Excel" e clicaremos em "Conectar".

David: É importante ressaltar que precisamos fechar a base em nosso sistema para que possamos realizar esta conexão. Então, caso esteja aberta, feche-a e retorne ao software para selecioná-la dentre os arquivos de sua máquina.

Daniel: Nós disponibilizaremos esta base, então basta baixá-la para sua máquina e localizá-la e armazená-la em um local que você se lembre na hora de selecioná-la para enviá-la ao Power BI.

Ao fazê-lo, observe que todas as abas do nosso arquivo foram trazidas e listadas como tabelas, seguido de outras que são colocadas como sugestões.

David: Essas sugestões estão representadas por símbolos de guias e aparecem ao final da lista. As primeiras posições da lista são ocupadas pelas abas, de fato, representadas por símbolos de tabelas e representam toda a formatação que analisamos no Excel.

Note que todas possuem um quadro para serem selecionadas, então basta marcar os que correspondem às abas do nosso arquivo e clicar em "Carregar". Uma janela abrirá indicando o carregamento desses dados no sistema.

Perceba que, quando clicamos em "Carregar", tínhamos também a opção "Transformar Dados", que nós não escolhemos porque essa base já veio tratada e estruturada, sendo necessário realizar somente a carga.

Daniel: Isso se deu porque nosso foco, aqui, é modelagem e disposição das tabelas.

Após o carregamento, na barra lateral esquerda, temos um menu e a terceira opção é "Modelo". Ao clicá-la, nossas tabelas são dispostas na tela no formato de cards ligados por linhas que representam seus relacionamentos.

Mas como saberemos que esses relacionamentos estão funcionando da melhor maneira? Ou, antes ainda, será que era esperado da gente, trabalhando no projeto, que saibamos apenas observando qual o melhor relacionamento entre elas?

David: Para respondermos essa pergunta, precisamos entender alguns fundamentos que são essenciais para que possamos seguir com este projeto e modelar todos esses dados no Power BI. Observando essa estrutura, como podemos dar o primeiro passo na análise desta modelagem?

Sobre o curso Power BI: modelagem de dados

O curso Power BI: modelagem de dados possui 107 minutos de vídeos, em um total de 53 atividades. Gostou? Conheça nossos outros cursos de Business Intelligence em Data Science, ou leia nossos artigos de Data Science.

Matricule-se e comece a estudar com a gente hoje! Conheça outros tópicos abordados durante o curso:

Aprenda Business Intelligence acessando integralmente esse e outros cursos, comece hoje!

Conheça os Planos para Empresas