Alura > Cursos de Data Science > Cursos de Business Intelligence > Conteúdos de Business Intelligence > Primeiras aulas do curso Tableau: executando um projeto de BI

Tableau: executando um projeto de BI

Base de dados do projeto - Apresentação

Meu nome é Victorino Vila e esse aqui vai ser o projeto final de Tableau. Vamos construir durante esse treinamento dois dashboards de uma empresa que vende suco de frutas.

O dashboard da presidência, mostrado aqui do meu lado, onde eu vou poder selecionar o ano e analisar os resultados de lucro, faturamento, despesa da empresa de suco de frutas.

E eu vou ter outro dashboard, esse aqui, que é um dashboard focado para o pessoal da área de vendas, onde eu vou ter o comparativo entre a meta e a venda, vou ver um mapa com a distribuição das vendas dentro dos estados, vou ver o que chamamos de sparkline, onde consigo ver a variação de vários indicadores, a variação gráfica.

E um gauge mostrando a distribuição das vendas por categorias. E também, sensibilizando aqui o menu, eu consigo ir alterando os valores desse dashboard.

Como nós vamos construir esses dois dashboards? Vamos primeiro mostrar o modelo para vocês, o modelo que foi o resultado do levantamento das entrevistas. Nós vamos especificar quais vão ser as dimensões, os indicadores, e vamos buscar a base de dados.

Vou falar um pouco do processo de ETL, mas só a parte teórica, porque como para fazermos o processo de ETL precisamos do Tableau Prep Builder e ele é um software pago, só vamos apresentar o nosso modelo relacional.

E também, como estamos usando o Tableau Public, nós não conseguimos nos conectar numa base de dados relacional, e vamos pegar alguns CSVs que vão fazer papel de base de dados relacional.

E vamos colocar no Tableau, ver como conseguimos registrar os metadados e nosso trabalho vai ser construir cada uma dessas planilhas separadamente, tanto do dashboard da presidência quanto do dashboard de vendas, e vamos construir planilha isoladamente, vamos acabar revendo muitos conceitos que vimos na formação Tableau. E depois vamos montar esses dois dashboards finais.

No final, nós falaremos sobre compartilhamento de dados e encerraremos esse curso. Então é isso, espero que vocês gostem, até o próximo vídeo.

Base de dados do projeto - Modelo

Vamos começar esse novo treinamento de Tableau? E o objetivo vai ser fazer um projeto final.

Nesse projeto final faremos uma revisão de tudo o que vimos dentro dos cursos da carreira de Tableau aqui na Alura e vamos simular um modelo de business intelligence de uma empresa de suco de frutas.

Claro, o nosso primeiro passo é entender o que o nosso usuário quer ver, ou seja, fazer toda a parte de modelagem desse nosso projeto final. Vamos começar tentando entender como é essa empresa de suco de frutas.

Aqui em cima temos várias figuras que representam vários executivos da empresa. Temos ali o presidente, o diretor de produção, o financeiro, o contador, o cara da TI, o vendedor, enfim. Todos eles são executivos dessa empresa e eles precisam ser providos de informações gerenciais, de dashboards ou de relatórios, para tomarem decisões.

Fizemos uma entrevista com esses usuários para poder saber como seria esse nosso modelo de TI. E essa empresa de suco de frutas nos disse que eles gostariam de ver as informações gerenciais por essas dimensões que estão mencionadas.

Ou seja, eu preciso apresentar as minhas informações por data (dia a dia); por cliente; por segmento de mercado; por estado; cidade; região; pela fábrica onde o suco de fruta foi manufaturado. Produto; o tamanho do produto, porque o suco de frutas possui embalagens e essas embalagens têm tamanhos.

O sabor do suco; a marca, porque os nossos sucos são divididos em marcas diferentes; a categoria, que também é um agrupamento maior em cima do produto.

O atendente que fez o atendimento da venda. O gerente de vendas que, na verdade, é chefe de vários atendentes, e o diretor de vendas, que acaba gerenciando vários gerentes de venda. Todas as informações a serem disponibilizadas deverão pelo menos cruzar com alguns desses indicadores.

E claro, conversando com o pessoal da empresa, conseguimos descobrir que aquelas informações que vão identificar os nossos indicadores possuem determinadas hierarquias, relacionamentos entre elas que vão criar uma noção de um dado hierárquico.

Nós teríamos lá inicialmente o que nós chamaremos de dimensão cliente, que seria aqui em cima. Onde eu começo com o cliente que faz a compra do suco de fruta e todo o nosso cliente está associado a um segmento de mercado.

Por outro lado, o cliente está associado também a uma cidade, que também está associada a um estado, que automaticamente está associada a uma região. Então há uma relação também hierárquica através dessas quatro entidades que começam em região e terminam lá no cliente.

No caso de produto, temos que os nossos produtos são agrupados por tamanhos, mas os produtos também são agrupados por marcas e as marcas agrupadas por categoria. E ainda, lá embaixo, os meus produtos são agregados por sabor.

Já a fábrica é uma entidade isolada, ela não tem uma interação com nenhuma outra entidade que faz parte do nosso modelo.

E finalmente, temos a hierarquia de vendas, que começa com o atendente, cai no diretor regional ou gerente regional de vendas, e finalmente no diretor de vendas, aqui embaixo. Seria a forma com que as entidades do nosso modelo se relacionam.

Então está aqui, na verdade, vamos ter quatro dimensões de análise e essas dimensões possuem o que nós chamamos de níveis. Por exemplo, o segmento é um nível da dimensão cliente. Cliente é um nível da dimensão cliente. Marca é um nível da dimensão produto.

OLAP DA PRESIDÊNCIA

TempoClienteProdutoFábricaVendas
Faturamento em R$ (Dados Diários)XXXXX
Custo de Frete R$ (Dados Diários)XXXX
Imposto em R$ (Dados Diários)XXXXX
Custo Fixo R$ (Dados Mensais)XX
Custo Variável R$ (Dados Diários)XXXXX
Unidades vendidas (Dados Diários)XXXXX
Quantidades Vendidas em Litros (Dados Diários)XXXXX
Meta de Faturamento em R$ (Dados Mensais)XXXX
Meta de custos em R$ (Dados Mensais)XXX

Eu tenho uma série de indicadores que deverão ser exibidos para os nossos usuários nos nossos relatórios ou dashboards. Começamos com o faturamento em reais; o custo de frete, que é o custo do transporte da mercadoria; o imposto pago; o custo fixo para manufaturar o suco de frutas.

Custo fixo é aquele que não depende da produção daquele produto, ele acontece independentemente se eu fabrico ou não alguma coisa.

O custo variável, esse sim tem uma relação direta com a quantidade de produtos produzidos. As unidades vendidas e a quantidade de unidades vendidas em litros.

Essa diferença é muito importante, porque o primeiro caso eu vou dizer, por exemplo, quantas garrafas ou quantas latas eu vendi de suco de frutas. E já embaixo, não, em vez de eu contar isso pela embalagem, eu conto pela quantidade de litros que eu vendi.

A meta do faturamento e a meta do custo. Essa meta é um orçamento que é feito pela empresa, que é onde eles esperam atingir, eles querem atingir determinado faturamento e determinados custos dentro de um período de análise.

E claro, todas essas informações também geram indicadores calculados. Então o faturamento líquido é o faturamento em reais, menos o custo de frete em reais, menos os impostos.

A margem, que é o lucro, é o faturamento líquido menos o custo fixo, menos o custo variável. O preço médio do produto é o faturamento em reais dividido pela quantidade vendida em litros.

Nós temos a variação da meta de faturamento, quanto meu faturamento real ficou acima ou abaixo do meu orçamento, que é o faturamento líquido em reais, dividido pela meta de faturamento, menos 1 vezes 100.

Temos a variação da meta custo, que é o custo fixo mais o custo variável, dividido pela meta do custo em reais menos 1 vezes 100. E finalmente a variação da meta.

Justamente, a variação da meta do custo e da meta da margem é quanto o meu custo ficou acima ou abaixo do que eu esperava, e o meu lucro, o quanto ele ficou acima ou abaixo do que eu esperava.

Esse é o modelo que nós vamos trabalhar. Esse desenho e esse modelo são obtidos através de entrevistas que eu faço com os usuários da empresa, para tentar entender o que o meu cliente quer ver e tentar entender um pouco como a informação é organizada.

Essa é uma fase importante da modelagem de um sistema de business intelligence. O próximo passo, segundo a nossa receita de bolo, é construir um banco de dados gerencial que será fonte dos nossos relatórios, que nós chamamos de data warehouse. Mas vamos falar um pouco sobre ele no próximo vídeo. Até daqui a pouco.

Base de dados do projeto - Base de dados

Baseado nas entrevistas e naqueles levantamentos todos, nós temos aqui a nossa Matriz Dimensão Indicador, onde colocamos nas colunas as dimensões, não são os níveis das dimensões, mas sim o nome das dimensões.

E nas linhas os indicadores que chamaríamos de indicadores primários, que são aqueles que serão fontes dos indicadores calculados. E nós colocamos ali um cruzamento para ver quem tem sentido cruzar com quem.

OLAP DA PRESIDÊNCIA

TempoClienteProdutoFábricaVendas
Faturamento em R$ (Dados Diários)XXXXX
Custo de Frete R$ (Dados Diários)XXXX
Imposto em R$ (Dados Diários)XXXXX
Custo Fixo R$ (Dados Mensais)XX
Custo Variável R$ (Dados Diários)XXXXX
Unidades vendidas (Dados Diários)XXXXX
Quantidades Vendidas em Litros (Dados Diários)XXXXX
Meta de Faturamento em R$ (Dados Mensais)XXXX
Meta de custos em R$ (Dados Mensais)XXX

Primeiro lugar, a dimensão chamada tempo vai estar presente em todos os cruzamentos. Afinal, o tempo é uma dimensão obrigatória em qualquer sistema de informações gerenciais.

Depois, temos as outras quatro dimensões e nem todo mundo cruza com todo mundo. Por exemplo, custo fixo não tem sentido cruzar com cliente, produto, nem com vendedor, porque o custo fixo é uma entidade que existe independente se eu fabrico ou vendo coisas. Só o fato de a empresa existir, eu já estou gastando dinheiro e esse dinheiro que eu gasto está agrupado dentro do custo fixo.

E baseado no desenho da matriz, temos automaticamente uma pista do desenho do nosso data warehouse, que vai ser a fonte de dados dos nossos relatórios.

Não vamos entrar nesse curso no detalhe de como, baseado na matriz, desenhamos o data warehouse. Aqui na Alura temos alguns treinamentos cujo esse assunto é o assunto principal. Mas eu vou apresentar para vocês o desenho desse banco, que seria este daqui que está sendo exibido.

Eu tenho cinco tabelas que representam as cinco dimensões e os níveis dessas dimensões estão todos nessas tabelas de forma desnormalizada, ou seja, a relação de cliente com cidade, estado, região, segmento, por exemplo, está toda nessa única tabela aqui, sempre por um identificador único, que é normalmente o identificador único do nível mais baixo da hierarquia.

A mesma coisa se aplica a produto, fábrica, operacional e tempo. Sendo que tempo eu já tenho aqui algumas agregações de tempo previamente calculadas. Apesar de que quando isso for para o Tableau, sabemos que o Tableau já faz esses cálculos de forma automática.

Mas lembre-se, o data warehouse é uma entidade que é montada independentemente do produto que você vai utilizar lá na ponta. Apesar de o Tableau já ter inteligência de tempo dentro dos seus relatórios, eu que estou projetando data warehouse não posso deixar de colocar essa inteligência de tempo na base de dados porque, de antemão, eu não sei que tipo de produto o meu usuário vai plugar lá na ponta para olhar esse dado gerencial.

E no meio nós temos a nossa tabela que chamamos tabela de fato, onde nós temos como identificador um ID de cada entidade e depois todos os indicadores, que são os indicadores primários, que são fonte dos cálculos. Os indicadores calculados nós não estamos colocando dentro dessa tabela do banco de dados.

Esse modelo que nós estamos vendo aqui nós chamamos de modelo estrela, porque as dimensões estão com tabelas todas desnormalizadas, ou seja, eu não tenho, por exemplo, as tais formas normais que vemos no modelo relacional sendo aplicadas nessas tabelas.

Quem quiser saber mais sobre modelagem relacional e formas normais, também temos cursos aqui na Alura que abordam esse assunto. Mas temos aqui o desenho do nosso banco.

Então ok, mas vamos lembrar uma coisa, nós estamos na nossa formação Tableau, desde o primeiro curso, usando o Tableau Public. E o Tableau Public tem uma limitação, eu não consigo me conectar em base de dados utilizando-o.

E nós optamos, nessa formação, de usar o Tableau Public porque ele é gratuito. Se quiséssemos usar o Tableau Desktop, que é a licença paga do Tableau, teríamos que fazer um investimento nisso.

Você, aluno, que quisesse fazer os exercícios que serão apresentados por mim, você teria que fazer um investimento nessa cópia, não era a nossa intenção isso, porém temos que estar presos às limitações de cada versão que a Tableau oferece.

Eu não tenho como, por exemplo, colocar aqui na nossa máquina, para fazermos esse projeto final, colocar esse banco de dados que está aí para poder fazer, digamos assim, todos os nossos relatórios. Porém, o que eu vou disponibilizar para vocês são vários CSVs. E cada CSV desse vai representar uma dessas tabelas do data warehouse.

Ou seja, a fábrica eu vou ter o CSV “Dim_Fabrica”. No caso da tabela organizacional, eu vou ter o CSV “Dim_Organizacional”. No caso do tempo, a tabela “Dim_Tempo”, no caso de cliente, a tabela “Dim_Cliente”. Todas representadas em arquivos separados. A dimensão produto no arquivo “Dim_Produto.csv” e a fato no arquivo “Fato_Presidencia.csv”.

Esses CSVs vão fazer papel de tabelas e esse relacionamento aqui que estamos olhando, a relação entre as entidades dentro do nosso data warehouse, faremos isso dentro do Tableau.

Porém, se tivéssemos carregado um banco de dados para o Tableau, não só com essas tabelas, mas com esses relacionamentos, algumas conectividades que já vêm do banco de dados já seriam entendidas automaticamente pelo Tableau.

E aqui, no nosso caso, teremos que fazer essas relações na mão, mas é legal porque pelo menos vocês ficam treinados a saber como lidar quando não estivermos trabalhando com uma base de dados que tenha todos os seus relacionamentos. Então é isso, até o próximo vídeo.

Sobre o curso Tableau: executando um projeto de BI

O curso Tableau: executando um projeto de BI possui 209 minutos de vídeos, em um total de 60 atividades. Gostou? Conheça nossos outros cursos de Business Intelligence em Data Science, ou leia nossos artigos de Data Science.

Matricule-se e comece a estudar com a gente hoje! Conheça outros tópicos abordados durante o curso:

Aprenda Business Intelligence acessando integralmente esse e outros cursos, comece hoje!

Conheça os Planos para Empresas